Категории

27.05.2024

ChatGPT начал в реальном времени разговаривать с пользователем и описывать изображения

Компания OpenAI представила новую версию ChatGPT — модель GPT-4o. Теперь чат-бот может в реальном времени вести диалог с пользователем и описывать полученные от него изображения.

Раньше в приложении сервиса пользователи могли записывать аудио, которое затем переводилось в текст. На текст GPT отвечал тоже текстом — его, в свою очередь, можно было прослушать с помощью встроенного диктора.

Теперь же в приложении появилась возможность вести диалог с AI-помощником в реальном времени. Пользователи могут говорить с GPT-4o напрямую и получать ответы голосом — это упрощает и ускоряет взаимодействие.

Кроме того, GPT-4o начал принимать от пользователя изображения и описывать их. Раньше такая функция была у нейросети только внутри приложения для помощи незрячим людям Be My Eyes.

К релизу новой GPT-4o Open AI и Be My Eyes подготовили ролик с участием незрячего человека, который пользуется AI-помощником во время прогулки по Лондону.

Сервис Be My Eyes, благодаря которому незрячие люди могут получать описания окружающей обстановки и предметов от волонтеров, начал тестировать интеграцию GPT в свое приложение летом 2023 года. Виртуальный волонтер, которого назвали Be My AI, заработал на базе GPT-4.

GPT-4o говорит в том числе и на русском языке, однако в России сервис официально не доступен.

Напоминаем, что за свежими новостями, интересными статьями и актуальными анонсами «Особого взгляда» удобно следить в нашем телеграм-канале. Приглашаем переходить по ссылке и становиться читателем. Подписывайтесь на нас также в «Дзене» и во «ВКонтакте».

Хотите получать рассылку «Особый взгляд»?

Нажимая на кнопку подписаться, Вы подтверждаете. что прочитали и соглашаетесь с нашими условиями использования в отношении хранения данных, отправленных через эту форму.

Произошла ошибка при оформлении подписки.

Спасибо за подписку!

Подписка уже оформлена.