Компания OpenAI представила новую модель искусственного интеллекта GPT-4o, которая способна обсуждать аудио, изображения и текст в режиме реального времени, сообщает El.kz со ссылкой на пресс-службу компании.
Новая модель чат-бота может реагировать на голос всего за 232 миллисекунды, что сравнимо с реакцией человека в разговоре. В сравнении с предыдущими моделями обновлённая версия лучше воспринимает изображения, аудио и другую визуальную информацию. Более того, использование чат-бота стало в два раза дешевле.
Теперь пользователи могут общаться с ChatGPT в разговорной манере, даже прерывая его в процессе ответа. Модель адаптируется под тон собеседника, может шутить и активно участвовать в беседе в реальном времени.
GPT-4o также способен считывать эмоциональную окраску голоса собеседника и выдавать ответы, учитывая это. Среди новых возможностей нейросети:
- Улучшена производительность для текста на английском языке и кода;
- Улучшена работа с текстом на других языках;
- Улучшено восприятие и анализ изображений, включая графики, диаграммы и скриншоты, по сравнению с предыдущими моделями;
- Модель запоминает все беседы с пользователем;
- Возможность выхода в интернет для использования как собственных знаний, так и данных из сети.
Работа нейросети была улучшена на 50 языках, а скорость обработки и выдачи информации увеличилась в два раза.