BTC 89355.9$
ETH 3100.42$
Tether (USDT) 1$
Toncoin (TON) 5.33$
telegram vk Х
telegram vk Х
Russian English
"

Последнее обновление OpenAI, по сути, позволяет пользователям вести прямую трансляцию с помощью ChatGPT

Дата публикации:14.05.2024, 08:51
1623
1623
Поделись с друзьями!

Создатель ChatGPT OpenAI анонсировал свою последнюю модель искусственного интеллекта GPT-4o, более разговорчивого и человекоподобного чат-бота с искусственным интеллектом, который может интерпретировать аудио и видео пользователя и реагировать в режиме реального времени.

В серии демонстраций, выпущенных компанией, показано, что GPT-4 Omni помогает потенциальным пользователям в таких вещах, как подготовка к собеседованию — убедившись, что они выглядят презентабельно для собеседования, — а также позвонить агенту службы поддержки клиентов, чтобы получить новый iPhone.

Другие демо-версии показывают, что он может делиться шутками о папах, переводить разговор на двух языках в режиме реального времени, судить матч "камень-ножницы-бумага" между двумя пользователями и отвечать с сарказмом, когда его спрашивают. В одной демо-версии даже показано, как ChatGPT реагирует на то, что его впервые знакомят со щенком пользователя.

"Ну, привет, Боузер! Разве ты не самая очаровательная малышка?", - чат-бот воскликнул.

“Это похоже на искусственный интеллект из фильмов; и для меня все еще немного удивительно, что это реально”, - сказал генеральный директор фирмы Сэм Альтман в блоге от 13 мая.

“Достижение времени отклика и выразительности на человеческом уровне оказалось большим изменением”.

13 мая была запущена версия для ввода текста и изображений, а полная версия будет выпущена в ближайшие недели, сказал OpenAI в недавнем посте X.

GPT-4o будет доступен как платным, так и бесплатным пользователям ChatGPT и будет доступен через API ChatGPT.

OpenAI заявила, что буква “o” в GPT-4o означает “omni”, что является шагом к более естественному взаимодействию человека и компьютера.

Способность GPT-4o обрабатывать любой ввод текста, аудио и изображения одновременно является  значительным достижением  по сравнению с более ранними инструментами искусственного интеллекта OpenAI,  такими как ChatGPT-4,  которые часто “теряют много информации” при выполнении нескольких задач.

В OpenAI заявили, что “GPT-4o особенно хорошо видит и понимает звук по сравнению с существующими моделями”, что даже включает в себя распознавание эмоций пользователя и характера дыхания.

Это также “намного быстрее” и “на 50% дешевле”, чем GPT-4 Turbo в API OpenAI.

Новый инструмент искусственного интеллекта может реагировать на аудиовходы всего за 2,3 секунды, при среднем времени 3,2 секунды, утверждает OpenAI, что, по его словам, аналогично времени реакции человека при обычном разговоре.

Подписывайся на наш Telegram канал. Не трать время на мониторинг новостей. Только срочные и важные новости

https://t.me/block_chain24