OpenAI дает ChatGPT новые возможности видеть и слышать

Прочитано: 62 раз(а)


OpenAI в понедельник выпустила более производительную и еще более человекоподобную версию технологии искусственного интеллекта, которая лежит в основе ее популярного генеративного инструмента ChatGPT, сделав ее бесплатной для всех пользователей.

Обновление флагманского продукта OpenAI появилось за день до того, как Google, как ожидается, сделает собственные объявления о Gemini, собственном инструменте искусственного интеллекта поискового гиганта, который напрямую конкурирует с ChatGPT.

«Мы очень, очень рады представить GPT-4o всем нашим бесплатным пользователям», — сказала технический директор Мира Мурати на долгожданном мероприятии по запуску в Сан-Франциско.

По словам компании, новая модель GPT-4o (буква «O» означает omni) будет внедрена в продуктах OpenAI в течение следующих нескольких недель, а платные клиенты получат неограниченный доступ к этому инструменту.

Компания заявила, что модель может генерировать контент или понимать команды в голосе, тексте или изображениях.

«Новый голосовой (и видео) режим — лучший компьютерный интерфейс, который я когда-либо использовал. Он похож на ИИ из фильмов», — сказал генеральный директор OpenAI Сэм Альтман в своем блоге.

Альтман ранее указывал на персонажа Скарлетт Йоханссон в фильме «Она» как на источник вдохновения для того, куда он хотел бы направить взаимодействие ИИ.

«Разговор с компьютером никогда не казался мне по-настоящему естественным; теперь это так», — добавил он.

Мурати и инженеры из OpenAI продемонстрировали новые возможности GPT-4o на виртуальном мероприятии, поставив перед усовершенствованной версией чат-бота ChatGPT вызов.

В демо в основном участвовали сотрудники OpenAI, которые задавали вопросы озвученному ChatGPT, который отвечал шутками и человеческим подшучиванием.

Бот выполнял функции переводчика с английского на итальянский, интерпретировал выражения лица и помог одному пользователю решить сложную алгебраическую задачу.

Компания заявила, что GPT-4o обладает теми же возможностями, что и предыдущая версия, когда дело касается текста, рассуждения и интеллекта в кодировании, а также устанавливает новые отраслевые стандарты для многоязычных разговоров, звука и зрения.

В одной из демонстраций ChatGPT успешно интерпретировал окружение сотрудника через камеру смартфона, говоря дружелюбным женским голосом, мало чем отличаясь от бота с искусственным интеллектом в фильме «Она».

«Хммм, судя по тому, что я вижу, похоже, что вы находитесь на какой-то записывающей или производственной установке с освещением, штативами… возможно, вы готовитесь снять видео или сделать объявление?» — сказал бот ChatGPT.

«Не торопитесь»

В последние недели были большие ожидания того, что OpenAI выпустит версию онлайн-поиска с искусственным интеллектом, которая будет конкурировать с поисковой системой Google, но в пятницу Альтман заявил, что этого не произойдет.

Наблюдатели также ждали запуска GPT-5, но на прошлой неделе Альтман заявил, что его компания «не торопится с выпуском крупных новых моделей».

Это событие является лишь последним эпизодом в гонке вооружений в области искусственного интеллекта, в которой Microsoft, поддерживающая OpenAI, превзошла Apple как крупнейшую в мире компанию по рыночной капитализации.

OpenAI и Microsoft находятся в ожесточенном соперничестве с Google за право стать основным игроком в области генеративного ИИ.

Все компании изо всех сил пытаются придумать способы покрыть непомерные затраты на генеративный искусственный интеллект, большая часть которых идет гиганту чипов Nvidia и ее мощным полупроводниковым графическим процессорам.

Предоставление новой модели доступной всем пользователям может вызвать вопросы о пути OpenAI к монетизации на фоне сомнений в том, что обычные пользователи готовы платить за подписку.

До сих пор клиентам были доступны бесплатно только менее производительные версии OpenAI или чат-ботов Google.

«Мы — бизнес, и мы найдем множество вещей, за которые можно брать плату», — сказал Альтман в своем блоге.

Создатели ИИ также ощущают давление со стороны издателей и создателей, которые требуют оплаты за любой контент, используемый для обучения моделей.

OpenAI подписала партнерские соглашения по контенту с Associated Press, Financial Times и Axel Springer, но также попала в крупный судебный процесс с The New York Times.

Компании, занимающиеся искусственным интеллектом, также столкнулись с отдельными исками от художников, музыкантов и авторов в залах судов США.

OpenAI дает ChatGPT новые возможности видеть и слышать



Новости партнеров