OpenAI випустила альфа-версію просунутого голосового помічника – ForkLog UA

OpenAI представила альфа-версію просунутого голосового режиму GPT-4o для невеликої групи користувачів ChatGPT Plus. Для всіх власників підписки він стане доступний восени.

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK

— OpenAI (@OpenAI) July 30, 2024

Учасники альфа-групи отримають сповіщення в застосунку та електронного листа з інструкцією щодо використання нового режиму. Користувачі можуть спілкуватися з ChatGPT голосом і отримувати відповіді в реальному часі без затримок, а також перебивати штучний інтелект під час його мови.

У травні OpenAI представила останню модель чат-бота GPT-4o і анонсувала додавання спеціального режиму Voice Mode для спілкування голосом. Запуск альфа-версії планували до кінця червня, але його перенесли на місяць.

Деякі продемонстровані в травні можливості ШІ не увійшли до запущеної альфа-версії, включно зі спільним використанням екрана і підтримкою відео. Вони будуть представлені пізніше.

Розширений голосовий режим

Стандартний голосовий режим ChatGPT використовує три окремі моделі:

одну для перетворення голосу в текст;
іншу для обробки запиту;
третю для конвертації тексту в голос.

Нове рішення мультимодального GPT-4o відрізняється, оскільки не використовує допоміжні моделі. Завдяки цьому розмова ведеться з меншою затримкою. За словами OpenAI, чат-бот може вловлювати емоційні інтонації в голосі на кшталт смутку або хвилювання.

ChatGPT може спілкуватися чотирма голосами, записаними у співпраці з акторами озвучування. Він не імітуватиме мову інших людей. Додатково додано фільтри для відхилення деяких запитів на створення музики або інших форм захищеного авторським правом контенту.

Нагадаємо, у липні OpenAI повідомила про тестування нових функцій пошуку на базі ШІ — SearchGPT.

Того ж місяця ЗМІ дізналися про роботу компанії Сема Альтмана над новою технологією Strawberry, яка «значно поліпшить процес міркування ШІ-моделей і дасть їм можливість планувати дії наперед».

Источник

No votes yet.

Please wait...