OpenAI випустила альфа-версію просунутого голосового помічника — ForkLog UA
OpenAI представила альфа-версію просунутого голосового режиму GPT-4o для невеликої групи користувачів ChatGPT Plus. Для всіх власників підписки він стане доступний восени.
We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
Учасники альфа-групи отримають сповіщення в застосунку та електронного листа з інструкцією щодо використання нового режиму. Користувачі можуть спілкуватися з ChatGPT голосом і отримувати відповіді в реальному часі без затримок, а також перебивати штучний інтелект під час його мови.
У травні OpenAI представила останню модель чат-бота GPT-4o і анонсувала додавання спеціального режиму Voice Mode для спілкування голосом. Запуск альфа-версії планували до кінця червня, але його перенесли на місяць.
Деякі продемонстровані в травні можливості ШІ не увійшли до запущеної альфа-версії, включно зі спільним використанням екрана і підтримкою відео. Вони будуть представлені пізніше.
Розширений голосовий режим
Стандартний голосовий режим ChatGPT використовує три окремі моделі:
- одну для перетворення голосу в текст;
- іншу для обробки запиту;
- третю для конвертації тексту в голос.
Нове рішення мультимодального GPT-4o відрізняється, оскільки не використовує допоміжні моделі. Завдяки цьому розмова ведеться з меншою затримкою. За словами OpenAI, чат-бот може вловлювати емоційні інтонації в голосі на кшталт смутку або хвилювання.
ChatGPT може спілкуватися чотирма голосами, записаними у співпраці з акторами озвучування. Він не імітуватиме мову інших людей. Додатково додано фільтри для відхилення деяких запитів на створення музики або інших форм захищеного авторським правом контенту.
Нагадаємо, у липні OpenAI повідомила про тестування нових функцій пошуку на базі ШІ — SearchGPT.
Того ж місяця ЗМІ дізналися про роботу компанії Сема Альтмана над новою технологією Strawberry, яка «значно поліпшить процес міркування ШІ-моделей і дасть їм можливість планувати дії наперед».