OpenAI презентує GPT-5.4 з підтримкою комп'ютерного бачення - ForkLog UA

Компанія OpenAI представила GPT‑5.4 та GPT‑5.4 Pro через дві доби після випуску версії 5.3 Instant.

GPT-5.4 Thinking and GPT-5.4 Pro are rolling out now in ChatGPT.

GPT-5.4 is also now available in the API and Codex.

GPT-5.4 brings our advances in reasoning, coding, and agentic workflows into one frontier model. pic.twitter.com/1hy6xXLAmJ

— OpenAI (@OpenAI) March 5, 2026

Звичайна редакція GPT‑5.4 наявна у веб‑інтерфейсі ChatGPT, через API та в інструменті Codex. Редакцію GPT‑5.4 Thinking відкрили для підписників Plus, Team і Pro.

Для користувачів плану Pro та корпоративних замовників Enterprise призначена GPT‑5.4 Pro, котра також наявна через API.

Базова ціна використання становить $2,5 за 1 млн вхідних токенів і $15 за 1 млн вихідних. Розцінки для редакції Pro значно вищі: $30 та $180 за 1 млн токенів відповідно.

Результативність у робочих задачах

GPT‑5.4 надає більш сталі та якісні результати у реальних випадках використання. У бенчмарку GDPval, що оцінює виконання задач за 44 професіями, редакція досягла показника 83%. Це сигналізує, що модель функціонує на рівні профільних спеціалістів чи перевершує їх. Для зіставлення, результат GPT‑5.2 складав 70,9%.

Джерело: OpenAI.

Особливу увагу розробники зосередили на роботі з таблицями, презентаціями та документами. У задачах рівня початкового аналітика інвестбанку GPT‑5.4 набрала 87,3% проти 68,4% у GPT‑5.2.

Презентаціям від нової моделі оцінювачі надавали перевагу у 68% випадків — за кращу естетику, різноманітність та ефективне використання генерації зображень.

Джерело: OpenAI.

GPT‑5.4 також стала найточнішою моделлю OpenAI з точки зору роботи з фактами. У ході тестування на промптах з наперед відомими огріхами:

окремі твердження виявлялися невірними на 33% рідше;
повні відповіді містили неточності на 18% рідше у порівнянні з GPT‑5.2.

Комп’ютерний зір

Редакція уперше отримала вбудовані здатності комп’ютерного зору та управління ПК. Модель здатна використовувати мишу та клавіатуру, орієнтуючись на скриншоти, а також писати код для автоматизації через Playwright.

Поведінку налаштовують під конкретні сценарії з урахуванням припустимого рівня ризику.

У бенчмарку OSWorld‑Verified (керування робочим столом) GPT‑5.4 успішно виконала 75% задач, обійшовши попередню редакцію (47,3%) та людину (72,4%). Прогрес пов’язаний з поліпшеним візуальним сприйняттям:

у тесті MMMU‑Pro (розуміння і логіка) результат склав 81,2% проти 79,5% у GPT‑5.2;
в OmniDocBench (аналіз документів) середній показник помилок знизився з 0,140 до 0,109.

Програмування

У кодингу модель зрівнялася зі спеціалізованою GPT‑5.3‑Codex, але функціонує швидше.

У Codex з’явився режим /fast, що прискорює генерацію у півтора рази без втрати якості. За підсумками внутрішніх тестувань GPT‑5.4 продемонструвала високі результати у складних задачах фронтенд‑розробки.

Також представлено експериментальну навичку Playwright (Interactive). Вона дозволяє моделі візуально налагоджувати веб‑ та Electron‑застосунки, тестуючи власний код прямо в процесі написання.

Інструменти

У GPT‑5.4 з’явилась функція пошуку інструментів (Tool Search). Раніше системі необхідно було заздалегідь завантажувати в контекст описи всіх наявних плагінів. Це додавало тисячі зайвих токенів до кожного запиту та збільшувало вартість.

Тепер модель одержує лише базовий список та за потреби самостійно знаходить та підвантажує потрібні параметри. У тестах на базі MCP Atlas такий підхід знизив споживання токенів на 47% без втрати точності.

Вебпошук також став продуктивнішим: у бенчмарку BrowseComp показники зросли на 17%, а редакція Pro досягла рекордних 89,3%. GPT‑5.4 Thinking ефективніше збирає інформацію з багатьох джерел, краще обробляє складні запити та надає більш структуровані відповіді.

Керованість і контекст

У процесі роботи зі складними запитами GPT‑5.4 Thinking у ChatGPT спершу показує користувачу план дій. Це дозволяє на ходу скорегувати напрям без перезапуску генерації та зайвих уточнень. Функція вже доступна на сайті та в Android‑застосунку, незабаром з’явиться на iOS.

Модель також краще утримує контекст у довгих діалогах та довше обмірковує складні задачі. Це допомагає зберігати зв’язність та релевантність відповідей навіть у ході роботи з великими масивами інформації.

Нагадаємо, на початку березня користувачі бойкотували ChatGPT на тлі угоди OpenAI з Пентагоном.

No votes yet.

Please wait...

OpenAI презентує GPT-5.4 з підтримкою комп’ютерного бачення – ForkLog UA

Результативність у робочих задачах

Комп’ютерний зір

Програмування

Інструменти

Керованість і контекст

Залишити відповідьСкасувати відповідь