OpenAI анонсувала передову ШІ-модель GPT-5.5 – ForkLog UA

Фірма OpenAI презентувала GPT‑5.5. Дану модель анонсують як «новий ступінь інтелекту для практичної діяльності та адміністрування агентами».

Штучна нейромережа «спроектована для осягнення важких завдань, застосування інструментарію, оцінки результатів праці й завершення більшої кількості цілей».

Модель здатна осягнути інтенції користувача, самостійно планувати діяльність і доводити завдання до кінцевого результату. GPT‑5.5 «чудово вправляється» з розробкою та налагодженням коду, відшукуванням даних в інтернеті, обробкою інформації, створенням документів і таблиць, управлінням ПЗ і перемиканням між інструментами.

«Замість скрупульозного контролювання кожного кроку ви можете доручити GPT‑5.5 комплексне багатоетапне завдання і покластися на неї в плануванні, використанні інструментів, інспектуванні своєї діяльності, подоланні неясностей і продовженні роботи», — зазначено в анонсі.

image

image

Тестування GPT‑5.5 у різноманітних бенчмарках. Джерело: OpenAI.

OpenAI відзначила, що нова модель особливо дієва в агентному програмуванні, адмініструванні комп’ютером, інтелектуальній діяльності та початкових наукових дослідженнях — галузях, де вкрай необхідно вибудовувати довгі ланцюжки розмірковувань і дій.

«GPT‑5.5 надає стрибок в інтелекті, не завдаючи шкоди швидкості. Більші та потужніші моделі часто-густо працюють повільніше, однак GPT‑5.5 відповідає GPT‑5.4 за затримкою на токен у реальних умовах, водночас демонструючи значно вищий рівень інтелекту», — констатували в стартапі.

Штучна нейромережа споживає «значно менше» токенів під час функціонування в Codex.

OpenAI повідомила про використання «найпотужнішого» набору запобіжних заходів перед запуском. Компанія співпрацювала з внутрішніми та сторонніми експертами.

Доступність

GPT‑5.5 функціонує в ChatGPT і Codex для користувачів планів Plus, Pro, Business і Enterprise. Окрема версія GPT‑5.5 Pro представлена для Pro, Business і Enterprise.

Найближчим часом обидві варіації виникнуть через API за ціною $5 млн за 1 млн вхідних токенів і $30 млн — вихідних. Вікно контексту — 1 млн токенів.

У Codex GPT‑5.5 доступна для тарифних планів Plus, Pro, Business, Enterprise, Edu і Go з вікном контексту 400 000. GPT‑5.5 представлена в режимі Fast, генеруючи токени в 1,5 раза швидше за 2,5х вартості.

GPT‑5.5 коштує дорожче, аніж GPT‑5.4. Це пояснюється вищою результативністю використання токенів.

Можливості GPT‑5.5

Нова модель витрачає менше токенів і рідше вдається до повторних спроб під час вирішення завдань. У показнику програмування Artificial Analysis вона забезпечує «передовий ступінь інтелекту» за вдвічі менших витрат, порівнюючи з конкурентами.

image

image

Джерело: OpenAI.

GPT‑5.5 — найпотужніше рішення компанії у сфері агентного програмування. У Terminal‑Bench 2.0, де випробовують складні сценарії функціонування в командному рядку, точність становить 82,7%.

У SWE‑Bench Pro результат дорівнював 58,6%, в Expert‑SWE нейромережа перевершила GPT‑5.4.

За усіма трьома бенчмарками новинка перевершила попередницю, водночас використавши менше токенів.

image

image

Джерело: OpenAI.

«Сильні сторони моделі у сфері програмування особливо яскраво виявляються в Codex, де вона здатна виконувати інженерні завдання — від реалізації та рефакторингу до налагодження, тестування та валідації», — йдеться в блозі компанії.

GPT‑5.5 краще розуміє устрій системи: чому щось не працює, де потрібно внести виправлення і яких частин коду це торкнеться.

Модель «помітно перевершує» GPT‑5.4 і Claude Opus 4.7 за спроможністю до логічного мислення та автономності: вона завчасно виявляє проблеми, передбачає потреби в тестуванні та рецензуванні без очевидних підказок.

У тесті GDPval⁠⁠, який перевіряє здатність агентів виконувати чітко визначені інтелектуальні завдання у 44 професіях, GPT‑5.5 набирає 84,9%. В OSWorld‑Verified — 78,7%, у Tau2‑bench — 98%.

image

image

Джерело: OpenAI.

GPT‑5.5 демонструє високі результати і в інших тестах: 60% у FinanceAgent, 88,5% — у задачах внутрішнього моделювання інвестиційного банкінгу та 54,1% — в OfficeQA Pro.

image

image

Джерело: OpenAI.

Робота з інформацією

GPT‑5.5 є «потужним інструментом для буденної діяльності на комп’ютері». Модель краще розуміє ідею користувача і впевненіше проходить увесь цикл роботи з інформацією: відшукування, обробка, використання інструментів, оцінка та перетворення початкових даних у готовий результат.

У Codex GPT‑5.5 перевершує GPT‑5.4 у творенні документів, таблиць і слайд‑презентацій.

Більш ніж 85% співробітників різних підрозділів OpenAI щотижня використовують Codex, зокрема в розробці ПЗ, фінансах, комунікаціях, маркетингу, аналітиці даних і продакт‑менеджменті.

Наукові дослідження

У науково‑технічних робочих процесах GPT‑5.5 також показує кращі результати. Йдеться про задачі, які не зводяться до відповіді на конкретне запитання: модель здатна послідовно вивчати ідею, збирати докази, перевіряти гіпотезу та інтерпретувати отримані дані.

image

image

Джерело: OpenAI.

GPT‑5.5 демонструє поліпшення, порівнюючи з GPT‑5.4 на GeneBench — платформі для багатоетапного аналізу наукових даних у генетиці та кількісній біології.

У BixBench нова модель також перевершила попередницю.

image

image

Джерело: OpenAI.

Нагадаємо, у квітні OpenAI презентувала «агентів для робочої зони» в ChatGPT. Колективи можуть створювати спільних асистентів для вирішення складних завдань і тривалих процесів.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *