OpenAI анонсувала передову ШІ-модель GPT-5.5 – ForkLog UA

OpenAI анонсувала передову ШІ-модель GPT-5.5 - ForkLog UA 2

Фірма OpenAI презентувала GPT‑5.5. Дану модель анонсують як «новий ступінь інтелекту для практичної діяльності та адміністрування агентами».

Штучна нейромережа «спроектована для осягнення важких завдань, застосування інструментарію, оцінки результатів праці й завершення більшої кількості цілей».

Модель здатна осягнути інтенції користувача, самостійно планувати діяльність і доводити завдання до кінцевого результату. GPT‑5.5 «чудово вправляється» з розробкою та налагодженням коду, відшукуванням даних в інтернеті, обробкою інформації, створенням документів і таблиць, управлінням ПЗ і перемиканням між інструментами.

«Замість скрупульозного контролювання кожного кроку ви можете доручити GPT‑5.5 комплексне багатоетапне завдання і покластися на неї в плануванні, використанні інструментів, інспектуванні своєї діяльності, подоланні неясностей і продовженні роботи», — зазначено в анонсі.

image

image

Тестування GPT‑5.5 у різноманітних бенчмарках. Джерело: OpenAI.

OpenAI відзначила, що нова модель особливо дієва в агентному програмуванні, адмініструванні комп’ютером, інтелектуальній діяльності та початкових наукових дослідженнях — галузях, де вкрай необхідно вибудовувати довгі ланцюжки розмірковувань і дій.

«GPT‑5.5 надає стрибок в інтелекті, не завдаючи шкоди швидкості. Більші та потужніші моделі часто-густо працюють повільніше, однак GPT‑5.5 відповідає GPT‑5.4 за затримкою на токен у реальних умовах, водночас демонструючи значно вищий рівень інтелекту», — констатували в стартапі.

Штучна нейромережа споживає «значно менше» токенів під час функціонування в Codex.

OpenAI повідомила про використання «найпотужнішого» набору запобіжних заходів перед запуском. Компанія співпрацювала з внутрішніми та сторонніми експертами.

Доступність

GPT‑5.5 функціонує в ChatGPT і Codex для користувачів планів Plus, Pro, Business і Enterprise. Окрема версія GPT‑5.5 Pro представлена для Pro, Business і Enterprise.

Найближчим часом обидві варіації виникнуть через API за ціною $5 млн за 1 млн вхідних токенів і $30 млн — вихідних. Вікно контексту — 1 млн токенів.

У Codex GPT‑5.5 доступна для тарифних планів Plus, Pro, Business, Enterprise, Edu і Go з вікном контексту 400 000. GPT‑5.5 представлена в режимі Fast, генеруючи токени в 1,5 раза швидше за 2,5х вартості.

GPT‑5.5 коштує дорожче, аніж GPT‑5.4. Це пояснюється вищою результативністю використання токенів.

Можливості GPT‑5.5

Нова модель витрачає менше токенів і рідше вдається до повторних спроб під час вирішення завдань. У показнику програмування Artificial Analysis вона забезпечує «передовий ступінь інтелекту» за вдвічі менших витрат, порівнюючи з конкурентами.

image

image

Джерело: OpenAI.

GPT‑5.5 — найпотужніше рішення компанії у сфері агентного програмування. У Terminal‑Bench 2.0, де випробовують складні сценарії функціонування в командному рядку, точність становить 82,7%.

У SWE‑Bench Pro результат дорівнював 58,6%, в Expert‑SWE нейромережа перевершила GPT‑5.4.

За усіма трьома бенчмарками новинка перевершила попередницю, водночас використавши менше токенів.

image

image

Джерело: OpenAI.

«Сильні сторони моделі у сфері програмування особливо яскраво виявляються в Codex, де вона здатна виконувати інженерні завдання — від реалізації та рефакторингу до налагодження, тестування та валідації», — йдеться в блозі компанії.

GPT‑5.5 краще розуміє устрій системи: чому щось не працює, де потрібно внести виправлення і яких частин коду це торкнеться.

Модель «помітно перевершує» GPT‑5.4 і Claude Opus 4.7 за спроможністю до логічного мислення та автономності: вона завчасно виявляє проблеми, передбачає потреби в тестуванні та рецензуванні без очевидних підказок.

У тесті GDPval⁠⁠, який перевіряє здатність агентів виконувати чітко визначені інтелектуальні завдання у 44 професіях, GPT‑5.5 набирає 84,9%. В OSWorld‑Verified — 78,7%, у Tau2‑bench — 98%.

image

image

Джерело: OpenAI.

GPT‑5.5 демонструє високі результати і в інших тестах: 60% у FinanceAgent, 88,5% — у задачах внутрішнього моделювання інвестиційного банкінгу та 54,1% — в OfficeQA Pro.

image

image

Джерело: OpenAI.

Робота з інформацією

GPT‑5.5 є «потужним інструментом для буденної діяльності на комп’ютері». Модель краще розуміє ідею користувача і впевненіше проходить увесь цикл роботи з інформацією: відшукування, обробка, використання інструментів, оцінка та перетворення початкових даних у готовий результат.

У Codex GPT‑5.5 перевершує GPT‑5.4 у творенні документів, таблиць і слайд‑презентацій.

Більш ніж 85% співробітників різних підрозділів OpenAI щотижня використовують Codex, зокрема в розробці ПЗ, фінансах, комунікаціях, маркетингу, аналітиці даних і продакт‑менеджменті.

Наукові дослідження

У науково‑технічних робочих процесах GPT‑5.5 також показує кращі результати. Йдеться про задачі, які не зводяться до відповіді на конкретне запитання: модель здатна послідовно вивчати ідею, збирати докази, перевіряти гіпотезу та інтерпретувати отримані дані.

image

image

Джерело: OpenAI.

GPT‑5.5 демонструє поліпшення, порівнюючи з GPT‑5.4 на GeneBench — платформі для багатоетапного аналізу наукових даних у генетиці та кількісній біології.

У BixBench нова модель також перевершила попередницю.

image

image

Джерело: OpenAI.

Нагадаємо, у квітні OpenAI презентувала «агентів для робочої зони» в ChatGPT. Колективи можуть створювати спільних асистентів для вирішення складних завдань і тривалих процесів.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *