OpenAI презентує нові моделі GPT, але доступ обмежений

Компанія OpenAI оголошує про обмежене тестування своєї новітньої передової моделі штучного інтелекту GPT-5.6, яка представлена трьома варіантами: Sol, Terra та Luna.

Sol призначена для вирішення найскладніших завдань, таких як складне програмування та дослідження безпеки; Terra — для високооб’ємних бізнес-завдань, як-от підтримка клієнтів, внутрішні інструменти та аналіз документів; а Luna — для швидкої, менш витратної повсякденної роботи, як-от узагальнення, складання текстів та рутинна автоматизація. Sol та Terra встановлюють нові рекорди за показниками ефективності, тоді як Luna демонструє результати, близькі до GPT-5.5, на кількох тестах, незважаючи на позиціонування як найшвидшої та найменш витратної моделі в сімействі GPT-5.6.

Проте моделі спочатку будуть доступні обмеженому колу приблизно 20 організацій, після того, як OpenAI поділилася планами випуску та самими моделями з урядом США. Загальний випуск заплановано на “найближчі тижні”.

Поетапний випуск відбувається відповідно до виконавчого наказу, виданого Президентом Дональдом Дж. Трампом на початку цього місяця, 2 червня 2026 року, який закликає різні федеральні агентства співпрацювати у процесі оцінки та тестування можливостей нових моделей ШІ, щоб забезпечити їхню безпеку та відповідність для широкого розповсюдження.

Хоча цей процес ще триває (згідно з наказом, він має зайняти 30 днів, тобто до 2 липня), OpenAI зазначає у своєму блозі: “Ми попередньо ознайомили наші плани та можливості моделей перед сьогоднішнім запуском. На прохання [уряду США] ми розпочинаємо з обмеженого попереднього перегляду для невеликої групи перевірених партнерів”.

Стратегія обмеженого попереднього випуску OpenAI також наслідує різкий крок уряду США щодо введення наказу про експортний контроль проти Anthropic, головного конкурента OpenAI в США, через виявлені вразливості (jailbreaks) у їхній найпотужнішій загальнодоступній моделі Claude Fable 5. На це Anthropic відповів видаленням доступу до моделі та її аналога, орієнтованого на кібербезпеку, Claude Mythos 5, для будь-яких публічних чи приватних сторін. (Раніше Anthropic анонсувала попередню версію моделі як “Claude Mythos Preview” для невеликої кількості зовнішніх учасників своєї програми досліджень кібербезпеки “Project Glasswing”, починаючи з квітня).

Оскільки OpenAI координує свою стратегію випуску з Білим домом перед ширшим публічним запуском, корпоративні покупці повинні орієнтуватися в новому ландшафті безпекових заходів у режимі реального часу, обов’язкових параметрів відповідності та структурованих систем кешування токенів.

Відмінності трьох нових моделей GPT-5.6: Sol проти Terra проти Luna

Три моделі GPT-5.6 розроблені для задоволення різних потреб підприємств та профілів продуктивності.

Sol — це топовий варіант, створений для найвимогливіших завдань, таких як складне логічне мислення, тривалі сесії програмування, розширені робочі процеси на основі агентів та програми, орієнтовані на безпеку.

Sol забезпечує найвищий рівень можливостей, але має найвищу ціну: 5,00 доларів США за мільйон вхідних токенів / 30,00 доларів США за мільйон вихідних токенів — так само, як і GPT-5.5. OpenAI зазначає, що ця модель демонструє значне зростання продуктивності для тривалих завдань програмування, кібербезпеки та роботи агентів.

Terra поєднує високу продуктивність з ефективністю. Вона призначена для великомасштабних виробничих середовищ, де організаціям потрібні надійні результати для великого обсягу роботи без навантаження найсучаснішої моделі. Її вартість становить 2,50 / 15,00 доларів США за 1 мільйон токенів.

Luna — це найлегший та найекономічніший варіант, оптимізований для швидкості та повсякденних сценаріїв використання. Він добре підходить для простіших завдань, рутинних робочих процесів та програм, де швидкість реакції та масштабованість важливіші за максимальну глибину логічного мислення. Його ціна є найдоступнішою: 1 / 6 доларів США за мільйон вхідних та вихідних токенів відповідно.

Джерела, обізнані з внутрішніми процесами OpenAI, повідомили VentureBeat, що нова схема найменування була розроблена для відходу від варіантів “nano” та “mini” для GPT-5, оскільки ці моделі не так сильно відрізняються за розміром чи загальним інтелектом, а натомість розроблені для різних, чітко визначених сценаріїв використання.

Як зазначає OpenAI у своєму блозі щодо нової схеми найменування: “У цій новій системі найменування, представленій з GPT‑5.6, число ідентифікує покоління моделі, тоді як Sol, Terra та Luna ідентифікують стійкі рівні можливостей, які можуть розвиватися за власним графіком. Разом, це сімейство дає людям та розробникам чіткіший вибір між інтелектом, швидкістю та вартістю”.

Крім того, джерела повідомили, що OpenAI прагнула викликати почуття натхнення, дивлячись на космос та пов’язані з ним назви.

Таким чином, Sol добре узгоджується з програмою Daybreak від OpenAI для організацій, зацікавлених у використанні моделей OpenAI для посилення кіберзахисту, що є додатковою перевагою. Голосовий стиль “Sol” для голосового режиму OpenAI в ChatGPT не пов’язаний з цим і, ймовірно, буде перейменовано.

Нова системна карта GPT-5.6 додає ще один важливий пункт для бізнесу: OpenAI класифікує всі три моделі GPT-5.6 — не тільки Sol — як “Високий” рівень ризику як для кібернетичних, так і для біологічних/хімічних можливостей, тоді як рівень ШІ самовдосконалення нижчий. Це означає, що навіть дешевші варіанти Terra та Luna можуть нести нові зобов’язання щодо управління для компаній, які використовують їх у сферах безпеки, наук про життя або інших чутливих робочих процесах.

Ось як вони співвідносяться з іншими провідними моделями LLM за ціною — зверніть увагу, що найдешевший варіант OpenAI є загалом моделлю середньої ціни, і все ще дорожчим за модель передового рівня GLM-5.2.

Знімок цін API передових моделей ШІ від VentureBeat

Модель	Вхідні дані	Вихідні дані	Загальна вартість	Джерело
MiMo-V2.5 Flash	0,10 доларів США	0,30 доларів США	0,40 доларів США	Xiaomi MiMo
deepseek-v4-flash	0,14 доларів США	0,28 доларів США	0,42 доларів США	DeepSeek
deepseek-v4-pro	0,435 доларів США	0,87 доларів США	1,305 доларів США	DeepSeek
MiniMax-M3	0,30 доларів США	1,20 доларів США	1,50 доларів США	MiniMax
Gemini 3.1 Flash-Lite	0,25 доларів США	1,50 доларів США	1,75 доларів США	Google
Qwen3.7-Plus	0,40 доларів США	1,60 доларів США	2,00 доларів США	Alibaba Cloud
MiMo-V2.5	0,40 доларів США	2,00 доларів США	2,40 доларів США	Xiaomi MiMo
Grok 4.3 (низький контекст)	1,25 доларів США	2,50 доларів США	3,75 доларів США	xAI
MiMo-V2.5 Pro (≤256K)	1,00 долар США	3,00 доларів США	4,00 доларів США	Xiaomi MiMo
Kimi-K2.6	0,95 доларів США	4,00 доларів США	4,95 доларів США	Moonshot/Kimi
GLM-5.2	1,40 доларів США	4,40 доларів США	5,80 доларів США	Z.ai
GPT-5.6 Luna	1,00 долар США	6,00 доларів США	7,00 доларів США	OpenAI
Grok 4.3 (високий контекст)	2,50 доларів США	5,00 доларів США	7,50 доларів США	xAI
MiMo-V2.5 Pro (>256K)	2,00 доларів США	6,00 доларів США	8,00 доларів США	Xiaomi MiMo
Qwen3.7-Max	2,50 доларів США	7,50 доларів США	10,00 доларів США	Alibaba Cloud
Gemini 3.5 Flash	1,50 доларів США	9,00 доларів США	10,50 доларів США	Google
Gemini 3.1 Pro Preview (≤200K)	2,00 доларів США	12,00 доларів США	14,00 доларів США	Google
GPT-5.6 Terra	2,50 доларів США	15,00 доларів США	17,50 доларів США	OpenAI
GPT-5.4	2,50 доларів США	15,00 доларів США	17,50 доларів США	OpenAI
Gemini 3.1 Pro Preview (>200K)	4,00 доларів США	18,00 доларів США	22,00 доларів США	Google
Claude Opus 4.8	5,00 доларів США	25,00 доларів США	30,00 доларів США	Anthropic
GPT-5.5	5,00 доларів США	30,00 доларів США	35,00 доларів США	OpenAI
GPT-5.5 Instant (chat-latest)	5,00 доларів США	30,00 доларів США	35,00 доларів США	OpenAI
Sakana Fugu Ultra (≤272K)	5,00 доларів США	30,00 доларів США	35,00 доларів США	Sakana AI
GPT-5.6 Sol	5,00 доларів США	30,00 доларів США	35,00 доларів США	OpenAI
Claude Fable 5 / Claude Mythos 5	10,00 доларів США	50,00 доларів США	60,00 доларів США	Anthropic

Технологія: глибше логічне мислення та робота на основі під-агентів

Основна технічна зміна в GPT-5.6 полягає в тому, щоб надати моделі більше часу та структури для складних завдань під час інференсу (висновку).

OpenAI додає новий параметр максимального логічного мислення для GPT-5.6 Sol, призначений для проблем, що вимагають тривалішого обмірковування.

OpenAI також представляє “ультра режим”, який залучає під-агентів, що можуть розподіляти та прискорювати складні проєкти, замість того, щоб тримати роботу в межах одного агента.

Оцінки результатів запуску компанії свідчать про покращення продуктивності в кількох завданнях, що імітують роботу агентів.

Бенчмарки показують помітне покращення порівняно з GPT-5.5 та новий стан речей у завданнях командного рядка TerminalBench 2.1

Серія GPT-5.6 демонструє чіткий стрибок продуктивності порівняно з попередніми версіями у складних завданнях логічного мислення та довготривалих завданнях.

OpenAI презентує нові моделі GPT, але доступ обмежений 6

В автоматизації командного рядка, оціненій на TerminalBench 2.1, як флагманська модель Sol, так і модель середнього рівня Terra перевершують попередні бенчмарки GPT-5.5. Примітно, що Sol використала новий ультра режим мислення для досягнення рекордного результату в 91,91% на цьому тестуванні, а режим Max — 88,76%, що вище, ніж у GPT-5.5 (83,4%) та Claude Mythos 5 (88%).

Ця перевага поширюється і на професійні робочі процеси в Agent’s Last Exam, де Sol є єдиною моделлю, яка успішно подолала позначку в 50% виконання завдань у “режимі коду” (50,9%), тоді як повсякденний варіант Luna також ледь перевершує флагман попереднього покоління.

OpenAI презентує нові моделі GPT, але доступ обмежений 7

У кількісно-біологічному та геномному тестуванні Sol і Terra досягають вищих показників точності, ніж GPT-5.5 та GPT-5.4, причому Sol явно забезпечує ці сильніші результати, споживаючи менше токенів.

Нарешті, в оцінках кібербезпеки, що вимірюють дослідження вразливостей та їх експлуатацію, нові моделі розширюють попередні межі продуктивності; Sol досягає значно вищих цільових показників експлуатації зі зростанням часу логічного мислення та забезпечує конкурентоспроможні межі можливостей, використовуючи лише третину вихідних токенів, необхідних для старих моделей.

За даними OpenAI, на ExploitBench Sol працює майже на рівні Mythos Preview, генеруючи приблизно на третину менше вихідних токенів.

OpenAI презентує нові моделі GPT, але доступ обмежений 8

Передбачувана механіка кешування промптів та прискорення на Cerebras

Щоб допомогти підприємствам контролювати непередбачувані витрати на запуск агентних циклів, API GPT-5.6 вводить оновлений протокол кешування промптів.

Тепер розробники можуть реалізовувати явні точки зупинки кешування з гарантованим мінімальним терміном життя кешу у 30 хвилин.

У рамках цієї системи перше записування в кеш коштує в 1,25 рази більше за стандартний тариф моделі для вхідних даних без кешування, тоді як наступні читання з кешу отримують знижку 90%.

На практиці, бізнеси, які виконують повторні або схожі операції, платять більше за створення кешу, а потім значно менше кожного разу, коли вони повторно використовують цей кешований контекст протягом мінімального вікна кешування (30 хвилин).

Для систем, які регулярно передають величезні контекстні вікна або визначення кодових баз назад у модель, така передбачуваність є критично важливим фінансовим запобіжником.

Крім того, для корпоративних програм, де затримка є основним бар’єром для впровадження, OpenAI запускає GPT-5.6 Sol на обладнанні Cerebras цього липня.

Це партнерство з інфраструктури обіцяє швидкість обробки до 750 токенів на секунду, орієнтуючись на спеціалізовані корпоративні програми, що вимагають обробки в реальному часі на рівні передових технологій.

Наслідки для підприємств: високий рівень безпеки та алгоритмічні перешкоди

Для корпоративних команд з розробки, інформаційної безпеки та відповідності нормативним вимогам впровадження GPT-5.6 вимагає ретельного розгляду його архітектури безпеки.

Щоб отримати дозвіл на випуск, OpenAI витратила приблизно 700 000 годин роботи GPU A100e виключно на автоматизоване червоне тестування (red-teaming) GPT-5.6. Цей обчислювальний ресурс був спрямований на виявлення “універсальних вразливостей” (universal jailbreaks) — системних векторів атак, розроблених для обходу захисних механізмів у різних контекстах, а не для одноразових обхідних шляхів.

OpenAI стверджує, що впровадила багатошаровий стек захисту, який працює в режимі реального часу, створюючи навмисні операційні перешкоди для команд безпеки підприємств.

Відхилення на рівні моделі: GPT-5.6 налаштована відхиляти заборонену допомогу в галузі кібербезпеки, включаючи запити, які маскують зловмисні наміри або намагаються обійти захисні механізми.
Сканування зловживань у реальному часі: Окремі детектори кібербезпеки та біологічної безпеки перевіряють результати під час їх створення.
Сканування на основі активації: Для Sol і Terra OpenAI заявляє, що додає класифікатори активації, які відстежують внутрішні сигнали моделі під час висновку. Якщо ці системи виявляють ризикований патерн, потокова передача вихідних даних може призупинитися, поки інша перевірка безпеки аналізує контент. Luna, схоже, не отримує такого ж рівня класифікації активації, хоча вона все ще охоплена іншими системами моніторингу.
Паузи під час логічного мислення: Коли ризик виглядає підвищеним, генерація може зупинитися, поки більш масштабна система логічного мислення аналізує обмін даними та навколишній контекст. Якщо система класифікує вивід як недозволений, відповідь блокується до досягнення кінцевого пункту.

Оскільки легітимна оборонна робота — така як перевірка коду, виявлення вразливостей, розробка патчів та оборонне тестування — часто використовує ті самі примітиви коду, що й наступальні експлойти, OpenAI визнає, що її класифікатори можуть регулярно спрацьовувати помилково.

Системна карта показує, що стек моніторингу OpenAI досяг 94,8% загального охоплення у своєму наборі біологічних оцінок та 81,6% загального охоплення у своєму наборі оцінок кібербезпеки. Ці цифри дають підприємствам рідкісний кількісний огляд заходів безпеки, але вони також свідчать про те, що система не є досконалою і може пропустити деякі ризиковані випадки або заблокувати деяку легітимну роботу.

Постійні спрацьовування можуть спричинити автоматизовані перевірки облікового запису за всіма історичними розмовами для оцінки того, чи займається корпоративний клієнт зловмисною поведінкою чи стандартними дослідженнями безпеки. OpenAI наразі веде переговори щодо довгострокових заходів безпеки для корпоративних клієнтів, включаючи елементи керування безпекою, керовані клієнтом, та механізми виявлення, що зберігають приватність, щоб захистити корпоративні дані від ручних конвеєрів перевірки.

Важливо зазначити, що, згідно з тестуванням, Sol залишається оптимізованою для оборонного стримування, а не для наступального розгортання. В оцінках, проведених на кодових базах Chromium і Firefox, модель успішно ізолювала помилки та примітиви експлуатації, але не змогла автономно розробити функціональний, повноцінний експлойт, залишаючись безпечно нижче рівня сповіщення “Cyber Critical” організації.

Однак усі три моделі GPT-5.6 перевищили її “високий” кібернетичний поріг у внутрішніх тестах “захоплення прапора” (capture-the-flag), де Sol досягла 96,7%, Terra — 91,84%, а Luna — 85,19%.

Ця відмінність важлива для покупців корпоративної безпеки: OpenAI представляє GPT-5.6 як достатньо потужну, щоб допомогти автоматизувати частини дослідження вразливостей та аналізу експлойтів, але ще не як систему, яка може надійно вести повну передову атакувальну кампанію без людського керівництва за тестовими умовами компанії.

Геополітика поетапного випуску

Ширший випуск серії GPT-5.6 відображає наростаюче заплутування між передовими лабораторіями ШІ та протоколами національної безпеки.

Рішення обмежити початковий доступ невеликому колу перевірених партнерів, чиї дані передаються уряду США, випливає з прямої координації щодо розробки рамок кібербезпеки відповідно до виконавчого наказу. OpenAI зробила незвичайний крок, публічно критикуючи цей державний контроль у своїх офіційних документах анонсу продукту. Компанія прямо зазначає:

“Ми не вважаємо, що такий процес урядового доступу повинен стати довгостроковою нормою. Він обмежує доступ до найкращих інструментів для користувачів, розробників, підприємств, кіберзахисників та глобальних партнерів, які їх потребують”.

Ця напруженість висвітлює делікатне становище сучасних технологічних підприємств. Хоча організації можуть отримати безпрецедентну ефективність агентів та надійні можливості оборонного патчингу через такі бенчмарки, як ExploitGym та ExploitBench, вони також повинні прийняти той факт, що доступ до преміальних інструментів залишається предметом дипломатичної та регуляторної авторизації.

Як захиститися (Порада CryptoDom): Завжди перевіряйте офіційні джерела інформації про випуск нових технологій та використовуйте надійні інструменти для двофакторної автентифікації, щоб запобігти несанкціонованому доступу до ваших облікових записів, особливо при роботі з новими або чутливими даними.

За даними порталу: venturebeat.com

No votes yet.

Please wait...