GLM-5.2 від Z.ai перевершує GPT-5.5 за кодуванням і вшестеро дешевший

GLM-5.2 від Z.ai перевершує GPT-5.5 за кодуванням і вшестеро дешевший 4

Китайський стартап у сфері штучного інтелекту Z.ai (раніше Zhipu AI) сьогодні оголосив про негайний випуск GLM-5.2, великої мовної моделі (LLM) з відкритими ваговими коефіцієнтами та 753 мільярдами параметрів, спеціально розробленої для домінування у задачах довготривалого автономного кодування та інженерії.

Модель, доступна негайно на Hugging Face, через API Z.ai та у понад 20 сторонніх середовищах розробки коду, може похвалитися надзвичайно стабільним контекстним вікном на 1 мільйон токенів, а також корпоративними тарифними планами, що стартують від 12.60 доларів США на місяць.

З чудовою новиною для бізнесів, свідомих витрат і безпеки, Z.ai випустила основні вагові коефіцієнти GLM-5.2 під необмеженою відкритою ліцензією MIT. Це дозволяє підприємствам безкоштовно завантажувати модель з Hugging Face, налаштовувати її під свої потреби, а потім запускати локально або через віртуальні машини, покриваючи лише витрати на обчислювальні ресурси та електроенергію.

Це стає все більш привабливим варіантом для підприємств, оскільки передові американські пропрієтарні моделі стикаються з невизначеним та потенційно перерваним регуляторним майбутнім. Минулого тижня адміністрація Трампа видала директиву про експортний контроль, яка забороняє іноземцям використовувати нову модель Anthropic Claude Fable 5 (на що компанія відреагувала, повністю офлайнивши відповідні моделі для всіх користувачів).

Для технічних керівників підприємств GLM-5.2 від Z.ai надає потужний шлях для локального розміщення передових систем ШІ, повністю оминаючи географічні обмеження та комерційні ліміти.

IndexShare повторно використовує один індексатор для кожних чотирьох шарів розрідженої уваги, зменшуючи потреби в обчисленнях

В основі GLM-5.2 працюють 753 мільярди параметрів, і вона запроваджує значну архітектурну оптимізацію під назвою “IndexShare”.

У стандартних масивних мовних моделях перерахунок механізмів уваги для довгих документів є надзвичайно затратним з точки зору обчислень. IndexShare вирішує цю проблему, повторно використовуючи той самий індексатор для кожних чотирьох шарів розрідженої уваги.

При максимальній довжині контексту в 1 мільйон токенів ця єдина інновація зменшує кількість операцій з плаваючою комою на один токен у 2.9 рази.

Модель також має оновлений шар Multi-Token Prediction (MTP) для спекулятивного декодування, що збільшує довжину прийнятих токенів до 20% під час виведення.

Крім того, Z.ai впровадила гнучкі, вибіркові “Режими мислення”. Користувачі можуть перемикати зусилля моделі з міркувань між “Максимальним”, призначеним для розширення меж логічного вирішення проблем, або “Високим”, який забезпечує ретельний баланс між високою продуктивністю та ефективністю токенів у чутливих до затримки додатках.

Найсучасніші результати тестів для відкритої моделі, що відповідають, а подекуди й перевершують пропрієтарних лідерів у деяких категоріях

У стандартних галузевих тестах, що проводяться третіми сторонами, GLM-5.2 демонструє вищу продуктивність, ніж більшість флагманських моделей з відкритим вихідним кодом, навіть DeepSeek v4, і показує результати, близькі або вищі за своїх закритих конкурентів, таких як GPT-5.5 від OpenAI та Claude Opus 4.8 від Anthropic.

GLM-5.2 від Z.ai перевершує GPT-5.5 за кодуванням і вшестеро дешевший 5

Модель особливо ефективна у використанні інструментів агентами та задачах довготривалого програмного інжинірингу:

  • SWE-bench Pro: GLM-5.2 отримала 62.1 бала, рішуче випередивши GPT-5.5 (58.6) та свого попередника, GLM-5.1 (58.4).

  • FrontierSWE (Домінування): Розроблена для тестування виконання довготривалих завдань, GLM-5.2 досягла 74.4%, перевершивши GPT-5.5 (72.6%) і майже зрівнявшись з Claude Opus 4.8 (75.1%).

GLM-5.2 від Z.ai перевершує GPT-5.5 за кодуванням і вшестеро дешевший 6
  • MCP-Atlas: У цьому оцінюванні використання інструментів агентами GLM-5.2 досягла 77.0, перевершивши GPT-5.5 (75.3) і ледь не зрівнявшись з Claude Opus 4.8 (77.8).

  • Humanity’s Last Exam (з інструментами): Оснащена зовнішніми інструментами, GLM-5.2 досягла результату 54.7, випередивши GPT-5.5 (52.2) і трохи відстаючи від Claude Opus 4.8 (57.9).

  • PostTrainBench & SWE-Marathon: У розширених багатоденних інженерних навантаженнях GLM-5.2 стабільно перевершувала GPT-5.5, отримавши 34.3% проти 25.0% у GPT-5.5 на PostTrainBench та 13.0% проти 12.0% у GPT-5.5 на SWE-Marathon.

Хоча GLM-5.2 трохи поступається Claude Opus 4.8 та GPT-5.5 за сирими показниками Terminal-Bench 2.1 (81.0 проти 85.0 та 84.0 відповідно), вона значно перевершує Gemini 3.1 Pro від Google (74.0).

Окрім традиційних показників кодування, GLM-5.2 зайняла вражаюче перше місце у краудсорсинговому тесті на дизайн Design Arena, перевершивши навіть згаданий вище передовий Claude Fable 5 з ELO-рейтингом 1360.

Більше того, вплив нових вибіркових “режимів мислення” від Z.ai чітко видно в даних: за максимального рівня зусиль (“Max”) GLM-5.2 розкриває піковий інтелект, але використовує майже 85 тисяч вихідних токенів на завдання. Перемикання на режим “Високий” дає лише незначну втрату продуктивності, ефективно зменшуючи необхідний вивід токенів удвічі, що забезпечує ключовий важіль оптимізації для чутливих до затримки додатків.

Доступно через Плани кодування та API

Для операціоналізації моделі Z.ai запустила GLM Coding Plan, орієнтований на робочі процеси розробників, а не на прості інтерфейси чату.

Цей план пропонує підтримку “з коробки” для сторонніх американських та глобальних інструментів і платформ для роботи з агентами, включаючи Claude Code, OpenClaw, Cline, Kilo Code, Crush та Factory, серед інших. Плани Coding Plan (при щорічній оплаті) є дуже конкурентоспроможними:

  • Lite: 12.60 доларів США на місяць (151.20 доларів США на рік, починаючи з другого року), призначений для легкого ітеративного розвитку невеликих репозиторіїв.

  • Pro: 50.40 доларів США на місяць для щоденної розробки середніх репозиторіїв, що пропонує в 5 разів більше допустимого використання, ніж план Lite.

  • Max: 112.00 доларів США на місяць для інтенсивних робочих навантажень, що пропонує в 20 разів більше, ніж Lite, і виділені ресурси в години пік.

Для корпоративних розробників, які інтегрують сиру модель у свої власні додатки, ціни API від Z.ai значно нижчі за ціни західних конкурентів, залишаючись при цьому такими ж, як і в попереднього покоління GLM-5.1.

Доступ до API GLM-5.2 коштує 1.40 доларів США за мільйон вхідних токенів і 4.40 доларів США за мільйон вихідних токенів, що робить її моделлю середнього цінового діапазону у світі, але приблизно

Знімок цін на API передових моделей від VentureBeat

Відсортовано за загальною вартістю (вхід + вихід) від найменш до найбільш дорогої. Показані ціни є стандартними цінами за оплату за використання за 1 мільйон токенів.

Модель

Вхід

Вихід

Загальна вартість

Джерело

MiMo-V2.5 Flash

$0.10

$0.30

$0.40

Xiaomi MiMo

deepseek-v4-flash

$0.14

$0.28

$0.42

DeepSeek

deepseek-v4-pro

$0.435

$0.87

$1.305

DeepSeek

MiniMax-M3

$0.30

$1.20

$1.50

MiniMax

Gemini 3.1 Flash-Lite

$0.25

$1.50

$1.75

Google

Qwen3.7-Plus

$0.40

$1.60

$2.00

Alibaba Cloud

MiMo-V2.5

$0.40

$2.00

$2.40

Xiaomi MiMo

Grok 4.3 (низький контекст)

$1.25

$2.50

$3.75

xAI

MiMo-V2.5 Pro (≤256K)

$1.00

$3.00

$4.00

Xiaomi MiMo

Kimi-K2.6

$0.95

$4.00

$4.95

Moonshot/Kimi

GLM-5.2

$1.40

$4.40

$5.80

Z.ai

Grok 4.3 (високий контекст)

$2.50

$5.00

$7.50

xAI

MiMo-V2.5 Pro (>256K)

$2.00

$6.00

$8.00

Xiaomi MiMo

Qwen3.7-Max

$2.50

$7.50

$10.00

Alibaba Cloud

Gemini 3.5 Flash

$1.50

$9.00

$10.50

Google

Gemini 3.1 Pro Preview (≤200K)

$2.00

$12.00

$14.00

Google

GPT-5.4

$2.50

$15.00

$17.50

OpenAI

Gemini 3.1 Pro Preview (>200K)

$4.00

$18.00

$22.00

Google

Claude Opus 4.8

$5.00

$25.00

$30.00

Anthropic

GPT-5.5

$5.00

$30.00

$35.00

OpenAI

Claude Fable 5 / Claude Mythos 5

$10.00

$50.00

$60.00

Anthropic

Для подальшої оптимізації витрат для робочих навантажень з довгим контекстом Z.ai пропонує кешовану ставку для вхідних даних лише за 0.26 доларів США за мільйон токенів, а також обмежену в часі пропозицію безкоштовного зберігання кешованих вхідних даних.

Різкий контраст між інноваторами з відкритими ваговими коефіцієнтами та західними пропрієтарними лабораторіями не залишився непоміченим спільнотою розробників.

На платформі X, відомий спостерігач у сфері ШІ Lisan al Gaib (@scaling01) стверджував, що “граничні лабораторії абсолютно шахраюють з цінами на API”.

У дописі зазначалося, що тоді як великі відкриті моделі, такі як GLM-5.2 з 744 мільярдами параметрів, коштують 4.40 доларів США за мільйон вихідних токенів, а DeepSeek-V4-Pro (1.6 трильйона параметрів) – лише 0.87 доларів США, пропрієтарні моделі вимагають значних націнок: Sonnet 4.6 та Opus 4.8 від Anthropic коштують 15.00 та 25.00 доларів США відповідно, тоді як GPT-5.5 від OpenAI коштує 30.00 доларів США за вивід.

Підкреслюючи, що розробники відкритих моделей працюють прибутково, не покладаючись на новітні “круті чипи Blackwell”, коментатор припустив, що провідні пропрієтарні лабораторії “ймовірно, мають маржу 90%+ на даний момент”.

Переваги незміненої ліцензії MIT для корпоративного використання

Найбільш руйнівним аспектом випуску GLM-5.2 є її ліцензування. Z.ai випустила вагові коефіцієнти моделі за відкритою ліцензією MIT, що робить її системою “Pure Open”.

Технічна документація компанії чітко зазначає, що ця ліцензія гарантує “відсутність регіональних обмежень” і дозволяє “технічний доступ без кордонів”.

Для лідерів корпоративних технологій ліцензія MIT означає, що програмне забезпечення може використовуватися, модифікуватися та комерціалізуватися без сплати роялті або дотримання обмежувальних політик “прийнятного використання”, поширених для ліцензій подвійного призначення.

Це дозволяє інженерним командам розміщувати передові системи ШІ на власній суверенній інфраструктурі, повністю усуваючи залежність від постачальника.

Теплий прийом серед розробників ШІ та творців інструментів

Реакція розробників на випуск була негайною та переважно позитивною.

Команда, що стоїть за Kilo Code, підтвердила інтеграцію в день випуску, заявивши в X: “GLM-5.2 працює в Kilo Code з першого дня. 1-мільйонне контекстне вікно та режим Max тепер доступні. Налаштуйте свою конфігурацію і вперед!”.

Відкрите середовище розробки коду Cline IDE повторило це почуття в X, відзначаючи економічну перевагу: “GLM-5.2 — це перша модель з відкритими ваговими коефіцієнтами, яка перетнула позначку 80% на Terminal-Bench, і перевершує кожну іншу доступну відкриту модель. Вона також перевершує Gemini, що робить її моделлю передового рівня за частку вартості. Відкриті вагові коефіцієнти повертаються. Ця модель змінює правила гри. Доступна в Cline зараз!”.

Аналогічно, конкурентний відкритий агент кодування Eigent AI також протестував нові можливості моделі в складних робочих процесах агентів, зазначивши в X: “надали справжнє довготривале завдання: дослідити 30 компаній у 6 секторах стеку інфраструктури ШІ, структурувати його в JSON, а потім створити інтерактивний HTML-звіт… де 5.2 виграє: -> плани…”.

Як захиститися (Порада CryptoDom): Оскільки GLM-5.2 є моделлю з відкритим вихідним кодом, першочерговим завданням є забезпечення цілісності завантажених файлів моделі. Завжди завантажуйте моделі лише з офіційних джерел (наприклад, Hugging Face) та перевіряйте хеш-суми (якщо вони надаються розробником), щоб уникнути завантаження модифікованого шкідливого програмного забезпечення.

За даними порталу: venturebeat.com

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *