
Кілька годин тому китайська компанія Meituan, розробник додатків для доставки, офіційно представила LongCat-2.0 на GitHub, Hugging Face та своїй власній платформі. Було розкрито, що ця модель є обчислювальним рушієм, що стоїть за “Owl Alpha” — анонімною прихованою моделлю, яка протягом останніх двох місяців очолювала глобальні рейтинги розробників на OpenRouter.
Система Mixture-of-Experts (MoE) з 1,6 трильйона параметрів, розроблена для докорінного руйнування домінування закритих корпоративних рішень у галузі автономної розробки програмного забезпечення, надає громадськості модель з нативним контекстним вікном у 1 мільйон токенів під надзвичайно дозвільною, промислового класу та комерційно вигідною ліцензією MIT.
Комерційний доступ до архітектури передбачає агресивний рівень ціноутворення, запроваджуючи механізм, за яким усі звернення до кешу контексту обробляються абсолютно безкоштовно. Це працює паралельно з тимчасовою розпродажем “Пакетів Токенів” (Token Pack). Також існує стандартний API “плати за використання” для звернень, що не потрапляють до кешу, за стандартною ціною $0.75 за вхідні та $2.95 за вихідні мільйон токенів.
Однак, обмежена за часом промо-знижка агресивно скорочує ці операційні витрати до $0.30 за мільйон вхідних токенів та $1.20 за мільйон вихідних токенів, обидва показники знаходяться на нижньому кінці цінового діапазону серед провідних моделей у світі.
|
Модель |
Вхід ($/1М) |
Вихід ($/1М) |
Разом ($/1М) |
Джерело |
|
MiMo-V2.5 Flash |
$0.10 |
$0.30 |
$0.40 |
Xiaomi |
|
deepseek-v4-flash |
$0.14 |
$0.28 |
$0.42 |
DeepSeek |
|
deepseek-v4-pro |
$0.435 |
$0.87 |
$1.305 |
DeepSeek |
|
MiniMax-M3 |
$0.30 |
$1.20 |
$1.50 |
MiniMax |
|
LongCat-2.0 — промо |
$0.30 |
$1.20 |
$1.50 |
LongCat |
|
Gemini 3.1 Flash-Lite |
$0.25 |
$1.50 |
$1.75 |
|
|
Qwen3.7-Plus |
$0.40 |
$1.60 |
$2.00 |
Alibaba Cloud |
|
MiMo-V2.5 |
$0.40 |
$2.00 |
$2.40 |
Xiaomi |
|
LongCat-2.0 — стандарт |
$0.75 |
$2.95 |
$3.70 |
LongCat |
|
Grok 4.3 (low context) |
$1.25 |
$2.50 |
$3.75 |
xAI |
|
MiMo-V2.5 Pro (≤256K) |
$1.00 |
$3.00 |
$4.00 |
Xiaomi |
|
Kimi-K2.6 |
$0.95 |
$4.00 |
$4.95 |
Moonshot AI |
|
GLM-5.2 |
$1.40 |
$4.40 |
$5.80 |
Z.ai |
|
GPT-5.6 Luna |
$1.00 |
$6.00 |
$7.00 |
OpenAI |
|
Grok 4.3 (high context) |
$2.50 |
$5.00 |
$7.50 |
xAI |
|
MiMo-V2.5 Pro (>256K) |
$2.00 |
$6.00 |
$8.00 |
Xiaomi |
|
Qwen3.7-Max |
$2.50 |
$7.50 |
$10.00 |
Alibaba Cloud |
|
Gemini 3.5 Flash |
$1.50 |
$9.00 |
$10.50 |
|
|
Gemini 3.1 Pro Preview (≤200K) |
$2.00 |
$12.00 |
$14.00 |
|
|
GPT-5.6 Terra |
$2.50 |
$15.00 |
$17.50 |
OpenAI |
|
GPT-5.4 |
$2.50 |
$15.00 |
$17.50 |
OpenAI |
|
Gemini 3.1 Pro Preview (>200K) |
$4.00 |
$18.00 |
$22.00 |
|
|
Claude Opus 4.8 |
$5.00 |
$25.00 |
$30.00 |
Anthropic |
|
GPT-5.5 |
$5.00 |
$30.00 |
$35.00 |
OpenAI |
|
GPT-5.5 Instant (chat-latest) |
$5.00 |
$30.00 |
$35.00 |
OpenAI |
|
Sakana Fugu Ultra (≤272K) |
$5.00 |
$30.00 |
$35.00 |
Sakana AI |
|
GPT-5.6 Sol |
$5.00 |
$30.00 |
$35.00 |
OpenAI |
|
Claude Fable 5 / Claude Mythos 5 |
$10.00 |
$50.00 |
$60.00 |
Anthropic |
Випуск цієї моделі є визначальним переломним моментом для глобальної технологічної інфраструктури завдяки її операційній незалежності: величезна модель була повністю навчена на кластері з понад 50 000 китайських спеціалізованих інтегральних схем (ASIC). Це доводить, що передові моделі штучного інтелекту можуть бути масштабовані успішно, не покладаючись на типові американські GPU від Nvidia, які до цього часу живили значну частину світових зусиль з тренування передових моделей генеративного ШІ.
Цей успішний розгортання альтернативного кремнію сигналізує про глибоку структурну зміну. Якщо китайські конгломерати зможуть послідовно створювати архітектури з трильйонами параметрів, використовуючи власні ASIC замість універсальних GPU, це може поставити під загрозу домінування Nvidia в цьому секторі.
Критично важливо, що цей технологічний зсув відбувається саме в той час, коли Вашингтон чинить тиск на провідні американські лабораторії з метою обмеження доступу до їхніх новітніх моделей. За запитом уряду США OpenAI була змушена обмежити доступ до своїх нових моделей GPT-5.6, тоді як Anthropic раніше також отримала наказ від США обмежити доступ до своїх останніх моделей Claude Fable 5 / Mythos 5, повністю відключивши їх. Водночас, зростаючий хор технологів, активістів та експертів галузі попереджає, що ці оборонні регуляторні маневри ненавмисно обернулися проти самих себе. Обмежуючи західні закриті моделі та підвищуючи вартість API, уряд США залишив широкий операційний простір для глобальних розробників, які шукають доступні, високопродуктивні альтернативи, подібні до тих, що пропонуються китайськими моделями з відкритим кодом, як-от Meituan LongCat-2.0.
Сирі операційні показники підтвердили захоплення розробників: під час свого анонімного перебування на OpenRouter, Owl Alpha обробляла приблизно 10,1 трильйона токенів щомісяця — у середньому 559 мільярдів токенів на день. Це становить вибухове зростання обсягу на 242% порівняно з попереднім місяцем, що вивело її до трійки лідерів платформи у світі.
До моменту, коли Meituan виступила, щоб заявити права на архітектуру, модель вже посіла перше місце в робочому середовищі Hermes Agent, друге місце в розгортаннях Claude Code та третє місце в міжнародних середовищах OpenClaw.
Технологія: Створення Sparse Context на 1 Млн Токенів
В основі LongCat-2.0 лежить агресивна оптимізація розрідженості (sparsity) Mixture-of-Experts (MoE), що дозволяє масштабувати загальну кількість параметрів до 1,6 трильйона, обмежуючи активні обчислення в середньому 48 мільярдами параметрів на токен.
Залежно від структурної складності запиту, динамічна активація моделі варіюється від 33 до 56 мільярдів параметрів. Ця конструкція реалізує каркас “Zero-Compute Experts”, який гарантує, що звичайні елементи виконання проходять через легші підмережі, повністю усуваючи неактивні обчислювальні накладні витрати, які зазвичай спостерігаються у надщільних моделях.
Для підтримки функціонального контекстного вікна в 1 мільйон токенів без катастрофічних апаратних вузьких місць, Meituan представила LongCat Sparse Attention (LSA). Розроблений як еволюційна ітерація DeepSeek Sparse Attention, LSA вирішує проблеми квадратичних витрат на оцінку та фрагментації пам’яті, які зазвичай переслідують дрібнозернисті механізми розрідженості, за допомогою трьох окремих, ортогональних векторів:
-
Індексація з урахуванням потоковості (Streaming-aware Indexing – SI): Ця система реструктурує конвеєр вибору токенів, змішуючи апаратно-орієнтоване зчитування суміжних даних з динамічним випадковим вибором. Перетворюючи фрагментований доступ до пам’яті на високопередбачувані, послідовні блоки, система досягає згуртованого використання High Bandwidth Memory (HBM) та підвищеної ефективної пропускної здатності.
-
Міжшарова індексація (Cross-Layer Indexing – CLI): Використовуючи емпіричну реальність того, що значущість уваги залишається надзвичайно стабільною в суміжних прихованих шарах, CLI амортизує обчислювальні витрати. Один прохід індексації успішно керує кількома послідовними шарами під час виведення, що підсилюється крос-шаровим дистиляцією протягом фази тренування.
-
Ієрархічна індексація (Hierarchical Indexing – HI):** Цей підхід застосовує дворівневу схему оцінки від загального до детального. Індексатор виконує швидке, приблизне блочне виявлення для фільтрації кандидатів, перш ніж запускати дрібнозернистий вибір токенів виключно на решті популяції.
Крім того, Meituan інтегрувала модуль N-gram Embedding, успадкований від своїх легших моделей. Розширюючи розподіл параметрів у розріджених вимірах, повністю ортогональних до розкладки експертів MoE, архітектура додає 135 мільярдів параметрів до каркасу комбінації 5-грамних токенів.
Це розширює основний простір вбудовування приблизно в 100 разів, дозволяючи моделі захоплювати щільні локальні взаємозв’язки токенів та прискорювати операції пакетного виведення, зменшуючи вузькі місця вводу-виводу (I/O) пам’яті.
Продукт: Постреалізаційне Трейнування, Фреймворк MOPD та Ефективність на Бенчмарках
Хоча загальні великі мовні моделі надають перевагу гнучким, розмовним інтерфейсам, LongCat-2.0 зосереджена виключно на багатоетапних інженерних завданнях, інтеграції інструментів та автоматизованій маніпуляції репозиторіями — тобто, агентних завданнях.
У стандартизованих оцінках LongCat-2.0 демонструє емпіричні 59,5 балів на SWE-bench Pro, перевершуючи показник GPT-5.5 у 58,6 балів. Модель також підтверджує свою спеціалізацію в агентних завданнях, здобуваючи 70,8 балів на Terminal-Bench 2.1, 77,3 балів на SWE-bench Multilingual та 73,2 балів на загальному симуляторі корпоративних робочих процесів FORTE.

Ця точна операційна поведінка досягається за допомогою структурного шару після тренування під назвою Multi-Teacher Optimization via Mixture of Specialized Experts (MOPD). Замість змішування сирого людського зворотного зв’язку в єдину функцію винагороди, архітектура MOPD розділяє оптимізацію після тренування на три незалежні, високосфокусовані кластери експертів:
-
Агентні експерти (Agent Experts): Тонко налаштовані виключно для структурного виконання, спеціалізуються на точному виклику інструментів, багатоетапному розборі параметрів API та механізмах самокорекції циклів для уникнення зупинки виконання.
-
Експерти з міркувань (Reasoning Experts): Оптимізовані ізольовано для розвитку багатоланцюгової логіки, складного інженерного ланцюжка думок, математики та вирішення STEM-задач високого рівня.
-
Експерти з взаємодії (Interaction Experts): Повністю зосереджені на узгодженні з людиною, нюансах виконання інструкцій, фактичному обґрунтуванні для придушення галюцинацій та дотриманні жорстких запобіжників безпеки без зниження загальної корисності моделі.
Розділяючи ці вектори під час післяреалізаційного тренування, LongCat-2.0 запобігає функціональній деградації. Динамічний механізм маршрутизації воріт безшовно об’єднує цю спеціалізовану поведінку під час виконання, дозволяючи фінальній моделі одночасно координувати глибокі міркування, стабільне виконання інструментів та безпечну взаємодію з користувачем.
Хоча LongCat-2.0 загалом відстає від преміальних передових систем, таких як Claude Opus 4.8, за широкими загальними бенчмарками для агентів, як-от FORTE та BrowseComp, вона явно перевершує свої можливості у сфері розробки програмного забезпечення. Вона майже досягає показників GPT-5.5 у строгій бенчмарці розробки програмного забезпечення SWE-bench Pro (59,5 проти 58,6), демонструючи високу конкурентоспроможність для складних завдань кодування, незважаючи на менший обчислювальний слід.
Комерційна модель: Плати за використання проти Пакетів Токенів за Спеціальною Ціною
Стратегія розгортання Meituan передбачає спеціалізовану комерційну модель, яка розділяє мережевий доступ між традиційним білінгом API в реальному часі та структурованими “Пакетами Токенів”.
Для традиційної корпоративної інтеграції доступні стандартні облікові записи з поповненням, які в реальному часі списують операційний капітал на основі метрик введення та генерації токенів.
Однак, для врахування непередбачуваних обчислювальних сплесків, характерних для автономних агентів розробки, Meituan запустила структурований фреймворк Пакетів Токенів. Ці пакети, придбані як фіксовані, одноразові об’ємні квоти, дійсні протягом суворого 30-денного періоду, додаються безпосередньо до існуючого базового облікового запису API організації.
Для управління навантаженням на мережу через свої ASIC-кластери, Meituan випускає ці високооб’ємні пакети через обмежені флеш-розпродажі чотири рази на день, точно о 10:00, 16:00, 21:00 та 23:00 за пекінським часом на основі принципу “першим прийшов – першим обслужений”. Економічною особливістю цього фреймворку є обробка звернень до кешу контексту безкоштовно.
У масових агентних середовищах, де помічник з кодування повинен багаторазово читати, посилатися та модифікувати один і той самий репозиторій коду з мільйонами токенів протягом тривалої сесії, стандартні архітектури карають розробників, стягуючи повну ціну за повторний контекст введення. Під інфраструктурою Meituan лише звернення, що не потрапляють до кешу, та фінальна генерація токенів споживають квоту пакету. Ця архітектура повністю змінює економіку операційних витрат великомасштабної розробки програмного забезпечення за допомогою агентів, дозволяючи глибоке ітераційне дослідження контексту без зростання витрат.
Ліцензування: Структурна Свобода Відкритих Кодів
Реєструючи репозиторій LongCat-2.0 під ліцензією відкритого коду MIT, Meituan надає архітектурі максимальну юридичну гнучкість для корпоративної інтеграції.
На відміну від парадигм копілефту, таких як GNU General Public License (GPL), яка юридично зобов’язує розробників відкривати будь-які похідні фреймворки або внутрішнє програмне забезпечення, що пов’язується з кодом, ліцензія MIT дозволяє майже необмежену свободу.
Для корпоративних інженерних команд цей юридичний стандарт гарантує, що LongCat-2.0 може бути глибоко модифікована, скомпільована та вбудована безпосередньо в комерційні програми із закритим кодом, пропрієтарні інструменти розробки та внутрішні автоматизовані бекенди.
Корпорації можуть форкнути репозиторій, оптимізувати внутрішні механізми LSA для приватних баз даних і продавати отриманий програмний стек кінцевим користувачам без будь-яких зобов’язань щодо розкриття своєї інтелектуальної власності чи структурних вдосконалень.
Еволюція Meituan: Від Супердодатку До AI-Гіганта
Заснована у березні 2010 року підприємцем Ван Сінем, Meituan спочатку запустилася як сайт щоденних знижок у стилі Groupon, перш ніж швидко перетворитися на один з домінуючих “супердодатків” Китаю. Після масштабного злиття у 2015 році з Dianping, пекінський технологічний гігант закріпив домінуючу частку ринку в міських логістичних коридорах країни, об’єднуючи місцеві відгуки споживачів, миттєву роздрібну торгівлю, бронювання готелів та доставку їжі. Функціонуючи як публічно торгуваний гігант на Гонконгській фондовій біржі, Meituan обслуговує понад 770 мільйонів користувачів щорічно та підтримує мережу з понад 14,5 мільйонів продавців.
Однак, стикаючись з інтенсивною внутрішньою ринковою конкуренцією, серйозним стисненням маржі та спадною рентабельністю, компанія агресивно змінила свою стратегію, вийшовши за межі логістики. Meituan публічно зобов’язалася інвестувати “мільярди” в штучний інтелект та вітчизняні чіпові можливості для відродження своїх технологічних пропозицій. Цей стратегічний перехід у глобальну гонку ШІ почав матеріалізуватися наприкінці 2025 року з випуском LongCat-Flash — моделі Mixture-of-Experts з 560 мільярдами параметрів, за якою швидко послідувала просунута модель міркувань LongCat-Flash-Thinking. Відкривши ці передові моделі під ліцензіями, дружніми до бізнесу, Meituan продемонструвала свої амбіції стати ключовим гравцем у глобальній інфраструктурі ШІ, а не залишатися виключно регіональним гігантом електронної комерції та доставки.
Наслідки для Підприємств: Автономні Операційні Робочі Процеси
Для сучасних підприємств випуск LongCat-2.0 відкриває чіткі операційні стратегії в галузях розробки програмного забезпечення, системних операцій та довгострокової інтерпретації даних. Комбінація моделі з відкритими вагами, ліцензованої MIT, з розширеним контекстним вікном на 1 мільйон токенів означає, що організації можуть уникнути проблем з конфіденційністю даних та поточних витрат, пов’язаних з використанням пропрієтарних сторонніх API.
У великомасштабних корпоративних середовищах розробки команди можуть використовувати спеціалізованих Агентних Експертів моделі для оркестрації автономних міграцій кодової бази. Замість того, щоб витрачати сотні годин розробників на ручне переписування застарілих фреймворків додатків, інженери можуть передати весь корпоративний репозиторій разом з документацією сучасних SDK безпосередньо в контекстне вікно на 1 мільйон токенів. LongCat-2.0 може відображати залежності, виконувати структурні оновлення на рівні репозиторію, компілювати новий код і виявляти помилки компіляції та виконання автономно в локальних пісочницях, перш ніж генерувати фінальний pull request.
Архітектурне розділення моделі за допомогою механізму маршрутизації воріт MOPD забезпечує значні переваги для суворого корпоративного відповідності. Маршрутизуючи конкретні операційні запити через ізольовані кластери експертів, фінансова установа або медична компанія може виконувати глибокі логічні та математичні міркування без ризику фактичних галюцинацій або порушення суворих запобіжників безпеки. Експерти з Взаємодії функціонують як неявний рівень запобіжників, пригнічуючи помилки та забезпечуючи дотримання протоколів виконання інструкцій без зниження вихідної обчислювальної потужності внутрішніх Експертів з Міркувань. У поєднанні з моделлю кешування з нульовою вартістю, підприємства можуть підтримувати високосфокусовані автономні мережі програмного забезпечення, які можуть багаторазово перевіряти корпоративні пули даних, постійно підтримуючи та оптимізуючи внутрішню інфраструктуру за частку стандартних операційних витрат.
Як захиститися (Порада CryptoDom): Ця новина стосується безпеки моделей ШІ, а не безпосередньо кіберзахисту особистих даних. Однак, загальні принципи безпеки залишаються актуальними. Рекомендується завжди використовувати надійні паролі та двофакторну автентифікацію для всіх онлайн-акаунтів, особливо для тих, що пов’язані з вашими фінансовими або особистими даними. Регулярно оновлюйте програмне забезпечення та операційну систему, щоб усунути відомі уразливості.
Оригінал статті: venturebeat.com
