Alibaba’s AI video model rises to No. 2 in global rankings, as OpenAI’s Sora and ByteDance’s Seedance fall away

Alibaba's AI video model rises to No. 2 in global rankings, as OpenAI's Sora and ByteDance's Seedance fall away 2

Alibaba Cloud у неділю представила HappyHorse 1.1 — значне оновлення своєї моделі генерації відео зі штучним інтелектом, яка, за словами компанії, забезпечує синтез відео, готового для виробництва, для основних сценаріїв створення контенту. Модель вже доступна на Alibaba Cloud Model Studio з повним API-доступом для корпоративних клієнтів та розробників, а також пропонує 40% знижку на весь майданчик протягом перших двох тижнів.

Випуск відбувся в період помітних потрясінь на ринку генерації відео за допомогою ШІ, і Alibaba, схоже, добре усвідомлює цей момент. OpenAI припинила розробку Sora через її фінансову непривабливість. ByteDance призупинила на невизначений термін міжнародний запуск Seedance 2.0 після шквалу скарг на порушення авторських прав від голлівудських студій. Для корпоративних закупівельних команд, які оцінювали або інтегрували ці інструменти у свої робочі процеси маркетингу, реклами та виробництва контенту, конкурентне середовище різко скоротилося за кілька місяців.

Це скорочення створює як можливості, так і випробування для Alibaba. HappyHorse 1.1 — це не дослідницька демонстрація чи споживча іграшка. Це продукт, побудований в першу чергу для інтеграції в корпоративні програмні стеки, з ціноутворенням, розрахованим на великі обсяги, та підтримкою глобальної інфраструктури вартістю 52,7 мільярда доларів. Чи зможе він перетворити технічні можливості на корпоративне впровадження, особливо на західних ринках, що переживають посилення технологічної напруженості між США та Китаєм, визначить, чи зможе Alibaba стати серйозним гравцем на ринку генеративного відео, який, за оцінками аналітиків, досягне десятків мільярдів доларів до кінця десятиліття.

Як HappyHorse перетворився з анонімної тестової моделі на відеомодель найвищого рівня

HappyHorse вперше з’явився на початку квітня як анонімна заявка на Artificial Analysis Video Arena — незалежній платформі для порівняльного тестування, де реальні користувачі порівнюють результати роботи моделей у сліпих, побічних оцінках. Модель негайно зайняла перше місце як у текстово-відео, так і в зображеннєво-відео рейтингах. Пізніше було підтверджено, що розробником є Alibaba, яка повідомила, що модель створена підрозділом ATH (Alibaba Token Hub) AI Innovation Unit — командою, яка раніше входила до Future Lab у складі Taobao and Tmall Group, до стратегічної організаційної реструктуризації.

За даними Arena.ai, HappyHorse 1.0 наразі займає 2-ге місце у всіх трьох таблицях лідерів Video Arena. Платформа зазначає, що модель набрала 1444 бали як у текстово-відео, так і в зображеннєво-відео категоріях, випереджаючи Veo-3.1 від Google (з аудіо) на 69 балів у текстово-відео та Grok-Imagine-Video від xAI на 23 бали у зображеннєво-відео. В системах рейтингу на основі Ело, подібних до Arena, моделі отримують або втрачають бали залежно від того, чи віддають користувачі перевагу їхнім результатам у прямих порівняннях. Це означає, що стійка двозначна перевага відображає послідовний розрив у якості, сприйнятий людськими оцінювачами, а не статистичний збіг.

Архітектура моделі пояснює, чому це так. Згідно зі спільно зібраною технічною документацією, HappyHorse побудований навколо уніфікованого механізму самостійної уваги Transformer з 15 мільярдами параметрів, який обробляє текстові, зображеннєві, відео- та аудіо токени в межах однієї послідовності токенів. На відміну від багатьох конкурентів, які склеюють окремі моделі для відео та аудіо, HappyHorse функціонує як уніфікована система, що обробляє всі модальності за один прохід генерації, усуваючи необхідність стороннього озвучення або пост-обробки аудіо. Для корпоративних покупців, які оцінюють загальну вартість володіння, така архітектурна простота безпосередньо означає менше точок інтеграції, менше залежностей від постачальників та швидший вихід на ринок.

Що виправлено в оновленні 1.1 — і чому це важливо для комерційного відеовиробництва

Оновлення 1.1 спрямоване на усунення проблем, з якими команди корпоративного відеовиробництва знайомі досконало. Alibaba Cloud описала випуск як “систематично оптимізований для основних сценаріїв створення контенту”, а конкретні покращення свідчать про модель, яка була налаштована для комерційного розгортання, а не для вірусних демонстрацій у соціальних мережах.

Найбільш значущим оновленням є можливість використання кількох референсних зображень, яку Alibaba називає R2V (Reference-to-Video). Ця функція дозволяє користувачам завантажувати кілька зображень персонажів і підтримувати послідовну ідентичність протягом згенерованого відео — безпосередньо вирішуючи одну з найскладніших проблем у виробництві ШІ-відео, де об’єкти схильні до зміни зовнішнього вигляду між кадрами або сценами. Для брендів, які створюють рекламні кампанії, продуктові відео або серійний маркетинговий контент, послідовність ідентичності є не просто бажаною функцією; це вимога, яка історично змушувала команди повертатися до традиційних методів виробництва.

Якість руху отримала значне оновлення завдяки тому, що Alibaba описує як “посилене моделювання руху”, яке усуває попередні обмеження щодо швидкості та плавності. Компанія також внесла цілеспрямовані покращення до візуальної текстури, зокрема, усунувши “жирність обличчя”, “надмірну різкість” та “неприродні текстури” — артефакти, які переслідували комерційне ШІ-відео з моменту появи цієї технології, і які одразу сигналізують глядачам, що контент згенеровано машиною.

Два додаткові оновлення завершують випуск. HappyHorse 1.1 покращує синхронізацію аудіо та відео, включаючи те, що Alibaba називає “синхронізацією губ з нульовим дрейфом” для сцен з діалогами та контекстно-залежним темпом мови — спираючись на вже помітну здатність версії 1.0 генерувати до 15 секунд відео 1080p з синхронізованим аудіовиходом. Модель також покращує дотримання інструкцій для довгих і складних запитів, що є критично важливим диференціатором для корпоративних користувачів, які потребують точного визначення рухів камери, умов освітлення та наративних сюжетів в одному проході генерації, а не шляхом багаторазових спроб.

Згортання проекту Sora та заморожування Seedance залишили корпоративних покупців з меншою кількістю вибору, ніж будь-коли

Конкурентний контекст навколо цього запуску є незвично сприятливим для Alibaba, і варто розуміти чому.

Веб- та мобільні додатки OpenAI Sora були припинені 26 квітня, а API Sora буде закрито 24 вересня. Припинення роботи сталося після того, як продукт виявився фінансово нежиттєздатним: Sora коштувала приблизно 1 мільйон доларів на день для експлуатації, але принесла лише близько 2,1 мільйона доларів загального доходу, тоді як кількість активних користувачів впала з пікових майже 1 мільйона до менш ніж 500 000. Для корпоративних команд, які інтегрували Sora у свої виробничі конвеєри, раптове відкликання підкреслило ризики залежності від продуктів ШІ, які не мають стійкої бізнес-моделі — це повчальна історія, яку менеджери із закупівель навряд чи швидко забудуть.

Seedance 2.0 від ByteDance, який багато хто вважав найгрізнішим наступником Sora, зіткнувся з іншим типом перешкод. Netflix, Warner Bros., Disney, Paramount та Sony надіслали юридичні погрози ByteDance через звинувачення у систематичному порушенні авторських прав після того, як користувачі створили вірусні кліпи з використанням інтелектуальної власності Голлівуду. ByteDance призупинила міжнародний запуск на невизначений термін, і глобальне розгортання залишається призупиненим.

Це залишає Google Veo 3.1 як основного західного конкурента в сфері генерації відео для підприємств. Але рейтинги Arena від Alibaba свідчать про те, що HappyHorse перевершує Veo за сприйнятою користувачами якістю, а 40% знижка на запуск у Alibaba Cloud Model Studio може зробити HappyHorse значно дешевшим у масштабі. На рівні 1.0 ціни через сторонні API-платформи становили приблизно 1,82 долара за 10-секундний кліп у 720p та 3,12 долара у 1080p. З промоційними цінами HappyHorse 1.1 може зробити високоякісну генерацію ШІ-відео доступною для компаній середнього бізнесу та агентств, які раніше вважали цю технологію занадто дорогою для чогось, окрім експериментів.

Ставка Alibaba на інфраструктуру вартістю 52,7 мільярда доларів дає HappyHorse перевагу в дистрибуції, якої не мають конкуренти

HappyHorse 1.1 існує не ізольовано. Він спирається на глобальну інфраструктурну стратегію, яка відрізняє Alibaba від компаній, що спеціалізуються виключно на моделях ШІ, які створюють вражаючі технології, але не мають фізичних і комерційних механізмів для масштабного обслуговування регульованих корпоративних клієнтів.

Лише за п’ять днів до запуску HappyHorse 1.1 Alibaba Cloud відкрила свої перші центри обробки даних у Франції, заснувавши свій третій європейський хаб після Німеччини та Великої Британії. Парижський регіон має дві зони доступності, що збільшує глобальну присутність компанії до 105 зон доступності в 32 регіонах. “Розширення нашої хмарної інфраструктури до Франції підсилює нашу постійну відданість наданню європейським підприємствам суверенних, безпечних та інтелектуальних рішень”, — заявив доктор Фейфей Лі, технічний директор та президент міжнародного бізнесу Alibaba Cloud, у заяві компанії. У Японії компанія відкрила свій п’ятий центр обробки даних у Токіо 19 червня.

Як повідомляє Data Center Dynamics, генеральний директор Едді Ву зобов’язався інвестувати 52,7 мільярда доларів у створення “єдиної глобальної хмарної мережі”, з подальшим розглядом можливості збільшення цієї суми до 69 мільярдів доларів. Лише цього року Alibaba запустила нові регіони в Мексиці, Таїланді, Джохорі (Малайзія) та Франції. Впровадження у Франції також є частиною плану Alibaba Cloud щодо розгортання корпоративних агентних сервісів ШІ по всій Європі у другій половині року, включаючи AgentRun (платформа розробки для агентів ШІ), STAROps (платформа інтелектуальної операційної діяльності) та ACS Agent Sandbox (що забезпечує апаратну безпечну ізоляцію для робочих навантажень агентів).

Розбудова інфраструктури служить подвійній меті для такого продукту, як HappyHorse. Запуск 15-мільярдної моделі генерації відео з інтегрованим аудіо вимагає надзвичайно великих обчислювальних ресурсів, а наявність локальної інфраструктури зменшує затримку для корпоративних API-запитів, зберігаючи при цьому дані клієнтів у межах регуляторних вимог. Для європейських покупців, які працюють за новими рамками цифрового суверенітету Європейської Комісії — опублікованими 3 червня з чіткою метою захисту “цифрової незалежності” блоку — можливість виконувати робочі навантаження з генерації ШІ-відео на локальній інфраструктурі є не розкішшю. Це стає все більш обов’язковою вимогою для дотримання нормативних вимог.

Список Пентагону та геополітичний ризик загрожують західним амбіціям Alibaba

Глобальний наступ Alibaba відбувається під значним геополітичним тиском, який корпоративні покупці не можуть ігнорувати. Пентагон додав Alibaba, разом з BYD і Baidu, до свого списку китайських військових компаній 8 червня, заборонивши їм отримувати оборонні контракти США. Alibaba відкинула це позначення, заявивши, що вона “не є китайською військовою компанією і не є частиною будь-якої стратегії цивільно-військової інтеграції”.

Це позначення не призводить автоматично до санкцій і не обмежує безпосередньо комерційні операції між приватними американськими компаніями та Alibaba. Але воно додає рівень репутаційної та регуляторної складності до рішень про закупівлю, особливо для компаній, що мають зв’язки з урядом США, входять до оборонного ланцюга поставок або ведуть трансатлантичну діяльність. Закупівлі корпоративних технологій рідко оцінюються лише за технічними характеристиками — оцінка ризиків постачальника, перевірки відповідності на рівні ради директорів та планування геополітичних сценаріїв — все це враховується при прийнятті рішень про закупівлю хмарної інфраструктури та інструментів ШІ.

Для європейських клієнтів, зокрема, розрахунки ускладнюються по-іншому. Зростаючий акцент континенту на цифровому сувереніті діє одночасно в двох напрямках: він створює попит на альтернативи домінуючим американським гіперскейлерам (Amazon Web Services, Microsoft Azure та Google Cloud контролюють приблизно 70% доходів від хмарної інфраструктури Європи, за даними Synergy Research Group), але також викликає запитання щодо того, чи китайський постачальник представляє собою значне покращення стратегічної автономії. Стратегія Alibaba щодо створення інфраструктури, що відповідає вимогам суверенітету, на місцях є прямою спробою відповісти на це питання — але список Пентагону гарантує, що воно буде ставитися неодноразово.

На що слід звернути увагу корпоративним командам під час консолідації ринку ШІ-відео

Практичні наслідки HappyHorse 1.1 для корпоративних команд є суттєвими. HappyHorse підтримує чотири режими генерації — text-to-video, image-to-video, subject-to-video та нове редагування відео — що охоплює повний спектр комерційних відеопотреб від ідеї до виробництва та пост-продакшну, все з інтегрованим аудіо без додаткових витрат. Ця широта можливостей, надана через єдиний API-ендпойнт, спрощує те, що історично було фрагментованим та дорогим виробничим процесом.

Питання на майбутнє полягає в тому, чи зможе Alibaba перетворити домінування в бенчмарках та конкурентний час на довгострокові корпоративні відносини. Компанія планує випустити HappyHorse через Alibaba Cloud Model Studio з повними корпоративними SLA, сертифікаціями безпеки та регіональною відповідністю — це базові вимоги, які відрізняють дослідницькі прориви від виробничих послуг. Слідкуйте за розкриттями інформації про клієнтів, показниками використання та тим, чи швидко сторонні платформи, такі як fal.ai та Atlas Cloud (які вже використовують HappyHorse 1.0), оновляться до версії 1.1, що свідчитиме про справжній попит розробників поза екосистемою Alibaba.

Ринок генерації ШІ-відео входив у 2026 рік з трьома достовірними корпоративними претендентами. Один мертвий. Один заморожений. А той, що залишився, — це китайська компанія, підкріплена інвестиціями в інфраструктуру на 52,7 мільярда доларів, що займає 2-е місце у всіх основних незалежних бенчмарках і пропонує 40% знижку будь-кому, хто готовий зробити ставку. У корпоративних технологіях найкращий продукт не завжди перемагає — але він рідко програє, коли конкуренція вже покинула поле.

Як захиститися (Порада CryptoDom): Використовуйте надійні, унікальні паролі для всіх своїх облікових записів та ввімкніть двофакторну автентифікацію, де це можливо, щоб запобігти несанкціонованому доступу навіть у випадку витоку даних.

Інформація підготовлена на основі матеріалів: venturebeat.com

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *