Sakana AI: ультраглибокі дослідження бізнесу за 8 годин

Японський стартап у сфері штучного інтелекту Sakana AI офіційно запустив свій перший комерційний продукт — Sakana Marlin.

Marlin, що позиціонується як “Віртуальний директор зі стратегії” (Virtual CSO), є автономним B2B дослідницьким агентом, який свідомо відмовляється від миттєвої генерації тексту, притаманної сучасним чат-ботам, на користь глибокого, довгострокового аналізу.

Що відрізняє Marlin від нинішньої екосистеми інструментів ШІ, так це його часовий масштаб: замість того, щоб надавати відповідь за секунди, він запускає безперервні, самокеровані цикли аналізу тривалістю до восьми годин, щоб надати глибоко досліджені, добре процитовані звіти зі стратегії обсягом до 100 сторінок та презентації для керівництва. Компанія опублікувала зразки звітів, згенерованих Marlin, на своєму вебсайті з продуктом тут.

Платформа, доступна негайно через вебсайт компанії з цінами, що починаються з моделі оплати за використання, призначена виключно для корпоративного використання — зокрема, для компаній, фінансових установ та аналітичних центрів.

Цикл ажіотажу навколо генеративного ШІ значною мірою визначався швидкістю. Протягом останніх двох років галузевим стандартом була здатність генерувати вірш, рядок коду або поверхневе резюме за лічені мілісекунди. Але для корпоративного сектору пріоритети швидко зміщуються від поверхневої, швидкої генерації до глибокого, методичного аналізу.

З Marlin великі компанії більше не запитують, наскільки швидко ШІ може відповісти, а наскільки глибоко він може мислити.

Продукт: Віртуальний Директор зі Стратегії

Що саме отримує бізнес, коли впроваджує Sakana Marlin? Робочий процес докорінно відрізняється від типової взаємодії з великими мовними моделями (LLM). Замість виснажливої сесії інженерії запитів з численними ітераціями, користувач просто надає основну тему дослідження. Після короткого початкового обміну для уточнення масштабу та напрямку дослідження, людина повністю відстороняється.

Протягом наступних кількох годин Marlin працює як самодостатня команда цифрових стратегів. Він формує власні початкові гіпотези, переглядає веб для збору даних, перехресно звіряє джерела для перевірки висновків та будує карту причинно-наслідкових зв’язків у складних бізнес-середовищах. По суті, він шукає “формулу успіху” серед інформаційного шуму.

Сприймайте його менше як пошукову систему, а більше як молодшого консультанта зі стратегії, замкненого в кімнаті з дошкою та підключенням до Інтернету. Ви надаєте стратегічний запит вранці, а до кінця робочого дня система видає комплексний, професійний портфель.

У випадку Marlin, кінцевий результат – це не загальний текстовий блок; це структурований набір стратегічних варіантів, доповнений короткими виступами для керівництва, додатками, посиланнями та глибоко дослідницьким звітом.

Компанія наголосила на кількох реальних сценаріях використання для демонстрації здатності Marlin до складного синтезу, зокрема, створення детальних сценаріїв розв’язання для теоретичної блокади Ормузької протоки, картографування фрагментованої глобальної мережі регулювання ШІ та аналіз макроекономічних тенденцій, таких як повернення “облігаційних пильнувачів”.

Sakana стверджує, що Marlin покладається на кілька моделей ШІ, але не надала конкретних назв моделей чи постачальників. Я звернувся до X, щоб дізнатися більше, і оновлю інформацію, коли отримаю відповідь.

VB Transform · 14–15 липня · Менло-Парк · LLM, операції та оцінки

Стандартні бенчмарки зазнають невдачі. Amazon та Waymo пояснюють, що вони тестують натомість.

Відстеження оцінок заглиблюється в чотири виміри надійності — послідовність, стійкість, передбачуваність, безпека — і те, як команди Amazon та Waymo впроваджують їх у виробництво.

Дивіться повний порядок денний →

Рушійна Сила Довгострокового Аналізу

Під капотом, Marlin є комерційним результатом значних лабораторних проривів Sakana AI за останні два роки.

Продукт працює на основі дослідницького рушія, що спирається на власне дослідження Sakana AI, Adaptive Branching Monte Carlo Tree Search (AB-MCTS), та використовує фреймворки, похідні від “The AI Scientist” – попереднього дослідницького проєкту Sakana AI, опублікованого в журналі Nature, який успішно автоматизував процес наукового відкриття від ідей до рецензування.

Щоб зрозуміти, як це працює на практиці, уявіть собі аналогію з реального життя: сучасні шахові рушії. Коли комп’ютер грає в шахи, він не просто дивиться на дошку і вгадує; він розігрує тисячі потенційних майбутніх ходів, оцінюючи силу кожної отриманої позиції перед тим, як зробити хід.

Рушій AB-MCTS Marlin робить щось подібне для досліджень.

Всередині Рушія: Механіка AB-MCTS

Хронологія цієї технології сягає червня 2025 року, коли Sakana AI вперше представила фреймворк громадськості разом із дослідницькою статтею “Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search”.

На той час, щоб заохотити експерименти розробників із колективним інтелектом ШІ, компанія випустила базовий алгоритм як бібліотеку відкритого програмного забезпечення під назвою TreeQuest, розповсюджену під дозвільною ліцензією Apache 2.0. Ця віха відкритого коду заклала технічну основу для того, що згодом, через рік, перетвориться на пропрієтарний продукт корпоративного рівня Marlin.

Традиційно, коли розробники намагаються отримати вищу якість аналізу від великих мовних моделей, вони покладаються на метод грубої сили, який називається “повторною вибіркою” — по суті, паралельно запускаючи модель десятки разів і сподіваючись, що одна з відповідей буде правильною. Однак, повторна вибірка працює наосліп; вона не може оцінити власні проміжні кроки або змінити напрямок на основі зовнішнього зворотного зв’язку.

AB-MCTS замінює цю парадигму принциповим, багатоетапним підходом, керованим байєсівською системою прийняття рішень. Під час створення звіту зі стратегії, система розглядає процес дослідження як розгалужене дерево можливостей. На кожному вузлі дерева алгоритм динамічно балансує дві різні поведінки на основі зовнішніх сигналів зворотного зв’язку:

Розширення (Exploration): Запуск абсолютно нових, альтернативних гіпотез або кандидатських відповідей, коли поточний шлях дає спадаючу віддачу або невирішені протиріччя.
Поглиблення (Exploitation): Методичне вдосконалення, аудит та розбудова існуючого кандидатського рішення, яке демонструє високий стратегічний потенціал.

Що перетворює це з лабораторного експерименту на комерційний рушій, так це його розширення до Multi-LLM AB-MCTS.

Архітектура Sakana AI вводить критично важливий третій вимір у дерево пошуку: здатність динамічно обирати, яку модель викликати для конкретного підзавдання, розглядаючи провідні моделі галузі як мережу колективного інтелекту, що підключається і працює.

Згідно з технічною документацією, опублікованою компанією, рушій може координувати високогетерогенні моделі — дозволяючи оркестраційній моделі делегувати початкову ідеацію одній LLM, тоді як інша, орієнтована на аналіз модель, проводить аудит, перевірку та виправлення проміжних помилок, згенерованих раніше в дереві пошуку.

Масштабуючи обчислення під час інференсу — використовуючи унікальні “особистості” та сильні сторони кількох базових моделей протягом тисяч автоматизованих циклів — AB-MCTS забезпечує математичні запобіжники, необхідні Marlin. Це гарантує, що отримані 100-сторінкові звіти зі стратегії є не просто багатослівними генераціями ШІ, а високоперевіреним продуктом системних, автоматизованих спроб і помилок.

Ліцензування, Дані та Корпоративні Наслідки

Важливо зазначити, що Sakana Marlin – це, безумовно, не загальний споживчий інструмент; це комерційна пропозиція програмного забезпечення як послуги (SaaS), яка обмежена корпоративними суб’єктами, організаціями та індивідуальними підприємцями.

Для підприємств умови ліцензування та обробки даних часто є вирішальними факторами для впровадження програмного забезпечення. На відміну від багатьох споживчих інструментів ШІ, які мовчки збирають вхідні дані користувачів та пропрієтарні дані для навчання майбутніх базових моделей, Sakana Marlin працює відповідно до суворої політики даних корпоративного рівня.

Ні Sakana AI, ні її зовнішні постачальники послуг ШІ не будуть використовувати дані клієнтів або вхідні дані для навчання або доналаштування моделей, якщо клієнт не надасть явну згоду на участь.

Навіть за наявності згоди, дані обробляються ретельно для видалення особистої ідентифікаційної інформації. Ця замкнена система безпеки є абсолютно важливою для компаній, що займаються чутливими дослідженнями M&A, неоголошеними стратегіями продуктів або пропрієтарним аналізом ринку.

Комерційне ліцензування структуроване за багаторівневими моделями ціноутворення, які відображають його корпоративний характер:

Оплата за використання: Користувачі можуть придбати кредити на вимогу; один запуск коштує 100 кредитів, а додаткові кредити – по 98 єн ($0.61 USD) кожен.
Pro План: За 150 000 єн ($935.68 USD) на місяць, компанії отримують 2000 кредитів, знижуючи вартість додаткових кредитів до 90 єн ($0.56 USD).
Team План: Цей план, розрахований на великі відділи, за 400 000 єн ($2495.14 USD) на місяць, включає 6000 кредитів, знижуючи вартість додаткових кредитів до 85 єн ($0.53 USD) за кредит.
Enterprise: Повністю індивідуальні пропозиції з виділеною підтримкою та налаштованим розподілом кредитів.

Чому Sakana Варто Спостерігати

Перехід Sakana AI до комерційного лідера корпоративного сегменту ґрунтується на авторитеті її засновників, які, як відомо, сприяли поточному буму генеративного ШІ.

Заснований у Токіо у 2023 році, стартап співзаснували Лліон Джонс – співавтор основоположної статті Google 2017 року “Attention Is All You Need”, який ввів термін “transformer” – та Девід Ха, колишній дослідник Google Brain та керівник дослідницького відділу Stability AI.

Рішення створити нову лабораторію за межами бульбашки Кремнієвої долини було свідомою відмовою від поточної екосистеми ШІ. На конференції TED AI наприкінці 2025 року Джонс відверто заявив, що він “абсолютно втомився” від трансформерів, попереджаючи, що сильний тиск з боку інвесторів та гіперфокусування на масштабуванні однієї монолітної моделі скасували креативність індустрії та засліпили дослідників щодо наступного великого прориву.

Щоб вирватися з цієї “хвороби великих компаній”, Джонс та Ха структурували Sakana AI на принципах біоімітації та еволюційних обчислень.

Назва компанії, що походить від японського слова “риба”, відображає її ключову технічну філософію: використання колективного інтелекту, подібного до шкіл риб, мурашників або роїв комах. Замість того, щоб намагатися створити одну величезну, універсальну базову модель, дослідження Sakana послідовно зосереджувалися на розгортанні мереж менших, спеціалізованих моделей, які динамічно співпрацюють для адаптації до складних середовищ.

Ця філософія передбачає, що розглядаючи окремі моделі ШІ як членів “команди мрії” з доповнюючими сильними сторонами, системи можуть досягти більш надійного та економічно ефективного аналізу, ніж просто покладаючись на величезний масштаб.

Цей підхід, натхненний природою, швидко приніс дивіденди у суворих, конкурентних тестах. Sakana AI досягла значного прогресу в “масштабуванні під час інференсу” — виділенні обчислювальних ресурсів під час фази розв’язання проблем, що дозволяє моделям думати, ітерувати та вдосконалювати власні відповіді протягом тривалих періодів.

На початку 2026 року ALE-Agent компанії зайняв перше місце у надзвичайно складному змаганні з евристики AtCoder (AHC058), випробуванні комбінаторної оптимізації, випередивши понад 800 провідних програмістів завдяки автономному перетворенню та тестуванню сотень рішень протягом чотиригодинного вікна.

Аналогічно, Sakana представила “RL Conductor” – невелику модель з 7 мільярдами параметрів, навчену через навчання з підкріпленням спеціально для оркестрації та делегування завдань різноманітному пулу робочих моделей — від GPT-5 до Claude Sonnet 4 — досягаючи передових результатів на бенчмарках аналізу за частку традиційних витрат на обчислення.

Швидка еволюція Sakana від революційної дослідницької лабораторії до комерційного постачальника програмного забезпечення привернула значну увагу з боку світових фінансових важковаговиків.

До кінця 2025 року токійський стартап залучив значний раунд фінансування Серії B, який підняв його оцінку після залучення інвестицій понад 2,6 мільярда доларів, закріпивши його статус однієї з найдорожчих приватних технологічних компаній Японії. Фірма має широкий список стратегічних інвесторів, включаючи ранніх венчурних бейкерів Khosla Ventures, Lux Capital та New Enterprise Associates (NEA), а також галузевих гігантів, таких як Nvidia та Google.

Оскільки Sakana розширює свій фокус на критично важливі сектори, такі як оборона та фінанси, вона також залучила інвестиції від великих глобальних банківських установ, таких як Mitsubishi UFJ Financial Group (MUFG) та Citi, а також від корпоративного технологічного гіганта Salesforce, що дозволяє стартапу активно формувати корпоративну інфраструктуру ШІ з нуля.

Реакція Спільноти та Польові Випробування

Перехід Sakana AI до комерційних агентів довгострокового аналізу не відбувся у вакуумі. Компанія провела ретельне закрите бета-тестування, розпочавши його у квітні 2026 року, надавши інструмент приблизно 300 професіоналам з фінансових установ, консалтингових фірм та аналітичних центрів. Відгуки підкреслюють разючу якісну різницю між стандартними генеративними чат-ботами та автономним, керованим фактами підходом Marlin.

Старший консультант великої токійської консалтингової фірми зазначив, що інструмент “перевершив очікування, виявивши ракурси, які ми навіть не уявляли”, відзначаючи його здатність відповідати людській всебічності, усуваючи людську упередженість. Тим часом, відділ кібербезпеки великого японського інтегратора ІТ-систем високо оцінив систему за надання “дуже переконливого звіту, підкріпленого високоякісними первинними дослідженнями”, а не спираючись на перероблені вторинні джерела.

У соціальних мережах анонс компанії резонував зі зростаючим апетитом ширшої технологічної спільноти до автономних агентів.

З розвитком галузі ШІ, цінність чітко зміщується. Інструменти, що діють як швидкі, розмовні енциклопедії, стають товаром. З Sakana Marlin, фокус повністю зміщується на відділення важкої роботи мислення від фінального акту прийняття рішень. Делегуючи вичерпне картографування причинно-наслідкових зв’язків агенту, здатному до тривалого аналізу, людські керівники вільні робити те, що вони роблять найкраще: діяти.

Як захиститися (Порада CryptoDom): Завжди перевіряйте вихідні дані будь-якого ШІ-інструменту, особливо коли він використовується для критично важливих рішень. Комбінуйте його висновки з власним аналізом та експертними знаннями, а також застосовуйте багатофакторну автентифікацію до всіх облікових записів.

Подробиці можна знайти на сайті: venturebeat.com

No votes yet.

Please wait...