Новини Google AI: Gemini, AI-математик і прискорювач ліків – ForkLog UA

Google вдосконалила версію розмірковувань Gemini 3 Deep Think. Інструмент подається як рішення для важких задач у сфері науки та техніки.

У випробуваннях модель обігнала GPT-5.2 від OpenAI та Claude Opus 4.6 від Anthropic, особливо в ARC-AGI-2 з візуальними головоломками, MMMU-Pro для оцінки мультимодальних можливостей, Elo 3455 та «Кінцевому екзамені людства».

image

image

Джерело: Google.

«Ми покращили Gemini 3 Deep Think у тісній взаємодії з науковцями та дослідниками, щоб мати справу зі складними науковими питаннями — там, де завдання часто не мають чіткої структури або єдиного правильного рішення, а відомості надані не повністю», — йдеться у блозі фірми.

Gemini 3 Deep Think показує проривні результати в математиці та кодуванні, а також «чудово» поводиться в природничих науках, зокрема в хімії та фізиці. Оновлена версія вирішує завдання на рівні володарів золотих медалей міжнародних олімпіад.

У CMT-Benchmark модель отримала 50,5%, підтвердивши глибокі пізнання в області теоретичної фізики.

image

image

Джерело: Google.

«Крім чудових показників, Deep Think зосереджений на практичному використанні: він допомагає науковцям розшифровувати складні дані, а інженерам — моделювати фізичні системи за допомогою коду», — відзначили в Google.

Новий Deep Think доступний у застосунку Gemini для користувачів Google AI Ultra, що мають підписку, та в Gemini API для певних розробників.

ШІ-математик від DeepMind

Підрозділ Google DeepMind представив ШІ-агента Aletheia. Модель встановила новий рекорд у бенчмарку IMO-ProofBench Advanced, вирішивши 91,9% задач. Тест вважається одним з найважчих у математиці.

Нейромережу створено на основі Gemini Deep Think. Система обладнана модулем перевірки: він знаходить помилки в чернетках розв’язків і запускає ітеративний процес їх доопрацювання.

Ключова риса агента — вміння визнати неможливість розв’язання задачі, що значно заощаджує час дослідників.

Aletheia використовує Google Search для навігації складними науковими матеріалами, запобігаючи ймовірності застосування помилкових посилань і обчислювальних помилок під час взаємодії з науковими працями.

Серед досягнень моделі:

  • повна генерація наукової статті з обчисленням структурних констант в арифметичній геометрії;
  • спільне з людиною доведення оцінок для систем взаємодіючих частинок (незалежних множин);
  • автономне розв’язання чотирьох задач зі списку Ердеша, одна з яких раніше вважалася відкритою.

У DeepMind наголосили, що успіх Aletheia підтверджує важливість законів масштабування: у доказовій математиці якість і надалі зростає завдяки результативному застосуванню агентів.

Прорив у медицині

Дочірня фірма DeepMind — Isomorphic Labs — представила рушій IsoDDE для розробки лікарських засобів. У складних випробуваннях новинка вдвічі перевершила AlphaFold 3 за точністю прогнозів.

Остання стала великим проривом, оскільки змогла передбачати тривимірні структури білків та їхню взаємодію з молекулами. IsoDDE натомість показує зовсім новий рівень:

  • модель прогнозує силу зв’язування (афінність) точніше за звичайні методи;
  • рушій може виявляти приховані структури («кишені») білків, у яких може зв’язуватися препарат;
  • підтримується широкий діапазон складних молекул, включно з антитілами та великими біологічними структурами.

«IsoDDE пропонує масштабовану основу для ШІ-дизайну ліків, надаючи точність прогнозів, необхідну для роботи з новими біологічними системами з безпрецедентною надійністю», — йдеться у блозі компанії.

Нагадаємо, у січні медики схвально відгукнулися на запуск ChatGPT Health для консультацій з питань здоров’я.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *