Microsoft поєднала GPT та Claude для взаємодії.

Корпорація Microsoft презентувала дві нові опції для інструменту Copilot Researcher — Critique та Council. Вони дозволяють моделям GPT від OpenAI та Claude від Anthropic взаємодіяти над спільним завданням з метою збільшення точності результатів.

Critique — це інноваційна багатомодельна система глибоких досліджень, розроблена спеціально для опрацювання об’ємних дослідницьких процесів. Інструмент використовує поєднання нейронних мереж від передових лабораторій.

«Одна модель керує етапом генерації, планує завдання, виконує ітерації з пошуку інформації та створює початковий проєкт. Інша відповідає за перевірку та поліпшення, виступаючи як експерт-оглядач», — зазначено в повідомленні Microsoft.

Варто зазначити, що LLM можуть змінювати свої ролі.

У компанії підкреслили, що всі існуючі ШІ-інструменти для досліджень функціонують однаково, і ніхто не проводить перевірку їх роботи. Critique намагається вирішити проблему галюцинацій, помилок у цитуванні та наданні неправдивих або недостовірних даних.

У тестуванні DRACO, що містить 100 комплексних дослідницьких задач у 10 різних сферах, Critique отримала 57,4 бала, в той час як Claude Opus 4.6 — 42,7.

image

image

Джерело: Microsoft.

Інша функція під назвою Council використовує інший підхід до вирішення завдання. Вона запускає GPT і Claude одночасно та показує їх повні звіти поряд. Потім третя модель‑арбітр вивчає обидві відповіді та готує висновок, де пояснює, у чому ШІ погодилися, а в чому їхні аргументи відрізняються.

У Critique LLM взаємодіють один з одним, в той час як у Council — змагаються між собою.

Critique є стандартним режимом у Researcher, а Council потрібно вибрати в меню налаштувань. Обидві опції доступні користувачам, що зареєстровані в програмі Microsoft Frontier.

Слід нагадати, що у березні корпорація презентувала ШІ-агента Cowork для виконання складних задач у Microsoft 365. Він має можливість взаємодіяти з екосистемними застосунками Outlook, Teams, Excel, PowerPoint та SharePoint.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *