ШІ-модель Evo 2 навчили проектувати геноми – ForkLog UA

Дослідники з Інституту Arc створили модель Evo 2, яка може досліджувати генетичні коди, передбачати хвороби та мутації та формулювати нові геноми, які можна порівняти за довжиною з геномами простих бактерій.

Ці спеціалісти співпрацюють із Nvidia, Стенфордським університетом, Каліфорнійським університетом у Берклі та Каліфорнійським університетом у Сан-Франциско. Їхня нейронна мережа пройшла навчання на ДНК понад 100 000 різних видів.

Код Evo 2 доступний для громадськості на GitHub, а також включений у структуру Nvidia BioNeMo.

Інститут Arc співпрацював з дослідницькою лабораторією штучного інтелекту Goodfire, щоб створити візуалізатор механічної інтерпретації, який розкриває важливі біологічні характеристики та закономірності, які модель вчиться ідентифікувати в геномних послідовностях.

«Evo 2 — це найбільша модель штучного інтелекту в біології на сьогоднішній день, навчена на більш ніж 9,3 трильйонах нуклеотидів — фундаментальних компонентах ДНК або РНК. […] Evo 2 містить знання про людей, рослини та різноманітні одноклітинні та багатоклітинні організми в еукаріотичному домені життя», — йдеться в повідомленні.

Нейронна мережа володіє «всеосяжним розумінням дерева життя», що допомагає у вирішенні численних завдань, таких як прогнозування мутацій і генерація коду для штучних форм життя.

«Еволюція вбудувала біологічну інформацію в ДНК і РНК, утворюючи шаблони, які Evo 2 може ідентифікувати та використовувати», — підкреслили автори дослідження.

Навчання штучного інтелекту проходило з використанням понад 2000 графічних процесорів Nvidia H100. Він може обробляти генетичні послідовності, що містять до 1 мільйона нуклеотидів одночасно, дозволяючи йому зрозуміти зв’язки між віддаленими сегментами геному.

В експериментах з варіантами гена BRCA1, пов’язаними з раком молочної залози, Evo 2 точно передбачив з точністю понад 90%, які мутації були нешкідливими, а які могли бути потенційно шкідливими.

Дослідницька група передбачає, що на основі Evo 2 можна буде розробити більш спеціалізовані моделі ШІ.

Варто зазначити, що в липні 2024 року китайські вчені представили робота, оснащеного вирощеним в лабораторії штучним мозком, здатним навчитися виконувати різні функції.

Раніше Meta AI представила «модель білкової мови» ESM-2, що містить 15 мільярдів параметрів, і базу даних ESM Metagenomic Atlas, яка містить понад 600 мільйонів прогнозних структур метагеномних сполук.

Источник

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються дані ваших коментарів.