Arc Institute совместно с NVIDIA, Стэнфордским университетом, Калифорнийским университетом в Беркли и Калифорнийским университетом в Сан-Франциско представил Evo 2 — крупнейшую на сегодня ИИ-модель для биологии:
Основные характеристики:
- Обучение на основе 9.3 триллионов нуклеотидов из 128 000 геномов.
- Покрытие всех доменов жизни: от бактерий до человека.
- Два варианта модели: 7 миллиардов и 40 миллиардов параметров.
- Способность обрабатывать последовательности длиной до 1 миллиона нуклеотидов.
Технологические достижения:
- Архитектура StripedHyena 2 обеспечивает трехкратное увеличение скорости обработки.
- Работа без предварительной подготовки или выравнивания последовательностей.
- Открытый исходный код и доступ к данным.
- Интеграция с платформой NVIDIA BioNeMo.
Возможности применения:
- Анализ генетических заболеваний:
- Прогнозирование патогенности мутаций с точностью свыше 90%.
- Эффективная работа с генами, такими как BRCA1 (рак молочной железы).
- Поддержка анализа как кодирующих, так и некодирующих участков ДНК.
- Генетическое проектирование:
- Генерация человеческих митохондриальных геномов.
- Создание бактериальных геномов.
- Проектирование эукариотических хромосом.
- Управление доступностью хроматина.
- Исследования и разработка лекарственных препаратов:
- Моделирование виртуальных клеток.
- Изучение взаимодействий между генотипом и окружающей средой.
- Идентификация новых терапевтических целей.
Обеспечение безопасности:
- Исключение патогенных организмов из тренировочного набора данных.
- Ограничения на использование модели для опасных патогенов.
- Этап этического контроля с участием экспертов.
Инструментальная экосистема:
- Веб-интерфейс Evo Designer для удобной работы с моделью.
- Средства интерпретации от GoodfireAI.
- Интеграция с NVIDIA для ускорения вычислительных процессов.
Уникальные особенности Evo 2:
- Универсальность: Модель охватывает весь спектр живых существ.
- Скорость: Значительное ускорение биомедицинских исследований.
- Доступность: Открытость кода способствует широкому использованию.
- Точность: Достижение лучших показателей без дополнительной настройки.
- Масштабируемость: Возможность создания специализированных приложений.
Перспективы:
- Ускоренная разработка новых лекарственных средств.
- Повышенная точность диагностики наследственных болезней.
- Более точные методы генной терапии.
- Прогресс в области синтетической биологии.
- Создание «магазина приложений» для биологических инструментов.
Evo 2 обещает революционизировать биологию и медицину благодаря своим мощным возможностям и открытому подходу.