Производитель компьютерного оборудования Nvidia отводит себе все большую роль в генетических исследованиях, поскольку в нем происходят кардинальные изменения благодаря новаторским усилиям в области искусственного интеллекта (ИИ).
Разработанная совместно с Аргоннской национальной лабораторией и Чикагским университетом новая масштабная языковая модель под названием
GenSLMs привлекла значительное внимание своей способностью генерировать последовательности генов, которые точно отражают реальные варианты вируса SARS-CoV-2, вызывающего COVID-19. Это говорит о том, что искусственный интеллект может демонстрировать глубокое понимание сложных генетических паттернов.
GenSLMs также может различать варианты COVID благодаря обучению на более чем 110 миллионах геномов, что позволяет ей классифицировать и группировать последовательности генома.
“Способность искусственного интеллекта предсказывать виды генных мутаций, присутствующих в последних штаммах COVID, несмотря на то, что во время обучения он видел только альфа— и бета—варианты, является убедительным подтверждением его возможностей”, - сказал Арвинд Раманатан, ведущий исследователь проекта из Аргонны, в официальном заявлении, опубликованном Nvidia.
Со своей стороны, Nvidia предоставила команде передовые вычислительные ресурсы, в том числе суперкомпьютеры на базе графического процессора NVIDIA A100 Tensor Core, которые оказались решающими при обработке обширного набора данных о нуклеотидных последовательностях.
Влияние больших языковых моделей на генетику
Ориентированные на медицину большие языковые модели, такие как GenSLMs, Ankh и CancerGPT, представляют собой важные достижения в современных генетических исследованиях. Эти системы искусственного интеллекта извлекают уроки из обширных текстовых наборов данных для прогнозирования и генерации контекстуально значимых языковых шаблонов. В генетике это выражается в способности анализировать и интерпретировать сложные генетические последовательности, очень похожие на лингвистический анализ.
Это инновационное приложение LLMs открыло новую главу в генетике, где глубокое понимание генетических последовательностей приводит к прорывам в выявлении маркеров заболеваний и продвижении персонализированной медицины.
Ankh, разработанный университетами Мюнхена и Колумбии совместно с биотехнологическим стартапом Proteinea, углубляется в язык белков, в то время как
CancerGPT, совместный проект Техасского и Массачусетского университетов, предсказывает лекарственное взаимодействие при лечении рака с использованием LLM. Эти исследования означают серьезный сдвиг в обработке огромных объемов генетических данных.
Способность GenSLMs прогнозировать вирусные мутации открывает новые возможности для разработки вакцин и стратегий лечения заболеваний, подобных COVID-19, утверждает Nvidia. Приложения Ankh для разработки лекарств и CancerGPT для понимания методов лечения рака прокладывают путь к более целенаправленным и эффективным медицинским вмешательствам.