Ai2 представили CodeScientist — опен сорс ИИ-агент, который генерирует научные гипотезы, проводит эксперименты и анализирует результаты. В ходе тестирования CodeScientist проанализировал ~ 50 научных статей в ИИ и виртуальных сред.
19 экспериментов система самостоятельно отметила как потенциальные открытия. После проверки человеком-экспертом 6 из них были признаны обоснованными научными находками. Ранее был представлен ИИ-агент The AI Scientist-v2, который успешно опубликовал научную статью, прошедшую рецензирование на воркшопе ICLR 2025. Смотрите отличие 2-х агентов на картинке. Несмотря на успехи CodeScientist, система сталкивается с рядом вызовов: 1. Более половины экспериментов заканчиваются неудачей из-за проблем с отладкой 2. Языковые модели по-прежнему "как младшие научные сотрудники", требующие наставничества 3. Открытия носят инкрементальный характер, а не революционный.