Вице-президент корпорации Дэвид Сильвер говорит, что до сих пор прогресс в ИИ сильно зависел от данных, созданных людьми.
Теперь же происходит переход к новой эре, где ИИ будет учиться на основе собственного опыта. Лауреат премии Тьюринга 2024 Ричард Саттон вместе с Дэвидом Сильвером представили ключевую концепцию эволюции ИИ и описали новую парадигму, к которой, по мнению авторов, мы сейчас переходим.
Почему именно сейчас? Потому, как появляются ИИ-агенты, взаимодействующие с реальным миром,разрабатываются мощные методы RL, есть тех.готовность для перехода от симуляций к реальности. Это должно позволить ИИ выйти за пределы человеческих знаний и открыть новые стратегии и решения.
Ключевой пример — AlphaProof, который решает олимпиадные задачи по математике на уровне серебряной медали. Практическая реализация этих идей находится в системе Agent S.