Главный вызов робототехников — научить технику обобщению: чтобы роботы могли работать в любом доме, с любыми предметами, даже если никогда их не видели.
Команда Physical Intelligence представила модель π0.5 — шаг к универсальному физическому интеллекту. В отличие от предыдущих решений, π0.5 адаптируется к совершенно новым условиям: убирает кухню или спальню в доме, которого не было в обучающих данных. Как это работает? π0.5 — это VLA-модель (Vision-Language-Action), которая учится на разнородных данных: Действия роботов (мобильные и статичные, из разных сред). Мультимодальные веб-данные (описания, вопросы, распознавание объектов).
Языковые инструкции (шаг за шагом, как человек объясняет задачу). Модель сначала рассуждает на высоком уровне («подними подушку»), а затем выбирает низкоуровневые моторные команды. Результаты Обобщение на новые дома: π0.5 справляется с уборкой в незнакомой среде, хотя и не всегда с первой попытки.
Масштабирование: после 100 обучающих сред π0.5 догоняет по эффективности модель, обученную *напрямую* на тестовой среде. Что дальше? π0.5 — не идеал, но важный шаг к роботам, которые: Учатся на автономном опыте. Запрашивают помощь в незнакомых ситуациях. Работают в реальных условиях (дома, магазины, больницы).