Мы становимся на шаг ближе к появлению универсальных домашних роботов, способных помогать нам в повседневной жизни без сложного программирования и адаптации к каждому дому.
Команда Physical Intelligence представила новую модель для робот π-0.5, которая показывает невиданные ранее способности к обобщению-робот может убирать квартиры и дома, которые никогда не видел в тренировочных данных.
Ключевой прорыв - роботы больше не привязаны к контролируемым средам. Современные роботы обычно работают только в хорошо изученных условиях (фабрики, склады), где объекты и их расположение строго определены.
Даже впечатляющие демонстрации сложных манипуляций происходят в тех же или очень похожих средах, где проводилось обучение. π-0.5 меняет правила игры — робот способен: - Убирать посуду в совершенно новых кухнях - Заправлять кровати в незнакомых спальнях - Реагировать на вмешательство человека - Понимать команды разного уровня детализации
Как им это удалось? 1. Смешение разнородных данных-модель обучалась одновременно на: •Мультимодальных веб-данных •Данных от различных типов роботов •Данных из множества разнообразных сред 2. Усовершенствованный рецепт обучения-предварительное обучение с предсказанием следующего токена и доводка с сопоставлением потоков. 3. Иерархическое мышление-модель сначала планирует высокоуровневые действия, затем преобразует их в конкретные моторные команды — подобно "внутреннему голосу" человека Результаты - при обучении на данных из 100 различных сред, π-0.5 достигает производительности, сравнимой с моделями, которые специально обучались на тестовых средах! π-0.5 опирается на предыдущие разработки компании: π0: первый "GPT для роботов". FAST: революционный метод токенизации действий. Hi Robot: система с "внутренним голосом" по модели Канемана. Модель уже протестирована в реальных условиях.Команда проверила систему в 3-х арендованных домах и специальных тестовых помещениях, которые не встречались в обучающих данных. Робот показал способность выполнять ежедневные задачи, хотя и не без ошибок. "π-0.5 далека от совершенства, но она демонстрирует гибкость и находчивость, напоминающую человеческий подход к новым задачам", — отмечают исследователи.