Робот-собака научилась ходить за час

Прочитано: 330 раз(а)


Новорожденный жираф или жеребенок должен как можно быстрее научиться ходить на ногах, чтобы избежать хищников. Животные рождаются с сетью координации мышц, расположенной в их спинном мозге. Однако обучение точной координации мышц и сухожилий ног требует некоторого времени. Первоначально детеныши животных в значительной степени полагаются на запрограммированные рефлексы спинного мозга. Рефлексы управления движением, хотя и более простые, помогают животному избежать падения и травм во время первых попыток ходьбы. Необходимо практиковать следующий, более продвинутый и точный контроль мышц, пока в конце концов нервная система не будет хорошо адаптирована к мышцам и сухожилиям ног молодого животного. Больше никаких неконтролируемых спотыканий — молодое животное теперь может не отставать от взрослых.

Робот-собака научилась ходить за час

Исследователи из Института интеллектуальных систем Макса Планка (MPI-IS) в Штутгарте провели исследование, чтобы выяснить, как животные учатся ходить и учатся, спотыкаясь. Они построили четвероногого робота размером с собаку, который помог им разобраться в деталях.

«Как инженеры и робототехники, мы искали ответ, создавая робота, который обладает рефлексами, как у животных, и учится на ошибках», — говорит Феликс Рупперт, бывший докторант исследовательской группы Dynamic Locomotion в MPI-IS. «Если животное спотыкается, является ли это ошибкой? Нет, если это происходит один раз. Но если оно спотыкается часто, это дает нам представление о том, насколько хорошо робот ходит».

Феликс Рупперт — первый автор книги « Изучение пластического сопоставления динамики роботов в центральных генераторах моделей с замкнутым контуром », которая будет опубликована 18 июля 2022 года в журнале Nature Machine Intelligence.

Алгоритм обучения оптимизирует виртуальный спинной мозг

Научившись ходить всего за час, робот Руперта успешно использует сложную механику ног. Алгоритм байесовской оптимизации направляет обучение: измеренная информация датчика стопы сопоставляется с целевыми данными из смоделированного виртуального спинного мозга, работающего как программа на компьютере робота. Робот учится ходить, постоянно сравнивая отправленную и ожидаемую информацию от датчиков, запуская рефлекторные циклы и адаптируя свои модели управления двигателем.

Алгоритм обучения адаптирует параметры управления центрального генератора шаблонов (CPG). У людей и животных эти центральные генераторы паттернов представляют собой сети нейронов в спинном мозге, которые производят периодические мышечные сокращения без участия головного мозга. Сети центрального генератора паттернов помогают генерировать ритмические задачи, такие как ходьба, моргание или пищеварение. Более того, рефлексы — это непроизвольные действия по управлению моторикой, запускаемые жестко закодированными нервными путями, которые соединяют датчики в ноге со спинным мозгом.

Пока молодое животное ходит по идеально плоской поверхности, CPG может быть достаточно для управления сигналами движения от спинного мозга. Однако небольшая неровность на земле меняет походку. Рефлексы включаются и регулируют движения, чтобы животное не упало. Эти мгновенные изменения в сигналах движения обратимы, или «эластичны», и модели движения возвращаются к своей первоначальной конфигурации после нарушения. Но если животное не перестает спотыкаться на многих циклах движения, несмотря на активные рефлексы, то шаблоны движений необходимо переучивать и делать «пластичными», т. е. необратимыми. У новорожденного животного ЦПГ изначально еще недостаточно отрегулированы, и животное спотыкается как на ровной, так и на неровной местности.

То же самое относится и к роботу-собаке размером с лабрадора по имени Морти. Более того, робот оптимизирует свои движения быстрее, чем животное, примерно за час. CPG Морти моделируется на небольшом и легком компьютере, который управляет движением ног робота. Этот виртуальный спинной мозг помещается на спину четвероногого робота, где должна быть голова. В течение часа, необходимого роботу для плавной ходьбы, данные датчика от ног робота постоянно сравниваются с ожидаемым приземлением, предсказанным CPG робота. Если робот спотыкается, алгоритм обучения меняет то, как далеко ноги качаются вперед и назад, как быстро качаются ноги и как долго нога находится на земле. Скорректированное движение также влияет на то, насколько хорошо робот может использовать свою податливую механику ног. В процессе обучения, CPG посылает адаптированные двигательные сигналы, чтобы впредь робот меньше спотыкался и оптимизировал свою походку. В этой структуре виртуальный спинной мозг не имеет явных знаний о конструкции ног робота, его двигателях и пружинах. Ничего не зная о физике машины, ему не хватает «модели» робота.

«Наш робот практически «рождается», ничего не зная об анатомии своих ног и о том, как они работают», — объясняет Руперт. «CPG напоминает встроенный автоматический интеллект ходьбы, который обеспечивает природа и который мы передали роботу. Компьютер выдает сигналы, управляющие моторами ног, и робот сначала идет и спотыкается. Данные возвращаются от датчиков к виртуальный спинной мозг, где сравниваются данные датчика и данные CPG. Если данные датчика не соответствуют ожидаемым данным, алгоритм обучения изменяет поведение при ходьбе до тех пор, пока робот не будет ходить хорошо и без спотыканий. Изменение выходных данных CPG при сохранении активных рефлексов и мониторинге спотыкание робота является основной частью процесса обучения ».

Энергоэффективный робот для управления собакой

Компьютер Морти потребляет всего пять ватт энергии в процессе ходьбы. Промышленные четвероногие роботы известных производителей, которые научились работать с помощью сложных контроллеров, гораздо более энергоемки. Их контроллеры закодированы со знанием точной массы и геометрии тела робота с использованием модели робота. Обычно они потребляют от нескольких десятков до нескольких сотен ватт мощности. Оба типа роботов работают динамично и эффективно, но потребление вычислительной энергии в модели Штутгарта намного ниже. Он также дает важные сведения об анатомии животных.

«Мы не можем легко исследовать спинной мозг живого животного. Но мы можем смоделировать его в роботе », — говорит Александр Бадри-Спровиц, который является соавтором публикации вместе с Рупертом и возглавляет группу исследования динамической локомоции. «Мы знаем, что эти CPG существуют у многих животных. Мы знаем, что рефлексы встроены, но как мы можем объединить и то, и другое, чтобы животные обучались движениям с помощью рефлексов и CPG? Это фундаментальное исследование на стыке робототехники и биологии. Роботизированная модель дает нам ответы на вопросы, на которые биология не может ответить».

 Робот-собака научилась ходить за час


Новости партнеров