Роботы с ногами, которые часто вдохновлены животными и насекомыми, могли бы помочь людям выполнять различные задачи реального мира, например, доставлять посылки или контролировать определенные среды. В последние годы ученые-компьютерщики создали алгоритмы, которые позволяют этим роботам ходить с разной скоростью, прыгать, имитировать некоторые движения животных и двигаться с большой ловкостью.
Исследователи из Лаборатории вычислительной автономии и робототехники Мичиганского университета (CURLY Lab) и Южного университета науки и технологий разработали фреймворк на основе обучения с подкреплением, который позволяет шагающим роботам успешно использовать скейтборд. Этот фреймворк, описанный в статье на сервере препринтов arXiv , также может использоваться для эмуляции других сложных движений реального мира, которые подразумевают физический контакт с близлежащими объектами.
«Существующие подходы к четвероногому передвижению не рассматривают контактно-богатое взаимодействие с целями, такими как катание на скейтборде», — рассказал Tech Xplore Сангли Тэн, автор-корреспондент статьи. «Наша работа была направлена на разработку конвейера для таких контактно-управляемых задач, которые стоит изучить, включая катание на скейтборде. Мичиганский университет имеет долгую историю разработки гибридных динамических систем, что вдохновило нас на выявление таких гибридных эффектов с помощью подходов, основанных на данных, в ИИ».
Основная цель недавней работы Тенга и его коллег состояла в том, чтобы позволить роботам на ногах выполнять контактно-управляемые движения, включая катание на скейтборде. Чтобы добиться этого, они разработали новую структуру, называемую дискретно-временным гибридным автоматным обучением (DHAL).
«Гибридная динамика» означает, что система может выполнять как непрерывные, так и дискретные переходы состояний. По сути, это означает, что она может двигаться плавно и внезапно менять свое состояние с течением времени.
«Например, когда отскакивающий мяч взаимодействует с землей, он имеет непрерывную динамику в воздухе и дискретные переходы состояний при столкновении с землей», — пояснил Тэн.
«Для систем с множественной непрерывной динамикой и функциями перехода чрезвычайно сложно одновременно идентифицировать дискретный режим и непрерывную динамику. Это происходит потому, что возможный переход растет экспоненциально быстро по отношению к числу возможных дискретных переходов».
Резкие переходы, описанные Тенгом, затрудняют изучение динамики системы с помощью традиционных вычислительных методов на основе регрессии . DHAL, фреймворк, разработанный исследователями, может идентифицировать эти резкие переходы, впоследствии изучая каждый непрерывный сегмент динамики системы с помощью методов на основе регрессии, уменьшая эффект разрыва, который, как было обнаружено, ухудшает производительность роботов при выполнении таких задач, как катание на скейтборде.
«По сравнению с существующими методами, DHAL не требует ручной идентификации дискретного перехода или предварительного знания количества переходных состояний», — сказал Тенг. «В DHAL все эвристично, и мы показали, что наш метод может автономно идентифицировать переход мод динамики».
Еще одним преимуществом фреймворка DHAL является его высокая интуитивность, что гарантирует, что переходы режимов, которые он определяет, соответствуют тем, которые обычно ассоциируются со скейтбордингом. В ходе первоначальных испытаний исследователи обнаружили, что он позволяет четвероногим (т. е. четвероногим) роботам плавно вставать на скейтборд и использовать его для быстрого движения вперед, одновременно тяну за собой небольшую тележку.
«В фазе толкания, скольжения и подъема на борт DHAL автоматически выводит различные метки», — сказал Тенг. «Наш метод можно применять для оценки состояния гибридных динамических систем, чтобы выяснить, происходит ли такой переход. С этой информацией о переходе система может лучше оценивать состояния, чтобы помочь в принятии решений».
Новая структура обучения с подкреплением, разработанная Тенгом и его коллегами, вскоре может открыть новые возможности для реального развертывания шагающих роботов. Например, она может позволить им двигаться быстрее с помощью скейтборда, доставляя посылки в городских условиях, внутри офисов или производственных помещений.
«Теперь мы планируем применить эту структуру к другим сценариям, таким как ловкое манипулирование (то есть манипулирование объектами с помощью нескольких пальцев или рук)», — добавил Тенг. «Ожидается, что DHAL будет точнее предсказывать контакт, тем самым позволяя алгоритмам планирования и управления принимать более обоснованные решения».