Гуманоидные роботы, имеющие структуру тела, которая отражает человеческую, могли бы быстро и эффективно решать широкий спектр задач в реальных условиях. Эти роботы и их базовые алгоритмы управления значительно улучшились за последние годы. Многие из них теперь могут двигаться быстрее, имитируя различные движения, подобные человеческим.
Поскольку эти роботы спроектированы так, чтобы ходить или бегать подобно людям, балансируя на двух ногах, они иногда могут сталкиваться с объектами или спотыкаться на неровной поверхности, падая на землю. Однако, в отличие от людей, которые могут легко подняться после падения, гуманоидные роботы иногда могут застрять на земле, требуя поддержки людей, чтобы снова встать на ноги.
Исследователи из Университета Иллинойса в Урбане-Шампейне недавно разработали новую структуру машинного обучения , которая может позволить гуманоидным роботам автоматически вставать и восстанавливаться после падения на землю. Эта структура, представленная в статье на сервере препринтов arXiv, может сделать этих роботов более автономными, что потенциально может способствовать их будущему масштабному развертыванию.
«Ручная разработка контроллеров для подъема затруднена из-за разнообразных конфигураций, в которых может оказаться гуманоид после падения, и сложных ландшафтов, на которых, как ожидается, будут работать гуманоидные роботы», — написали в своей статье Сялинь Хэ, Рунпей Донг и их коллеги. «В этой статье разрабатывается обучающая структура для создания контроллеров, которые позволяют гуманоидным роботам вставать из различных конфигураций на различных ландшафтах».
Новая структура, разработанная этой исследовательской группой, названная HUMANUP , опирается на подход обучения с подкреплением (RL). Этот подход призван улучшить способность гуманоидных роботов вставать, независимо от их положения при падении.
«В отличие от предыдущих успешных применений обучения локомоции гуманоидов, задача вставания включает в себя сложные схемы контакта, что требует точного моделирования геометрии столкновения и более редких вознаграждений», — написали Хэ, Донг и их коллеги. «Мы решаем эти проблемы с помощью двухэтапного подхода, который следует учебной программе».
Структура HUMANUP RL охватывает два различных этапа. На первом этапе структура фокусируется на определении хороших траекторий конечностей, которые позволят роботу встать, что накладывает минимальные ограничения на то, насколько плавными должны быть движения робота или на скорость, с которой эти движения должны выполняться.
С другой стороны, во время второй фазы фреймворк совершенствует движения, раскрытые в рамках более ранней фазы, в конечном итоге превращая их в плавные и медленные движения, которые могут выполнять роботы. Примечательно, что эти усовершенствованные движения также должны быть эффективными независимо от положения робота и местности, на которую он упал.
Исследователи протестировали свою структуру как в симуляциях, так и в реальных условиях, развернув ее на гуманоидном роботе Unitree G1 , передовой роботизированной системе, созданной китайской компанией Unitree Robotics. Их выводы были весьма многообещающими, поскольку они обнаружили, что их подход позволил роботу автономно восстанавливаться после падения, независимо от положения, в котором он находился, и рельефа под ним.
«Мы обнаружили, что эти инновации позволяют реальному гуманоидному роботу G1 вставать из двух основных ситуаций, которые мы рассматривали: а) лежа лицом вверх и б) лежа лицом вниз, оба случая были протестированы на плоских, деформируемых, скользких поверхностях и склонах (например, неровной траве и снежном поле)», — написали Хэ, Донг и их коллеги. «Насколько нам известно, это первая успешная демонстрация выученных политик вставания для гуманоидных роботов размером с человека в реальном мире».
Новая многообещающая структура, разработанная Хэ, Донгом и их коллегами, вскоре может быть улучшена и развернута на других гуманоидных роботах, снабдив их способностью автоматически подниматься после падения. Это может помочь в дальнейшем совершенствовании роботов, что может способствовать их будущему широкому внедрению.