Представлен более простой метод обучения роботов новым навыкам

Прочитано: 72 раз(а)


Хотя за последние десятилетия робототехники внедряли все более сложные системы, обучение этих систем успешному и надежному решению новых задач часто оказывалось сложной задачей. Часть этого обучения включает в себя сопоставление многомерных данных, таких как изображения, собранные бортовыми камерами RGB, с целенаправленными действиями робота.

Исследователи из Имперского колледжа Лондона и Лаборатории обучения роботов Dyson недавно представили Render and Diffuse (R&D) – метод, который объединяет низкоуровневые действия роботов и изображения RBG с использованием виртуальных 3D-рендерингов роботизированной системы. Этот метод, представленный в статье , опубликованной на сервере препринтов arXiv , может в конечном итоге облегчить процесс обучения роботов новым навыкам, сократив огромное количество человеческих демонстраций, требуемых многими существующими подходами.

«Наша недавняя статья была обусловлена ​​целью дать людям возможность эффективно обучать роботов новым навыкам без необходимости проведения обширных демонстраций», — сказал Виталис Восилиус, доктор философии последнего года обучения. студент Имперского колледжа Лондона и ведущий автор. «Существующие методы требуют больших объемов данных и плохо справляются с пространственной генерализацией, плохо работают, когда объекты расположены не так, как на демонстрациях. Это связано с тем, что прогнозирование точных действий в виде последовательности чисел из изображений RGB чрезвычайно сложно, когда данные ограничены».

Во время стажировки в Dyson Robot Learning Восилиус работал над проектом, кульминацией которого стало развитие исследований и разработок. Этот проект был направлен на упрощение задачи обучения роботов, позволяя им более эффективно прогнозировать действия, которые позволят им выполнять различные задачи.

В отличие от большинства роботизированных систем, осваивая новые навыки ручного труда, люди не выполняют обширных вычислений, чтобы определить, насколько сильно им следует двигать конечностями. Вместо этого они обычно пытаются представить, как должны двигаться их руки, чтобы эффективно решать конкретную задачу .

«Наш метод Render and Diffuse позволяет роботам делать нечто подобное: «представлять» свои действия внутри изображения, используя виртуальные рендеры своего собственного воплощения», — объяснил Восилиус. «Представление действий и наблюдений роботов вместе в виде изображений RGB позволяет нам обучать роботов различным задачам с меньшим количеством демонстраций и делать это с улучшенными возможностями пространственного обобщения».

Чтобы робот научился выполнять новую задачу, ему сначала необходимо спрогнозировать действия, которые он должен выполнить, на основе изображений, снятых его датчиками. Метод исследований и разработок, по сути, позволяет роботам более эффективно изучать сопоставление изображений и действий.

«Как следует из названия, наш метод состоит из двух основных компонентов», — сказал Восилиус. «Во-первых, мы используем виртуальные рендеры робота, позволяя роботу «представлять» свои действия так же, как он видит окружающую среду. Мы делаем это, визуализируя робота в той конфигурации, в которой он оказался бы, если бы принял определенные меры. действия.

«Во-вторых, мы используем процесс обучения, который итеративно уточняет эти воображаемые действия, что в конечном итоге приводит к последовательности действий, которые робот должен выполнить для выполнения задачи».

Используя широко доступные 3D-модели роботов и методы рендеринга, исследования и разработки могут значительно упростить приобретение новых навыков, а также значительно снизить требования к обучающим данным. Исследователи оценили свой метод в серии симуляций и обнаружили, что он улучшает возможности обобщения роботизированной политики.

Они также продемонстрировали возможности своего метода в эффективном решении шести повседневных задач с помощью настоящего робота. В эти задачи входило убрать сиденье унитаза, подмести шкаф, открыть коробку, положить яблоко в ящик, а также открыть и закрыть ящик.

«Тот факт, что использование виртуальных изображений робота для представления его действий приводит к повышению эффективности обработки данных, действительно впечатляет», — сказал Восилиус. «Это означает, что, умело представляя действия роботов, мы можем значительно сократить объем данных, необходимых для обучения роботов, что в конечном итоге уменьшит трудоемкую необходимость сбора большого количества демонстраций».

В будущем метод, предложенный этой командой исследователей, можно будет протестировать и применить к другим задачам, с которыми смогут справиться роботы. Кроме того, многообещающие результаты исследователей могут вдохновить на разработку аналогичных подходов для упрощения обучения алгоритмов для приложений робототехники.

«Способность отображать действия роботов в изображениях открывает захватывающие возможности для будущих исследований», — добавил Восилиус. «Я особенно воодушевлен объединением этого подхода с мощными моделями оснований изображений, обученными на огромных объемах интернет-данных. Это может позволить роботам использовать общие знания, полученные с помощью этих моделей, сохраняя при этом возможность рассуждать о действиях роботов на низком уровне».

Представлен более простой метод обучения роботов новым навыкам



Новости партнеров