Разрабатывают роботов, которые могут предвидеть и безопасно избегать людей в движении

Разрабатывают «социально сознательных» роботов, которые могут предвидеть и безопасно избегать людей в движении.

Группа исследователей под руководством профессора Университета Торонто Тима Барфута использует новую стратегию, которая позволяет роботам избегать столкновений с людьми, предсказывая будущее расположение динамических препятствий на их пути.

Проект будет представлен на Международной конференции по робототехнике и автоматизации в Филадельфии в конце мая.

Результаты моделирования, которые еще не прошли рецензирование, доступны в службе препринтов arXiv.

«Принцип нашей работы заключается в том, чтобы робот предсказывал, что люди собираются делать в ближайшем будущем», — говорит Хьюг Томас, научный сотрудник лаборатории Барфута в Институте аэрокосмических исследований Университета Титана на факультете прикладных наук. & Инжиниринг. «Это позволяет роботу предвидеть движение людей, с которыми он сталкивается, а не реагировать на эти препятствия».

Чтобы решить, куда двигаться, робот использует пространственно-временные карты занятости (SOGM). Это карты 3D-сетки, поддерживаемые процессором робота, где каждая ячейка 2D-сетки содержит прогнозируемую информацию об активности в этом пространстве в определенное время. Робот выбирает свои будущие действия, обрабатывая эти карты с помощью существующих алгоритмов планирования траектории.

Еще одним ключевым инструментом, используемым командой, является обнаружение света и определение дальности (лидар), технология дистанционного зондирования, похожая на радар, за исключением того, что она использует свет вместо звука. Каждый пинг лидара создает точку, хранящуюся в памяти робота. Предыдущая работа группы была сосредоточена на маркировке этих точек на основе их динамических свойств. Это помогает роботу распознавать различные типы объектов в своем окружении.

Сеть SOGM группы в настоящее время способна распознавать четыре категории лидарных точек: земля; постоянные приспособления, такие как стены; вещи подвижные, но неподвижные, например стулья и столы; и динамические препятствия, такие как люди. Никакая человеческая маркировка данных не требуется.

«С помощью этой работы мы надеемся, что роботы смогут перемещаться по переполненным помещениям в более социальной манере», — говорит Барфут. «Предсказывая, куда пойдут люди и другие объекты, мы можем планировать пути, предвосхищая действия динамических элементов».

В документе команда сообщает об успешных результатах алгоритма, реализованного в моделировании. Следующая задача — продемонстрировать аналогичную производительность в реальных условиях, когда действия человека трудно предсказать. В рамках этих усилий команда протестировала свою конструкцию на первом этаже Центра инженерных инноваций и предпринимательства Университета Т. Михаль, где робот смог пройти мимо занятых студентов.

«Когда мы проводим эксперименты в моделировании, у нас есть агенты, запрограммированные на определенное поведение, и они доберутся до определенной точки, следуя наилучшей траектории, чтобы добраться туда», — говорит Томас. «Но это не то, что люди делают в реальной жизни».

Когда люди перемещаются в пространстве, они могут торопиться или резко останавливаться, чтобы поговорить с кем-то еще, или повернуть в совершенно другом направлении. Чтобы справиться с таким поведением, сеть использует технику машинного обучения, известную как обучение с самоконтролем.

Самоконтролируемое обучение контрастирует с другими методами машинного обучения , такими как усиленное обучение, когда алгоритм учится выполнять задачу, максимизируя понятие вознаграждения методом проб и ошибок. Хотя этот подход хорошо работает для некоторых задач — например, когда компьютер учится играть в шахматы или го, — он не идеален для навигации такого типа.

«При обучении с подкреплением вы создаете черный ящик, из-за которого трудно понять связь между входными данными — тем, что видит робот, — и выходными данными или действиями робота», — говорит Томас. «Это также потребовало бы, чтобы робот много раз терпел неудачу, прежде чем он выучит правильные вызовы, и мы не хотели, чтобы наш робот учился, врезаясь в людей».

Напротив, самоконтролируемое обучение простое и понятное, а это означает, что легче увидеть, как робот принимает свои решения. Этот подход также ориентирован на точки, а не на объекты, что означает, что сеть имеет более точную интерпретацию необработанных данных датчиков, что позволяет делать мультимодальные прогнозы.

«Многие традиционные методы определяют людей как отдельные объекты и создают для них траектории. Но поскольку наша модель точечно-ориентирована, наш алгоритм не определяет количество людей как отдельных объектов, а распознает области, где люди должны находиться. людей, площадь становится больше», — говорит Томас.

«Это исследование предлагает многообещающее направление, которое может иметь положительные последствия в таких областях, как автономное вождение и доставка роботами, где окружающая среда не полностью предсказуема».

В будущем команда хочет посмотреть, смогут ли они расширить свою сеть, чтобы изучать более тонкие сигналы от динамических элементов в сцене.

«Для этого потребуется гораздо больше обучающих данных», — говорит Барфут. «Но это должно быть возможно, потому что мы настроили себя на генерацию данных более автоматическим способом: когда робот может сам собирать больше данных во время навигации, обучать более совершенные прогностические модели, когда он не работает, а затем использовать их при следующем перемещении.»