Новый подход позволяет роям дронов автономно перемещаться в сложных условиях на высокой скорости

Беспилотные летательные аппараты (БПЛА), обычно называемые дронами, широко используются во всем мире для решения различных задач, включая видеосъемку различных целей, наблюдение за посевами и другими объектами с воздуха, оценку зон стихийных бедствий и проведение военных операций. Несмотря на их широкое распространение, большинство существующих дронов либо полностью, либо частично управляются человеком.

Кроме того, многие дроны не способны маневрировать в загромождённых, переполненных или незнакомых местах, не сталкиваясь с близлежащими объектами. Те, которые способны маневрировать в таких условиях, обычно используют дорогостоящие или громоздкие компоненты, такие как современные датчики, графические процессоры (GPU) или системы беспроводной связи .

Исследователи из Шанхайского университета Цзяотун недавно представили новый подход, вдохновлённый насекомыми, который позволит группам из нескольких дронов автономно перемещаться в сложных условиях, двигаясь на высокой скорости. Предлагаемый ими подход, представленный в статье, опубликованной в журнале Nature Machine Intelligence , основан как на алгоритме глубокого обучения, так и на основных физических принципах.

«Наше исследование вдохновили невероятные способности к полёту крошечных насекомых, таких как мухи», — рассказали изданию Tech Xplore профессор Даньпин Цзоу и профессор Вэйяо Линь, соавторы статьи. «Нас всегда поражало, как такие маленькие существа, с крошечным мозгом и ограниченными органами чувств, могут совершать ловкие и разумные манёвры — избегать препятствий, зависать в воздухе или преследовать добычу».

«Воспроизведение такого уровня управления полётом давно было мечтой и серьёзной задачей в робототехнике. Для этого требуется тесно интегрированная система восприятия, планирования и управления, работающая на очень ограниченном объёме бортовых вычислений, как в мозге насекомого».

Большинство распространённых вычислительных подходов к управлению полётом нескольких дронов разбивают задачу автономной навигации на отдельные модули, такие как оценка состояния, картографирование, планирование пути, генерация траектории и модули управления. Хотя раздельное решение этих подзадач может быть эффективным, иногда это приводит к накоплению ошибок в разных модулях и вносит задержку в реакцию дронов. Другими словами, это может привести к более медленной реакции дронов при приближении к препятствиям, что повышает риск столкновений в динамичной и загромождённой среде.

«Основной целью нашего исследования было выяснить, может ли легкая искусственная нейронная сеть (ИНС) заменить этот классический конвейер компактной сквозной политикой», — заявили профессора Цзоу и профессор Линь.

Эта сеть принимает данные датчиков на входе и напрямую выдаёт управляющие воздействия — парадигма, отражающая то, как мухи используют небольшое количество нейронов для реализации сложного, интеллектуального поведения. Мы стремились не просто соответствовать биологической элегантности, но и продемонстрировать, что минимализм в восприятии и вычислениях может обеспечить высокопроизводительный автономный полёт.

Новая система, разработанная исследователями, в первую очередь опирается на недавно разработанную лёгкую искусственную нейронную сеть, способную генерировать команды управления для квадрокоптерного летательного аппарата на основе карты глубины сверхнизкого разрешения 12×16. Хотя детализация карт, передаваемых в алгоритм, невысокая, её оказалось достаточно для того, чтобы сеть могла анализировать окружающую обстановку и эффективно планировать действия летательных аппаратов.

«Мы обучили эту сеть на специально разработанном симуляторе, состоящем из простых геометрических фигур — кубов, эллипсоидов, цилиндров и плоскостей, — что позволяет нам создавать разнообразные, но структурированные среды», — пояснили профессора Цзоу и профессор Линь. «Наш процесс обучения отличается высокой эффективностью благодаря дифференцируемому физическому конвейеру. Он поддерживает как одноагентный, так и многоагентный режимы обучения: в многоагентном режиме другие дроны рассматриваются как динамические препятствия в процессе обучения».

Ключевым преимуществом разработанного исследователями подхода к навигации с использованием нескольких летательных аппаратов является то, что он основан на чрезвычайно компактной и лёгкой глубокой нейронной сети, состоящей всего из трёх свёрточных слоёв. Исследователи протестировали её на встраиваемой вычислительной плате стоимостью всего 21 доллар и обнаружили, что она работает плавно и энергоэффективно.

«Обучение занимает всего 2 часа на графическом процессоре RTX 4090, что невероятно быстро для изучения политик», — заявили профессора Цзоу и профессор Линь. «Наша система также естественным образом поддерживает навигацию нескольких роботов без централизованного планирования или явного взаимодействия, что обеспечивает масштабируемое развёртывание в сценариях роя».

Изучив предыдущую литературу в этой области, исследователи обнаружили, что многие алгоритмы глубокого обучения для навигации дронов плохо обобщаются в реальных условиях. Это часто связано с тем, что они не учитывают неожиданные препятствия или изменения окружающей среды и требуют обучения на больших объёмах данных полёта, размеченных экспертами-людьми.

«Наше самое важное открытие заключается в том, что внедрение физической модели квадрокоптера непосредственно в процесс обучения может значительно повысить как эффективность обучения, так и реальные показатели — с точки зрения надежности и маневренности», — заявили профессора Цзоу и профессор Линь.

«Эта методика, известная как дифференцируемое обучение физике, была изобретена не нами, но мы первыми успешно расширили и применили её к реальному управлению квадрокоптером. Благодаря этому исследованию мы также пришли к трём неожиданным, но важным выводам — урокам, которые могут изменить наше представление об интеллекте, моделях и восприятии в робототехнике».

Многообещающие результаты, полученные профессорами Цзоу, Линем и их коллегами, демонстрируют потенциал небольших моделей на основе искусственных нейронных сетей для решения сложных навигационных задач. Исследователи показали, что эти модели могут быть более эффективными, чем принято считать, и могут также помочь понять принципы работы более крупных моделей.

«Точно так же, как нейробиология достигла своего раннего прогресса благодаря плодовой мушке, чьи простые нейронные цепи помогли открыть основополагающие идеи, небольшие модели дают нам более чёткое представление о том, как связаны восприятие, принятие решений и контроль», — говорят профессора Цзоу и профессор Линь. «В нашем случае модель с менее чем 2 МБ параметров обеспечила многоагентную координацию без какой-либо коммуникации, показывая, как простота может привести к появлению нового интеллекта».

Примечательно, что разработанная исследователями облегчённая модель показала хорошие результаты, несмотря на обучение в имитируемой среде. Это резко контрастирует со многими ранее разработанными моделями, требующими значительных объёмов данных, размеченных экспертами.

«Мы узнали, что интеллект не обязательно зависит от огромных наборов данных», — заявили исследователи. «Мы отработали нашу политику исключительно на моделировании — без данных интернет-масштаба, предварительно собранных журналов или вручную подготовленных демонстраций, — используя лишь несколько базовых задач и геометрических сред, работающих на базе дифференцируемого физического движка. Это ставит под сомнение распространённое предположение о том, что «больше данных всегда лучше», и предполагает, что структурное выравнивание и встроенные физические априорные данные могут иметь большее значение, чем просто объём данных».

В целом, результаты недавнего исследования свидетельствуют о том, что нейронные сети, основанные на базовых физических принципах, могут достигать лучших результатов, чем сети, обученные на миллионах изображений, карт или других размеченных данных. Более того, исследователи обнаружили, что даже низкодетализированные изображения могут быть использованы для точного управления поведением роботов.

«Подобно плодовой мушке, чьё зрение ограничено фасеточными глазами низкого разрешения, но которая, тем не менее, совершает невероятные подвиги в воздухе, мы использовали изображения с глубиной 12×16 пикселей для управления дронами, летающими со скоростью до 20 м/с», — говорят профессора Цзоу и профессор Линь. «Это подтверждает смелую гипотезу: эффективность навигации может зависеть больше от внутреннего понимания агентом физического мира, чем от точности сенсоров».

В будущем подход, разработанный профессором Цзоу, профессором Линем и его коллегами, может быть использован на большем количестве типов летательных аппаратов и протестирован в конкретных реальных условиях. В конечном итоге он может помочь расширить круг задач, решаемых сверхлёгкими дронами, например, позволяя им автоматически делать селфи или участвовать в гонках. Этот подход также может оказаться полезным для трансляций спортивных и других мероприятий, для поиска обрушившихся зданий во время поисково-спасательных операций и для осмотра загромождённых складов.

«В настоящее время мы изучаем возможность использования оптического потока вместо карт глубины для полностью автономного полёта», — добавили профессора Цзоу и профессор Линь. «Оптический поток обеспечивает фундаментальные сигналы движения и давно изучается в нейробиологии как ключевой компонент зрения насекомых».

«Используя его, мы надеемся ещё больше приблизиться к имитации естественных стратегий, используемых насекомыми для навигации. Ещё одно важное направление, в котором мы работаем, — это интерпретируемость систем сквозного обучения».

Хотя лёгкая нейронная сеть, созданная этой группой, показала впечатляющие результаты в реальных экспериментах, механизм работы этих многообещающих результатов пока не до конца изучен. В рамках своих следующих исследований профессора Цзоу и профессор Линь надеются пролить больше света на внутренние представления сети, что также может дать представление о том, как насекомые воспринимают окружающую среду и планируют свои действия.