Сотни роботов носятся взад и вперед по полу огромного роботизированного склада, захватывая предметы и доставляя их людям для упаковки и отправки. Такие склады все чаще становятся частью цепочки поставок во многих отраслях: от электронной коммерции до автомобилестроения.
Однако эффективно доставить 800 роботов к месту назначения и обратно, не допуская при этом их столкновения друг с другом, — непростая задача. Это настолько сложная проблема, что даже лучшие алгоритмы поиска путей с трудом справляются с головокружительными темпами электронной коммерции или производства.
В некотором смысле эти роботы подобны автомобилям, пытающимся перемещаться по многолюдному центру города. Итак, группа исследователей Массачусетского технологического института, которые используют ИИ для уменьшения заторов на дорогах, применила идеи из этой области для решения этой проблемы.
Они создали модель глубокого обучения, которая кодирует важную информацию о складе, включая роботов, запланированные пути, задачи и препятствия, и использует ее для прогнозирования лучших областей склада для разгрузки, чтобы повысить общую эффективность.
Их технология делит складских роботов на группы, поэтому эти меньшие группы роботов можно быстрее разгрузить с помощью традиционных алгоритмов, используемых для координации роботов. В конце концов, их метод разгружает роботов почти в четыре раза быстрее, чем метод сильного случайного поиска.
Помимо оптимизации складских операций, этот подход глубокого обучения можно использовать и в других сложных задачах планирования, таких как проектирование компьютерных чипов или прокладка труб в больших зданиях.
«Мы разработали новую архитектуру нейронной сети, которая действительно подходит для операций в реальном времени в масштабе и сложности этих складов».
«Он может кодировать сотни роботов с точки зрения их траекторий, пунктов отправления, пунктов назначения и отношений с другими роботами, и он может делать это эффективным способом, повторно используя вычисления для групп роботов», — говорит Кэти Ву, Гилберт В. Уинслоу. Доцент по развитию карьеры в области гражданского и экологического строительства (CEE), а также член Лаборатории систем информации и принятия решений (LIDS) и Института данных, систем и общества (IDSS).
К Ву, старшему автору статьи по этой методике, присоединяется ведущий автор Чжунся Ян, аспирант в области электротехники и информатики. Работа будет представлена на Международной конференции по обучению представлений.
Роботизированный тетрис
С высоты птичьего полета пол роботизированного склада электронной коммерции немного напоминает динамичную игру «Тетрис».
Когда поступает заказ клиента, робот отправляется в определенную часть склада, захватывает полку, на которой находится запрошенный товар, и доставляет ее оператору-человеку, который собирает и упаковывает товар. Сотни роботов делают это одновременно, и если пути двух роботов столкнутся при пересечении огромного склада, они могут разбиться.
Традиционные алгоритмы, основанные на поиске, позволяют избежать потенциальных сбоев, удерживая одного робота на своем курсе и перепланируя траекторию для другого. Но из-за такого большого количества роботов и потенциальных столкновений проблема быстро растет в геометрической прогрессии.
«Поскольку склад работает в режиме онлайн, роботы перепланируются примерно каждые 100 миллисекунд. Это означает, что каждую секунду робот перепланируется 10 раз. Поэтому эти операции должны выполняться очень быстро», — говорит Ву.
Поскольку время имеет решающее значение при перепланировании, исследователи из Массачусетского технологического института используют машинное обучение, чтобы сосредоточить перепланирование на наиболее эффективных участках с заторами, где существует наибольший потенциал для сокращения общего времени в пути роботов.
Ву и Ян создали архитектуру нейронной сети , которая одновременно учитывает меньшие группы роботов. Например, на складе с 800 роботами сеть может разделить склад на более мелкие группы по 40 роботов в каждой.
Затем он предсказывает, какая группа имеет наибольший потенциал для улучшения общего решения, если для координации траекторий роботов в этой группе использовался решатель на основе поиска.
Это итеративный процесс: общий алгоритм выбирает наиболее перспективную группу роботов с помощью нейронной сети, разгружает группу с помощью решателя на основе поиска, затем выбирает следующую наиболее перспективную группу с помощью нейронной сети и так далее.
Учитывая отношения
Нейронная сеть может эффективно рассуждать о группах роботов, поскольку она фиксирует сложные отношения, существующие между отдельными роботами. Например, даже если изначально один робот может находиться далеко от другого, их пути все равно могут пересекаться во время поездок.
Этот метод также упрощает вычисления, кодируя ограничения только один раз, вместо повторения процесса для каждой подзадачи. Например, на складе с 800 роботами для разгрузки группы из 40 роботов необходимо удерживать остальные 760 роботов в качестве ограничений. Другие подходы требуют рассмотрения всех 800 роботов один раз на группу в каждой итерации.
Вместо этого подход исследователей требует только одного рассуждения о 800 роботах для всех групп в каждой итерации.
«Склад — это одно большое пространство, поэтому многие из этих групп роботов будут иметь некоторые общие аспекты более крупной проблемы. Мы разработали нашу архитектуру так, чтобы использовать эту общую информацию», — добавляет она.
Они протестировали свою технику в нескольких смоделированных средах, в том числе в стиле складов, в некоторых со случайными препятствиями и даже в лабиринтах, имитирующих интерьеры зданий.
Выявив более эффективные группы для разгрузки, их подход, основанный на обучении, разгружает склад до четырех раз быстрее, чем сильные подходы, не основанные на обучении. Даже если они учли дополнительные вычислительные затраты на работу нейронной сети, их подход все равно решил проблему в 3,5 раза быстрее.
В будущем исследователи хотят получить простые, основанные на правилах идеи из своей нейронной модели, поскольку решения нейронной сети могут быть непрозрачными и трудными для интерпретации. Более простые методы, основанные на правилах, также может быть проще внедрять и поддерживать в реальных условиях роботизированного склада.