Искусственный интеллект поможет беспилотным автомобилям не простаивать на красный свет

Прочитано: 170 раз(а)


Никто не любит сидеть на красный свет. Но регулируемые перекрестки — это не просто мелкая неприятность для водителей; транспортные средства потребляют топливо и выделяют парниковые газы, ожидая смены светофора.

Что, если бы водители могли планировать свои поездки таким образом, чтобы приезжать на перекресток на зеленый свет? Хотя это может быть просто счастливой случайностью для водителя-человека, этого можно добиться более последовательно с помощью автономного транспортного средства , которое использует искусственный интеллект для управления своей скоростью.

В новом исследовании исследователи из Массачусетского технологического института демонстрируют подход машинного обучения , который может научиться управлять парком автономных транспортных средств, когда они приближаются и проезжают через сигнальный перекресток таким образом, чтобы обеспечить бесперебойное движение транспорта.

Используя моделирование, они обнаружили, что их подход снижает расход топлива и выбросы при одновременном повышении средней скорости автомобиля. Этот метод дает наилучшие результаты, если все автомобили на дороге являются автономными, но даже если только 25% используют свой алгоритм управления , это все равно приводит к существенным преимуществам в топливе и выбросах.

«Это действительно интересное место для вмешательства. Ничья жизнь не стала лучше, потому что они застряли на перекрестке. При многих других вмешательствах в области изменения климата ожидается разница в качестве жизни, поэтому существует барьер. для входа туда. Здесь барьер намного ниже», — говорит старший автор Кэти Ву, доцент кафедры развития карьеры Гилберта Уинслоу на факультете гражданского и экологического проектирования и член Института данных, систем и общества ( IDSS) и Лаборатория систем информации и принятия решений (LIDS).

Ведущим автором исследования является Виндула Джаявардана, аспирант LIDS и факультета электротехники и компьютерных наук. Исследование будет представлено на Европейской конференции по контролю.

Сложности пересечения

В то время как люди могут проезжать мимо зеленого сигнала светофора , не задумываясь об этом, перекрестки могут представлять собой миллиарды различных сценариев в зависимости от количества полос движения, того, как работают сигналы, количества транспортных средств и их скоростей, присутствия пешеходов и велосипедистов и т. д.

Типичные подходы к решению проблем управления перекрестком используют математические модели для решения одного простого идеального перекрестка. Это выглядит хорошо на бумаге, но, скорее всего, не будет работать в реальном мире, где схемы трафика часто настолько беспорядочны, насколько это возможно.

Ву и Джаявардана переключили передачу и подошли к проблеме, используя технику без моделей, известную как глубокое обучение с подкреплением . Обучение с подкреплением — это метод проб и ошибок, когда алгоритм управления учится принимать последовательность решений. Он вознаграждается, когда находит хорошую последовательность. При глубоком обучении с подкреплением алгоритм использует предположения, полученные нейронной сетью , чтобы найти ярлыки для хороших последовательностей, даже если есть миллиарды возможностей.

Это полезно для решения такой проблемы дальнего горизонта; Алгоритм управления должен выдавать транспортному средству более 500 инструкций по ускорению в течение длительного периода времени, объясняет Ву.

«И мы должны получить правильную последовательность, прежде чем мы узнаем, что проделали хорошую работу по снижению выбросов и добрались до перекрестка на хорошей скорости», — добавляет она.

Но есть дополнительная морщинка. Исследователи хотят, чтобы система научилась стратегии, которая снижает расход топлива и ограничивает влияние на время в пути . Эти цели могут противоречить друг другу.

«Чтобы сократить время в пути, мы хотим, чтобы машина ехала быстро, но чтобы уменьшить выбросы, мы хотим, чтобы машина замедлялась или вообще не двигалась. Эти конкурирующие вознаграждения могут сбивать с толку обучающегося агента», — говорит Ву.

Хотя решить эту проблему в целом сложно, исследователи использовали обходной путь, используя технику, известную как формирование вознаграждения. С формированием вознаграждения они дают системе некоторые знания в предметной области, которые она не может изучить самостоятельно. В этом случае они наказывали систему всякий раз, когда автомобиль полностью останавливался, чтобы он научился избегать этого действия.

Тесты трафика

После того, как они разработали эффективный алгоритм управления, они оценили его с помощью платформы моделирования дорожного движения с одним перекрестком. Алгоритм управления применяется к парку подключенных автономных транспортных средств, которые могут связываться с предстоящим светофором, чтобы получать информацию о фазе и времени сигнала и наблюдать за своим ближайшим окружением. Алгоритм управления сообщает каждому транспортному средству, как ускоряться и замедляться.

Их система не создавала остановку движения при приближении транспортных средств к перекрестку. (Движение с остановками происходит, когда автомобили вынуждены полностью останавливаться из-за остановившегося впереди движения). В симуляциях больше автомобилей прошло за одну зеленую фазу, что превзошло модель, имитирующую людей-водителей. По сравнению с другими методами оптимизации, также предназначенными для предотвращения частых остановок, их метод привел к большему расходу топлива и сокращению выбросов. Если каждое транспортное средство на дороге будет автономным, их система управления может снизить расход топлива на 18 % и выбросы углекислого газа на 25 %, при этом повысив скорость движения на 20 %.

«Единичное вмешательство, позволяющее сократить расход топлива или выбросы на 20–25 %, — это действительно невероятно. Но то, что я нахожу интересным и действительно надеялся увидеть, — это нелинейное масштабирование. Если мы контролируем только 25 % транспортных средств, это дает нам 50 % преимуществ с точки зрения снижения расхода топлива и выбросов. Это означает, что нам не нужно ждать, пока мы доберемся до 100 % автономных транспортных средств, чтобы получить преимущества от такого подхода», — говорит она.

В будущем исследователи хотят изучить эффекты взаимодействия между несколькими перекрестками. Они также планируют изучить, как различные настройки перекрестков (количество полос движения, светофоры, время и т. д.) могут влиять на время в пути, выбросы и расход топлива . Кроме того, они намерены изучить, как их система управления может повлиять на безопасность, когда автономные транспортные средства и водители-люди делят дорогу. Например, несмотря на то, что автономные транспортные средства могут водить не так, как водители-люди, более медленные дороги и дороги с более постоянной скоростью могут повысить безопасность, говорит Ву.

Хотя эта работа все еще находится на ранней стадии, Ву считает, что этот подход может быть реализован в ближайшем будущем.

«Цель этой работы — продвинуть вперед устойчивую мобильность. Мы тоже хотим мечтать, но эти системы — большие монстры инерции. поднимает меня по утрам», — говорит она.

Искусственный интеллект поможет беспилотным автомобилям не простаивать на красный свет



Новости партнеров