За последние десятилетия алгоритмы компьютерного зрения стали все более совершенными, что позволяет разрабатывать сложные технологии для мониторинга конкретной среды, обнаружения интересующих объектов на видеозаписях и выявления подозрительных действий в записях видеонаблюдения. Некоторые из этих алгоритмов специально разработаны для обнаружения и изоляции движущихся объектов или людей, представляющих интерес на видео. Эта задача известна как сегментация движущихся целей.
Хотя некоторые традиционные алгоритмы сегментации движущихся целей достигли многообещающих результатов, большинство из них плохо работают в режиме реального времени (т. е. при анализе видео, которые не записаны заранее, но снимаются в настоящий момент). Поэтому некоторые исследовательские группы пытались решить эту проблему, используя альтернативные типы алгоритмов, такие как так называемые квантовые алгоритмы.
Исследователи из Нанкинского университета информационных наук и технологий и Юго-Восточного университета в Китае недавно разработали новый квантовый алгоритм для сегментации движущихся целей в видео в оттенках серого. Было обнаружено , что этот алгоритм, опубликованный в журнале Advanced Quantum Technologies, превосходит классические подходы в задачах, предполагающих анализ видеоматериалов в режиме реального времени.
«Наша предыдущая работа была посвящена алгоритмам сегментации квантовых изображений, и мы опубликовали несколько статей, но все они касаются статических целей», — рассказал Tech Xplore Вэньцзе Лю, один из исследователей, проводивших исследование. «Мы задавались вопросом, сможем ли мы дополнительно сегментировать движущиеся цели и расширить приложение от изображения до видео. Мы проверили соответствующие исследования по квантовому видео и обнаружили, что исследований в этой области недостаточно».
Алгоритм, разработанный Лю и его коллегами, использует квантово-механические процессы для быстрой сегментации движущихся целей в видео в оттенках серого. Затем этого сегментированного человека или объект можно распознать как цель и отслеживать с помощью дополнительных вычислительных методов.
«Во-первых, мы сохраняем классическое видео в оттенках серого в несколько кубитов, позволяем позициям кадра и пикселей находиться в состоянии суперпозиции и позволяем значениям оттенков серого пикселей переплетаться с ними, чтобы получить квантовое видео V k», — сказал Лю . «Затем видео смещается по кругу, чтобы получить два других новых видео, V k -1 и V k +1 , в которых положения кадров сдвинуты вперед и назад на одну единицу соответственно по сравнению с исходным видео. Эти три Видео имеют общие позиционные кубиты. Затем из двух вновь полученных видео можно выполнить операцию вычитания абсолютного значения с исходным видео, т. е. B k -1 = | V k — V k -1 |, B k +1 = | V k — V k +1 |. Затем B k -1 и B k +1 преобразуются в бинарную форму, чтобы получить b k -1 и b k +1 . b k -1 и b k +1 складываются для получения окончательного результата, а затем измерения выполняются для восстановления классического видео».
Чтобы позволить своему алгоритму различать пороговые значения и значения оттенков серого, Лю и его коллеги включили так называемый квантовый компаратор, который требует меньших вычислительных мощностей. Кроме того, команда разработала различные блоки квантовых схем, использующие меньше квантовых битов и квантовых вентилей.
«На основе этих блоков была собрана полная квантовая схема», — сказал Лю. «По сравнению с классическим аналогом мы добились экспоненциального ускорения, а сложность алгоритма также превосходит существующие квантовые алгоритмы. Позиции пикселей в изображении сохраняются в квантовых битах в состоянии суперпозиции, а затем в квантовых битах серого значения. Информация переплетается с квантовыми битами информации о положении, так что изображение или видео находится в состоянии суперпозиции. Вычислительная операция над пикселем изображения (или видео) в состоянии суперпозиции эквивалентна вычислительной операции над всем изображением ( или все видео), так что вычислительную сложность можно уменьшить в геометрической прогрессии».
Лю и его коллеги оценили свой алгоритм в серии тестов, сравнив его производительность с классическим алгоритмом сегментации движущихся целей. Их алгоритм оказался значительно быстрее классических моделей, сохраняя при этом ту же точность.
«Сложность алгоритма экспоненциально снижается по сравнению с его классическим аналогом», — сказал Лю. «Кроме того, мы разработали квантовый компаратор с меньшим количеством квантовых вентилей и кубитов, который можно использовать в любой задаче, требующей сравнения значений, и который может эффективно снизить сложность алгоритма».
В будущем алгоритм, созданный этой командой исследователей, можно будет доработать и протестировать на более реальных кадрах. Одновременно эта работа может вдохновить на разработку новых высокопроизводительных квантовых алгоритмов для других передовых приложений компьютерного зрения.
«В настоящее время наши исследования сосредоточены на том, как упростить обработку изображений в пространственной области с помощью квантовых схем, и эффект можно еще улучшить», — добавил Лю. «В будущем, чтобы получить лучшие результаты обработки, мы расширим наши исследования до обработки изображений с помощью квантовых нейронных сетей. Кроме того, существующие квантовые технологии не могут реализовать использование крупномасштабных кубитов в краткосрочной перспективе, поэтому гибридные классические квантовая нейронная сеть также является лучшим выбором».