Разрабатывается движок, способный распутывать визуальные атрибуты объектов

Большинство людей врожденно способны идентифицировать отдельные атрибуты сенсорных стимулов, например объекты, которые они видят, звуки, которые они слышат, и так далее. Хотя инструменты искусственного интеллекта (ИИ) все лучше распознают определенные объекты на изображениях или других стимулах, они часто не в состоянии выделить их индивидуальные атрибуты (например, их цвет, размер и т. д.).

Исследователи из IBM Research Zürich и ETH Zürich недавно разработали вычислительно эффективный механизм, который расшифровывает отдельные атрибуты визуального стимула. Этот двигатель, представленный в статье в журнале Nature Nanotechnology, в конечном итоге может помочь быстрее и эффективнее решать сложные реальные проблемы.

«Мы работали над разработкой концепции нейро-векторно-символической архитектуры (NVSA) , которая предлагает как возможности восприятия, так и рассуждения в единой структуре», — сказал Tech Xplore Аббас Рахими, один из исследователей, проводивших исследование. «В NVSA визуальное восприятие частично осуществляется глубокой сетью, в которой результирующие представления запутаны сложным образом, что может подходить для конкретной задачи, но затрудняет обобщение на несколько иные ситуации. Например, запутанное представление «маленький красный треугольник» не может раскрыть такие концептуальные признаки объекта, как его цвет, размер, тип и т. д.».

Чтобы преодолеть ограничения существующих архитектур NVSA, Рахими и его коллеги решили создать новый движок, который мог бы разделять визуальные представления объектов на изображениях, представляя их атрибуты отдельно. Этот движок, получивший название «факторизатор в памяти», основан на варианте рекуррентных нейронных сетей, называемых резонаторными сетями, которые могут итеративно решать особую форму задачи факторизации.

«В этой элегантной математической форме значения атрибутов и их запутанность представлены в виде многомерных голографических векторов», — объяснил Рахими. «Они голографичны, потому что закодированная информация равномерно распределена по всем компонентам вектора. В резонаторных сетях операторы векторно-символических архитектур итеративно манипулируют этими голографическими представлениями для решения проблемы факторизации».

Резонаторная сеть — это тип рекуррентной нейронной сети, предназначенной для решения задач факторизации (т. е. задач, связанных с разбиением одного целого числа на более мелкие множители, которые при умножении дают исходное число). Хотя резонаторные сети оказались эффективными для решения многих простых задач факторизации, они обычно страдают двумя ключевыми ограничениями.

Во-первых, эти сети уязвимы для входа в «бесконечный цикл поиска», явление, известное как предельные циклы. Кроме того, резонаторные сети часто не могут быстро и эффективно решать большие задачи, включающие несколько факторов. Двигатель, созданный Рахими и его коллегами, устраняет и преодолевает оба этих ограничения.

«Наш факторизатор в памяти обогащает сети резонаторов на оборудовании аналоговых вычислений в памяти (AIMC), естественным образом используя собственный шум мемристивного устройства, чтобы предотвратить застревание сетей резонаторов в предельных циклах», — сказал Рахими. «Эта внутренняя стохастичность устройства, основанная на материале с фазовым переходом, модернизирует детерминированную сеть резонаторов до сети стохастических резонаторов, позволяя выполнять зашумленные вычисления на каждой отдельной итерации. Кроме того, наш факторизатор в памяти вводит пороговые нелинейные активации и обнаружение конвергенции».

В рамках своего недавнего исследования исследователи создали прототип своего движка, используя два вычислительных чипа в памяти. Эти чипы были основаны на мемристивных устройствах с фазовым переходом, многообещающих системах, которые могут выполнять как вычисления, так и хранить информацию.

«Экспериментальная аппаратная установка AIMC содержит два ядра памяти с фазовым переходом, каждое с 256 × 256 элементарными ячейками для выполнения умножения матрицы на вектор (MVM) и транспонированного MVM с высокой степенью параллелизма и за постоянное время», — сказал Рахими. «По сути, наш факторизатор в памяти снижает вычислительную сложность векторной факторизации до простого количества итераций».

В первоначальных оценках факторизатор в памяти, созданный Рахими и его коллегами, добился многообещающих результатов, решая задачи как минимум в пять раз более масштабные и сложные, чем те, которые можно было решить с помощью обычной системы на основе резонаторных цепей . Примечательно, что их движок также может решать эти проблемы быстрее и потреблять меньше вычислительной мощности.

«Прорывным открытием нашего исследования является то, что неизбежная стохастичность, присутствующая в оборудовании AIMC, — это не проклятие, а благословение», — сказал Рахими. «В сочетании с методами пороговой обработки эта стохастичность может проложить путь к решению как минимум на пять порядков более крупных комбинаторных задач, которые ранее были неразрешимы в данных ограничениях».

В будущем новый механизм факторизации, созданный этой группой исследователей, можно будет использовать для надежного распутывания отдельных визуальных атрибутов объектов на изображениях, снятых камерами или другими датчиками. Его также можно применять к другим сложным задачам факторизации, открывая новые захватывающие направления в исследованиях ИИ.

«Огромное количество дорогостоящих в вычислительном отношении операций MVM, задействованных во время факторизации, ускоряется нашим факторизатором в памяти», — добавил Рахими. «Далее мы планируем спроектировать и протестировать крупномасштабное оборудование AIMC, способное выполнять более крупные MVM».