Разработан подход к решению задач оптимизации с использованием машин Больцмана

Машины Изинга — это нетрадиционные компьютерные архитектуры, основанные на физических принципах, названные в честь немецкого физика Эрнста Изинга. В последние годы они оказались особенно многообещающими инструментами для решения задач комбинаторной оптимизации (КО) и создания искусственных моделей мозга.

Группа исследователей в группе Сайефа Салахуддина, выдающегося профессора TSMC в области EECS в Калифорнийском университете в Беркли, недавно изучала потенциал машин Изинга для глубокого поиска решений сложных задач оптимизации . В их последней статье, опубликованной в журнале Nature Electronics , была представлена новая машина Изинга, состоящая из множества ограниченных машин Больцмана (УБМ), которая, как было обнаружено, достигает замечательных результатов в сложных задачах комбинаторной оптимизации.

«В последние годы было проделано много работы с машинами Изинга для ускорения задач оптимизации, на которых основана наша работа», — сказал TechXplore Сааван Патель, ведущий автор, проводивший исследование. «Главная цель нашего исследования состояла в том, чтобы показать, как машинное обучение и аппаратное ускорение могут вписаться в структуру машин Изинга и ускорить решение задач оптимизации способом, вдохновленным цифровой логикой».

Ограниченные машины Больцмана (RBM) — это генеративные стохастические модели, основанные на искусственных нейронных сетях. Эти модели могут очень хорошо фиксировать сложные корреляции и закономерности распределения в больших объемах входных данных.

RBM полагаются на бинарные активации, обходя прямое умножение матрицы на вектор, которое обычно является наиболее требовательным к вычислительным ресурсам для сетей глубокого обучения. В своем исследовании Патель и его коллеги использовали эту уникальную характеристику моделей, чтобы увеличить скорость, с которой их машина могла решать задачи оптимизации.

«Наш алгоритм работает, используя основные принципы цифровой логики по-новому», — объяснил Патель. «Обычно цифровые ворота работают только в прямом направлении, но, используя вероятностные графические модели и машинное обучение, мы показали способы их работы в обратном направлении. Используя этот принцип, мы разрабатываем наши вероятностные цифровые схемы таким образом, чтобы они могли решить прямое проблема («Является ли этот набор входных данных допустимым решением?» или «Что такое 191 x 223?»), но, поскольку система обратима, она также может ответить на гораздо более сложную обратную задачу («Каковы все наборы входных данных, которые дать правильное решение?» и «Какие А и В такие, что А х В = 42593?»)».

Разработанная ими машина позволила Пателю и его коллегам решить множество различных задач оптимизации. По сути, их схема работает, сначала оценивая различные существующие решения, а затем пытаясь определить новые решения. В отличие от других ранее предложенных решений, платформа исследователей сочетает в себе подходы к отображению проблем, машинное обучение и аппаратные решения.

«Используя наш цифровой логический подход, мы смогли показать, что можем решать два типа «сложных» задач», — сказал Патель. «Первая — это логическая выполнимость, которая составляет основу задач комбинаторной оптимизации, а вторая — проблема целочисленной факторизации, которая является основой алгоритма шифрования RSA, используемого современными компьютерами. Цель состояла в том, чтобы показать, что этот инструмент работает, и мы показали, что можем решать более крупные задачи факторизации, чем предложенные ранее методы».

При первоначальных оценках машина, созданная этой группой исследователей, показала весьма многообещающие результаты, решая сложные задачи комбинаторной оптимизации и целочисленной факторизации. Кроме того, вспомогательное оборудование, представленное в статье, могло находить решения проблем в 10 000 раз быстрее, чем обычный ЦП.

В будущем машины Изинга, подобные той, которую представил Пател и его коллеги, можно будет использовать для более быстрого и эффективного решения широкого круга сложных реальных проблем, включая проблемы, связанные с логистикой или производством, проблемами маршрутизации и взломом криптографии. В своих следующих исследованиях исследователи попытаются увеличить масштаб своей машины, чтобы она могла выполнять все более крупные и сложные задачи оптимизации. Кроме того, они хотели бы оценить его потенциал для решения других типов задач.

«Мы разрабатываем более крупные и эффективные системы FPGA для решения более крупных задач, а также ASIC», — добавил Патель. «Что касается новых проблемных областей, мы исследовали отображения для задач маршрутизации (таких как задача коммивояжёра), коммуникационных проблем (таких как кодирование LDPC), квантовых задач (таких как поиск основного состояния молекулярных систем) и других задач оптимизации ( например, решения для задач MAX-CUT). Для этих систем открывается много новых возможностей, и мы рады исследовать новые области! Наша цель — всегда решать более сложные задачи быстрее и с большей энергоэффективностью».