Машинное обучение исследует вопросы материаловедения и решает сложные задачи поиска

Используя вычислительные ресурсы Национального научно-вычислительного центра энергетических исследований (NERSC) в Национальной лаборатории Лоуренса в Беркли (Berkeley Lab), исследователи из Аргоннской национальной лаборатории преуспели в изучении важных вопросов материаловедения и продемонстрировали прогресс в использовании машинного обучения для решения сложных поисковых задач.

Адаптировав алгоритм машинного обучения из настольных игр , таких как AlphaGo, исследователи разработали силовые поля для нанокластеров из 54 элементов периодической таблицы, что стало значительным шагом к пониманию их уникальных свойств и подтверждению концепции их метода поиска. Команда опубликовала свои результаты в Nature Communications в январе.

В зависимости от их масштаба — объемные системы более 100 нанометров по сравнению с нанокластерами размером менее 100 нанометров — материалы могут демонстрировать совершенно разные свойства, включая оптические и магнитные свойства, дискретные уровни энергии и усиленную фотолюминесценцию. Эти свойства могут найти новые применения в науке и промышленности, и ученые могут узнать о них, разрабатывая силовые поля — вычислительные модели, которые оценивают потенциальные энергии между атомами в молекуле и между молекулами — для каждого элемента или соединения. Но ученые-материаловеды могут потратить годы, используя традиционные методы, основанные на физике, для изучения структур и сил между атомами в нанокластерах одного элемента.

«Мы хотели изучить динамику в наномасштабе, и для этого обычно мы использовали квантовое исчисление и теорию функционала плотности, но это очень дорогие расчеты в вычислительном отношении», — сказал материаловед Сукрити Манна, главный автор статьи. кропотливая работа по поиску и нахождению параметров потенциальных моделей.

Применение машинного обучения — один из возможных способов сократить эти расходы. Однако доступные алгоритмы исходят из дискретных пространств поиска, таких как игры, где количество ветвей поиска и возможных результатов конечно. В пространстве непрерывного действия, таком как силовые поля для нанокластеров химических элементов, количество возможных ветвей поиска бесконечно, и грубая сила — возможность запустить каждый сценарий, чтобы найти наилучший результат — просто не работает.

Работать умнее, а не больше

Чтобы существующий алгоритм работал умнее, а не сложнее, специалист по машинному обучению Трой Леффлер использовал тип обучения с подкреплением .называется поиском по дереву Монте-Карло (MCTS). Обучение с подкреплением — это форма машинного обучения, которая позволяет алгоритму напрямую взаимодействовать со своей средой, обучаясь через наказание и вознаграждение, с целью получения максимального кумулятивного вознаграждения с течением времени. MCTS использует метод «исследуй и используй» — сначала поиск случайным образом, затем обучение игнорирует менее продуктивные пути поиска или воспроизведения и сосредотачивается на более продуктивных. Лёффлер также представил несколько новых функций, чтобы сделать алгоритм более эффективным: функцию уникальности для устранения избыточных поисков, схему масштабирования окна, чтобы соотнести глубину дерева с пространством действий, чтобы обеспечить полезную часть структуры, и расширение воспроизведения, которое учит алгоритм для приоритизации случайных поисков, которые были ближе к тому, что уже доказало свою эффективность.

«Большая часть работы, которую мы проделали, на самом деле заключалась в разработке алгоритма для пространств с непрерывным действием, где у вас нет красивых, дискретных пространств для настольных игр; у вас есть параметры, которые могут перемещаться в любом месте на конкретном ландшафте», — сказал Леффлер. «Основная идея заключается в том, что вы используете комбинацию полной случайности и немного детерминированного элемента с ИИ, чтобы понять это».

Комбинация сработала, дав силовые поля для 54 элементов за долю времени, которое раньше потребовалось бы для поиска параметров только для одного элемента, и доказав, что обучение с подкреплением может быть полезным инструментом в пространствах с непрерывным действием.

Команда использовала суперкомпьютер Cori в NERSC для выполнения своих расчетов и создания наборов данных для обучения и подбора, в основном с использованием программного обеспечения Vienna Ab initio Simulation Package (VASP) для моделирования материалов атомного масштаба и классического кода молекулярной динамики LAMMPS. Этот проект — лишь один из многих проектов NERSC, осуществляемых группой теории и моделирования в Аргонне, которые часто используют преимущества вычислительной мощности NERSC, минимальных очередей и надежного обслуживания.

«Для таких элементов, как углерод, бор и фосфор, нам требуется много наборов данных, и мы требуем хорошего качества, и для этой конкретной работы я использую NERSC для создания тонн огромных наборов данных из-за их структурного разнообразия. Cori — очень быстрый компьютер. , и когда я им пользовался, время в очереди было очень коротким, поэтому мы сделали эту работу очень быстро», — сказал Манна. Кроме того, по его словам, «если у нас есть 100% рабочей нагрузки, в отношении вычислительного времени мы зависим от NERSC в отношении 90% этой рабочей нагрузки».

С ним согласен специалист по машинному обучению Рохит Батра, разработавший систему машинного обучения для анализа тенденций ошибок в потенциальных функциях в периодической таблице. «Я большой поклонник Cori — я использую его для нескольких целей», — сказал он. «Он очень хорошо обслуживается. Иногда в других кластерах могут возникать проблемы, из-за которых они отключаются на некоторое время, но я думаю, что NERSC очень хорошо обслуживается и в этом отношении очень надежен».

Будущее MCTS идет глубоко и широко

Теперь, когда продемонстрировано использование MCTS в пространстве непрерывного поиска, что дальше? С точки зрения материаловедения предстоит еще много работы по изучению более сложных материалов.

«С точки зрения применения, с точки зрения разработки силового поля, мы исследовали элементный материал и несколько бинарных сплавов, поэтому в ближайшем будущем мы рассмотрим комбинации, такие как оксиды и сульфиты, и разработаем эти силовые поля», — сказал Манна. . «Благодаря мощному алгоритму все, что нам нужно, — это время и другие наборы обучающих данных».

Но материаловедение — не единственное приложение MCTS, открытое этой работой, и часть следующего этапа включает в себя проверку широты и границ полезности алгоритма.

«Мы принимаем MCTS и применяем его во множестве различных ситуаций, — сказал Леффлер. «У нас есть 10 или 11 различных проектов, в которых мы или наши сотрудники заинтересованы в использовании алгоритма», включая дальнейшие исследования, ориентированные на игры, и дополнительную настройку силового поля. Он добавил, что пока этот процесс увенчался успехом, и его будущее выглядит радужным. «Мы ищем много вещей, чтобы попробовать это. Но пока все, что мы пробовали, работало невероятно хорошо».