Создание уникальной и многообещающей исследовательской гипотезы является основополагающим навыком для любого ученого. Это также может занять много времени: новые кандидаты на получение степени доктора философии могут провести первый год своей программы, пытаясь решить, что именно исследовать в своих экспериментах. Что, если искусственный интеллект может помочь?
Исследователи MIT создали способ автономного создания и оценки перспективных исследовательских гипотез в разных областях посредством сотрудничества человека и искусственного интеллекта. В новой статье они описывают, как они использовали эту структуру для создания основанных на доказательствах гипотез, которые соответствуют неудовлетворенным исследовательским потребностям в области биологически вдохновленных материалов.
Исследование, опубликованное в журнале Advanced Materials, было проведено в соавторстве с Алирезой Гафароллахи, постдоком Лаборатории атомной и молекулярной механики (LAMM), и Маркусом Бюлером, профессором инженерии им. Джерри Макафи на кафедрах гражданского строительства и экологии и машиностроения Массачусетского технологического института, а также директором LAMM.
Фреймворк, который исследователи называют SciAgents, состоит из нескольких агентов ИИ, каждый из которых обладает определенными возможностями и доступом к данным, которые используют методы «графического рассуждения», где модели ИИ используют граф знаний , который организует и определяет отношения между различными научными концепциями. Многоагентный подход имитирует способ, которым биологические системы организуются как группы элементарных строительных блоков.
Бюлер отмечает, что принцип «разделяй и властвуй» является важной парадигмой в биологии на многих уровнях: от материалов до стай насекомых и цивилизаций — во всех примерах, где совокупный интеллект намного превосходит сумму способностей отдельных людей.
«Используя несколько агентов ИИ, мы пытаемся смоделировать процесс, посредством которого сообщества ученых совершают открытия», — говорит Бюлер. «В MIT мы делаем это, заставляя группу людей с разным опытом работать вместе и сталкиваться друг с другом в кофейнях или в бесконечном коридоре MIT. Но это очень случайно и медленно. Наша задача — смоделировать процесс открытия, исследуя, могут ли системы ИИ быть креативными и совершать открытия».
Автоматизация хороших идей
Как показали последние разработки, большие языковые модели (LLM) продемонстрировали впечатляющую способность отвечать на вопросы, обобщать информацию и выполнять простые задачи. Но они весьма ограничены, когда дело доходит до генерации новых идей с нуля. Исследователи MIT хотели разработать систему, которая позволила бы моделям ИИ выполнять более сложный, многошаговый процесс, который выходит за рамки припоминания информации, полученной во время обучения, для экстраполяции и создания новых знаний.
Основой их подхода является онтологический граф знаний, который организует и устанавливает связи между различными научными концепциями. Для создания графов исследователи вводят набор научных статей в генеративную модель ИИ.
В предыдущей работе Бюлер использовал область математики, известную как теория категорий, чтобы помочь модели ИИ разработать абстракции научных концепций в виде графов, основанных на определении отношений между компонентами, таким образом, чтобы их могли анализировать другие модели посредством процесса, называемого графовым рассуждением. Это фокусирует модели ИИ на разработке более принципиального способа понимания концепций; это также позволяет им лучше обобщать между доменами.
«Для нас очень важно создавать модели ИИ, ориентированные на науку, поскольку научные теории обычно основаны на обобщаемых принципах, а не просто на воспоминаниях о знаниях», — говорит Бюлер. «Сосредоточив модели ИИ на «мышлении» таким образом, мы можем выйти за рамки традиционных методов и исследовать более креативные способы использования ИИ».
В своей последней работе исследователи использовали около 1000 научных исследований биологических материалов, однако Бюлер утверждает, что графы знаний можно создать, используя гораздо большее или меньшее количество исследовательских работ из любой области.
Создав граф, исследователи разработали систему ИИ для научных открытий с несколькими моделями, специализированными для выполнения определенных ролей в системе. Большинство компонентов были построены на основе моделей серии ChatGPT-4 от OpenAI и использовали технику, известную как контекстное обучение, в которой подсказки предоставляют контекстную информацию о роли модели в системе, позволяя ей при этом учиться на предоставленных данных.
Отдельные агенты в фреймворке взаимодействуют друг с другом, чтобы совместно решить сложную проблему, которую никто из них не смог бы решить в одиночку. Первая задача, которую им дают, — это сгенерировать исследовательскую гипотезу. Взаимодействия LLM начинаются после того, как подграф был определен из графа знаний, что может происходить случайным образом или путем ручного ввода пары ключевых слов, обсуждаемых в статьях.
В рамках этой структуры языковая модель, которую исследователи назвали «Онтолог», призвана определять научные термины в статьях и изучать связи между ними, конкретизируя граф знаний.
Затем модель под названием «Ученый 1» создает исследовательское предложение на основе таких факторов, как его способность открывать неожиданные свойства и новизну. Предложение включает обсуждение потенциальных результатов, влияние исследования и предположение о базовых механизмах действия.
Модель «Ученый 2» расширяет идею, предлагая конкретные экспериментальные и имитационные подходы и внося другие улучшения. Наконец, модель «Критик» подчеркивает ее сильные и слабые стороны и предлагает дальнейшие улучшения.
«Речь идет о создании команды экспертов, которые не все думают одинаково», — говорит Бюлер. «Они должны думать по-разному и иметь разные возможности. Агент-критик намеренно запрограммирован на критику других, поэтому у вас нет всех, кто соглашается и говорит, что это отличная идея. У вас есть агент, который говорит: «Здесь есть слабое место, можете ли вы объяснить его лучше?» Это сильно отличает результат от отдельных моделей».
Другие агенты в системе могут осуществлять поиск в существующей литературе, что дает системе возможность не только оценивать осуществимость, но и создавать и оценивать новизну каждой идеи.
Укрепление системы
Для проверки своего подхода Бюлер и Гафароллахи построили граф знаний на основе слов «шелк» и «энергоемкий». Используя эту структуру, модель «Ученый 1» предложила интегрировать шелк с пигментами на основе одуванчика для создания биоматериалов с улучшенными оптическими и механическими свойствами. Модель предсказала, что материал будет значительно прочнее традиционных шелковых материалов и потребует меньше энергии для обработки.
Затем ученый 2 внес предложения, такие как использование определенных инструментов молекулярной динамики для изучения того, как будут взаимодействовать предлагаемые материалы, добавив, что хорошим применением для материала будет биоинспирированный клей. Затем модель Критика выделила несколько сильных сторон предлагаемого материала и области для улучшения, такие как его масштабируемость, долгосрочная стабильность и воздействие на окружающую среду использования растворителя. Чтобы решить эти проблемы, Критик предложил провести пилотные исследования для проверки процесса и выполнить строгий анализ долговечности материала.
Исследователи также провели другие эксперименты со случайно выбранными ключевыми словами, в результате которых были выдвинуты различные оригинальные гипотезы о более эффективных биомиметических микрофлюидных чипах, улучшении механических свойств каркасов на основе коллагена и взаимодействии между графеновыми и амилоидными фибриллами для создания биоэлектронных устройств.
«Система смогла предложить эти новые, строгие идеи на основе пути из графа знаний», — говорит Гафароллахи.
«С точки зрения новизны и применимости материалы кажутся надежными и новыми. В будущей работе мы собираемся сгенерировать тысячи или десятки тысяч новых исследовательских идей, а затем мы сможем классифицировать их, попытаться лучше понять, как создаются эти материалы и как их можно улучшить в дальнейшем».
В дальнейшем исследователи надеются включить в свои фреймворки новые инструменты для извлечения информации и запуска симуляций. Они также смогут легко заменить базовые модели в своих фреймворках на более продвинутые модели, что позволит системе адаптироваться к последним инновациям в области ИИ.
«Из-за особенностей взаимодействия этих агентов улучшение в одной модели, даже незначительное, оказывает огромное влияние на общее поведение и результаты работы системы», — говорит Бюлер.
После публикации препринта с открытым исходным кодом подробностей своего подхода к исследователям обратились сотни людей, заинтересованных в использовании этих фреймворков в различных научных областях и даже в таких областях, как финансы и кибербезопасность.
«Многое можно сделать, не прибегая к помощи лаборатории», — говорит Бюлер. «По сути, вы хотите приходить в лабораторию в самом конце процесса. Лаборатория стоит дорого и занимает много времени, поэтому вам нужна система, которая может очень глубоко проникать в лучшие идеи, формулировать лучшие гипотезы и точно предсказывать возникающее поведение. Наша цель — сделать это простым в использовании, чтобы вы могли использовать приложение для внесения других идей или перетаскивать наборы данных, чтобы действительно бросить вызов модели и сделать новые открытия».