Новая методика, основанная на математике 18-го века, показывает, что более простые модели ИИ не требуют глубокого обучения.
Исследователи из Университета Ювяскюля смогли упростить самую популярную технику искусственного интеллекта — глубокое обучение, используя математику 18-го века. Они также обнаружили, что классические алгоритмы обучения, созданные 50 лет назад, работают лучше, чем популярные в последнее время методы. Их более простой подход способствует развитию экологически чистых ИТ, его легче использовать и понимать.
Недавний успех искусственного интеллекта во многом основан на использовании одного основного метода: глубокого обучения . Глубокое обучение относится к методам искусственного интеллекта , при которых сети с большим количеством уровней обработки данных обучаются с использованием огромных наборов данных и значительного количества вычислительных ресурсов.
Глубокое обучение позволяет компьютерам выполнять сложные задачи , такие как анализ и генерация изображений и музыки, играть в цифровые игры и, совсем недавно, в связи с ChatGPT и другими методами генеративного искусственного интеллекта, выступать в качестве диалогового агента на естественном языке , который предоставляет высококачественное резюме существующих знаний.
Шесть лет назад профессор Томми Кярккяйнен и докторант Ян Ханнинен провели предварительные исследования по сокращению данных. Результаты оказались неожиданными: если объединить простые сетевые структуры новым способом, то глубина не понадобится. Аналогичные или даже лучшие результаты можно получить с помощью неглубоких моделей.
«Использование методов глубокого обучения — сложная и подверженная ошибкам задача, а полученные модели сложно поддерживать и интерпретировать», — говорит Кярккяйнен. «Наша новая модель в ее поверхностной форме более выразительна и может надежно сокращать большие наборы данных, сохраняя в них всю необходимую информацию».
Структура новой техники искусственного интеллекта восходит к математике XVIII века. Кярккяйнен и Ханнинен также обнаружили, что традиционные методы оптимизации 1970-х годов лучше работают при подготовке их модели по сравнению с методами глубокого обучения 21-го века.
«Наши результаты гарантируют, что использование нейронных сетей в различных приложениях стало проще и надежнее, чем раньше», — предполагает Ханнинен. Исследование опубликовано в журнале Neurocomputing.
Более простые модели ведут к более экологичному и этичному ИИ
Искусственный интеллект играет все более важную роль в современных технологиях, и поэтому становится все более важным понимать, как ИИ делает то, что он делает.
«Чем прозрачнее и проще ИИ, тем легче рассмотреть его этическое использование», — говорит Кярккяйнен. «Например, в медицинских приложениях методы глубокого обучения настолько сложны, что их прямое использование может поставить под угрозу безопасность пациентов из-за неожиданного, скрытого поведения».
Исследователи отмечают, что более простые модели могут помочь в развитии «зеленых» ИТ и более экологичны, поскольку экономят вычислительные ресурсы и потребляют значительно меньше энергии.
Результаты, которые бросают вызов общепринятым убеждениям и популярным в настоящее время представлениям о методах глубокого обучения, было трудно опубликовать.
«Глубокое обучение играет настолько заметную роль в исследованиях, разработках и бизнесе в области искусственного интеллекта, что, даже если наука всегда прогрессирует и отражает новейшие данные, само сообщество может сопротивляться изменениям».
«Нам очень интересно посмотреть, как эти результаты будут восприняты научным и деловым сообществом», — говорит Кярккяйнен. «Наш новый ИИ имеет ряд применений в наших собственных исследованиях: от нанотехнологий для улучшения материалов в устойчивой экономике до улучшения среды цифрового обучения и повышения надежности и прозрачности медицинских технологий и технологий благополучия».