Быстрое развитие алгоритмов глубокого обучения и генеративных моделей позволило автоматизировать создание все более впечатляющего художественного контента, генерируемого ИИ. Однако большая часть этого искусства, созданного ИИ, создается с помощью алгоритмов и вычислительных моделей, а не физических роботов.
Исследователи из Мадридского университета Комплутенсе (UCM) и Мадридского университета Карлоса III (UC3M) недавно разработали модель, основанную на глубоком обучении, которая позволяет роботу-гуманоиду рисовать изображения так же, как это делает человек-художник. Их статья, опубликованная в Cognitive Systems Research, предлагает замечательную демонстрацию того, как роботы могут активно участвовать в творческих процессах.
«Наша идея заключалась в том, чтобы предложить приложение для роботов, которое могло бы привлечь научное сообщество и широкую общественность», — рассказал Рауль Фернандес-Фернандес, соавтор статьи. «Мы подумали о задаче, зрелище выполнения которой могло бы шокировать, и именно так к нам пришла идея заниматься искусством с помощью робота-гуманоида».
Большинство существующих роботизированных систем , предназначенных для создания эскизов или картин, по сути работают как принтеры, воспроизводя изображения, которые ранее были созданы с помощью алгоритма. С другой стороны, Фернандес-Фернандес и его коллеги хотели создать робота, который бы использовал методы глубокого обучения с подкреплением для создания эскизов штрих за штрихом, подобно тому, как их рисуют люди.
«Цель нашего исследования заключалась не в создании приложения для рисования робота, которое могло бы создавать сложные картины, а в том, чтобы создать надежного физического робота-художника», — сказал Фернандес-Фернандес. «Мы хотели улучшить этап управления роботом при покраске роботов».
В последние несколько лет Фернандес-Фернандес и его коллеги пытались разработать продвинутые и эффективные алгоритмы для планирования действий креативных роботов. Их новая статья основана на этих недавних исследовательских усилиях, объединяя подходы, которые они считают особенно многообещающими.
«Эта работа была вдохновлена двумя ключевыми предыдущими работами», — сказал Фернандес-Фернандес. «Первая из них — это одна из наших предыдущих исследовательских работ , в которой мы изучали потенциал Quick Draw! Набор данных работает для обучения роботов-маляров. Вторая работа представила Deep-Q-Learning как способ выполнения сложных траекторий, которые могут включать в себя сложные такие черты, как эмоции».
Новая роботизированная система создания эскизов, представленная исследователями, основана на системе Deep-Q-Learning, впервые представленной в предыдущей статье Чжоу и его коллег, опубликованной на arXiv . Фернандес-Фернандес и его коллеги усовершенствовали эту структуру, чтобы тщательно планировать действия роботов, позволяя им выполнять сложные ручные задачи в самых разных условиях.
« Нейронная сеть разделена на три части, которые можно рассматривать как три разные сети, связанные между собой», — объяснил Фернандес-Фернандес. «Глобальная сеть извлекает высокоуровневые функции всего холста. Локальная сеть извлекает низкоуровневые функции вокруг позиции рисования. Выходная сеть принимает в качестве входных данных функции, извлеченные сверточными слоями (из глобальной и локальной сетей) для генерации следующие позиции рисования».
Фернандес-Фернандес и его сотрудники также передали свою модель через два дополнительных канала, которые предоставляют информацию о расстоянии и инструменте рисования (т. е. положение инструмента относительно холста). В совокупности все эти функции способствовали обучению сети, улучшая ее навыки рисования эскизов. Чтобы еще больше улучшить навыки рисования в своей системе, исследователи также ввели предварительный этап обучения, основанный на так называемом генераторе случайных штрихов.
«Мы используем двойное Q-обучение, чтобы избежать проблемы переоценки, и настраиваемую функцию вознаграждения за его обучение», — сказал Фернандес-Фернандес. «В дополнение к этому мы ввели дополнительную сеть классификации эскизов для извлечения высокоуровневых характеристик эскиза и использования его результатов в качестве награды на последних этапах эпохи рисования. Эта сеть обеспечивает некоторую гибкость рисования, поскольку вознаграждение сгенерированный им, зависит не от эталонного полотна, а от категории».
Поскольку они пытались автоматизировать создание эскизов с помощью физического робота, исследователям также пришлось разработать стратегию для перевода расстояний и положений, наблюдаемых на изображениях, созданных ИИ, на холст в реальном мире. Чтобы добиться этого, они создали дискретное виртуальное пространство внутри физического холста, в котором робот мог перемещаться и напрямую перемещать позиции рисования, предусмотренные моделью.
«Я думаю, что наиболее важным достижением этой работы является внедрение передовых алгоритмов управления в реальном приложении для рисования роботов», — сказал Фернандес-Фернандес. «С помощью этой работы мы продемонстрировали, что этап управления рисованием приложений робота может быть улучшен с помощью внедрения этих алгоритмов. Мы считаем, что структуры DQN обладают возможностями и уровнем абстракции для создания оригинальных и высокоуровневых приложений, выходящих за рамки возможного. классических задач».
Недавняя работа этой группы исследователей является захватывающим примером того, как роботы могут создавать произведения искусства в реальном мире, используя действия, которые больше напоминают действия людей-художников. Фернандес-Фернандес и его коллеги надеются, что разработанная ими модель, основанная на глубоком обучении, вдохновит на дальнейшие исследования и потенциально будет способствовать внедрению политики управления, которая позволит роботам решать все более сложные задачи.
«В этом направлении мы разработали систему с использованием Deep Q-Learning для извлечения эмоций человека-демонстратора и передачи их роботу», — добавил Фернандес-Фернандес. «В этой недавней статье мы воспользовались возможностями сетей DQN по извлечению признаков, чтобы рассматривать эмоции как функцию, которую можно оптимизировать и определить в рамках вознаграждения за стандартную задачу робота, и результаты весьма впечатляют.
«В будущих работах мы стремимся представить аналогичные идеи, которые расширят возможности применения управления роботами за пределами классических задач управления роботами».