Представлена роботизированная система создания эскизов

Прочитано: 408 раз(а)


Быстрое развитие алгоритмов глубокого обучения и генеративных моделей позволило автоматизировать создание все более впечатляющего художественного контента, генерируемого ИИ. Однако большая часть этого искусства, созданного ИИ, создается с помощью алгоритмов и вычислительных моделей, а не физических роботов.

Исследователи из Мадридского университета Комплутенсе (UCM) и Мадридского университета Карлоса III (UC3M) недавно разработали модель, основанную на глубоком обучении, которая позволяет роботу-гуманоиду рисовать изображения так же, как это делает человек-художник. Их статья, опубликованная в Cognitive Systems Research, предлагает замечательную демонстрацию того, как роботы могут активно участвовать в творческих процессах.

«Наша идея заключалась в том, чтобы предложить приложение для роботов, которое могло бы привлечь научное сообщество и широкую общественность», — рассказал Рауль Фернандес-Фернандес, соавтор статьи. «Мы подумали о задаче, зрелище выполнения которой могло бы шокировать, и именно так к нам пришла идея заниматься искусством с помощью робота-гуманоида».

Большинство существующих роботизированных систем , предназначенных для создания эскизов или картин, по сути работают как принтеры, воспроизводя изображения, которые ранее были созданы с помощью алгоритма. С другой стороны, Фернандес-Фернандес и его коллеги хотели создать робота, который бы использовал методы глубокого обучения с подкреплением для создания эскизов штрих за штрихом, подобно тому, как их рисуют люди.

«Цель нашего исследования заключалась не в создании приложения для рисования робота, которое могло бы создавать сложные картины, а в том, чтобы создать надежного физического робота-художника», — сказал Фернандес-Фернандес. «Мы хотели улучшить этап управления роботом при покраске роботов».

В последние несколько лет Фернандес-Фернандес и его коллеги пытались разработать продвинутые и эффективные алгоритмы для планирования действий креативных роботов. Их новая статья основана на этих недавних исследовательских усилиях, объединяя подходы, которые они считают особенно многообещающими.

«Эта работа была вдохновлена ​​двумя ключевыми предыдущими работами», — сказал Фернандес-Фернандес. «Первая из них — это одна из наших предыдущих исследовательских работ , в которой мы изучали потенциал Quick Draw! Набор данных работает для обучения роботов-маляров. Вторая работа представила Deep-Q-Learning как способ выполнения сложных траекторий, которые могут включать в себя сложные такие черты, как эмоции».

Новая роботизированная система создания эскизов, представленная исследователями, основана на системе Deep-Q-Learning, впервые представленной в предыдущей статье Чжоу и его коллег, опубликованной на arXiv . Фернандес-Фернандес и его коллеги усовершенствовали эту структуру, чтобы тщательно планировать действия роботов, позволяя им выполнять сложные ручные задачи в самых разных условиях.

« Нейронная сеть разделена на три части, которые можно рассматривать как три разные сети, связанные между собой», — объяснил Фернандес-Фернандес. «Глобальная сеть извлекает высокоуровневые функции всего холста. Локальная сеть извлекает низкоуровневые функции вокруг позиции рисования. Выходная сеть принимает в качестве входных данных функции, извлеченные сверточными слоями (из глобальной и локальной сетей) для генерации следующие позиции рисования».

Фернандес-Фернандес и его сотрудники также передали свою модель через два дополнительных канала, которые предоставляют информацию о расстоянии и инструменте рисования (т. е. положение инструмента относительно холста). В совокупности все эти функции способствовали обучению сети, улучшая ее навыки рисования эскизов. Чтобы еще больше улучшить навыки рисования в своей системе, исследователи также ввели предварительный этап обучения, основанный на так называемом генераторе случайных штрихов.

«Мы используем двойное Q-обучение, чтобы избежать проблемы переоценки, и настраиваемую функцию вознаграждения за его обучение», — сказал Фернандес-Фернандес. «В дополнение к этому мы ввели дополнительную сеть классификации эскизов для извлечения высокоуровневых характеристик эскиза и использования его результатов в качестве награды на последних этапах эпохи рисования. Эта сеть обеспечивает некоторую гибкость рисования, поскольку вознаграждение сгенерированный им, зависит не от эталонного полотна, а от категории».

Поскольку они пытались автоматизировать создание эскизов с помощью физического робота, исследователям также пришлось разработать стратегию для перевода расстояний и положений, наблюдаемых на изображениях, созданных ИИ, на холст в реальном мире. Чтобы добиться этого, они создали дискретное виртуальное пространство внутри физического холста, в котором робот мог перемещаться и напрямую перемещать позиции рисования, предусмотренные моделью.

«Я думаю, что наиболее важным достижением этой работы является внедрение передовых алгоритмов управления в реальном приложении для рисования роботов», — сказал Фернандес-Фернандес. «С помощью этой работы мы продемонстрировали, что этап управления рисованием приложений робота может быть улучшен с помощью внедрения этих алгоритмов. Мы считаем, что структуры DQN обладают возможностями и уровнем абстракции для создания оригинальных и высокоуровневых приложений, выходящих за рамки возможного. классических задач».

Недавняя работа этой группы исследователей является захватывающим примером того, как роботы могут создавать произведения искусства в реальном мире, используя действия, которые больше напоминают действия людей-художников. Фернандес-Фернандес и его коллеги надеются, что разработанная ими модель, основанная на глубоком обучении, вдохновит на дальнейшие исследования и потенциально будет способствовать внедрению политики управления, которая позволит роботам решать все более сложные задачи.

«В этом направлении мы разработали систему с использованием Deep Q-Learning для извлечения эмоций человека-демонстратора и передачи их роботу», — добавил Фернандес-Фернандес. «В этой недавней статье мы воспользовались возможностями сетей DQN по извлечению признаков, чтобы рассматривать эмоции как функцию, которую можно оптимизировать и определить в рамках вознаграждения за стандартную задачу робота, и результаты весьма впечатляют.

«В будущих работах мы стремимся представить аналогичные идеи, которые расширят возможности применения управления роботами за пределами классических задач управления роботами».

Представлена роботизированная система создания эскизов



Новости партнеров