Разрабатывается ИИ, который сможет чувствовать и иметь эмоции

Прочитано: 439 раз(а)


Системы искусственного интеллекта с эмоциональным интеллектом могут учиться быстрее и быть более полезными.

Были ли вы за последний год в стрессе? Вы когда-нибудь хотели помочь справиться с ситуацией? Представьте себе, если бы на протяжении всей пандемии у вас был виртуальный терапевт, работающий на системе искусственного интеллекта (ИИ), сущность, которая сочувствовала вам и постепенно узнавала ваше настроение и поведение.

Терапия — это лишь одна из областей, в которой, по нашему мнению, система искусственного интеллекта, способная распознавать и интерпретировать эмоции, может принести людям большую пользу.

Системы искусственного интеллекта с эмоциональным интеллектом могут учиться быстрее и быть более полезными

Наша команда происходит из группы Microsoft Human Understanding and Empathy , наша миссия — наполнить технологии эмоциональным интеллектом. Почему? Благодаря этому качеству ИИ может лучше понимать своих пользователей, более эффективно общаться с ними и улучшать их взаимодействие с технологиями.

Усилия по созданию эмоционально интеллектуального ИИ основаны на работе в области психологии, нейробиологии, взаимодействия человека с компьютером, лингвистики, электротехники и машинного обучения.

В последнее время мы думаем о том, как улучшить голосовых помощников с ИИ, таких как Alexa и Siri, которые сейчас многие люди используют в качестве повседневных помощников. Мы ожидаем, что вскоре они будут применены в автомобилях, больницах, магазинах, школах и т. Д., Где они обеспечат более персонализированное и значимое взаимодействие с технологиями. Но чтобы реализовать свой потенциал, таким голосовым помощникам потребуется серьезный толчок в области эффективных вычислений.

Этот термин, введенный профессором Массачусетского технологического института Розалинд У. Пикард в одноименной книге 1997 года, относится к технологиям, которые могут ощущать, понимать и даже моделировать человеческие эмоции. Голосовые помощники с эмоциональным интеллектом должны быть более естественными и эффективными, чем голосовые помощники без него.

Подумайте, как такой агент ИИ может помочь человеку, который перегружен стрессом. В настоящее время лучшим вариантом может быть посещение настоящего психолога-человека, который после серии дорогостоящих консультаций обсудит ситуацию и обучит соответствующим навыкам управления стрессом. Во время сеансов терапевт будет постоянно оценивать ответы человека и использовать эту информацию для формирования обсуждаемого, адаптируя как содержание, так и представление, чтобы обеспечить наилучший результат.

Хотя это лечение, возможно, является лучшим из существующих методов лечения, и хотя технологии все еще далеки от того, чтобы воспроизвести этот опыт, для некоторых он не идеален. Например, некоторые люди чувствуют себя некомфортно, обсуждая свои чувства с терапевтами, а некоторые находят этот процесс стигматизирующим или требующим много времени. Терапевт искусственного интеллекта может предоставить им альтернативный способ поддержки, а также будет проводить более частые и персонализированные оценки. В одной из недавних обзорных статей было обнаружено, что 1 миллиард человек во всем мире страдают психическими и аддиктивными расстройствами ; масштабируемое решение, такое как виртуальный консультант, может стать огромным благом.

Есть некоторые свидетельства того, что люди могут чувствовать себя более заинтересованными и с большей готовностью раскрывать конфиденциальную информацию, когда они разговаривают с машиной. Другое исследование, однако, показало, что люди, ищущие эмоциональной поддержки на онлайн-платформе, предпочитают ответы, исходящие от людей, а не от машины, даже если контент одинаков. Ясно, что нам нужны дополнительные исследования в этой области.

Около 1 миллиарда человек во всем мире страдают психическими расстройствами; масштабируемое решение, такое как терапевт с искусственным интеллектом, может стать огромным благом.

В любом случае терапевт с искусственным интеллектом предлагает ключевое преимущество: он всегда будет доступен. Таким образом, он может оказать решающую поддержку в неожиданные моменты кризиса или воспользоваться теми моментами, когда человек находится в настроении для более аналитического разговора. Он потенциально мог бы собрать гораздо больше информации о поведении человека, чем человек-терапевт мог бы посредством спорадических сеансов, и он мог бы служить напоминаниями, чтобы держать человека на правильном пути.

А поскольку пандемия значительно расширила распространение методов телездравоохранения, люди вскоре могут найти для себя вполне нормальным получать указания от агента на экране компьютера или телефона.

Однако, для того, чтобы такой виртуальный терапевт был эффективным, потребуется значительный эмоциональный интеллект. Ему нужно будет чувствовать и понимать предпочтения пользователя и колебания эмоционального состояния, чтобы оптимизировать свое общение. В идеале он также имитировал бы определенные эмоциональные реакции, чтобы способствовать сочувствию и лучше мотивировать человека.

Виртуальный терапевт — не новое изобретение. Самый первый пример произошел в 1960-х годах, когда Джозеф Вейценбаум из Массачусетского технологического института написал сценарии для своей программы обработки естественного языка ELIZA , которая часто повторяла им слова пользователей в значительно упрощенной симуляции психотерапии. Более серьезная работа в 2000-х годах в Институте творческих технологий Университета Южной Калифорнии привела к созданию SimSensei , виртуального человека, изначально предназначенного для консультирования военнослужащих. Сегодня наиболее известным примером может быть Woebot , бесплатный чат-бот, который предлагает разговоры на основе когнитивно-поведенческой терапии . Но предстоит пройти еще долгий путь, прежде чем мы увидим системы искусственного интеллекта, которые действительно понимают сложность человеческих эмоций.

Наша группа проводит фундаментальную работу, которая приведет к созданию таких сложных машин. Мы также изучаем, что может случиться, если мы создадим системы ИИ, которые будут мотивированы чем-то, напоминающим человеческие эмоции. Мы утверждаем, что такой сдвиг выведет и без того впечатляющие возможности современного ИИ на новый уровень.

Всего десять лет назад для эффективных вычислений требовалось специальное оборудование и программное обеспечение, что, в свою очередь, требовало для работы кого-то с продвинутой технической степенью. Эти ранние системы обычно включали неуклюжие большие датчики и громоздкие провода, которые могли легко повлиять на эмоциональные переживания пользователей.

Сегодня высококачественные сенсоры крошечные и беспроводные, что позволяет ненавязчиво оценивать эмоциональное состояние человека. Мы также можем использовать мобильные телефоны и носимые устройства для изучения внутреннего человеческого опыта в реальных условиях, когда эмоции действительно имеют значение. И вместо коротких лабораторных экспериментов с небольшими группами людей теперь мы можем изучать эмоции с течением времени и собирать данные из больших популяций, так сказать, «в дикой природе».

Чтобы предсказать чье-то эмоциональное состояние, лучше всего комбинировать показания. В этом примере программное обеспечение, которое анализирует мимику, обнаруживает визуальные подсказки, отслеживая тонкие движения мышц, которые могут указывать на эмоции (1). Физиологический монитор определяет частоту сердечных сокращений (2), а программное обеспечение распознавания речи расшифровывает слова человека и извлекает особенности из звука (3), такие как эмоциональный тон речи.
Чтобы предсказать чье-то эмоциональное состояние, лучше всего комбинировать показания. В этом примере программное обеспечение, которое анализирует мимику, обнаруживает визуальные подсказки, отслеживая тонкие движения мышц, которые могут указывать на эмоции (1). Физиологический монитор определяет частоту сердечных сокращений (2), а программное обеспечение распознавания речи расшифровывает слова человека и извлекает особенности из звука (3), такие как эмоциональный тон речи.

Более ранние исследования в области аффективных вычислений обычно измеряли эмоциональные реакции с помощью одного параметра, такого как частота сердечных сокращений или тон голоса, и проводились в искусственных лабораторных условиях. Благодаря значительным достижениям в области искусственного интеллекта, включая автоматическое распознавание речи, распознавание сцен и объектов, а также отслеживание лиц и тела, сегодня исследователи могут добиться гораздо большего. Используя комбинацию словесных, визуальных и физиологических сигналов, мы можем лучше улавливать тонкости, указывающие на определенные эмоциональные состояния.

Мы также строим новые психологические модели, которые лучше объясняют, как и почему люди выражают свои эмоции. Например, психологи подвергли критике распространенное мнение о том, что определенные выражения лица всегда сигнализируют об определенных эмоциях, утверждая, что значение таких выражений, как улыбка и хмурый взгляд, сильно варьируется в зависимости от контекста, а также отражает индивидуальные и культурные различия. Поскольку эти модели продолжают развиваться, эмоциональные вычисления также должны развиваться.

Эта технология поднимает ряд социальных проблем. Во-первых, мы должны подумать о последствиях для конфиденциальности сбора и анализа визуальных, вербальных и физиологических сигналов людей. Одна из стратегий уменьшения проблем с конфиденциальностью — уменьшить объем данных, которые должны покинуть сенсорное устройство, что затрудняет идентификацию человека по таким данным. Мы также должны гарантировать, что пользователи всегда знают, разговаривают ли они с ИИ или с человеком. Кроме того, пользователи должны четко понимать, как используются их данные, и знать, как отказаться от них или остаться незамеченными в публичном пространстве, которое может содержать агентов, распознающих эмоции.

По мере того, как такие агенты становятся более реалистичными, нам также придется бороться с феноменом « сверхъестественной долины» , когда люди обнаруживают, что несколько реалистичные сущности ИИ более жуткие, чем более явно синтетические существа. Но прежде чем мы дойдем до всех этих проблем развертывания, мы должны заставить технологию работать.

В качестве первого шага к системе искусственного интеллекта, которая может поддерживать психическое здоровье и благополучие людей, мы создали Emma, ​​эмоционально ориентированное телефонное приложение. В одном из экспериментов 2019 года Эмма спрашивала пользователей, как они себя чувствуют в случайное время в течение дня. Половина из них получила чуткий ответ от Эммы, адаптированный к их эмоциональному состоянию, а другая половина получила нейтральный ответ. Результат: те участники, которые взаимодействовали с чутким ботом, чаще сообщали о положительном настроении.

Во втором эксперименте с той же когортой мы проверили, можем ли мы делать выводы о настроении людей на основе базовых данных мобильного телефона, и может ли предложение соответствующих оздоровительных мероприятий поднять настроение тем, кто чувствует себя угрюмым. Используя только местоположение (которое давало нам расстояние пользователя от дома или работы), время суток и день недели, мы смогли надежно предсказать, где находится настроение пользователя в рамках простой квадрантной модели эмоций .

В зависимости от того, был ли пользователь счастлив, спокоен, взволнован или грустен, Эмма ответила соответствующим тоном и рекомендовала простые действия, такие как глубокий вдох или разговор с другом. Мы обнаружили, что пользователи, получившие чуткие призывы Эммы, с большей вероятностью предприняли рекомендуемые действия и сообщили о большем удовлетворении, чем пользователи, получившие тот же совет от нейтрального бота.

В одном раннем эксперименте с Emma, ​​эмоционально ориентированным телефонным приложением, пользователей просили оценивать свое эмоциональное состояние несколько раз в течение дня, используя квадрантную модель эмоций.
В одном раннем эксперименте с Emma, ​​эмоционально ориентированным телефонным приложением, пользователей просили оценивать свое эмоциональное состояние несколько раз в течение дня, используя квадрантную модель эмоций.

Мы собирали и другие данные с мобильного телефона: встроенный акселерометр давал нам информацию о передвижениях пользователя, а метаданные телефонных звонков, текстовых сообщений и событий календаря рассказывали нам о частоте и продолжительности социальных контактов. Некоторые технические трудности не позволили нам использовать эти данные для прогнозирования эмоций, но мы ожидаем, что включение такой информации только сделает оценки более точными.

В другой области исследований мы пытаемся помочь информационным работникам снизить стресс и повысить производительность. Мы разработали множество итераций инструментов поддержки производительности, последняя из которых — работа над «целевыми агентами». Эти помощники планируют время в календарях пользователей, чтобы сосредоточиться на важных задачах. Затем они следят за соблюдением пользователями своих планов, вмешиваются, когда появляются отвлекающие факторы, напоминают им о перерывах, когда это необходимо, и помогают им задуматься о своем повседневном настроении и целях. Агенты получают доступ к календарям пользователей и наблюдают за их компьютерной деятельностью, чтобы узнать, используют ли они такие приложения, как Word, которые помогают их продуктивности, или уходят, чтобы проверить социальные сети.

Чтобы увидеть, улучшит ли эмоциональный интеллект пользовательский опыт, мы создали одного фокусирующего агента, который появлялся на экране в виде дружелюбного аватара. Этот агент использовал анализ мимики для оценки эмоций пользователей и полагался на диалоговую модель на базе искусственного интеллекта, чтобы отвечать соответствующими тонами.

Мы сравнили воздействие этого агента-аватара с воздействием безэмоционального текстового агента, а также с воздействием существующего инструмента Microsoft, который просто позволял пользователям планировать время для целенаправленной работы. Мы обнаружили, что оба типа агентов помогают информационным работникам оставаться сосредоточенными и что люди используют приложения, связанные с производительностью, большую часть своего времени, чем их коллеги, использующие стандартный инструмент планирования. И в целом пользователи сообщили, что чувствуют себя наиболее продуктивными и довольными агентом на основе аватара.

Наш агент умел предсказывать подмножество эмоций, но предстоит еще поработать над распознаванием более тонких состояний, таких как сосредоточенность, скука, стресс и усталость от задач. Мы также уточняем время взаимодействия, чтобы оно воспринималось как полезное, а не раздражающее.

Если агент ИИ был мотивирован страхом, любопытством или восторгом, как это изменило бы технологию и ее возможности?

Нам показалось интересным, что ответы на наш чуткий воплощенный аватар были поляризованными. Некоторых пользователей успокаивало взаимодействие, в то время как другие считали, что аватар отвлекает от работы. Люди высказали самые разные предпочтения относительно того, как должны себя вести такие агенты. Хотя теоретически мы могли бы разработать множество различных типов агентов, удовлетворяющих потребности множества разных пользователей, такой подход был бы неэффективным способом увеличения масштабов. Было бы лучше создать единого агента, который мог бы адаптироваться к предпочтениям пользователя в общении, как это делают люди в своих взаимодействиях.

Например, многие люди инстинктивно подбирают разговорный стиль человека, с которым они разговаривают; такая «лингвистическая мимикрия» увеличивает эмпатию, взаимопонимание и просоциальное поведение . Мы разработали первый пример агента ИИ, который выполняет тот же трюк , согласовывая речевые привычки своего собеседника, включая высоту тона, громкость, скорость речи, выбор слов и длину высказывания. Мы можем представить себе интеграцию такого стилистического соответствия в фокус-агент, чтобы создать более естественный диалог.

Мы постоянно обсуждаем наши исследования с производственными группами Microsoft. Мы пока не знаем, какие из наших усилий будут реализованы в программном обеспечении офисных работников в течение следующих пяти лет, но мы уверены, что будущие продукты Microsoft будут включать в себя эмоционально интеллектуальный ИИ.

Системы искусственного интеллекта, которые могут предсказывать человеческие эмоции и реагировать на них, — это одно, но что, если система искусственного интеллекта действительно может испытывать что-то похожее на человеческие эмоции? Если агент был мотивирован страхом, любопытством или восторгом, как это изменило бы технологию и ее возможности? Чтобы изучить эту идею, мы обучили агентов, у которых были основные эмоциональные побуждения страха и счастливого любопытства.

С помощью этой работы мы пытаемся решить несколько проблем в области ИИ, называемой обучением с подкреплением, в которой агент ИИ учится выполнять задачу путем неустанных проб и ошибок. За миллионы попыток агент определяет наилучшие действия и стратегии, которые следует использовать, и, если он успешно завершает свою миссию, он получает вознаграждение. Обучение с подкреплением использовалось, чтобы обучить агентов ИИ побеждать людей в настольной игре го , видеоигре StarCraft II и разновидности покера, известной как техасский холдем.

Наш «фокус-агент» был нацелен на повышение производительности, помогая пользователям планировать время для работы над важными задачами и помогая им придерживаться своих планов. Камера (1) и компьютерное программное обеспечение (2) отслеживали поведение пользователя. Система восприятия (3) обнаруживала количество людей в поле зрения и положение пользователя перед экраном компьютера, оценивала эмоциональное состояние пользователя, а также отслеживала активность пользователя в различных приложениях. Приложение агента (4) управляло аватаром фокусирующего агента, который вовлекал пользователя в разговор, с помощью диалогового бота на базе искусственного интеллекта (5), который использовал различные модели диалога, чтобы реагировать на ситуацию соответствующим образом.
Наш «фокус-агент» был нацелен на повышение производительности, помогая пользователям планировать время для работы над важными задачами и помогая им придерживаться своих планов. Камера (1) и компьютерное программное обеспечение (2) отслеживали поведение пользователя. Система восприятия (3) обнаруживала количество людей в поле зрения и положение пользователя перед экраном компьютера, оценивала эмоциональное состояние пользователя, а также отслеживала активность пользователя в различных приложениях. Приложение агента (4) управляло аватаром фокусирующего агента, который вовлекал пользователя в разговор, с помощью диалогового бота на базе искусственного интеллекта (5), который использовал различные модели диалога, чтобы реагировать на ситуацию соответствующим образом.

Хотя этот тип машинного обучения хорошо работает с играми, где выигрыш дает явную награду, его сложнее применить в реальном мире. Рассмотрим, например, задачу по обучению беспилотному автомобилю. Если награда благополучно доставляется к месту назначения, ИИ будет много времени врезаться в вещи, пробуя разные стратегии, и лишь в редких случаях добивается успеха. Это проблема скудных внешних вознаграждений. ИИ также может потребоваться некоторое время, чтобы выяснить, какие конкретные действия наиболее важны — остановка на красный свет или ускорение на пустой улице? Поскольку вознаграждение приходит только в конце длинной последовательности действий, исследователи называют это проблемой присвоения кредита.

А теперь подумайте, как ведет себя человек за рулем. Безопасное достижение пункта назначения по-прежнему является целью, но по пути человек получает много отзывов. В стрессовой ситуации, например при ускорении по шоссе во время ливня, человек может чувствовать, как его сердце бешено колотится в груди, когда адреналин и кортизол проходят по его телу. Эти изменения являются частью реакции человека «бей или беги», которая влияет на принятие решений. Водителю не обязательно врезаться во что-нибудь, чтобы почувствовать разницу между безопасным маневром и рискованным движением. А когда он выезжает с шоссе и его пульс замедляется, между событием и реакцией наблюдается четкая корреляция.

Мы хотели зафиксировать эти корреляции и создать агента ИИ, который в некотором смысле испытывает страх . Поэтому мы попросили людей провести машину по лабиринту в смоделированной среде, измерили их физиологические реакции как в спокойные, так и в стрессовые моменты, а затем использовали эти данные для обучения управляющего ИИ. Мы запрограммировали агента на получение внешнего вознаграждения за исследование хорошего процента лабиринта, а также внутреннего вознаграждения за минимизацию эмоционального состояния, связанного с опасными ситуациями.

Мы обнаружили, что объединение этих двух наград привело к созданию агентов, которые обучались намного быстрее, чем агент, получавший только типичное внешнее вознаграждение. Эти агенты также реже падали. Тем не менее, что нам показалось особенно интересным, так это то, что агент, мотивированный в первую очередь внутренним вознаграждением, не работал очень хорошо: если мы уменьшали внешнее вознаграждение, агент становился настолько не склонным к риску, что не очень старался выполнить свою задачу. цель.

Во время еще одной попытки создать внутреннюю мотивацию для агента ИИ мы думали о человеческом любопытстве и о том, как люди стремятся исследовать, потому что они думают, что могут открыть для себя вещи, которые заставят их чувствовать себя хорошо. В связанных исследованиях искусственного интеллекта другие группы уловили что-то вроде элементарного любопытства, вознаграждая агентов за поиск новизны, когда они исследуют моделируемую среду. Но мы хотели создать более разборчивого агента, который искал бы не только новизну, но и новизну, которая могла бы сделать его «счастливым».

Мы записали объем крови на импульс испытуемых, когда они проезжали виртуальный лабиринт. В этом примере объем крови субъекта уменьшается между 285 и 300 секундами. В течение этого периода водитель столкнулся со стеной при резком повороте, чтобы избежать другого препятствия. Эти данные использовались для обучения агента ИИ, которому была поставлена ​​цель минимизировать такие стрессовые ситуации.
Мы записали объем крови на импульс испытуемых, когда они проезжали виртуальный лабиринт. В этом примере объем крови субъекта уменьшается между 285 и 300 секундами. В течение этого периода водитель столкнулся со стеной при резком повороте, чтобы избежать другого препятствия. Эти данные использовались для обучения агента ИИ, которому была поставлена ​​цель минимизировать такие стрессовые ситуации.

Чтобы собрать данные для обучения такого агента, мы попросили людей управлять виртуальным автомобилем в симулированном лабиринте улиц, предлагая им исследовать, но не ставя перед ними никаких других целей. Во время вождения мы использовали анализ мимики, чтобы отслеживать улыбки, которые мелькали на их лицах, когда они успешно перемещались по сложным участкам или неожиданно находили выход из лабиринта. Мы использовали эти данные в качестве основы для функции внутреннего вознаграждения, что означает, что агента научили максимально использовать ситуации, которые вызывают у человека улыбку. Агент получал внешнее вознаграждение, покрывая как можно большую территорию.

Опять же, мы обнаружили, что агенты, обладающие внутренним драйвом, работали лучше, чем обычно обученные агенты — они дольше ехали по лабиринту, прежде чем врезаться в стену, и исследовали большую территорию. Мы также обнаружили, что такие агенты лучше справляются со связанными задачами визуальной обработки, такими как оценка глубины трехмерного изображения и сегментирование сцены на составные части.

Мы находимся в самом начале имитации человеческих эмоций in silico, и, несомненно, возникнут философские дебаты о том, что значит для машины способность имитировать эмоциональные состояния, связанные со счастьем или страхом. Но мы думаем, что такие подходы могут не только способствовать более эффективному обучению, но и дать системам ИИ решающую способность к обобщениям.

Сегодняшние системы искусственного интеллекта обычно обучаются выполнять одну задачу, в которой они могут хорошо разбираться, но не могут перенести свои кропотливо приобретенные навыки в какую-либо другую область. Но люди используют свои эмоции, чтобы каждый день ориентироваться в новых ситуациях; это то, что люди имеют в виду, когда говорят об использовании своих инстинктов.

Мы хотим дать системам ИИ аналогичные возможности. Если системы ИИ управляются человеческими эмоциями, могут ли они больше походить на человеческий интеллект? Возможно, смоделированные эмоции могут побудить системы искусственного интеллекта достичь гораздо большего, чем они могли бы сделать иначе. Нам определенно любопытно изучить этот вопрос — отчасти потому, что мы знаем, что наши открытия заставят нас улыбнуться.

Искусственный интеллект теперь может обнаруживать эмоции с помощью радиоволн



Новости партнеров