Используется глубокое обучение для обнаружения депрессии по речи

Прочитано: 243 раз(а)


Инструменты искусственного интеллекта (ИИ) добились многообещающих результатов в решении множества задач и вскоре могут помочь профессионалам в различных условиях. В последние годы ученые-компьютерщики изучают потенциал этих инструментов для обнаружения признаков различных физических и психических состояний.

Депрессия является одним из наиболее распространенных психических расстройств, от которого ежегодно страдают примерно 9,5% взрослых американцев. Инструменты, которые могут автоматически обнаруживать признаки депрессии, могут помочь снизить уровень самоубийств, поскольку они позволят врачам быстро выявлять людей, нуждающихся в психологической поддержке.

Исследователи из Института перспективных исследований Цзиньхуа и Харбинского университета науки и технологий недавно разработали алгоритм глубокого обучения, который может обнаруживать депрессию по речи человека. Эта модель, представленная в статье, опубликованной в Mobile Networks and Applications , была обучена распознавать эмоции в человеческой речи путем анализа различных соответствующих функций.

«Многоинформационная модель алгоритма совместного принятия решений создается посредством распознавания эмоций», — написали в своей статье Хань Тянь, Чжан Чжу и Сюй Цзин. «Модель используется для анализа репрезентативных данных об испытуемых и для помощи в диагностике депрессии у испытуемых».

Тиан и его коллеги обучили свою модель набору данных DAIC-WOZ, набору звуковых и трехмерных выражений лиц пациентов с диагнозом депрессивное расстройство и людей без депрессии. Эти аудиозаписи и мимика были собраны во время интервью, проводимых виртуальным агентом, который задавал различные вопросы о настроении и жизни интервьюируемого.

«На основе изучения речевых характеристик людей с депрессивным расстройством в этой статье проводится углубленное исследование диагностики депрессии с помощью речи на основе речевых данных из набора данных DAIC-WOZ», — написали Тянь, Чжу и Цзянь в своем исследовании. бумага. «Во-первых, речевая информация предварительно обрабатывается, включая предварительное выделение речевого сигнала, кадрирование, обнаружение конечной точки, шумоподавление и т. д. Во-вторых, OpenSmile используется для извлечения характеристик речевых сигналов, и речевые характеристики, которые могут отражать функции, изучены и проанализированы глубоко».

Чтобы извлечь важные функции из голосовых записей, модель команды использует OpenSmile (интерпретация речи и музыки с открытым исходным кодом путем извлечения большого пространства). Это набор инструментов, который часто используется учеными-компьютерщиками для извлечения характеристик из аудиоклипов и классификации этих клипов.

Исследователи использовали этот инструмент для извлечения отдельных особенностей речи и их комбинаций, которые обычно встречаются в речи пациентов с диагнозом депрессия. Впоследствии они использовали технику, известную как анализ основных компонентов , чтобы сократить набор извлекаемых признаков.

Тянь, Чжу и Цзянь оценили свою модель в серии тестов, в ходе которых они оценили ее способность обнаруживать депрессивных и недепрессивных людей по записям их голоса. Их схема дала замечательные результаты, выявляя депрессию с точностью 87% у пациентов мужского пола и 87,5% у пациентов женского пола.

В будущем алгоритм глубокого обучения, разработанный этой группой исследователей, может стать дополнительным вспомогательным инструментом для психиатров и врачей наряду с другими хорошо зарекомендовавшими себя диагностическими инструментами. Кроме того, это исследование может вдохновить на разработку аналогичных инструментов ИИ для выявления признаков психических расстройств по речи.

Используется глубокое обучение для обнаружения депрессии по речи



Новости партнеров