Искусственный интеллект по словам и голосу смог выявить депрессию у 87% испытуемых

17 февраля 2023

Ученые из Харбинского университета науки и технологий и Института перспективных исследований Цзиньхуа разработали самообучаемый механизм, помогающий обнаружить депрессию.

Информация о создании этой модели изложена в журнале Mobile Networks and Applications. В ней рассказывается, о том, как интеллект научился распознавать эмоциональные отклонения, анализируя записи голоса. Алгоритм работы многоинформационной системы создавался на базе анализа эмоций в голосе человека, его мимики, а также сравнения этих параметров с характеристиками здорового человека. Разработкой модели занимаются ученые Чжан Чжу, Хань Тянь, и Сюй Цзин. Модель была обучена информации из датасет DAIC-WOZ. В базе хранятся клинические опросы, полученные при распознавании депрессии, тревоги, стресса, других психических расстройств. В файлах содержатся аудиоверсии и трехмерные изображения лиц людей, подверженных депрессивным состоянием. Для сравнения используются данные людей, не сталкивавшихся с депрессией. Эти сведения собирались в ходе интервью с помощью виртуального помощника.

Задаваемые вопросы касались жизни, эмоций, событий, происходящих с респондентом. Специалисты пояснили, что на основе углубленного изучения характеристик речи проводится анализ голосовых показателей из DAIC-WOZ. Записи изначально обрабатываются методом выделения речевых импульсов, раскадровки, шумоподавления и определения окончательных точек разговора.

Также для изъятия сигналов применялась утилита распознавания звуков и музыки - OpenSmile. Программа распознает звуки путем изъятий значительных пространств хранения с доступным начальным кодом. На ее основе были построены функции для глубокого изучения данных. Этот набор инструментов широко используется исследователями для выделения звуковых признаков из аудиофайлов / звукозаписей и для их последующей классификации.

На основе уже известных данных о речевых характеристиках депрессивных расстройств и отдельно извлеченных особенностей и комбинаций был составлен анализ основных комплексов в целях кластеризации данных. Тянь, Чжу и Цзинь провели лабораторные тесты, показавшие 87%-ю достоверность. Погрешность выборки пациентов в зависимости от пола испытуемого составила 0,5%. Испытания проводились параллельно на людях, страдающих разными формами депрессии, и на здоровых участниках. 13% не вошедших в пределы точности — это люди с начальными этапами депрессии ( допустимая погрешность испытания). Алгоритм глубокого обучения планируют внедрять в качестве вспомогательного инструмента к методикам, которые уже применяются психиатрами. Модель может помочь выявить проблему, а затем быстро принять меры для выздоровления людей, страдающих депрессией на разных этапах развития. Это также даст толчок вдохновения для разработки аналогичных алгоритмов с целью выявления психических расстройств.