科研进展

心理所研究抑郁患者与健康人语音的跨情境差异

发布时间:2019-10-25 作者:中国科学院行为科学重点实验室 朱廷劭研究组 汪静莹

  抑郁症(MDD)是一种以持久的抑郁情绪为核心症状的心境障碍。作为情感表达的一种方式,研究发现声音可能是一种潜在的识别抑郁的手段。人们不仅发现声音与MDD患者的神经认知功能障碍有关,一些声音特征与抑郁得分显著相关,还发现抑郁患者与健康人在一些声音特性上存在差别。虽然已有不少异常特征的发现,但抑郁患者的这些异常是普遍存在的还是仅存在于某些特殊情境下仍不得而知。

  研究这一问题需要考虑两个影响因素:一个是任务,研究已发现不同的任务可能会对语音特征产生不同的影响,这是由于不同的任务参与的认知功能不同导致的;另一个是情绪,研究表明不同的情绪有不同的声音表达模式。因此,在实验设计中,应当充分考虑以上两个因素去设计相应的语音情境。

  中国科学院行为科学重点实验室朱廷劭研究组采集了47个健康人与57个抑郁症患者在12种言语情景下的声音。研究将抑郁组在四种任务(视频观看、问题回答、文本朗读和图片描述)下的积极、消极和中性语音分别与健康组在相同情境下的语音相比较。在将教育水平作为协变量控制的情况下,通过多元协方差分析(MANCOVA)评估了抑郁组和健康组在上述12种情景下的25个语音特征的差异。25个语音特征包括音量(Loudness)、基频(F0)、基频包络(F0 envelope)、过零率(Zero-crossing rate)、清浊比(Voicing probability)、12个梅尔倒谱系数(Mel-frequency cepstrum coefficient,MFCC)和8个线性频谱对(Line Spectral Pairs)。由于存在多重假设检验的情况,本研究以“p < 0.001”为显著性水平的标准。

  MANCOVA结果显示,在12种语音情景中,两个组别均存在有显著性差异的语音特征。如图1所示,在不同情景下,显著的声学特征数量并不完全相同。结果还显示,响度、MFCC5和MFCC7三个语音特征在所有12种语音情景下都始终体现出显著的组别差异。根据本研究的结果,抑郁语音的表现是无力(weak)、低沉(low-pitched)和少抑扬顿挫(untoned)。

 

图1. 不同情境下显著语音特征的数量

VW,视频观看;QA,问题问答;TR,文本朗读;PD,图片描述;Pos,积极;neu,中性;neg,负性

 

  综上,本研究表明抑郁症患者声音异常存在跨情境稳定性,响度、MFCC5和MFCC7具备成为声音识别抑郁症的行为指标的潜质。本研究为未来建立稳健有效的抑郁语音识别模型提供了有力的依据。

  以上研究受国家重点研究发展项目和中国科学院重点研究项目的资助。文章已在线发表于https://bmcpsychiatry.biomedcentral.com/articles/10.1186/s12888-019-2300-7

  (Jingying Wang, Lei Zhang, Tianli Liu, Wei Pan, Bin Hu, Tingshao Zhu. (2019) Acoustic differences between healthy and depressed people: a cross-situation study. BMC Psychiatry, 2019 19:300. DOI: 10.1186/s12888-019-2300-7.)


附件下载: