当我们比较愉快的时候,语速会变快,音调会提高。但是,当我们忧郁的时候,声音就会变得单调而干涩。利用信号处理技术,计算机可以探测到这些线索,这就像测谎仪可以记录血压、脉搏与皮肤的导电性一样。为了探测到抑郁的情绪,我们利用“监督学习法”(一种常见的机器学习模型)来训练机器,让它可以识别与抑郁相关的声学特征。虽然在一段简短的语音记录中只包含几个词,但是我们却可以从音调中抽取出大量的信号数据。我们研究的第一步是,教会机器从学生的语音样本中识别出有压力的负面情绪。由于研究的内容,学生们还给这个小组起了一个外号:“香港压力与紧张大学”(Hong Kong University of Stress andTension),首字母缩写与香港科技大学相同。我们会问学生12个问题,这些问题给学生带来的压力会逐渐增加。完成这个过程后,我们就建了第一个多语种的自然语音情感数据集,其中包含了英语、普通话与粤语。