您的位置:首页 > 其它

语音的情感识别问题

2015-09-21 19:50 267 查看
最近在看语音的情感识别相关文档,对其中的一些点有了初步的认识,记录下来与大家分享。

1、单从语料的音调就能识别出说话人的喜怒哀乐时,先进行语音信号的标注,提取情感的特征参数,包括基于声学的特征参数:LPCC(线性预测倒谱系数);基于人的听觉机理:MFCC、共振峰参数,还有基于韵律特征的基频和能量方面的特征,另外还可以从说话持续时长、振幅参数来考虑语音所表达出来的情感;

2、需要从语料的说话内容才能判断说话人的正负情绪时,这涉及到语义的理解问题。对测试的语料库的每个句子提取关键词,比如说话人不带强烈情感的说:话费扣的比**多,这是向移动客服表达一种不满,应为负面情绪,把话费、多连在一块儿,做成一个模板,当说话人再有此类语句,且音调正常时,表达的应是负面情绪;

对于语音情感的识别方法有;

矢量分割型马氏距离判别法、主元分析法、神经网络方法、隐马尔科夫模型(HMM)、混合高斯模型(GMM)

另外,情感是一个模糊的概念,对于情感的判别可以采用模糊熵的概念,设有模糊集A={x1,x2,x3,...xn},其对应的隶属度分别为u1,u2,...un,模糊熵的值为S为ui与ln ui乘积的求和的负值。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: