您的位置:首页 > 其它

哭声检测

2015-07-05 20:36 274 查看
从音频信号中检测出哭泣声。 先验条件:

无强噪声,无背景音乐等干扰。

构成一个两类分类问题: 哭泣 VS 正常语音

哭泣声音的语谱图如下:



其具有很明显的特点,声道的变化较为缓慢,通过MFCC参数刻画声道模型,可以对哭声对应的语音帧进行鉴别。

识别模型有两种选择: 从语句级全局去构造特征,如共振峰轨迹变化缓慢等。亦可以从帧级建立概率模型,记录哭泣时扩张的声道参数。

这里我们选用后一种,特征构造比较简单。

帧级特征,具体为MFCC13+Pitch1+Formant1-3 = 17维度, 即为一个样本点。可以采用朴素贝叶斯,支持向量机等简单实现。

这里我们选用OpenCV的SVM支持向量机实现。核函数选用RBF,未进行参数优化(opencv train_Auto)。

系统构成如下:



采用Youtube下载小孩哭声,和正常语音进行训练和测试,测试8次。

识别结果如下:



应用:

智能家居,婴儿看护,儿童玩具等领域。目前的技术已经比较成熟,已达到商用级别。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: