您的位置：首页 > 其它

哭声检测

2015-07-05 20:36 274 查看

从音频信号中检测出哭泣声。先验条件：

无强噪声，无背景音乐等干扰。

构成一个两类分类问题：哭泣 VS 正常语音

哭泣声音的语谱图如下：

其具有很明显的特点，声道的变化较为缓慢，通过MFCC参数刻画声道模型，可以对哭声对应的语音帧进行鉴别。

识别模型有两种选择：从语句级全局去构造特征，如共振峰轨迹变化缓慢等。亦可以从帧级建立概率模型，记录哭泣时扩张的声道参数。

这里我们选用后一种，特征构造比较简单。

帧级特征，具体为MFCC13+Pitch1+Formant1-3 = 17维度，即为一个样本点。可以采用朴素贝叶斯，支持向量机等简单实现。

这里我们选用OpenCV的SVM支持向量机实现。核函数选用RBF，未进行参数优化（opencv train_Auto）。

系统构成如下：

采用Youtube下载小孩哭声，和正常语音进行训练和测试，测试8次。

识别结果如下：

应用：

智能家居，婴儿看护，儿童玩具等领域。目前的技术已经比较成熟，已达到商用级别。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航