语音端点检测(voice activity detection,VAD)
2013-03-12 13:46
2236 查看
可以将一段语音片段分为 静音段、过度段、语音段、结束。
比较常用的VAD技术是基于短时能量和过零率的双门限端点检测。
1. 分别对短时能量和过零率设置两个门限值energy_low, energy_high和zcr_low, zcr_high
energy_high > energy_low
zcr_high > zcr_low
2. 计算一帧的短时能量enegry和过零率zcr
若enegry > energy_low && zcr > zcr_low,则进入过度段
3. 计算一帧的短时能量和过零率,
若enegry > energy_high && zcr > zcr_high, 此时还不能断定语音开始,
继续计算几帧短时能量和过零率,若enegry > energy_high && zcr > zcr_high,则可判定语音开始。
能量双门限VAD流程图
比较常用的VAD技术是基于短时能量和过零率的双门限端点检测。
1. 分别对短时能量和过零率设置两个门限值energy_low, energy_high和zcr_low, zcr_high
energy_high > energy_low
zcr_high > zcr_low
2. 计算一帧的短时能量enegry和过零率zcr
若enegry > energy_low && zcr > zcr_low,则进入过度段
3. 计算一帧的短时能量和过零率,
若enegry > energy_high && zcr > zcr_high, 此时还不能断定语音开始,
继续计算几帧短时能量和过零率,若enegry > energy_high && zcr > zcr_high,则可判定语音开始。
能量双门限VAD流程图
相关文章推荐
- webrtcvad python——语音端点检测
- 关于webrtc的VAD(voice activity dectctor)算法说明
- 语音发生检测VAD
- 详解语音处理检测技术中的热点——端点检测、降噪和压缩
- 关于webrtc的VAD(voice activity dectctor)算法说明
- 语音激活检测(VAD)--前向神经网络方法(Alex)
- python的webrtc库实现语音端点检测
- 语音识别之端点检测
- 语音信号的端点检测的matlab代码(子带谱熵法法)
- 详解语音处理检测技术中的热点——端点检测、降噪和压缩
- 语音端点检测
- [行为检测]R-C3D-Resgion Convolutional 3D Network for Temporal Activity Detection
- 详解语音处理检测技术中的热点——端点检测、降噪和压缩 | 硬创公开课
- 强噪声下的语音检测 VAD
- 端点检测(VAD)技术
- 详解python的webrtc库实现语音端点检测
- matlab中语音端点检测
- 语音端点检测(2):单参数双门限法
- 语音端点检测(1):双门限法(简单教学版)
- Facial Landmark Detection(人脸特征点检测)