您的位置：首页 > 其它

浅谈语音信号处理系列之二语音信号处理的基础

2017-11-16 15:46 375 查看

下面简单扼要的总结几个基本概念，如果想深入了解请告诉我或者直接参考相关文献。

一语音信号的产生

一般来说，声音是通过振动产生的。同样，语音是肺里面的空气形成气流通过声道，再从口

鼻辐射而产生的。语音信号主要是由三种成分组成：浊音、清音和爆破音组成，这三种不同

的发音取决于声带的振动和发音器官（口鼻舌等）的位置和状态。如果用信号系统的角度来

看，气流通过声门（声带）形成激励源，从声门到口鼻这段腔体是一个时变的系统，当然语

音就是输出的时变信号了。只有搞清楚激励源和时变系统的特性，才能真正明白语音信号的

产生，从而进行更深入的研究。

二描述语音特性的几个概念

1、物理属性：

1）音调：音高，是声音振动的频率；

2）音强：音量，声音震动的强弱；

3）音长：声音的长短；

4）音色：音质，声音的内容和特质，与声带振动频率、激励源和声道的形状等有

关。

2、基本单位

1）最基本的单位：音素，分为浊音和清音。

2）最小发音单位：音节，由音素组成。音节=元音+辅音，而没有说音节=浊音+清

音，这是因为二者不是一个领域范畴的表述，一个是语言学构成，另一个是语音成分组成，

另外辅音分为清辅音和浊辅音，元音和浊辅音表示了声带振动，清辅音声带不振动。

3）汉语语音=声母+韵母+音调

3、共振峰特性

当振动频率与系统的固有频率一致时，就会引起共振现象。声道是一个具有某种谐振特性的

腔体，可以与语音在多个频率上发生谐振，这些谐振的位置称为共振峰，它对语音信号产生

了很大的影响。

4、掩蔽效应

   从人耳的感知特性出发，是一种心理声学现象，以后会再详细介绍。

三语音信号与音频信号的关系

语音信号的频率范围是200~3400Hz左右，人们可听到的音频信号范围是20~20KHz，显然语音

信号属于音频信号，那为什么还特别强调语音信号的研究呢？

1、语音信号和音频信号的处理对象不同，语音信号主要是以人发声为研究对象，而音频信

号则是以自然界所有的声音为研究对象；

2、研究方法不同，语音信号主要从人的发声机理为基础，建立发声系统模型，分析系统特

性；而音频信号的来源太多了，所以它是以人的听觉特性为基础，建立人耳系统模型，分析

系统特性。

3、语音信号具有更多的实际研究价值和应用价值。

四语音信号处理的常用技术

1、时域分析

   通过将语音信号分帧，转化时变信号为时不变信号以进行处理。

1）短时能量

2）短时平均过零率

3）短时自相关运算

2、频域分析

1）傅里叶变换（FFT）

2）滤波器组（Filter Bank）

        3）基于听觉特性的Mel频率倒谱分析

        4）基于线性预测（LPC）的倒谱分析

3、两个关键参数

1）基音频率（Pitch）

2）线性预测系数（LPC）

五语音信号处理的常用软件

1、Matlab

2、Cool Edit

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

浅谈语音信号处理系列之二 语音信号处理的基础

浅谈语音信号处理系列之二语音信号处理的基础