您的位置:首页 > 其它

浅谈语音信号处理系列之二 语音信号处理的基础

2017-11-16 15:46 375 查看
下面简单扼要的总结几个基本概念,如果想深入了解请告诉我或者直接参考相关文献。

一 语音信号的产生

一般来说,声音是通过振动产生的。同样,语音是肺里面的空气形成气流通过声道,再从口

鼻辐射而产生的。语音信号主要是由三种成分组成:浊音、清音和爆破音组成,这三种不同

的发音取决于声带的振动和发音器官(口鼻舌等)的位置和状态。如果用信号系统的角度来

看,气流通过声门(声带)形成激励源,从声门到口鼻这段腔体是一个时变的系统,当然语

音就是输出的时变信号了。只有搞清楚激励源和时变系统的特性,才能真正明白语音信号的

产生,从而进行更深入的研究。

二 描述语音特性的几个概念

1、物理属性:

 1)音调:音高,是声音振动的频率;

 2)音强:音量,声音震动的强弱;

 3)音长:声音的长短;

 4)音色:音质,声音的内容和特质,与声带振动频率、激励源和声道的形状等有

关。

2、基本单位

 1)最基本的单位:音素,分为浊音和清音。

 2)最小发音单位:音节,由音素组成。音节=元音+辅音,而没有说音节=浊音+清

音,这是因为二者不是一个领域范畴的表述,一个是语言学构成,另一个是语音成分组成,

另外辅音分为清辅音和浊辅音,元音和浊辅音表示了声带振动,清辅音声带不振动。

 3)汉语语音=声母+韵母+音调

3、共振峰特性

当振动频率与系统的固有频率一致时,就会引起共振现象。声道是一个具有某种谐振特性的

腔体,可以与语音在多个频率上发生谐振,这些谐振的位置称为共振峰,它对语音信号产生

了很大的影响。

4、掩蔽效应

   从人耳的感知特性出发,是一种心理声学现象,以后会再详细介绍。

三 语音信号与音频信号的关系

语音信号的频率范围是200~3400Hz左右,人们可听到的音频信号范围是20~20KHz,显然语音

信号属于音频信号,那为什么还特别强调语音信号的研究呢?

1、语音信号和音频信号的处理对象不同,语音信号主要是以人发声为研究对象,而音频信

号则是以自然界所有的声音为研究对象;

2、研究方法不同,语音信号主要从人的发声机理为基础,建立发声系统模型,分析系统特

性;而音频信号的来源太多了,所以它是以人的听觉特性为基础,建立人耳系统模型,分析

系统特性。

3、语音信号具有更多的实际研究价值和应用价值。

四 语音信号处理的常用技术

1、时域分析

   通过将语音信号分帧,转化时变信号为时不变信号以进行处理。

 1)短时能量

 2)短时平均过零率

 3)短时自相关运算 

2、频域分析

 1)傅里叶变换(FFT)

 2)滤波器组(Filter Bank)

        3)基于听觉特性的Mel频率倒谱分析

        4)基于线性预测(LPC)的倒谱分析

3、两个关键参数

 1)基音频率(Pitch)

 2)线性预测系数(LPC)

五 语音信号处理的常用软件

1、Matlab

2、Cool Edit
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: