浅谈语音信号处理系列之二 语音信号处理的基础
2017-11-16 15:46
375 查看
下面简单扼要的总结几个基本概念,如果想深入了解请告诉我或者直接参考相关文献。
一 语音信号的产生
一般来说,声音是通过振动产生的。同样,语音是肺里面的空气形成气流通过声道,再从口
鼻辐射而产生的。语音信号主要是由三种成分组成:浊音、清音和爆破音组成,这三种不同
的发音取决于声带的振动和发音器官(口鼻舌等)的位置和状态。如果用信号系统的角度来
看,气流通过声门(声带)形成激励源,从声门到口鼻这段腔体是一个时变的系统,当然语
音就是输出的时变信号了。只有搞清楚激励源和时变系统的特性,才能真正明白语音信号的
产生,从而进行更深入的研究。
二 描述语音特性的几个概念
1、物理属性:
1)音调:音高,是声音振动的频率;
2)音强:音量,声音震动的强弱;
3)音长:声音的长短;
4)音色:音质,声音的内容和特质,与声带振动频率、激励源和声道的形状等有
关。
2、基本单位
1)最基本的单位:音素,分为浊音和清音。
2)最小发音单位:音节,由音素组成。音节=元音+辅音,而没有说音节=浊音+清
音,这是因为二者不是一个领域范畴的表述,一个是语言学构成,另一个是语音成分组成,
另外辅音分为清辅音和浊辅音,元音和浊辅音表示了声带振动,清辅音声带不振动。
3)汉语语音=声母+韵母+音调
3、共振峰特性
当振动频率与系统的固有频率一致时,就会引起共振现象。声道是一个具有某种谐振特性的
腔体,可以与语音在多个频率上发生谐振,这些谐振的位置称为共振峰,它对语音信号产生
了很大的影响。
4、掩蔽效应
从人耳的感知特性出发,是一种心理声学现象,以后会再详细介绍。
三 语音信号与音频信号的关系
语音信号的频率范围是200~3400Hz左右,人们可听到的音频信号范围是20~20KHz,显然语音
信号属于音频信号,那为什么还特别强调语音信号的研究呢?
1、语音信号和音频信号的处理对象不同,语音信号主要是以人发声为研究对象,而音频信
号则是以自然界所有的声音为研究对象;
2、研究方法不同,语音信号主要从人的发声机理为基础,建立发声系统模型,分析系统特
性;而音频信号的来源太多了,所以它是以人的听觉特性为基础,建立人耳系统模型,分析
系统特性。
3、语音信号具有更多的实际研究价值和应用价值。
四 语音信号处理的常用技术
1、时域分析
通过将语音信号分帧,转化时变信号为时不变信号以进行处理。
1)短时能量
2)短时平均过零率
3)短时自相关运算
2、频域分析
1)傅里叶变换(FFT)
2)滤波器组(Filter Bank)
3)基于听觉特性的Mel频率倒谱分析
4)基于线性预测(LPC)的倒谱分析
3、两个关键参数
1)基音频率(Pitch)
2)线性预测系数(LPC)
五 语音信号处理的常用软件
1、Matlab
2、Cool Edit
一 语音信号的产生
一般来说,声音是通过振动产生的。同样,语音是肺里面的空气形成气流通过声道,再从口
鼻辐射而产生的。语音信号主要是由三种成分组成:浊音、清音和爆破音组成,这三种不同
的发音取决于声带的振动和发音器官(口鼻舌等)的位置和状态。如果用信号系统的角度来
看,气流通过声门(声带)形成激励源,从声门到口鼻这段腔体是一个时变的系统,当然语
音就是输出的时变信号了。只有搞清楚激励源和时变系统的特性,才能真正明白语音信号的
产生,从而进行更深入的研究。
二 描述语音特性的几个概念
1、物理属性:
1)音调:音高,是声音振动的频率;
2)音强:音量,声音震动的强弱;
3)音长:声音的长短;
4)音色:音质,声音的内容和特质,与声带振动频率、激励源和声道的形状等有
关。
2、基本单位
1)最基本的单位:音素,分为浊音和清音。
2)最小发音单位:音节,由音素组成。音节=元音+辅音,而没有说音节=浊音+清
音,这是因为二者不是一个领域范畴的表述,一个是语言学构成,另一个是语音成分组成,
另外辅音分为清辅音和浊辅音,元音和浊辅音表示了声带振动,清辅音声带不振动。
3)汉语语音=声母+韵母+音调
3、共振峰特性
当振动频率与系统的固有频率一致时,就会引起共振现象。声道是一个具有某种谐振特性的
腔体,可以与语音在多个频率上发生谐振,这些谐振的位置称为共振峰,它对语音信号产生
了很大的影响。
4、掩蔽效应
从人耳的感知特性出发,是一种心理声学现象,以后会再详细介绍。
三 语音信号与音频信号的关系
语音信号的频率范围是200~3400Hz左右,人们可听到的音频信号范围是20~20KHz,显然语音
信号属于音频信号,那为什么还特别强调语音信号的研究呢?
1、语音信号和音频信号的处理对象不同,语音信号主要是以人发声为研究对象,而音频信
号则是以自然界所有的声音为研究对象;
2、研究方法不同,语音信号主要从人的发声机理为基础,建立发声系统模型,分析系统特
性;而音频信号的来源太多了,所以它是以人的听觉特性为基础,建立人耳系统模型,分析
系统特性。
3、语音信号具有更多的实际研究价值和应用价值。
四 语音信号处理的常用技术
1、时域分析
通过将语音信号分帧,转化时变信号为时不变信号以进行处理。
1)短时能量
2)短时平均过零率
3)短时自相关运算
2、频域分析
1)傅里叶变换(FFT)
2)滤波器组(Filter Bank)
3)基于听觉特性的Mel频率倒谱分析
4)基于线性预测(LPC)的倒谱分析
3、两个关键参数
1)基音频率(Pitch)
2)线性预测系数(LPC)
五 语音信号处理的常用软件
1、Matlab
2、Cool Edit
相关文章推荐
- 浅谈语音信号处理系列之二 语音信号处理的基础
- 图像处理基础知识系列之二:核概率密度估计简介
- Linux基础系列-信号及信号处理
- 语音信号处理基础——简易VAD函数
- 浅谈语音信号处理系列之三 语音编码
- 笨鸟先飞学编程系列之二 基础代码的编写2(转)
- [.Net 线程处理系列]专题一:线程基础
- 数字语音信号处理学习笔记——绪论(1)
- 不拖控件的ASP.NET之二-一般处理程序基础
- [学习]信号处理基础
- 小波变换在语音信号处理的应用
- 2. oracle学习入门系列之二 数据库基础知识
- 语音信号的加窗处理
- 从一个小小的滚动轴承聊到信号处理再聊到机器学习(轴承故障检测系列~)
- 数字语音信号处理学习笔记——语音信号的短时频域分析(1)
- 【脚本语言系列】关于Python基础知识异常处理,你需要知道的事
- storm基础系列之二----zookeeper的作用
- 笨鸟先飞学编程系列之二 基础代码的编写3(转)
- JavaScript基础系列之七 错误处理
- 语音信号处理之(二)基音周期估计(Pitch Detection)