语音信号的预加重和加窗处理
2016-07-17 17:27
573 查看
一、语音信号的预加重
语音信号的预加重,目的是为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。一般通过传递函数为一阶FIR高通数字滤波器来实现预加重,其中a为预加重系数,0.9<a<1.0。设n时刻的语音采样值为x(n),经过预加重处理后的结果为y(n))=x(n)-ax(n-1),这里取a=0.98。
预加重实验:
%预加重<span class="wp_keywordlink" style="margin: 0px; padding: 0px; border: 0px; font-size: 13.3333330154419px; background: transparent;"><a target=_blank href="http://www.xuebuyuan.com/" title="程序" target="_blank" style="text-decoration: none; color: rgb(1, 150, 227);">程序</a></span> 2013/9/25 clear all; [x,sr]=wavread('test2.wav'); %sr为采样频率 ee=x(1500:1755); r=fft(ee,1024); r1=abs(r); pinlv=(0:1:255)*8000/512; yuanlai=20*log10(r1); signal(1:256)=yuanlai(1:256); [h1,f1]=freqz([1,-0.98],[1],256,4000); pha=angle(h1); H1=abs(h1); r2(1:256)=r(1:256); u=r2.*h1'; u2=abs(u); u3=20*log10(u2); un=filter([1,-0.98],[1],ee); figure(1);subplot(2,1,1); plot(f1,H1);title('高通滤波器的幅频特性'); xlabel('频率/Hz');ylabel('幅度'); subplot(2,1,2);plot(pha);title('高通滤波器的相频特性'); xlabel('频率/Hz');ylabel('角度/rad'); figure(2);subplot(2,1,1);plot(ee);title('原始语音信号'); %axis([0 256 -3*10^4 2*10^4]); xlabel('样点数');ylabel('幅度'); subplot(2,1,2);plot(un);title('经高通滤波后的语音信号'); %axis([0 256 -1*10^4 1*10^4]); xlabel('样点数');ylabel('幅度'); figure(3);subplot(2,1,1);plot(pinlv,signal);title('原始语音信号频谱'); xlabel('频率/Hz');ylabel('幅度/dB'); subplot(2,1,2);plot(pinlv,u3);title('经高通滤波后的语音信号频谱'); xlabel('频率/Hz');ylabel('幅度/dB');
实验结果:
可以看出,预加重后的频谱在高频部分的幅度得到了提升。
二、语音信号的加窗处理
进行预加重数字滤波处理后,下面就是进行加窗分帧处理,语音信号具有短时平稳性(10--30ms内可以认为语音信号近似不变),这样就可以把语音信号分为一些短段来来进行处理,这就是分帧,语音信号的分帧是采用可移动的有限长度的窗口进行加权的方法来实现的。一般每秒的帧数约为33~100帧,视情况而定。一般的分帧方法为交叠分段的方法,前一帧和后一帧的交叠部分称为帧移,帧移与帧长的比值一般为0~0.5,。汉明窗函数如下:
汉明窗的时域和频域波形,窗长N=61
x=linspace(20,80,61); h=hamming(61); figure(1); subplot(1,2,1); plot(x,h,'k');title('汉明窗时域波形'); xlabel('样点数');ylabel('幅度'); w1=linspace(0,61,61); w1(1:61)=hamming(61); w2=fft(w1,1024); w3=w2/w2(1); w4=20*log10(abs(w3)); w=2*[0:1023]/1024; subplot(1,2,2); plot(w,w4,'k'); axis([0,1,-100,0]); title('汉明窗幅度特性'); xlabel('归一化频率');ylabel('幅度/dB');
结果:
汉明窗的主瓣宽度较宽,是矩形窗的一倍,但是汉明窗的旁瓣衰减较大,具有更平滑的低通特性,能够在较高的程度上反应短时信号的频率特性。
矩形窗的主瓣宽度小于汉明窗,具有较高的频谱分辨率,但是矩形窗的旁瓣峰值较大,因此其频谱泄露比较严重。
相关文章推荐
- UILabel,文字添加下划线,中划线
- 国内公共DNS
- hdu4352 XHXJ's LIS(数位Dp)
- Docker安装及镜像管理
- 如何计算两个文档的相似度(一)
- 《linux学习》之怎么安装搜狗输入法
- Linux多线程与同步
- iOS获取经纬度
- Android 自定义View (一)
- 专访腾讯徐汉彬:架构、优化环环相扣,日请求8亿只是起点
- 杭电oj -1008
- ARP协议学习
- 关于《自己动手写CPU》使用GNU工具过程遇到的问题
- memove 的实现
- 用位运算实现四则运算之加减乘除
- Python遇到的小问题与解决方法,时时更新!
- Bit and Byte Order
- 深度解析:清理烂代码
- Python学习笔记(2)—搜索路径
- jenkins2 pipeline 语法快速参考