您的位置:首页 > 其它

DTMF信号的分离——关于一篇博客文章的复现(一)

2018-03-19 21:02 363 查看
为什么要用“复现”这个词呢?因为逼格高。。。。。

之前看到过一篇Blog,奇妙的传送门本文的部分图片也取自原博主。

文章大概是一个老学长写的,记录了自己给几个本科生布置的一项课程设计。最近我正好也在做语音信号处理,严格来说并不是语音信号,只不过是声音信号,但殊途同归,方法都是一样的,因此照葫芦画瓢,把这位学长的想法又自己写了一遍,收获还是不小的,在此和大家分享一下!

一、任务简述

我们在用古老的座机(主要现在手机已经没有这个声音了)的时候,摁下数字键盘上的“1”,“2”等等数字或者字幕,总会出现“嘀嘀嘀”的声音,而且不同的数字和字母对应这不同的声音,主要体现在频率上,而这种声音信号,就是我们所说的DTMF信号。DTMF信号又叫做双音多频信号,对于电话机来说,它每个按键所对应的声音都是由两个不同频率的声音叠加而成,而声音的频率决定了音调,因此我们才会在按键的时候,听到不同音调的声音。具体的对应关系参考下图:



所以我们的任务就是:

根据一段拨打电话时按键的录音来得到这段电话号码

是不是很有柯南的感觉?哈哈哈哈哈哈

二、算法

我本来想画个流程图的,但CSDN的这个新的编辑界面我实在是不会(其实旧的也不会,不过新的更让我不爽)。

那我就简要的说一说思路吧。既然每个音都是两个单频,那么,一个简单的频谱分析不就好了吗?诚然,我们可以把每个音提取出来,然后计算每个音的频率,之后再对照上面的图,找到这个音所对应的按键。这是一个很简单的办法,但是,逼格不够高,逼格如何才能更高呢?答案是——语谱图。

语谱图的逼格是非常高的,因为它不同于我们的频谱,它在显示频谱的同时,还能显示时间,换言之,语谱图含有的信息是:在什么时候含有什么频率。这样,我们就不用分离每个音,然后做FFT/DTFT了。

得到语谱图后,我们还要进行一个分类,在真实的情况下,录音应该是有杂波的,也就是说,信号的频率一定是复杂的,不仅仅是双频。在这种情况下,还需要做的一个工作是量化。简言之,是把八个基本频率中各自附近的频率都算作同一频率。

什么意思呢?比如八个基本频率是[f1,f2,f3,f4,f5,f6,f7,f8],如果信号在f1到f2之间的频率上有能量,怎么办?量化的目的就在于此,将两个相邻频率的重点作为分界,本着就近原则,属于同一频率的信号,将它们的模值全部相加。这样做的好处是什么呢?语谱图会更加明了!它会只反映这八个频率点的信号能量,这对于我们提取信号并且按照特征值来分类是非常有帮助的。

既然要做分类,那么一定会有分类标准,这个标准是什么呢?就是原始的信号—频率对照关系,根据这个表,我们才能识别出究竟是哪个信号,这个过程需要建立特征向量。这个我们之后细说。

那么整个思路就很明显了:

分帧——绘制全频率语谱图——频率量化——绘制区间频率语谱图——特征提取——特征匹配——分类——得到号码。

前期的准备工作大概是这样的,下一步,我们就要开始这个浩大的工程了。请移步此处
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: