语音识别中的鸡尾酒会问题
2014-02-18 11:43
232 查看
概念
“ 鸡尾酒会问题”(cocktail party problem)是在计算机语音识别领域的一个问题。当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数为两人或者多人时,语音识别率就会极大的降低,这一难题被称为鸡尾酒会问题。解决方案
斯坦福大学的Andrew NG教授的机器学习公开课(http://v.163.com/special/opencourse/machinelearning.html)(ml-class.org)在第一章unsupervised learning那段视频里解决鸡尾酒会问题(cocktailparty problem)就写了一行代码:[W,s,v] = svd ((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
用fastICA算法可以比较好地解决http://research.ics.tkk.fi/ica/fastica/。
http://www.endolith.com/wordpress/2009/11/22/a-simple-fastica-example/
是一个分离音乐的例子,效果比较明显。用的就是fastICA的python实现。不过好像用来解决cocktail party problem的话效果不太好。
Blind Source Separation of recorded speech and music signals:http://cnl.salk.edu/~tewon/Blind/blind_audio.html
相关文章推荐
- 做语音识别的一些感受!
- vista 系统中语音识别的一些常用命令
- 急聘 语音识别专业 博士
- 在.net中使用语音识别和语音合成技术
- 语音识别的数据丢失
- Android 轻松实现语音识别
- Android-语音识别
- Siri工作方式详解:本地语音识别+云计算服务
- 手势识别以及语音识别demo
- 语音识别范例
- 轻松实现语音识别
- Microsoft Speech SDK5.1 语音识别
- android语音识别 android.speech 包分析
- android语音识别和语音播报相关资料总结
- chrome 语音识别
- Android 开发技巧之传感器和语音识别
- Kinect for windows语音识别(Speech)
- Android语音识别--RecognizerInten…
- 关于语音识别的一些见解
- Android 轻松实现语音识别