您的位置：首页 > 其它

语音识别中的鸡尾酒会问题

2014-02-18 11:43 232 查看

概念

“ 鸡尾酒会问题”（cocktail party problem）是在计算机语音识别领域的一个问题。当前语音识别技术已经可以以较高精度识别一个人所讲的话，但是当说话的人数为两人或者多人时，语音识别率就会极大的降低，这一难题被称为鸡尾酒会问题。

解决方案

斯坦福大学的Andrew NG教授的机器学习公开课（http://v.163.com/special/opencourse/machinelearning.html）(ml-class.org)在第一章unsupervised learning那段视频里解决鸡尾酒会问题(cocktail
party problem)就写了一行代码：[W,s,v] = svd ((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

用fastICA算法可以比较好地解决http://research.ics.tkk.fi/ica/fastica/。

http://www.endolith.com/wordpress/2009/11/22/a-simple-fastica-example/
是一个分离音乐的例子，效果比较明显。用的就是fastICA的python实现。不过好像用来解决cocktail party problem的话效果不太好。

Blind Source Separation of recorded speech and music signals：http://cnl.salk.edu/~tewon/Blind/blind_audio.html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航