基于微软嵌入式系统添加语音功能(语音合成与语音识别)
2009-09-23 10:22
337 查看
基于Windows Embedded Standard以及Windows Embedded XP,如果需要添加语音识别,语音朗读功能,需要下列组件的支持。
Speech Control Panel:
添加该组件可以在控制面中添加语音控制图标,我们可以通过这个功能来选择或者配置Speech recognition(SR-语音识别)或者 text-to-speech engine(TTS-文本语音转化引擎)。 这些设置取决与可选择的语言,声音输出和声音质量, 也包括可选择的麦克风输入。 在语音属性中可以制定和更新用户配置文件。通过用户配置文件,使语音识别引擎能够更好地认识到一个发言者的习惯和在一个特定的环境下的背景声音。
Text To Speech Core:
该组件作为一个文本语音转换的核心组件为文本语音转换和语音识别提供了一个公共的、基础的组成文件。 因为任何系统以外的语音或讲话都直接访问这些动态链接库的情况是不可能的。
注意:SAPI的共同组成部分文件无法直接测试。因为这些文件需要的语音业务,而成功的测试功能需要包括相关讲话来证实他们的存在和目前的状态。
Speech API English Text To Speech Engine:
该组件包含一个设备驱动程序,负责的文字转换成语音。该动态链接库( DLL )无法直接被应用程序所访问,但可以通过语音的API ( SAPI模块)获得。这一组件默认提供了微软英文支持和至少包含一个英文的声音。一般来说,每一种语言,都需要自己的DLL和支持文件。此外,至少有一个朗读声音是需要为每种语言所必需的可用发音。制造商可以提供他们自己的语言格式,或符合现有的Microsoft模式。
Speech API English Text To Speech Voice (Sam):
该组件包含一个程序,输入或储存转换的文字语言。通过该程序可以用语音描述文本。 Microsoft提供了一个默认的声音-Microsoft Sam。可以从独立的语音引擎制造商购买到更多的第三方厂商提供的声音,并在安装过程中加载到语音识别系统中。
Speech API Core:
该组件提供了基本的语音功能所提供的语音应用程序编程接口( SAPI模块) 。sapi.dll文件是组件的一个组成部分,需要依赖所有的语音功能组件。组件的其他文件-sapisvr.exe,用于语音识别,该功能不能在操作系统初始安装后安装。
Speech Text Services v1.1:
该组件是一个是基于文本服务框架的API的Windows输入服务。结合语音的API( SAPI模块)和语音识别引擎,该组件提供听写和文字转换语音服务。
Text Services Framework:
文字服务框架(TSF)的组成部分是一个组件对象模型(COM)为基础的系统服务,它提供了一种简单且可扩展的框架,以便提供先进的文本输入和自然语言技术。TSF可以启用在应用程序中或作为TSF文字服务启动。TSF提供多国语言文字服务的支持,并提供文字服务,如键盘输入服务,手写识别和语音识别。
TSF是一个独立于设备的,语言中立,和可扩展的系统提供文字和语言的技术。TSF的应用程序可以使用任何文字服务来支持TSF。
添加下列组件以后,就可以基于嵌入式系统开发语音识别与语音合成应用了。
如果开发语音识别引擎,
请参考:
http://blog.csdn.net/yincheng01/archive/2009/02/11/3878807.aspx
如果开发语音合成引擎,
请参考:
http://blog.csdn.net/yincheng01/archive/2009/02/11/3879130.aspx
如果开发嵌入式语音识别应用,请参考,
http://blog.csdn.net/yincheng01/archive/2008/12/13/3511673.aspx
如果开发嵌入式语音朗读应用,请产考,
http://blog.csdn.net/yincheng01/archive/2008/12/13/3511702.aspx
本人提供语音技术项目咨询顾问服务,请联系MSN :yincheng01@163.com
Speech Control Panel:
添加该组件可以在控制面中添加语音控制图标,我们可以通过这个功能来选择或者配置Speech recognition(SR-语音识别)或者 text-to-speech engine(TTS-文本语音转化引擎)。 这些设置取决与可选择的语言,声音输出和声音质量, 也包括可选择的麦克风输入。 在语音属性中可以制定和更新用户配置文件。通过用户配置文件,使语音识别引擎能够更好地认识到一个发言者的习惯和在一个特定的环境下的背景声音。
Text To Speech Core:
该组件作为一个文本语音转换的核心组件为文本语音转换和语音识别提供了一个公共的、基础的组成文件。 因为任何系统以外的语音或讲话都直接访问这些动态链接库的情况是不可能的。
注意:SAPI的共同组成部分文件无法直接测试。因为这些文件需要的语音业务,而成功的测试功能需要包括相关讲话来证实他们的存在和目前的状态。
Speech API English Text To Speech Engine:
该组件包含一个设备驱动程序,负责的文字转换成语音。该动态链接库( DLL )无法直接被应用程序所访问,但可以通过语音的API ( SAPI模块)获得。这一组件默认提供了微软英文支持和至少包含一个英文的声音。一般来说,每一种语言,都需要自己的DLL和支持文件。此外,至少有一个朗读声音是需要为每种语言所必需的可用发音。制造商可以提供他们自己的语言格式,或符合现有的Microsoft模式。
Speech API English Text To Speech Voice (Sam):
该组件包含一个程序,输入或储存转换的文字语言。通过该程序可以用语音描述文本。 Microsoft提供了一个默认的声音-Microsoft Sam。可以从独立的语音引擎制造商购买到更多的第三方厂商提供的声音,并在安装过程中加载到语音识别系统中。
Speech API Core:
该组件提供了基本的语音功能所提供的语音应用程序编程接口( SAPI模块) 。sapi.dll文件是组件的一个组成部分,需要依赖所有的语音功能组件。组件的其他文件-sapisvr.exe,用于语音识别,该功能不能在操作系统初始安装后安装。
Speech Text Services v1.1:
该组件是一个是基于文本服务框架的API的Windows输入服务。结合语音的API( SAPI模块)和语音识别引擎,该组件提供听写和文字转换语音服务。
Text Services Framework:
文字服务框架(TSF)的组成部分是一个组件对象模型(COM)为基础的系统服务,它提供了一种简单且可扩展的框架,以便提供先进的文本输入和自然语言技术。TSF可以启用在应用程序中或作为TSF文字服务启动。TSF提供多国语言文字服务的支持,并提供文字服务,如键盘输入服务,手写识别和语音识别。
TSF是一个独立于设备的,语言中立,和可扩展的系统提供文字和语言的技术。TSF的应用程序可以使用任何文字服务来支持TSF。
添加下列组件以后,就可以基于嵌入式系统开发语音识别与语音合成应用了。
如果开发语音识别引擎,
请参考:
http://blog.csdn.net/yincheng01/archive/2009/02/11/3878807.aspx
如果开发语音合成引擎,
请参考:
http://blog.csdn.net/yincheng01/archive/2009/02/11/3879130.aspx
如果开发嵌入式语音识别应用,请参考,
http://blog.csdn.net/yincheng01/archive/2008/12/13/3511673.aspx
如果开发嵌入式语音朗读应用,请产考,
http://blog.csdn.net/yincheng01/archive/2008/12/13/3511702.aspx
本人提供语音技术项目咨询顾问服务,请联系MSN :yincheng01@163.com
相关文章推荐
- 基于微软嵌入式系统添加语音功能(语音合成与语音识别)
- 为kindeditor添加在线播放视频功能(基于原有flash上传,mp4,flv,flash)
- 网站搜索框添加语音搜索功能
- html5为输入框添加语音输入功能
- Android 基于百度语音的语音交互功能
- Android开发集成科大讯飞语音识别+语音合成功能
- 基于51单片机语音模块(录音放音功能)
- 为kindeditor添加在线播放视频功能(基于原有flash上传,mp4,flv,flash)
- 树莓派添加中文语音合成功能
- 如何启动使用Win8语音识别功能实现无鼠标语音操作
- 框架 day51 BOS项目练习(定区添加及查询,Hessian入门,基于hessian实现定区关联客户功能)
- Launcher功能的修改及添加,本篇是一些小功能的展示,通知栏显隐,dock显隐,屏幕页面跳转,(语音)搜索,等小功能
- html5为输入框添加语音输入功能
- 漫漫的webim(二) 基于腾讯webIm+cos实现语音,视频,文件,定位等多媒体功能
- 基于iOS平台配置免费离线语音识别功能-OpenEars
- Android开发集成科大讯飞语音识别+语音合成功能
- android上实现语音识别,基于google的语音识的简单例子.
- 在WinForm上添加语音朗读功能
- BOS项目练习(定区添加及查询,Hessian入门,基于hessian实现定区关联客户功能)