C#汉字转拼音,可识别多音字,带声调,提供正向、逆向、双向分词算法的小程序
2014-04-11 10:56
501 查看
用C#写了个汉字转拼音的小工具,和网上大部分工具不同,这个通过分词算法,解决了多音字的问题,并且提供声调,可开可关。
如题,用"银行 行不行 行家说了算"举例,如果转拼音却不能识别多音字,就惨了。
而这个小工具的效果如图:
实现了3种分词算法:
* 正向最大匹配
* 反向最大匹配
* 双向最大匹配
(这个双向匹配的歧义处理办法,还是本人创新。。。)
软件下载: http://pan.baidu.com/s/1mTg3T
-----------------分割线---------------------
这里,不得不提一下分词算法这个事情。
不过都写在这就太长了,还是放到下一篇再谈。
-----------------源代码(含生成好的程序)--------------------
百度网盘: http://pan.baidu.com/s/1ED1Ls
腾讯微云: http://url.cn/PnnMOU
使用注意:
* bin/release目录下,已经包含了生成的软件。
* 显示拼音时,因为词库的中文单字非常不全,我引用了微软的ChnCharInfo.dll,来获得一些单字拼音。这个库是要下载Visual Studio International Pack安装到系统才会有的。
不过你可以直接从bin/release里面找到,自己重新引用一下就行了。只需要引用: ChnCharInfo.dll,但下面2个文件也不能删掉ChnCharInfo.xml和zh-CN目录下的 ChnCharInfo.resources.dll
如题,用"银行 行不行 行家说了算"举例,如果转拼音却不能识别多音字,就惨了。
而这个小工具的效果如图:
实现了3种分词算法:
* 正向最大匹配
* 反向最大匹配
* 双向最大匹配
(这个双向匹配的歧义处理办法,还是本人创新。。。)
软件下载: http://pan.baidu.com/s/1mTg3T
-----------------分割线---------------------
这里,不得不提一下分词算法这个事情。
不过都写在这就太长了,还是放到下一篇再谈。
-----------------源代码(含生成好的程序)--------------------
百度网盘: http://pan.baidu.com/s/1ED1Ls
腾讯微云: http://url.cn/PnnMOU
使用注意:
* bin/release目录下,已经包含了生成的软件。
* 显示拼音时,因为词库的中文单字非常不全,我引用了微软的ChnCharInfo.dll,来获得一些单字拼音。这个库是要下载Visual Studio International Pack安装到系统才会有的。
不过你可以直接从bin/release里面找到,自己重新引用一下就行了。只需要引用: ChnCharInfo.dll,但下面2个文件也不能删掉ChnCharInfo.xml和zh-CN目录下的 ChnCharInfo.resources.dll
相关文章推荐
- C#汉字转拼音,自动识别多音字,带声调,提供正向、逆向、双向分词算法的小程序
- 自己动手写分词引擎——逆向最大、正向最大、双向最大分词算法的实现
- C#汉字转拼音(支持多音字)
- [C#程序]汉字转拼音缩写的函数
- 汉字拼音带声调和发音mp3文件(C#源程序)
- [C#] 汉字转拼音,支持多音字
- 取中文拼音首字母,提供了多音字的选择 js javascript c# java(转)
- 【ASP】GBK汉字转拼音程序,支持多音字
- [C#] 汉字转拼音,支持多音字
- 中文分词引擎 java 实现 — 正向最大、逆向最大、双向最大匹配法
- 汉字转拼音,可识别多音字,可返回首字母,大小写等
- C#汉字转化成拼音的算法
- 用正向和逆向最大匹配算法进行中文分词
- 逆向最大匹配分词算法C#
- 取中文拼音首字母,提供了多音字的选择 js javascript c# java(转)
- C#分词算法:正向、逆向、双向最大匹配算法
- C# 汉字转拼音 方法(汉字的发音不过400多种(不算声调))
- android实现汉字转拼音功能 带多音字识别
- NLP——分词之正向(逆向、双向)最大
- c#版汉字拼音大全,支持多音字