您的位置:首页 > 其它

多维输入法启示

2006-12-14 14:05 344 查看
多维的含义?


谓之多维,是希望拼音输入法可以从更多的角度来处理用户输入,就像人在面对一个问题的时候,总是要从诸多方面进行考虑,这也就是所谓的智能。当然,智能一词 过于复杂,也过于宽泛,对于输入法而言,其智能应该在于其具有敏捷的学习功能,在于语言模型的鲁棒性,并能让用户感觉面对的是一个活物,不要那么机械,这 大概也就是多维拼音输入法的目标。值得一提的是“多维”一词,也是我昵称Dave的谐音。

有啥新特性?

根据计划,多维拼音输入法应该会具有一些有趣的特性,之所以说是有趣,并不代表它一定会受用户欢迎,只是我个人的一些关于语言处理的ideas(当然它肯定也具有现有输入法所应该有的特性):
1. 强大的整句输入功能,支持长整句自动组词,越以整个句子的方式输入结果越精确。
2. 以用户为导向,通过自主学习算法自动调整词库,以符合用户习惯,而不是被动式通过发布新辞典的方式更新辞典。
3. 支持输入拼音,以及转化汉字结果的智能预测,并进行相关提示。
4. 支持字音以及字型结构的混合输入(专利范畴)。
5. 一些很有意思的智能特性,因仍未申请专利,暂时保密,以防剽窃。

哪有源代码?

多 维拼音输入法系统界面库采用 Win32 C++编写,基本上以面向对象的方式封装(讨厌Win32 C程序那种凌乱的处理方式,全局变量满天飞),Main程序以及IME接口部分遵循win32消息处理机制代码编写风格,详细技巧可以参考Blog上我撰 写的关于输入法编程心得的文章。作为开源的坚定支持者,多维拼音输入法的界面库将在合适的版本和计划下在我souceforge目录下进行公布,同时语言 模型引擎接口也将公开(因为专利以及词库版权的问题,引擎库代码库暂不会公开),以方便输入法爱好者可以选择编写自己的界面库,或者自然语言处理研究者可 以避开书写界面库的烦琐,直接用自己的语言模型库替换掉现有的来进行自己的研究或者玩乐。


何时可试用?

我想把这个产品作为这一年里苦苦思索的一个总结,也作为给自己新年的礼物,所以定在2007年元旦发布beta版本。Linux版本计划在阴历新年开始时启动,具体方案和时间表将和合作的朋友协商后于此博客中公布。

将来的发展?

语言处理的本身就是一个模仿人学习的过程,正如语言文字最大的用处在于表现和传达知识一样,语言处理软件也应该具有传递知识,辅助教育的作用,多维拼音输入法软件的发展将定位在更多地给人以知识和学习上的帮助,而不仅仅是文字输入的工具。
多维拼音输入法的Linux版本将设计为网络词库同步训练,多人协同工作模式,并以网络服务方式提供。因此项目本身比较庞大,正在和我一班朋友合作策划中,同时欢迎有共同爱好者参与。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: