研究方案
2005-03-17 21:02
127 查看
研究目标、研究内容和拟解决的关键问题
通过对自然语言处理技术的理解,采用J2EE分布式体系构架,开发具有自然语言处理能力的智能搜索引擎。实现智能搜索的过程主要分三部分:语义理解、知识管理和知识检索。其中,知识库是实现智能搜索的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结果,同互联网的状况相同,人类的知识结构和容量都在飞速膨胀,所以知识库也需要有良好的适应能力。在语义理解的整个过程中,智能分词技术是最初的一个环节,它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中,如何能够恰当地提供足够的词来供分析程序处理,并且过滤掉冗余的信息,这是后期语义分析的质量和速度的重要前提。加入了知识库处理技术的智能分词能够避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。知识检索可以利用语义分析的结果,对知识库进行概念级的检索,对用户提出问题给出准确度最高、相关度最强的检索结果。
本人参与搜索引擎的整体系统分析和局部模块的设计和开发工作,实现基于自然语言处理技术的语义处理用户查询, 与传统搜索引擎相比,该搜索引擎的主要特点如下:更高的搜索的易用性
由于智能搜索引擎具有智能分词功能,因此使得查询变得更为简单、易于操作。搜索结果的范围定位准确
由于采用知识(概念)检索技术,明确和缩小的搜索范围,减少对无用信息的搜索。搜索结果的智能性
由于智能搜索引擎有综合知识库为背景,使得信息检索与导航服务更具有智能性。知识库中的知识有助于解决表达差异的问题。所谓表达差异就是用户使用不同的词表达同一概念。而知识库中关于同义词的定义正好可以消除这种表达差异带来的检索困难。
拟解决的关键:1)如何实现智能分词功能2)如何采用知识(概念)检索技术,明确和缩小的搜索范围,减少对无用信息的搜索。3)如何消除表达差异这一问题,尽可能地提供准确的搜索结果 3. 本论文或工程项目的特色与创新之处
采用J2EE 构架,分布式内容管理,高度灵活的体系构造架,可以和已有的企业应用系统进行交互。支持多种文件格式,具有语义处理引擎,理解用户查询内容,并通过基于“本体论”知识表达技术,分析识别用户所关心的领域信息,挖掘潜在意图,以提供最为恰当的反馈结果。并且随着提问的深入,通过对上下文的分析,来加强对当前语义的理解。
通过对自然语言处理技术的理解,采用J2EE分布式体系构架,开发具有自然语言处理能力的智能搜索引擎。实现智能搜索的过程主要分三部分:语义理解、知识管理和知识检索。其中,知识库是实现智能搜索的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结果,同互联网的状况相同,人类的知识结构和容量都在飞速膨胀,所以知识库也需要有良好的适应能力。在语义理解的整个过程中,智能分词技术是最初的一个环节,它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中,如何能够恰当地提供足够的词来供分析程序处理,并且过滤掉冗余的信息,这是后期语义分析的质量和速度的重要前提。加入了知识库处理技术的智能分词能够避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。知识检索可以利用语义分析的结果,对知识库进行概念级的检索,对用户提出问题给出准确度最高、相关度最强的检索结果。
本人参与搜索引擎的整体系统分析和局部模块的设计和开发工作,实现基于自然语言处理技术的语义处理用户查询, 与传统搜索引擎相比,该搜索引擎的主要特点如下:更高的搜索的易用性
由于智能搜索引擎具有智能分词功能,因此使得查询变得更为简单、易于操作。搜索结果的范围定位准确
由于采用知识(概念)检索技术,明确和缩小的搜索范围,减少对无用信息的搜索。搜索结果的智能性
由于智能搜索引擎有综合知识库为背景,使得信息检索与导航服务更具有智能性。知识库中的知识有助于解决表达差异的问题。所谓表达差异就是用户使用不同的词表达同一概念。而知识库中关于同义词的定义正好可以消除这种表达差异带来的检索困难。
拟解决的关键:1)如何实现智能分词功能2)如何采用知识(概念)检索技术,明确和缩小的搜索范围,减少对无用信息的搜索。3)如何消除表达差异这一问题,尽可能地提供准确的搜索结果 3. 本论文或工程项目的特色与创新之处
采用J2EE 构架,分布式内容管理,高度灵活的体系构造架,可以和已有的企业应用系统进行交互。支持多种文件格式,具有语义处理引擎,理解用户查询内容,并通过基于“本体论”知识表达技术,分析识别用户所关心的领域信息,挖掘潜在意图,以提供最为恰当的反馈结果。并且随着提问的深入,通过对上下文的分析,来加强对当前语义的理解。
相关文章推荐
- Delphi版 关于QQ输入控件无法Spy到句柄的实现方案可行性研究
- unity 纯C# android 端PC端 热更方案研究
- windows环境下,远程传输文件方案研究资料整理
- 基于淘宝弹性布局方案lib-flexible的问题研究
- 腾讯GT的流畅度测试方案研究
- php上传图片重命名 6种方案研究与总结
- php上传图片重命名 6种方案研究与总结
- Atitit attilax要工作研究的要素 纪要 方案 趋势 方向 概念 理论
- 云存储安全方案研究
- Docker监控方案(TIG)的研究与实践之Telegraf
- 淘宝弹性布局方案lib-flexible研究
- Android基于WIFI实现电脑和手机间数据传输的技术方案研究
- Androidの共享登录之方案研究
- 安卓非微信内置浏览器中的网页调起微信支付的方案研究
- 基于电力线载波的物联网智能家居控制系统研究方案
- 关于extjs大量数据导入方案研究
- 校园数字化建设--注册中心投标文件研究(2)--设计方案总体技术框架
- Linux下的高可用性方案研究
- CWMP开源代码研究番外篇——博通方案
- Delphi版 关于QQ输入控件无法Spy到句柄的实现方案可行性研究