您的位置:首页 > 业界新闻

研究方案

2005-03-17 21:02 127 查看
 研究目标、研究内容和拟解决的关键问题

通过对自然语言处理技术的理解,采用J2EE分布式体系构架,开发具有自然语言处理能力的智能搜索引擎。实现智能搜索的过程主要分三部分:语义理解、知识管理和知识检索。其中,知识库是实现智能搜索的基础和核心。知识库提供的是语义理解中最终将要提供给用户的结果,同互联网的状况相同,人类的知识结构和容量都在飞速膨胀,所以知识库也需要有良好的适应能力。在语义理解的整个过程中,智能分词技术是最初的一个环节,它将组成语句的核心词提炼出来供语义分析模块使用。在分词的过程中,如何能够恰当地提供足够的词来供分析程序处理,并且过滤掉冗余的信息,这是后期语义分析的质量和速度的重要前提。加入了知识库处理技术的智能分词能够避免了传统分词技术在拆分时产生的歧义组合。从而为语义理解的处理提供了良好的原始材料。知识检索可以利用语义分析的结果,对知识库进行概念级的检索,对用户提出问题给出准确度最高、相关度最强的检索结果。
本人参与搜索引擎的整体系统分析和局部模块的设计和开发工作,实现基于自然语言处理技术的语义处理用户查询, 与传统搜索引擎相比,该搜索引擎的主要特点如下:更高的搜索的易用性
由于智能搜索引擎具有智能分词功能,因此使得查询变得更为简单、易于操作。搜索结果的范围定位准确
由于采用知识(概念)检索技术,明确和缩小的搜索范围,减少对无用信息的搜索。搜索结果的智能性
由于智能搜索引擎有综合知识库为背景,使得信息检索与导航服务更具有智能性。知识库中的知识有助于解决表达差异的问题。所谓表达差异就是用户使用不同的词表达同一概念。而知识库中关于同义词的定义正好可以消除这种表达差异带来的检索困难。
拟解决的关键:1)如何实现智能分词功能2)如何采用知识(概念)检索技术,明确和缩小的搜索范围,减少对无用信息的搜索。3)如何消除表达差异这一问题,尽可能地提供准确的搜索结果 3. 本论文或工程项目的特色与创新之处
采用J2EE 构架,分布式内容管理,高度灵活的体系构造架,可以和已有的企业应用系统进行交互。支持多种文件格式,具有语义处理引擎,理解用户查询内容,并通过基于“本体论”知识表达技术,分析识别用户所关心的领域信息,挖掘潜在意图,以提供最为恰当的反馈结果。并且随着提问的深入,通过对上下文的分析,来加强对当前语义的理解。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息