您的位置:首页 > 其它

基于语义依存关系的相似度算法简述

2016-06-20 12:23 387 查看

一、基本思路

1.依据语义依存关系提取关键信息(修饰关系、疑问关系)

2.依照关键信息打分

3.计算分值,计算公式(待补充)

二、例子说明

1.例子1

句子:仲裁申请的资料需要哪些

语义依存关系:



关键信息提取:

仲裁==>资料(疑问)

句子:申请仲裁需要提供什么资料

语义依存关系:



关键信息提取:

仲裁==>资料(疑问)

2.例子2

句子:你的名字是啥?

语义依存关系:



关键信息提取:

你==>名字(疑问)

句子:你叫什么?

语义依存关系:



关键信息提取:

你==>名字(疑问)

句子:请问一下你的姓名是什么

语义依存关系:



关键信息提取:

你==>姓名(疑问)

句子:你的猫叫什么名字?

语义依存关系:



关键信息提取:

猫==>名字(疑问)

3.关键信息抽取信息规则

待补充

4.相似度评分标准

1.主语、宾语设为第1档

2.状语设为第2档(时间、地点、原因、介宾等)

3.谓语设为第3档

4.主语、宾语的修饰关系设为第4档

三、上下文的相似度

上下文关联:

例子:

1.什么是仲裁

关键信息提取:仲裁

2.申请仲裁需要提供哪些资料

关键信息提取:仲裁、资料(疑问)


4000
是问题变为:

问1:什么是仲裁?

答1:仲裁是xx

问2:需要提供哪些资料

简要过程:

“问2”抽取:资料(疑问)

查找关键信息时找到了“申请仲裁需要提供哪些资料”,但缺少“仲裁”

正好可以从“问1”中补齐关键信息

这样就能算出“需要提供哪些资料”与“申请仲裁需要提供哪些资料”的相似度非常高

四、说明

语义依存关系标注方法采用哈工大的语法依存关系,网址:http://www.ltp-cloud.com/intro/#dp_how

词义为哈工大的同义词林(扩展版)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息