基于语义依存关系的相似度算法简述
2016-06-20 12:23
387 查看
一、基本思路
1.依据语义依存关系提取关键信息(修饰关系、疑问关系)2.依照关键信息打分
3.计算分值,计算公式(待补充)
二、例子说明
1.例子1
句子:仲裁申请的资料需要哪些语义依存关系:
关键信息提取:
仲裁==>资料(疑问)
句子:申请仲裁需要提供什么资料
语义依存关系:
关键信息提取:
仲裁==>资料(疑问)
2.例子2
句子:你的名字是啥?语义依存关系:
关键信息提取:
你==>名字(疑问)
句子:你叫什么?
语义依存关系:
关键信息提取:
你==>名字(疑问)
句子:请问一下你的姓名是什么
语义依存关系:
关键信息提取:
你==>姓名(疑问)
句子:你的猫叫什么名字?
语义依存关系:
关键信息提取:
猫==>名字(疑问)
3.关键信息抽取信息规则
待补充4.相似度评分标准
1.主语、宾语设为第1档2.状语设为第2档(时间、地点、原因、介宾等)
3.谓语设为第3档
4.主语、宾语的修饰关系设为第4档
三、上下文的相似度
上下文关联:例子:
1.什么是仲裁
关键信息提取:仲裁
2.申请仲裁需要提供哪些资料
关键信息提取:仲裁、资料(疑问)
若
4000
是问题变为:
问1:什么是仲裁?
答1:仲裁是xx
问2:需要提供哪些资料
简要过程:
“问2”抽取:资料(疑问)
查找关键信息时找到了“申请仲裁需要提供哪些资料”,但缺少“仲裁”
正好可以从“问1”中补齐关键信息
这样就能算出“需要提供哪些资料”与“申请仲裁需要提供哪些资料”的相似度非常高
四、说明
语义依存关系标注方法采用哈工大的语法依存关系,网址:http://www.ltp-cloud.com/intro/#dp_how词义为哈工大的同义词林(扩展版)
相关文章推荐
- 基于语法树的语句识别算法
- 长期招聘:自然语言处理工程师
- 长期招聘:个性化推荐
- LDA学习心得
- comodo中国招聘 搜索与自然语言工程师
- 统计学习的几种方法
- mini edit distance & minimum cost alignment
- 最大熵模型介绍
- 数学之美 系列一 -- 统计语言模型
- 数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用
- 数学之美 系列七 -- 信息论在信息处理中的应用
- 数学之美 系列八-- 贾里尼克的故事和现代语言处理
- Google 黑板報 - 數學之美系列
- 图像处理工程师的要求
- 人工智能
- 特征表示与lucene
- 号召
- 数学之美 系列一 -- 统计语言模型
- 数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用