您的位置:首页 > 理论基础 > 计算机网络

2018-3-3 论文(网络评论中非结构化信息的表示与应用研究)笔记一

2018-03-03 20:24 267 查看
文章立脚点:

大量网络评论的出现,使得产品制造商或消费者很难跟踪己购产品用户的意见和建议,这就给他们的决策造成了额外的困难。

文章思路;

将网络评论中的非结构化信息处理成结构化信息

文章的总体的脉络

首先研宄评论分词、词性标注以及对歧义词、未登录词、禁用词的处理方法,然后分析比较传统特征抽取模型的优缺点,并在此基础上提出基于迭代思想的网络评论特征抽取模型,然后利用模糊认知图的知识表示和推理机制,充分考虑特征项之间、特征项与类别之间、类别与类别之间的因果关系和相互影响,提出基于模糊认知图的网络评论表示模型。在此基础上,利用分类器对网络评论进行分类,提出基于证据理论的网络评论综合评价模型。最后,收集来自于互联网的大量客户评论内容,并利用提出的模型和方法进行相应实验,得到了有效的实验结果,进而验证了模型的有效性。



研究背景:






研究意义:






文章主要内容:






论文研究路线:






特征提取的三种方式:






汉语文本的切分方式:






汉语相比较英语难切分:

(1)汉语的多意,一个汉字自己是一种意思,和另一个组合是一种意思,在和另外一个有是另一种

(2)英语中粗略的可以使用分隔符,作为分词的依据

(3)英语文本是小字符集上的已经充分分开的词串,而汉语文本是大字符集上的连续字符串,并且次与此之间没有明显的符号分割(比如空格符)

歧义字段分类以及目前切片策略






未登录词:

没有录入词典中作为切分的词(可以通过统计是否常用来更新词典中的词)

禁用词:

没有意义的词。其遵循的规则如下:




内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐