情感分析论文阅读笔记
2016-03-02 18:02
344 查看
参考资料:
http://xueshu.baidu.com/s?wd=paperuri%3A%28b6abec56d591d7b37cdc13716932d1ba%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Fwenku.baidu.com%2Fview%2F124e7e2b2af90242a895e542.html&ie=utf-8
基于情感的文本分类
研究的实际应用:
推荐系统,过滤系统
与基于主题的文本分类类似,不同之处在于具有主观性的词语更重要
算法:
朴素备叶斯:
利用类别的先验概率和特征分布相对于类别的条件概率来计算未知文档属于某一类别的概率。
采用文本向量空间模型表示文档。
最大熵:(待补充)
是在满足系统当前提供的所有条件下寻求分布最均匀的模型, 即熵最大的模型。
分析:
文档的情感主要是通过具有情感倾向的词语( 或共现/ 关联词语) 来体现出来的,
注意:否定词不再作为停用词删除,因为当其否定的对象具有语义倾向的时候,发生反向变化这样的词语主要是有形容词、
名词、动词、成语和习惯用语。
有效识别不带感情倾向的客观语句。
中文分词方法:
备忘:中文情感词典,sentiment analysis,
http://xueshu.baidu.com/s?wd=paperuri%3A%28b6abec56d591d7b37cdc13716932d1ba%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Fwenku.baidu.com%2Fview%2F124e7e2b2af90242a895e542.html&ie=utf-8
基于情感的文本分类
研究的实际应用:
推荐系统,过滤系统
与基于主题的文本分类类似,不同之处在于具有主观性的词语更重要
算法:
朴素备叶斯:
利用类别的先验概率和特征分布相对于类别的条件概率来计算未知文档属于某一类别的概率。
采用文本向量空间模型表示文档。
最大熵:(待补充)
是在满足系统当前提供的所有条件下寻求分布最均匀的模型, 即熵最大的模型。
分析:
文档的情感主要是通过具有情感倾向的词语( 或共现/ 关联词语) 来体现出来的,
注意:否定词不再作为停用词删除,因为当其否定的对象具有语义倾向的时候,发生反向变化这样的词语主要是有形容词、
名词、动词、成语和习惯用语。
有效识别不带感情倾向的客观语句。
中文分词方法:
备忘:中文情感词典,sentiment analysis,
相关文章推荐
- 样式(Style)与主题(Theme)的自定义
- Source insight 常用快捷键
- ArrayList类型变量
- 初识solr + tomcat 部署(非集群)
- git 创建branch分支【转】
- 使用SQL 查询 第一条数据
- php核心知识要点
- HTML+CSS Day05 基本CSS选择器、复合CSS选择器与CSS继承性
- 解决Error:Android Dex: com.android.dex.DexIndexOverflowException: Cannot merge new index 65918 into a
- Android学习笔记----Activity的生命周期
- Linux中find常见用法示例
- Android 发短信功能实现
- cxf框架和spring mvc的集成
- C#数据类型
- git简单基本操作
- 关于Redis的启动过程
- Qt浅谈之四十六QemuQuestAgent的应用
- IOS开发 多线程
- 数据结构和算法分析习题解答之二——第1章习题解答
- C#关键字