Tensorflow实现微博的评论情感分类模型
2018-02-27 22:59
405 查看
学习研究项目:基于微博评论的数据挖掘与情感分析
Github地址:情感分类模型源码项目简介
学习卷积神经网络,循环神经网络在实际环境下的应用,提升实践能力,了解深度学习在自然语言处理方面的进展cnn_for_text_classify
具备较强的自动关键词提取能力,在酒店评论测试集上达到95%的准确率采用l2正则和dropout来控制过拟合现象
4种卷积核使其能提取局部高效的短特征
lstm_for_text_classify
具有较强的对长难句,反问句,阴阳怪气句的判断能力,在在酒店评论测试集上达到97%的准确率采用双向LSTM网络
对输入数据进行dropout,模拟增大样本空间
LSTM层与层之间进行dropout
对LSTM网络权重,偏置进行l2正则,抗过拟合
网络采用正交初始化,加快收敛速度,提升训练集上的正确率,大幅提升测试集上的正确率
采用Clipping Gradients,防止梯度爆炸,提升测试集上的正确率
word2vec:
项目使用的词向量:embedding_64.bin(1.5G)训练语料:百度百科800w条 20G+搜狐新闻400w条 12G+小说:90G左右
模型参数:window=5 min_count=5 size=64
下载链接:百度网盘链接 密码:wzqv
文件功能介绍
./weibo.py:微博评论爬虫
readdata.py:为情感分析模型提供多种数据加载相关API
word2vec.py:为情感分析模型提供多种词向量的相关API
cnn_model.py:CNN文本分类模型图结构
cnn_train.py:CNN文本分类训练代码
cnn_test.py: CNN文本分类测试代码
lstm_model.py:lstm文本分类模型图结构
lstm_train.py:lstm文本分类训练代码
lstm_test.py: lstm文本分类测试代码
mixed_cnn_lstm_test.py:采用模型融合方式将cnn与lstm的结果进行融合投票绝对最终结果
./data
pos.txt:正面评价数据集
neg.txt:负面评价数据集
test.txt:自己放样本测试
embedding_64.bin:训练好的词向量模型
/cnn:cnn模型训练完成的相关数据参数
/lstm:lstm模型训练完成的相关数据参数
推荐运行环境
python 3.6tensorflow-gpu 1.4
gensim 3.3
Ubuntu 64 Bit / windows10 64 Bit
使用模型注意事项
1.文本TXT文件必须采用UTF-8编码格式,非UTF-8格式的,去记事本中另存为的时候选择UTF-82.pos.txt、neg.txt、test.txt 文件一行为一条评论,长度不限,可以有英文和标点(反正都会去除的),不要词性标注信息
3.词向量模型一定要用我放的那个64维度的bin文件
4.模型代码在windows上测试过基本没bug,linux平台没测试过,不过肯定需要自行修改文件路径
模型结构
CNN模型优化
LSTM模型优化
相关文章推荐
- tensorflow训练自己的数据集实现CNN图像分类2(保存模型&测试单张图片)
- 字符级卷积神经网络(Char-CNN)实现文本分类--模型介绍与TensorFlow实现
- Tensorflow使用slim工具(vgg16模型)实现图像分类与分割
- 机器学习实验(十二):深度学习之图像分类模型AlexNet结构分析和tensorflow实现
- TensorFlow练手项目一:使用循环神经网络(RNN)实现影评情感分类
- CNN模型和RNN模型在分类问题中的应用(Tensorflow实现)
- PaddlePaddle文本卷积实现情感分类和微博女友情绪监控AI
- Laravel5.1 实现第三方登录认证(包括微博、QQ、微信、豆瓣) 2017-01-08 18:08 457人阅读 评论(0) 收藏 举报 分类: laravel框架(33) 目录(?)[
- 基于Tensorflow的英文评论二分类CNN模型
- TensorFlow损失函数(loss function) 2017-08-14 11:32 125人阅读 评论(0) 收藏 举报 分类: 深度学习及TensorFlow实现(10) 版权声明:
- Tensorflow使用slim工具(vgg16模型)实现图像分类与分割
- Tensorflow使用slim工具(vgg16模型)实现图像分类与分割
- Tensorflow实现图像分割——FCN模型
- Tensorflow实现基于LSTM的文本分类方法
- tensorflow实现机器学习模型的基本步骤
- 利用TFIDF实时微博情感分类-朴素贝叶斯算法
- ASP.NET中登录页验证码的实现 分类: ASP.NET 2012-03-08 22:44 4936人阅读 评论(5) 收藏
- 在 TensorFlow 中实现文本分类的卷积神经网络
- 朴素贝叶斯案例1:进行文档/评论分类(python实现)
- TensorFlow实现模型评估