文本挖掘需要的技术栈
2017-03-27 11:31
148 查看
目地
技术栈
数据爬取方式
urllibRequests
Beautiful Soup
Selenium-PhantomJS
爬取框架
Scrapy
分布式爬虫
数据存储
MySql存储
分布式存储-NoSQL数据库
HDFS存储
Elastic Search存储
其他分布式存储方案
爬虫技巧
表单处理
模拟登陆
验证码处理
爬虫代理池
网页内容处理
爬虫容错
文本挖掘库
NLTK
TextBlob文本处理库
分词库
词云
文本挖掘相关概念
文本预处理
文本特征处理
文本聚类
深度学习与文本处理
案例
技术栈
数据爬取方式
urllibRequests
Beautiful Soup
Selenium-PhantomJS
爬取框架
Scrapy
分布式爬虫
数据存储
MySql存储
分布式存储-NoSQL数据库
HDFS存储
Elastic Search存储
其他分布式存储方案
爬虫技巧
表单处理
模拟登陆
验证码处理
爬虫代理池
网页内容处理
爬虫容错
文本挖掘库
NLTK
TextBlob文本处理库
分词库
词云
文本挖掘相关概念
文本预处理
文本特征处理
文本聚类
深度学习与文本处理
案例
目地
掌握网络信息的获取方法,熟练的进行文本分析处理技术栈
数据爬取方式
urllib/Requests
Beautiful Soup
Selenium-PhantomJS
爬取框架
Scrapy
分布式爬虫
数据存储
MySql存储
分布式存储-NoSQL数据库
HDFS存储
Elastic Search存储
其他分布式存储方案
爬虫技巧
表单处理
模拟登陆
验证码处理
爬虫代理池
网页内容处理
爬虫容错
文本挖掘库
NLTK
TextBlob文本处理库
分词库
词云
文本挖掘相关概念
文本预处理
文本特征处理
文本聚类
深度学习与文本处理
案例
相关文章推荐
- 文本挖掘技术在CIC的应用--转载
- TF-IDF 用于资讯检索与文本挖掘的常用加权技术
- 总结下这几年在文本挖掘领域的一些技术积累
- 文本挖掘之降维技术之特征选择
- R语言机器学习与大数据可视化暨Python文本挖掘与自然语言处理核心技术研修
- Web文本挖掘技术研究(王继成 潘金贵 张福炎)
- NLP基本功-文本相似度 | AI产品经理需要了解的AI技术通识
- pku,杨建武:文本挖掘技术
- pku,杨建武:文本挖掘技术
- NLP基本功-文本相似度 | AI产品经理需要了解的AI技术通识
- 数据挖掘:网络挖掘技术——微博文本特征提取
- 网络挖掘技术——微博文本特征提取
- 网络挖掘技术——微博文本特征提取
- 利用文本挖掘技术来找出《天龙八部》中的“小鲜词”
- 文本挖掘之降维技术之特征提取之因子分析(FA)
- 文本挖掘技术讲义
- 文本挖掘技术案例视频
- 文本挖掘之降维技术之特征选择
- 文本挖掘的简要综述:分类,聚类和提取技术
- NLP基本功-文本相似度 | AI产品经理需要了解的AI技术通识