【Deep Learning】Using Structured Events to Predict Stock Price Movement:An Empirical Investigation
2015-08-07 16:04
190 查看
时间:2014
发表于:EMNLP
原文件:http://pan.baidu.com/s/1i3phG49
主要内容:
利用新闻事件来预测:1. 美股大盘走势;2. 挑选的15个个股的走势。
详细内容:
主要工作步骤:
1. 抽取财经新闻
2. 对新闻title进行parser,并进行事件抽取。
其中事件抽取是open information extraction,即不限定事件的模版,而是进行开放式抽取。抽取的结果是:(主语、动词、宾语、时间)。其中,各个元素都会做stemming,动词会做聚类、变成动词类别,如:get_class这个类别。
3. 对抽取的结果进行泛化,如:将(主语、动词、宾语、时间)泛化成几个输入,(主语、动词)、(动词、宾语)等等,从而避免原始输入的数据稀疏问题。
4. 将上述输入给到分类模型,如:svm、或者deep learning,进行二值分类,从而预测大盘和单只股票的涨跌
实验:
在美股上做的,用了Reuters和Bloomberg的财经频道的新闻,分别预测大盘以及个股的下一天、下一周、下一个月的涨跌。对比baseline是仅仅采用词袋输入特征的模型(svm或者deep learning)
实验结果:
1. 预测一天的准确率要高于预测的时间长的,说明事件对于短期的股票预测作用比较大
2. title数据最有用,加入了content数据、反而预测准确率下降了
3. deep learning比svm有用,不过隐层2层效果最好,3层就不好了,没有尝试更多层
相关工作:
1. 之前的人是采用词袋特征+分类器来进行预测的
2. 在词袋特征的基础上,一种扩展方法是加入短语特征,如:名词性短语
3. 在词袋特征的基础上,另一种扩展方法是加入语义特征,如:通过广大用户在twitter上的情绪指数来预测大盘走势
发表于:EMNLP
原文件:http://pan.baidu.com/s/1i3phG49
主要内容:
利用新闻事件来预测:1. 美股大盘走势;2. 挑选的15个个股的走势。
详细内容:
主要工作步骤:
1. 抽取财经新闻
2. 对新闻title进行parser,并进行事件抽取。
其中事件抽取是open information extraction,即不限定事件的模版,而是进行开放式抽取。抽取的结果是:(主语、动词、宾语、时间)。其中,各个元素都会做stemming,动词会做聚类、变成动词类别,如:get_class这个类别。
3. 对抽取的结果进行泛化,如:将(主语、动词、宾语、时间)泛化成几个输入,(主语、动词)、(动词、宾语)等等,从而避免原始输入的数据稀疏问题。
4. 将上述输入给到分类模型,如:svm、或者deep learning,进行二值分类,从而预测大盘和单只股票的涨跌
实验:
在美股上做的,用了Reuters和Bloomberg的财经频道的新闻,分别预测大盘以及个股的下一天、下一周、下一个月的涨跌。对比baseline是仅仅采用词袋输入特征的模型(svm或者deep learning)
实验结果:
1. 预测一天的准确率要高于预测的时间长的,说明事件对于短期的股票预测作用比较大
2. title数据最有用,加入了content数据、反而预测准确率下降了
3. deep learning比svm有用,不过隐层2层效果最好,3层就不好了,没有尝试更多层
相关工作:
1. 之前的人是采用词袋特征+分类器来进行预测的
2. 在词袋特征的基础上,一种扩展方法是加入短语特征,如:名词性短语
3. 在词袋特征的基础上,另一种扩展方法是加入语义特征,如:通过广大用户在twitter上的情绪指数来预测大盘走势
相关文章推荐
- poj 3281 Dining 【最大流】
- TCA9546A
- QT 多语言 字库 编码 文字方向相关问题
- 运算符重载
- iOS开发 - 微信扫描二维码登录网页的原理
- Code Complete 读后总结和新的扩展阅读计划
- Android面试中经常遇到的问题
- 面试题:限制用户登录(请求)频率,如限制用户在1分钟之内最多登录10次
- 与oc字符串有关的习题以及答案
- 9.7数学与概率(三)——在二维平面上,有两个正方形,请找出一条直线,能够将这两个正方形对半分
- SSH框架的No result defined for action 错误
- [kuangbin带你飞]专题四 最短路练习
- poj 2752 Seek the Name, Seek the Fame
- JavaScript new 一个构造函数
- 专访杨云君:变身优秀开发者的学习之道
- magento后台产品超过1000个,修改分类信息无法保存
- MongoDB基本用法
- 流操作text文件------读取、保存文档
- 导入项目后,make project时出错
- C# 委托及各种写法