Python预测股票走势
2018-02-04 15:12
423 查看
Python的功能可谓相当强大,在很多行业具有相当的优势,这种优势很大程度上来源于各种第三方库。本文介绍了如何利用时间序列模型ARIMA进行股票走势预测。
环境:windows 64
平台:Jupyter Notebook (Kernel python3)
库:tushare statsmodels pandas numpy seaborn matplotlib
先来看看效果吧
图1 预测结果图
图1中橙色线条为股票行情实际数据,蓝色线条为模型预测的行情走势,预测结果显示股票呈上涨趋势,从长期来看,还是符合实际走势的,证明了ARIMA模型具有一定的可信性。但是在这里还是要提醒大家一句,股市有风险,投资需谨慎。模型只能提供一个参考,并不能完全正确的指导用户投资。
具体的介绍点我。
tushare的安装方法很简单, pip install tushare即可。
导入库,然后调用get_h_data函数获取数据,‘600000’指定股票代码,start指定数据开始的日期,最后将获取的数据使用to_csv函数以csv格式保存到本地。
注意:调用get_h_data时有时会出现错误,可能是由于服务器不稳定,重新执行即可。但两次调用之间要间隔一定时间。
使用pandas的read_csv函数进行读取数据,各指标意义见代码段中的注释。
图2 读取数据展示
pandas读取出的数据如图2所示,我们将选取close,即收盘价作为考核指标来建立ARIMA模型。
原始数据是股票每天的行情,我们这里将数据进行重采样,按每周的平均行情来进行分析,‘W-TUE’表示按周为单位,指定周二为基准日,即周二到下个周二为一个计算周期。
画图看一下现在的数据
图3 重采样后的数据
图3使用matplotlib和seaborn绘制,代码如下
由图3可以看出,数据波动比较大,而时间序列模型要求数据平缓,满足平稳性的要求。因此需要对数据进行差分处理。
图4 一阶差分结果图
一阶差分的结果如图4所示,图4可以看出数据基本已经趋于平缓,为了确定一阶差分足以满足需求,再进行ACF和PACF检验,ACF和PACF可以直接调用statemodel里的函数进行求算。
图5 ACF结果图
图6 PACF结果图
由图5和图6可以看出,进行一阶差分时,结果已经落在了置信区间内(图中蓝色区域),因此可以确定进行一阶差分是可靠有效的。
接下来就可以进行ARIMA模型训练了
参数order=(1,1,1)表示一阶差分,ACF和PACF的取值均为1,关于差分阶数、ACF、PACF取值详细介绍点我。
最后一步就是利用建立好的result模型来预测走势了
需要注意的是,预测数据起始时间必须在训练集内,而终止时间则没有限制
画图
就可以看见文章开头的结果了
4000
环境:windows 64
平台:Jupyter Notebook (Kernel python3)
库:tushare statsmodels pandas numpy seaborn matplotlib
先来看看效果吧
图1 预测结果图
图1中橙色线条为股票行情实际数据,蓝色线条为模型预测的行情走势,预测结果显示股票呈上涨趋势,从长期来看,还是符合实际走势的,证明了ARIMA模型具有一定的可信性。但是在这里还是要提醒大家一句,股市有风险,投资需谨慎。模型只能提供一个参考,并不能完全正确的指导用户投资。
股票行情数据获取
数据的获取利用第三方库tushare,tushare是一个免费、开源的python财经数据接口包,具体的介绍点我。
tushare的安装方法很简单, pip install tushare即可。
import tushare data=tushare.get_h_data('600000',start='2005-05-05') data.to_csv('600000_2005.csv')
导入库,然后调用get_h_data函数获取数据,‘600000’指定股票代码,start指定数据开始的日期,最后将获取的数据使用to_csv函数以csv格式保存到本地。
注意:调用get_h_data时有时会出现错误,可能是由于服务器不稳定,重新执行即可。但两次调用之间要间隔一定时间。
数据读取与预处理
df=pd.read_csv('600000_2005.csv',index_col=0,parse_dates=[0]) #index_col表示把第一列设为index,parse_dates=[0]表示把第一列按datetime格式解析
使用pandas的read_csv函数进行读取数据,各指标意义见代码段中的注释。
图2 读取数据展示
pandas读取出的数据如图2所示,我们将选取close,即收盘价作为考核指标来建立ARIMA模型。
ARIMA模型建立
stock_week=df['close'].resample('W-TUE').mean() #将收盘价作为评判标准,resample指按周统计平均数据(可以指定哪天为基准日,此处是周二为基准) stock_train=stock_week['2005':'2017'].dropna() #选取2005-2017的数据
原始数据是股票每天的行情,我们这里将数据进行重采样,按每周的平均行情来进行分析,‘W-TUE’表示按周为单位,指定周二为基准日,即周二到下个周二为一个计算周期。
画图看一下现在的数据
图3 重采样后的数据
图3使用matplotlib和seaborn绘制,代码如下
stock_train.plot(figsize=(12,8)) # plt.legend(bbox_to_anchor=(1.25,0.5)) plt.title('Close Price') sns.despine() #边框控制,默认没有上方和右方的框 plt.show()
由图3可以看出,数据波动比较大,而时间序列模型要求数据平缓,满足平稳性的要求。因此需要对数据进行差分处理。
stock_diff=stock_train.diff().dropna() #对数据进行差分,目的使数据平缓,满足平稳性的要求 plt.figure() plt.plot(stock_diff) font_loc='' plt.title('一阶差分',fontproperties=font_set) #注意要设置字体,否则会乱码 plt.show()
图4 一阶差分结果图
一阶差分的结果如图4所示,图4可以看出数据基本已经趋于平缓,为了确定一阶差分足以满足需求,再进行ACF和PACF检验,ACF和PACF可以直接调用statemodel里的函数进行求算。
from statsmodels.graphics.tsaplots import plot_acf,plot_pacf acf=plot_acf(stock_diff,lags=20) plt.title('ACF') acf.show() plt.show() pacf=plot_pacf(stock_diff,lags=20) plt.title('PACF') pacf.show() plt.show()
图5 ACF结果图
图6 PACF结果图
由图5和图6可以看出,进行一阶差分时,结果已经落在了置信区间内(图中蓝色区域),因此可以确定进行一阶差分是可靠有效的。
接下来就可以进行ARIMA模型训练了
model=ARIMA(stock_train,order=(1,1,1),freq='W-TUE')#训练模型,order表示(p,d,q) result=model.fit()
参数order=(1,1,1)表示一阶差分,ACF和PACF的取值均为1,关于差分阶数、ACF、PACF取值详细介绍点我。
最后一步就是利用建立好的result模型来预测走势了
pred=result.predict('20160816','20180112',dynamic=True,typ='levels')#注意预测的起始时间要在训练时间的范围内,结束时间没有要求
需要注意的是,预测数据起始时间必须在训练集内,而终止时间则没有限制
plt.figure(figsize=(6,6)) plt.xticks(rotation=45) plt.plot(pred) plt.plot(stock_train) plt.show()
画图
就可以看见文章开头的结果了
4000
注:第一次发博客,不足之处欢迎大家提意见,另外该博文主要参考了唐宇迪机器学习视频以及很多已有博客,在此予以声明。
相关文章推荐
- 基于Spark Streaming预测股票走势的例子(一)
- 神经网络预测股票价格走势
- 基于ARIMA的股票预测 Python实现 附Github
- 一文教你如何用Python预测股票价格
- 科学经得起实践检验-python3.6通过决策树实战精准准确预测今日大盘走势(含代码)
- 如何利用Python预测股票价格
- 一文教你如何用Python预测股票价格
- [20160225] 太空工程师入门 / LOL 10级 / 股票走势预测
- 一文教你如何用Python预测股票价格
- 3/19股票操作总结&明日走势预测
- 贝叶斯分类对股票走势预测
- 3/20股票操作总结&下周走势预测
- 一文教你如何用Python预测股票价格,程序员学以致用
- R语言svm预测股票走势
- 基于SVM的股票预测 Python实现 附Github
- 科学经得起实践检验-python3.6通过决策树实战精准准确预测今日大盘走势(含代码)
- 基于小波变换的时间序列预测,Python实现,来自雪球,
- 使用Python预测黄金AU9999收盘价
- LSTM模型分析及对时序数据预测的具体实现(python实现)