我把算法模型套在了这波股市上,发现...

530 阅读3分钟

跑步进场

最近股市大涨,不少人忙着跑步进场。作为保守型“投资者”,主投指数基金:沪深300。在这波行情 中,短短2个月,也有13%的账面收益。虽然知道指数类适合长期持有,但也好奇,这个点是否是高位了。为了解决这个疑虑。我们今天用算法模型套一套,看能否发现些什么。

时序预测的价值

时序问题的预测在生活中很常见。例如:游戏在线人数预测、消费情况预测、 O2O 的到店人数预测、交通流量预测,这些场景的精确预测,为资源的调配起到了重大的参考作用。从个体角度来说,得到的服务和体验也大大提升。

为此,Facebook 开源了一套工具 Prophet,专门用于时间学列预测。在这里,我们将用它,来一探股市究竟。

时序预测的原理

对于时间序列问题,常用的手法是时间序列的分解:这里有些类似于傅里叶变换的意味。将一个函数分解为多个规律函数的和积。时间序列的常见组成成分包括:季节项、趋势项以及噪声。在 Prophet 中,结合实际情况,他们又加入了节假日项目。之前在一次 kaggle 的比赛中,我们也发现节假日的数据波动,其实是类似于周末效应的。即:节假日的前后数据,类似于周六的前后数据。对数据进行修正后,评价指标会好很多。


废话不多说,咱们开干。

Prophet in 沪深300

工具包安装

pip install fbprophet

数据准备与清洗

import pandas as pd
import numpy as np
from fbprophet import Prophet

数据准备

data = pd.read_csv('../data/000300.csv',encoding='GB2312') 
data.head()

数据清洗

  • 选取需要的数据,并对数据做 log / box-cox 变换,使数据更符合线性、正态分布,减少方差差异。经济系统和生态系统类似,都存在指数级增长现象,也存在饱和现象。我们这里采用 log 变换。
df = data[[u'日期',u'收盘价']]
df.columns = ['ds','y']
df['y'] = df['y'].apply(lambda x: np.log(int(x)))

模型拟合与预测

简单定义,然后拟合。

m = Prophet()
m.fit(df)

预测未来一年的行情

future = m.make_future_dataframe(periods=365)
forecast = m.predict(future)

详细看最后15天的数据

forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail(15)
future_predict['yhat'] = future_predict['yhat'].apply(lambda x:np.exp(x))
future_predict['yhat_lower'] = future_predict['yhat_lower'].apply(lambda x:np.exp(x))
future_predict['yhat_upper'] = future_predict['yhat_upper'].apply(lambda x:np.exp(x))

yhat 预测比较保守,20200307 相较于目前20190308 的大盘涨了100个点。预期最大收益:(6536-3658)/3658≈ 78%,预期最大亏损:(2158-3658)/3658≈-41%

模型看到了什么

Prophet 有个功能是成分拆分,咱们来看看国内股市的趋势以及季节性因素是什么。

fig1 = m.plot(forecast)

模型拟合情况

模型拟合情况

趋势项

整体趋势、周趋势和年趋势

总结

模型数据表明,沪深股市短期看可能有波动,长期看上扬可能性更大。短期对于我们这种投资方式的参考意义不大,长期来看,稳中向好,我也将持续沪深300。当然,话说回来,投资有风险,决策需谨慎。不要只看狼吃肉,不见狼挨打。去年最差的时候,本人累计亏损15%...

另外再强调一下,模型并非万能。这里使用的信息单一,但真实世界,可是有多种信息共同作用于市场。模型也还未经过充分调参,没有划分数据做验证,实际使用价值有限。

对此,你怎么看?请在留言区写下你的看法。

原文链接:kuhungio.me/2019/prophe…