这周重新把学期初看的隐马尔可夫模型重新捡起来。重新理解HMM模型。后面看到耦合隐马尔可夫模型。所谓coupled hmm,就是引入了外部变量后观察状态变成观察状态对。认识到这一点,太重要了。许多问题都迎刃而解了。提高模型的准确度的问题就变成了如何生成状态对。
大抵可以从三个思路出发
- 指数本身(HMM)
- 加上其他国家的指数(CHMM)
- 加上其他因子 (决策树模型?)
这周的工作:
-
获得股票数据
- 标普500的数据
- 沪深300
-
用暴力搜索出最好的窗口大小,但似乎是有问题的,窗口大小的确定对于预测的准确程度影响很大,这也是下周要探索的问题。
-
隐状态的大小,目前隐状态设置隐状态是3个。后续可以试试不同的数值
-
初始值对结果的影响
-
观察值的设定,根据沪深300的和标普500的涨跌幅符合正态分布。以(-2,0,2)作为阈值来区分观察值
下周的展望:
-
查阅论文看看初始值怎么选择
-
试试其他因子作为观察值
-
能否加入决策树模型?
暂时只想到这些,先写到这吧。