强化学习
1 编程
1.1 环境
Gym
1.2实践出真知
1.3 coding
MorvanZhou/Reinforcement-learning-with-tensorflow
★(mofan系)白话强化学习与PyTorch实现:
github.com/catziyan/DR… github.com/GAOYANGAU/D… blog.csdn.net/cat_ziyan/a…
(mofan系)Dueling DQN_torch实现他的其他DQN实现:www.zhihu.com/people/bai-…
yeqiang/ReinforcemengLearningPractice
1.4 框架
使用tensorflow实现DQN——OpenAI Baselines
强化学习快速上手:编写自定义通用gym环境类+主流开源强化学习框架调用
2 算法
3 博客专栏
3.1 专栏
3.2 笔记
简洁的视频笔记: 微丶念David Silver强化学习课程笔记
3.3 路线图
安装踩坑
关于ubuntu16.04下的安装问题
anaconda使用
tensorflow
卡尔曼滤波
A geometric interpretation of the covariance matrix
Kalman滤波器作状态观测器设计时为什么只要求被控系统可测(detectable)即可?
书籍推荐:
画图网站
数学建模
学习资料、视频
MDP
【机器学习】白板推导系列(三十四) ~ 强化学习之马尔科夫决策过程
(MDP书看完后看这个)强化学习纲要
策略评估、策略迭代、值迭代的收敛性证明(压缩映射定理):
zhuanlan.zhihu.com/p/108484403
zhuanlan.zhihu.com/p/111104420