收藏夹

1,147 阅读2分钟

强化学习

1 编程

1.1 环境

Gym

OpenAI Gym使用、rendering画图

github: openai / gym

官方文档

gym环境注册教程

1.2实践出真知

调参必看:深度强化学习落地方法论

洛荷强化学习实践

GAZEBO下DQN开发

1.3 coding

MorvanZhou/Reinforcement-learning-with-tensorflow

★(mofan系)白话强化学习与PyTorch实现:

github.com/catziyan/DR… github.com/GAOYANGAU/D… blog.csdn.net/cat_ziyan/a…

(mofan系)Dueling DQN_torch实现他的其他DQN实现:www.zhihu.com/people/bai-…

yeqiang/ReinforcemengLearningPractice

17种深度强化学习算法用Pytorch实现

1.4 框架

使用tensorflow实现DQN——OpenAI Baselines

强化学习快速上手:编写自定义通用gym环境类+主流开源强化学习框架调用

2 算法

最通俗易懂的DQN介绍

rainbowDQN:DQN及其改进

Prioritized DQN

Prioritized DQN

DDPG

3 博客专栏

3.1 专栏

最新论文介绍:强化学习前沿

通俗易懂:白话强化学习

叶强强化学习实践

深度强化学习

3.2 笔记

简洁的读书笔记:机器学习读书笔记汇总 - 强化学习篇

简洁的视频笔记: 微丶念David Silver强化学习课程笔记

3.3 路线图

全面:强化学习路线图(岳路飞)

详细:强化学习线路图(白话强化学习)

范围广:完备的 AI 学习路线

安装踩坑

关于ubuntu16.04下的安装问题

juejin.cn/post/684490…

anaconda使用

conda常用命令

anaconda安装pytorch

anaconda用git来安装baselines框架

pycharm配置Anaconda的环境

tensorflow

tensorflow2.0使用1.x模块

卡尔曼滤波

卡尔曼滤波 学习目录

A geometric interpretation of the covariance matrix

Kalman滤波器作状态观测器设计时为什么只要求被控系统可测(detectable)即可?

如何直观地理解「协方差矩阵」?

图解卡尔曼滤波器 ☆英文原版材料

kalman滤波和最小二乘的异同点

卡尔曼滤波与梯度下降法、牛顿法等最优化方法的区别是什么?

☆贝叶斯滤波与卡尔曼滤波 ☆组合导航系统-

书籍推荐:

画图网站

绘制神经网络图层

数学建模

数学建模 学习笔记目录

学习资料、视频

数学视频、资料推荐:非数学专业出身的工科博士如何学好数学?

pytorch学习:官网文档

强化学习路线图,袁路飞

☆完备的 AI 学习路线,黄海广博士

☆机器学习路线,红色石头

MDP

【机器学习】白板推导系列(三十四) ~ 强化学习之马尔科夫决策过程

【机器学习】白板推导系列(三十五) ~ 强化学习之动态规划

(MDP书看完后看这个)强化学习纲要

策略评估、策略迭代、值迭代的收敛性证明(压缩映射定理):

zhuanlan.zhihu.com/p/39279611

zhuanlan.zhihu.com/p/68407730

zhuanlan.zhihu.com/p/108484403

zhuanlan.zhihu.com/p/111104420

latex教程

☆十五分钟学会latex系列