RLcode 项目是一个强化学习教程,作者以尽量易懂的方式讲解了强化学习原理知识和实现代码。是一份很棒的强化学习入门教程,更多信息在这里 👉 juejin.cn

第一部分:概念
💦 马尔科夫链
💦 Q值和V值
💦 用蒙地卡罗方法(Monte-Carlo)估算V值
💦 用时序差分TD估算状态V值

第二部分:核心算法(附代码)
💦 Qlearning算法
💦 深度神经网络
💦 DQN算法
💦 Double DQN
💦 策略梯度(Policy Gradient)
💦 Actor-Critic
💦 argparse模块
💦 PPO算法
💦 DDPG算法
💦 TD3算法
展开
ShowMeAI于2022-10-03 13:03发布的图片
评论
评论