首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户3609319618245
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
用户3609319618245
赞了这篇文章
盐的甜
研究生
·
5年前
关注
强化学习 5 —— SARSA 和 Q-Learning 代码实现与详解
上篇文章 强化学习——时序差分 (TD) --- SARSA and Q-Learning 我们介绍了时序差分TD算法解决强化学习的评估和控制问题,TD对比MC有很多优势,...
2
评论
分享
用户3609319618245
关注了
盐的甜
用户3609319618245
关注了
小菜羊
用户3609319618245
关注了
richard_dai
用户3609319618245
关注了
ShowMeAI
用户3609319618245
关注了标签
Python
用户3609319618245
关注了标签
算法
关注了
4
关注者
0
收藏集
0
关注标签
19
加入于
2022-06-15