稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
用户3609319618245的个人资料头像

用户3609319618245

掘友等级
掘友1级:预备掘友
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1 沸点 0
赞
1
返回
|
搜索文章
用户3609319618245
赞了这篇文章
盐的甜的头像
盐的甜
研究生
·
5年前

强化学习 5 —— SARSA 和 Q-Learning 代码实现与详解

上篇文章 强化学习——时序差分 (TD) --- SARSA and Q-Learning 我们介绍了时序差分TD算法解决强化学习的评估和控制问题,TD对比MC有很多优势,...
2
评论
分享
用户3609319618245的头像
用户3609319618245
关注了
盐的甜
用户3609319618245的头像
用户3609319618245
关注了
小菜羊
用户3609319618245的头像
用户3609319618245
关注了
richard_dai
用户3609319618245的头像
用户3609319618245
关注了
ShowMeAI
用户3609319618245的头像
用户3609319618245
关注了标签 Python Python
用户3609319618245的头像
用户3609319618245
关注了标签 算法 算法
关注了
4
关注者
0
收藏集
0
关注标签
19
加入于
2022-06-15