稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
theAgeOfFrost的个人资料头像

theAgeOfFrost

创作等级LV.1
掘友等级
掘友1级:预备掘友
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0 沸点 0
赞
0
返回
|
搜索文章
最新 热门
  • [HRL]Model-Free HRL
    代码实现:Python,使用的库有Pytorch, NumPy, Opencv, and SciPy,网址为https://github.com/root-master/unified-hrl。 通常的强化学习方法,在涉及巨大的状态空间和稀疏延时奖励反馈的大规模应用上遭受挑战。…
    • 5年前
    • 243
    • 点赞
    • 评论
    人工智能
  • [HRL]H-DQN
    在sparse feedback的复杂环境中学习目标导向的行为对人工智能来说是一个基本挑战。在这种设定下进行学习,需要agent在spatio-temporal abstractions的多个层次上表示知识,并有效地探索环境。 最近非线性函数逼近和强化学习的结合使得在学习在高维…
    • 5年前
    • 703
    • 点赞
    • 评论
    深度学习
  • 强化学习笔记1
    Model-free:不对环境建模,环境反馈什么是什么。 Model-based:尝试对环境进行建模逼近。 Policy vs. Value Policy based:输出下一步要采取的各种动作的概率,根据概率进行行动。 Value based:输出的是所有动作的价值, 根据最…
    • 5年前
    • 128
    • 点赞
    • 评论
    程序员
  • 个人成就
    文章被阅读 1,074
    掘力值 38
    关注了
    5
    关注者
    0
    收藏集
    0
    关注标签
    5
    加入于
    2020-07-04