稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
陈佳盼的个人资料头像

陈佳盼

掘友等级
掘友2级:见习掘友
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 1 沸点 1
赞
2
返回
|
搜索文章
赞
文章( 1 ) 沸点( 1 )
  • 伯克利,斯坦福,宾大联合发表:从观察和交互中学习预测模型
    作者在这里所关心的是,智能体采样很难采样到那些表现性能比较好的样本,就是说有些状态动作对根本就采不到,因为很难去学习这么好的策略,但是人类可以很轻松的采样得到这些样本。但是这些样本也是存在一些问题的,比如是没有带注释的,他不会有描述说为什么这么做,如果像模仿学习那样利用这些样本…
    • 小小何先生
    • 5年前
    • 646
    • 2
    • 1
    强化学习
  • 关注了
    9
    关注者
    0
    收藏集
    1
    关注标签
    5
    加入于
    2019-11-30