首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
theAgeOfFrost
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
[HRL]Model-Free HRL
代码实现:Python,使用的库有Pytorch, NumPy, Opencv, and SciPy,网址为https://github.com/root-master/unified-hrl。 通常的强化学习方法,在涉及巨大的状态空间和稀疏延时奖励反馈的大规模应用上遭受挑战。…
[HRL]H-DQN
在sparse feedback的复杂环境中学习目标导向的行为对人工智能来说是一个基本挑战。在这种设定下进行学习,需要agent在spatio-temporal abstractions的多个层次上表示知识,并有效地探索环境。 最近非线性函数逼近和强化学习的结合使得在学习在高维…
强化学习笔记1
Model-free:不对环境建模,环境反馈什么是什么。 Model-based:尝试对环境进行建模逼近。 Policy vs. Value Policy based:输出下一步要采取的各种动作的概率,根据概率进行行动。 Value based:输出的是所有动作的价值, 根据最…
个人成就
文章被阅读
1,074
掘力值
38
关注了
5
关注者
0
收藏集
0
关注标签
5
加入于
2020-07-04