首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
安可可可可
掘友等级
学生
研究方向:强化学习、多智能体强化学习
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
47
文章 37
沸点 10
赞
47
返回
|
搜索文章
强化学习
订阅
强化学习(Reinforcement learning,RL)讨论的问题是一个智能体(agent) 怎么在一个复杂不确定的 环境(environment) 里面去极大化它能获得的奖励。通过感知所处环境的 状态(state) 对 动作(action) 的 反应(reward), 来指导更好的动作
2023-05-15 19:59
·
文章数 4
·
订阅人数 5
新建专栏
欢迎大家使用稀土掘金专栏,让你的写作更加体系化~
专栏名称
0/50
专栏简介
0/150
专栏封面
点击上传图片
建议尺寸:480*270px
个人成就
文章被点赞
44
文章被阅读
30,376
掘力值
449
关注了
5
关注者
30
收藏集
0
关注标签
4
加入于
2022-09-19