首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
探索AI改变世界的可能性
airbowen
创建于2024-07-03
订阅专栏
拥抱变化,探索新事物
暂无订阅
共2篇文章
创建于2024-07-03
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
基于策略梯度(Policy Gradient)来序贯决策(sequential decision making)任务
即序贯决策(sequential decision making)任务。构建最简单的神经网络来进行强化学习
探索OpenAI 企业级AI Alignment的规范,学习资料汇总
RLHF(Reinforcement Learning from Human Feedback)学习提纲