首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
强化学习
wxchyy
创建于2025-03-30
订阅专栏
从领带你入门强化学习
暂无订阅
共2篇文章
创建于2025-03-30
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
强化学习:Markov决策过程(MDP)——手把手教你入门强化学习(二)
前言 本期是手把手教你入门强化学习第二篇了,在这期,笔者会介绍强化学习中最核心的数学模型——Markov决策过程,用来描述智能体(Agent)与环境(Environment)交互的框架。同样会尽量通
强化学习:基础知识篇(包含Gym库的简单实践)——手把手教你入门强化学习(一)
前言 本期笔者将开启新的专栏--手把手教你入门强化学习。强化学习正在改变人类社会的方方面面,像基于强化学习的游戏AI,AlphaGo,以及最近大火的Deepseek的GRPO算法等等。所以笔者希望能