首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
wxchyy
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
7
文章 7
沸点 0
赞
7
返回
|
搜索文章
最新
热门
强化学习:Markov决策过程(MDP)——手把手教你入门强化学习(二)
前言 本期是手把手教你入门强化学习第二篇了,在这期,笔者会介绍强化学习中最核心的数学模型——Markov决策过程,用来描述智能体(Agent)与环境(Environment)交互的框架。同样会尽量通
强化学习:基础知识篇(包含Gym库的简单实践)——手把手教你入门强化学习(一)
前言 本期笔者将开启新的专栏--手把手教你入门强化学习。强化学习正在改变人类社会的方方面面,像基于强化学习的游戏AI,AlphaGo,以及最近大火的Deepseek的GRPO算法等等。所以笔者希望能
小白避坑指南:国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录(附镜像加速方案)
概要 由于笔者是为了记录自己的踩坑记录,会讲述基本流程,但具体的技术细节,我就不深入探讨,直接实操,咱们干中学吧!!! 我会尽量用通俗易懂的语言进行表达,由于笔者能力有限,有错误之处,请大家多多担待
个人成就
文章被点赞
3
文章被阅读
664
掘力值
81
关注了
11
关注者
0
收藏集
0
关注标签
3
加入于
2024-04-10