首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
宝贝儿好
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
宝贝儿好
1小时前
关注
第二章: 图像处理基本操作
第二章: 图像处理基本操作 一、图像的表示方法 二值图像: 每个像素点不是白色就是黑色;一个像素点只要一个bit位就能表示;用0或1表示每个像素点。 灰度图像: 图像只有一...
0
评论
分享
宝贝儿好
3天前
关注
【强化学习】第七章:深度强化学习原理、DQN算法
强化学习分三种范式:基于价值的强化学习、基于策略的强化学习、基于AC框架的强化学习。其中基于AC框架的强化学习是前两种的大一统范式。这三种范式可以说是强化学习领域的三个独立...
0
评论
分享
宝贝儿好
4天前
关注
【强化学习】第六章:无模型控制:在轨MC控制、在轨时序差分学习(Sarsa)、离轨学习(Q-learning)
从知识点上看,本篇是承接前五章的所有重点和难点!所以你前面知识点必须非常熟悉,本篇才能顺水推舟的理解了。尽管本篇我已经尽力回溯之前的知识点,但你还是得没有逻辑断点,才能看懂...
0
评论
分享
宝贝儿好
4天前
关注
【强化学习】第五章:无模型评估:蒙特卡洛学习、时序差分学习、TD(λ)
无模型(Model-free)是指现实问题是一个非完备的MDP,我们只能实实在在的去打几步或者打完整个游戏,然后得到一些s,a,r序列,然后通过这些序列去计算状态价值。...
0
评论
分享
宝贝儿好
4天前
关注
【强化学习】第四章:动态规划(DP)
类似梯度下降算法就是为了求解损失函数的最小值一样,动态规划法也只是求解价值函数的一种方法。,所以本篇重点讲怎么用动态规划求解价值函数,而非动态规划法背后的理论和数学推导。...
0
评论
分享
宝贝儿好
11天前
关注
【强化学习】第三章:马尔可夫决策过程(MDP)、贝尔曼期望方程、贝尔曼最优方程
本篇非常基础也非常难,但是本篇是整个强化学习的基石,务必非常清晰得弄懂本篇的所有知识点,后面的学习才会一马平川。...
0
评论
分享
宝贝儿好
11天前
举报
#新人报道#
发了一篇文章,为什么审核不通过呢?
反馈 & 建议
分享
12
点赞
宝贝儿好
11天前
关注
【强化学习】第一章:强化学习知识体系介绍
DeepMind大卫·希尔弗在youtube发布了一套强化学习视频公开课,系统全面地介绍了强化学习的各种思想、实现算法,对理解强化学习来说是一套非常好的入门教程。本系列文章...
0
评论
分享
个人成就
文章被阅读
161
掘力值
70
关注了
0
关注者
0
收藏集
0
关注标签
0
加入于
2026-01-28