首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Lamorak
掘友等级
学生
|
USTC
尝试并努力去做一个更好的DataScience相关工作者,喜欢跑步,积极生活
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
226
文章 206
沸点 20
赞
226
返回
|
搜索文章
最新
热门
DFPN-E 论文阅读
0 论文信息 1.简介 搜索是人工智能核心技术之一,特别是在游戏和领域无关的规划中。从历史上看,新的搜索算法和现有算法的新组合带来了显著的性能提升。
Optical Flow and FlowNet : 从传统算法到深度模型
1 光流 (Optical Flow) 的定义与介绍 1.1 光流 (Optical Flow) 的提出和定义 光流或视流是观察者与场景之间的相对运动引起的视觉场景中物体、表面和边缘的表观运动模式
SGQN 论文阅读
0 论文信息 1.介绍 在本项工作中,作者提出了一种新颖的方法,该方法鼓励智能体有效地识别关键输入像素,并加强策略对这些像素的依赖性。
观《周处除三害》有感
最近因为一些特别的原因一下子多了一点空闲的时间,然后发现在工作之余还有点时间,结合着《周处除三害》,谈谈自己的感想。
SRM 论文阅读
0.SRM 的论文信息 1.介绍 介绍中提到了传统强化学习并不存在测试与训练中的分布的差距 (gap),同时也用图 1 详细展示了图像识别任务与强化学习任务中对于图像处理要求的不同。
PPO 论文阅读
0 论文信息 PPO (Proximal Policy Optimization Algorithms) 这篇工作之前就大概听说过,但是一直没有去看,刚好也属于 Actor-Critic 算法族中
WAPPO 论文阅读
0 论文信息 1 相关工作和背景 强化学习涉及顺序决策制定 : 一个强化学习主体存在于一个世界 (环境) 中,必须基于对世界 (状态) $s$ 的一些信息采取行动 $a$。这导致环境提供下一个状态
DARC 论文阅读
0 论文信息 ICLR 的论文,感觉应该比之前读的 AAAI 的论文有意思一些,为了方便易懂一些继续把综述放上来,替代介绍部分。以及文中很喜欢用 dynamics (动力学) 一词来进行叙述
Cycle-Consistent VAE 论文阅读
0 论文信息 在之前阅读的那篇解决强化学习泛化性能的 LUSR 中就以这篇论文提出的 Cycle-Consistent Variation Auto-Encoder
LUSR 论文阅读
0 论文信息 最近看看前人是怎么做强化学习中 visual transfer 的工作,在此基础之上看看有哪些可以将自己思路进行落地的地方。
下一页
个人成就
文章被点赞
358
文章被阅读
30,250
掘力值
1,666
关注了
10
关注者
31
收藏集
0
关注标签
9
加入于
2022-03-24