首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
olixu
掘友等级
Ph.D
|
上海交通大学
强化学习,最优控制
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
Safe learning框架综述
本文主要是对《Learning-Based model predictive control: Toward Safe Learning in Control》文章中Section5中所引用的文章的笔
JoinQuant量化策略开发-平台探索
从2019年开始就已经开始在探索基金、股票分析量化平台,但是由于个人能力和时间有限,一直没有做出来,现在炒股炒了两年,虽然交易次数不多,但是也积累了一些经验想记录一下。主要是我对量化交易的一些思考,还
2021年上半年健身总结
2月份 根据训记上的记录,我是从2月26日开始进入健身房进行训练,当天进行的训练如下图所示,可以看到,卧推还只能是20kg,当然,可能那时候由于是第一次进入健身房,属于恢复期,相当于只能做做热身了,这
重要性采样及KL散度分析与不同实现方法
本文原始地址:https://blog.oliverxu.cn 重要性采样及KL散度分析与不同实现方法 这篇文章里举的例子都是以强化学习的连续动作空间中的policy来举例的。 产生两个策略用于验证:
个人成就
文章被点赞
4
文章被阅读
3,753
掘力值
120
关注了
0
关注者
2
收藏集
0
关注标签
0
加入于
2021-09-16