olixu

Ph.D | 上海交通大学

强化学习，最优控制

赞

0

|

搜索文章

Safe learning框架综述

本文主要是对《Learning-Based model predictive control: Toward Safe Learning in Control》文章中Section5中所引用的文章的笔

4年前
931
点赞
评论

JoinQuant量化策略开发-平台探索

从2019年开始就已经开始在探索基金、股票分析量化平台，但是由于个人能力和时间有限，一直没有做出来，现在炒股炒了两年，虽然交易次数不多，但是也积累了一些经验想记录一下。主要是我对量化交易的一些思考，还

4年前
741
1
评论

2021年上半年健身总结

2月份根据训记上的记录，我是从2月26日开始进入健身房进行训练，当天进行的训练如下图所示，可以看到，卧推还只能是20kg，当然，可能那时候由于是第一次进入健身房，属于恢复期，相当于只能做做热身了，这

4年前
2.1k
4
评论

重要性采样及KL散度分析与不同实现方法

本文原始地址：https://blog.oliverxu.cn 重要性采样及KL散度分析与不同实现方法这篇文章里举的例子都是以强化学习的连续动作空间中的policy来举例的。产生两个策略用于验证：

4年前
803
点赞
评论

个人成就

文章被点赞 5

文章被阅读 4,544

加入于

2021-09-16