首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
赤西沽
掘友等级
学生
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
11
文章 11
沸点 0
赞
11
返回
|
搜索文章
赤西沽
学生
·
5年前
关注
《Introduction to Probability Models》前言
Chapter 9 is concerned with reliability theory....
0
评论
分享
赤西沽
学生
·
5年前
关注
《线性估计》 Chapter4 The Innovations Process
在许多应用中,这些随机变量具有其他结构,例如,它们可能是由随机过程产生的,如在Ch.1。 尤其是,当随机变量来自一个索引族,即它们是随机过程时,观察到的随机变量的数量可能非...
0
评论
分享
赤西沽
学生
·
5年前
关注
强化学习Actor Critic编程学习
结合了 Policy Gradient (Actor) 和 Function Approximation (Critic) 的方法. Actor 基于概率选行为, Crit...
0
评论
分享
赤西沽
学生
·
5年前
关注
强化学习 Policy Gradients 编程学习(Tensorflow)
除了DQN这种action value方法,还有policy gradients这种直接学习【参数化policy】的方法。 这样就不用将所有Q值都记录在table里,面对有...
0
评论
分享
赤西沽
学生
·
5年前
关注
《Discrete-Time Markov Control Processes》Chapter 1学习笔记
但是很多情况下无法满足所有三个条件,所以本书就是为了削弱这三个条件。 在本卷中,我们将重点介绍MCP的基本最优准则,即有限地平线问题,以及具有折扣成本准则和长期平均成本的无...
0
评论
分享
赤西沽
学生
·
5年前
关注
《线性估计》 Chapter3 随机性最小二乘问题(Stochastic Least-Squares Problems )
给出两个独立的随机变量,为已知,为未知。 需要用到联合概率分布,很难求。所以我们简化一下: 让h()为一个线性函数。我们还可能指出,当{x,y}为联合高斯分布时,通常是合理...
0
评论
分享
赤西沽
学生
·
5年前
关注
python_tkinter学习笔记
Tkinter 是使用 python 进行窗口视窗设计的模块....
0
评论
分享
赤西沽
学生
·
5年前
关注
python_gym学习笔记
policy_gradient的main代码...
0
评论
分享
赤西沽
学生
·
5年前
关注
tensorflow学习笔记
Tensorflow 首先要定义神经网络的结构, 然后再把数据放入结构当中去运算和 training. 因为TensorFlow是采用数据流图(data flow grap...
0
评论
分享
赤西沽
学生
·
5年前
关注
!DQN编程实践RL_maze(RL编程的思想)
在做每一个强化学习的时候, 我们最好先规划好要怎么分解这一个 task. 具体来说, 分成三方面的脚本可以是这样: 在 rl.py 和 env.py 中, 我们必须有这样几...
0
评论
分享
赤西沽
学生
·
5年前
关注
论文研读 Discretized Approximations for POMDP with Average Cost
在每个时间段,环境处于某种状态s. agent在A中采取动作a,这会导致转换到状态s'的环境概率为T。同时,代理接收观察o,它取决于环境的新状态,概率为O。最后,代理接收奖...
0
评论
分享
赤西沽
学生
·
5年前
关注
理解卡尔曼滤波器(MATLAB官方教程)
卡尔曼滤波器是一种优化估算算法,在不确定和间接测量的情况下估算系统状态。 因此,卡尔曼滤波器算法可能会不收敛。 它把非线性函数在当前估算状态的平均值附近进行线性化。在每个时...
0
评论
分享
赤西沽
学生
·
5年前
关注
《线性估计》 Chapter 2 确定性最小二乘问题(DETERMINISTIC LEAST-SQUARES PROBLEMS)
(a) When H is full rank, the unique solution is given by x = (H* H)-1 H*y. H(x1- x2) =...
0
评论
分享
赤西沽
赞了这篇文章
赤西沽
学生
·
5年前
关注
python基础学习笔记
学习自莫烦python教程1print2math3自变量4循环结构while&forcontinue&break5if;if_else;if_elif6函数全局变量7读写文...
1
评论
分享
赤西沽
学生
·
5年前
关注
MATLAB_Reinforcement Learning Toolbox 学习
Updates the critic properties at each time step during learning. Explores the action s...
0
评论
分享
赤西沽
学生
·
5年前
关注
☆系统的能控能观性和稳定性到底有什么关系?
系统能控能观性是系统可以被稳定的充分不必要条件。 如果系统能控,意味着我们可以利用输入让系统状态等于任意我们希望的状态。 将原本不稳定的系统变成稳定的系统。 很显然,构建这...
0
评论
分享
赤西沽
学生
·
5年前
关注
ROS_Gazebo学习笔记
gazebo是一款功能强大的三维物理仿真平台启动命令:主界面组成部分:0:3D视图区1:工具栏2:模型列表3:模型属性项4:时间显示区...
0
评论
分享
赤西沽
学生
·
5年前
关注
ROS机器人开发案例学习---古月居
古月居:拿到一个功能包,需要知道他是干什么的,输入是什么?输出是什么?不必了解内部封装的细节。 跑起来之后,优化细节再深入学习内部细节。...
1
评论
分享
下一页
个人成就
文章被点赞
31
文章被阅读
154,283
掘力值
2,985
关注了
9
关注者
22
收藏集
12
关注标签
8
加入于
2019-03-22