首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
小小何先生
掘友等级
硕二在读
|
公众号:小小何先生
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
25
文章 24
沸点 1
赞
25
返回
|
搜索文章
赞
文章( 24 )
沸点( 1 )
【ICLR 2018】模型集成的TRPO算法【附代码】
model free的方法具有high sample complexity ,难将其用于real-world。用ensemble的方式来克服model bias。 标准的model-based方法是交替使用model learning和policy aptimization。m…
【5分钟 Paper】(TD3) Addressing Function Approximation Error in Actor-Critic Methods
value-base的强化学习值函数的近似估计会过估计值函数(DQN),作者将Double Q-Learning处理过拟合的思想引入actor critic算法中。(过估计的问题就在于累计误差会使得某些不好的state的value变地很高(exploration 不充分所导致的…
伯克利,斯坦福,宾大联合发表:从观察和交互中学习预测模型
作者在这里所关心的是,智能体采样很难采样到那些表现性能比较好的样本,就是说有些状态动作对根本就采不到,因为很难去学习这么好的策略,但是人类可以很轻松的采样得到这些样本。但是这些样本也是存在一些问题的,比如是没有带注释的,他不会有描述说为什么这么做,如果像模仿学习那样利用这些样本…
从α到μ:DeepMind棋盘游戏AI进化史
选自towardsdatascience,作者:Connor Shorten,机器之心编译,参与:Panda、蛋酱。 本文将简单介绍这些算法的演进历程。未来,DeepMind 能否创造出这一系列的终极算法 OmegaZero 呢? DeepMind 近期发布了他们开发的 MuZ…
机器博弈 (二) 遗憾最小化算法
现代的博弈论快速与人工智能进行结合,形成了以数据驱动的博弈论新的框架。博弈论与计算机科学的交叉领域非常多,有以下几个方面: 人工智能:多智能体系统、AI游戏、人机交互、机器学习、广告推荐等。 互联网:互联网经济、共享经济。 分布式系统:区块链。 人工智能与博弈论结合,形成了两个…
经典机器学习系列之【线性判别分析LDA】
线性判别分析,英文名称Linear Discriminant Analysis(LDA)是一种经典的线性学习方法。本文针对二分类问题,从直观理解,对其数学建模,之后模型求解,再拓展到多分类问题。 给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近、异类样…
经典机器学习系列之【决策树详解】
这节我们来讲说一下决策树。介绍一下决策树的基础知识、决策树的基本算法、决策树中的问题以及决策树的理解和解释。 本文主要思路结构如下:先从直观上解释决策树的算法流程。之后针对在实际操作过程中会遇到的6个问题对其进行具体分析,其简要包括(后文会详细分析): 处理选择最佳划分属性:依…
机器博弈 (四)博弈规则的设计
也就是说,假设博弈的参与者都是足够理性的,如何设计一个博弈规则能确保公正性或者达到设计者的最大利益。主要的难点是:规则复杂,计算量大。 在生活中,人们通常会碰到与资源匹配相关的决策问题(如求职就业、报考录取等),这些需要双向选择的情况被称为是双边匹配问题。在双边匹配问题中,需要…
经典机器学习系列之【线性模型与广义线性模型】
这一节我们介绍线性模型,介绍思路如下:我们先介绍概念,什么叫做线性模型?在了解了基本的线性模型之后,我们将其应用于一元线性回归,之后扩展到多元线性回归。之后我们再将其扩展到广义线性模型。最后通过广义线性模型迁移到logit回归(分类问题)中。 线性模型(Linear Model…
机器博弈 (一) 入门简介
现代博弈论的建立得从1944年算起,1944年冯·诺依曼的《博弈论与经济行为》以数学形式来阐述博弈论及其应用,标志着现代系统博弈理论的初步形成。冯·诺依曼被称为现代博弈论之父。 博弈论(game theory),也被称为对策论。博弈者在博弈过程中的行为(action)被称作博弈…
下一页
个人成就
文章被点赞
66
文章被阅读
80,398
掘力值
1,384
关注了
5
关注者
587
收藏集
0
关注标签
11
加入于
2020-01-28