首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
小小何先生
掘友等级
硕二在读
|
公众号:小小何先生
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
25
文章 24
沸点 1
赞
25
返回
|
搜索文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
经典机器学习系列之【聚类分析】
在《战国策·齐策三》中有这么一句话:“物以类聚,人以群分”,用于比喻同类的东西常聚在一起,志同道合的人相聚成群,反之就分开。而所谓的科学,不过是把我们日常的生活经验,大自然...
0
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
强化学习中的无模型预测
在大多是强化学习(reinforcement learning RL)问题中,环境的model都是未知的,也就无法直接做动态规划。一种方法是去学MDP,在这个系列的理解强化...
0
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
动态规划与策略迭代、值迭代
上一节我们说了马尔可夫决策过程,它是对完全可观测的环境进行描述的,也就是观测到的内容完整决定了决策所需要的特征。马尔可夫决策过程可以用方程组求解简单问题,但是对于复杂一点的...
0
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
马尔可夫决策过程与贝尔曼方程
马尔可夫决策过程 (Markov Decision Process,MDP)是序贯决策(sequential decision)的数学模型,一般用于具备马尔可夫性的环境中。...
0
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
经典机器学习系列之【相似性度量】
相似性度量是机器学习中一个非常基础的概念:是评定两个事物之间相似程度的一种度量,尤其是在聚类、推荐算法中尤为重要。其本质就是一种量化标准。在机器学习中主要是用于衡量样本之间...
0
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
手把手教你强化学习 (一) 强化学习基本概要 (下)
上节聊完了这个强化学习从直观上的一些理解。以及它和其他的机器学习方法的一些异同点。这一节来唠唠强化学习中的一些基本的概念及其组成部分。主要就是一些概念,将其罗列出来,方便理...
1
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
手把手教你强化学习 (一) 强化学习基本概要 (上)
在19年4月,有写过一篇强化学习的入门直观简介。强化学习通俗入门简介(一)。感兴趣的可以看一下,如果知道一些基本概念的话,也就没啥必要了,都是些很通俗的理解。 强化学习智能...
0
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
周志华西瓜书-AdaBoost算法证明解析
其中是真实函数,,表示样本的权值分布(对于错误的样本权重要高一点,正确的样本权重要低一点,所有的样本组合起来就相当于有一个分布)。 若基学习器的线性组合能够使得指数损失函数...
0
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
深度强化学习中实验环境-开源平台框架汇总
本文汇总了常用的验证强化学习算法的开源环境平台。 当我们设计了一个强化学习算法之后,我们如何来验证算法的好坏呢?就像数据集一样,我们需要一个公认的平台来衡量这个算法。这样的...
1
评论
分享
小小何先生
赞了这篇文章
机器之心
@机器之心
·
5年前
关注
从α到μ:DeepMind棋盘游戏AI进化史
选自towardsdatascience,作者:Connor Shorten,机器之心编译,参与:Panda、蛋酱。 本文将简单介绍这些算法的演进历程。未来,DeepMin...
3
评论
分享
小小何先生
赞了这篇沸点
乔3D
摸鱼统领 & Bug制造家
·
5年前
举报
在家工作他不香吗?
收起
查看大图
向左旋转
向右旋转
上班摸鱼
等人赞过
分享
44
18
小小何先生
赞了这篇文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
机器博弈 (二) 遗憾最小化算法
现代的博弈论快速与人工智能进行结合,形成了以数据驱动的博弈论新的框架。博弈论与计算机科学的交叉领域非常多,有以下几个方面: 人工智能:多智能体系统、AI游戏、人机交互、机器...
2
评论
分享
小小何先生
赞了这篇文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
经典机器学习系列之【线性判别分析LDA】
线性判别分析,英文名称Linear Discriminant Analysis(LDA)是一种经典的线性学习方法。本文针对二分类问题,从直观理解,对其数学建模,之后模型求解...
2
评论
分享
小小何先生
赞了这篇文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
经典机器学习系列之【决策树详解】
这节我们来讲说一下决策树。介绍一下决策树的基础知识、决策树的基本算法、决策树中的问题以及决策树的理解和解释。 本文主要思路结构如下:先从直观上解释决策树的算法流程。之后针对...
1
评论
分享
小小何先生
赞了这篇文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
机器博弈 (四)博弈规则的设计
也就是说,假设博弈的参与者都是足够理性的,如何设计一个博弈规则能确保公正性或者达到设计者的最大利益。主要的难点是:规则复杂,计算量大。 在生活中,人们通常会碰到与资源匹配相...
1
评论
分享
小小何先生
赞了这篇文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
经典机器学习系列之【线性模型与广义线性模型】
这一节我们介绍线性模型,介绍思路如下:我们先介绍概念,什么叫做线性模型?在了解了基本的线性模型之后,我们将其应用于一元线性回归,之后扩展到多元线性回归。之后我们再将其扩展到...
1
评论
分享
小小何先生
赞了这篇文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
经典机器学习系列之【神经网络详解】
这节主要来详细说一下神经网络。从神经网络定义到M-P模型再扩展到单层感知机、多层前馈神经网络、再到深层神经网络。(本文有一些概念省略了,若有写得不清楚的地方,我们一起在微信...
1
评论
分享
小小何先生
赞了这篇文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
机器博弈 (三) 虚拟遗憾最小化算法
如果不能遍历计算机所有节点的遗憾值,那么可以采用虚拟遗憾最小化算法来进行模拟计算。 为信息集,包含了博弈的规则以及玩家采取的历史行动,在信息集下所能采取的行为集合记为。 玩...
2
评论
分享
小小何先生
赞了这篇文章
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
【详细原理】蒙特卡洛树搜索入门教程!
本文是对Monte Carlo Tree Search – beginners guide这篇文章的文章大体翻译,以及对其代码的解释。分为两篇【详细原理】和【代码实战】。 ...
3
评论
分享
小小何先生
硕二在读 @公众号:小小何先生
·
5年前
关注
【书籍干货】多智能体系统与分布式人工智能简介
作者Nikos Vlassis(尼科斯·弗拉西斯)是希腊克里特技术大学生产工程与管理系的助理教授。 多智能体系统是一个将博弈论、分散控制等经典领域与计算机科学、机器学习等现...
0
评论
分享
下一页
个人成就
文章被点赞
66
文章被阅读
80,392
掘力值
1,384
关注了
5
关注者
587
收藏集
0
关注标签
11
加入于
2020-01-28