小小何先生

硕二在读 | 公众号：小小何先生

赞

25

|

搜索文章

周志华西瓜书-AdaBoost算法证明解析

其中是真实函数，，表示样本的权值分布(对于错误的样本权重要高一点，正确的样本权重要低一点，所有的样本组合起来就相当于有一个分布)。若基学习器的线性组合能够使得指数损失函数最小化，一般的做法就是求偏导数，令其等于零，求解。由于取值只有两种，所以其求偏导数之后的结果如下所示：这…

5年前
827
点赞
评论

深度强化学习中实验环境-开源平台框架汇总

本文汇总了常用的验证强化学习算法的开源环境平台。当我们设计了一个强化学习算法之后，我们如何来验证算法的好坏呢？就像数据集一样，我们需要一个公认的平台来衡量这个算法。这样的一个平台，最基本的需要有仿真和渲染。业界最出名的莫过于Gym和Universe了。OpenAI Gym用…

6年前
2.5k
1
评论

【书籍干货】多智能体系统与分布式人工智能简介

作者Nikos Vlassis(尼科斯·弗拉西斯)是希腊克里特技术大学生产工程与管理系的助理教授。多智能体系统是一个将博弈论、分散控制等经典领域与计算机科学、机器学习等现代领域相融合的扩展领域。这本专著提供了一个简要介绍的主题，涵盖了理论基础，以及更近期的发展，以连贯和可读的…

6年前
420
点赞
评论

【书籍干货】多智能体系统

这本书提供了多智能体系统的介绍。这些系统是由多个相互作用的智能体组成的，其中一个智能体是一个计算实体，如软件程序或机器人，它位于某个环境中，并且在某种程度上能够自主行动以实现其设计目标。本书适用于课堂教学（本科、研究生、研究生）和独立学习，可作为研究人员和行业专业人员的基本参…

6年前
474
点赞
评论

【详细原理】蒙特卡洛树搜索入门教程！

本文是对Monte Carlo Tree Search – beginners guide这篇文章的文章大体翻译，以及对其代码的解释。分为两篇【详细原理】和【代码实战】。蒙特卡洛树搜索在2006年被Rémi Coulom第一次提出，应用于Crazy Stone的围棋游戏。蒙…

6年前
5.7k
3
评论

经典机器学习系列之【决策树详解】

这节我们来讲说一下决策树。介绍一下决策树的基础知识、决策树的基本算法、决策树中的问题以及决策树的理解和解释。本文主要思路结构如下：先从直观上解释决策树的算法流程。之后针对在实际操作过程中会遇到的6个问题对其进行具体分析，其简要包括(后文会详细分析)：处理选择最佳划分属性：依…

6年前
410
1
评论

经典机器学习系列之【神经网络详解】

这节主要来详细说一下神经网络。从神经网络定义到M-P模型再扩展到单层感知机、多层前馈神经网络、再到深层神经网络。(本文有一些概念省略了，若有写得不清楚的地方，我们一起在微信群里面讨论讨论)。在不同的领域、以及不同人的一些偏好。大家对神经网络的叫法有些许差别。但主要会包括以下几…

6年前
3.1k
1
评论

经典机器学习系列之【线性判别分析LDA】

线性判别分析，英文名称Linear Discriminant Analysis(LDA)是一种经典的线性学习方法。本文针对二分类问题，从直观理解，对其数学建模，之后模型求解，再拓展到多分类问题。给定训练样例集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能接近、异类样…

6年前
1.7k
2
评论

经典机器学习系列之【线性模型与广义线性模型】

这一节我们介绍线性模型，介绍思路如下：我们先介绍概念，什么叫做线性模型？在了解了基本的线性模型之后，我们将其应用于一元线性回归，之后扩展到多元线性回归。之后我们再将其扩展到广义线性模型。最后通过广义线性模型迁移到logit回归(分类问题)中。线性模型(Linear Model…

6年前
1.2k
1
评论

机器博弈 (四)博弈规则的设计

也就是说，假设博弈的参与者都是足够理性的，如何设计一个博弈规则能确保公正性或者达到设计者的最大利益。主要的难点是：规则复杂，计算量大。在生活中，人们通常会碰到与资源匹配相关的决策问题(如求职就业、报考录取等)，这些需要双向选择的情况被称为是双边匹配问题。在双边匹配问题中，需要…

6年前
754
1
评论

个人成就

文章被点赞 66

文章被阅读 85,294

掘力值 1,433

加入于

2020-01-28