首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
小小何先生
掘友等级
硕二在读
|
公众号:小小何先生
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
25
文章 24
沸点 1
赞
25
返回
|
搜索文章
最新
热门
周志华西瓜书-AdaBoost算法证明解析
其中是真实函数,,表示样本的权值分布(对于错误的样本权重要高一点,正确的样本权重要低一点,所有的样本组合起来就相当于有一个分布)。 若基学习器的线性组合能够使得指数损失函数最小化,一般的做法就是求偏导数,令其等于零,求解。由于取值只有两种,所以其求偏导数之后的结果如下所示: 这…
深度强化学习中实验环境-开源平台框架汇总
本文汇总了常用的验证强化学习算法的开源环境平台。 当我们设计了一个强化学习算法之后,我们如何来验证算法的好坏呢?就像数据集一样,我们需要一个公认的平台来衡量这个算法。这样的一个平台,最基本的需要有仿真和渲染。 业界最出名的莫过于Gym和Universe了。OpenAI Gym用…
【书籍干货】多智能体系统与分布式人工智能简介
作者Nikos Vlassis(尼科斯·弗拉西斯)是希腊克里特技术大学生产工程与管理系的助理教授。 多智能体系统是一个将博弈论、分散控制等经典领域与计算机科学、机器学习等现代领域相融合的扩展领域。这本专著提供了一个简要介绍的主题,涵盖了理论基础,以及更近期的发展,以连贯和可读的…
【书籍干货】多智能体系统
这本书提供了多智能体系统的介绍。这些系统是由多个相互作用的智能体组成的,其中一个智能体是一个计算实体,如软件程序或机器人,它位于某个环境中,并且在某种程度上能够自主行动以实现其设计目标。 本书适用于课堂教学(本科、研究生、研究生)和独立学习,可作为研究人员和行业专业人员的基本参…
【详细原理】蒙特卡洛树搜索入门教程!
本文是对Monte Carlo Tree Search – beginners guide这篇文章的文章大体翻译,以及对其代码的解释。分为两篇【详细原理】和【代码实战】。 蒙特卡洛树搜索在2006年被Rémi Coulom第一次提出,应用于Crazy Stone的围棋游戏。 蒙…
经典机器学习系列之【决策树详解】
这节我们来讲说一下决策树。介绍一下决策树的基础知识、决策树的基本算法、决策树中的问题以及决策树的理解和解释。 本文主要思路结构如下:先从直观上解释决策树的算法流程。之后针对在实际操作过程中会遇到的6个问题对其进行具体分析,其简要包括(后文会详细分析): 处理选择最佳划分属性:依…
经典机器学习系列之【神经网络详解】
这节主要来详细说一下神经网络。从神经网络定义到M-P模型再扩展到单层感知机、多层前馈神经网络、再到深层神经网络。(本文有一些概念省略了,若有写得不清楚的地方,我们一起在微信群里面讨论讨论)。 在不同的领域、以及不同人的一些偏好。大家对神经网络的叫法有些许差别。但主要会包括以下几…
经典机器学习系列之【线性判别分析LDA】
线性判别分析,英文名称Linear Discriminant Analysis(LDA)是一种经典的线性学习方法。本文针对二分类问题,从直观理解,对其数学建模,之后模型求解,再拓展到多分类问题。 给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近、异类样…
经典机器学习系列之【线性模型与广义线性模型】
这一节我们介绍线性模型,介绍思路如下:我们先介绍概念,什么叫做线性模型?在了解了基本的线性模型之后,我们将其应用于一元线性回归,之后扩展到多元线性回归。之后我们再将其扩展到广义线性模型。最后通过广义线性模型迁移到logit回归(分类问题)中。 线性模型(Linear Model…
机器博弈 (四)博弈规则的设计
也就是说,假设博弈的参与者都是足够理性的,如何设计一个博弈规则能确保公正性或者达到设计者的最大利益。主要的难点是:规则复杂,计算量大。 在生活中,人们通常会碰到与资源匹配相关的决策问题(如求职就业、报考录取等),这些需要双向选择的情况被称为是双边匹配问题。在双边匹配问题中,需要…
下一页
个人成就
文章被点赞
66
文章被阅读
85,294
掘力值
1,433
关注了
5
关注者
587
收藏集
0
关注标签
11
加入于
2020-01-28