首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
强化学习
订阅
user5590484679423
更多收藏集
微信扫码分享
微信
新浪微博
QQ
12篇文章 · 0订阅
机器学习在ABR算法中的应用纵览
大家好,我是来自清华大学计算机系的博士生王莫为,导师是崔勇教授,本次分享的主题是机器学习在ABR算法中的应用,机器学习在网络、系统和流媒体中都有各种各样的应用。 我们组自2016年就开始对机器学习如何与网络相结合做一些调研和综述,发现在2016年前后相关应用特别少,而且大多集中…
手把手教你强化学习 (一) 强化学习基本概要 (上)
在19年4月,有写过一篇强化学习的入门直观简介。强化学习通俗入门简介(一)。感兴趣的可以看一下,如果知道一些基本概念的话,也就没啥必要了,都是些很通俗的理解。 强化学习智能体通过与环境交互,为了获取整个交互过程中的收益最大,不断自我调整优化。就像你的整个人生过程一样,算法的原理…
手把手教你强化学习 (一) 强化学习基本概要 (下)
上节聊完了这个强化学习从直观上的一些理解。以及它和其他的机器学习方法的一些异同点。这一节来唠唠强化学习中的一些基本的概念及其组成部分。主要就是一些概念,将其罗列出来,方便理解和观看。 Agent中文名称一般被称为智能体,或者称之为“玩家”,是整个强化学习算法的核心。整个的学习过…
中文课程!台大李宏毅机器学习公开课2019版上线
台大教授李宏毅的机器学习课程经常被认为是中文开放课程中的首选。李教授的授课风格风趣幽默,通俗易懂,其课程内容中不仅有机器学习、深度学习的基础知识,也会介绍 ML 领域里的各种最新技术。近日,2019 版的课程资料与视频终于上线了!
强化学习总结01 基本概念
1. 概述 强化学习是智能体(Agent)与环境(Environment)不断交互, 不断提高自己的决策能力的过程. 所学习的样本来自于与环境的交互。而非像传统机器学习的样本是现有的。 。 2. 强化学习的组成 回报值 又称累积折扣奖励(cumulative discounte…
深度强化学习的弱点和局限
强化学习是机器学习中的一个领域,它强调如何基于环境而行动,以取得最大化的预期利益。近年来,强化学习的大型研究层见迭出,以AlphaGo为代表的成果不仅轰动了学术界,也吸引了媒体的目光。那么强化学习真的是人工智能的新希望吗?
强化学习
监督学习是利用标记了的样本进行学习,无监督学习则是使用未标记的样本进行学习,这两个是我们最常见的。半监督学习则是样本中只有少量带标记的样本,多数样本都未标记,利用这些样本进行学习。强化学习则是很不同的一种学习方式,它没有规则的训练样本和标签,主要通过奖励和惩罚达到学习的目的。 …
强化学习(Reinforcement Learning)中的Q-Learning、DQN,面试看这篇就够了!
1. 什么是强化学习 其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报。在很多场景中,当前的行动不仅会影响当前的rewards,还会影响之后的状态和一…
机器学习和深度学习的区别
在本文中,我们将研究深度学习和机器学习之间的差异。我们将逐一了解它们,然后讨论他们在各个方面的不同之处。除了深度学习和机器学习的比较外,我们还将研究他们未来的趋势和走向。 通常,为了实现人工智能,我们使用机器学习。我们有几种算法用于机器学习。例如: 1,监督机器学习算法用于进行…
强化学习的一些基本问题和总结
如果真要划分的话,关于强化学习的体系 第一个需要谈论的问题肯定不是这两者,毕竟无论怎么说off-policy和on-policy都还是隶属于值函数的这一类方法,前面肯定有许多铺垫和介绍 来构建整个强化学习的体系,进而才会谈论到这个问题。但讲到强化学习进行分类的时候,总第一反应就…