首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
微笑小星
掘友等级
广东工业大学硕士在读
强化学习的信仰者,游戏开发的爱好者
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
ML-Agents命令及配置大全
<trainer-config-file>是训练器配置 YAML 的文件路径。里面包含所有超参数值。<env_name>(可选)是包含要训练的代理的Unity 可执行文件的名称(包括路径) 。如果不写,则训练将在编辑器中进行。<run-identifier> 是一个唯一的名称,主...
Unity强化学习之ML-Agents的使用
Github下载链接:https://github.ML-Agents是游戏引擎Unity3D中的一个插件,也就是说,这个软件的主业是用来开发游戏的,实际上,它也是市面上用得最多的游戏引擎之一。而在几年前随着人工智能的兴起,强化学习算法的不断改进,使得越来越多的强化学习环境被开发...
多任务深度强化学习入门
多任务深度强化学习,英文Multi-Task Deep Reinforcement Learning ,简称MTDRL或MTRL。于MARL不同,它可以是单智能体多任务的情况,也可以是多智能体多任务的情况。现在的深度强化学习领域虽然在很多特定任务上有着超越人类的表现,然而这些算法...
多智能体强化学习之QMIX
MARL中如何表示和使用动作价值函数使得系统达到一个均衡稳态是多智能体系统的目标。Qa。这种方法不能明确表示智能体之间的相互作用,并且可能不会收敛,因为每个智能体的学习都被其他智能体的探索和学习混淆。另一种是学习一个完全集中式的动作价值函数,即反事实多智能体(counterfa...
多智能体强化学习之MADDPG
对于MADDPG推荐的博客有:探秘多智能体强化学习-MADDPG算法原理及简单实现,里面包含代码实现。github代码(基于Tensorflow):https://github.MADDPG算法是单智能体算法DDPG在多智能体环境下的改进。其中最核心的差别就是,每个Agent的C...
分布式强化学习之IMPALA
参考内容:https://zhuanlan.zhihu.IMPALA全名Importance Weighted Actor-Learner Architecture,也就是重要性加权Actor-learner架构,可以训练高效复杂的任务序列。在实际的问题场景中,我们可以将数百个A...
分布式强化学习之D4PG
D4PG全称Distributed Distributional Deterministic Policy Gradient,是总所周知的DDPG的分布式版本。因此学习D4PG之前,需要了解DDPG。首先DDPG是DQN在连续空间的版本,DQN只能处理离散动作空间的问题,对于连续...
分布式强化学习(Distributed RL)入门
一般情况下我们做的论文课题都是小规模的,使用的都是一个相对较小的数据库,因此使用单机系统基本可以完成任务。但现实生活中的数据往往是巨量的,我们需要一个完整的分布式系统来处理这种大规模的数据。算法和结果只是冰山一角,只有拥有一个好的系统和框架作为支撑,才能得到好的算法和实验结果。一...
模仿学习(Imitation Learning)入门
在游戏中,我们往往有一个计分板准确定义事情的好坏程度。但现实中,定义Reward有可能是非常困难的,并且人定的reward也有可能存在许多意想不到的缺陷。在没有reward的情况下,让AI跟环境互动的一个方法叫做Imitation-Learning。在没有reward的前提下,我...
model-based强化学习入门
之前介绍的算法例如DQN,DDPG,PPO都是**model-free(无模型)**的,这也是比较多人的研究领域,这些算法是智能体直接和环境互动获得数据,不需要拟合环境模型,智能体对环境的认知只能通过和环境不断大量的交互来实现。这样做的优点是通过无数次与环境的交互可以保证智能体得...
下一页
个人成就
文章被点赞
6
文章被阅读
18,157
掘力值
421
关注了
0
关注者
2
收藏集
0
关注标签
5
加入于
2022-06-28