Zic

赞

0

|

搜索文章

针对深度多智能体强化学习的稳定经验回放（Experience replay）

针对深度多智能体强化学习的稳定经验回放（Experience replay）摘要：因为独立Q-learing引入的不稳定性（nonstationary）使其与深度Q-learning所依赖的exp

2年前
558
点赞
评论

利用反向传播解决多智能体通信

利用反向传播解决多智能体通信介绍存在的问题在现实世界中，每个参与者的能力和对世界的可见性都有限虽然控制每个代理的模型通常是通过强化学习来学习的，但通信的规范和格式通常是预先确定的（每个时间步交

2年前
209
点赞
评论

针对混合合作竞争环境下的多智能体演员-评论家网络

针对混合合作竞争环境下的多智能体演员-评论家网络摘要： Q-learning受到环境non-stationarity的影响，策略梯度则受到随着智能体数量增加而增加。本文提出：一种适应演员-评论家

2年前
317
点赞
评论

个人成就

文章被阅读 5,094

加入于

2023-06-27