使用超参数工作第一部分(机器学习)

91 阅读1分钟
  1. AutoRL超参数景观(arXiv)

作者 :Aditya Mohan,Carolin Benjamins,Konrad Wienecke,Alexander Dockhorn,Marius Lindauer

摘要 : 尽管强化学习(RL)已被证明能够产生令人印象深刻的结果,但其使用受到其超参数对性能的影响的限制。这往往使它在实践中难以取得好的结果。自动RL(AutoRL)解决了这一难题,但人们对超参数优化(HPO)方法在寻找最佳配置时穿越的超参数景观的动态性知之甚少。鉴于现有的AutoRL方法动态地调整超参数配置,我们提出了一种方法来建立和分析这些超参数景观,不仅仅是在一个时间点上,而是在整个训练过程中的多个时间点上。为了解决关于这种动态AutoRL方法合法性的一个重要的开放性问题,我们提供了全面的经验证据,即在不同类型的环境(Cartpole和Hopper)中,RL文献中的代表性算法(DQN和SAC)的超参数景观随时间变化而强烈。这支持了超参数应该在训练期间动态调整的理论,并显示了通过景观分析可以获得更多关于AutoRL问题的洞察力的潜力。

2.用于超参数优化的深度排名组合 (arXiv)

作者 :Abdus Salam Khazi,Sebastian Pineda Arango,Josif Grabocka

摘要 :