使用超参数工作第一部分(机器学习)AutoRL超参数景观(arXiv) 作者 :Aditya Mohan,Carolin

AutoRL超参数景观(arXiv)

作者 :Aditya Mohan,Carolin Benjamins,Konrad Wienecke,Alexander Dockhorn,Marius Lindauer

摘要 : 尽管强化学习（RL）已被证明能够产生令人印象深刻的结果，但其使用受到其超参数对性能的影响的限制。这往往使它在实践中难以取得好的结果。自动RL（AutoRL）解决了这一难题，但人们对超参数优化（HPO）方法在寻找最佳配置时穿越的超参数景观的动态性知之甚少。鉴于现有的AutoRL方法动态地调整超参数配置，我们提出了一种方法来建立和分析这些超参数景观，不仅仅是在一个时间点上，而是在整个训练过程中的多个时间点上。为了解决关于这种动态AutoRL方法合法性的一个重要的开放性问题，我们提供了全面的经验证据，即在不同类型的环境（Cartpole和Hopper）中，RL文献中的代表性算法（DQN和SAC）的超参数景观随时间变化而强烈。这支持了超参数应该在训练期间动态调整的理论，并显示了通过景观分析可以获得更多关于AutoRL问题的洞察力的潜力。

2.用于超参数优化的深度排名组合 (arXiv)

作者 :Abdus Salam Khazi,Sebastian Pineda Arango,Josif Grabocka

摘要：