强化学习:搭建Gymnasium环境,运行月球着陆器(LunarLander)

432 阅读1分钟

简介

Gymnasium 是一个用于开发和比较强化学习(Reinforcement Learning,RL)算法的工具包,最初由 OpenAI 开发并命名为 Gym。Gymnasium 提供了丰富的环境集合,可以用于训练和测试各种 RL 算法。

Gymnasium环境搭建

首先通过pyhton官网的PyPI,搜索一下Gymnasium,可以看到他支持的python版本3.11,3.10

QQ截图20240603043843.png

Gymnasium官网

安装命令

 pip install gymnasium 
 #安装box2d游戏包
 pip install gymnasium[box2d]

可能出现的问题:

  • pygame下载SSL错误,可以通过PyPI搜索对应版本,通过 pip install .\pygame-2.5.2-cp310-cp310-win_amd64.whl 手动安装。
  • 缺少swig.exe,可以通过swig官网下载window版本,里面有swig.exe,将swig.exe添加到环境变量里,可以通cmd运行。

简单运行一下游戏

具体python代码

import gymnasium as gym

if __name__ == '__main__':
    # 创建一个`LunarLander`环境
    env = gym.make("LunarLander-v2", render_mode="human")
     # 重新设置环境
    observation, info = env.reset()
     # 循环1000次
    for _ in range(1000):
        # 随机选一个动作
        action = env.action_space.sample()  # agent policy that uses the observation and info
        # 执行动作
        observation, reward, terminated, truncated, info = env.step(action)
        # 判断接受
        if terminated or truncated:
            observation, info = env.reset()

    env.close()

如下效果:

153222406-af5ce6f0-4696-4a24-a683-46ad4939170c.gif