强化学习：搭建Gymnasium环境，运行月球着陆器(LunarLander)Gymnasium 是一个用于开发和比较强

简介

Gymnasium 是一个用于开发和比较强化学习（Reinforcement Learning，RL）算法的工具包，最初由 OpenAI 开发并命名为 Gym。Gymnasium 提供了丰富的环境集合，可以用于训练和测试各种 RL 算法。

Gymnasium环境搭建

首先通过pyhton官网的PyPI,搜索一下Gymnasium,可以看到他支持的python版本3.11,3.10

QQ截图20240603043843.png

安装命令

 pip install gymnasium 
 #安装box2d游戏包
 pip install gymnasium[box2d]

可能出现的问题：

pygame下载SSL错误，可以通过PyPI搜索对应版本，通过 pip install .\pygame-2.5.2-cp310-cp310-win_amd64.whl 手动安装。
缺少swig.exe,可以通过swig官网下载window版本,里面有swig.exe,将swig.exe添加到环境变量里，可以通cmd运行。

简单运行一下游戏

具体python代码

import gymnasium as gym

if __name__ == '__main__':
    # 创建一个`LunarLander`环境
    env = gym.make("LunarLander-v2", render_mode="human")
     # 重新设置环境
    observation, info = env.reset()
     # 循环1000次
    for _ in range(1000):
        # 随机选一个动作
        action = env.action_space.sample()  # agent policy that uses the observation and info
        # 执行动作
        observation, reward, terminated, truncated, info = env.step(action)
        # 判断接受
        if terminated or truncated:
            observation, info = env.reset()

    env.close()

如下效果：