# Reforcement-Learning-forAI22 **Repository Path**: yangchengjun2/reforcement-learning-for-ai22 ## Basic Information - **Project Name**: Reforcement-Learning-forAI22 - **Description**: No description available - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 5 - **Forks**: 4 - **Created**: 2024-11-24 - **Last Updated**: 2024-12-12 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README  ## 参考资料 https://github.com/boyu-ai/Hands-on-RL https://hrl.boyuai.com/slides/ ## 环境 ### 安装需要的包 https://gymnasium.farama.org/ ### 动手学使用的gym版本为0.10.5,numpy1.26.4 ```sh conda create -n rl2024 --clone dl2024 ``` ### 旧版本可以选择装上gym==0.26.2 新版本对numpy有要求 gymnasium (open ai gym 2022) numpy<2.0.0 ``` sh pip install gymnasium comet_ml>=3.44.1 stable-baselines3 ``` - Gymnasium 是一个强化学习(Reinforcement Learning,RL)的工具包,它提供了各种强化学习的环境,允许开发者创建、运行和测试不同的RL算法。[classic-control] 是一种额外的依赖选项,包含经典控制论环境适用于控制任务的实验和研究。 |CartPole-v1| - —|一个简单的平衡杆环境| |-|-|-| |MountainCar-v0| - |一个小车爬坡的问题| |Pendulum-v1| - |处理倒立摆的控制| |Acrobot-v1| - |控制两个连接摆臂的旋转系统| - Stable Baselines3 是一个强化学习库,提供了一些常用的RL算法,如PPO(Proximal Policy Optimization)、DQN(Deep Q-Network)、A2C(Advantage Actor-Critic)等。它建立在 PyTorch 之上,专为研究和应用强化学习算法而设计。 Stable Baselines3 主要用于快速实现和测试RL算法,适用于研究人员和开发人员。 ```sh pip install gym==0.26.2 pettingzoo==1.23.1 -i https://pypi.tuna.tsinghua.edu.cn/simple pip install swig pip install gymnasium[box2d] -i https://pypi.tuna.tsinghua.edu.cn/simple ```