# MindSpeed-RL **Repository Path**: baymax591/MindSpeed-RL ## Basic Information - **Project Name**: MindSpeed-RL - **Description**: 昇腾强化学习加速库 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 290 - **Created**: 2025-03-13 - **Last Updated**: 2025-08-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
 
 
| 依赖软件 | 版本 | 
|---|---|
| 昇腾NPU驱动 | 在研版本 | 
| 昇腾NPU固件 | |
| Toolkit(开发套件) | 在研版本 | 
| Kernel(算子包) | |
| NNAL(Ascend Transformer Boost加速库) | |
| Python | PT配套版本 | 
| PyTorch | 2.5 | 
| torch_npu插件 | 在研版本 | 
| apex | 
| 训练算法 | 训练指南 | 支持模型 | 发布状态 | 
|---|---|---|---|
| GRPO | Doc | 
        Qwen2.5-7B  Qwen2.5-32B  | 
      Released | 
| Doc | 
        Qwen2.5VL-3B  Qwen2.5VL-7B Qwen2.5VL-32B  | 
      Released | |
| Doc | 
        Qwen3-8B  Qwen3-235B-A22B DeepSeek-R1-671B  | 
      Preview | |
| DAPO | Doc | 
        Qwen2.5-32B  Qwen3-30B-A3B Qwen3-32B  | 
      Preview | 
| PPO | Doc | 
        Qwen2.5-32B  | 
      Preview | 
| DPO | Doc | 
        Qwen3-30B-A3B  | 
      Preview | 
| 核心特性 | 特性指南 | 适用算法 | 发布状态 | 
|---|---|---|---|
| 训推共卡 | Doc | 
        GRPO  DAPO PPO  | 
      
      Released | 
| 数据调度 | Doc | 
        GRPO  DAPO PPO  | 
      
      Preview | 
| 权重重切分 | Doc | 
        GRPO  DAPO PPO  | 
      
      Preview | 
| 填充移除 | Doc | 
        GRPO  DAPO PPO  | 
      
      Preview | 
| 长序列并行 | Doc | 
        GRPO  DAPO PPO DPO  | 
      
      Preview | 
| Partial Rollout | Doc | 
        GRPO  | 
      
      Preview | 
| 工具特性 | 特性指南 | 适用算法 | 发布状态 | 
|---|---|---|---|
| 训练监控 | Doc | 
        GRPO  DAPO PPO  | 
      
      Preview | 
| 性能调优 | Doc | 
        GRPO  DAPO PPO DPO  | 
      
      Preview | 
| 精度分析 | Doc | 
        GRPO  DAPO PPO  | 
      
      Preview | 
| 确定性计算 | Doc | 
        GRPO  DAPO PPO DPO  | 
      
      Preview |