# MindSpeed-RL **Repository Path**: ascend/MindSpeed-RL ## Basic Information - **Project Name**: MindSpeed-RL - **Description**: 昇腾强化学习加速库 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: Yes ## Statistics - **Stars**: 412 - **Forks**: 238 - **Created**: 2025-01-22 - **Last Updated**: 2025-08-01 ## Categories & Tags **Categories**: machine-learning **Tags**: None ## README
依赖软件 | 版本 |
---|---|
昇腾NPU驱动 | 在研版本 |
昇腾NPU固件 | |
Toolkit(开发套件) | 在研版本 |
Kernel(算子包) | |
NNAL(Ascend Transformer Boost加速库) | |
Python | PT配套版本 |
PyTorch | 2.5 |
torch_npu插件 | 在研版本 |
apex |
训练算法 | 训练指南 | 支持模型 | 发布状态 |
---|---|---|---|
GRPO | Doc |
Qwen2.5-7B Qwen2.5-32B |
Released |
Doc |
Qwen2.5VL-3B Qwen2.5VL-7B Qwen2.5VL-32B |
Released | |
Doc |
Qwen3-8B Qwen3-235B-A22B DeepSeek-R1-671B |
Preview | |
DAPO | Doc |
Qwen2.5-32B Qwen3-30B-A3B Qwen3-32B |
Preview |
PPO | Doc |
Qwen2.5-32B |
Preview |
DPO | Doc |
Qwen3-30B-A3B |
Preview |
核心特性 | 特性指南 | 适用算法 | 发布状态 |
---|---|---|---|
训推共卡 | Doc |
GRPO DAPO PPO |
Released |
数据调度 | Doc |
GRPO DAPO PPO |
Preview |
权重重切分 | Doc |
GRPO DAPO PPO |
Preview |
填充移除 | Doc |
GRPO DAPO PPO |
Preview |
长序列并行 | Doc |
GRPO DAPO PPO DPO |
Preview |
工具特性 | 特性指南 | 适用算法 | 发布状态 |
---|---|---|---|
训练监控 | Doc |
GRPO DAPO PPO |
Preview |
性能调优 | Doc |
GRPO DAPO PPO DPO |
Preview |
精度分析 | Doc |
GRPO DAPO PPO |
Preview |
确定性计算 | Doc |
GRPO DAPO PPO DPO |
Preview |