# MindSpeed-MM **Repository Path**: ljing-git/MindSpeed-MM ## Basic Information - **Project Name**: MindSpeed-MM - **Description**: 华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: https://gitee.com/ascend/MindSpeed-MM - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 229 - **Created**: 2024-11-07 - **Last Updated**: 2025-02-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
模型任务 | 模型 | 参数量 | 任务 | 集群 | 精度格式 | NPU性能 | 参考性能 | 贡献方 | 认证 |
---|---|---|---|---|---|---|---|---|---|
视频生成 | OpenSora 1.0 | 5.5B | 预训练 | 1x8 | BF16 | 3.18 (Samples per Second) | 2.04 (Samples per Second) | 【昇腾】 | 【Pass】 |
OpenSora 1.2 | 5.2B | 预训练 | 1x8 | BF16 | 7.31 (Samples per Second) | 8.15 (Samples per Second) | 【昇腾】 | 【Pass】 | |
OpenSoraPlan 1.2 | 8.7B | 预训练 | 1x8 | BF16 | 0.42 (Samples per Second) | 0.37 (Samples per Second) | 【昇腾】 | 【Pass】 | |
OpenSoraPlan 1.3 | 8.6B | 预训练 | 1x8 | BF16 | 0.71 (Samples per Second) | 0.73 (Samples per Second) | 【昇腾】 | 【Test】 | |
CogVideoX | 5B | / | / | / | / | / | / | 【Test】 | |
图像生成 | SDXL | 3.5B | 预训练 | 1x8 | BF16 | 29.92 (FPS) | 30.65 (FPS) | 【昇腾】【NAIE】 | 【Pass】 |
3.5B | 预训练 | 1x8 | FP16 | 28.51 (FPS) | 30.23 (FPS) | 【昇腾】【NAIE】 | 【Pass】 | ||
SD3 | 2B | 全参微调 | 1x8 | BF16 | 17.08 (FPS) | 17.51 (FPS) | 【昇腾】【NAIE】 | 【Pass】 | |
2B | 全参微调 | 1x8 | FP16 | 16.57 (FPS) | 16.36 (FPS) | 【昇腾】【NAIE】 | 【Pass】 | ||
Flux | 12B | 全参微调 | 1x8 | BF16 | 55.23 (FPS) | 53.65 (FPS) | 【昇腾】 | 【Pass】 | |
Kolors | 2.6B | 推理 | 1x1 | FP16 | / | / | 【NAIE】 | 【Pass】 | |
多模态理解 | LLaVA 1.5 | 7B | 预训练 | 1x8 | BF16 | 48.27 (FPS) | 49.94 (FPS) | 【昇腾】【NAIE】 | 【Pass】 |
Intern-VL-2.0 | 2B | 微调 | 1x8 | BF16 | / | / | 【昇腾】 | 【Test】 | |
8B | 微调 | 1x8 | BF16 | 9.95 (s/step) | 11.64 (s/step) | 【昇腾】 | 【Test】 | ||
26B | / | / | / | / | / | / | 【Coming Soon】 | ||
Qwen2-VL | 7B | / | / | / | / | / | / | 【Coming Soon】 | |
72B | / | / | / | / | / | / | 【Coming Soon】 | ||
语音识别 | Whisper | 1.5B | 预训练 | 1x8 | BF16 | 93.38 (Samples per Second) | 109.23 (Samples per Second) | 【昇腾】 | 【Pass】 |
模型 | 参数量 | 任务 | 集群 | 精度格式 | NPU性能 | 参考性能 | 贡献方 | 认证 |
---|---|---|---|---|---|---|---|---|
CogVLM-2 | 8B | 微调 | 1x8 | BF16 | 3.9 (s/it) | 3.3 (s/it) | 【GTS】 | 【Pass】 |
PLLaVA | 7B | 预训练 | 1x8 | BF16 | 0.841 (s/step) | 0.935 (s/step) | 【NAIE】 | 【Pass】 |
7B | 预训练 | 1x8 | FP32 | 0.935 (s/step) | 1.08 (s/step) | 【NAIE】 | 【Pass】 | |
miniCPM-V 2.5 | 8B | 全参微调 | 1x8 | BF16 | 1046 (s)/50-200steps | 847 (s)/50-200steps | 【昇腾】 | 【Pass】 |
8B | Lora微调 | 1x8 | BF16 | 603 (s)/50-200steps | 490 (s)/50-200steps | 【昇腾】 | 【Pass】 | |
HunYuanDiT | 1.5B | 预训练 | 1x8 | BF16 | 1099.5 (ms/step) | 1059.3 (ms/step) | 【昇腾】 | 【Pass】 |
Intern-VL-1.5 | 26B | 微调训练 | 1x8 | BF16 | 4.952 (FPS) | 5.151 (FPS) | 【昇腾】 | 【Pass】 |