From f3f7e353eed8c4b568c5ac6012dc608bbed9bec0 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E5=AE=8B=E4=BD=B3=E7=90=AA?= Date: Mon, 4 Aug 2025 11:06:22 +0800 Subject: [PATCH] mindstudio_docs --- .../docs/source_zh_cn/feature/performance.md | 4 ++++ .../docs/source_zh_cn/feature/precision.md | 20 ++++++++++--------- docs/mindstudio/docs/source_zh_cn/index.rst | 2 +- 3 files changed, 16 insertions(+), 10 deletions(-) diff --git a/docs/mindstudio/docs/source_zh_cn/feature/performance.md b/docs/mindstudio/docs/source_zh_cn/feature/performance.md index 736c394344..23acdefdde 100644 --- a/docs/mindstudio/docs/source_zh_cn/feature/performance.md +++ b/docs/mindstudio/docs/source_zh_cn/feature/performance.md @@ -2,6 +2,10 @@ [![查看源文件](https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/website-images/master/resource/_static/logo_source.svg)](https://gitee.com/mindspore/docs/blob/master/docs/mindstudio/docs/source_zh_cn/feature/performance.md) +MindSpore框架和MindStudio Training Tools工具链提供了多个性能分析与优化工具。 +MindSpore Profiler可以为用户提供算子执行时间分析、内存使用分析、AI Core指标分析、Timeline展示等功能,帮助用户分析性能瓶颈、优化训练效率。 +MindStudio Training Tools工具链中的MindStudio Insight工具、msprof-analyze工具、msLeaks工具分别负责模型训练可视化、性能数据分析、内存分配释放情况追踪。 + diff --git a/docs/mindstudio/docs/source_zh_cn/feature/precision.md b/docs/mindstudio/docs/source_zh_cn/feature/precision.md index 4975fbb5d1..e55b1ada47 100644 --- a/docs/mindstudio/docs/source_zh_cn/feature/precision.md +++ b/docs/mindstudio/docs/source_zh_cn/feature/precision.md @@ -2,10 +2,12 @@ [![查看源文件](https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/website-images/master/resource/_static/logo_source.svg)](https://gitee.com/mindspore/docs/blob/master/docs/mindstudio/docs/source_zh_cn/feature/precision.md) -
工具
+msprobe 是 MindStudio Training Tools 工具链下精度调试部分的工具包。主要包括精度预检、溢出检测和精度比对等功能,目前适配 PyTorch 和 MindSpore 框架。msprobe提供多个于子工具侧重不同的训练场景,可以定位模型训练中的精度问题。 + +
- - + + @@ -29,18 +31,18 @@ - - - - - - + + + + + + diff --git a/docs/mindstudio/docs/source_zh_cn/index.rst b/docs/mindstudio/docs/source_zh_cn/index.rst index 2b74f75484..21851cfd95 100644 --- a/docs/mindstudio/docs/source_zh_cn/index.rst +++ b/docs/mindstudio/docs/source_zh_cn/index.rst @@ -64,7 +64,7 @@ MindStudio是面向AI开发者提供的全流程工具链,提供了精度、 - + -- Gitee
工具功能工具功能 简介 适用场景/优势 当前版本限制1. 将模型中训练的API或Cell的前反向输入输出数据保存下来分析
2. 模型出现溢出时,可用于查看哪些API或Cell出现了溢出
1. API级数据采集仅对支持列表中的API进行采集
2. 暂不支持采集inplace类API及其上一节点的反向数据
3. 暂不支持参数及参数梯度的采集
可视化比对解析Dump的精度数据,还原模型图结构,比对各层级精度数据,助力理解模型结构、分析精度问题。1. 整网精度比对定位可疑算子,通过浏览器展示比对结果,支持快速搜索到可疑算子
2. 支持查看模型层级结果,比对模型层级结构差异
1. 由于使用整网Dump数据,定位的可疑算子受累计误差影响
2. 当模型规模较大时,比对所需时间较长
溢出检查 检测模型计算过程的输入输出,并在溢出时落盘数据,助力用户快速定位溢出位置。 1. 当模型出现溢出时,可用于定位最先溢出的API或Cell或kernel
2. 相比数据采集,性能更优,磁盘压力更小
1. 除具有与数据采集功能相同的约束外,动态图场景下,不支持 Primitive 和 Jit 类 API 的检测
2. 动态图场景下,仅支持检测API或Cell级别溢出
3. 静态图场景下,仅支持检测kernel级别溢出
可视化比对解析Dump的精度数据,还原模型图结构,比对各层级精度数据,助力理解模型结构、分析精度问题。1. 整网精度比对定位可疑算子,通过浏览器展示比对结果,支持快速搜索到可疑算子
2. 支持查看模型层级结果,比对模型层级结构差异
1. 由于使用整网Dump数据,定位的可疑算子受累计误差影响
2. 当模型规模较大时,比对所需时间较长
compare精度比对 NPU精度数据与标杆数据的比对,支持MindSpore框架内和与PyTorch跨框架的比对,助力快速定位精度异常API或Cell。安装msprof-anaylze
msleaksmsleaks CANN包提供的命令行工具,用于模型训内存问题定位,提供Step内和Step间的内存异常检测能力,包括Step内内存泄漏分析和Step间内存对比分析。 安装MindSpore