diff --git a/debug/accuracy_tools/msprobe/docs/07.accuracy_checker_PyTorch.md b/debug/accuracy_tools/msprobe/docs/07.accuracy_checker_PyTorch.md index fbb2f54f6447ef9d27362521f831ce908a87f96d..0b81ada99f01bdbe8981d5368b70d43fd05818f9 100644 --- a/debug/accuracy_tools/msprobe/docs/07.accuracy_checker_PyTorch.md +++ b/debug/accuracy_tools/msprobe/docs/07.accuracy_checker_PyTorch.md @@ -28,7 +28,7 @@ run_ut 预检操作包括以下两种方式: ### 3.1 使用 run_ut 执行预检 -将 API 信息输入到 run_ut 模块进行精度检测并比对,运行如下命令: +将 API 信息输入到 run_ut 模块进行精度检测并比对,在dump_path的上一级目录执行以下命令(不要在别的路径下执行): ```bash msprobe -f pytorch run_ut -api_info ./dump_path/step{step_number}/rank{rank_number}/dump.json @@ -47,7 +47,7 @@ msprobe -f pytorch run_ut -api_info ./dump_path/step{step_number}/rank{rank_numb run_ut 执行结果包括 `accuracy_checking_result_{timestamp}.csv` 和 `accuracy_checking_details_{timestamp}.csv` 两个文件。`accuracy_checking_result_{timestamp}.csv` 属于 API 级,标明每个 API 是否通过测试。建议用户先查看 `accuracy_checking_result_{timestamp}.csv` 文件,对于其中没有通过测试的或者特定感兴趣的 API,根据其 API name 字段在 `accuracy_checking_details_{timestamp}.csv` 中查询其各个输出的达标情况以及比较指标。详细介绍请参见[ 4 预检结果](#4-预检结果)。 -如果需要保存比对不达标的输入和输出数据,可以在 run_ut 执行命令结尾添加 `-save_error_data`,例如: +如果需要保存比对不达标的输入和输出数据,可以在 run_ut 执行命令结尾添加 `-save_error_data`,在dump_path的上一级目录执行以下命令(不要在别的路径下执行): ```bash msprobe -f pytorch run_ut -api_info ./dump_path/step{step_number}/rank{rank_number}/dump.json -save_error_data @@ -95,7 +95,7 @@ msprobe -f pytorch run_ut -api_info ./dump_path/step{step_number}/rank{rank_numb ### 3.2 使用 multi_run_ut 执行多线程预检 -multi_run_ut 脚本,可以并行执行多个 run_ut 操作,从而减少预检耗时。示例如下: +multi_run_ut 脚本,可以并行执行多个 run_ut 操作,从而减少预检耗时。在dump_path的上一级目录执行以下命令(不要在别的路径下执行): ```bash msprobe -f pytorch multi_run_ut -api_info ./dump_path/step{step_number}/rank{rank_number}/dump.json -n 32 -d 0 1 2 3 @@ -114,7 +114,7 @@ msprobe -f pytorch multi_run_ut -api_info ./dump_path/step{step_number}/rank{ran ### 3.3 断点续检 -断点续检操作通过如下命令执行: +断点续检操作示例,在dump_path的上一级目录执行以下命令(不要在别的路径下执行): ```bash msprobe -f pytorch run_ut -api_info ./dump_path/step{step_number}/rank{rank_number}/dump.json -csv_path /home/xxx/ut/accuracy_checking_result_{timestamp}.csv diff --git a/debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md b/debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md index f34fca3311f2bdf6835dba638b0a51d4b44e5206..487524f2c83994cde0ae1fc0ff88b51466f3d140 100644 --- a/debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md +++ b/debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md @@ -50,7 +50,7 @@ export INF_NAN_MODE_ENABLE=1 详见《[msprobe 使用手册](../README.md)》的“安装”章节。 -2. 执行溢出 API 解析操作。 +2. 执行溢出 API 解析操作。在dump_path的上一级目录执行以下命令(不要在别的路径下执行): ```bash msprobe -f pytorch run_overflow_check -api_info ./dump_path/step{step_number}/rank{rank_number}/dump.json