From affdd2edef5f8c5000583d316fe4b93a75a19a35 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Thu, 20 Feb 2025 15:46:26 +0800
Subject: [PATCH 001/145] compare add euclidean distance

---
 .../msprobe/core/common/const.py              |  8 +-
 .../msprobe/core/compare/acc_compare.py       | 11 ++-
 .../msprobe/core/compare/highlight.py         | 13 ++-
 .../core/compare/multiprocessing_compute.py   |  2 +
 .../msprobe/core/compare/npy_compare.py       | 51 ++++++++++++
 .../msprobe/core/compare/utils.py             |  8 +-
 .../compare/test_acc_compare_npy_compare.py   | 80 ++++++++++++++++++-
 7 files changed, 160 insertions(+), 13 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/common/const.py b/debug/accuracy_tools/msprobe/core/common/const.py
index d9623b80712..bf0883667c0 100644
--- a/debug/accuracy_tools/msprobe/core/common/const.py
+++ b/debug/accuracy_tools/msprobe/core/common/const.py
@@ -256,6 +256,7 @@ class CompareConst:
     MEAN_DIFF = "Mean diff"
     NORM_DIFF = "L2norm diff"
     COSINE = "Cosine"
+    EUC_DIST = "EucDist"
     MAX_ABS_ERR = "MaxAbsErr"
     MAX_RELATIVE_ERR = "MaxRelativeErr"
     MIN_RELATIVE_ERR = "MinRelativeErr"
@@ -330,8 +331,8 @@ class CompareConst:
     ULP_ERR_STATUS = "ulp_err_status"
 
     COMPARE_RESULT_HEADER = [
-        NPU_NAME, BENCH_NAME, NPU_DTYPE, BENCH_DTYPE, NPU_SHAPE, BENCH_SHAPE, COSINE, MAX_ABS_ERR, MAX_RELATIVE_ERR,
-        ONE_THOUSANDTH_ERR_RATIO, FIVE_THOUSANDTHS_ERR_RATIO,
+        NPU_NAME, BENCH_NAME, NPU_DTYPE, BENCH_DTYPE, NPU_SHAPE, BENCH_SHAPE, COSINE, EUC_DIST,
+        MAX_ABS_ERR, MAX_RELATIVE_ERR, ONE_THOUSANDTH_ERR_RATIO, FIVE_THOUSANDTHS_ERR_RATIO,
         NPU_MAX, NPU_MIN, NPU_MEAN, NPU_NORM, BENCH_MAX, BENCH_MIN, BENCH_MEAN, BENCH_NORM, ACCURACY, ERROR_MESSAGE
     ]
 
@@ -357,7 +358,8 @@ class CompareConst:
         Const.MD5: MD5_COMPARE_RESULT_HEADER
     }
 
-    ALL_COMPARE_INDEX = [COSINE, MAX_ABS_ERR, MAX_RELATIVE_ERR, ONE_THOUSANDTH_ERR_RATIO, FIVE_THOUSANDTHS_ERR_RATIO]
+    ALL_COMPARE_INDEX = [COSINE, EUC_DIST, MAX_ABS_ERR, MAX_RELATIVE_ERR, ONE_THOUSANDTH_ERR_RATIO,
+                         FIVE_THOUSANDTHS_ERR_RATIO]
     SUMMARY_COMPARE_INDEX = [MAX_DIFF, MIN_DIFF, MEAN_DIFF, NORM_DIFF,
                              MAX_RELATIVE_ERR, MIN_RELATIVE_ERR, MEAN_RELATIVE_ERR, NORM_RELATIVE_ERR]
 
diff --git a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
index 55229d72657..0672e32404c 100644
--- a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
@@ -456,6 +456,7 @@ class Comparator:
 
     def compare_ops(self, idx, dump_path_dict, result_df, lock, input_param):
         cos_result = []
+        euc_dist_result = []
         max_err_result = []
         max_relative_err_result = []
         err_mess = []
@@ -469,8 +470,8 @@ class Comparator:
             if is_print_compare_log:
                 logger.info("start compare: {}".format(npu_op_name))
 
-            cos_sim, max_abs_err, max_relative_err, one_thousand_err_ratio, five_thousand_err_ratio, err_msg = \
-                self.compare_by_op(npu_op_name, bench_op_name, dump_path_dict, input_param, bench_data)
+            cos_sim, euc_dist, max_abs_err, max_relative_err, one_thousand_err_ratio, five_thousand_err_ratio, err_msg \
+                = self.compare_by_op(npu_op_name, bench_op_name, dump_path_dict, input_param, bench_data)
 
             if is_print_compare_log:
                 logger.info(
@@ -479,6 +480,7 @@ class Comparator:
                     "five_thousand_err_ratio {}".format(npu_op_name, cos_sim, max_abs_err, max_relative_err,
                                                         err_msg, one_thousand_err_ratio, five_thousand_err_ratio))
             cos_result.append(cos_sim)
+            euc_dist_result.append(euc_dist)
             max_err_result.append(max_abs_err)
             max_relative_err_result.append(max_relative_err)
             err_mess.append(err_msg)
@@ -487,6 +489,7 @@ class Comparator:
 
         cr = ComparisonResult(
             cos_result=cos_result,
+            euc_dist_result=euc_dist_result,
             max_err_result=max_err_result,
             max_relative_err_result=max_relative_err_result,
             err_msgs=err_mess,
@@ -496,9 +499,9 @@ class Comparator:
 
         return _save_cmp_result(idx, cr, result_df, lock)
 
-    def do_multi_process(self, input_parma, result_df):
+    def do_multi_process(self, input_param, result_df):
         try:
-            result_df = _handle_multi_process(self.compare_ops, input_parma, result_df,
+            result_df = _handle_multi_process(self.compare_ops, input_param, result_df,
                                               multiprocessing.Manager().RLock())
             return result_df
         except ValueError as e:
diff --git a/debug/accuracy_tools/msprobe/core/compare/highlight.py b/debug/accuracy_tools/msprobe/core/compare/highlight.py
index cf3e1c4c03e..d95729c6d85 100644
--- a/debug/accuracy_tools/msprobe/core/compare/highlight.py
+++ b/debug/accuracy_tools/msprobe/core/compare/highlight.py
@@ -17,6 +17,7 @@ import abc
 import math
 import multiprocessing
 import re
+from abc import ABC
 from collections import namedtuple
 
 import numpy as np
@@ -97,6 +98,13 @@ class CheckCosineSimilarity(HighlightCheck):
                                    "compared to the input/parameters's")
 
 
+class CheckEuclideanDistance(HighlightCheck):
+    """检查欧式距离"""
+
+    def apply(self, info, color_columns, dump_mode):
+        pass
+
+
 class CheckMaxRelativeDiff(HighlightCheck):
     """检查最大相对差异"""
 
@@ -146,11 +154,14 @@ class HighlightRules:
     }
 
     # 用于比较输入和输出的规则
+    # 真实数据检查规则
     compare_rules = {
         "check_order_magnitude": CheckOrderMagnitude(),
         "check_one_thousand_error": CheckOneThousandErrorRatio(),
-        "check_cosine_similarity": CheckCosineSimilarity()
+        "check_cosine_similarity": CheckCosineSimilarity(),
+        "check_euclidean_distance": CheckEuclideanDistance()
     }
+    # 统计量数据检查规则
     summary_compare_rules = {
         "check_order_magnitude": CheckOrderMagnitude(),
         "check_max_relative_diff": CheckMaxRelativeDiff(),
diff --git a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
index c2c1461e452..560a6f603eb 100644
--- a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
+++ b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
@@ -110,6 +110,7 @@ def read_dump_data(result_df):
 @dataclass
 class ComparisonResult:
     cos_result: list
+    euc_dist_result: list
     max_err_result:  list
     max_relative_err_result: list
     err_msgs: list
@@ -135,6 +136,7 @@ def _save_cmp_result(offset, result: ComparisonResult, result_df, lock):
         for i, _ in enumerate(result.cos_result):
             process_index = i + offset
             result_df.loc[process_index, CompareConst.COSINE] = result.cos_result[i]
+            result_df.loc[process_index, CompareConst.EUC_DIST] = result.euc_dist_result[i]
             result_df.loc[process_index, CompareConst.MAX_ABS_ERR] = result.max_err_result[i]
             result_df.loc[process_index, CompareConst.MAX_RELATIVE_ERR] = result.max_relative_err_result[i]
             result_df.loc[process_index, CompareConst.ERROR_MESSAGE] = result.err_msgs[i]
diff --git a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
index c551985780c..db391726c79 100644
--- a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
@@ -168,6 +168,7 @@ def statistics_data_check(result_dict):
 
 class TensorComparisonBasic(abc.ABC):
     """NPU和bench中npy数据的比较模板"""
+
     @abc.abstractmethod
     def apply(self, n_value, b_value, relative_err):
         raise NotImplementedError
@@ -190,6 +191,7 @@ def get_relative_err(n_value, b_value):
 
 class GetCosineSimilarity(TensorComparisonBasic):
     """计算cosine相似度"""
+
     @staticmethod
     def correct_data(result):
         if result == CompareConst.NAN:
@@ -224,8 +226,54 @@ class GetCosineSimilarity(TensorComparisonBasic):
         return result, ""
 
 
+class GetEuclideanDistance(TensorComparisonBasic):
+    """计算欧式距离"""
+
+    def apply(self, n_value, b_value, relative_err):
+        msg = ''
+
+        # 检查输入维度是否一致
+        if n_value.shape != b_value.shape:
+            msg = f"Cannot compare by Euclidean Distance, shapes of tensors do not match: \
+            npu:{n_value.shape} vs bench:{b_value.shape}"
+            return CompareConst.UNSUPPORTED, msg
+
+        # 检查输入是否为空
+        if n_value.size == 0 or b_value.size == 0:
+            msg = f"Cannot compare by Euclidean Distance, sizes of tensors must not be empty: \
+            npu:{n_value.size} vs bench:{b_value.size}"
+            return CompareConst.NAN, msg
+
+        # 检查是否包含 NaN 或 Inf
+        if np.any(np.isnan(n_value)) or np.any(np.isnan(b_value)):
+            msg = "Tensor contains NaN values."
+            return CompareConst.NAN, msg
+        if np.any(np.isinf(n_value)) or np.any(np.isinf(b_value)):
+            msg = "Tensor contains Inf values."
+            return CompareConst.NAN, msg
+
+        # 处理零向量
+        if np.all(n_value == 0) and np.all(b_value == 0):
+            return 0.0, "Zero tensors"
+
+        # 输入为标量
+        if np.ndim(n_value) == 0 or np.ndim(b_value) == 0:
+            msg = "Cannot compare by Euclidean Distance, input must be a vector, not a scalar."
+            return CompareConst.UNSUPPORTED, msg
+
+        # 大数值溢出
+        if np.any(np.abs(n_value) > 1e10) or np.any(np.abs(b_value) > 1e10):
+            msg = "tensors's values are large, which may cause overflow."
+
+        # 计算欧式距离
+        distance = np.linalg.norm(n_value - b_value)
+
+        return distance, msg
+
+
 class GetMaxAbsErr(TensorComparisonBasic):
     """计算最大绝对误差"""
+
     def apply(self, n_value, b_value, relative_err):
         temp_res = n_value - b_value
         max_value = np.max(np.abs(temp_res))
@@ -237,6 +285,7 @@ class GetMaxAbsErr(TensorComparisonBasic):
 
 class GetMaxRelativeErr(TensorComparisonBasic):
     """计算最大相对误差"""
+
     def apply(self, n_value, b_value, relative_err):
         max_relative_err = np.max(np.abs(relative_err))
         if np.isnan(max_relative_err):
@@ -247,6 +296,7 @@ class GetMaxRelativeErr(TensorComparisonBasic):
 
 class GetErrRatio(TensorComparisonBasic):
     """计算相对误差小于指定阈值(千分之一、千分之五)的比例"""
+
     def __init__(self, threshold):
         self.threshold = threshold
 
@@ -264,6 +314,7 @@ class GetErrRatio(TensorComparisonBasic):
 class CompareOps:
     compare_ops = {
         "cosine_similarity": GetCosineSimilarity(),
+        "euclidean_distance": GetEuclideanDistance(),
         "max_abs_error": GetMaxAbsErr(),
         "max_relative_error": GetMaxRelativeErr(),
         "one_thousand_err_ratio": GetErrRatio(CompareConst.THOUSAND_RATIO_THRESHOLD),
diff --git a/debug/accuracy_tools/msprobe/core/compare/utils.py b/debug/accuracy_tools/msprobe/core/compare/utils.py
index a2edf57e5bb..72b75ab254e 100644
--- a/debug/accuracy_tools/msprobe/core/compare/utils.py
+++ b/debug/accuracy_tools/msprobe/core/compare/utils.py
@@ -285,9 +285,9 @@ def result_item_init(n_info, b_info, dump_mode):
             md5_compare_result = CompareConst.PASS if n_info.struct[2] == b_info.struct[2] else CompareConst.DIFF
             result_item.extend([n_info.struct[2], b_info.struct[2], md5_compare_result])
         elif dump_mode == Const.SUMMARY:
-            result_item.extend([" "] * 8)
+            result_item.extend([" "] * 8)  # 8个统计量数据情况的比对指标
         else:
-            result_item.extend([" "] * 5)
+            result_item.extend([" "] * 6)  # 6个真实数据情况的比对指标
     else:
         err_msg = "index out of bounds error will occur in result_item_init, please check!\n" \
                   f"npu_info_struct is {n_info.struct}\n" \
@@ -453,9 +453,9 @@ def get_un_match_accuracy(result, n_dict, dump_mode):
             result.append(result_item)
             continue
         if dump_mode == Const.SUMMARY:
-            result_item.extend([CompareConst.N_A] * 8)
+            result_item.extend([CompareConst.N_A] * 8)  # 8个统计量数据情况的比对指标
         if dump_mode == Const.ALL:
-            result_item.extend([CompareConst.N_A] * 5)
+            result_item.extend([CompareConst.N_A] * 6)  # 6个真实数据情况的比对指标
 
         npu_summary_data = safe_get_value(summary_reorder, index, "summary_reorder")
         bench_summary_data = [CompareConst.N_A] * 4
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
index aec6cdc5117..cee6d5565bf 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
@@ -20,7 +20,7 @@ from unittest.mock import patch
 from msprobe.core.common.const import CompareConst
 from msprobe.core.compare.npy_compare import handle_inf_nan, reshape_value, get_error_flag_and_msg, \
     npy_data_check, statistics_data_check, get_relative_err, GetCosineSimilarity, GetMaxAbsErr, GetMaxRelativeErr, \
-    GetErrRatio, error_value_process, compare_ops_apply
+    GetErrRatio, error_value_process, compare_ops_apply, GetEuclideanDistance
 
 
 op_name = 'Functional.conv2d.0.backward.input.0'
@@ -473,3 +473,81 @@ class TestUtilsMethods(unittest.TestCase):
         a, b = compare_ops_apply(n_value, b_value, error_flag, err_msg)
         self.assertEqual(a, [1.0, 0.0, 0.0, 1.0, 1.0])
         self.assertEqual(b, '')
+
+
+class TestGetEuclideanDistance(unittest.TestCase):
+
+    def setUp(self):
+        self.euc_distance = GetEuclideanDistance()
+
+    def test_shape_mismatch(self):
+        # 测试当两个张量的形状不匹配时，返回 UNSUPPORTED
+        n_value = np.array([1, 2, 3])
+        b_value = np.array([1, 2])
+
+        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        self.assertEqual(result, CompareConst.UNSUPPORTED)
+        self.assertIn("Cannot compare by Euclidean Distance", msg)
+
+    def test_empty_tensor(self):
+        # 测试当输入的张量为空时，返回 NAN
+        n_value = np.array([])
+        b_value = np.array([1, 2, 3])
+
+        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        self.assertEqual(result, CompareConst.NAN)
+        self.assertIn("sizes of tensors must not be empty", msg)
+
+    def test_nan_in_tensor(self):
+        # 测试当张量包含 NaN 值时，返回 NAN
+        n_value = np.array([1, 2, np.nan])
+        b_value = np.array([1, 2, 3])
+
+        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        self.assertEqual(result, CompareConst.NAN)
+        self.assertIn("Tensor contains NaN values", msg)
+
+    def test_inf_in_tensor(self):
+        # 测试当张量包含 Inf 值时，返回 NAN
+        n_value = np.array([1, 2, np.inf])
+        b_value = np.array([1, 2, 3])
+
+        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        self.assertEqual(result, CompareConst.NAN)
+        self.assertIn("Tensor contains Inf values", msg)
+
+    def test_zero_tensors(self):
+        # 测试两个零张量的欧式距离
+        n_value = np.array([0, 0, 0])
+        b_value = np.array([0, 0, 0])
+
+        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        self.assertEqual(result, 0.0)
+        self.assertIn("Zero tensors", msg)
+
+    def test_scalars(self):
+        # 测试当输入是标量时，返回 UNSUPPORTED
+        n_value = np.array(5)
+        b_value = np.array(10)
+
+        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        self.assertEqual(result, CompareConst.UNSUPPORTED)
+        self.assertIn("input must be a vector, not a scalar", msg)
+
+    def test_large_values(self):
+        # 测试当张量包含大值时，应该返回大数值溢出的警告
+        n_value = np.array([1e11, 1e11, 1e11])
+        b_value = np.array([1e10, 1e10, 1e10])
+
+        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        self.assertIn("tensors's values are large", msg)
+
+    def test_euclidean_distance(self):
+        # 测试计算两个张量之间的欧式距离
+        n_value = np.array([1, 2, 3])
+        b_value = np.array([4, 5, 6])
+
+        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        expected_distance = np.linalg.norm(n_value - b_value)
+        self.assertEqual(result, expected_distance)
+        self.assertEqual(msg, '')
-- 
Gitee


From e72f218ff15c2d7203981ba606b3aef16d43ff08 Mon Sep 17 00:00:00 2001
From: jiangchao_j <chaojiang_j@163.com>
Date: Fri, 21 Feb 2025 21:03:48 +0800
Subject: [PATCH 002/145] reconstruct api_wrap code

---
 .../msprobe/core/common/const.py              |  94 ++++++++
 .../msprobe/core/data_dump/api_registry.py    | 175 +++++++++++++++
 .../data_processor/mindspore_processor.py     |  51 ++---
 .../mindspore/debugger/precision_debugger.py  |  35 +--
 .../mindspore/dump/hook_cell/api_register.py  | 123 ++++++++++
 .../mindspore/dump/hook_cell/api_registry.py  | 207 -----------------
 .../mindspore/dump/hook_cell/hook_cell.py     |  14 +-
 .../mindspore/dump/hook_cell/wrap_api.py      | 212 ------------------
 .../msprobe/mindspore/dump/jit_dump.py        |  13 +-
 .../free_benchmark/api_pynative_self_check.py |  16 +-
 .../msprobe/mindspore/service.py              |   9 +-
 .../run_ut/run_ut_utils.py                    |  36 +--
 .../pytorch/dump/module_dump/module_dump.py   |   7 +-
 .../pytorch/hook_module/api_register.py       | 126 +++++++++++
 .../pytorch/hook_module/api_registry.py       | 166 --------------
 .../pytorch/hook_module/hook_module.py        |  24 +-
 .../pytorch/hook_module/support_wrap_ops.yaml |   6 +-
 .../msprobe/pytorch/hook_module/wrap_aten.py  | 111 ---------
 .../pytorch/hook_module/wrap_distributed.py   |  79 -------
 .../pytorch/hook_module/wrap_functional.py    |  66 ------
 .../pytorch/hook_module/wrap_npu_custom.py    |  85 -------
 .../pytorch/hook_module/wrap_tensor.py        |  69 ------
 .../msprobe/pytorch/hook_module/wrap_torch.py |  84 -------
 .../msprobe/pytorch/hook_module/wrap_vf.py    |  60 -----
 .../accuracy_tools/msprobe/pytorch/service.py |  10 +-
 25 files changed, 624 insertions(+), 1254 deletions(-)
 create mode 100644 debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
 create mode 100644 debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
 delete mode 100644 debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_registry.py
 delete mode 100644 debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/wrap_api.py
 create mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
 delete mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/api_registry.py
 delete mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_aten.py
 delete mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_distributed.py
 delete mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_functional.py
 delete mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_npu_custom.py
 delete mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_tensor.py
 delete mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_torch.py
 delete mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_vf.py

diff --git a/debug/accuracy_tools/msprobe/core/common/const.py b/debug/accuracy_tools/msprobe/core/common/const.py
index d9623b80712..fffab5e8d28 100644
--- a/debug/accuracy_tools/msprobe/core/common/const.py
+++ b/debug/accuracy_tools/msprobe/core/common/const.py
@@ -230,6 +230,100 @@ class Const:
 
     TENSOR_STAT_LEN = 2
 
+    SUPPORT_API_FILE_NAME = "support_wrap_ops.yaml"
+
+    PT_API_TYPE_FUNCTIONAL = "functional"
+    PT_API_TYPE_TENSOR = "tensor"
+    PT_API_TYPE_TORCH = "torch"
+    PT_API_TYPE__VF = "_VF"
+    PT_API_TYPE_NPU = "torch_npu"
+    PT_API_TYPE_ATEN = "aten"
+    PT_API_TYPE_DIST = "distributed"
+    PT_API_TYPE_DIST_C10D = "distributed_c10d"
+    PT_API_TYPE_NPU_DIST = "npu_distributed"
+    PT_API_TYPE_NPU_DIST_C10D = "npu_distributed_c10d"
+
+    MS_API_TYPE_OPS = "ops"
+    MS_API_TYPE_TENSOR = "tensor"
+    MS_API_TYPE_STUB_TENSOR = "stubtensor"
+    MS_API_TYPE_MINT = "mint.ops"
+    MS_API_TYPE_MINT_FUNC = "mint.nn.functional"
+    MS_API_TYPE_COM = "communication.comm_func"
+
+    FUNCTIONAL_API_TYPE_PREFIX = "Functional"
+    TENSOR_API_TYPE_PREFIX = "Tensor"
+    DIST_API_TYPE_PREFIX = "Distributed"
+
+    TORCH_API_TYPE_PREFIX = "Torch"
+    NPU_API_TYPE_PREFIX = "NPU"
+    ATEN_API_TYPE_PREFIX = "Aten"
+    VF_API_TYPE_PREFIX = "VF"
+
+    MINT_API_TYPE_PREFIX = "Mint"
+    MINT_FUNC_API_TYPE_PREFIX = "MintFunctional"
+
+    SUPPORT_API_DICT_KEY_MAP = {
+        PT_FRAMEWORK: {
+            PT_API_TYPE_FUNCTIONAL: PT_API_TYPE_FUNCTIONAL,
+            PT_API_TYPE_TENSOR: PT_API_TYPE_TENSOR,
+            PT_API_TYPE_TORCH: PT_API_TYPE_TORCH,
+            PT_API_TYPE__VF: PT_API_TYPE__VF,
+            PT_API_TYPE_NPU: PT_API_TYPE_NPU,
+            PT_API_TYPE_ATEN: PT_API_TYPE_ATEN,
+            PT_API_TYPE_DIST: PT_API_TYPE_DIST,
+            PT_API_TYPE_DIST_C10D: PT_API_TYPE_DIST,
+            PT_API_TYPE_NPU_DIST: PT_API_TYPE_NPU_DIST,
+            PT_API_TYPE_NPU_DIST_C10D: PT_API_TYPE_NPU_DIST
+        },
+        MS_FRAMEWORK: {
+            MS_API_TYPE_OPS: MS_API_TYPE_OPS,
+            MS_API_TYPE_TENSOR: MS_API_TYPE_TENSOR,
+            MS_API_TYPE_STUB_TENSOR: MS_API_TYPE_TENSOR,
+            MS_API_TYPE_MINT: MS_API_TYPE_MINT,
+            MS_API_TYPE_MINT_FUNC: MS_API_TYPE_MINT_FUNC,
+            MS_API_TYPE_COM: MS_API_TYPE_COM
+        },
+        MT_FRAMEWORK: {
+            PT_API_TYPE_FUNCTIONAL: PT_API_TYPE_FUNCTIONAL,
+            PT_API_TYPE_TENSOR: PT_API_TYPE_TENSOR,
+            PT_API_TYPE_TORCH: PT_API_TYPE_TORCH,
+            PT_API_TYPE_NPU: PT_API_TYPE_NPU,
+            PT_API_TYPE_DIST: PT_API_TYPE_DIST,
+            PT_API_TYPE_DIST_C10D: PT_API_TYPE_DIST
+        }
+    }
+
+    API_DATA_PREFIX = {
+        PT_FRAMEWORK: {
+            PT_API_TYPE_FUNCTIONAL: FUNCTIONAL_API_TYPE_PREFIX,
+            PT_API_TYPE_TENSOR: TENSOR_API_TYPE_PREFIX,
+            PT_API_TYPE_TORCH: TORCH_API_TYPE_PREFIX,
+            PT_API_TYPE__VF: VF_API_TYPE_PREFIX,
+            PT_API_TYPE_NPU: NPU_API_TYPE_PREFIX,
+            PT_API_TYPE_ATEN: ATEN_API_TYPE_PREFIX,
+            PT_API_TYPE_DIST: DIST_API_TYPE_PREFIX,
+            PT_API_TYPE_DIST_C10D: DIST_API_TYPE_PREFIX,
+            PT_API_TYPE_NPU_DIST: DIST_API_TYPE_PREFIX,
+            PT_API_TYPE_NPU_DIST_C10D: DIST_API_TYPE_PREFIX
+        },
+        MS_FRAMEWORK: {
+            MS_API_TYPE_OPS: FUNCTIONAL_API_TYPE_PREFIX,
+            MS_API_TYPE_TENSOR: TENSOR_API_TYPE_PREFIX,
+            MS_API_TYPE_STUB_TENSOR: TENSOR_API_TYPE_PREFIX,
+            MS_API_TYPE_MINT: MINT_API_TYPE_PREFIX,
+            MS_API_TYPE_MINT_FUNC: MINT_FUNC_API_TYPE_PREFIX,
+            MS_API_TYPE_COM: DIST_API_TYPE_PREFIX
+        },
+        MT_FRAMEWORK: {
+            PT_API_TYPE_FUNCTIONAL: FUNCTIONAL_API_TYPE_PREFIX,
+            PT_API_TYPE_TENSOR: TENSOR_API_TYPE_PREFIX,
+            PT_API_TYPE_TORCH: TORCH_API_TYPE_PREFIX,
+            PT_API_TYPE_NPU: NPU_API_TYPE_PREFIX,
+            PT_API_TYPE_DIST: DIST_API_TYPE_PREFIX,
+            PT_API_TYPE_DIST_C10D: DIST_API_TYPE_PREFIX,
+        }
+    }
+
 
 class CompareConst:
     """
diff --git a/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py b/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
new file mode 100644
index 00000000000..62e63769690
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
@@ -0,0 +1,175 @@
+# Copyright (c) 2025-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from typing import Dict, Any, Optional, Callable, Union, List, Tuple
+
+from msprobe.core.common.const import Const
+from msprobe.core.common.file_utils import load_yaml
+
+
+def _get_attr(module, attr_name):
+    if Const.SEP in attr_name:
+        sub_module_name, sub_attr = attr_name.rsplit(Const.SEP, 1)
+        sub_module = getattr(module, sub_module_name, None)
+        attr = getattr(sub_module, sub_attr, None)
+    else:
+        attr = getattr(module, attr_name, None)
+    return attr
+
+
+class ApiWrapper:
+    def __init__(
+        self, api_types: Dict[str, Dict[str, Any]],
+        api_list_paths: Union[str, List[str], Tuple[str]]
+    ):
+        self.api_types = api_types
+        if not isinstance(api_list_paths, (list, tuple)):
+            api_list_paths = [api_list_paths] * len(self.api_types)
+        elif len(api_list_paths) != len(self.api_types):
+            raise RuntimeError("The number of api_list_paths must be equal to the number of frameworks in 'api_types', "
+                               "when api_list_paths is a list or tuple.")
+        self.api_list_paths = api_list_paths
+        self.api_names = self._get_api_names()
+        self.wrapped_api_functions = dict()
+
+    def wrap_api(
+        self, api_templates, hook_build_func: Optional[Callable]
+    ):
+        api_types_num = sum([len(v) for v in self.api_types.values()])
+        if not isinstance(api_templates, (list, tuple)):
+            api_templates = [api_templates] * api_types_num
+        elif len(api_templates) != len(api_types_num):
+            raise RuntimeError("The number of api_templates must be equal to the number of api_types, "
+                               "when api_templates is a list or tuple.")
+
+        self.wrapped_api_functions.clear()
+        # {"pytorch": {"torch": torch}, "mindspore": {"tensor": ms.Tensor}}
+        index = 0
+        for framework, api_types in self.api_types.items():
+            wrapped_functions_in_framework = dict()
+            for api_type, api_modules in api_types.items():
+                wrapped_functions = dict()
+                name_prefix = Const.API_DATA_PREFIX.get(framework, {}).get(api_type, "API")
+                api_template = api_templates[index]
+                index += 1
+                for api_name in self.api_names.get(framework, {}).get(api_type, []):
+                    ori_api = _get_attr(api_modules[0], api_name)
+                    if callable(ori_api):
+                        def wrap_api_func(api_name, api_func, prefix, hook_build_func, api_template):
+                            def api_function(*args, **kwargs):
+                                return api_template(api_name, api_func, prefix, hook_build_func)(*args, **kwargs)
+                            return api_function
+                        wrapped_functions[api_name] = wrap_api_func(api_name, ori_api, name_prefix,
+                                                                    hook_build_func, api_template)
+                wrapped_functions_in_framework[api_type] = wrapped_functions
+            self.wrapped_api_functions[framework] = wrapped_functions_in_framework
+        return self.wrapped_api_functions
+
+    def _get_api_names(self):
+        api_names = dict()
+
+        for index, framework in enumerate(self.api_types.keys()):
+            api_list = load_yaml(self.api_list_paths[index])
+            valid_names = dict()
+            for api_type, api_modules in self.api_types.get(framework, {}).items():
+                api_from_file = api_list.get(Const.SUPPORT_API_DICT_KEY_MAP.get(framework, {}).get(api_type), [])
+                names = set()
+                for api_name in api_from_file:
+                    target_attr = api_name
+                    target_module = api_modules[0]
+                    if Const.SEP in api_name:
+                        sub_module_name, target_attr = api_name.rsplit('.', 1)
+                        target_module = getattr(api_modules[0], sub_module_name)
+                    if target_attr in dir(target_module):
+                        names.add(api_name)
+                valid_names[api_type] = names
+            api_names[framework] = valid_names
+
+        return api_names
+
+
+class ApiRegistry:
+    """
+    Base class for api registry.
+    """
+
+    def __init__(self, api_types, inner_used_api, supported_api_list_path, api_templates):
+        self.ori_api_attr = dict()
+        self.wrapped_api_attr = dict()
+        self.inner_used_ori_attr = dict()
+        self.inner_used_wrapped_attr = dict()
+        self.api_types = api_types
+        self.inner_used_api = inner_used_api
+        self.supported_api_list_path = supported_api_list_path
+        self.api_templates = api_templates
+
+    @staticmethod
+    def store_ori_attr(ori_api_group, api_list, api_ori_attr):
+        for api in api_list:
+            ori_api_func = _get_attr(ori_api_group, api)
+            api_ori_attr[api] = ori_api_func
+
+    @staticmethod
+    def set_api_attr(api_group, attr_dict):
+        for api, api_attr in attr_dict.items():
+            if Const.SEP in api:
+                sub_module_name, sub_op = api.rsplit(Const.SEP, 1)
+                sub_module = getattr(api_group, sub_module_name, None)
+                if sub_module is not None:
+                    setattr(sub_module, sub_op, api_attr)
+            else:
+                setattr(api_group, api, api_attr)
+
+    def register_all_api(self):
+        for framework, api_types in self.api_types.items():
+            for api_type, api_modules in api_types.items():
+                api_type_with_framework = framework + Const.SEP + api_type
+                self.set_api_attr(api_modules[1], self.wrapped_api_attr.get(api_type_with_framework, {}))
+
+    def register_inner_used_api(self):
+        for api_type in self.inner_used_api.keys():
+            self.set_api_attr(self.inner_used_api.get(api_type)[0], self.inner_used_wrapped_attr.get(api_type, {}))
+
+    def restore_all_api(self):
+        for framework, api_types in self.api_types.items():
+            for api_type, api_modules in api_types.items():
+                api_type_with_framework = framework + Const.SEP + api_type
+                self.set_api_attr(api_modules[1], self.ori_api_attr.get(api_type_with_framework, {}))
+
+    def restore_inner_used_api(self):
+        for api_type in self.inner_used_api.keys():
+            self.set_api_attr(self.inner_used_api.get(api_type)[0], self.inner_used_ori_attr.get(api_type, {}))
+
+    def initialize_hook(self, hook_build_func):
+        api_wrapper = ApiWrapper(self.api_types, self.supported_api_list_path)
+        wrapped_api_functions = api_wrapper.wrap_api(self.api_templates, hook_build_func)
+
+        for framework, api_types in self.api_types.items():
+            for api_type, api_modules in api_types.items():
+                ori_attr = dict()
+                self.store_ori_attr(api_modules[0], api_wrapper.api_names.get(framework).get(api_type), ori_attr)
+                api_type_with_framework = framework + Const.SEP + api_type
+                self.ori_api_attr[api_type_with_framework] = ori_attr
+                self.wrapped_api_attr[api_type_with_framework] = wrapped_api_functions.get(framework).get(api_type)
+
+        for inner_used_api_type, inner_used_api_list in self.inner_used_api.items():
+            ori_attr = dict()
+            wrapped_attr = dict()
+            for api_name in inner_used_api_list[1:]:
+                if self.ori_api_attr.get(inner_used_api_type, {}).get(api_name):
+                    ori_attr[api_name] = self.ori_api_attr.get(inner_used_api_type).get(api_name)
+                    wrapped_attr[api_name] = self.wrapped_api_attr.get(inner_used_api_type).get(api_name)
+            self.inner_used_ori_attr[inner_used_api_type] = ori_attr
+            self.inner_used_wrapped_attr[inner_used_api_type] = wrapped_attr
diff --git a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/mindspore_processor.py b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/mindspore_processor.py
index 8c4542a1917..c6ab0293cf3 100644
--- a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/mindspore_processor.py
+++ b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/mindspore_processor.py
@@ -26,7 +26,7 @@ from msprobe.core.data_dump.data_processor.base import (BaseDataProcessor, Tenso
 from msprobe.core.common.file_utils import path_len_exceeds_limit, save_npy
 from msprobe.mindspore.common.utils import convert_bf16_to_fp32, save_tensor_as_npy
 from msprobe.mindspore.common.log import logger
-from msprobe.mindspore.dump.hook_cell.api_registry import api_register
+from msprobe.mindspore.dump.hook_cell.api_register import get_api_register
 
 has_adump = True
 try:
@@ -44,6 +44,7 @@ class MindsporeDataProcessor(BaseDataProcessor):
             "dtype": self.analyze_dtype_in_kwargs
         }
         self._async_dump_cache = {}
+        self.api_register = get_api_register()
 
     @staticmethod
     def get_md5_for_tensor(x):
@@ -74,46 +75,29 @@ class MindsporeDataProcessor(BaseDataProcessor):
         else:
             if not ops.is_floating_point(data) or data.dtype == ms.float64:
                 data = data.to(ms.float32)
-            api_register.norm_inner_op_set_ori_func()
-            get_max_value = api_register.mint_ops_ori_attr.get("max", mint.max)
-            get_min_value = api_register.mint_ops_ori_attr.get("min", mint.min)
-            get_mean_value = api_register.mint_ops_ori_attr.get("mean", mint.mean)
-            if hasattr(mint, "norm"):
-                get_norm_value = api_register.mint_ops_ori_attr.get("norm", mint.norm)
-            else:
-                get_norm_value = api_register.functional_ori_attr.get("norm", ops.norm)
-            tensor_stat.max = get_max_value(data).item()
-            tensor_stat.min = get_min_value(data).item()
-            tensor_stat.mean = get_mean_value(data).item()
+            get_norm_value = mint.norm if hasattr(mint, "norm") else ops.norm
+            tensor_stat.max = mint.max(data).item()
+            tensor_stat.min = mint.min(data).item()
+            tensor_stat.mean = mint.mean(data).item()
             tensor_stat.norm = get_norm_value(data).item()
-            api_register.norm_inner_op_set_hook_func()
         return tensor_stat
 
     @staticmethod
     def get_stat_info_async(data):
         tensor_stat = TensorStatInfo()
-        stack_method = api_register.functional_ori_attr.get("stack", ms.ops.stack)
         if data.dtype == ms.complex64 or data.dtype == ms.complex128:
             logger.warning("Async dump do not support complex data!")
             return tensor_stat
         elif data.dtype == ms.bool_:
-            tensor_stat.stack_tensor_stat = (["Max", "Min"], stack_method([data.any(), data.all()]))
+            tensor_stat.stack_tensor_stat = (["Max", "Min"], ops.stack([data.any(), data.all()]))
         elif not data.shape:
-            tensor_stat.stack_tensor_stat = (["Max", "Min", "Mean", "Norm"], stack_method([data, data, data, data]))
+            tensor_stat.stack_tensor_stat = (["Max", "Min", "Mean", "Norm"], ops.stack([data, data, data, data]))
         else:
             if not ops.is_floating_point(data) or data.dtype == ms.float64:
                 data = data.to(ms.float32)
-            api_register.norm_inner_op_set_ori_func()
-            get_max_value = api_register.mint_ops_ori_attr.get("max", mint.max)
-            get_min_value = api_register.mint_ops_ori_attr.get("min", mint.min)
-            get_mean_value = api_register.mint_ops_ori_attr.get("mean", mint.mean)
-            if hasattr(mint, "norm"):
-                get_norm_value = api_register.mint_ops_ori_attr.get("norm", mint.norm)
-            else:
-                get_norm_value = api_register.functional_ori_attr.get("norm", ops.norm)
-            tensor_stat.stack_tensor_stat = (["Max", "Min", "Mean", "Norm"], stack_method(
-                [get_max_value(data), get_min_value(data), get_mean_value(data), get_norm_value(data)]))
-            api_register.norm_inner_op_set_hook_func()
+            get_norm_value = mint.norm if hasattr(mint, "norm") else ops.norm
+            tensor_stat.stack_tensor_stat = (["Max", "Min", "Mean", "Norm"], ops.stack(
+                [mint.max(data), mint.min(data), mint.mean(data), get_norm_value(data)]))
         return tensor_stat
 
     @staticmethod
@@ -125,14 +109,17 @@ class MindsporeDataProcessor(BaseDataProcessor):
         return super().get_special_types() + cls.mindspore_special_type
 
     def get_stat_info(self, data):
+        self.api_register.restore_inner_used_api()
         tensor_stat = TensorStatInfo()
         if data.numel() == 0:
-            return tensor_stat
+            stat_info = tensor_stat
         else:
             if self.config.async_dump:
-                return MindsporeDataProcessor.get_stat_info_async(data)
+                stat_info = MindsporeDataProcessor.get_stat_info_async(data)
             else:
-                return MindsporeDataProcessor.get_stat_info_sync(data)
+                stat_info = MindsporeDataProcessor.get_stat_info_sync(data)
+        self.api_register.register_inner_used_api()
+        return stat_info
 
     def analyze_single_element(self, element, suffix_stack):
         if suffix_stack and suffix_stack[-1] in self.mindspore_object_key:
@@ -191,7 +178,7 @@ class TensorDataProcessor(MindsporeDataProcessor):
         else:
             save_tensor_as_npy(tensor, file_path)
         return single_arg
-    
+
     def _analyze_numpy(self, ndarray, suffix):
         dump_data_name, file_path = self.get_save_file_path(suffix)
         save_npy(ndarray, file_path)
@@ -244,7 +231,7 @@ class OverflowCheckDataProcessor(MindsporeDataProcessor):
         api_info_struct = super().analyze_backward(name, module, module_input_output)
         self.maybe_save_overflow_data()
         return api_info_struct if self.has_overflow else None
-
+    
     def analyze_params(self, name, param_name, grad):
         self.has_overflow = False
         api_info_struct = super().analyze_params(name, param_name, grad)
diff --git a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
index 7694d71dd98..6fb7c587b37 100644
--- a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
+++ b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
@@ -25,9 +25,9 @@ from msprobe.core.common.file_utils import FileChecker
 from msprobe.core.common.utils import get_real_step_or_rank
 from msprobe.mindspore.cell_processor import CellProcessor
 from msprobe.mindspore.common.const import Const as MsConst
-from msprobe.mindspore.common.utils import set_register_backward_hook_functions, check_save_param
+from msprobe.mindspore.common.utils import set_register_backward_hook_functions
 from msprobe.mindspore.debugger.debugger_config import DebuggerConfig
-from msprobe.mindspore.dump.hook_cell.api_registry import api_register
+from msprobe.mindspore.dump.hook_cell.api_register import get_api_register
 from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
 from msprobe.mindspore.grad_probe.grad_monitor import GradientMonitor
 from msprobe.mindspore.ms_config import parse_json_config
@@ -89,7 +89,6 @@ class PrecisionDebugger:
 
         self.config.execution_mode = self._get_execution_mode()
         if self._need_service():
-            self.config.check_config_with_l2()
             self.service = Service(self.config)
 
         Runtime.step_count = 0
@@ -140,11 +139,11 @@ class PrecisionDebugger:
     def _is_graph_dump(config):
         if config.level != MsConst.KERNEL:
             return False
-        if not config.list:
+        if not config.list or len(config.list) > 1:
             return True
-        is_graph = any(item.startswith("name-regex") for item in config.list)
-        is_graph |= all("." not in item for item in config.list)
-        return is_graph
+        if '-' in config.list[0] or '/' in config.list[0]:
+            return True
+        return False
 
     @classmethod
     def start(cls, model=None):
@@ -163,7 +162,7 @@ class PrecisionDebugger:
             instance.service.start(model)
         else:
             if not instance.first_start:
-                api_register.api_set_ori_func()
+                get_api_register().restore_all_api()
                 handler = TaskHandlerFactory.create(instance.config)
                 handler.handle()
 
@@ -215,24 +214,6 @@ class PrecisionDebugger:
             return
         instance.gm.monitor(opt)
 
-    @classmethod
-    def save(cls, variable, name, save_backward=True):
-        instance = cls._instance
-        if not instance:
-            raise Exception(MsgConst.NOT_CREATED_INSTANCE)
-        if instance.task not in [Const.TENSOR, Const.STATISTICS] or instance.config.level_ori != Const.LEVEL_DEBUG:
-            return
-        try:
-            check_save_param(variable, name, save_backward)
-        except ValueError:
-            return
-
-        instance.config.execution_mode = cls._get_execution_mode()
-        if cls._need_service():
-            if not instance.service:
-                instance.service = Service(instance.config)
-            instance.service.save(variable, name, save_backward)
-
     @classmethod
     def _need_service(cls):
         instance = cls._instance
@@ -241,4 +222,4 @@ class PrecisionDebugger:
         if instance.config.execution_mode != MsConst.PYNATIVE_MODE:
             return False
         else:
-            return instance.config.task != Const.FREE_BENCHMARK and not instance._is_graph_dump(instance.config)
\ No newline at end of file
+            return instance.config.task != Const.FREE_BENCHMARK and not instance._is_graph_dump(instance.config)
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
new file mode 100644
index 00000000000..207ccacb595
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
@@ -0,0 +1,123 @@
+# Copyright (c) 2025-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+
+from mindspore import Tensor, ops, mint
+from mindspore.mint.nn import functional
+from mindspore.common._stub_tensor import StubTensor
+from mindspore.communication import comm_func
+
+from msprobe.core.common.utils import Const
+from msprobe.core.data_dump.api_registry import ApiRegistry
+from msprobe.mindspore.common.const import Const as MsConst
+from msprobe.mindspore.common.utils import is_mindtorch
+from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
+
+if not is_mindtorch():
+    _api_types = {
+        Const.MS_FRAMEWORK: {
+            Const.MS_API_TYPE_OPS: (ops, ops),
+            Const.MS_API_TYPE_TENSOR: (Tensor, Tensor),
+            Const.MS_API_TYPE_STUB_TENSOR: (StubTensor, StubTensor),
+            Const.MS_API_TYPE_MINT: (mint, mint),
+            Const.MS_API_TYPE_MINT_FUNC: (functional, functional),
+            Const.MS_API_TYPE_COM: (comm_func, comm_func)
+        }
+    }
+else:
+    import torch
+    import torch_npu
+    _api_types = {
+        Const.MT_FRAMEWORK: {
+            Const.PT_API_TYPE_FUNCTIONAL: (torch.nn.functional, torch.nn.functional),
+            Const.PT_API_TYPE_TENSOR: (torch.Tensor, torch.Tensor),
+            Const.PT_API_TYPE_TORCH: (torch, torch),
+            Const.PT_API_TYPE_NPU: (torch_npu, torch_npu),
+            Const.PT_API_TYPE_DIST: (torch.distributed, torch.distributed),
+            Const.PT_API_TYPE_DIST_C10D: (torch.distributed.distributed_c10d, torch.distributed.distributed_c10d)
+        }
+    }
+
+
+_inner_used_api = {
+    Const.MS_FRAMEWORK + Const.SEP + Const.MS_API_TYPE_OPS: (
+        ops, "norm", "square", "sqrt", "is_complex", "stack", "is_floating_point"
+    ),
+    Const.MS_FRAMEWORK + Const.SEP + Const.MS_API_TYPE_TENSOR: (
+        Tensor, "to", "numel"
+    ),
+    Const.MS_FRAMEWORK + Const.SEP + Const.MS_API_TYPE_MINT: (
+        mint, "max", "min", "mean", "norm"
+    )
+}
+
+_supported_api_list_path = (os.path.join(os.path.dirname(os.path.realpath(__file__)), MsConst.SUPPORTED_API_LIST_FILE),)
+
+
+class ApiTemplate(HOOKCell):
+    def __init__(self, api_name, api_func, prefix, hook_build_func):
+        self.api_name = api_name
+        self.api_func = api_func
+        self.prefix_api_name = prefix + Const.SEP + str(api_name.split(Const.SEP)[-1]) + Const.SEP
+        super().__init__(hook_build_func)
+
+    @staticmethod
+    def async_to_sync(output):
+        # Fake handle, used to return after the CommHandle executes the wait method
+        fake_handle = type("FakeHandle", (), {"wait": lambda self: None})()
+        if isinstance(output, tuple) and len(output) == 2 and hasattr(output[1], "wait"):
+            output[1].wait()
+            output = (output[0], fake_handle)
+        elif hasattr(output, "wait"):
+            output.wait()
+            output = fake_handle
+        return output
+
+    def construct(self, *args, **kwargs):
+        if self.api_name.startswith(MsConst.DROPOUT_API_NAME_PREFIX):
+            return args[0] if args else kwargs.get(Const.INPUT)
+
+        output = self.api_func(*args, **kwargs)
+
+        if self.prefix_api_name.startswith(MsConst.DISTRIBUTED_DATA_PREFIX):
+            if kwargs.get("async_op") or self.api_name in ["isend", "irecv"]:
+                output = self.async_to_sync(output)
+        return output
+
+    def forward(self, *args, **kwargs):
+        if self.api_name.startswith(MsConst.DROPOUT_API_NAME_PREFIX):
+            return args[0] if args else kwargs.get(Const.INPUT)
+        return self.api_func(*args, **kwargs)
+
+
+api_register = None
+
+
+def get_api_register():
+    global api_register
+
+    def stub_method(method):
+        def wrapped_method(*args, **kwargs):
+            return method(*args, **kwargs)
+        return wrapped_method
+
+    if api_register is None:
+        if not is_mindtorch():
+            for attr in dir(StubTensor):
+                if callable(attr):
+                    setattr(StubTensor, attr, stub_method(attr))
+        api_register = ApiRegistry(_api_types, _inner_used_api, _supported_api_list_path, ApiTemplate)
+    return api_register
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_registry.py b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_registry.py
deleted file mode 100644
index 7aee1deccd9..00000000000
--- a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_registry.py
+++ /dev/null
@@ -1,207 +0,0 @@
-# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-from mindspore import Tensor, ops, mint
-from mindspore.mint.nn import functional
-from mindspore.common._stub_tensor import StubTensor
-from mindspore.communication import comm_func
-
-from msprobe.mindspore.dump.hook_cell.wrap_api import (HOOKTensor, HOOKStubTensor, HOOKFunctionalOP,
-                                                       HOOKMintOP, HOOKMintNNFunctionalOP, HOOKDistributedOP,
-                                                       HOOKTorchOP, HOOKTorchTensor, HOOKTorchFunctionalOP,
-                                                       HOOKTorchDistributedOP, HOOKTorchNpuOP,
-                                                       get_wrap_api_list, get_wrap_torch_api_list, setup_hooks)
-from msprobe.core.common.utils import Const
-from msprobe.mindspore.common.utils import is_mindtorch
-
-if is_mindtorch():
-    import torch
-    import torch_npu
-
-
-def stub_method(method):
-    def wrapped_method(*args, **kwargs):
-        return method(*args, **kwargs)
-    return wrapped_method
-
-
-class ApiRegistry:
-    def __init__(self):
-        self.tensor_ori_attr = {}
-        self.stub_tensor_ori_attr = {}
-        self.functional_ori_attr = {}
-        self.mint_ops_ori_attr = {}
-        self.mint_func_ops_ori_attr = {}
-        self.distributed_ori_attr = {}
-        self.norm_inner_ops_ori_attr = {}
-
-        self.torch_ori_attr = {}
-        self.torch_tensor_ori_attr = {}
-        self.torch_functional_ori_attr = {}
-        self.torch_distributed_ori_attr = {}
-        self.torch_npu_ori_attr = {}
-
-        self.tensor_hook_attr = {}
-        self.stub_tensor_hook_attr = {}
-        self.functional_hook_attr = {}
-        self.mint_ops_hook_attr = {}
-        self.mint_func_ops_hook_attr = {}
-        self.distibuted_hook_attr = {}
-        self.norm_inner_ops_hook_attr = {}
-
-        self.torch_hook_attr = {}
-        self.torch_tensor_hook_attr = {}
-        self.torch_functional_hook_attr = {}
-        self.torch_distributed_hook_attr = {}
-        self.torch_npu_hook_attr = {}
-
-        self.norm_inner_ops = ["norm", "square", "sqrt", "is_complex"]
-
-    @staticmethod
-    def store_ori_attr(ori_api_group, api_list, api_ori_attr):
-        for api in api_list:
-            if Const.SEP in api:
-                sub_module_name, sub_op = api.rsplit(Const.SEP, 1)
-                sub_module = getattr(ori_api_group, sub_module_name)
-                ori_api_func = getattr(sub_module, sub_op)
-            else:
-                ori_api_func = getattr(ori_api_group, api)
-            if ori_api_group == StubTensor:
-                api_ori_attr[api] = stub_method(ori_api_func)
-                continue
-            api_ori_attr[api] = ori_api_func
-
-    @staticmethod
-    def set_api_attr(api_group, attr_dict):
-        for api, api_attr in attr_dict.items():
-            if Const.SEP in api:
-                sub_module_name, sub_op = api.rsplit(Const.SEP, 1)
-                sub_module = getattr(api_group, sub_module_name, None)
-                if sub_module is not None:
-                    setattr(sub_module, sub_op, api_attr)
-            else:
-                setattr(api_group, api, api_attr)
-
-    def norm_inner_op_set_hook_func(self):
-        self.set_api_attr(ops, self.norm_inner_ops_hook_attr)
-
-    def norm_inner_op_set_ori_func(self):
-        self.set_api_attr(ops, self.norm_inner_ops_ori_attr)
-
-    def api_set_hook_func(self):
-        if is_mindtorch():
-            self.set_api_attr(torch, self.torch_hook_attr)
-            self.set_api_attr(torch.Tensor, self.torch_tensor_hook_attr)
-            self.set_api_attr(torch.nn.functional, self.torch_functional_hook_attr)
-            self.set_api_attr(torch.distributed, self.torch_distributed_hook_attr)
-            self.set_api_attr(torch.distributed.distributed_c10d, self.torch_distributed_hook_attr)
-            self.set_api_attr(torch_npu, self.torch_npu_hook_attr)
-        else:
-            self.set_api_attr(Tensor, self.tensor_hook_attr)
-            self.set_api_attr(StubTensor, self.stub_tensor_hook_attr)
-            self.set_api_attr(ops, self.functional_hook_attr)
-            self.set_api_attr(mint, self.mint_ops_hook_attr)
-            self.set_api_attr(functional, self.mint_func_ops_hook_attr)
-            self.set_api_attr(comm_func, self.distibuted_hook_attr)
-
-    def api_set_ori_func(self):
-        if is_mindtorch():
-            self.set_api_attr(torch, self.torch_ori_attr)
-            self.set_api_attr(torch.Tensor, self.torch_tensor_ori_attr)
-            self.set_api_attr(torch.nn.functional, self.torch_functional_ori_attr)
-            self.set_api_attr(torch.distributed, self.torch_distributed_ori_attr)
-            self.set_api_attr(torch.distributed.distributed_c10d, self.torch_distributed_ori_attr)
-            self.set_api_attr(torch_npu, self.torch_npu_ori_attr)
-        else:
-            self.set_api_attr(Tensor, self.tensor_ori_attr)
-            self.set_api_attr(StubTensor, self.stub_tensor_ori_attr)
-            self.set_api_attr(ops, self.functional_ori_attr)
-            self.set_api_attr(mint, self.mint_ops_ori_attr)
-            self.set_api_attr(functional, self.mint_func_ops_ori_attr)
-            self.set_api_attr(comm_func, self.distributed_ori_attr)
-
-    def initialize_hook(self, hook):
-        setup_hooks(hook)
-        if is_mindtorch():
-            wrap_torch_api_name = get_wrap_torch_api_list()
-            self.store_ori_attr(torch,
-                                wrap_torch_api_name.torch_api_names, self.torch_ori_attr)
-            self.store_ori_attr(torch.Tensor,
-                                wrap_torch_api_name.tensor_api_names, self.torch_tensor_ori_attr)
-            self.store_ori_attr(torch.nn.functional,
-                                wrap_torch_api_name.functional_api_names, self.torch_functional_ori_attr)
-            self.store_ori_attr(torch.distributed,
-                                wrap_torch_api_name.distributed_api_names, self.torch_distributed_ori_attr)
-            self.store_ori_attr(torch_npu,
-                                wrap_torch_api_name.npu_api_names, self.torch_npu_ori_attr)
-            for attr_name in dir(HOOKTorchOP):
-                if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                    api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                    self.torch_hook_attr[api_name] = getattr(HOOKTorchOP, attr_name)
-            for attr_name in dir(HOOKTorchTensor):
-                if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                    api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                    self.torch_tensor_hook_attr[api_name] = getattr(HOOKTorchTensor, attr_name)
-            for attr_name in dir(HOOKTorchFunctionalOP):
-                if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                    api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                    self.torch_functional_hook_attr[api_name] = getattr(HOOKTorchFunctionalOP, attr_name)
-            for attr_name in dir(HOOKTorchDistributedOP):
-                if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                    api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                    self.torch_distributed_hook_attr[api_name] = getattr(HOOKTorchDistributedOP, attr_name)
-            for attr_name in dir(HOOKTorchNpuOP):
-                if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                    api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                    self.torch_npu_hook_attr[api_name] = getattr(HOOKTorchNpuOP, attr_name)
-            return
-
-        wrap_api_name = get_wrap_api_list()
-        self.store_ori_attr(Tensor, wrap_api_name.tensor_api_names, self.tensor_ori_attr)
-        self.store_ori_attr(StubTensor, wrap_api_name.stub_tensor_api_names, self.stub_tensor_ori_attr)
-        self.store_ori_attr(ops, wrap_api_name.ops_api_names, self.functional_ori_attr)
-        self.store_ori_attr(mint, wrap_api_name.mint_api_names, self.mint_ops_ori_attr)
-        self.store_ori_attr(functional, wrap_api_name.mint_nn_func_api_names, self.mint_func_ops_ori_attr)
-        self.store_ori_attr(comm_func, wrap_api_name.distributed_api_names, self.distributed_ori_attr)
-        self.store_ori_attr(ops, self.norm_inner_ops, self.norm_inner_ops_ori_attr)
-        for attr_name in dir(HOOKTensor):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                self.tensor_hook_attr[api_name] = getattr(HOOKTensor, attr_name)
-        for attr_name in dir(HOOKStubTensor):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                self.stub_tensor_hook_attr[api_name] = getattr(HOOKStubTensor, attr_name)
-        for attr_name in dir(HOOKFunctionalOP):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                self.functional_hook_attr[api_name] = getattr(HOOKFunctionalOP, attr_name)
-                if api_name in self.norm_inner_ops:
-                    self.norm_inner_ops_hook_attr[api_name] = getattr(HOOKFunctionalOP, attr_name)
-        for attr_name in dir(HOOKMintOP):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                self.mint_ops_hook_attr[api_name] = getattr(HOOKMintOP, attr_name)
-        for attr_name in dir(HOOKMintNNFunctionalOP):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                self.mint_func_ops_hook_attr[api_name] = getattr(HOOKMintNNFunctionalOP, attr_name)
-        for attr_name in dir(HOOKDistributedOP):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                api_name = attr_name[Const.ATTR_NAME_PREFIX_LEN:]
-                self.distibuted_hook_attr[api_name] = getattr(HOOKDistributedOP, attr_name)
-
-
-api_register = ApiRegistry()
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/hook_cell.py b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/hook_cell.py
index b68a7d995a5..3386feca3b7 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/hook_cell.py
+++ b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/hook_cell.py
@@ -28,7 +28,7 @@ def get_cell_count(name):
     return HOOKCell.cell_count[name]
 
 
-def __init__(self, build_hook) -> None:
+def __init__(self, hook_build_func) -> None:
     super(HOOKCell, self).__init__()
     self.changed_status = False
     self.input_kwargs = {}
@@ -40,11 +40,13 @@ def __init__(self, build_hook) -> None:
             self.prefix = self.prefix_api_name
 
         self.forward_data_collected = False
-        forward_pre_hook, forward_hook, backward_hook, backward_pre_hook = build_hook(self.prefix)
-        self.register_forward_pre_hook(forward_pre_hook)
-        self.register_forward_hook(forward_hook)
-        register_backward_hook_functions["full"](self, backward_hook)
-        register_backward_hook_functions["pre"](self, backward_pre_hook)
+
+        if callable(hook_build_func):
+            forward_pre_hook, forward_hook, backward_hook, backward_pre_hook = hook_build_func(self.prefix)
+            self.register_forward_pre_hook(forward_pre_hook)
+            self.register_forward_hook(forward_hook)
+            register_backward_hook_functions["full"](self, backward_hook)
+            register_backward_hook_functions["pre"](self, backward_pre_hook)
 
 
 # 重载call，加全局标志。
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/wrap_api.py b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/wrap_api.py
deleted file mode 100644
index 0e97929ecd7..00000000000
--- a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/wrap_api.py
+++ /dev/null
@@ -1,212 +0,0 @@
-# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-
-from mindspore import Tensor, mint, ops
-from mindspore.common._stub_tensor import StubTensor
-from mindspore.communication import comm_func
-from mindspore.mint.nn import functional
-
-from msprobe.core.common.const import Const
-from msprobe.core.common.file_utils import load_yaml
-from msprobe.mindspore.common.const import Const as MsConst
-from msprobe.mindspore.common.utils import is_mindtorch
-from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
-
-if is_mindtorch():
-    import torch
-    import torch_npu
-
-cur_path = os.path.dirname(os.path.realpath(__file__))
-yaml_path = os.path.join(cur_path, MsConst.SUPPORTED_API_LIST_FILE)
-torch_yaml_path = os.path.join(cur_path, "../../../pytorch/hook_module", MsConst.SUPPORTED_API_LIST_FILE)
-
-
-class HOOKTensor(object):
-    pass
-
-
-class HOOKStubTensor(object):
-    pass
-
-
-class HOOKFunctionalOP(object):
-    pass
-
-
-class HOOKMintOP(object):
-    pass
-
-
-class HOOKMintNNFunctionalOP(object):
-    pass
-
-
-class HOOKDistributedOP(object):
-    pass
-
-
-class HOOKTorchOP(object):
-    pass
-
-
-class HOOKTorchTensor(object):
-    pass
-
-
-class HOOKTorchFunctionalOP(object):
-    pass
-
-
-class HOOKTorchDistributedOP(object):
-    pass
-
-
-class HOOKTorchNpuOP(object):
-    pass
-
-
-class ApiTemplate(HOOKCell):
-    def __init__(self, api_name, api_dict, prefix, hook):
-        self.api_name = api_name
-        self.api_func = api_dict[api_name]
-        self.prefix_api_name = prefix + str(api_name.split(Const.SEP)[-1]) + Const.SEP
-        super().__init__(hook)
-
-    @staticmethod
-    def async_to_sync(output):
-        # Fake handle, used to return after the CommHandle executes the wait method
-        fake_handle = type("FakeHandle", (), {"wait": lambda self: None})()
-        if isinstance(output, tuple) and len(output) == 2 and hasattr(output[1], "wait"):
-            output[1].wait()
-            output = (output[0], fake_handle)
-        elif hasattr(output, "wait"):
-            output.wait()
-            output = fake_handle
-        return output
-
-    def construct(self, *args, **kwargs):
-        if self.api_name.startswith(MsConst.DROPOUT_API_NAME_PREFIX):
-            return args[0] if args else kwargs.get(Const.INPUT)
-        
-        output = self.api_func(*args, **kwargs)
-
-        if self.prefix_api_name.startswith(MsConst.DISTRIBUTED_DATA_PREFIX):
-            if kwargs.get("async_op") or self.api_name in ["isend", "irecv"]:
-                output = self.async_to_sync(output)
-        return output
-
-    def forward(self, *args, **kwargs):
-        if self.api_name.startswith(MsConst.DROPOUT_API_NAME_PREFIX):
-            return args[0] if args else kwargs.get(Const.INPUT)
-        return self.api_func(*args, **kwargs)
-
-
-class WrapApiName:
-    def __init__(self, tensor_api_names, stub_tensor_api_names, ops_api_names, mint_api_names, mint_nn_func_api_names,
-                 distributed_api_names):
-        self.tensor_api_names = tensor_api_names
-        self.stub_tensor_api_names = stub_tensor_api_names
-        self.ops_api_names = ops_api_names
-        self.mint_api_names = mint_api_names
-        self.mint_nn_func_api_names = mint_nn_func_api_names
-        self.distributed_api_names = distributed_api_names
-
-
-class WrapTorchApiName:
-    def __init__(self, torch_api_names, tensor_api_names, functional_api_names, distributed_api_names, npu_api_names):
-        self.torch_api_names = torch_api_names
-        self.tensor_api_names = tensor_api_names
-        self.functional_api_names = functional_api_names
-        self.distributed_api_names = distributed_api_names
-        self.npu_api_names = npu_api_names
-
-
-def get_wrap_api_list():
-    api_list = load_yaml(yaml_path)
-    tensor_api = api_list.get(MsConst.SUPPORTED_TENSOR_LIST_KEY)
-    ops_api = api_list.get(MsConst.SUPPORTED_OPS_LIST_KEY)
-    mint_api = api_list.get(MsConst.SUPPORTED_MINT_LIST_KEY)
-    mint_nn_func_api = api_list.get(MsConst.SUPPORTED__MINT_NN_FUNC_LIST_KEY)
-    distributed_api = api_list.get(MsConst.SUPPORTED_COMM_LIST_KEY)
-    wrap_api_name = WrapApiName(set(tensor_api) & set(dir(Tensor)),
-                                set(tensor_api) & set(dir(StubTensor)),
-                                set(ops_api) & set(dir(ops)),
-                                set(mint_api) & set(dir(mint)),
-                                set(mint_nn_func_api) & set(dir(functional)),
-                                set(distributed_api) & set(dir(comm_func)))
-    return wrap_api_name
-
-
-def get_wrap_torch_api_list():
-    api_list = load_yaml(torch_yaml_path)
-    torch_api = api_list.get("torch")
-    tensor_api = api_list.get("tensor")
-    functional_api = api_list.get("functional")
-    distributed_api = api_list.get("distributed")
-    npu_api = api_list.get("torch_npu")
-    wrap_api_name = WrapTorchApiName(set(torch_api) & set(dir(torch)),
-                                     set(tensor_api) & set(dir(torch.Tensor)),
-                                     set(functional_api) & set(dir(torch.nn.functional)),
-                                     set(distributed_api) & set(dir(torch.distributed)),
-                                     set(npu_api) & set(dir(torch_npu)))
-    return wrap_api_name
-
-
-def wrap_api_func(api_name, api_dict, prefix, hook):
-    def api_function(*args, **kwargs):
-        return ApiTemplate(api_name, api_dict, prefix, hook)(*args, **kwargs)
-    return api_function
-
-
-def wrap_api_func_and_bind(api_list, api_dict, prefix, hook, hook_class):
-    for api_name in api_list:
-        if callable(api_dict[api_name]):
-            setattr(hook_class, Const.ATTR_NAME_PREFIX + api_name, wrap_api_func(api_name, api_dict, prefix, hook))
-
-
-def setup_hooks(hook):
-    if is_mindtorch():
-        torch_wrap_api_name = get_wrap_torch_api_list()
-        wrap_api_func_and_bind(torch_wrap_api_name.torch_api_names,
-                               {f: getattr(torch, f) for f in dir(torch)},
-                               MsConst.TORCH_DATA_PREFIX, hook, HOOKTorchOP)
-        wrap_api_func_and_bind(torch_wrap_api_name.tensor_api_names,
-                               {f: getattr(torch.Tensor, f) for f in dir(torch.Tensor)},
-                               MsConst.TENSOR_DATA_PREFIX, hook, HOOKTorchTensor)
-        wrap_api_func_and_bind(torch_wrap_api_name.functional_api_names,
-                               {f: getattr(torch.nn.functional, f) for f in dir(torch.nn.functional)},
-                               MsConst.OPS_DATA_PREFIX, hook, HOOKTorchFunctionalOP)
-        wrap_api_func_and_bind(torch_wrap_api_name.distributed_api_names,
-                               {f: getattr(torch.distributed, f) for f in dir(torch.distributed)},
-                               MsConst.DISTRIBUTED_DATA_PREFIX, hook, HOOKTorchDistributedOP)
-        wrap_api_func_and_bind(torch_wrap_api_name.npu_api_names, {f: getattr(torch_npu, f) for f in dir(torch_npu)},
-                               MsConst.TORCH_NPU_DATA_PREFIX, hook, HOOKTorchNpuOP)
-        return
-
-    wrap_api_name = get_wrap_api_list()
-    wrap_api_func_and_bind(wrap_api_name.tensor_api_names, {f: getattr(Tensor, f) for f in dir(Tensor)},
-                           MsConst.TENSOR_DATA_PREFIX, hook, HOOKTensor)
-    wrap_api_func_and_bind(wrap_api_name.stub_tensor_api_names, {f: getattr(StubTensor, f) for f in dir(StubTensor)},
-                           MsConst.STUB_TENSOR_DATA_PREFIX, hook, HOOKStubTensor)
-    wrap_api_func_and_bind(wrap_api_name.ops_api_names, {f: getattr(ops, f) for f in dir(ops)},
-                           MsConst.OPS_DATA_PREFIX, hook, HOOKFunctionalOP)
-    wrap_api_func_and_bind(wrap_api_name.mint_api_names, {f: getattr(mint, f) for f in dir(mint)},
-                           MsConst.MINT_DATA_PREFIX, hook, HOOKMintOP)
-    wrap_api_func_and_bind(wrap_api_name.mint_nn_func_api_names, {f: getattr(functional, f) for f in dir(functional)},
-                           MsConst.MINT_NN_FUNC_DATA_PREFIX, hook, HOOKMintNNFunctionalOP)
-    wrap_api_func_and_bind(wrap_api_name.distributed_api_names, {f: getattr(comm_func, f) for f in dir(comm_func)},
-                           MsConst.DISTRIBUTED_DATA_PREFIX, hook, HOOKDistributedOP)
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py b/debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py
index 4eee5eed724..6d73f2409ff 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py
+++ b/debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py
@@ -27,7 +27,10 @@ from msprobe.core.common.log import logger
 from msprobe.core.data_dump.data_processor.base import ModuleForwardInputsOutputs, ModuleBackwardInputsOutputs
 from msprobe.core.common.const import Const
 from msprobe.core.data_dump.data_processor.base import ModuleForwardInputsOutputs
-from msprobe.mindspore.dump.hook_cell.api_registry import api_register
+from msprobe.mindspore.dump.hook_cell.api_register import get_api_register
+
+
+_api_register = get_api_register()
 
 
 def dump_jit(name, in_feat, out_feat, is_forward):
@@ -71,7 +74,7 @@ class JitDump(_MindsporeFunctionExecutor):
 
     def __call__(self, *args, **kwargs):
         if JitDump.jit_dump_switch:
-            api_register.api_set_ori_func()
+            _api_register.restore_all_api()
         out = super().__call__(*args, **kwargs)
         if JitDump.jit_dump_switch and len(args) > 0:
             if self.name and self.name != "construct":
@@ -82,7 +85,7 @@ class JitDump(_MindsporeFunctionExecutor):
         elif len(args) == 0:
             logger.warning(f"The jit function {self.name} has no input arguments, nothing will be dumped.")
         if JitDump.jit_dump_switch:
-            api_register.api_set_hook_func()
+            _api_register.register_all_api()
         return out
 
     @classmethod
@@ -103,9 +106,9 @@ class JitDump(_MindsporeFunctionExecutor):
 
     def grad(self, obj, grad, weights, grad_position, *args, **kwargs):
         if JitDump.jit_dump_switch and JitDump.jit_enable:
-            api_register.api_set_ori_func()
+            _api_register.restore_all_api()
         output = self._executor.grad(grad, obj, weights, grad_position, *args, *(kwargs.values()))
         if JitDump.jit_dump_switch and JitDump.jit_enable:
             dump_jit(obj, args, None, False)
-            api_register.api_set_hook_func()
+            _api_register.register_all_api()
         return output
diff --git a/debug/accuracy_tools/msprobe/mindspore/free_benchmark/api_pynative_self_check.py b/debug/accuracy_tools/msprobe/mindspore/free_benchmark/api_pynative_self_check.py
index 57b7de4fa56..da4821b3ac4 100644
--- a/debug/accuracy_tools/msprobe/mindspore/free_benchmark/api_pynative_self_check.py
+++ b/debug/accuracy_tools/msprobe/mindspore/free_benchmark/api_pynative_self_check.py
@@ -19,6 +19,7 @@ import os
 import traceback
 
 import mindspore as ms
+
 from msprobe.core.common.const import Const
 from msprobe.core.common.exceptions import DistributedNotInitializedError
 from msprobe.core.common.file_utils import check_path_length, load_yaml
@@ -27,7 +28,7 @@ from msprobe.mindspore.common.const import FreeBenchmarkConst
 from msprobe.mindspore.common.log import logger
 from msprobe.mindspore.common.utils import get_rank_if_initialized
 from msprobe.mindspore.debugger.debugger_config import DebuggerConfig
-from msprobe.mindspore.dump.hook_cell.api_registry import api_register
+from msprobe.mindspore.dump.hook_cell.api_register import get_api_register
 from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
 from msprobe.mindspore.free_benchmark.common.config import Config
 from msprobe.mindspore.free_benchmark.common.handler_params import HandlerParams
@@ -37,6 +38,9 @@ from msprobe.mindspore.free_benchmark.perturbation.perturbation_factory import P
 from msprobe.mindspore.runtime import Runtime
 
 
+_api_register = get_api_register()
+
+
 class ApiPyNativeSelfCheck:
     def __init__(self, config: DebuggerConfig):
         Config.is_enable = True
@@ -60,8 +64,8 @@ class ApiPyNativeSelfCheck:
         self.store_original_func()
 
     def handle(self):
-        api_register.initialize_hook(self.build_hook)
-        api_register.api_set_hook_func()
+        _api_register.initialize_hook(self.build_hook)
+        _api_register.register_all_api()
 
     def build_hook(self, api_name):
         def pre_hook(cell, input_data):
@@ -166,13 +170,13 @@ def check_self(api_name_with_id, output, ori_func, *args, **kwargs):
         return ret
 
     logger.info(f"[{api_name_with_id}] is {Config.handler_type}ing.")
-    api_register.api_set_ori_func()
+    _api_register.restore_all_api()
 
     try:
         perturbation = PerturbationFactory.create(api_name_with_id)
         params.fuzzed_result = perturbation.handle(params)
         if params.fuzzed_result is False:
-            api_register.api_set_hook_func()
+            _api_register.register_all_api()
             return ret
         if Config.stage == Const.BACKWARD:
             params.original_result = Tools.get_grad(params.original_func, *params.args, **params.kwargs)
@@ -183,7 +187,7 @@ def check_self(api_name_with_id, output, ori_func, *args, **kwargs):
         logger.error(f"[{api_name_with_id}] Error: {str(e)}")
         logger.error(f"[{api_name_with_id}] Error detail: {traceback.format_exc()}")
 
-    api_register.api_set_hook_func()
+    _api_register.register_all_api()
     return ret
 
 
diff --git a/debug/accuracy_tools/msprobe/mindspore/service.py b/debug/accuracy_tools/msprobe/mindspore/service.py
index 7359dead7a4..c8f272a9ae5 100644
--- a/debug/accuracy_tools/msprobe/mindspore/service.py
+++ b/debug/accuracy_tools/msprobe/mindspore/service.py
@@ -41,7 +41,7 @@ from msprobe.mindspore.cell_processor import CellProcessor
 from msprobe.mindspore.common.log import logger
 from msprobe.mindspore.common.utils import (get_rank_if_initialized, clean_input_kwargs,
                                             is_mindtorch, register_backward_hook_functions)
-from msprobe.mindspore.dump.hook_cell.api_registry import api_register
+from msprobe.mindspore.dump.hook_cell.api_register import get_api_register
 from msprobe.mindspore.dump.hook_cell.primitive_hooks import PrimitiveHookService
 from msprobe.mindspore.dump.jit_dump import JitDump
 from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
@@ -71,6 +71,7 @@ class Service:
         self.params_grad_info = {}
         self.hook_handle_dict = {}
         # 提前注册，确保注册尽可能多的API hook
+        self.api_register = get_api_register()
         self.register_api_hook()
         self.init_for_debug_level()
 
@@ -318,7 +319,7 @@ class Service:
                     PIJitCaptureContext.__exit__ = self.empty
             self.first_start = False
 
-        api_register.api_set_hook_func()
+        self.api_register.register_all_api()
         self.switch = True
         self.primitive_switch = True
         logger.info(f"Dump switch is turned on at step {self.current_iter}. ")
@@ -407,8 +408,8 @@ class Service:
     def register_api_hook(self):
         if self.config.level in [Const.LEVEL_MIX, Const.LEVEL_L1, Const.LEVEL_L2]:
             logger.info(f"The api {self.config.task} hook function is successfully mounted to the model.")
-            api_register.initialize_hook(functools.partial(self.build_hook, BaseScope.Module_Type_API))
-            api_register.api_set_hook_func()
+            self.api_register.initialize_hook(functools.partial(self.build_hook, BaseScope.Module_Type_API))
+            self.api_register.register_all_api()
 
     def get_cells_and_names(self):
         cells_and_names_with_index = {}
diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut_utils.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut_utils.py
index dc0174212e3..259dbb82077 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut_utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut_utils.py
@@ -33,11 +33,8 @@ from msprobe.core.common.const import FileCheckConst, Const, CompareConst
 from msprobe.core.common.file_utils import FileChecker
 from msprobe.core.common.log import logger
 from msprobe.core.common.utils import CompareException
-from msprobe.pytorch.hook_module.wrap_aten import AtenOPTemplate
-from msprobe.pytorch.hook_module.wrap_functional import FunctionalOPTemplate
-from msprobe.pytorch.hook_module.wrap_npu_custom import NpuOPTemplate
-from msprobe.pytorch.hook_module.wrap_tensor import TensorOPTemplate
-from msprobe.pytorch.hook_module.wrap_torch import TorchOPTemplate
+from msprobe.pytorch.hook_module.api_register import ApiTemplate, get_api_register
+
 
 hf_32_standard_api = ["conv1d", "conv2d"]
 not_detach_set = {'resize_', 'resize_as_', 'set_', 'transpose_', 't_', 'squeeze_', 'unsqueeze_'}
@@ -109,16 +106,25 @@ def exec_api(exec_params):
     is_autocast = exec_params.is_autocast
     autocast_dtype = exec_params.autocast_dtype
 
-    if api_type == "Functional":
-        torch_api = FunctionalOPTemplate(api_name, str, False)
-    if api_type == "Tensor":
-        torch_api = TensorOPTemplate(api_name, str, False)
-    if api_type == "Torch":
-        torch_api = TorchOPTemplate(api_name, str, False)
-    if api_type == "Aten":
-        torch_api = AtenOPTemplate(api_name, None, False)
-    if api_type == "NPU":
-        torch_api = NpuOPTemplate(api_name, None, False, device)
+    prefix_map = Const.API_DATA_PREFIX.get(Const.PT_FRAMEWORK, {})
+    if not prefix_map or api_type not in prefix_map.values() or \
+        api_type not in (
+            Const.FUNCTIONAL_API_TYPE_PREFIX,
+            Const.TENSOR_API_TYPE_PREFIX,
+            Const.TORCH_API_TYPE_PREFIX,
+            Const.ATEN_API_TYPE_PREFIX,
+            Const.NPU_API_TYPE_PREFIX
+    ):
+        return
+
+    api_register = get_api_register()
+    api_register.initialize_hook(None)
+    api_func_type = list(prefix_map.keys())[list(prefix_map.values()).index(api_type)]
+    api_func = api_register.ori_api_attr.get(Const.PT_FRAMEWORK + Const.SEP + api_func_type, {}).get(api_name)
+    if api_func is None:
+        return
+
+    torch_api = ApiTemplate(api_name, api_func, api_type, None, need_hook=False, device=device)
     if is_autocast:
         with autocast(dtype=autocast_dtype):
             out = torch_api.forward(*args, **kwargs)
diff --git a/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_dump.py b/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_dump.py
index 4700de6f1f9..cc78962f401 100644
--- a/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_dump.py
+++ b/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_dump.py
@@ -17,7 +17,7 @@ import torch
 from msprobe.core.common.const import Const
 from msprobe.core.data_dump.scope import BaseScope
 from msprobe.pytorch.common.log import logger
-from msprobe.pytorch.hook_module.api_registry import api_register
+from msprobe.pytorch.hook_module.api_register import get_api_register
 
 torch_version_above_or_equal_2 = torch.__version__.split('+')[0] >= '2.0'
 
@@ -26,13 +26,14 @@ class ModuleDumper:
     def __init__(self, service):
         self.service = service
         self.hook_handle_list = []
+        self.api_register = get_api_register()
 
     def start_module_dump(self, module, dump_name):
-        api_register.api_originality()
+        self.api_register.restore_all_api()
         self.register_hook(module, dump_name)
 
     def stop_module_dump(self):
-        api_register.api_modularity()
+        self.api_register.register_all_api()
         for hook_handle in self.hook_handle_list:
             if isinstance(hook_handle, torch.utils.hooks.RemovableHandle):
                 hook_handle.remove()
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
new file mode 100644
index 00000000000..c12f94248cf
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
@@ -0,0 +1,126 @@
+# Copyright (c) 2025-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import functools
+import os
+
+import torch
+import torch.distributed as dist
+
+from msprobe.core.common.const import Const
+from msprobe.core.data_dump.api_registry import ApiRegistry
+from msprobe.pytorch.common.utils import (
+    torch_without_guard_version, is_gpu, torch_device_guard, parameter_adapter
+)
+from msprobe.pytorch.function_factory import npu_custom_functions
+from msprobe.pytorch.hook_module.hook_module import HOOKModule
+
+
+torch_version_above_2 = torch.__version__.split('+')[0] > '2.0'
+
+_api_types = {
+    Const.PT_FRAMEWORK: {
+        Const.PT_API_TYPE_FUNCTIONAL: (torch.nn.functional, torch.nn.functional),
+        Const.PT_API_TYPE_TENSOR: (torch.Tensor, torch.Tensor),
+        Const.PT_API_TYPE_TORCH: (torch, torch),
+        Const.PT_API_TYPE__VF: (torch._C._VariableFunctionsClass, torch._VF),
+        Const.PT_API_TYPE_DIST: (dist, dist),
+        Const.PT_API_TYPE_DIST_C10D: (dist.distributed_c10d, dist.distributed_c10d)
+    }
+}
+if not is_gpu:
+    import torch_npu
+    if torch_without_guard_version:
+        _api_types.get(Const.PT_FRAMEWORK).update(
+            {Const.PT_API_TYPE_NPU: (torch.ops.npu, torch_npu)}
+        )
+    else:
+        _api_types.get(Const.PT_FRAMEWORK).update(
+            {Const.PT_API_TYPE_NPU: (torch_npu._C._VariableFunctionsClass, torch_npu)}
+        )
+        _api_types.get(Const.PT_FRAMEWORK).update(
+            {
+                Const.PT_API_TYPE_NPU_DIST: (torch_npu.distributed, torch_npu.distributed),
+                Const.PT_API_TYPE_NPU_DIST_C10D: (torch_npu.distributed.distributed_c10d,
+                                                  torch_npu.distributed.distributed_c10d)
+            }
+        )
+
+_inner_used_api = {}
+_supported_api_list_path = (os.path.join(os.path.dirname(os.path.realpath(__file__)), Const.SUPPORT_API_FILE_NAME),)
+_cuda_func_mapping = {"npu_fusion_attention": "gpu_fusion_attention"}
+
+
+@parameter_adapter
+def tensor_module_forward(module, *args, **kwargs):
+    return module.api_func(*args, **kwargs)
+
+
+def dist_module_forward(module, *args, **kwargs):
+    handle = module.api_func(*args, **kwargs)
+    if kwargs.get("async_op") or module.api_name in ["isend", "irecv"]:
+        if handle and hasattr(handle, 'wait'):
+            handle.wait()
+        if module.api_name == "batch_isend_irecv":
+            if isinstance(handle, list):
+                for req in handle:
+                    req.wait()
+    return handle
+
+
+def npu_module_forward(module, *args, **kwargs):
+    if not module.need_hook:
+        if module.api_name not in npu_custom_functions:
+            raise Exception(f'There is not bench function {module.api_name}')
+        if module.device == Const.CUDA_LOWERCASE:
+            module.api_name = _cuda_func_mapping.get(module.api_name, module.api_name)
+        if module.device in [Const.CUDA_LOWERCASE, Const.CPU_LOWERCASE]:
+            return npu_custom_functions[module.api_name](*args, **kwargs)
+        return module.api_func(*args, **kwargs)
+
+
+forward_methods = {
+    "Tensor": tensor_module_forward,
+    "Distributed": dist_module_forward,
+    "NPU": npu_module_forward
+}
+
+
+class ApiTemplate(HOOKModule):
+    def __init__(self, api_name, api_func, prefix, hook_build_func, need_hook=True, device=Const.CPU_LOWERCASE):
+        self.api_name = api_name
+        self.api_func = api_func
+        self.prefix = prefix
+        self.prefix_api_name = prefix + Const.SEP + str(api_name.split(Const.SEP)[-1]) + Const.SEP
+        self.need_hook = need_hook
+        self.device = device
+        if self.need_hook:
+            super().__init__(hook_build_func)
+
+    @torch_device_guard
+    def forward(self, *args, **kwargs):
+        exec_func = forward_methods.get(self.prefix)
+        exec_func = functools.partial(exec_func, self) if exec_func else self.api_func
+        return exec_func(*args, **kwargs)
+
+
+api_register = None
+
+
+def get_api_register():
+    global api_register
+    if api_register is None:
+        api_register = ApiRegistry(_api_types, _inner_used_api, _supported_api_list_path, ApiTemplate)
+    return api_register
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/api_registry.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/api_registry.py
deleted file mode 100644
index 1aad89bd6e8..00000000000
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/api_registry.py
+++ /dev/null
@@ -1,166 +0,0 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import torch
-import torch.distributed as dist
-
-from msprobe.pytorch.hook_module import wrap_torch, wrap_functional, wrap_tensor, wrap_vf, wrap_distributed, wrap_aten
-from msprobe.pytorch.hook_module.wrap_aten import get_aten_ops
-from msprobe.pytorch.hook_module.wrap_distributed import get_distributed_ops
-from msprobe.pytorch.hook_module.wrap_functional import get_functional_ops
-from msprobe.pytorch.hook_module.wrap_tensor import get_tensor_ops
-from msprobe.pytorch.hook_module.wrap_torch import get_torch_ops
-from msprobe.pytorch.hook_module.wrap_vf import get_vf_ops
-from msprobe.pytorch.common.utils import torch_without_guard_version, npu_distributed_api, is_gpu
-from msprobe.core.common.const import Const
-
-torch_version_above_2 = torch.__version__.split('+')[0] > '2.0'
-
-if not is_gpu:
-    import torch_npu
-    from . import wrap_npu_custom
-    from .wrap_npu_custom import get_npu_ops
-
-
-class ApiRegistry:
-    def __init__(self):
-        self.tensor_ori_attr = {}
-        self.torch_ori_attr = {}
-        self.functional_ori_attr = {}
-        self.distributed_ori_attr = {}
-        self.npu_distributed_ori_attr = {}
-        self.vf_ori_attr = {}
-        self.aten_ori_attr = {}
-        self.torch_npu_ori_attr = {}
-
-        self.tensor_hook_attr = {}
-        self.torch_hook_attr = {}
-        self.functional_hook_attr = {}
-        self.distributed_hook_attr = {}
-        self.npu_distributed_hook_attr = {}
-        self.vf_hook_attr = {}
-        self.aten_hook_attr = {}
-        self.torch_npu_hook_attr = {}
-
-    @staticmethod
-    def store_ori_attr(ori_api_group, api_list, api_ori_attr):
-        for api in api_list:
-            if '.' in api:
-                sub_module_name, sub_op = api.rsplit('.', 1)
-                sub_module = getattr(ori_api_group, sub_module_name)
-                api_ori_attr[api] = getattr(sub_module, sub_op)
-            else:
-                api_ori_attr[api] = getattr(ori_api_group, api)
-
-    @staticmethod
-    def set_api_attr(api_group, attr_dict):
-        for api, api_attr in attr_dict.items():
-            if '.' in api:
-                sub_module_name, sub_op = api.rsplit('.', 1)
-                sub_module = getattr(api_group, sub_module_name, None)
-                if sub_module is not None:
-                    setattr(sub_module, sub_op, api_attr)
-            else:
-                setattr(api_group, api, api_attr)
-
-    def api_modularity(self):
-        self.set_api_attr(torch.Tensor, self.tensor_hook_attr)
-        self.set_api_attr(torch, self.torch_hook_attr)
-        self.set_api_attr(torch.nn.functional, self.functional_hook_attr)
-        self.set_api_attr(dist, self.distributed_hook_attr)
-        self.set_api_attr(dist.distributed_c10d, self.distributed_hook_attr)
-        if not is_gpu and not torch_without_guard_version:
-            self.set_api_attr(torch_npu.distributed, self.npu_distributed_hook_attr)
-            self.set_api_attr(torch_npu.distributed.distributed_c10d, self.npu_distributed_hook_attr)
-        if torch_version_above_2:
-            self.set_api_attr(torch.ops.aten, self.aten_hook_attr)
-        self.set_api_attr(torch._VF, self.vf_hook_attr)
-        if not is_gpu:
-            self.set_api_attr(torch_npu, self.torch_npu_hook_attr)
-
-    def api_originality(self):
-        self.set_api_attr(torch.Tensor, self.tensor_ori_attr)
-        self.set_api_attr(torch, self.torch_ori_attr)
-        self.set_api_attr(torch.nn.functional, self.functional_ori_attr)
-        self.set_api_attr(dist, self.distributed_ori_attr)
-        self.set_api_attr(dist.distributed_c10d, self.distributed_ori_attr)
-        if not is_gpu and not torch_without_guard_version:
-            self.set_api_attr(torch_npu.distributed, self.npu_distributed_ori_attr)
-            self.set_api_attr(torch_npu.distributed.distributed_c10d, self.npu_distributed_ori_attr)
-        if torch_version_above_2:
-            self.set_api_attr(torch.ops.aten, self.aten_ori_attr)
-        self.set_api_attr(torch._VF, self.vf_ori_attr)
-        if not is_gpu:
-            self.set_api_attr(torch_npu, self.torch_npu_ori_attr)
-
-    def initialize_hook(self, hook, online_run_ut=False):
-        """
-        initialize_hook
-        Args:
-            hook (_type_): initialize_hook
-            online_run_ut (bool): default False, whether online run_ut or not.
-                If online_run_ut is True, the hook will not wrap the aten ops.
-        """
-        self.store_ori_attr(torch.Tensor, get_tensor_ops(), self.tensor_ori_attr)
-        wrap_tensor.wrap_tensor_ops_and_bind(hook)
-        for attr_name in dir(wrap_tensor.HOOKTensor):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                self.tensor_hook_attr[attr_name[5:]] = getattr(wrap_tensor.HOOKTensor, attr_name)
-
-        self.store_ori_attr(torch, get_torch_ops(), self.torch_ori_attr)
-        wrap_torch.wrap_torch_ops_and_bind(hook)
-        for attr_name in dir(wrap_torch.HOOKTorchOP):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                self.torch_hook_attr[attr_name[5:]] = getattr(wrap_torch.HOOKTorchOP, attr_name)
-
-        self.store_ori_attr(torch.nn.functional, get_functional_ops(), self.functional_ori_attr)
-        wrap_functional.wrap_functional_ops_and_bind(hook)
-        for attr_name in dir(wrap_functional.HOOKFunctionalOP):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                self.functional_hook_attr[attr_name[5:]] = getattr(wrap_functional.HOOKFunctionalOP, attr_name)
-
-        self.store_ori_attr(dist, get_distributed_ops(), self.distributed_ori_attr)
-        wrap_distributed.wrap_distributed_ops_and_bind(hook)
-        if not is_gpu and not torch_without_guard_version:
-            self.store_ori_attr(torch_npu.distributed, npu_distributed_api, self.npu_distributed_ori_attr)
-        for attr_name in dir(wrap_distributed.HOOKDistributedOP):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                self.distributed_hook_attr[attr_name[5:]] = getattr(wrap_distributed.HOOKDistributedOP, attr_name)
-                if not is_gpu and not torch_without_guard_version and attr_name[5:] in npu_distributed_api:
-                    self.npu_distributed_hook_attr[attr_name[5:]] = getattr(wrap_distributed.HOOKDistributedOP,
-                                                                            attr_name)
-
-        if torch_version_above_2 and not online_run_ut:
-            self.store_ori_attr(torch.ops.aten, get_aten_ops(), self.aten_ori_attr)
-            wrap_aten.wrap_aten_ops_and_bind(hook)
-            for attr_name in dir(wrap_aten.HOOKAtenOP):
-                if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                    self.aten_hook_attr[attr_name[5:]] = getattr(wrap_aten.HOOKAtenOP, attr_name)
-
-        self.store_ori_attr(torch._VF, get_vf_ops(), self.vf_ori_attr)
-        wrap_vf.wrap_vf_ops_and_bind(hook)
-        for attr_name in dir(wrap_vf.HOOKVfOP):
-            if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                self.vf_hook_attr[attr_name[5:]] = getattr(wrap_vf.HOOKVfOP, attr_name)
-
-        if not is_gpu:
-            self.store_ori_attr(torch_npu, get_npu_ops(), self.torch_npu_ori_attr)
-            wrap_npu_custom.wrap_npu_ops_and_bind(hook)
-            for attr_name in dir(wrap_npu_custom.HOOKNpuOP):
-                if attr_name.startswith(Const.ATTR_NAME_PREFIX):
-                    self.torch_npu_hook_attr[attr_name[5:]] = getattr(wrap_npu_custom.HOOKNpuOP, attr_name)
-
-
-api_register = ApiRegistry()
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
index b59d4be82f2..355b25d24a6 100644
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
@@ -28,7 +28,7 @@ class HOOKModule(nn.Module):
     module_count = defaultdict(int)
     inner_stop_hook = {}
 
-    def __init__(self, build_hook) -> None:
+    def __init__(self, hook_build_func) -> None:
         super(HOOKModule, self).__init__()
         self.has_overflow = False
         self.prefix = ""
@@ -38,18 +38,20 @@ class HOOKModule(nn.Module):
         self.stop_hook = HOOKModule.inner_stop_hook.get(self.current_thread, False)
 
         if not self.stop_hook:
-            if hasattr(self, "prefix_op_name_"):
-                self.prefix = self.prefix_op_name_
+            if hasattr(self, "prefix_api_name"):
+                self.prefix = self.prefix_api_name
 
             self.forward_data_collected = False
-            forward_pre_hook, forward_hook, backward_hook, _ = build_hook(self.prefix)
-            if torch_version_above_or_equal_2:
-                self.register_forward_pre_hook(forward_pre_hook, with_kwargs=True)
-                self.register_forward_hook(forward_hook, with_kwargs=True)
-            else:
-                self.register_forward_pre_hook(forward_pre_hook)
-                self.register_forward_hook(forward_hook)
-            self.register_backward_hook(backward_hook)
+
+            if callable(hook_build_func):
+                forward_pre_hook, forward_hook, backward_hook, _ = hook_build_func(self.prefix)
+                if torch_version_above_or_equal_2:
+                    self.register_forward_pre_hook(forward_pre_hook, with_kwargs=True)
+                    self.register_forward_hook(forward_hook, with_kwargs=True)
+                else:
+                    self.register_forward_pre_hook(forward_pre_hook)
+                    self.register_forward_hook(forward_hook)
+                self.register_backward_hook(backward_hook)
 
     def __call__(self, *args, **kwargs):
         changed = False
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/support_wrap_ops.yaml b/debug/accuracy_tools/msprobe/pytorch/hook_module/support_wrap_ops.yaml
index 4bc22f51ceb..43d750e7d6a 100644
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/support_wrap_ops.yaml
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/support_wrap_ops.yaml
@@ -1912,4 +1912,8 @@ distributed:
   - all_to_all
   - all_gather_into_tensor
   - reduce_scatter_tensor
-  - batch_isend_irecv
\ No newline at end of file
+  - batch_isend_irecv
+
+npu_distributed:
+  - isend
+  - irecv
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_aten.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_aten.py
deleted file mode 100644
index 637bae33ad7..00000000000
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_aten.py
+++ /dev/null
@@ -1,111 +0,0 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-import torch
-
-from msprobe.pytorch.hook_module.hook_module import HOOKModule
-from msprobe.pytorch.common.utils import torch_device_guard
-from msprobe.core.common.const import Const
-from msprobe.core.common.file_utils import load_yaml
-from msprobe.pytorch.function_factory import npu_custom_grad_functions
-
-
-cur_path = os.path.dirname(os.path.realpath(__file__))
-yaml_path = os.path.join(cur_path, "support_wrap_ops.yaml")
-ops = load_yaml(yaml_path)
-wrap_aten_ops = ops.get('aten')
-white_aten_ops = ops.get('white_aten_ops', [])
-
-
-aten_func = {}
-for f in dir(torch.ops.aten):
-    aten_func[f] = getattr(torch.ops.aten, f)
-
-
-def get_aten_ops():
-    global wrap_aten_ops
-    _all_aten_ops = dir(torch.ops.aten)
-    return set(wrap_aten_ops) & set(_all_aten_ops)
-
-
-class HOOKAtenOP(object):
-    pass
-
-
-class AtenOPTemplate(HOOKModule):
-    def __init__(self, op, hook, need_hook=True):
-        if isinstance(op, torch._ops.OpOverloadPacket):
-            op_name_ = op._qualified_op_name.split("::")[-1]
-        elif isinstance(op, str):
-            op_name_ = str(op)
-        else:
-            op_name_ = op.name().split("::")[-1]
-            overload_name = op._overloadname
-            if not '.' + overload_name in op_name_:
-                op_name_ = op_name_ + '.' + overload_name
-        self.op = op
-        self.prefix_op_name_ = "Aten" + Const.SEP + str(op_name_) + Const.SEP
-        self.need_hook = need_hook
-        if self.need_hook:
-            super().__init__(hook)
-
-    @torch_device_guard
-    def forward(self, *args, **kwargs):
-        if isinstance(self.op, str):
-            if self.op in npu_custom_grad_functions:
-                return npu_custom_grad_functions[self.op](*args, **kwargs)
-            if self.op in white_aten_ops:
-                return eval(f"torch.ops.aten.{self.op}")(*args, **kwargs)
-            if self.op not in aten_func:
-                raise Exception(f"Skip op[{self.op}] accuracy check, because the op is not "
-                                f"in dir(torch.ops.aten) and support yaml.")
-            return aten_func[self.op](*args, **kwargs)
-        return self.op(*args, **kwargs)
-
-
-class AtenOPPacketTemplate():
-    def __init__(self, op_packet, hook):
-        self.op_packet = op_packet
-        self.hook = hook
-
-    def __getattr__(self, key):
-        try:
-            attr = getattr(self.op_packet, key)
-        except AttributeError as e:
-            raise AttributeError(f"AtenOPPacketTemplate or OpOverloadPacket does not have attribute '{key}'.") from e
-        if isinstance(attr, torch._ops.OpOverload):
-            return AtenOPTemplate(attr, self.hook)
-        else:
-            return attr
-
-    @torch_device_guard
-    def __call__(self, *args, **kwargs):
-        return AtenOPTemplate(self.op_packet, self.hook)(*args, **kwargs)
-
-    def overloads(self):
-        return self.op_packet.overloads()
-
-
-def wrap_aten_op(op, hook):
-    return AtenOPPacketTemplate(op, hook)
-
-
-def wrap_aten_ops_and_bind(hook):
-    _aten_ops = get_aten_ops()
-    for op_name in _aten_ops:
-        if not isinstance(aten_func.get(op_name), torch._ops.OpOverloadPacket):
-            continue
-        setattr(HOOKAtenOP, "wrap_" + str(op_name), wrap_aten_op(aten_func.get(op_name), hook))
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_distributed.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_distributed.py
deleted file mode 100644
index 1cd11842c31..00000000000
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_distributed.py
+++ /dev/null
@@ -1,79 +0,0 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-from functools import wraps
-import torch.distributed as dist
-
-from msprobe.pytorch.hook_module.hook_module import HOOKModule
-from msprobe.pytorch.common.utils import torch_device_guard
-from msprobe.core.common.const import Const
-from msprobe.core.common.file_utils import load_yaml
-
-
-cur_path = os.path.dirname(os.path.realpath(__file__))
-yaml_path = os.path.join(cur_path, "support_wrap_ops.yaml")
-
-
-distributed_func = {}
-for f in dir(dist):
-    distributed_func[f] = getattr(dist, f)
-
-
-def get_distributed_ops():
-    _all_distributed_ops = dir(dist)
-    yaml_data = load_yaml(yaml_path)
-    wrap_distributed_ops = yaml_data.get('distributed')
-    return set(wrap_distributed_ops) & set(_all_distributed_ops)
-
-
-class HOOKDistributedOP(object):
-    pass
-
-
-class DistributedOPTemplate(HOOKModule):
-    def __init__(self, op_name, build_hook):
-        self.op_name_ = op_name
-        self.prefix_op_name_ = "Distributed" + Const.SEP + str(op_name) + Const.SEP
-        super().__init__(build_hook)
-        if not self.stop_hook:
-            self.op_is_distributed = True
-
-    @torch_device_guard
-    def forward(self, *args, **kwargs):
-        handle = distributed_func.get(self.op_name_)(*args, **kwargs)
-        if kwargs.get("async_op") or self.op_name_ in ["isend", "irecv"]:
-            if handle and hasattr(handle, 'wait'):
-                handle.wait()
-        if self.op_name_ == "batch_isend_irecv":
-            if isinstance(handle, list):
-                for req in handle:
-                    req.wait()
-        return handle
-
-
-def wrap_distributed_op(op_name, hook):
-    @wraps(DistributedOPTemplate)
-    def distributed_op_template(*args, **kwargs):
-        return DistributedOPTemplate(op_name, hook)(*args, **kwargs)
-
-    distributed_op_template.__name__ = op_name
-    return distributed_op_template
-
-
-def wrap_distributed_ops_and_bind(hook):
-    _distributed_ops = get_distributed_ops()
-    for op_name in _distributed_ops:
-        setattr(HOOKDistributedOP, "wrap_" + str(op_name), wrap_distributed_op(op_name, hook))
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_functional.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_functional.py
deleted file mode 100644
index 6164169476d..00000000000
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_functional.py
+++ /dev/null
@@ -1,66 +0,0 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-import torch
-
-from msprobe.pytorch.hook_module.hook_module import HOOKModule
-from msprobe.pytorch.common.utils import torch_device_guard
-from msprobe.core.common.const import Const
-from msprobe.pytorch.common.log import logger
-from msprobe.core.common.file_utils import load_yaml
-
-
-cur_path = os.path.dirname(os.path.realpath(__file__))
-yaml_path = os.path.join(cur_path, "support_wrap_ops.yaml")
-
-
-def get_functional_ops():
-    yaml_data = load_yaml(yaml_path)
-    wrap_functional_ops = yaml_data.get('functional')
-    _all_functional_ops = dir(torch.nn.functional)
-    return set(wrap_functional_ops) & set(_all_functional_ops)
-
-
-TorchFunctions = {func: getattr(torch.nn.functional, func) for func in get_functional_ops()}
-
-
-class HOOKFunctionalOP(object):
-    pass
-
-
-class FunctionalOPTemplate(HOOKModule):
-    def __init__(self, op_name, hook, need_hook=True):
-        self.op_name_ = op_name
-        self.prefix_op_name_ = "Functional" + Const.SEP + str(op_name) + Const.SEP
-        if need_hook:
-            super().__init__(hook)
-
-    @torch_device_guard
-    def forward(self, *args, **kwargs):
-        return TorchFunctions[str(self.op_name_)](*args, **kwargs)
-
-
-def wrap_functional_op(op_name, hook):
-    def functional_op_template(*args, **kwargs):
-        return FunctionalOPTemplate(op_name, hook)(*args, **kwargs)
-
-    return functional_op_template
-
-
-def wrap_functional_ops_and_bind(hook):
-    _functional_ops = get_functional_ops()
-    for op_name in _functional_ops:
-        setattr(HOOKFunctionalOP, "wrap_" + op_name, wrap_functional_op(op_name, hook))
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_npu_custom.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_npu_custom.py
deleted file mode 100644
index 1c0afc59f50..00000000000
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_npu_custom.py
+++ /dev/null
@@ -1,85 +0,0 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-import torch
-
-from msprobe.pytorch.hook_module.hook_module import HOOKModule
-from msprobe.pytorch.common.utils import torch_device_guard, torch_without_guard_version
-from msprobe.core.common.const import Const
-from msprobe.core.common.log import logger
-from msprobe.core.common.file_utils import load_yaml
-from msprobe.pytorch.function_factory import npu_custom_functions
-
-try:
-    import torch_npu
-except ImportError:
-    logger.info("Failing to import torch_npu.")
-
-
-cur_path = os.path.dirname(os.path.realpath(__file__))
-yaml_path = os.path.join(cur_path, "support_wrap_ops.yaml")
-cuda_func_mapping = {"npu_fusion_attention" : "gpu_fusion_attention"}
-
-
-def get_npu_ops():
-    if torch_without_guard_version:
-        _npu_ops = dir(torch.ops.npu)
-    else:
-        _npu_ops = dir(torch_npu._C._VariableFunctionsClass)
-    yaml_data = load_yaml(yaml_path)
-    wrap_npu_ops = yaml_data.get('torch_npu')
-    return set(wrap_npu_ops) & set(_npu_ops)
-
-
-class HOOKNpuOP(object):
-    pass
-
-
-class NpuOPTemplate(HOOKModule):
-
-    def __init__(self, op_name, hook, need_hook=True, device=Const.CPU_LOWERCASE):
-        self.op_name_ = op_name
-        self.prefix_op_name_ = "NPU" + Const.SEP + str(op_name) + Const.SEP
-        self.need_hook = need_hook
-        self.device = device
-        if need_hook:
-            super().__init__(hook)
-
-    @torch_device_guard
-    def forward(self, *args, **kwargs):
-        if not self.need_hook:
-            if self.op_name_ not in npu_custom_functions:
-                raise Exception(f'There is not bench function {self.op_name_}')
-            if self.device == Const.CUDA_LOWERCASE:
-                self.op_name_ = cuda_func_mapping.get(self.op_name_, self.op_name_)
-            if self.device in [Const.CUDA_LOWERCASE, Const.CPU_LOWERCASE]:
-                return npu_custom_functions[self.op_name_](*args, **kwargs)
-        if torch_without_guard_version:
-            return getattr(torch.ops.npu, str(self.op_name_))(*args, **kwargs)
-        else:
-            return getattr(torch_npu._C._VariableFunctionsClass, str(self.op_name_))(*args, **kwargs)
-
-
-def wrap_npu_op(op_name, hook):
-    def npu_op_template(*args, **kwargs):
-        return NpuOPTemplate(op_name, hook)(*args, **kwargs)
-    return npu_op_template
-
-
-def wrap_npu_ops_and_bind(hook):
-    _npu_ops = get_npu_ops()
-    for op_name in _npu_ops:
-        setattr(HOOKNpuOP, "wrap_" + str(op_name), wrap_npu_op(op_name, hook))
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_tensor.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_tensor.py
deleted file mode 100644
index f93c09a1241..00000000000
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_tensor.py
+++ /dev/null
@@ -1,69 +0,0 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-
-import torch
-
-from msprobe.pytorch.hook_module.hook_module import HOOKModule
-from msprobe.pytorch.common.utils import torch_device_guard, parameter_adapter
-from msprobe.core.common.const import Const
-from msprobe.core.common.file_utils import load_yaml
-
-
-cur_path = os.path.dirname(os.path.realpath(__file__))
-yaml_path = os.path.join(cur_path, "support_wrap_ops.yaml")
-
-
-def get_tensor_ops():
-    _tensor_ops = dir(torch.Tensor)
-    yaml_data = load_yaml(yaml_path)
-    wrap_tensor_ops = yaml_data.get('tensor')
-    return set(wrap_tensor_ops) & set(_tensor_ops)
-
-
-TensorOps = {op: getattr(torch.Tensor, op) for op in get_tensor_ops()}
-
-
-class HOOKTensor(object):
-    pass
-
-
-class TensorOPTemplate(HOOKModule):
-
-    def __init__(self, op_name, hook, need_hook=True):
-        self.op_name_ = op_name
-        self.prefix_op_name_ = "Tensor" + Const.SEP + str(op_name) + Const.SEP
-        if need_hook:
-            super().__init__(hook)
-
-    @torch_device_guard
-    @parameter_adapter
-    def forward(self, *args, **kwargs):
-        return TensorOps[str(self.op_name_)](*args, **kwargs)
-
-
-def wrap_tensor_op(op_name, hook):
-
-    def tensor_op_template(*args, **kwargs):
-        return TensorOPTemplate(op_name, hook)(*args, **kwargs)
-
-    return tensor_op_template
-
-
-def wrap_tensor_ops_and_bind(hook):
-    _tensor_ops = get_tensor_ops()
-    for op_name in _tensor_ops:
-        setattr(HOOKTensor, "wrap_" + str(op_name), wrap_tensor_op(op_name, hook))
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_torch.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_torch.py
deleted file mode 100644
index fc9d61c206b..00000000000
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_torch.py
+++ /dev/null
@@ -1,84 +0,0 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-import torch
-
-from msprobe.pytorch.hook_module.hook_module import HOOKModule
-from msprobe.pytorch.common.utils import torch_device_guard
-from msprobe.core.common.const import Const
-from msprobe.core.common.file_utils import load_yaml
-
-
-cur_path = os.path.dirname(os.path.realpath(__file__))
-yaml_path = os.path.join(cur_path, "support_wrap_ops.yaml")
-
-
-def get_torch_ops():
-    _torch_ops = []
-    yaml_data = load_yaml(yaml_path)
-    wrap_torch_ops = yaml_data.get('torch')
-    for operation in wrap_torch_ops:
-        if '.' in operation:
-            operation_sub_module_name, operation_sub_op = operation.rsplit('.', 1)
-            operation_sub_module = getattr(torch, operation_sub_module_name)
-            if operation_sub_op in dir(operation_sub_module):
-                _torch_ops.append(operation)
-        else:
-            if hasattr(torch, operation):
-                _torch_ops.append(operation)
-    return set(_torch_ops)
-
-
-TorchOps = {}
-for op in get_torch_ops():
-    if '.' in op:
-        sub_module_name, sub_op = op.rsplit('.', 1)
-        sub_module = getattr(torch, sub_module_name)
-        TorchOps[op] = getattr(sub_module, sub_op)
-    else:
-        TorchOps[op] = getattr(torch, op)
-
-
-
-class HOOKTorchOP(object):
-    pass
-
-
-class TorchOPTemplate(HOOKModule):
-
-    def __init__(self, op_name, hook, need_hook=True):
-        self.op_name_ = op_name
-        self.prefix_op_name_ = "Torch" + Const.SEP + str(op_name) + Const.SEP
-        if need_hook:
-            super().__init__(hook)
-
-    @torch_device_guard
-    def forward(self, *args, **kwargs):
-        return TorchOps[str(self.op_name_)](*args, **kwargs)
-
-
-def wrap_torch_op(op_name, hook):
-
-    def torch_op_template(*args, **kwargs):
-        return TorchOPTemplate(op_name, hook)(*args, **kwargs)
-
-    return torch_op_template
-
-
-def wrap_torch_ops_and_bind(hook):
-    _torch_ops = get_torch_ops()
-    for op_name in _torch_ops:
-        setattr(HOOKTorchOP, "wrap_" + op_name, wrap_torch_op(op_name, hook))
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_vf.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_vf.py
deleted file mode 100644
index 05ee3bc9225..00000000000
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_vf.py
+++ /dev/null
@@ -1,60 +0,0 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-import torch
-
-from msprobe.core.common.const import Const
-from msprobe.core.common.file_utils import load_yaml
-from msprobe.pytorch.hook_module.hook_module import HOOKModule
-from msprobe.pytorch.common.utils import torch_device_guard
-
-
-cur_path = os.path.dirname(os.path.realpath(__file__))
-yaml_path = os.path.join(cur_path, "support_wrap_ops.yaml")
-
-
-def get_vf_ops():
-    yaml_data = load_yaml(yaml_path)
-    wrap_vf_ops = yaml_data.get('_VF')
-    return wrap_vf_ops
-
-
-class HOOKVfOP(object):
-    pass
-
-
-class VfOPTemplate(HOOKModule):
-    def __init__(self, op_name, hook):
-        self.op_name_ = op_name
-        self.prefix_op_name_ = "VF" + Const.SEP + str(op_name) + Const.SEP
-        super().__init__(hook)
-
-    @torch_device_guard
-    def forward(self, *args, **kwargs):
-        return getattr(torch._C._VariableFunctionsClass, str(self.op_name_))(*args, **kwargs)
-
-
-def wrap_vf_op(op_name, hook):
-    def vf_op_template(*args, **kwargs):
-        return VfOPTemplate(op_name, hook)(*args, **kwargs)
-
-    return vf_op_template
-
-
-def wrap_vf_ops_and_bind(hook):
-    _vf_ops = get_vf_ops()
-    for op_name in _vf_ops:
-        setattr(HOOKVfOP, "wrap_" + op_name, wrap_vf_op(op_name, hook))
diff --git a/debug/accuracy_tools/msprobe/pytorch/service.py b/debug/accuracy_tools/msprobe/pytorch/service.py
index fd81a7f1cf0..11eef489de2 100644
--- a/debug/accuracy_tools/msprobe/pytorch/service.py
+++ b/debug/accuracy_tools/msprobe/pytorch/service.py
@@ -30,7 +30,7 @@ from msprobe.pytorch.common.log import logger
 from msprobe.pytorch.common.utils import get_rank_if_initialized, is_recomputation
 from msprobe.pytorch.dump.kernel_dump.kernel_config import create_kernel_config_json
 from msprobe.pytorch.dump.module_dump.module_processer import ModuleProcesser
-from msprobe.pytorch.hook_module.api_registry import api_register
+from msprobe.pytorch.hook_module.api_register import get_api_register
 from msprobe.pytorch.hook_module.hook_module import HOOKModule
 from msprobe.pytorch.hook_module.register_optimizer_hook import register_optimizer_hook
 
@@ -58,6 +58,7 @@ class Service:
         self.params_grad_info = {}
         self.hook_handle_dict = {}
         # 提前注册，确保注册尽可能多的API hook
+        self.api_register = get_api_register()
         self.register_api_hook()
         self.init_for_debug_level()
 
@@ -370,11 +371,10 @@ class Service:
     def register_api_hook(self):
         if self.config.level in [Const.LEVEL_MIX, Const.LEVEL_L1, Const.LEVEL_L2]:
             logger.info_on_rank_0(f"The api {self.config.task} hook function is successfully mounted to the model.")
-            api_register.initialize_hook(
-                functools.partial(self.build_hook, BaseScope.Module_Type_API),
-                self.config.online_run_ut
+            self.api_register.initialize_hook(
+                functools.partial(self.build_hook, BaseScope.Module_Type_API)
             )
-            api_register.api_modularity()
+            self.api_register.register_all_api()
 
     def register_module_hook(self):
         if self.config.level in [Const.LEVEL_L0, Const.LEVEL_MIX]:
-- 
Gitee


From 820bd952616ff9b6500f436915a1b2b8f03b1334 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Mon, 24 Feb 2025 10:58:33 +0800
Subject: [PATCH 003/145] compare add euclidean distance

---
 .../msprobe/core/compare/acc_compare.py       |  9 ++--
 .../core/compare/multiprocessing_compute.py   | 10 ++---
 .../test/core_ut/compare/test_acc_compare.py  | 38 +++++++++-------
 .../compare/test_acc_compare_npy_compare.py   |  4 +-
 .../core_ut/compare/test_acc_compare_utils.py | 44 +++++++++++--------
 .../test_cmp_multiprocessing_compute.py       | 20 +++++----
 6 files changed, 69 insertions(+), 56 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
index 0672e32404c..4f4bdd0b105 100644
--- a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
@@ -459,9 +459,10 @@ class Comparator:
         euc_dist_result = []
         max_err_result = []
         max_relative_err_result = []
-        err_mess = []
         one_thousand_err_ratio_result = []
         five_thousand_err_ratio_result = []
+        err_mess = []
+
         is_print_compare_log = input_param.get("is_print_compare_log")
         bench_data = load_json(input_param.get("bench_json_path")).get('data')
         for i in range(len(result_df)):
@@ -483,18 +484,18 @@ class Comparator:
             euc_dist_result.append(euc_dist)
             max_err_result.append(max_abs_err)
             max_relative_err_result.append(max_relative_err)
-            err_mess.append(err_msg)
             one_thousand_err_ratio_result.append(one_thousand_err_ratio)
             five_thousand_err_ratio_result.append(five_thousand_err_ratio)
+            err_mess.append(err_msg)
 
         cr = ComparisonResult(
             cos_result=cos_result,
             euc_dist_result=euc_dist_result,
             max_err_result=max_err_result,
             max_relative_err_result=max_relative_err_result,
-            err_msgs=err_mess,
             one_thousand_err_ratio_result=one_thousand_err_ratio_result,
-            five_thousand_err_ratio_result=five_thousand_err_ratio_result
+            five_thousand_err_ratio_result=five_thousand_err_ratio_result,
+            err_msgs=err_mess
         )
 
         return _save_cmp_result(idx, cr, result_df, lock)
diff --git a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
index 560a6f603eb..20849afa920 100644
--- a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
+++ b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
@@ -1,4 +1,4 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
 # All rights reserved.
 #
 # Licensed under the Apache License, Version 2.0  (the "License");
@@ -113,9 +113,9 @@ class ComparisonResult:
     euc_dist_result: list
     max_err_result:  list
     max_relative_err_result: list
-    err_msgs: list
     one_thousand_err_ratio_result: list
     five_thousand_err_ratio_result: list
+    err_msgs: list
 
 
 def _save_cmp_result(offset, result: ComparisonResult, result_df, lock):
@@ -139,13 +139,13 @@ def _save_cmp_result(offset, result: ComparisonResult, result_df, lock):
             result_df.loc[process_index, CompareConst.EUC_DIST] = result.euc_dist_result[i]
             result_df.loc[process_index, CompareConst.MAX_ABS_ERR] = result.max_err_result[i]
             result_df.loc[process_index, CompareConst.MAX_RELATIVE_ERR] = result.max_relative_err_result[i]
-            result_df.loc[process_index, CompareConst.ERROR_MESSAGE] = result.err_msgs[i]
-            result_df.loc[process_index, CompareConst.ACCURACY] = (
-                check_accuracy(result.cos_result[i], result.max_err_result[i]))
             result_df.loc[process_index, CompareConst.ONE_THOUSANDTH_ERR_RATIO] = (
                 result.one_thousand_err_ratio_result)[i]
             result_df.loc[process_index, CompareConst.FIVE_THOUSANDTHS_ERR_RATIO] = (
                 result.five_thousand_err_ratio_result)[i]
+            result_df.loc[process_index, CompareConst.ACCURACY] = (
+                check_accuracy(result.cos_result[i], result.max_err_result[i]))
+            result_df.loc[process_index, CompareConst.ERROR_MESSAGE] = result.err_msgs[i]
         return result_df
     except ValueError as e:
         logger.error('result dataframe is not found.')
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
index b4566fcfe6f..c882e331f55 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
@@ -191,17 +191,21 @@ summary_line_3 = ['Functional_batch_norm_0_forward.output.2', 'Functional_batch_
                   'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 0, 0, 0, 0, 2, 0, 1, 1, 1, 1, 1, 1,
                   'Warning', '']
 line_input = ['Functional.batch.norm.0.forward.input.0', 'Functional.batch.norm.0.forward.input.0', 'torch.float16',
-              'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 1, 1, 1, 0.95, 1, 1, 1, 1, 1, 1.01, 1, 1, 1,
+              'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 1, 0.5, 1, 1, 0.95, 1,
+              1, 1, 1, 1, 1.01, 1, 1, 1,
               'Yes', '']
 line_1 = ['Functional.batch.norm.0.forward.output.0', 'Functional.batch.norm.0.forward.output.0', 'torch.float16',
-          'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 0.8, 1, 1, 0.59, 1, 'nan', 0, 1, 1, 19, 1, 1, 1,
-          'Warning', '']
+          'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 0.8, 0.5, 1, 1, 0.59, 1,
+          'nan', 0, 1, 1, 19, 1, 1, 1,
+          'Yes', '']
 line_2 = ['Functional.batch.norm.0.forward.output.1', 'Functional.batch.norm.0.forward.output.1', 'torch.float16',
-          'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 0.9, 1, 1, 0.8, 1, 0, 0.12, 0, 1, 1, 0.1, 1, 1, 1,
-          'Warning', '']
+          'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 0.9, 0.5, 1, 1, 0.8, 1,
+          0, 0.12, 0, 1, 1, 0.1, 1, 1,
+          'Yes', '']
 line_3 = ['Functional.batch.norm.0.forward.output.2', 'Functional.batch.norm.0.forward.output.2', 'torch.float16',
-          'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 0.8, 1.1e+10, 1, 0.85, 1, 9, 0.12, 0, 1, 1, 0.1, 1,
-          1, 1, 'Warning', '']
+          'torch.float32', [256, 256, 14, 14], [256, 256, 14, 14], 0.8, 0.5, 1.1e+10, 1, 0.85, 1,
+          9, 0.12, 0, 1, 1, 0.1, 1, 1,
+          'Yes', '']
 
 op_data = {
     'input_args': [{'type': 'torch.Tensor', 'dtype': 'torch.float32', 'shape': [16, 1, 3, 3],
@@ -363,7 +367,7 @@ class TestUtilsMethods(unittest.TestCase):
                            'torch.float32', 'torch.float32', [2, 2], [2, 2], '', '', '', '', '', '', '', '',
                            1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', 'File']]
         result_all = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
-                       'torch.float32', 'torch.float32', [2, 2], [2, 2], '', '', '', '', '',
+                       'torch.float32', 'torch.float32', [2, 2], [2, 2], '', '', '', '', '', '',
                        1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', 'File', '-1']]
         columns_md5_stack_mode_true = CompareConst.MD5_COMPARE_RESULT_HEADER + ['NPU_Stack_Info']
         result_table_md5_true = pd.DataFrame(result_md5, columns=columns_md5_stack_mode_true, dtype=object)
@@ -403,10 +407,10 @@ class TestUtilsMethods(unittest.TestCase):
                            'torch.float32', 'torch.float32', [2, 2], [2, 2], '', '', '', '', '', '', '', '',
                            1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '']]
         result_all_test = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
-                            'torch.float32', 'torch.float32', [2, 2], [2, 2], '', '', '', '', '',
+                            'torch.float32', 'torch.float32', [2, 2], [2, 2], '', '', '', '', '', '',
                             1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '', '-1']]
         result_all = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
-                       'torch.float32', 'torch.float32', [2, 2], [2, 2], '', '', '', '', '',
+                       'torch.float32', 'torch.float32', [2, 2], [2, 2], '', '', '', '', '', '',
                        1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']]
         columns_md5_stack_mode_true = CompareConst.MD5_COMPARE_RESULT_HEADER
         result_table_md5_true = pd.DataFrame(result_md5, columns=columns_md5_stack_mode_true, dtype='object')
@@ -632,10 +636,10 @@ class TestUtilsMethods(unittest.TestCase):
     def test_do_multi_process(self):
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']]
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']]
         o_data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
-                   'torch.float32', 'torch.float32', [2, 2], [2, 2], 'unsupported', 'unsupported', 'unsupported',
-                   'unsupported', 'unsupported',
+                   'torch.float32', 'torch.float32', [2, 2], [2, 2],
+                   'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
                    1, 1, 1, 1, 1, 1, 1, 1, 'None', 'No bench data matched.', '-1']]
         columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
         result_df = pd.DataFrame(data, columns=columns)
@@ -669,7 +673,7 @@ class TestUtilsMethods(unittest.TestCase):
         result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param, {})
 
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                                  'No bench data matched.'])
+                                  'unsupported', 'No bench data matched.'])
 
     def test_compare_by_op_2(self):
         npu_op_name = 'Functional.linear.0.forward.input.0'
@@ -691,7 +695,7 @@ class TestUtilsMethods(unittest.TestCase):
                                               {'Functional.linear.0.forward': {'input_args': [
                                                   {'data_name': 'Functional.linear.0.forward.input.0.pt'}]}})
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                                  f'Dump file: {pt_path} not found.'])
+                                  'unsupported', f'Dump file: {pt_path} not found.'])
 
         pt_name = 'Functional.linear.0.forward.input.0.pt'
         pt_path = os.path.join(base_dir, pt_name)
@@ -699,13 +703,13 @@ class TestUtilsMethods(unittest.TestCase):
         input_param = {'npu_dump_data_dir': base_dir, 'bench_dump_data_dir': base_dir}
         result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param, {})
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                                  'Bench does not have data file.'])
+                                  'unsupported', 'Bench does not have data file.'])
 
         generate_pt(base_dir)
         result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param,
                                               {'Functional.linear.0.forward': {'input_args': [
                                                   {'data_name': 'Functional.linear.0.forward.input.0.pt'}]}})
-        self.assertEqual(result, [1.0, 0.0, 0.0, 1.0, 1.0, ''])
+        self.assertEqual(result, [1.0, 0.0, 0.0, 0.0, 1.0, 1.0, ''])
 
     def test_get_bench_data_name_input(self):
         bench_op_name = "Functional.linear.0.forward.input.0"
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
index cee6d5565bf..5c10d96cb8d 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
@@ -471,7 +471,7 @@ class TestUtilsMethods(unittest.TestCase):
         error_flag = False
         err_msg = ''
         a, b = compare_ops_apply(n_value, b_value, error_flag, err_msg)
-        self.assertEqual(a, [1.0, 0.0, 0.0, 1.0, 1.0])
+        self.assertEqual(a, [1.0, 0.0, 0.0, 0.0, 1.0, 1.0])
         self.assertEqual(b, '')
 
 
@@ -492,7 +492,7 @@ class TestGetEuclideanDistance(unittest.TestCase):
     def test_empty_tensor(self):
         # 测试当输入的张量为空时，返回 NAN
         n_value = np.array([])
-        b_value = np.array([1, 2, 3])
+        b_value = np.array([])
 
         result, msg = self.euc_distance.apply(n_value, b_value, None)
         self.assertEqual(result, CompareConst.NAN)
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
index ab8703dcd35..2e9a4657266 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
@@ -221,28 +221,34 @@ o_result_unmatch_2 = [
      'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None']
 ]
 o_result_unmatch_3 = [
-    ['Functional.conv2d.0.forward.input.0', 'N/A', 'torch.float32', 'N/A', [1, 1, 28, 28], 'N/A', 'N/A', 'N/A', 'N/A',
-     'N/A', 'N/A', 3.029174327850342, -2.926689624786377, -0.06619918346405029, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+    ['Functional.conv2d.0.forward.input.0', 'N/A', 'torch.float32', 'N/A', [1, 1, 28, 28], 'N/A',
+     'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+     3.029174327850342, -2.926689624786377, -0.06619918346405029, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      'No bench data matched.', 'None', '-1'],
-    ['Functional.conv2d.0.forward.input.1', 'N/A', 'torch.float32', 'N/A', [16, 1, 5, 5], 'N/A', 'N/A', 'N/A', 'N/A',
-     'N/A', 'N/A', 0.19919930398464203, -0.19974489510059357, 0.006269412115216255, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+    ['Functional.conv2d.0.forward.input.1', 'N/A', 'torch.float32', 'N/A', [16, 1, 5, 5], 'N/A',
+     'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+     0.19919930398464203, -0.19974489510059357, 0.006269412115216255, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      'No bench data matched.', 'None', '-1'],
-    ['Functional.conv2d.0.forward.input.2', 'N/A', 'torch.float32', 'N/A', [16], 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'N/A', 0.19734230637550354, -0.18177609145641327, 0.007903944700956345, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+    ['Functional.conv2d.0.forward.input.2', 'N/A', 'torch.float32', 'N/A', [16], 'N/A',
+     'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+     0.19734230637550354, -0.18177609145641327, 0.007903944700956345, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      'No bench data matched.', 'None', '-1'],
-    ['Functional.conv2d.0.forward.parameters.weight', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A', 'N/A',
-     'N/A', 'N/A',
-     'N/A', 'N/A', 1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
-    ['Functional.conv2d.0.forward.parameters.bias', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A', 'N/A', 'N/A',
-     'N/A',
-     'N/A', 'N/A', 1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
-    ['Functional.conv2d.0.forward.output.0', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A', 'N/A', 'N/A', 'N/A',
-     'N/A', 'N/A', 2.1166646480560303, -2.190781354904175, -0.003579073818400502, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+    ['Functional.conv2d.0.forward.parameters.weight', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
+     'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+    ['Functional.conv2d.0.forward.parameters.bias', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
+     'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+    ['Functional.conv2d.0.forward.output.0', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
+     'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+     2.1166646480560303, -2.190781354904175, -0.003579073818400502, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      'No bench data matched.', 'None', '-1'],
-    ['Functional.conv2d.0.parameters_grad.weight', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A', 'N/A', 'N/A', 'N/A',
-     'N/A', 'N/A', 1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
-    ['Functional.conv2d.0.parameters_grad.bias', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A', 'N/A', 'N/A', 'N/A',
-     'N/A', 'N/A', 1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1']
+    ['Functional.conv2d.0.parameters_grad.weight', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
+     'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+    ['Functional.conv2d.0.parameters_grad.bias', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
+     'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1']
 ]
 
 # test_merge_tensor
@@ -558,7 +564,7 @@ class TestUtilsMethods(unittest.TestCase):
         dump_mode = Const.ALL
         result_item = result_item_init(n_info, b_info, dump_mode)
         self.assertEqual(result_item, ['Tensor.add.0.forward.input.0', 'Tensor.add.0.forward.input.0',
-                                       'torch.float32', 'torch.float32', [96], [96], ' ', ' ', ' ', ' ', ' '])
+                                       'torch.float32', 'torch.float32', [96], [96], ' ', ' ', ' ', ' ', ' ', ' '])
 
         dump_mode = Const.SUMMARY
         result_item = result_item_init(n_info, b_info, dump_mode)
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
index 9c2dea835fe..3fa16b0d9d4 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
@@ -16,12 +16,12 @@ from test_acc_compare import generate_dump_json
 
 data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
          'torch.float32', 'torch.float32', [2, 2], [2, 2],
-         '', '', '', '', '',
+         '', '', '', '', '', '',
          1, 1, 1, 1, 1, 1, 1, 1,
          'Yes', '', '-1']]
 o_data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
            'torch.float32', 'torch.float32', [2, 2], [2, 2],
-           'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
+           'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
            1, 1, 1, 1, 1, 1, 1, 1,
            'None', 'No bench data matched.', '-1']]
 columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
@@ -34,9 +34,9 @@ class TestUtilsMethods(unittest.TestCase):
 
     def setUp(self):
         self.result_df = pd.DataFrame(columns=[
-            CompareConst.COSINE, CompareConst.MAX_ABS_ERR, CompareConst.MAX_RELATIVE_ERR,
-            CompareConst.ERROR_MESSAGE, CompareConst.ACCURACY,
-            CompareConst.ONE_THOUSANDTH_ERR_RATIO, CompareConst.FIVE_THOUSANDTHS_ERR_RATIO
+            CompareConst.COSINE, CompareConst.EUC_DIST, CompareConst.MAX_ABS_ERR, CompareConst.MAX_RELATIVE_ERR,
+            CompareConst.ONE_THOUSANDTH_ERR_RATIO, CompareConst.FIVE_THOUSANDTHS_ERR_RATIO,
+            CompareConst.ACCURACY, CompareConst.ERROR_MESSAGE
         ])
         os.makedirs(base_dir, mode=0o750, exist_ok=True)
         self.lock = threading.Lock()
@@ -72,9 +72,10 @@ class TestUtilsMethods(unittest.TestCase):
             cos_result=[0.99, 0.98],
             max_err_result=[0.01, 0.02],
             max_relative_err_result=[0.001, 0.002],
-            err_msgs=['', 'Error in comparison'],
+            euc_dist_result=[0.5, 0.49],
             one_thousand_err_ratio_result=[0.1, 0.2],
-            five_thousand_err_ratio_result=[0.05, 0.1]
+            five_thousand_err_ratio_result=[0.05, 0.1],
+            err_msgs=['', 'Error in comparison']
         )
         offset = 0
         updated_df = _save_cmp_result(offset, comparison_result, self.result_df, self.lock)
@@ -88,9 +89,10 @@ class TestUtilsMethods(unittest.TestCase):
             cos_result=[0.99],
             max_err_result=[],
             max_relative_err_result=[0.001],
-            err_msgs=[''],
+            euc_dist_result=[0.5],
             one_thousand_err_ratio_result=[0.1],
-            five_thousand_err_ratio_result=[0.05]
+            five_thousand_err_ratio_result=[0.05],
+            err_msgs=['']
         )
         with self.assertRaises(CompareException) as context:
             _save_cmp_result(0, comparison_result, self.result_df, self.lock)
-- 
Gitee


From 1fc978d5cd78390543e6b092d017b89d1951aaeb Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Mon, 24 Feb 2025 11:14:06 +0800
Subject: [PATCH 004/145] compare add euclidean distance

---
 .../msprobe/core/compare/npy_compare.py       |  2 +-
 .../core_ut/compare/test_cmp_highlight.py     | 30 +++++++++----------
 2 files changed, 16 insertions(+), 16 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
index db391726c79..7147f4d3dba 100644
--- a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
@@ -1,4 +1,4 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
 # All rights reserved.
 #
 # Licensed under the Apache License, Version 2.0  (the "License");
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_highlight.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_highlight.py
index f561a3e05ec..3261bce5d6d 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_highlight.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_highlight.py
@@ -26,7 +26,7 @@ def generate_result_xlsx(base_dir):
     data_path = os.path.join(base_dir, 'target_result.xlsx')
     data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
              'torch.float32', 'torch.float32', [2, 2], [2, 2],
-             '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
+             '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
             ]
     columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
     result_df = pd.DataFrame(data, columns=columns)
@@ -101,8 +101,8 @@ class TestUtilsMethods(unittest.TestCase):
         self.assertEqual(result, None)
 
     def test_CheckOneThousandErrorRatio_str(self):
-        api_in = [1, 1, 1, 1, 1, 1, 1, 1, 1, "unsupported"]
-        api_out = [1, 1, 1, 1, 1, 1, 1, 1, 1, "unsupported"]
+        api_in = [1, 1, 1, 1, 1, 1, 0.9, 0.5, 1, 1, "unsupported"]
+        api_out = [1, 1, 1, 1, 1, 1, 0.9, 0.5, 1, 1, "unsupported"]
         info = (api_in, api_out, 1)
         color_columns = ()
         dump_mode = Const.ALL
@@ -113,8 +113,8 @@ class TestUtilsMethods(unittest.TestCase):
 
     @patch("msprobe.core.compare.highlight.add_highlight_row_info")
     def test_CheckOneThousandErrorRatio_red(self, mock_add_highlight_row_info):
-        api_in = [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
-        api_out = [1, 1, 1, 1, 1, 1, 1, 1, 1, 0.5]
+        api_in = [1, 1, 1, 1, 1, 1, 0.9, 0.5, 1, 1, 1]
+        api_out = [1, 1, 1, 1, 1, 1, 0.9, 0.5, 1, 1, 0.5]
         info = (api_in, api_out, 1)
         ColorColumns = namedtuple('ColorColumns', ['red', 'yellow'])
         color_columns = ColorColumns(red=[], yellow=[])
@@ -315,7 +315,7 @@ class TestUtilsMethods(unittest.TestCase):
         columns = CompareConst.COMPARE_RESULT_HEADER
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '']
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '']
                 ]
         result_df = pd.DataFrame(data, columns=columns)
 
@@ -329,7 +329,7 @@ class TestUtilsMethods(unittest.TestCase):
     def test_highlight_rows_xlsx_red(self):
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
                 ]
         columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
         result_df = pd.DataFrame(data, columns=columns)
@@ -342,7 +342,7 @@ class TestUtilsMethods(unittest.TestCase):
     def test_highlight_rows_xlsx_yellow(self):
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
                 ]
         columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
         result_df = pd.DataFrame(data, columns=columns)
@@ -356,7 +356,7 @@ class TestUtilsMethods(unittest.TestCase):
     def test_highlight_rows_xlsx_malicious_columns(self, mock_save_book):
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
                 ]
         columns = CompareConst.COMPARE_RESULT_HEADER + ['=Data_name']
         result_df = pd.DataFrame(data, columns=columns)
@@ -378,10 +378,10 @@ class TestUtilsMethods(unittest.TestCase):
     def test_highlight_rows_xlsx_malicious_type(self, mock_save_book):
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  '=torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1'],
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1'],
                 ['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  '=torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
                 ]
         columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
         result_df = pd.DataFrame(data, columns=columns)
@@ -416,10 +416,10 @@ class TestUtilsMethods(unittest.TestCase):
     def test_update_highlight_err_msg(self):
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1'],
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1'],
                 ['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']
                 ]
         columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
         result_df = pd.DataFrame(data, columns=columns)
@@ -433,10 +433,10 @@ class TestUtilsMethods(unittest.TestCase):
 
         t_data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                    'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                   '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', 'a\nb', '-1'],
+                   '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', 'a\nb', '-1'],
                   ['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                    'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                   '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', 'd', '-1']
+                   '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', 'd', '-1']
                   ]
         target_result_df = pd.DataFrame(t_data, columns=columns)
         self.assertTrue(result_df.equals(target_result_df))
-- 
Gitee


From a01d5cb49d528302c01c731c6efc32874aa9d2ac Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Mon, 24 Feb 2025 11:26:18 +0800
Subject: [PATCH 005/145] compare add euclidean distance

---
 debug/accuracy_tools/msprobe/core/compare/acc_compare.py     | 4 ++--
 debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py | 3 ++-
 2 files changed, 4 insertions(+), 3 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
index 4f4bdd0b105..f0ac97a0293 100644
--- a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
@@ -311,9 +311,9 @@ class Comparator:
                 ]
 
                 if self.dump_mode == Const.SUMMARY:
-                    result_item = base_result_item + [" "] * 8
+                    result_item = base_result_item + [" "] * 8  # 8个统计量数据情况的比对指标
                 else:
-                    result_item = base_result_item + [" "] * 5
+                    result_item = base_result_item + [" "] * 6  # 6个真实数据情况的比对指标
 
                 npu_summary_data = npu_ops_all.get(ms_op_name).get("summary")
                 result_item.extend(npu_summary_data)
diff --git a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
index 8509a7f38ad..de507e87665 100644
--- a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
+++ b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
@@ -125,7 +125,8 @@ class MSComparator(Comparator):
             result_df.loc[warning_flag, CompareConst.RESULT] = CompareConst.WARNING
             result_df.loc[warning_flag, CompareConst.ERROR_MESSAGE] = 'Need double check api accuracy.'
         else:
-            fill_cols = [CompareConst.COSINE, CompareConst.MAX_ABS_ERR, CompareConst.MAX_RELATIVE_ERR,
+            fill_cols = [CompareConst.COSINE, CompareConst.EUC_DIST,
+                         CompareConst.MAX_ABS_ERR, CompareConst.MAX_RELATIVE_ERR,
                          CompareConst.ONE_THOUSANDTH_ERR_RATIO, CompareConst.FIVE_THOUSANDTHS_ERR_RATIO,
                          CompareConst.ERROR_MESSAGE]
             result_df.loc[~condition_no_bench, fill_cols] = ''
-- 
Gitee


From 739fe1cad25c7c7d8aeaf53e773a4d07aaeea429 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Mon, 24 Feb 2025 15:25:43 +0800
Subject: [PATCH 006/145] compare add euclidean distance

---
 debug/accuracy_tools/msprobe/core/common/const.py     |  2 +-
 .../msprobe/mindspore/compare/ms_graph_compare.py     | 11 ++++++-----
 .../mindspore_ut/compare/test_ms_graph_compare.py     |  2 +-
 3 files changed, 8 insertions(+), 7 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/common/const.py b/debug/accuracy_tools/msprobe/core/common/const.py
index bf0883667c0..b60d06d10bf 100644
--- a/debug/accuracy_tools/msprobe/core/common/const.py
+++ b/debug/accuracy_tools/msprobe/core/common/const.py
@@ -469,7 +469,7 @@ class CompareConst:
         BENCH_MEAN: None, BENCH_NORM: None, ACCURACY: '', ERROR_MESSAGE: ''
     }
     MS_GRAPH_NPY = {
-        COSINE: None, MAX_ABS_ERR: None, MAX_RELATIVE_ERR: None, ONE_THOUSANDTH_ERR_RATIO: None,
+        COSINE: None, EUC_DIST: None, MAX_ABS_ERR: None, MAX_RELATIVE_ERR: None, ONE_THOUSANDTH_ERR_RATIO: None,
         FIVE_THOUSANDTHS_ERR_RATIO: None
     }
     MS_GRAPH_STATISTIC = {
diff --git a/debug/accuracy_tools/msprobe/mindspore/compare/ms_graph_compare.py b/debug/accuracy_tools/msprobe/mindspore/compare/ms_graph_compare.py
index 701988ba483..153f4fd6552 100644
--- a/debug/accuracy_tools/msprobe/mindspore/compare/ms_graph_compare.py
+++ b/debug/accuracy_tools/msprobe/mindspore/compare/ms_graph_compare.py
@@ -195,11 +195,12 @@ class GraphMSComparator:
             if not error_flag:
                 result_list, err_msg = compare_ops_apply(n_value, b_value, False, "")
                 result_dict[CompareConst.COSINE] = result_list[0]
-                result_dict[CompareConst.MAX_ABS_ERR] = result_list[1]
-                result_dict[CompareConst.MAX_RELATIVE_ERR] = result_list[2]
-                result_dict[CompareConst.ONE_THOUSANDTH_ERR_RATIO] = result_list[3]
-                result_dict[CompareConst.FIVE_THOUSANDTHS_ERR_RATIO] = result_list[4]
-                result_dict[CompareConst.ACCURACY] = check_accuracy(result_list[0], result_list[1])
+                result_dict[CompareConst.EUC_DIST] = result_list[1]
+                result_dict[CompareConst.MAX_ABS_ERR] = result_list[2]
+                result_dict[CompareConst.MAX_RELATIVE_ERR] = result_list[3]
+                result_dict[CompareConst.ONE_THOUSANDTH_ERR_RATIO] = result_list[4]
+                result_dict[CompareConst.FIVE_THOUSANDTHS_ERR_RATIO] = result_list[5]
+                result_dict[CompareConst.ACCURACY] = check_accuracy(result_list[0], result_list[2])
                 result_dict[CompareConst.ERROR_MESSAGE] = err_msg
 
             return pd.Series(result_dict)
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_graph_compare.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_graph_compare.py
index e3fd9348efe..c2e7c9368c3 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_graph_compare.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_graph_compare.py
@@ -78,7 +78,7 @@ class TestMsGraphCompare(unittest.TestCase):
 
         result_correct = (
             f"[['{npu_file_path}', '{bench_file_path}', dtype('float16'), dtype('float16'), (10, 10), (10, 10), "
-            f"44.0, 44.0, 44.0, inf, 44.0, 44.0, 44.0, inf, 'Yes', '', 1.0, 0.0, 0.0, 1.0, 1.0]]")
+            f"44.0, 44.0, 44.0, inf, 44.0, 44.0, 44.0, inf, 'Yes', '', 1.0, 0.0, 0.0, 0.0, 1.0, 1.0]]")
 
         self.assertNotEqual(len(files), 0)
         self.assertEqual(result, result_correct)
-- 
Gitee


From 56fbae42a7d74aa162eb8dac7fe82a30f9d5b5b2 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Mon, 24 Feb 2025 19:56:23 +0800
Subject: [PATCH 007/145] compare add euclidean distance

---
 .../core/compare/multiprocessing_compute.py   |  9 ++-
 .../msprobe/core/compare/npy_compare.py       | 36 +----------
 .../compare/test_acc_compare_npy_compare.py   | 62 -------------------
 3 files changed, 8 insertions(+), 99 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
index 20849afa920..f79671827c1 100644
--- a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
+++ b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
@@ -15,8 +15,11 @@
 
 import multiprocessing
 from dataclasses import dataclass
+from functools import partial
+
 import pandas as pd
 from tqdm import tqdm
+
 from msprobe.core.common.log import logger
 from msprobe.core.common.utils import CompareException
 from msprobe.core.common.const import CompareConst
@@ -44,7 +47,7 @@ def _handle_multi_process(func, input_parma, result_df, lock):
 
     progress_bar = tqdm(total=len(result_df), desc="API/Module Item Compare Process", unit="row", ncols=100)
 
-    def update_progress(size, progress_lock):
+    def update_progress(size, progress_lock, extra_param=None):
         with progress_lock:
             progress_bar.update(size)
 
@@ -54,8 +57,10 @@ def _handle_multi_process(func, input_parma, result_df, lock):
         result = pool.apply_async(func,
                                   args=(idx, op_name_mapping_dict, df_chunk, lock, input_parma),
                                   error_callback=err_call,
-                                  callback=update_progress(chunk_size, lock))
+                                  callback=partial(update_progress, chunk_size, lock)
+                                  )
         results.append(result)
+
     final_results = [r.get() for r in results]
     pool.close()
     pool.join()
diff --git a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
index 7147f4d3dba..d060b4013f0 100644
--- a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
@@ -232,41 +232,7 @@ class GetEuclideanDistance(TensorComparisonBasic):
     def apply(self, n_value, b_value, relative_err):
         msg = ''
 
-        # 检查输入维度是否一致
-        if n_value.shape != b_value.shape:
-            msg = f"Cannot compare by Euclidean Distance, shapes of tensors do not match: \
-            npu:{n_value.shape} vs bench:{b_value.shape}"
-            return CompareConst.UNSUPPORTED, msg
-
-        # 检查输入是否为空
-        if n_value.size == 0 or b_value.size == 0:
-            msg = f"Cannot compare by Euclidean Distance, sizes of tensors must not be empty: \
-            npu:{n_value.size} vs bench:{b_value.size}"
-            return CompareConst.NAN, msg
-
-        # 检查是否包含 NaN 或 Inf
-        if np.any(np.isnan(n_value)) or np.any(np.isnan(b_value)):
-            msg = "Tensor contains NaN values."
-            return CompareConst.NAN, msg
-        if np.any(np.isinf(n_value)) or np.any(np.isinf(b_value)):
-            msg = "Tensor contains Inf values."
-            return CompareConst.NAN, msg
-
-        # 处理零向量
-        if np.all(n_value == 0) and np.all(b_value == 0):
-            return 0.0, "Zero tensors"
-
-        # 输入为标量
-        if np.ndim(n_value) == 0 or np.ndim(b_value) == 0:
-            msg = "Cannot compare by Euclidean Distance, input must be a vector, not a scalar."
-            return CompareConst.UNSUPPORTED, msg
-
-        # 大数值溢出
-        if np.any(np.abs(n_value) > 1e10) or np.any(np.abs(b_value) > 1e10):
-            msg = "tensors's values are large, which may cause overflow."
-
-        # 计算欧式距离
-        distance = np.linalg.norm(n_value - b_value)
+        distance = np.linalg.norm(n_value - b_value, ord=2)
 
         return distance, msg
 
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
index 5c10d96cb8d..c9096694a77 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
@@ -480,68 +480,6 @@ class TestGetEuclideanDistance(unittest.TestCase):
     def setUp(self):
         self.euc_distance = GetEuclideanDistance()
 
-    def test_shape_mismatch(self):
-        # 测试当两个张量的形状不匹配时，返回 UNSUPPORTED
-        n_value = np.array([1, 2, 3])
-        b_value = np.array([1, 2])
-
-        result, msg = self.euc_distance.apply(n_value, b_value, None)
-        self.assertEqual(result, CompareConst.UNSUPPORTED)
-        self.assertIn("Cannot compare by Euclidean Distance", msg)
-
-    def test_empty_tensor(self):
-        # 测试当输入的张量为空时，返回 NAN
-        n_value = np.array([])
-        b_value = np.array([])
-
-        result, msg = self.euc_distance.apply(n_value, b_value, None)
-        self.assertEqual(result, CompareConst.NAN)
-        self.assertIn("sizes of tensors must not be empty", msg)
-
-    def test_nan_in_tensor(self):
-        # 测试当张量包含 NaN 值时，返回 NAN
-        n_value = np.array([1, 2, np.nan])
-        b_value = np.array([1, 2, 3])
-
-        result, msg = self.euc_distance.apply(n_value, b_value, None)
-        self.assertEqual(result, CompareConst.NAN)
-        self.assertIn("Tensor contains NaN values", msg)
-
-    def test_inf_in_tensor(self):
-        # 测试当张量包含 Inf 值时，返回 NAN
-        n_value = np.array([1, 2, np.inf])
-        b_value = np.array([1, 2, 3])
-
-        result, msg = self.euc_distance.apply(n_value, b_value, None)
-        self.assertEqual(result, CompareConst.NAN)
-        self.assertIn("Tensor contains Inf values", msg)
-
-    def test_zero_tensors(self):
-        # 测试两个零张量的欧式距离
-        n_value = np.array([0, 0, 0])
-        b_value = np.array([0, 0, 0])
-
-        result, msg = self.euc_distance.apply(n_value, b_value, None)
-        self.assertEqual(result, 0.0)
-        self.assertIn("Zero tensors", msg)
-
-    def test_scalars(self):
-        # 测试当输入是标量时，返回 UNSUPPORTED
-        n_value = np.array(5)
-        b_value = np.array(10)
-
-        result, msg = self.euc_distance.apply(n_value, b_value, None)
-        self.assertEqual(result, CompareConst.UNSUPPORTED)
-        self.assertIn("input must be a vector, not a scalar", msg)
-
-    def test_large_values(self):
-        # 测试当张量包含大值时，应该返回大数值溢出的警告
-        n_value = np.array([1e11, 1e11, 1e11])
-        b_value = np.array([1e10, 1e10, 1e10])
-
-        result, msg = self.euc_distance.apply(n_value, b_value, None)
-        self.assertIn("tensors's values are large", msg)
-
     def test_euclidean_distance(self):
         # 测试计算两个张量之间的欧式距离
         n_value = np.array([1, 2, 3])
-- 
Gitee


From 02fa286f4b0216080d35f8222ab2a3ef14e971a1 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Mon, 24 Feb 2025 19:58:16 +0800
Subject: [PATCH 008/145] compare add euclidean distance

---
 debug/accuracy_tools/msprobe/core/compare/highlight.py | 1 -
 1 file changed, 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/highlight.py b/debug/accuracy_tools/msprobe/core/compare/highlight.py
index d95729c6d85..ead0f6bda87 100644
--- a/debug/accuracy_tools/msprobe/core/compare/highlight.py
+++ b/debug/accuracy_tools/msprobe/core/compare/highlight.py
@@ -17,7 +17,6 @@ import abc
 import math
 import multiprocessing
 import re
-from abc import ABC
 from collections import namedtuple
 
 import numpy as np
-- 
Gitee


From da88a94a3195b69aa43d946a764aac8c16a72854 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Mon, 24 Feb 2025 20:05:22 +0800
Subject: [PATCH 009/145] compare add euclidean distance

---
 debug/accuracy_tools/msprobe/core/compare/highlight.py | 10 +---------
 1 file changed, 1 insertion(+), 9 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/highlight.py b/debug/accuracy_tools/msprobe/core/compare/highlight.py
index ead0f6bda87..1983313249f 100644
--- a/debug/accuracy_tools/msprobe/core/compare/highlight.py
+++ b/debug/accuracy_tools/msprobe/core/compare/highlight.py
@@ -97,13 +97,6 @@ class CheckCosineSimilarity(HighlightCheck):
                                    "compared to the input/parameters's")
 
 
-class CheckEuclideanDistance(HighlightCheck):
-    """检查欧式距离"""
-
-    def apply(self, info, color_columns, dump_mode):
-        pass
-
-
 class CheckMaxRelativeDiff(HighlightCheck):
     """检查最大相对差异"""
 
@@ -157,8 +150,7 @@ class HighlightRules:
     compare_rules = {
         "check_order_magnitude": CheckOrderMagnitude(),
         "check_one_thousand_error": CheckOneThousandErrorRatio(),
-        "check_cosine_similarity": CheckCosineSimilarity(),
-        "check_euclidean_distance": CheckEuclideanDistance()
+        "check_cosine_similarity": CheckCosineSimilarity()
     }
     # 统计量数据检查规则
     summary_compare_rules = {
-- 
Gitee


From b3278e3e41bfd7a38b14e27f1511948979076d47 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Tue, 25 Feb 2025 11:48:50 +0800
Subject: [PATCH 010/145] compare add euclidean distance

---
 .../msprobe/core/compare/npy_compare.py       | 24 +++++++++----------
 1 file changed, 12 insertions(+), 12 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
index d060b4013f0..cfd0db3f1fe 100644
--- a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
@@ -70,7 +70,7 @@ def get_error_flag_and_msg(n_value, b_value, error_flag=False, error_file=None):
         error_flag = True
         return CompareConst.NONE, CompareConst.NONE, error_flag, err_msg
     if not n_value.shape:  # 判断数据是否为0维张量
-        err_msg = (f"This is type of 0-d tensor, can not calculate '{CompareConst.COSINE}', "
+        err_msg = (f"This is type of 0-d tensor, can not calculate '{CompareConst.COSINE}', {CompareConst.EUC_DIST}"
                    f"'{CompareConst.ONE_THOUSANDTH_ERR_RATIO}' and '{CompareConst.FIVE_THOUSANDTHS_ERR_RATIO}'. ")
         error_flag = False  # 0-d tensor 最大绝对误差、最大相对误差仍然支持计算，因此error_flag设置为False，不做统一处理
         return n_value, b_value, error_flag, err_msg
@@ -170,7 +170,7 @@ class TensorComparisonBasic(abc.ABC):
     """NPU和bench中npy数据的比较模板"""
 
     @abc.abstractmethod
-    def apply(self, n_value, b_value, relative_err):
+    def apply(self, n_value, b_value, relative_err, err_msg):
         raise NotImplementedError
 
 
@@ -200,9 +200,9 @@ class GetCosineSimilarity(TensorComparisonBasic):
             return round(float(result), 6)
         return result
 
-    def apply(self, n_value, b_value, relative_err):
-        if not n_value.shape:
-            return CompareConst.UNSUPPORTED, ""
+    def apply(self, n_value, b_value, relative_err, err_msg):
+        if "This is type of 0-d tensor" in n_value:
+            return CompareConst.UNSUPPORTED, err_msg
 
         with np.errstate(divide="ignore", invalid="ignore"):
             if len(n_value) == 1:
@@ -229,7 +229,7 @@ class GetCosineSimilarity(TensorComparisonBasic):
 class GetEuclideanDistance(TensorComparisonBasic):
     """计算欧式距离"""
 
-    def apply(self, n_value, b_value, relative_err):
+    def apply(self, n_value, b_value, relative_err, err_msg):
         msg = ''
 
         distance = np.linalg.norm(n_value - b_value, ord=2)
@@ -240,7 +240,7 @@ class GetEuclideanDistance(TensorComparisonBasic):
 class GetMaxAbsErr(TensorComparisonBasic):
     """计算最大绝对误差"""
 
-    def apply(self, n_value, b_value, relative_err):
+    def apply(self, n_value, b_value, relative_err, err_msg):
         temp_res = n_value - b_value
         max_value = np.max(np.abs(temp_res))
         if np.isnan(max_value):
@@ -252,7 +252,7 @@ class GetMaxAbsErr(TensorComparisonBasic):
 class GetMaxRelativeErr(TensorComparisonBasic):
     """计算最大相对误差"""
 
-    def apply(self, n_value, b_value, relative_err):
+    def apply(self, n_value, b_value, relative_err, err_msg):
         max_relative_err = np.max(np.abs(relative_err))
         if np.isnan(max_relative_err):
             msg = "Cannot compare by MaxRelativeError, the data contains nan/inf/-inf in dump data."
@@ -266,9 +266,9 @@ class GetErrRatio(TensorComparisonBasic):
     def __init__(self, threshold):
         self.threshold = threshold
 
-    def apply(self, n_value, b_value, relative_err):
-        if not n_value.shape:
-            return CompareConst.UNSUPPORTED, ""
+    def apply(self, n_value, b_value, relative_err, err_msg):
+        if "This is type of 0-d tensor" in n_value:
+            return CompareConst.UNSUPPORTED, err_msg
 
         if not np.size(relative_err):
             return CompareConst.NAN, ""
@@ -312,7 +312,7 @@ def compare_ops_apply(n_value, b_value, error_flag, err_msg):
     n_value, b_value = reshape_value(n_value, b_value)
 
     for op in CompareOps.compare_ops.values():
-        result, msg = op.apply(n_value, b_value, relative_err)
+        result, msg = op.apply(n_value, b_value, relative_err, err_msg)
         result_list.append(result)
         err_msg += msg
     return result_list, err_msg
-- 
Gitee


From fc665daa328e8ef29655485a63a53632b64994d0 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Tue, 25 Feb 2025 14:23:44 +0800
Subject: [PATCH 011/145] compare add euclidean distance

---
 debug/accuracy_tools/msprobe/core/compare/npy_compare.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
index cfd0db3f1fe..6728b8b35f4 100644
--- a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
@@ -201,7 +201,7 @@ class GetCosineSimilarity(TensorComparisonBasic):
         return result
 
     def apply(self, n_value, b_value, relative_err, err_msg):
-        if "This is type of 0-d tensor" in n_value:
+        if "This is type of 0-d tensor" in err_msg:
             return CompareConst.UNSUPPORTED, err_msg
 
         with np.errstate(divide="ignore", invalid="ignore"):
@@ -267,7 +267,7 @@ class GetErrRatio(TensorComparisonBasic):
         self.threshold = threshold
 
     def apply(self, n_value, b_value, relative_err, err_msg):
-        if "This is type of 0-d tensor" in n_value:
+        if "This is type of 0-d tensor" in err_msg:
             return CompareConst.UNSUPPORTED, err_msg
 
         if not np.size(relative_err):
-- 
Gitee


From 23c9871ea5c66595fdcb81c9e228416bb7a3d12b Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Tue, 25 Feb 2025 14:25:27 +0800
Subject: [PATCH 012/145] compare add euclidean distance

---
 debug/accuracy_tools/msprobe/core/compare/npy_compare.py | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
index 6728b8b35f4..68a2e9bea28 100644
--- a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
@@ -230,11 +230,12 @@ class GetEuclideanDistance(TensorComparisonBasic):
     """计算欧式距离"""
 
     def apply(self, n_value, b_value, relative_err, err_msg):
-        msg = ''
+        if "This is type of 0-d tensor" in err_msg:
+            return CompareConst.UNSUPPORTED, err_msg
 
         distance = np.linalg.norm(n_value - b_value, ord=2)
 
-        return distance, msg
+        return distance, ""
 
 
 class GetMaxAbsErr(TensorComparisonBasic):
-- 
Gitee


From f6ec2cddfbdfa8b0c9cb61791c2b0a430e9e5457 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Tue, 25 Feb 2025 15:13:56 +0800
Subject: [PATCH 013/145] compare add euclidean distance

---
 .../msprobe/core/compare/npy_compare.py       |  2 +-
 .../compare/test_acc_compare_npy_compare.py   | 69 +++++++++++++------
 2 files changed, 50 insertions(+), 21 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
index 68a2e9bea28..4103d361fec 100644
--- a/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/npy_compare.py
@@ -70,7 +70,7 @@ def get_error_flag_and_msg(n_value, b_value, error_flag=False, error_file=None):
         error_flag = True
         return CompareConst.NONE, CompareConst.NONE, error_flag, err_msg
     if not n_value.shape:  # 判断数据是否为0维张量
-        err_msg = (f"This is type of 0-d tensor, can not calculate '{CompareConst.COSINE}', {CompareConst.EUC_DIST}"
+        err_msg = (f"This is type of 0-d tensor, can not calculate '{CompareConst.COSINE}', '{CompareConst.EUC_DIST}', "
                    f"'{CompareConst.ONE_THOUSANDTH_ERR_RATIO}' and '{CompareConst.FIVE_THOUSANDTHS_ERR_RATIO}'. ")
         error_flag = False  # 0-d tensor 最大绝对误差、最大相对误差仍然支持计算，因此error_flag设置为False，不做统一处理
         return n_value, b_value, error_flag, err_msg
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
index c9096694a77..da315b657c8 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_npy_compare.py
@@ -113,7 +113,7 @@ class TestUtilsMethods(unittest.TestCase):
         n_value, b_value, error_flag, err_msg = get_error_flag_and_msg(n_value, b_value, error_flag=error_flag)
 
         self.assertFalse(error_flag)
-        self.assertEqual(err_msg, "This is type of 0-d tensor, can not calculate 'Cosine', "
+        self.assertEqual(err_msg, "This is type of 0-d tensor, can not calculate 'Cosine', 'EucDist', "
                                   "'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'. ")
 
     def test_get_error_flag_and_msg_shape_unmatch(self):
@@ -239,15 +239,17 @@ class TestUtilsMethods(unittest.TestCase):
         b_value_1 = np.array(1)
         relative_err = get_relative_err(n_value_1, b_value_1)
         n_value_1, b_value_1 = reshape_value(n_value_1, b_value_1)
-        result, err_msg = op.apply(n_value_1, b_value_1, relative_err)
+        err_msg = "This is type of 0-d tensor, can not calculate 'Cosine', 'EucDist', 'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'. "
+        result, err_msg = op.apply(n_value_1, b_value_1, relative_err, err_msg)
         self.assertEqual(result, CompareConst.UNSUPPORTED)
-        self.assertEqual(err_msg, "")
+        self.assertEqual(err_msg, "This is type of 0-d tensor, can not calculate 'Cosine', 'EucDist', 'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'. ")
 
         n_value_2 = np.array([1, 2])
         b_value_2 = np.array([1, 2])
         relative_err = get_relative_err(n_value_2, b_value_2)
         n_value_2, b_value_2 = reshape_value(n_value_2, b_value_2)
-        result, err_msg = op.apply(n_value_2, b_value_2, relative_err)
+        err_msg = ""
+        result, err_msg = op.apply(n_value_2, b_value_2, relative_err, err_msg)
         self.assertEqual(result, 1.0)
         self.assertEqual(err_msg, "")
 
@@ -255,7 +257,8 @@ class TestUtilsMethods(unittest.TestCase):
         b_value_3 = np.array([0, 0])
         relative_err = get_relative_err(n_value_3, b_value_3)
         n_value_3, b_value_3 = reshape_value(n_value_3, b_value_3)
-        result, err_msg = op.apply(n_value_3, b_value_3, relative_err)
+        err_msg = ""
+        result, err_msg = op.apply(n_value_3, b_value_3, relative_err, err_msg)
         self.assertEqual(result, 1.0)
         self.assertEqual(err_msg, "")
 
@@ -263,7 +266,8 @@ class TestUtilsMethods(unittest.TestCase):
         b_value_4 = np.array([1, 2])
         relative_err = get_relative_err(n_value_4, b_value_4)
         n_value_4, b_value_4 = reshape_value(n_value_4, b_value_4)
-        result, err_msg = op.apply(n_value_4, b_value_4, relative_err)
+        err_msg = ""
+        result, err_msg = op.apply(n_value_4, b_value_4, relative_err, err_msg)
         self.assertEqual(result, CompareConst.NAN)
         self.assertEqual(err_msg, 'Cannot compare by Cosine Similarity, All the data is Zero in npu dump data.')
 
@@ -271,7 +275,8 @@ class TestUtilsMethods(unittest.TestCase):
         b_value_5 = np.array([0, 0])
         relative_err = get_relative_err(n_value_5, b_value_5)
         n_value_5, b_value_5 = reshape_value(n_value_5, b_value_5)
-        result, err_msg = op.apply(n_value_5, b_value_5, relative_err)
+        err_msg = ""
+        result, err_msg = op.apply(n_value_5, b_value_5, relative_err, err_msg)
         self.assertEqual(result, CompareConst.NAN)
         self.assertEqual(err_msg, 'Cannot compare by Cosine Similarity, All the data is Zero in Bench dump data.')
 
@@ -282,7 +287,9 @@ class TestUtilsMethods(unittest.TestCase):
         b_value_1 = np.array([1])
         relative_err = get_relative_err(n_value_1, b_value_1)
         n_value_1, b_value_1 = reshape_value(n_value_1, b_value_1)
-        result, err_msg = op.apply(n_value_1, b_value_1, relative_err)
+        err_msg = ""
+
+        result, err_msg = op.apply(n_value_1, b_value_1, relative_err, err_msg)
         self.assertEqual(result, CompareConst.UNSUPPORTED)
         self.assertEqual(err_msg, "This is a 1-d tensor of length 1.")
 
@@ -294,8 +301,9 @@ class TestUtilsMethods(unittest.TestCase):
         b_value = np.array([1, 1])
         relative_err = get_relative_err(n_value, b_value)
         n_value, b_value = reshape_value(n_value, b_value)
+        err_msg = ""
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, CompareConst.NAN)
         self.assertEqual(err_msg, "Cannot compare by Cosine Similarity, the dump data has NaN.")
@@ -319,8 +327,9 @@ class TestUtilsMethods(unittest.TestCase):
         b_value = np.array([0, 0])
         relative_err = get_relative_err(n_value, b_value)
         n_value, b_value = reshape_value(n_value, b_value)
+        err_msg = ""
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, 2.0)
         self.assertEqual(err_msg, "")
@@ -333,8 +342,9 @@ class TestUtilsMethods(unittest.TestCase):
         b_value = np.array([1, 1])
         relative_err = get_relative_err(n_value, b_value)
         n_value, b_value = reshape_value(n_value, b_value)
+        err_msg = ""
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, CompareConst.NAN)
         self.assertEqual(err_msg, "Cannot compare by MaxAbsError, the data contains nan/inf/-inf in dump data.")
@@ -347,8 +357,9 @@ class TestUtilsMethods(unittest.TestCase):
         b_value = np.array([1, 1])
         relative_err = get_relative_err(n_value, b_value)
         n_value, b_value = reshape_value(n_value, b_value)
+        err_msg = ""
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, 1.0)
         self.assertEqual(err_msg, "")
@@ -361,8 +372,9 @@ class TestUtilsMethods(unittest.TestCase):
         b_value = np.array([1, 1])
         relative_err = get_relative_err(n_value, b_value)
         n_value, b_value = reshape_value(n_value, b_value)
+        err_msg = ""
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, CompareConst.NAN)
         self.assertEqual(err_msg, "Cannot compare by MaxRelativeError, the data contains nan/inf/-inf in dump data.")
@@ -375,8 +387,9 @@ class TestUtilsMethods(unittest.TestCase):
         b_value = np.array([1, 1])
         relative_err = get_relative_err(n_value, b_value)
         n_value, b_value = reshape_value(n_value, b_value)
+        err_msg = ""
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, 0.5)
         self.assertEqual(err_msg, "")
@@ -387,11 +400,12 @@ class TestUtilsMethods(unittest.TestCase):
         n_value = np.array(1)   # 标量
         b_value = np.array(1)
         relative_err = np.array(0)
+        err_msg = "This is type of 0-d tensor, can not calculate 'Cosine', 'EucDist', 'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'. "
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, CompareConst.UNSUPPORTED)
-        self.assertEqual(err_msg, "")
+        self.assertEqual(err_msg, "This is type of 0-d tensor, can not calculate 'Cosine', 'EucDist', 'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'. ")
 
     def test_GetThousandErrRatio_not_size(self):
         op = GetErrRatio(CompareConst.THOUSAND_RATIO_THRESHOLD)
@@ -399,8 +413,9 @@ class TestUtilsMethods(unittest.TestCase):
         n_value = np.array([1, 2])
         b_value = np.array([1, 2])
         relative_err = np.array([])     # 空数组
+        err_msg = ""
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, CompareConst.NAN)
         self.assertEqual(err_msg, "")
@@ -412,8 +427,9 @@ class TestUtilsMethods(unittest.TestCase):
         b_value = np.array([1, 1])
         relative_err = get_relative_err(n_value, b_value)
         n_value, b_value = reshape_value(n_value, b_value)
+        err_msg = ""
 
-        result, err_msg = op.apply(n_value, b_value, relative_err)
+        result, err_msg = op.apply(n_value, b_value, relative_err, err_msg)
 
         self.assertEqual(result, 0.5)
         self.assertEqual(err_msg, "")
@@ -480,12 +496,25 @@ class TestGetEuclideanDistance(unittest.TestCase):
     def setUp(self):
         self.euc_distance = GetEuclideanDistance()
 
-    def test_euclidean_distance(self):
+    def test_euclidean_distance_normal(self):
         # 测试计算两个张量之间的欧式距离
         n_value = np.array([1, 2, 3])
         b_value = np.array([4, 5, 6])
+        relative_err = None
+        err_msg = ""
 
-        result, msg = self.euc_distance.apply(n_value, b_value, None)
+        result, msg = self.euc_distance.apply(n_value, b_value, relative_err, err_msg)
         expected_distance = np.linalg.norm(n_value - b_value)
         self.assertEqual(result, expected_distance)
         self.assertEqual(msg, '')
+
+    def test_euclidean_distance_0d_tensor(self):
+        # 测试计算两个张量之间的欧式距离
+        n_value = np.array(1)
+        b_value = np.array(1)
+        relative_err = None
+        err_msg = "This is type of 0-d tensor, can not calculate 'Cosine', 'EucDist', 'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'. "
+
+        result, msg = self.euc_distance.apply(n_value, b_value, relative_err, err_msg)
+        self.assertEqual(result, CompareConst.UNSUPPORTED)
+        self.assertEqual(msg, "This is type of 0-d tensor, can not calculate 'Cosine', 'EucDist', 'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'. ")
-- 
Gitee


From 1da6f695dbc2e8560f9b2c7cef4254021c532b97 Mon Sep 17 00:00:00 2001
From: xubanxia <904691018@qq.com>
Date: Tue, 25 Feb 2025 19:29:01 +0800
Subject: [PATCH 014/145] =?UTF-8?q?=E6=94=AF=E6=8C=81advisor=E5=AF=B9AI=20?=
 =?UTF-8?q?CORE=E7=AE=97=E5=AD=90=E6=80=A7=E8=83=BD=E5=88=86=E6=9E=90=20bu?=
 =?UTF-8?q?gFix=EF=BC=9Asheet=E9=A1=B5=E5=90=8D=E7=A7=B0=E8=B6=85=E9=95=BF?=
 =?UTF-8?q?=EF=BC=8C=E4=BF=AE=E6=94=B9=E4=B8=BA=E7=AE=80=E5=86=99?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprof_analyze/advisor/rules/en/aicore_performance.yaml | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml b/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
index 68ab59f1693..73c2e1bafd4 100644
--- a/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
+++ b/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
@@ -1,6 +1,6 @@
-cube_problem: "Cube operator performance analysis"
-fa_problem: "FA operator performance analysis"
-vector_problem: "Vector operator performance analysis"
+cube_problem: "Cube Operator Perf Analysis"
+fa_problem: "FA Operator Perf Analysis"
+vector_problem: "Vector Operator Perf Analysis"
 description: "Provide some reference bottlenecks for the AICORE operator"
 bound_description: "set of bound operators"
 optimization_description: "set of performance optimization operators"
-- 
Gitee


From 7ffae45b97d57a1896bed853d8f761c49ec910e0 Mon Sep 17 00:00:00 2001
From: kiritorl <ruxinglong@huawei.com>
Date: Tue, 25 Feb 2025 22:47:07 +0800
Subject: [PATCH 015/145] fix some description

---
 .../ai_core_performance/ai_core_performance_checker.py          | 2 +-
 .../advisor/display/html/templates/ai_core_performance.html     | 2 +-
 .../msprof_analyze/advisor/rules/en/aicore_performance.yaml     | 2 +-
 3 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py b/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
index fa62cd6f895..d4a0482e0cd 100644
--- a/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
+++ b/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
@@ -440,7 +440,7 @@ class AICorePerformanceChecker:
         result.add(OptimizeRecord(optimization_item))
         headers = [
             "Type",
-            "Description and Suggestion",
+            "Description",
         ]
         result.add_detail(problem_map[op_type], headers=headers)
         for opti_issue in self.result[op_type][0]:
diff --git a/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html b/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
index 77e5e0cb552..743953ff351 100644
--- a/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
+++ b/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
@@ -11,7 +11,7 @@
          bound_refer=' bound type: ', affinity_refer=' type of disaffinity: ', title_desc=' Operator related analysis, referenced below: ') %}
         {% endif %}
         {% if format_result.cube[0]|length + format_result.cube[1]|length + format_result.cube[2]|length > 0 %}
-        <a style="font-weight: bold" id="timeline_api_instruction">MatMul{{ title_ns.title_desc }}</a>
+        <a style="font-weight: bold" id="timeline_api_instruction">Cube{{ title_ns.title_desc }}</a>
         <br>
         <table>
             <tr>
diff --git a/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml b/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
index 73c2e1bafd4..5f9f6386905 100644
--- a/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
+++ b/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
@@ -1,7 +1,7 @@
 cube_problem: "Cube Operator Perf Analysis"
 fa_problem: "FA Operator Perf Analysis"
 vector_problem: "Vector Operator Perf Analysis"
-description: "Provide some reference bottlenecks for the AICORE operator"
+description: "Provide some reference bottlenecks for the AICORE operators"
 bound_description: "set of bound operators"
 optimization_description: "set of performance optimization operators"
 affinity_description: "set of unaffine operators"
-- 
Gitee


From 1fc646f16ad906f08dab3a6d12501a004974e101 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 26 Feb 2025 10:05:25 +0800
Subject: [PATCH 016/145] compare add euclidean distance

---
 .../docs/10.accuracy_compare_PyTorch.md       | 20 ++++++++++---------
 1 file changed, 11 insertions(+), 9 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md b/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
index e98478de0e1..e1d521d4472 100644
--- a/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
+++ b/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
@@ -257,11 +257,11 @@ PyTorch 精度比对是以 CPU 或 GPU 的计算结果为标杆，通过计算
 
 统计量有 4 种：最大值（max）、最小值（min）、平均值（mean）和 L2-范数（L2 norm）。
 
-|dump 数据模式|Cosine (tensor 余弦相似度)|MaxAbsErr (tensor 最大绝对误差)|MaxRelativeErr (tensor 最大相对误差)|One Thousandth Err Ratio (tensor 相对误差小于千分之一的比例)|Five Thousandth Err Ratio (tensor 相对误差小于千分之五的比例)|NPU 和 bench 的统计量绝对误差 (max, min, mean, L2 norm) diff| NPU 和 bench 的统计量相对误差 (max, min, mean, L2 norm) RelativeErr |NPU 和 bench 的统计量 (max, min, mean, L2 norm)|NPU MD5 (NPU 数据 CRC-32 值)|BENCH MD5 (bench 数据 CRC-32 值)|Result (比对结果)|Accuracy Reached or Not (计算精度是否达标)|Err_message (错误信息提示)|NPU_Stack_Info (堆栈信息)|Data_Name (NPU 真实数据名)|
-|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
-|真实数据模式|√|√|√|√|√|||√||||√|√|√|√|
-|统计数据模式||||||√|√|√|||√||√|√||
-|MD5 模式|||||||||√|√|√|||√||
+|dump 数据模式|Cosine (tensor 余弦相似度)|EucDist (tensor 欧式距离)|MaxAbsErr (tensor 最大绝对误差)|MaxRelativeErr (tensor 最大相对误差)|One Thousandth Err Ratio (tensor 相对误差小于千分之一的比例)|Five Thousandth Err Ratio (tensor 相对误差小于千分之五的比例)|NPU 和 bench 的统计量绝对误差 (max, min, mean, L2 norm) diff| NPU 和 bench 的统计量相对误差 (max, min, mean, L2 norm) RelativeErr |NPU 和 bench 的统计量 (max, min, mean, L2 norm)|NPU MD5 (NPU 数据 CRC-32 值)|BENCH MD5 (bench 数据 CRC-32 值)|Result (比对结果)|Accuracy Reached or Not (计算精度是否达标)|Err_message (错误信息提示)|NPU_Stack_Info (堆栈信息)|Data_Name (NPU 真实数据名)|
+|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
+|真实数据模式|√|√|√|√|√|√|||√||||√|√|√|√|
+|统计数据模式|||||||√|√|√|||√||√|√||
+|MD5 模式||||||||||√|√|√|||√||
 
 上表中NPU_Stack_Info字段需要配置-s参数生成。
 
@@ -320,7 +320,7 @@ MD5 模式：
 5. "This is empty data, can not compare."：读取到的数据为空（真实数据模式）；
 6. "Shape of NPU and bench Tensor do not match. Skipped."：NPU 和 Bench 的数据结构不一致（真实数据模式）；
 7. "The Position of inf or nan in NPU and bench Tensor do not match."：NPU 和 Bench 的数据有 nan/inf（真实数据模式）；
-8. "This is type of 0-d tensor, can not calculate 'Cosine', 'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'."：NPU 为0维张量（真实数据模式）；
+8. "This is type of 0-d tensor, can not calculate 'Cosine', 'EucDist', 'One Thousandth Err Ratio' and 'Five Thousandths Err Ratio'."：NPU 为0维张量（真实数据模式）；
 9.  "Dtype of NPU and bench Tensor do not match."：NPU 和 Bench 数据的数据类型不同（真实数据模式）；
 10. ""：除以上情况的其余情况（真实数据模式、统计数据模式）。
 
@@ -330,13 +330,15 @@ MD5 模式：
 
 1. Cosine：通过计算两个向量的余弦值来判断其相似度，数值越接近于 1 说明计算出的两个张量越相似，实际可接受阈值为大于 0.99。在计算中可能会存在 nan，主要由于可能会出现其中一个向量为 0。
 
-2. MaxAbsErr：当最大绝对误差越接近 0 表示其计算的误差越小，实际可接受阈值为小于 0.001。
+2. EucDist：通过计算两个向量的欧式距离来判断其相似度，定义为多维空间中两个点之间的绝对距离。数值越接近0，张量越相似，数值越大，差异越大。
 
-3. MaxRelativeErr：当最大相对误差越接近 0 表示其计算的误差越小。
+3. MaxAbsErr：当最大绝对误差越接近 0 表示其计算的误差越小，实际可接受阈值为小于 0.001。
+
+4. MaxRelativeErr：当最大相对误差越接近 0 表示其计算的误差越小。
 
    当 dump 数据中存在 0 或 Nan 时，比对结果中最大相对误差则出现 inf 或 Nan 的情况，属于正常现象。
 
-4. One Thousandth Err Ratio（相对误差小于千分之一的元素比例）、Five Thousandths Err Ratio（相对误差小于千分之五的元素比例）精度指标：是指 NPU 的 Tensor 中的元素逐个与对应的标杆数据对比，相对误差小于千分之一、千分之五的比例占总元素个数的比例。该数据仅作为精度下降趋势的参考，并不参与计算精度是否通过的判定。
+5. One Thousandth Err Ratio（相对误差小于千分之一的元素比例）、Five Thousandths Err Ratio（相对误差小于千分之五的元素比例）精度指标：是指 NPU 的 Tensor 中的元素逐个与对应的标杆数据对比，相对误差小于千分之一、千分之五的比例占总元素个数的比例。该数据仅作为精度下降趋势的参考，并不参与计算精度是否通过的判定。
 
 ## 4 多卡比对结果提取汇总通信算子数据
 
-- 
Gitee


From 3ff76c29698072214d9a0193ac2a5ff1aeb92b6c Mon Sep 17 00:00:00 2001
From: xubanxia <904691018@qq.com>
Date: Tue, 25 Feb 2025 19:29:01 +0800
Subject: [PATCH 017/145] =?UTF-8?q?=E6=94=AF=E6=8C=81advisor=E5=AF=B9AI=20?=
 =?UTF-8?q?CORE=E7=AE=97=E5=AD=90=E6=80=A7=E8=83=BD=E5=88=86=E6=9E=90=20bu?=
 =?UTF-8?q?gFix=EF=BC=9Asheet=E9=A1=B5=E5=90=8D=E7=A7=B0=E8=B6=85=E9=95=BF?=
 =?UTF-8?q?=EF=BC=8C=E4=BF=AE=E6=94=B9=E4=B8=BA=E7=AE=80=E5=86=99=20bugFix?=
 =?UTF-8?q?=EF=BC=9Afix=20some=20description?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../ai_core_performance/ai_core_performance_checker.py    | 2 +-
 .../display/html/templates/ai_core_performance.html       | 2 +-
 .../advisor/rules/en/aicore_performance.yaml              | 8 ++++----
 3 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py b/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
index fa62cd6f895..d4a0482e0cd 100644
--- a/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
+++ b/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
@@ -440,7 +440,7 @@ class AICorePerformanceChecker:
         result.add(OptimizeRecord(optimization_item))
         headers = [
             "Type",
-            "Description and Suggestion",
+            "Description",
         ]
         result.add_detail(problem_map[op_type], headers=headers)
         for opti_issue in self.result[op_type][0]:
diff --git a/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html b/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
index 77e5e0cb552..743953ff351 100644
--- a/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
+++ b/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
@@ -11,7 +11,7 @@
          bound_refer=' bound type: ', affinity_refer=' type of disaffinity: ', title_desc=' Operator related analysis, referenced below: ') %}
         {% endif %}
         {% if format_result.cube[0]|length + format_result.cube[1]|length + format_result.cube[2]|length > 0 %}
-        <a style="font-weight: bold" id="timeline_api_instruction">MatMul{{ title_ns.title_desc }}</a>
+        <a style="font-weight: bold" id="timeline_api_instruction">Cube{{ title_ns.title_desc }}</a>
         <br>
         <table>
             <tr>
diff --git a/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml b/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
index 68ab59f1693..5f9f6386905 100644
--- a/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
+++ b/profiler/msprof_analyze/advisor/rules/en/aicore_performance.yaml
@@ -1,7 +1,7 @@
-cube_problem: "Cube operator performance analysis"
-fa_problem: "FA operator performance analysis"
-vector_problem: "Vector operator performance analysis"
-description: "Provide some reference bottlenecks for the AICORE operator"
+cube_problem: "Cube Operator Perf Analysis"
+fa_problem: "FA Operator Perf Analysis"
+vector_problem: "Vector Operator Perf Analysis"
+description: "Provide some reference bottlenecks for the AICORE operators"
 bound_description: "set of bound operators"
 optimization_description: "set of performance optimization operators"
 affinity_description: "set of unaffine operators"
-- 
Gitee


From 2d0d21c7e4507ef7e372f836b46fc1b8e32877fd Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 26 Feb 2025 11:30:10 +0800
Subject: [PATCH 018/145] framework get improve

---
 .../msprobe/core/common/utils.py              | 15 ++++----
 .../msprobe/mindspore/compare/ms_compare.py   | 15 ++++----
 .../msprobe/test/core_ut/common/test_utils.py | 38 ++++++++++++++++++-
 .../mindspore_ut/compare/test_ms_compare.py   | 18 +++++++++
 4 files changed, 69 insertions(+), 17 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/common/utils.py b/debug/accuracy_tools/msprobe/core/common/utils.py
index c06b5b64927..340fa079058 100644
--- a/debug/accuracy_tools/msprobe/core/common/utils.py
+++ b/debug/accuracy_tools/msprobe/core/common/utils.py
@@ -247,14 +247,13 @@ def md5_find(data):
 
 
 def detect_framework_by_dump_json(file_path):
-    pattern_ms = r'"type":\s*"mindspore'
-    pattern_pt = r'"type":\s*"torch'
-    with FileOpen(file_path, 'r') as file:
-        for line in file:
-            if re.search(pattern_ms, line):
-                return Const.MS_FRAMEWORK
-            if re.search(pattern_pt, line):
-                return Const.PT_FRAMEWORK
+    bench_json_data = load_json(file_path)
+    framework = bench_json_data.get("framework", None)
+    if not framework:
+        logger.error("cannot find framework in dump.json")
+        raise CompareException(CompareException.INVALID_DUMP_FILE)
+    if framework in [Const.PT_FRAMEWORK, Const.MS_FRAMEWORK]:
+        return framework
     logger.error(f"{file_path} must be based on the MindSpore or PyTorch framework.")
     raise CompareException(CompareException.INVALID_PARAM_ERROR)
 
diff --git a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
index 8509a7f38ad..e0915f8179b 100644
--- a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
+++ b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
@@ -22,10 +22,10 @@ import pandas as pd
 
 from msprobe.core.common.const import CompareConst, Const
 from msprobe.core.common.exceptions import FileCheckException
-from msprobe.core.common.file_utils import FileOpen, create_directory, load_json, load_npy, load_yaml
+from msprobe.core.common.file_utils import create_directory, load_json, load_npy, load_yaml
 from msprobe.core.common.log import logger
 from msprobe.core.common.utils import CompareException, check_compare_param, check_configuration_param, \
-    check_op_str_pattern_valid, get_dump_mode, set_dump_path
+    check_op_str_pattern_valid, get_dump_mode, set_dump_path, detect_framework_by_dump_json
 from msprobe.core.compare.acc_compare import Comparator, ModeConfig
 from msprobe.core.compare.check import dtype_mapping
 from msprobe.core.compare.layer_mapping import generate_data_mapping_by_layer_mapping
@@ -382,12 +382,11 @@ class MSComparator(Comparator):
 
 
 def check_cross_framework(bench_json_path):
-    pattern = r'"data_name":\s*"[^"]+\.pt"'
-    with FileOpen(bench_json_path, 'r') as file:
-        for line in file:
-            if re.search(pattern, line):
-                return True
-    return False
+    framework = detect_framework_by_dump_json(bench_json_path)
+    if framework == Const.PT_FRAMEWORK:
+        return True
+    else:
+        return False
 
 
 def ms_compare(input_param, output_path, **kwargs):
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
index 3472ca9018e..cd8660bf164 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
@@ -18,6 +18,7 @@ import json
 import os
 import tempfile
 from datetime import datetime, timezone
+import unittest
 from unittest import TestCase
 from unittest.mock import MagicMock, mock_open, patch
 
@@ -53,7 +54,8 @@ from msprobe.core.common.utils import (CompareException,
                                        recursion_depth_decorator,
                                        MsprobeBaseException,
                                        check_str_param,
-                                       is_json_file)
+                                       is_json_file,
+                                       detect_framework_by_dump_json)
 
 
 class TestUtils(TestCase):
@@ -488,3 +490,37 @@ class TestCheckCrtValid(TestCase):
         with self.assertRaises(RuntimeError) as context:
             check_crt_valid(self.cert_file_path)
         self.assertIn('The SSL certificate is invalid', str(context.exception))
+
+
+class TestDetectFrameworkByDumpJson(unittest.TestCase):
+
+    @patch('msprobe.common.utils.load_json')
+    def test_valid_pytorch_framework(self, mock_load_json):
+        mock_load_json.return_value = {"framework": Const.PT_FRAMEWORK}
+
+        result = detect_framework_by_dump_json("dummy_path")
+
+        self.assertEqual(result, Const.PT_FRAMEWORK)
+
+    @patch('msprobe.common.utils.load_json')
+    def test_valid_mindspore_framework(self, mock_load_json):
+        mock_load_json.return_value = {"framework": Const.MS_FRAMEWORK}
+
+        result = detect_framework_by_dump_json("dummy_path")
+
+        self.assertEqual(result, Const.MS_FRAMEWORK)
+
+    @patch('msprobe.common.utils.load_json')
+    def test_invalid_framework(self, mock_load_json):
+        # 模拟 load_json 返回一个没有 "framework" 键的字典
+        mock_load_json.return_value = {}
+
+        with self.assertRaises(CompareException):
+            detect_framework_by_dump_json("dummy_path")
+
+        # 模拟返回其他未知的框架
+        mock_load_json.return_value = {"framework": "tensorflow"}
+
+        with self.assertRaises(CompareException):
+            detect_framework_by_dump_json("dummy_path")
+
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
index b5cbff9784a..94d7d388de9 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
@@ -5,6 +5,7 @@ import random
 import shutil
 import tempfile
 import unittest
+from unittest.mock import patch
 
 import numpy as np
 import torch
@@ -351,6 +352,7 @@ class TestUtilsMethods(unittest.TestCase):
             shutil.rmtree(data_path)
 
     def test_check_cross_framework(self):
+        # dffgf
         ms_data = {
             "data_name": "Cell.model.language_model.encoder.layers.5.input_norm.FusedRMSNorm.forward.0.input.0.npy",
         }
@@ -366,6 +368,22 @@ class TestUtilsMethods(unittest.TestCase):
         self.assertFalse(check_data(ms_data))
         self.assertTrue(check_data(pt_data))
 
+    @patch('msprobe.mindspore.ms_compare.detect_framework_by_dump_json')
+    def test_check_cross_framework_valid_pytorch(self, mock_detect_framework):
+        mock_detect_framework.return_value = Const.PT_FRAMEWORK
+
+        result = check_cross_framework("dummy_path")
+
+        self.assertTrue(result)
+
+    @patch('msprobe.mindspore.ms_compare.detect_framework_by_dump_json')
+    def test_check_cross_framework_invalid_framework(self, mock_detect_framework):
+        mock_detect_framework.return_value = Const.MS_FRAMEWORK
+
+        result = check_cross_framework("dummy_path")
+
+        self.assertFalse(result)
+
     def test_comapre_process(self):
         data_path = tempfile.mkdtemp(prefix='dump_data', dir='/tmp')
         try:
-- 
Gitee


From f8ad598a1d53ee9beb01c6c0df339ff20dfa510f Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 26 Feb 2025 11:35:42 +0800
Subject: [PATCH 019/145] compare framework get improve

---
 debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
index cd8660bf164..a0078061b96 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
@@ -1,7 +1,7 @@
 #!/usr/bin/env python3
 # -*- coding: utf-8 -*-
 """
-# Copyright (C) 2024-2024. Huawei Technologies Co., Ltd. All rights reserved.
+# Copyright (C) 2024-2025. Huawei Technologies Co., Ltd. All rights reserved.
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
-- 
Gitee


From eb5c046cdd4eac8b34e5b45cf3542809d1da34c3 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 26 Feb 2025 15:01:49 +0800
Subject: [PATCH 020/145] compare framework get improve

---
 .../mindspore_ut/compare/test_ms_compare.py     | 17 -----------------
 1 file changed, 17 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
index 94d7d388de9..7611243dc04 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
@@ -351,23 +351,6 @@ class TestUtilsMethods(unittest.TestCase):
         finally:
             shutil.rmtree(data_path)
 
-    def test_check_cross_framework(self):
-        # dffgf
-        ms_data = {
-            "data_name": "Cell.model.language_model.encoder.layers.5.input_norm.FusedRMSNorm.forward.0.input.0.npy",
-        }
-        pt_data = {
-            "data_name": "Module.module.module.language_model.encoder.layers.0.input_norm.RMSNorm.forward.0.input.0.pt",
-        }
-
-        def check_data(data):
-            with tempfile.NamedTemporaryFile(mode='w+', suffix='.json', encoding='utf-8', delete=True) as temp_file:
-                json.dump(data, temp_file, ensure_ascii=False, indent=4)
-                temp_file.flush()
-                return check_cross_framework(temp_file.name)
-        self.assertFalse(check_data(ms_data))
-        self.assertTrue(check_data(pt_data))
-
     @patch('msprobe.mindspore.ms_compare.detect_framework_by_dump_json')
     def test_check_cross_framework_valid_pytorch(self, mock_detect_framework):
         mock_detect_framework.return_value = Const.PT_FRAMEWORK
-- 
Gitee


From 78b342f7131833187210d30f667f972b40d53840 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 26 Feb 2025 15:04:59 +0800
Subject: [PATCH 021/145] compare framework get improve

---
 .../msprobe/test/core_ut/common/test_utils.py               | 6 +++---
 .../msprobe/test/mindspore_ut/compare/test_ms_compare.py    | 4 ++--
 2 files changed, 5 insertions(+), 5 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
index a0078061b96..79395cfc3dd 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
@@ -494,7 +494,7 @@ class TestCheckCrtValid(TestCase):
 
 class TestDetectFrameworkByDumpJson(unittest.TestCase):
 
-    @patch('msprobe.common.utils.load_json')
+    @patch('msprobe.core.common.utils.load_json')
     def test_valid_pytorch_framework(self, mock_load_json):
         mock_load_json.return_value = {"framework": Const.PT_FRAMEWORK}
 
@@ -502,7 +502,7 @@ class TestDetectFrameworkByDumpJson(unittest.TestCase):
 
         self.assertEqual(result, Const.PT_FRAMEWORK)
 
-    @patch('msprobe.common.utils.load_json')
+    @patch('msprobe.core.common.utils.load_json')
     def test_valid_mindspore_framework(self, mock_load_json):
         mock_load_json.return_value = {"framework": Const.MS_FRAMEWORK}
 
@@ -510,7 +510,7 @@ class TestDetectFrameworkByDumpJson(unittest.TestCase):
 
         self.assertEqual(result, Const.MS_FRAMEWORK)
 
-    @patch('msprobe.common.utils.load_json')
+    @patch('msprobe.core.common.utils.load_json')
     def test_invalid_framework(self, mock_load_json):
         # 模拟 load_json 返回一个没有 "framework" 键的字典
         mock_load_json.return_value = {}
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
index 7611243dc04..035fe0c53a4 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
@@ -351,7 +351,7 @@ class TestUtilsMethods(unittest.TestCase):
         finally:
             shutil.rmtree(data_path)
 
-    @patch('msprobe.mindspore.ms_compare.detect_framework_by_dump_json')
+    @patch('msprobe.mindspore.compare.ms_compare.detect_framework_by_dump_json')
     def test_check_cross_framework_valid_pytorch(self, mock_detect_framework):
         mock_detect_framework.return_value = Const.PT_FRAMEWORK
 
@@ -359,7 +359,7 @@ class TestUtilsMethods(unittest.TestCase):
 
         self.assertTrue(result)
 
-    @patch('msprobe.mindspore.ms_compare.detect_framework_by_dump_json')
+    @patch('msprobe.mindspore.compare.ms_compare.detect_framework_by_dump_json')
     def test_check_cross_framework_invalid_framework(self, mock_detect_framework):
         mock_detect_framework.return_value = Const.MS_FRAMEWORK
 
-- 
Gitee


From 0cc86b0ee1990be1670df8d274779a3c6f3857dd Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 26 Feb 2025 15:57:46 +0800
Subject: [PATCH 022/145] compare framework get improve

---
 .../msprobe/test/resources/layer_mapping/mindspore/dump.json     | 1 +
 .../msprobe/test/resources/layer_mapping/pytorch/dump.json       | 1 +
 2 files changed, 2 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/test/resources/layer_mapping/mindspore/dump.json b/debug/accuracy_tools/msprobe/test/resources/layer_mapping/mindspore/dump.json
index b55f9e0699f..153d84e7d11 100644
--- a/debug/accuracy_tools/msprobe/test/resources/layer_mapping/mindspore/dump.json
+++ b/debug/accuracy_tools/msprobe/test/resources/layer_mapping/mindspore/dump.json
@@ -1,6 +1,7 @@
 {
   "task": "statistics",
   "level": "mix",
+  "framework": "mindspore",
   "dump_data_dir": null,
   "data": {
     "Cell.network_with_loss.module.language_model.embedding.word_embeddings.VocabParallelEmbedding.forward.0": {
diff --git a/debug/accuracy_tools/msprobe/test/resources/layer_mapping/pytorch/dump.json b/debug/accuracy_tools/msprobe/test/resources/layer_mapping/pytorch/dump.json
index d7dd1c0c38e..02239176a9d 100644
--- a/debug/accuracy_tools/msprobe/test/resources/layer_mapping/pytorch/dump.json
+++ b/debug/accuracy_tools/msprobe/test/resources/layer_mapping/pytorch/dump.json
@@ -1,6 +1,7 @@
 {
   "task": "statistics",
   "level": "mix",
+  "framework": "pytorch",
   "dump_data_dir": null,
   "data": {
     "Module.module.module.language_model.embedding.word_embeddings.VocabParallelEmbedding.forward.0": {
-- 
Gitee


From 73c4b0d119598d4eba6f6a5fa37a5ad4d24838f8 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 26 Feb 2025 16:18:37 +0800
Subject: [PATCH 023/145] compare framework get improve

---
 .../test/mindspore_ut/compare/dump_file/mindspore_data/dump.json | 1 +
 .../test/mindspore_ut/compare/dump_file/pytorch_data/dump.json   | 1 +
 2 files changed, 2 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/dump_file/mindspore_data/dump.json b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/dump_file/mindspore_data/dump.json
index 5b954f6d644..48800c0455c 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/dump_file/mindspore_data/dump.json
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/dump_file/mindspore_data/dump.json
@@ -1,6 +1,7 @@
 {
     "task": "statistics",
     "level": "mix",
+    "framework": "mindspore",
     "dump_data_dir": null,
     "data": {
         "Tensor.__add__.0.forward": {
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/dump_file/pytorch_data/dump.json b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/dump_file/pytorch_data/dump.json
index 150cbd43b16..b2704185ff1 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/dump_file/pytorch_data/dump.json
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/dump_file/pytorch_data/dump.json
@@ -1,6 +1,7 @@
 {
     "task": "statistics",
     "level": "mix",
+    "framework": "pytorch",
     "dump_data_dir": null,
     "data": {
         "Tensor.__add__.0.forward": {
-- 
Gitee


From a7137d267ad81c72a35fea1f475290038253f9ba Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Wed, 26 Feb 2025 16:26:49 +0800
Subject: [PATCH 024/145] bug_fix_for_matrix_rank

---
 .../cluster_analyse/analysis/comm_matrix_analysis.py            | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
index a87803438ae..2ad5797cc92 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
@@ -100,7 +100,6 @@ class CommMatrixAnalysis(BaseAnalysis):
                 tmp_link[f"{src_rank}-{dst_rank}"] = link_dict
             return tmp_link
 
-        project_local_global_rank_map = dict()
         default_value = {
             Constant.TRANSPORT_TYPE: '',
             Constant.TRANSIT_TIME_MS: 0,
@@ -109,6 +108,7 @@ class CommMatrixAnalysis(BaseAnalysis):
         }
         for op_name, op_dict in step_dict.items():
             link_info = defaultdict(lambda: copy.deepcopy(default_value))
+            project_local_global_rank_map = dict()
             for rank_id, rank_dict in op_dict.items():
                 process_link_key(rank_id, rank_dict)
             step_dict[op_name] = convert_local_to_global_rank()
-- 
Gitee


From c9ec95828d6d8d285c82f506d74ba8c6460a6741 Mon Sep 17 00:00:00 2001
From: wangnan39 <wangnan39@huawei.com>
Date: Wed, 26 Feb 2025 14:56:35 +0800
Subject: [PATCH 025/145] support overflow set max num

---
 .../msprobe/ccsrc/base/DebuggerConfig.hpp     |  2 +-
 .../msprobe/ccsrc/core/AclDumper.cpp          | 30 +++++++++++++++++++
 .../msprobe/ccsrc/core/AclDumper.hpp          |  6 ++++
 3 files changed, 37 insertions(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/ccsrc/base/DebuggerConfig.hpp b/debug/accuracy_tools/msprobe/ccsrc/base/DebuggerConfig.hpp
index 15ea9e6fda4..d56191443f8 100644
--- a/debug/accuracy_tools/msprobe/ccsrc/base/DebuggerConfig.hpp
+++ b/debug/accuracy_tools/msprobe/ccsrc/base/DebuggerConfig.hpp
@@ -199,7 +199,7 @@ public:
     OverflowCheckCfg() = default;
     ~OverflowCheckCfg() = default;
 
-    uint32_t overflowNums{1};
+    int32_t overflowNums{1};
     DebuggerOpCheckLevel checkMode{DebuggerOpCheckLevel::CHECK_LEVEL_ALL};
 
 private:
diff --git a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp
index 80769d7fc5f..ec6e59dafd7 100644
--- a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp
+++ b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp
@@ -151,6 +151,29 @@ bool AclDumper::IsCfgEnableAclDumper()
             ELE_IN_VECTOR(tasks, DebuggerTaskType::TASK_OVERFLOW_CHECK));
 }
 
+bool AclDumper::IsOverflowCompleted()
+{
+    if (overflowNums != -1 && realOverflowNums > overflowNums) {
+        return true;
+    }
+    return false;
+}
+
+void AclDumper::CountOverflowNumbers(const acldumpChunk* chunk)
+{
+    if (IsOverflowCompleted() || !isOverflowDump || !chunk->isLastChunk) {
+        return;
+    }
+    const std::string fileName = chunk->fileName;
+    auto separator = fileName.rfind("/");
+    auto fileBaseName = fileName.substr(separator + 1);
+    if (fileBaseName.rfind("Opdebug.Node_OpDebug.") == 0) {
+        // count according to the first file: Node_OpDebug
+        realOverflowNums++;
+    }
+    return;
+}
+
 std::string AclDumper::GetDumpPath(uint32_t curStep) const
 {
     if (!initialized || foreDumpPath.empty()) {
@@ -357,6 +380,11 @@ DebuggerErrno AclDumper::Initialize()
 void AclDumper::OnAclDumpCallBack(const acldumpChunk* chunk, int32_t len)
 {
     DEBUG_FUNC_TRACE();
+    CountOverflowNumbers(chunk);
+    if (IsOverflowCompleted()) {
+        return;
+    }
+
     std::string dumpPath = FileUtils::GetAbsPath(chunk->fileName);
     auto it = dataProcessors.find(dumpPath);
     if (it == dataProcessors.end()) {
@@ -424,6 +452,8 @@ void AclDumper::SetDump(uint32_t rank, uint32_t curStep, ExtArgs& args)
         ret = AclDumpGenStatJson(statisticsCfg, rank, curStep, kernels);
     } else if (overflowCheckCfg != nullptr) {
         ret = AclDumpGenOverflowJson(overflowCheckCfg, rank, curStep);
+        overflowNums = overflowCheckCfg->overflowNums;
+        isOverflowDump = true;
     }
 
     if (ret != DebuggerErrno::OK) {
diff --git a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.hpp b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.hpp
index dcfad5fafca..6985df65e16 100644
--- a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.hpp
+++ b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.hpp
@@ -58,11 +58,17 @@ private:
                                      uint32_t curStep, const char** kernels);
     DebuggerErrno AclDumpGenOverflowJson(std::shared_ptr<const OverflowCheckCfg> overflowCfg, uint32_t rank,
                                          uint32_t curStep);
+    void CountOverflowNumbers(const acldumpChunk* chunk);
+    bool IsOverflowCompleted();
+
     bool initialized{false};
     bool aclDumpHasSet{false};
     std::string foreDumpPath;
     std::vector<DebuggerSummaryOption> hostAnalysisOpt;
     std::map<std::string, std::shared_ptr<AclDumpDataProcessor>> dataProcessors;
+    bool isOverflowDump{false};
+    int32_t overflowNums{1};
+    int32_t realOverflowNums{0};
 };
 
 void KernelInitDump();
-- 
Gitee


From c857b5c0ee82bb3c3656b05b3bcac5786d70935c Mon Sep 17 00:00:00 2001
From: lcw <lichangwei4@huawei.com>
Date: Tue, 25 Feb 2025 19:18:33 +0800
Subject: [PATCH 026/145] =?UTF-8?q?=E3=80=90Bugfix=E3=80=91=E8=B5=84?=
 =?UTF-8?q?=E6=96=99=E4=BF=AE=E6=94=B9=EF=BC=8C=E9=99=8D=E4=BD=8E=E6=BA=A2?=
 =?UTF-8?q?=E5=87=BA=E6=A3=80=E6=B5=8B=E5=8A=9F=E8=83=BD=E7=9A=84=E4=BC=98?=
 =?UTF-8?q?=E5=85=88=E7=BA=A7?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 debug/accuracy_tools/msprobe/README.md | 38 +++++++++++++-------------
 1 file changed, 19 insertions(+), 19 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/README.md b/debug/accuracy_tools/msprobe/README.md
index 0e68d1f8d9b..e31490f01e9 100644
--- a/debug/accuracy_tools/msprobe/README.md
+++ b/debug/accuracy_tools/msprobe/README.md
@@ -83,21 +83,21 @@ PyTorch 场景的[离线预检](./docs/07.accuracy_checker_PyTorch.md)和[在线
 
 MindSpore 动态图场景的[离线预检](./docs/09.accuracy_checker_MindSpore.md)
 
-### 3 精度比对
+### 3 分级可视化构图比对
 
-该功能进行 PyTorch 整网 API 粒度的数据 dump、精度比对，进而定位训练场景下的精度问题。
+该功能将msprobe工具dump的精度数据进行解析，还原模型图结构，实现模型各个层级的精度数据比对，方便用户理解模型结构、分析精度问题。
 
-[PyTorch 场景的精度比对](./docs/10.accuracy_compare_PyTorch.md)
+[PyTorch 场景的分级可视化构图比对](./docs/21.visualization_PyTorch.md)
 
-[MindSpore 场景的精度比对](./docs/11.accuracy_compare_MindSpore.md)
+[MindSpore 场景的分级可视化构图比对](./docs/22.visualization_MindSpore.md)
 
-### 4 溢出检测与解析
+### 4 精度比对
 
-溢出检测与解析是在执行精度数据 dump 时，判断是否存在输入正常但输出存在溢出的 API，从而判断是否为正常溢出。对应 config.json 中的 overflow_check。
+该功能进行 PyTorch 整网 API 粒度的数据 dump、精度比对，进而定位训练场景下的精度问题。
 
-[PyTorch 场景的溢出检测与解析](./docs/12.overflow_check_PyTorch.md)
+[PyTorch 场景的精度比对](./docs/10.accuracy_compare_PyTorch.md)
 
-[MindSpore 场景的溢出检测与解析](./docs/13.overflow_check_MindSpore.md)
+[MindSpore 场景的精度比对](./docs/11.accuracy_compare_MindSpore.md)
 
 ### 5 数据解析
 
@@ -129,27 +129,27 @@ MindSpore 动态图场景的[离线预检](./docs/09.accuracy_checker_MindSpore.
 
 [兼容 PyTorch 和 MindSpore 框架的训练状态监控](./docs/19.monitor.md)
 
-### 10 分级可视化构图比对
-
-该功能将msprobe工具dump的精度数据进行解析，还原模型图结构，实现模型各个层级的精度数据比对，方便用户理解模型结构、分析精度问题。
-
-[PyTorch 场景的分级可视化构图比对](./docs/21.visualization_PyTorch.md)
-
-[MindSpore 场景的分级可视化构图比对](./docs/22.visualization_MindSpore.md)
-
-
-### 11 单算子API自动生成脚本
+### 10 单算子API自动生成脚本
 
 该功能将msprobe工具dump的精度数据进行解析，自动生成单API脚本，用于复现整网中出现的算子问题，降低用户复现问题的成本，供开发分析算子问题。
 
 [PyTorch 单算子API自动生成脚本](./docs/23.generate_operator_PyTorch.md)
 
-### 12 数码关联
+### 11 数码关联
 
 该功能只支持 MindSpore 静态图场景，用于将IR图与dump数据进行关联，获取dump数据和代码调用栈的关联关系。
 
 [MindSpore 场景的数码关联](./docs/24.code_mapping_Mindspore.md)
 
+### 12 溢出检测与解析
+
+溢出检测与解析是在执行精度数据 dump 时，判断是否存在输入正常但输出存在溢出的 API，从而判断是否为正常溢出。对应 config.json 中的 overflow_check。 
+推荐直接使用[数据采集](#1-数据采集)功能采集统计量信息检测溢出问题。
+
+[PyTorch 场景的溢出检测与解析](./docs/12.overflow_check_PyTorch.md)
+
+[MindSpore 场景的溢出检测与解析](./docs/13.overflow_check_MindSpore.md)
+
 ## 📑 补充材料
 
 [无标杆比对功能在 PyTorch 场景的性能基线报告](./docs/S02.report_free_benchmarking_validation_performance_baseline.md)
-- 
Gitee


From 44c10ee85be3856cb3d99971f9948746435747b4 Mon Sep 17 00:00:00 2001
From: jiangchao_j <chaojiang_j@163.com>
Date: Wed, 26 Feb 2025 17:47:06 +0800
Subject: [PATCH 027/145] fix l2norm bug in acl dump

---
 .../ccsrc/core/AclDumpDataProcessor.cpp       | 26 ++++++++++---------
 1 file changed, 14 insertions(+), 12 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumpDataProcessor.cpp b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumpDataProcessor.cpp
index 0fe3443fa1f..72178d6486a 100644
--- a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumpDataProcessor.cpp
+++ b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumpDataProcessor.cpp
@@ -56,23 +56,25 @@ constexpr const char* kStatsHeaderShape = "Shape";
 constexpr const char* kStatsHeaderMax = "Max Value";
 constexpr const char* kStatsHeaderMin = "Min Value";
 constexpr const char* kStatsHeaderAvg = "Avg Value";
-constexpr const char* kStatsHeaderL2Norm = "L2 Norm Value";
+constexpr const char* kStatsHeaderL2Norm = "l2norm";
+constexpr const char* kStatsHeaderL2NormInCsv = "L2Norm Value";
 constexpr const char* kStatsHeaderMD5 = "MD5 Value";
 constexpr const char* kStatsHeaderNan = "Nan Count";
+constexpr const char* kStatsHeaderNanInCsv = "NaN Count";
 constexpr const char* kStatsHeaderNegInf = "Negative Inf Count";
 constexpr const char* kStatsHeaderPosInf = "Positive Inf Count";
 constexpr const char* kRankId = "RANK_ID";
 constexpr const char* kDigitalNumbers = "0123456789";
 
-static const std::map<DebuggerSummaryOption, std::string> summaryOptionHeaderStrMap = {
-    {DebuggerSummaryOption::MAX, kStatsHeaderMax},
-    {DebuggerSummaryOption::MIN, kStatsHeaderMin},
-    {DebuggerSummaryOption::MEAN, kStatsHeaderAvg},
-    {DebuggerSummaryOption::L2NORM, kStatsHeaderL2Norm},
-    {DebuggerSummaryOption::NAN_CNT, kStatsHeaderNan},
-    {DebuggerSummaryOption::NEG_INF_CNT, kStatsHeaderNegInf},
-    {DebuggerSummaryOption::POS_INF_CNT, kStatsHeaderPosInf},
-    {DebuggerSummaryOption::MD5, kStatsHeaderMD5},
+static const std::map<DebuggerSummaryOption, std::pair<std::string, std::string>> summaryOptionHeaderStrMap = {
+    {DebuggerSummaryOption::MAX, {kStatsHeaderMax, kStatsHeaderMax}},
+    {DebuggerSummaryOption::MIN, {kStatsHeaderMin, kStatsHeaderMin}},
+    {DebuggerSummaryOption::MEAN, {kStatsHeaderAvg, kStatsHeaderAvg}},
+    {DebuggerSummaryOption::L2NORM, {kStatsHeaderL2Norm, kStatsHeaderL2NormInCsv}},
+    {DebuggerSummaryOption::NAN_CNT, {kStatsHeaderNan, kStatsHeaderNanInCsv}},
+    {DebuggerSummaryOption::NEG_INF_CNT, {kStatsHeaderNegInf, kStatsHeaderNegInf}},
+    {DebuggerSummaryOption::POS_INF_CNT, {kStatsHeaderPosInf, kStatsHeaderPosInf}},
+    {DebuggerSummaryOption::MD5, {kStatsHeaderMD5, kStatsHeaderMD5}},
 };
 
 class AclTensorStats {
@@ -170,7 +172,7 @@ static std::map<uint32_t, DebuggerSummaryOption> ParseTensorSummaryHeaderOrder(c
     for (uint32_t pos = 0; pos < segs.size(); ++pos) {
         const std::string& opt = segs[pos];
         for (auto it = summaryOptionHeaderStrMap.begin(); it != summaryOptionHeaderStrMap.end(); ++it) {
-            if (opt == it->second) {
+            if (opt == it->second.first) {
                 ret[pos] = it->first;
                 break;
             }
@@ -233,7 +235,7 @@ std::string AclTensorStats::GetCsvHeader() const
     ret.append("Op Type,Op Name,Task ID,Stream ID,Timestamp,Input/Output,Slot,Data Size,Data Type,Format,Shape");
     for (auto it = stats.begin(); it != stats.end(); it++) {
         ret.append(",");
-        ret.append(summaryOptionHeaderStrMap.at(it->first));
+        ret.append(summaryOptionHeaderStrMap.at(it->first).second);
     }
     ret.append("\n");
 
-- 
Gitee


From 604447ed375723ced665bce776015eb342461fcc Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Thu, 27 Feb 2025 15:11:25 +0800
Subject: [PATCH 028/145] compare add euclidean distance

---
 debug/accuracy_tools/msprobe/visualization/utils.py | 7 ++-----
 1 file changed, 2 insertions(+), 5 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/visualization/utils.py b/debug/accuracy_tools/msprobe/visualization/utils.py
index 20a881e2cdb..acfc5b59124 100644
--- a/debug/accuracy_tools/msprobe/visualization/utils.py
+++ b/debug/accuracy_tools/msprobe/visualization/utils.py
@@ -181,11 +181,8 @@ class GraphConst:
     STR_MAX_LEN = 50
     SMALL_VALUE = 1e-3
     MD5_INDEX_LIST = [CompareConst.RESULT]
-    REAL_DATA_INDEX_LIST = [CompareConst.COSINE, CompareConst.MAX_ABS_ERR, CompareConst.MAX_RELATIVE_ERR,
-                            CompareConst.ONE_THOUSANDTH_ERR_RATIO, CompareConst.FIVE_THOUSANDTHS_ERR_RATIO]
-    SUMMARY_INDEX_LIST = [CompareConst.MAX_DIFF, CompareConst.MIN_DIFF, CompareConst.MEAN_DIFF,
-                          CompareConst.NORM_DIFF, CompareConst.MAX_RELATIVE_ERR, CompareConst.MIN_RELATIVE_ERR,
-                          CompareConst.MEAN_RELATIVE_ERR, CompareConst.NORM_RELATIVE_ERR]
+    REAL_DATA_INDEX_LIST = CompareConst.ALL_COMPARE_INDEX
+    SUMMARY_INDEX_LIST = CompareConst.SUMMARY_COMPARE_INDEX
     VALUE_INDEX_LIST = [Const.MAX, Const.MIN, Const.MEAN, Const.NORM]
     APIS_BETWEEN_MODULES = 'Apis_Between_Modules'
     NULL = 'null'
-- 
Gitee


From 1ea16af86fe27e3668e6c3adb41f48c33f7ff10c Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Thu, 27 Feb 2025 16:36:38 +0800
Subject: [PATCH 029/145] compare framework get improve

---
 .../msprobe/core/common/utils.py              | 15 +++++++----
 .../msprobe/test/core_ut/common/test_utils.py | 26 ++++++++++---------
 2 files changed, 24 insertions(+), 17 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/common/utils.py b/debug/accuracy_tools/msprobe/core/common/utils.py
index 340fa079058..7ec0490168f 100644
--- a/debug/accuracy_tools/msprobe/core/common/utils.py
+++ b/debug/accuracy_tools/msprobe/core/common/utils.py
@@ -247,13 +247,18 @@ def md5_find(data):
 
 
 def detect_framework_by_dump_json(file_path):
-    bench_json_data = load_json(file_path)
-    framework = bench_json_data.get("framework", None)
-    if not framework:
-        logger.error("cannot find framework in dump.json")
-        raise CompareException(CompareException.INVALID_DUMP_FILE)
+    json_data = load_json(file_path)
+    framework = json_data.get("framework", None)
     if framework in [Const.PT_FRAMEWORK, Const.MS_FRAMEWORK]:
         return framework
+    pattern_ms = r'"type":\s*"mindspore'
+    pattern_pt = r'"type":\s*"torch'
+    with FileOpen(file_path, 'r') as file:
+        for line in file:
+            if re.search(pattern_ms, line):
+                return Const.MS_FRAMEWORK
+            if re.search(pattern_pt, line):
+                return Const.PT_FRAMEWORK
     logger.error(f"{file_path} must be based on the MindSpore or PyTorch framework.")
     raise CompareException(CompareException.INVALID_PARAM_ERROR)
 
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
index 79395cfc3dd..a8eef63f59c 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
@@ -18,6 +18,7 @@ import json
 import os
 import tempfile
 from datetime import datetime, timezone
+import re
 import unittest
 from unittest import TestCase
 from unittest.mock import MagicMock, mock_open, patch
@@ -510,17 +511,18 @@ class TestDetectFrameworkByDumpJson(unittest.TestCase):
 
         self.assertEqual(result, Const.MS_FRAMEWORK)
 
-    @patch('msprobe.core.common.utils.load_json')
-    def test_invalid_framework(self, mock_load_json):
-        # 模拟 load_json 返回一个没有 "framework" 键的字典
-        mock_load_json.return_value = {}
-
-        with self.assertRaises(CompareException):
-            detect_framework_by_dump_json("dummy_path")
+    @patch("msprobe.core.common.utils.FileOpen", new_callable=mock_open)
+    @patch("re.search")  # 模拟 re.search
+    def test_detect_framework_in_file(self, mock_search, mock_open):
+        # 测试框架是 MindSpore
+        fake_file_content = '{"type": "mindspore.float16"}\n'
+        mock_open.return_value.read.side_effect = fake_file_content
 
-        # 模拟返回其他未知的框架
-        mock_load_json.return_value = {"framework": "tensorflow"}
-
-        with self.assertRaises(CompareException):
-            detect_framework_by_dump_json("dummy_path")
+        result = detect_framework_by_dump_json("dummy_path")
+        self.assertEqual(result, Const.MS_FRAMEWORK)
 
+        # 测试框架是 PyTorch
+        fake_file_content = '{"type": "torch.float16"}\n'
+        mock_open.return_value.read.side_effect = fake_file_content
+        result = detect_framework_by_dump_json("dummy_path")
+        self.assertEqual(result, Const.PT_FRAMEWORK)
-- 
Gitee


From eeec5f495efa2c011baca0b79fae223bd25bfc91 Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Thu, 27 Feb 2025 15:37:18 +0800
Subject: [PATCH 030/145] cluster_adapt_msprof_text

---
 .../msprof_step_trace_time_adapter.py         |  56 ++++++++++
 .../analysis/step_trace_time_analysis.py      |  34 +++++-
 .../cluster_analyse/cluster_analysis.py       |  70 ++++++++----
 .../msprof_data_preprocessor.py               |  98 +++++++++++++++++
 .../base_communication_group.py               |   6 +-
 .../communication_json_group.py               |  14 ++-
 .../msprof_communication_matrix_adapter.py    | 102 ++++++++++++++++++
 .../msprof_communication_time_adapter.py      |  38 +++++++
 .../msprof_analyze/prof_common/constant.py    |   2 +
 profiler/msprof_analyze/prof_common/utils.py  |   7 ++
 10 files changed, 396 insertions(+), 31 deletions(-)
 create mode 100644 profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/communication_group/msprof_communication_matrix_adapter.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/communication_group/msprof_communication_time_adapter.py

diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py b/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
new file mode 100644
index 00000000000..5c34a0fb421
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
@@ -0,0 +1,56 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+from msprof_analyze.cluster_analyse.prof_bean.step_trace_time_bean import StepTraceTimeBean
+from msprof_analyze.prof_common.utils import convert_to_float
+from msprof_analyze.prof_common.file_manager import FileManager
+
+
+class MsprofStepTraceTimeAdapter:
+    COMPUTE = "Computing"
+    COMM_NOT_OVERLAP = "Communication(Not Overlapped)"
+    OVERLAPPED = "Overlapped"
+    COMMUNICATION = "Communication"
+    FREE = "Free"
+    STAGE = "Stage"
+    BUBBLE = "Bubble"
+    COMM_NOT_OVERLAP_EXCLUDE_RECEIVE = "Communication(Not Overlapped and Exclude Receive)"
+    PREPARE = "Preparing"
+
+    def __init__(self, file_path_list):
+        self.file_path_list = file_path_list
+        self._data = {self.COMPUTE: 0, self.COMM_NOT_OVERLAP: 0, self.OVERLAPPED: 0, self.COMMUNICATION: 0,
+                      self.FREE: 0, self.STAGE: 0, self.BUBBLE: 0, self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE: 0,
+                      self.PREPARE: 0}
+
+    def generate_step_trace_time_data(self):
+        json_str = []
+        for file_path in self.file_path_list:
+            json_str.extend(FileManager.read_json_file(file_path))
+        receive_comm = []
+        analysis_data = {}
+        for data in json_str:
+            event_name = data.get("name", "")
+            if event_name in {self.COMMUNICATION, self.COMPUTE, self.FREE, self.COMM_NOT_OVERLAP}:
+                analysis_data.setdefault(event_name, []).append(data)
+            elif event_name.startswith('hcom_receive'):
+                receive_comm.append(data)
+        for event_type, event_list in analysis_data.items():
+            self._data[event_type] = sum((convert_to_float(event.get("dur", 0)) for event in event_list))
+        self._data[self.BUBBLE] = sum((convert_to_float(event.get("dur", 0)) for event in receive_comm))
+        self._data[self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE] = self._data[self.COMM_NOT_OVERLAP] - self._data[self.BUBBLE]
+        self._data[self.OVERLAPPED] = self._data[self.COMMUNICATION] - self._data[self.COMM_NOT_OVERLAP]
+        e2e_time = self._data[self.FREE] + self._data[self.COMPUTE] + self._data[self.COMM_NOT_OVERLAP]
+        self._data[self.STAGE] = e2e_time - self._data[self.BUBBLE]
+        return [StepTraceTimeBean(self._data)]
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
index 5168f63aef5..44675137922 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
@@ -13,6 +13,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 import os
+import re
 
 from msprof_analyze.prof_common.db_manager import DBManager
 from msprof_analyze.cluster_analyse.common_func.utils import increase_shared_value
@@ -21,6 +22,7 @@ from msprof_analyze.cluster_analyse.prof_bean.step_trace_time_bean import StepTr
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.file_manager import FileManager
 from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.cluster_analyse.analysis.msprof_step_trace_time_adapter import MsprofStepTraceTimeAdapter
 
 logger = get_logger()
 
@@ -40,6 +42,7 @@ class StepTraceTimeAnalysis:
         self.step_data_list = []
         self.data_type = param.get(Constant.DATA_TYPE)
         self.distributed_args = None
+        self.is_msprof = param.get(Constant.IS_MSPROF)
 
     @staticmethod
     def get_max_data_row(data_group_list: list):
@@ -50,6 +53,26 @@ class StepTraceTimeAnalysis:
             ret.append(max(item))
         return ret
 
+    @staticmethod
+    def find_msprof_json(path):
+        msprof_pattern = r'^msprof_\d{14}\.json$'
+        msprof_slice_pattern = r'^msprof_slice_\d{1}_\d{14}\.json$'
+        msprof_dict, msprof_slice_dict = {}, {}
+        for file_name in os.listdir(path):
+            if re.match(msprof_pattern, file_name):
+                timestamp = re.search(r"\d{14}", file_name).group()
+                msprof_dict.setdefault(timestamp, []).append(os.path.join(path, file_name))
+            elif re.match(msprof_slice_pattern, file_name):
+                timestamp = re.search(r"\d{14}", file_name).group()
+                msprof_slice_dict.setdefault(timestamp, []).append(os.path.join(path, file_name))
+        if msprof_dict:
+            max_timestamp = max(msprof_dict.keys())
+            return msprof_dict.get(max_timestamp)
+        if msprof_slice_dict:
+            max_timestamp = max(msprof_slice_dict.keys())
+            return msprof_slice_dict.get(max_timestamp)
+        return []
+
     def run(self, completed_processes, lock):
         self.load_step_trace_time_data()
         self.analyze_step_time()
@@ -132,9 +155,14 @@ class StepTraceTimeAnalysis:
                 metadata = FileManager.read_json_file(metadata_path)
                 self.distributed_args = metadata.get(Constant.DISTRIBUTED_ARGS, None) if metadata else None
             if self.data_type == Constant.TEXT:
-                step_time_file = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT, Constant.STEP_TIME_CSV)
-                if os.path.exists(step_time_file):
-                    self.step_time_dict[rank_id] = FileManager.read_csv_file(step_time_file, StepTraceTimeBean)
+                if self.is_msprof:
+                    msprof_json = self.find_msprof_json(os.path.join(profiling_dir_path, "mindstudio_profiler_output"))
+                    self.step_time_dict[rank_id] = MsprofStepTraceTimeAdapter(
+                        msprof_json).generate_step_trace_time_data()
+                else:
+                    step_time_file = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT, Constant.STEP_TIME_CSV)
+                    if os.path.exists(step_time_file):
+                        self.step_time_dict[rank_id] = FileManager.read_csv_file(step_time_file, StepTraceTimeBean)
             else:
                 step_time_file = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT,
                                               Constant.DB_COMMUNICATION_ANALYZER)
diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py b/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
index d7d71908506..1e90d0cad11 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
@@ -21,6 +21,7 @@ sys.path.append(os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(
 from msprof_analyze.cluster_analyse.analysis.analysis_facade import AnalysisFacade
 from msprof_analyze.cluster_analyse.cluster_data_preprocess.pytorch_data_preprocessor import PytorchDataPreprocessor
 from msprof_analyze.cluster_analyse.cluster_data_preprocess.mindspore_data_preprocessor import MindsporeDataPreprocessor
+from msprof_analyze.cluster_analyse.cluster_data_preprocess.msprof_data_preprocessor import MsprofDataPreprocessor
 from msprof_analyze.cluster_analyse.communication_group.communication_group_generator import CommunicationGroupGenerator
 from msprof_analyze.prof_common.additional_args_manager import AdditionalArgsManager
 from msprof_analyze.prof_common.constant import Constant
@@ -47,6 +48,7 @@ ALL_FEATURE_LIST = COMM_FEATURE_LIST + get_all_recipes()
 class Interface:
     ASCEND_PT = "ascend_pt"
     ASCEND_MS = "ascend_ms"
+    PROF = "PROF_"
 
     def __init__(self, params: dict):
         self.collection_path = PathManager.get_realpath(params.get(Constant.PROFILING_PATH))
@@ -70,27 +72,38 @@ class Interface:
     def allocate_prof_data(self):
         ascend_pt_dirs = []
         ascend_ms_dirs = []
+        prof_dirs = []
         for root, dirs, _ in os.walk(self.collection_path):
             for dir_name in dirs:
                 if dir_name.endswith(self.ASCEND_PT):
                     ascend_pt_dirs.append(os.path.join(root, dir_name))
                 if dir_name.endswith(self.ASCEND_MS):
                     ascend_ms_dirs.append(os.path.join(root, dir_name))
+                if dir_name.startswith(self.PROF):
+                    prof_dirs.append(os.path.join(root, dir_name))
         pytorch_processor = PytorchDataPreprocessor(ascend_pt_dirs)
         pt_data_map = pytorch_processor.get_data_map()
-        data_type = pytorch_processor.get_data_type()
+        pt_data_type = pytorch_processor.get_data_type()
         ms_data_map = MindsporeDataPreprocessor(ascend_ms_dirs).get_data_map()
         if pt_data_map and ms_data_map:
             logger.error("Can not analyze pytorch and mindspore meantime.")
-            return []
-        return (pt_data_map, data_type) if pt_data_map else (ms_data_map, Constant.TEXT)
+            return {}
+        if pt_data_map:
+            return {Constant.DATA_MAP: pt_data_map, Constant.DATA_TYPE: pt_data_type, Constant.IS_MSPROF: False}
+        if ms_data_map:
+            return {Constant.DATA_MAP: ms_data_map, Constant.DATA_TYPE: Constant.TEXT, Constant.IS_MSPROF: False}
+        msprof_processor = MsprofDataPreprocessor(prof_dirs)
+        prof_data_map = msprof_processor.get_data_map()
+        prof_data_type = msprof_processor.get_data_type()
+        return {Constant.DATA_MAP: prof_data_map, Constant.DATA_TYPE: prof_data_type, Constant.IS_MSPROF: True}
 
     def run(self):
         PathManager.check_input_directory_path(self.collection_path)
         PathManager.check_input_directory_path(self.cluster_analysis_output_path)
         PathManager.check_path_owner_consistent([self.collection_path, self.cluster_analysis_output_path])
 
-        data_map, data_type = self.allocate_prof_data()
+        data_dict = self.allocate_prof_data()
+        data_map, data_type = data_dict.get(Constant.DATA_MAP), data_dict.get(Constant.DATA_TYPE)
         if not data_map:
             logger.warning("Can not get rank info or profiling data.")
             return
@@ -100,32 +113,43 @@ class Interface:
 
         params = {
             Constant.COLLECTION_PATH: self.collection_path,
+            Constant.ANALYSIS_MODE: self.analysis_mode,
             Constant.DATA_MAP: data_map,
             Constant.DATA_TYPE: data_type,
-            Constant.ANALYSIS_MODE: self.analysis_mode,
+            Constant.IS_MSPROF: data_dict.get(Constant.IS_MSPROF, False),
             Constant.CLUSTER_ANALYSIS_OUTPUT_PATH: self.cluster_analysis_output_path,
             Constant.DATA_SIMPLIFICATION: self.origin_params.get(Constant.DATA_SIMPLIFICATION, False),
             Constant.FORCE: self.force
         }
 
-        if self.analysis_mode in COMM_FEATURE_LIST:
-            FileManager.create_output_dir(self.cluster_analysis_output_path)
-            PathManager.check_path_writeable(self.cluster_analysis_output_path)
-            logger.info("Begin generate communication data.")
-            comm_data_dict = CommunicationGroupGenerator(params).generate()
-            logger.info("Communication data read completed.")
-            params[Constant.COMM_DATA_DICT] = comm_data_dict
-            AnalysisFacade(params).cluster_analyze()
-            logger.info("The cluster analysis result file has been generated: %s",
-                        self.cluster_analysis_output_path)
-            return
-
-        if data_type != Constant.DB:
-            logger.error("The current analysis node only supports DB as input data. Please check.")
-            return
-        FileManager.create_output_dir(self.cluster_analysis_output_path, is_overwrite=True)
-        self.origin_params.update(params)
-        AnalysisFacade(self.origin_params).recipe_analyze()
+        if data_type == Constant.TEXT:
+            if self.analysis_mode in COMM_FEATURE_LIST:
+                FileManager.create_output_dir(self.cluster_analysis_output_path)
+                PathManager.check_path_writeable(self.cluster_analysis_output_path)
+                logger.info("Begin generate communication data.")
+                comm_data_dict = CommunicationGroupGenerator(params).generate()
+                logger.info("Communication data read completed.")
+                params[Constant.COMM_DATA_DICT] = comm_data_dict
+                AnalysisFacade(params).cluster_analyze()
+                logger.info("The cluster analysis result file has been generated: %s",
+                            self.cluster_analysis_output_path)
+            else:
+                logger.error("The current analysis node only supports DB as input data. Please check.")
+        else:
+            if self.analysis_mode in COMM_FEATURE_LIST:
+                FileManager.create_output_dir(self.cluster_analysis_output_path)
+                PathManager.check_path_writeable(self.cluster_analysis_output_path)
+                logger.info("Begin generate communication data.")
+                comm_data_dict = CommunicationGroupGenerator(params).generate()
+                logger.info("Communication data read completed.")
+                params[Constant.COMM_DATA_DICT] = comm_data_dict
+                AnalysisFacade(params).cluster_analyze()
+                logger.info("The cluster analysis result file has been generated: %s",
+                            self.cluster_analysis_output_path)
+            else:
+                FileManager.create_output_dir(self.cluster_analysis_output_path, is_overwrite=True)
+                self.origin_params.update(params)
+                AnalysisFacade(self.origin_params).recipe_analyze()
 
 
 def cluster_analysis_main():
diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
new file mode 100644
index 00000000000..04953b0edfc
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
@@ -0,0 +1,98 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import os
+import re
+from collections import defaultdict
+
+from msprof_analyze.cluster_analyse.cluster_data_preprocess.data_preprocessor import DataPreprocessor
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.prof_common.file_manager import FileManager
+
+logger = get_logger()
+
+
+class MsprofDataPreprocessor(DataPreprocessor):
+    DEVICE_HEAD = "device_"
+    INFO_JSON_PATTERN = r"^info\.json\.\d{1,2}$"
+    DB_PATTERN = r"^msprof_\d{1,20}\.db$"
+
+    def __init__(self, path_list: list):
+        super().__init__(path_list)
+        self.data_type = set()
+
+    def get_data_map(self) -> dict:
+        prof_data_uid = defaultdict(list)
+        prof_data_rank = defaultdict(list)
+        for dir_name in self.path_list:
+            info_json_file = self._find_info_json_file(dir_name)
+            if not info_json_file:
+                logger.error(f"Profiling data in not completed, please check the info.json file in the path {dir_name}")
+                continue
+
+            if self._check_db_type(dir_name):
+                self.data_type.add(Constant.DB)
+            elif os.path.exists(os.path.join(dir_name, "mindstudio_profiler_output")):
+                if os.path.exists(os.path.join(dir_name, "analyze")):
+                    self.data_type.add(Constant.TEXT)
+                else:
+                    logger.error(f"The profiling data has not been fully parsed.  You can parse it by executing "
+                                 f"the following command: msprof --analyze=on --output={dir_name}")
+                    continue
+            else:
+                logger.error(f"The profiling data has not been fully parsed.  You can parse it by executing "
+                             f"the following command: msprof --export=on --output={dir_name}; "
+                             f"msprof --analyze=on --output={dir_name}")
+                continue
+            info_json = FileManager.read_json_file(info_json_file)
+            rank_id = info_json.get("rank_id")
+            if rank_id != Constant.INVALID_RETURN:
+                prof_data_rank[rank_id].append(dir_name)
+                continue
+            host_id = info_json.get("hostUid")
+            device_id = int(os.path.basename(info_json_file).split(".")[-1])
+            prof_data_uid[(host_id, device_id)].append(dir_name)
+
+        if prof_data_rank:
+            for rank_id, dir_list in prof_data_rank.items():
+                dir_list.sort(key=lambda x: x.split('_')[-2])
+                self.data_map[rank_id] = dir_list[0]
+        else:
+            ordered_keys = sorted(prof_data_uid.keys(), key=lambda x: (x[0], x[1]))
+            rank_id = 0
+            for key in ordered_keys:
+                dir_list = prof_data_uid[key]
+                dir_list.sort(key=lambda x: x.split('_')[-2])
+                self.data_map[rank_id] = dir_list[0]
+                rank_id += 1
+        return self.data_map
+
+    def get_data_type(self):
+        if len(self.data_type) == 1:
+            return self.data_type.pop()
+        return Constant.INVALID
+
+    def _find_info_json_file(self, dir_name):
+        for file_name in os.listdir(dir_name):
+            for device_file in os.listdir(os.path.join(dir_name, file_name)):
+                if re.match(self.INFO_JSON_PATTERN, device_file):
+                    return os.path.join(dir_name, file_name, device_file)
+        return None
+
+    def _check_db_type(self, dir_name):
+        for file_name in os.listdir(dir_name):
+            if re.match(self.DB_PATTERN, file_name):
+                return True
+        return False
diff --git a/profiler/msprof_analyze/cluster_analyse/communication_group/base_communication_group.py b/profiler/msprof_analyze/cluster_analyse/communication_group/base_communication_group.py
index 2c02bfdbf1b..0df5214eb49 100644
--- a/profiler/msprof_analyze/cluster_analyse/communication_group/base_communication_group.py
+++ b/profiler/msprof_analyze/cluster_analyse/communication_group/base_communication_group.py
@@ -39,6 +39,7 @@ class BaseCommunicationGroup:
         self.data_map = params.get(Constant.DATA_MAP)
         self.data_type = params.get(Constant.DATA_TYPE)
         self.analysis_mode = params.get(Constant.ANALYSIS_MODE)
+        self.is_msprof = params.get(Constant.IS_MSPROF)
         self.rank_comm_dir_dict = {}
         self.p2p_link = []
         self.collective_group_dict = defaultdict(set)
@@ -54,8 +55,9 @@ class BaseCommunicationGroup:
         comm_op_dirs = []
         for rank_id, profiling_dir_path in self.data_map.items():
             if self.data_type == Constant.TEXT:
-                comm_dir = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT, Constant.COMM_JSON)
-                matrix_dir = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT, Constant.COMM_MATRIX_JSON)
+                output_dir = "analyze" if self.is_msprof else Constant.SINGLE_OUTPUT
+                comm_dir = os.path.join(profiling_dir_path, output_dir, Constant.COMM_JSON)
+                matrix_dir = os.path.join(profiling_dir_path, output_dir, Constant.COMM_MATRIX_JSON)
             else:
                 comm_dir = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT, Constant.DB_COMMUNICATION_ANALYZER)
                 matrix_dir = comm_dir
diff --git a/profiler/msprof_analyze/cluster_analyse/communication_group/communication_json_group.py b/profiler/msprof_analyze/cluster_analyse/communication_group/communication_json_group.py
index 2975050da07..e6fd3b41eea 100644
--- a/profiler/msprof_analyze/cluster_analyse/communication_group/communication_json_group.py
+++ b/profiler/msprof_analyze/cluster_analyse/communication_group/communication_json_group.py
@@ -15,9 +15,13 @@
 
 import os
 from copy import deepcopy
- 
+
 from msprof_analyze.cluster_analyse.communication_group.base_communication_group import BaseCommunicationGroup
 from msprof_analyze.prof_common.file_manager import FileManager
+from msprof_analyze.cluster_analyse.communication_group.msprof_communication_matrix_adapter import \
+    MsprofCommunicationMatrixAdapter
+from msprof_analyze.cluster_analyse.communication_group.msprof_communication_time_adapter import \
+    MsprofCommunicationTimeAdapter
 
 
 class CommunicationJsonGroup(BaseCommunicationGroup):
@@ -42,7 +46,11 @@ class CommunicationJsonGroup(BaseCommunicationGroup):
         comm_data = {}
         matrix_data = {}
         if os.path.exists(comm_json_path) and self.analysis_mode in ["all", "communication_time"]:
-            comm_data = FileManager.read_json_file(comm_json_path)
+            comm_data = MsprofCommunicationTimeAdapter(
+                comm_json_path).generate_comm_time_data() if self.is_msprof else FileManager.read_json_file(
+                comm_json_path)
         if os.path.exists(matrix_json_path) and self.analysis_mode in ["all", "communication_matrix"]:
-            matrix_data = FileManager.read_json_file(matrix_json_path)
+            matrix_data = MsprofCommunicationMatrixAdapter(
+                matrix_json_path).generate_comm_matrix_data() if self.is_msprof else FileManager.read_json_file(
+                matrix_json_path)
         return rank_id, comm_data, matrix_data
diff --git a/profiler/msprof_analyze/cluster_analyse/communication_group/msprof_communication_matrix_adapter.py b/profiler/msprof_analyze/cluster_analyse/communication_group/msprof_communication_matrix_adapter.py
new file mode 100644
index 00000000000..7f1aef80b96
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/communication_group/msprof_communication_matrix_adapter.py
@@ -0,0 +1,102 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import re
+from collections import defaultdict
+
+from msprof_analyze.prof_common.file_manager import FileManager
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.logger import get_logger
+
+from msprof_analyze.prof_common.utils import compute_ratio
+
+logger = get_logger()
+
+
+class MsprofCommunicationMatrixAdapter:
+    P2P_HCOM = ["hcom_send", "hcom_receive", "hcom_batchsendrecv"]
+    HCCL_PATTERN = r"send|reduce|invalid|broadcast|allreduce|" \
+                   r"receive|allgather|reducescatter|scatter|alltoall|alltoallv|alltoallvc|batchsendrecv"
+    BANDWIDTH_GB_S = "Bandwidth(GB/s)"
+    TRANSPORT_TYPE = "Transport Type"
+    TRANSIT_SIZE_MB = "Transit Size(MB)"
+    TRANSIT_TIME_MS = "Transit Time(ms)"
+
+    def __init__(self, file_path):
+        self.file_path = file_path
+
+    def generate_comm_matrix_data(self):
+        output_comm_matrix = {"step": {Constant.P2P: {}, Constant.COLLECTIVE: {}}}
+        comm_matrix_data = FileManager.read_json_file(self.file_path)
+        split_comm_dict = {Constant.P2P: {}, Constant.COLLECTIVE: {}}
+        for communication_op, comm_matrix_info in comm_matrix_data.items():
+            lower_op_name = communication_op.lower()
+            if any(lower_op_name.startswith(start_str) for start_str in self.P2P_HCOM):
+                split_comm_dict[Constant.P2P][communication_op] = comm_matrix_info
+            elif lower_op_name.startswith(Constant.TOTAL):
+                continue
+            else:
+                split_comm_dict[Constant.COLLECTIVE][communication_op] = comm_matrix_info
+        output_comm_matrix["step"][Constant.P2P] = self.integrate_matrix_data(
+            self.get_comm_type(split_comm_dict[Constant.P2P]))
+        output_comm_matrix["step"][Constant.COLLECTIVE] = self.integrate_matrix_data(
+            self.get_comm_type(split_comm_dict[Constant.COLLECTIVE]))
+        return output_comm_matrix
+
+    def get_comm_type(self, op_data: dict) -> dict:
+        new_comm_op_dict = defaultdict(list)
+        for communication_op, communication_info in op_data.items():
+            match_obj = re.compile(self.HCCL_PATTERN).search((communication_op.lower()))
+            if match_obj:
+                comm_op_type = match_obj.group()
+            else:
+                comm_op_type = communication_op.split("__")[0]
+                logger.warning(f"Unknown communication op type: {comm_op_type}")
+            for link, data in communication_info.items():
+                new_comm_op_name = (comm_op_type, communication_op.split("@")[-1], link)
+                data['Op Name'] = communication_op.split("@")[0]
+                new_comm_op_dict[new_comm_op_name].append(data)
+        return new_comm_op_dict
+
+    def integrate_matrix_data(self, new_comm_op_dict: dict):
+        """integrate the matrix data"""
+        comm_op_dict = defaultdict(dict)
+        for new_comm_op_name, data in new_comm_op_dict.items():
+            data.sort(key=lambda x: x[self.BANDWIDTH_GB_S], reverse=True)
+            t_type = data[0].get(self.TRANSPORT_TYPE, '')
+            t_size = sum(x.get(self.TRANSIT_SIZE_MB, 0) for x in data)
+            t_time = sum(x.get(self.TRANSIT_TIME_MS, 0) for x in data)
+            bandwidth = compute_ratio(t_size, t_time)
+
+            link = new_comm_op_name[2]
+            new_comm_op_name_top1 = f'{new_comm_op_name[0]}-top1@{new_comm_op_name[1]}'
+            new_comm_op_name_middle = f'{new_comm_op_name[0]}-middle@{new_comm_op_name[1]}'
+            new_comm_op_name_bottom1 = f'{new_comm_op_name[0]}-bottom1@{new_comm_op_name[1]}'
+            new_comm_op_name_bottom2 = f'{new_comm_op_name[0]}-bottom2@{new_comm_op_name[1]}'
+            new_comm_op_name_bottom3 = f'{new_comm_op_name[0]}-bottom3@{new_comm_op_name[1]}'
+            new_comm_op_name_total = f'{new_comm_op_name[0]}-total@{new_comm_op_name[1]}'
+            comm_op_dict[new_comm_op_name_top1].update({link: data[0]})
+            comm_op_dict[new_comm_op_name_middle].update({link: data[len(data) // 2]})
+            comm_op_dict[new_comm_op_name_bottom1].update({link: data[-1]})
+            comm_op_dict[new_comm_op_name_total].update({link: {
+                self.TRANSPORT_TYPE: t_type,
+                self.TRANSIT_SIZE_MB: t_size,
+                self.TRANSIT_TIME_MS: t_time,
+                self.BANDWIDTH_GB_S: bandwidth
+            }})
+            if len(data) >= 2:
+                comm_op_dict[new_comm_op_name_bottom2].update({link: data[-2]})
+            if len(data) >= 3:
+                comm_op_dict[new_comm_op_name_bottom3].update({link: data[-3]})
+        return comm_op_dict
diff --git a/profiler/msprof_analyze/cluster_analyse/communication_group/msprof_communication_time_adapter.py b/profiler/msprof_analyze/cluster_analyse/communication_group/msprof_communication_time_adapter.py
new file mode 100644
index 00000000000..7b63b700f5c
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/communication_group/msprof_communication_time_adapter.py
@@ -0,0 +1,38 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+from msprof_analyze.prof_common.file_manager import FileManager
+from msprof_analyze.prof_common.constant import Constant
+
+
+class MsprofCommunicationTimeAdapter:
+    P2P_HCOM = ["hcom_send", "hcom_receive", "hcom_batchsendrecv"]
+    TOTAL = "total"
+
+    def __init__(self, file_path):
+        self.file_path = file_path
+
+    def generate_comm_time_data(self):
+        output_communication = {"step": {Constant.P2P: {}, Constant.COLLECTIVE: {}}}
+        communication_data = FileManager.read_json_file(self.file_path)
+        for communication_op, communication_info in communication_data.items():
+            lower_op_name = communication_op.lower()
+            if any(lower_op_name.startswith(start_str) for start_str in self.P2P_HCOM):
+                output_communication["step"][Constant.P2P][communication_op] = communication_info
+            elif lower_op_name.startswith(self.TOTAL):
+                continue
+            else:
+                output_communication["step"][Constant.COLLECTIVE][communication_op] = communication_info
+
+        return output_communication
diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index 5353fc6d40f..f34aeade895 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -61,6 +61,7 @@ class Constant(object):
     # communication
     P2P = "p2p"
     COLLECTIVE = "collective"
+    TOTAL = "total"
     STEP_ID = "step_id"
     RANK_ID = "rank_id"
     GROUP_NAME = "group_name"
@@ -97,6 +98,7 @@ class Constant(object):
     TRANSPORT_TYPE = "Transport Type"
     COMM_DATA_DICT = "comm_data_dict"
     DATA_TYPE = "data_type"
+    IS_MSPROF = "is_prof"
 
     # step time
     RANK = "rank"
diff --git a/profiler/msprof_analyze/prof_common/utils.py b/profiler/msprof_analyze/prof_common/utils.py
index 005d8505c9c..5c083256633 100644
--- a/profiler/msprof_analyze/prof_common/utils.py
+++ b/profiler/msprof_analyze/prof_common/utils.py
@@ -91,3 +91,10 @@ def convert_to_int(num):
     except (ValueError, NameError):
         logger.error(f"Can not convert %s to int", num)
     return 0
+
+
+def compute_ratio(dividend: float, divisor: float):
+    if abs(divisor) < 1e-15:
+        return 0
+    else:
+        return round(dividend / divisor, 4)
-- 
Gitee


From 572b0b6fa96a8df74c44990b62ad2e0abacdcf9a Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Thu, 27 Feb 2025 17:20:03 +0800
Subject: [PATCH 031/145] mstx_sum support range

---
 .../cluster_analyse/common_func/context.py    |   7 +-
 .../recipes/mstx_sum/mstx_sum.py              | 109 +++++++++++-------
 ...tx_mark_export.py => mstx_event_export.py} |  50 +++++++-
 3 files changed, 119 insertions(+), 47 deletions(-)
 rename profiler/msprof_analyze/prof_exports/{mstx_mark_export.py => mstx_event_export.py} (58%)

diff --git a/profiler/msprof_analyze/cluster_analyse/common_func/context.py b/profiler/msprof_analyze/cluster_analyse/common_func/context.py
index b41972c0d21..cde351508c0 100644
--- a/profiler/msprof_analyze/cluster_analyse/common_func/context.py
+++ b/profiler/msprof_analyze/cluster_analyse/common_func/context.py
@@ -84,7 +84,12 @@ class ConcurrentContext(Context):
 
     def map(self, func, *iterables, **kwargs):
         partial_func = partial(func, **kwargs)
-        return list(self._executor.map(partial_func, *iterables))
+        try:
+            res = list(self._executor.map(partial_func, *iterables))
+        except Exception as err:
+            logger.error(err)
+            return []
+        return res
 
     def wait(self, waitable):
         return waitable
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/mstx_sum/mstx_sum.py b/profiler/msprof_analyze/cluster_analyse/recipes/mstx_sum/mstx_sum.py
index bfbcc6ffb49..db6aae0de86 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/mstx_sum/mstx_sum.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/mstx_sum/mstx_sum.py
@@ -21,7 +21,7 @@ from msprof_analyze.cluster_analyse.common_func.utils import describe_duration
 from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
-from msprof_analyze.prof_exports.mstx_mark_export import MstxMarkExport
+from msprof_analyze.prof_exports.mstx_event_export import MstxMarkExport, MstxRangeExport
 from msprof_analyze.prof_exports.mstx_step_export import MstxStepExport
 
 logger = get_logger()
@@ -43,16 +43,28 @@ def format_mark_info(df: pd.DataFrame, start_idx, stop_idx, name) -> MarkInfo:
     )
 
 
-def rename_mark_msg_name(mark_stats_df: pd.DataFrame):
+def format_range_info(df: pd.DataFrame, idx, name) -> MarkInfo:
+    range_series = df.iloc[idx]
+    return MarkInfo(
+        name=name,
+        framework_duration=float(0),
+        cann_duration=float(range_series["cann_end_ts"] - range_series["cann_start_ts"]),
+        device_duration=float(range_series["device_end_ts"] - range_series["device_start_ts"]),
+        tid=range_series["tid"],
+        start_ns=range_series["cann_start_ts"]
+    )
+
+
+def rename_mark_msg_name(mstx_stats_df: pd.DataFrame):
     msg_idx_counter = {}
-    for idx, mark_info in enumerate(mark_stats_df.itertuples(index=False)):
+    for idx, mark_info in enumerate(mstx_stats_df.itertuples(index=False)):
         msg_idx_counter.setdefault(mark_info.step_id, {}).setdefault(mark_info.name, []).append(idx)
     for msg_dict in msg_idx_counter.values():
         for msg, idx_list in msg_dict.items():
             if len(idx_list) <= 1:
                 continue
             for i, idx in enumerate(idx_list):
-                mark_stats_df.loc[idx, 'name'] = f"{msg}_{i}"
+                mstx_stats_df.loc[idx, 'name'] = f"{msg}_{i}"
 
 
 def compute_step_id(mark_stat, step_stats_df: pd.DataFrame):
@@ -80,6 +92,45 @@ def format_columns(df: pd.DataFrame):
     return formatted_df[cols]
 
 
+def handle_mark_data(mark_df: pd.DataFrame, rank_id: int) -> list:
+    res = []
+    mark_df["framework_ts"] = mark_df["framework_ts"].astype("int64")
+    mark_info = {}
+    mismatch_msg = []
+    for idx, row in enumerate(mark_df.itertuples(index=False)):
+        if row.msg.endswith(MstxSum.START_SUFFIX):
+            msg = row.msg[:-len(MstxSum.START_SUFFIX)]
+            mark_info.setdefault(row.tid, {}).setdefault(msg, []).append(idx)
+        elif row.msg.endswith(MstxSum.STOP_SUFFIX):
+            msg = row.msg[:-len(MstxSum.STOP_SUFFIX)]
+            idx_list = mark_info.get(row.tid, {}).get(msg, [])
+            if not idx_list:
+                mismatch_msg.append((row.msg, idx))
+                continue
+            start_idx = idx_list.pop()
+            res.append(format_mark_info(mark_df, start_idx, idx, msg))
+
+    # 统计未匹配上的mark信息
+    for msg_info in mark_info.values():
+        for msg, idx_list in msg_info.items():
+            if not idx_list:
+                continue
+            mismatch_msg.extend((msg + MstxSum.START_SUFFIX, idx) for idx in idx_list)
+    if mismatch_msg:
+        mismatch_msg.sort(key=lambda msg: msg[1])
+        logger.warning(f"The following mark messages do not match anyone in "
+                       f"rank {rank_id}: {','.join(msg[0] for msg in mismatch_msg)}.")
+
+    return res
+
+
+def handle_range_data(range_df: pd.DataFrame) -> list:
+    res = []
+    for idx, row in enumerate(range_df.itertuples(index=False)):
+        res.append(format_range_info(range_df, idx, row.msg))
+    return res
+
+
 class MstxSum(BaseRecipeAnalysis):
     TABLE_FRAMEWORK_STATS = "MSTXAllFrameworkStats"
     TABLE_CANN_STATS = "MSTXAllCannStats"
@@ -159,40 +210,18 @@ class MstxSum(BaseRecipeAnalysis):
         if step_df is None or step_df.empty:
             step_df = pd.DataFrame({"start_ns": [0], "end_ns": [float("inf")], "step_id": [0]})
         mark_df = MstxMarkExport(profiler_db_path, analysis_class, step_range).read_export_db()
-        if mark_df is None or mark_df.empty:
-            logger.warning(f"There is no mark data in {profiler_db_path}.")
+        range_df = MstxRangeExport(profiler_db_path, analysis_class, step_range).read_export_db()
+        mstx_res = []
+        if not mark_df.empty:
+            mstx_res += handle_mark_data(mark_df, rank_id)
+        if not range_df.empty:
+            mstx_res += handle_range_data(range_df)
+        if not mstx_res:
+            logger.warning(f"There is no mstx data in {profiler_db_path}.")
             return None
-        mark_df["framework_ts"] = mark_df["framework_ts"].astype("int64")
-
-        mark_info = {}
-        mark_res = []
-        mismatch_msg = []
-        for idx, row in enumerate(mark_df.itertuples(index=False)):
-            if row.msg.endswith(MstxSum.START_SUFFIX):
-                msg = row.msg[:-len(MstxSum.START_SUFFIX)]
-                mark_info.setdefault(row.tid, {}).setdefault(msg, []).append(idx)
-            elif row.msg.endswith(MstxSum.STOP_SUFFIX):
-                msg = row.msg[:-len(MstxSum.STOP_SUFFIX)]
-                idx_list = mark_info.get(row.tid, {}).get(msg, [])
-                if not idx_list:
-                    mismatch_msg.append((row.msg, idx))
-                    continue
-                start_idx = idx_list.pop()
-                mark_res.append(format_mark_info(mark_df, start_idx, idx, msg))
-
-        # 统计未匹配上的mark信息
-        for msg_info in mark_info.values():
-            for msg, idx_list in msg_info.items():
-                if not idx_list:
-                    continue
-                mismatch_msg.extend((msg + MstxSum.START_SUFFIX, idx) for idx in idx_list)
-        if mismatch_msg:
-            mismatch_msg.sort(key=lambda msg: msg[1])
-            logger.warning(f"The following mark messages do not match anyone in "
-                           f"rank {rank_id}: {','.join(msg[0] for msg in mismatch_msg)}.")
-
-        mark_stats_df = pd.DataFrame(mark_res).assign(Rank=rank_id)
-        mark_stats_df["step_id"] = mark_stats_df.apply(compute_step_id, axis=1, step_stats_df=step_df)
-        rename_mark_msg_name(mark_stats_df)
-        mark_stats_df = format_columns(mark_stats_df).set_index("Name", drop=True)
-        return mark_stats_df
+
+        mstx_stats_df = pd.DataFrame(mstx_res).assign(Rank=rank_id)
+        mstx_stats_df["step_id"] = mstx_stats_df.apply(compute_step_id, axis=1, step_stats_df=step_df)
+        rename_mark_msg_name(mstx_stats_df)
+        mstx_stats_df = format_columns(mstx_stats_df).set_index("Name", drop=True)
+        return mstx_stats_df
diff --git a/profiler/msprof_analyze/prof_exports/mstx_mark_export.py b/profiler/msprof_analyze/prof_exports/mstx_event_export.py
similarity index 58%
rename from profiler/msprof_analyze/prof_exports/mstx_mark_export.py
rename to profiler/msprof_analyze/prof_exports/mstx_event_export.py
index 6a7f8d0c6d2..97c3813b7eb 100644
--- a/profiler/msprof_analyze/prof_exports/mstx_mark_export.py
+++ b/profiler/msprof_analyze/prof_exports/mstx_event_export.py
@@ -16,7 +16,7 @@
 from msprof_analyze.prof_exports.base_stats_export import BaseStatsExport
 from msprof_analyze.prof_common.constant import Constant
 
-QUERY = """
+MARK_QUERY = """
 WITH
     FRAMEWORK_API AS (
         SELECT
@@ -46,7 +46,8 @@ LEFT JOIN
 LEFT JOIN
     STRING_IDS AS MSG_IDS
     ON MSTX_EVENTS.message == MSG_IDS.id
-{}
+WHERE 
+    MSTX_EVENTS.eventType == 3 {}
 ORDER BY
     MSTX_EVENTS.startNs
     """
@@ -61,9 +62,46 @@ class MstxMarkExport(BaseStatsExport):
     def get_query_statement(self):
         if self._step_range:
             filter_statement_1 = f"WHERE PYTORCH_API.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                                 f"and PYTORCH_API.startNs <= {self._step_range.get(Constant.END_NS)}"
-            filter_statement_2 = f"WHERE MSTX_EVENTS.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                                 f"and MSTX_EVENTS.startNs <= {self._step_range.get(Constant.END_NS)}"
+                                 f"AND PYTORCH_API.startNs <= {self._step_range.get(Constant.END_NS)}"
+            filter_statement_2 = f"AND MSTX_EVENTS.startNs >= {self._step_range.get(Constant.START_NS)} " \
+                                 f"AND MSTX_EVENTS.startNs <= {self._step_range.get(Constant.END_NS)}"
         else:
             filter_statement_1, filter_statement_2 = "", ""
-        return QUERY.format(filter_statement_1, filter_statement_2)
+        return MARK_QUERY.format(filter_statement_1, filter_statement_2)
+
+
+RANGE_QUERY = '''
+SELECT
+    MSG_IDS.value AS "msg",
+    MSTX_EVENTS.startNs AS "cann_start_ts",
+    MSTX_EVENTS.endNs AS "cann_end_ts",
+    TASK.startNs AS "device_start_ts",
+    TASK.endNs AS "device_end_ts",
+    MSTX_EVENTS.globalTid AS "tid"
+FROM
+    MSTX_EVENTS
+LEFT JOIN
+    TASK
+    ON MSTX_EVENTS.connectionId == TASK.connectionId
+LEFT JOIN
+    STRING_IDS AS MSG_IDS
+    ON MSTX_EVENTS.message == MSG_IDS.id
+WHERE
+    MSTX_EVENTS.eventType == 2 {}
+AND
+    MSTX_EVENTS.connectionId != 4294967295
+ORDER BY
+    MSTX_EVENTS.startNs
+    '''
+
+
+class MstxRangeExport(BaseStatsExport):
+
+    def __init__(self, db_path, recipe_name, step_range):
+        super().__init__(db_path, recipe_name, step_range)
+        self._query = self.get_query_statement()
+
+    def get_query_statement(self):
+        filter_statement = f"AND MSTX_EVENTS.startNs >= {self._step_range.get(Constant.START_NS)} AND " \
+                           f"MSTX_EVENTS.startNs <= {self._step_range.get(Constant.END_NS)}" if self._step_range else ""
+        return RANGE_QUERY.format(filter_statement)
-- 
Gitee


From 574bd927d4b232c9224e8915866b1380c4ff1986 Mon Sep 17 00:00:00 2001
From: DavidFFFan <fandawei2@huawei.com>
Date: Thu, 27 Feb 2025 10:35:35 +0000
Subject: [PATCH 032/145] Update
 debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp

---
 debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp | 5 +----
 1 file changed, 1 insertion(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp
index ec6e59dafd7..805a6a7a0a2 100644
--- a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp
+++ b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumper.cpp
@@ -153,10 +153,7 @@ bool AclDumper::IsCfgEnableAclDumper()
 
 bool AclDumper::IsOverflowCompleted()
 {
-    if (overflowNums != -1 && realOverflowNums > overflowNums) {
-        return true;
-    }
-    return false;
+    return overflowNums != -1 && realOverflowNums > overflowNums;
 }
 
 void AclDumper::CountOverflowNumbers(const acldumpChunk* chunk)
-- 
Gitee


From 14d54b529322e774d18125a18b676e9c8aaeca37 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Thu, 27 Feb 2025 19:12:00 +0800
Subject: [PATCH 033/145] compare framework get improve

---
 .../test_dump_file/dump_no_pt_no_ms.json      |  3 ++
 .../test_dump_file/ms_dump_no_framework.json  |  4 +++
 .../test_dump_file/pt_dump_no_framework.json  |  4 +++
 .../msprobe/test/core_ut/common/test_utils.py | 30 +++++++++++--------
 4 files changed, 28 insertions(+), 13 deletions(-)
 create mode 100644 debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/dump_no_pt_no_ms.json
 create mode 100644 debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/ms_dump_no_framework.json
 create mode 100644 debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/pt_dump_no_framework.json

diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/dump_no_pt_no_ms.json b/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/dump_no_pt_no_ms.json
new file mode 100644
index 00000000000..63a062d8ffa
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/dump_no_pt_no_ms.json
@@ -0,0 +1,3 @@
+{
+  "task": "tensor"
+}
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/ms_dump_no_framework.json b/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/ms_dump_no_framework.json
new file mode 100644
index 00000000000..b223c74b231
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/ms_dump_no_framework.json
@@ -0,0 +1,4 @@
+{
+  "task": "tensor",
+  "type": "mindspore.float16"
+}
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/pt_dump_no_framework.json b/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/pt_dump_no_framework.json
new file mode 100644
index 00000000000..2444ae1fd40
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_dump_file/pt_dump_no_framework.json
@@ -0,0 +1,4 @@
+{
+  "task": "tensor",
+  "type": "torch.float16"
+}
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
index a8eef63f59c..c0328008adf 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
@@ -18,13 +18,13 @@ import json
 import os
 import tempfile
 from datetime import datetime, timezone
-import re
 import unittest
 from unittest import TestCase
 from unittest.mock import MagicMock, mock_open, patch
 
 import OpenSSL
 import numpy as np
+from pathlib import Path
 
 from msprobe.core.common.const import Const
 from msprobe.core.common.file_utils import (
@@ -511,18 +511,22 @@ class TestDetectFrameworkByDumpJson(unittest.TestCase):
 
         self.assertEqual(result, Const.MS_FRAMEWORK)
 
-    @patch("msprobe.core.common.utils.FileOpen", new_callable=mock_open)
-    @patch("re.search")  # 模拟 re.search
-    def test_detect_framework_in_file(self, mock_search, mock_open):
-        # 测试框架是 MindSpore
-        fake_file_content = '{"type": "mindspore.float16"}\n'
-        mock_open.return_value.read.side_effect = fake_file_content
+    def test_detect_framework_in_file(self):
+        self.current_dir = Path(__file__).parent
+        file_path = self.current_dir / "test_dump_file/pt_dump_no_framework.json"
+        result = detect_framework_by_dump_json(file_path)
+        self.assertEqual(result, Const.PT_FRAMEWORK)
 
-        result = detect_framework_by_dump_json("dummy_path")
+        self.current_dir = Path(__file__).parent
+        file_path = self.current_dir / "test_dump_file/ms_dump_no_framework.json"
+        result = detect_framework_by_dump_json(file_path)
         self.assertEqual(result, Const.MS_FRAMEWORK)
 
-        # 测试框架是 PyTorch
-        fake_file_content = '{"type": "torch.float16"}\n'
-        mock_open.return_value.read.side_effect = fake_file_content
-        result = detect_framework_by_dump_json("dummy_path")
-        self.assertEqual(result, Const.PT_FRAMEWORK)
+    @patch("msprobe.core.common.utils.logger")
+    def test_detect_framework_exception(self, mock_logger):
+        self.current_dir = Path(__file__).parent
+        file_path = self.current_dir / "test_dump_file/pt_dump_no_pt_no_ms.json"
+        with self.assertRaises(CompareException) as context:
+            result = detect_framework_by_dump_json(file_path)
+        self.assertEqual(context.exception.code, CompareException.INVALID_PARAM_ERROR)
+        mock_logger.error.assert_called_once_with(f"{file_path} must be based on the MindSpore or PyTorch framework.")
-- 
Gitee


From 96a0bfd81ba325b89300d4c2983dfe1eb1503998 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Thu, 27 Feb 2025 19:13:34 +0800
Subject: [PATCH 034/145] compare framework get improve

---
 debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
index c0328008adf..61766ed27c0 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/common/test_utils.py
@@ -525,7 +525,7 @@ class TestDetectFrameworkByDumpJson(unittest.TestCase):
     @patch("msprobe.core.common.utils.logger")
     def test_detect_framework_exception(self, mock_logger):
         self.current_dir = Path(__file__).parent
-        file_path = self.current_dir / "test_dump_file/pt_dump_no_pt_no_ms.json"
+        file_path = self.current_dir / "test_dump_file/dump_no_pt_no_ms.json"
         with self.assertRaises(CompareException) as context:
             result = detect_framework_by_dump_json(file_path)
         self.assertEqual(context.exception.code, CompareException.INVALID_PARAM_ERROR)
-- 
Gitee


From 3944c9dea10f64b9e24c5a3967b566afff16c789 Mon Sep 17 00:00:00 2001
From: curry3 <485078529@qq.com>
Date: Wed, 26 Feb 2025 11:19:57 +0800
Subject: [PATCH 035/145] =?UTF-8?q?=E3=80=90feature=E3=80=91ms=E5=92=8Cpt?=
 =?UTF-8?q?=E8=A1=A5=E5=85=85API=E6=94=AF=E6=8C=81=E5=88=97=E8=A1=A8?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../data_processor/pytorch_processor.py       |   8 +-
 .../dump/hook_cell/support_wrap_ops.yaml      |  50 ++--
 .../pytorch/hook_module/support_wrap_ops.yaml | 242 ++++++++++++------
 3 files changed, 197 insertions(+), 103 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
index 64253aa4260..2cd98b12568 100644
--- a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
+++ b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
@@ -78,14 +78,16 @@ class PytorchDataProcessor(BaseDataProcessor):
     def analyze_device_in_kwargs(element):
         single_arg = {}
         single_arg.update({'type': "torch.device"})
-        if not isinstance(element, str):
+        if isinstance(element, (int, str)):
+            single_arg.update({"value": element})
+        elif isinstance(element, torch.device):
             if hasattr(element, "index"):
                 device_value = element.type + ":" + str(element.index)
             else:
                 device_value = element.type
             single_arg.update({"value": device_value})
         else:
-            single_arg.update({"value": element})
+            logger.debug(f"Device type {type(element)} is not supported.")
         return single_arg
 
     @staticmethod
@@ -311,7 +313,7 @@ class TensorDataProcessor(PytorchDataProcessor):
             saved_tensor = tensor.clone().contiguous().detach()
             save_pt(saved_tensor, file_path)
         return single_arg
-    
+
     def _analyze_numpy(self, ndarray, suffix):
         dump_data_name, file_path = self.get_save_file_path(suffix)
         save_pt(torch.tensor(ndarray), file_path)
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/support_wrap_ops.yaml b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/support_wrap_ops.yaml
index 723b0cbc93f..364062b4647 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/support_wrap_ops.yaml
+++ b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/support_wrap_ops.yaml
@@ -564,15 +564,15 @@ tensor:
   - all
   - amax
   - amin
+  - angle
   - any
   - arccos
   - arccosh
-  - argmax
-  - angle
   - arcsin
   - arcsinh
   - arctan
   - arctanh
+  - argmax
   - argmin
   - argsort
   - asin
@@ -582,19 +582,23 @@ tensor:
   - atanh
   - baddbmm
   - bernoulli
+  - bfloat16
   - bincount
   - bitwise_and
   - bitwise_or
   - bitwise_xor
   - bmm
   - bool
+  - bool astype
   - broadcast_to
+  - byte
   - ceil
-  - cholesky_solve
   - cholesky
+  - cholesky_solve
   - clamp
   - clip
   - conj
+  - copy
   - copysign
   - cos
   - cosh
@@ -606,11 +610,13 @@ tensor:
   - deg2rad
   - diag
   - diagflat
+  - diagonal
   - diff
   - digamma
   - div
   - div_
   - divide
+  - double
   - equal
   - erf
   - erfc
@@ -618,13 +624,16 @@ tensor:
   - exp
   - expand_as
   - expm1
+  - flatten
   - flip
   - fliplr
   - flipud
+  - float
   - float_power
   - floor
   - fmod
   - frac
+  - from_numpy
   - gather_elements
   - ge
   - geqrf
@@ -648,12 +657,12 @@ tensor:
   - inner
   - int
   - inverse
+  - is_complex
+  - is_signed
   - isclose
   - isfinite
   - isinf
   - isnan
-  - is_complex
-  - is_signed
   - isneginf
   - isposinf
   - isreal
@@ -704,28 +713,27 @@ tensor:
   - new_ones
   - new_zeros
   - nextafter
-  - norm
   - nonzero
+  - norm
   - not_equal
   - ormqr
   - permute
   - pow
   - prod
   - qr
+  - rad2deg
   - ravel
   - real
   - reciprocal
   - remainder
   - renorm
-  - rad2deg
-  - tile
   - repeat_interleave
   - reshape
   - reshape
-  - round
+  - resize
   - rot90
+  - round
   - rsqrt
-  - sum_to_size
   - scatter
   - sgn
   - short
@@ -745,7 +753,8 @@ tensor:
   - sub
   - sub_
   - subtract
-  - subtract
+  - sum
+  - sum_to_size
   - svd
   - swapaxes
   - swapdims
@@ -753,13 +762,13 @@ tensor:
   - take
   - tan
   - tanh
-  - trace
-  - swapaxes
+  - tensor_split
   - tile
+  - to
   - topk
-  - tril
-  - tensor_split
+  - trace
   - transpose
+  - tril
   - true_divide
   - trunc
   - unbind
@@ -769,17 +778,6 @@ tensor:
   - view
   - where
   - xlogy
-  - from_numpy
-  - std
-  - take
-  - var
-  - all
-  - any
-  - copy
-  - diagonal
-  - flatten
-  - resize
-  - sum
 
 mint.ops:
   - abs
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/support_wrap_ops.yaml b/debug/accuracy_tools/msprobe/pytorch/hook_module/support_wrap_ops.yaml
index 4bc22f51ceb..91eb016284a 100644
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/support_wrap_ops.yaml
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/support_wrap_ops.yaml
@@ -149,9 +149,10 @@ tensor:
   - __bool__
   - __div__
   - __eq__
+  - __floordiv__
   - __ge__
-  - __gt__
   - __getitem__
+  - __gt__
   - __iadd__
   - __iand__
   - __idiv__
@@ -160,23 +161,33 @@ tensor:
   - __imod__
   - __imul__
   - __ior__
+  - __ipow__
   - __irshift__
   - __isub__
   - __ixor__
+  - __le__
   - __lshift__
+  - __lt__
   - __matmul__
   - __mod__
   - __mul__
+  - __ne__
   - __nonzero__
   - __or__
+  - __pow__
   - __radd__
+  - __rdiv__
+  - __rmod__
   - __rmul__
+  - __ror__
+  - __rpow__
   - __rshift__
+  - __rsub__
+  - __rxor__
   - __setitem__
   - __sub__
   - __truediv__
   - __xor__
-  - __pow__
   - abs
   - abs_
   - absolute
@@ -199,12 +210,14 @@ tensor:
   - addmv_
   - addr
   - addr_
+  - adjoint
   - align_as
   - align_to
   - all
   - allclose
   - amax
   - amin
+  - aminmax
   - angle
   - any
   - arccos
@@ -216,12 +229,15 @@ tensor:
   - arcsinh
   - arcsinh_
   - arctan
+  - arctan2
+  - arctan2_
   - arctan_
   - arctanh
   - arctanh_
   - argmax
   - argmin
   - argsort
+  - argwhere
   - asin
   - asin_
   - asinh
@@ -236,39 +252,51 @@ tensor:
   - baddbmm_
   - bernoulli
   - bernoulli_
+  - bfloat16
   - bincount
   - bitwise_and
   - bitwise_and_
+  - bitwise_left_shift
+  - bitwise_left_shift_
   - bitwise_not
   - bitwise_not_
   - bitwise_or
   - bitwise_or_
+  - bitwise_right_shift
+  - bitwise_right_shift_
   - bitwise_xor
   - bitwise_xor_
   - bmm
+  - bool
   - broadcast_to
+  - byte
   - cauchy_
   - ceil
   - ceil_
+  - cfloat
+  - char
   - cholesky
+  - cholesky_inverse
+  - cholesky_solve
   - chunk
   - clamp
-  - cholesky_solve
-  - cholesky_inverse
   - clamp_
   - clamp_max
   - clamp_max_
-  - clip
   - clamp_min
   - clamp_min_
+  - clip
   - clip_
+  - conj_physical
   - copysign
   - copysign_
+  - corrcoef
   - cos
   - cos_
   - cosh
   - cosh_
   - count_nonzero
+  - cov
   - cummax
   - cummin
   - cumprod
@@ -282,20 +310,23 @@ tensor:
   - diag_embed
   - diagflat
   - diagonal
+  - diagonal_scatter
   - diff
-  - dist
   - digamma
   - digamma_
+  - dist
   - div
   - div_
   - divide
   - divide_
   - dot
+  - double
+  - dsplit
   - eig
   - eq
   - eq_
-  - erf
   - equal
+  - erf
   - erf_
   - erfc
   - erfc_
@@ -304,18 +335,21 @@ tensor:
   - exp
   - exp2
   - exp2_
-  - expm1
   - exp_
+  - expand
+  - expand_as
+  - expm1
   - expm1_
   - exponential_
   - fill_
-  - fix
   - fill_diagonal_
+  - fix
   - fix_
+  - flatten
   - flip
   - fliplr
-  - flatten
   - flipud
+  - float
   - float_power
   - float_power_
   - floor
@@ -328,6 +362,7 @@ tensor:
   - fmod_
   - frac
   - frac_
+  - frexp
   - gather
   - gcd
   - gcd_
@@ -338,31 +373,37 @@ tensor:
   - ger
   - greater
   - greater_
-  - gt
-  - gt_
   - greater_equal
   - greater_equal_
+  - gt
+  - gt_
+  - half
   - hardshrink
   - heaviside
   - heaviside_
   - histc
+  - histogram
+  - hsplit
   - hypot
   - hypot_
+  - i0
+  - i0_
   - igamma
   - igamma_
   - igammac
   - igammac_
   - index_add
   - index_add_
-  - inverse
   - index_copy
   - index_copy_
   - index_fill
   - index_fill_
   - index_put
   - index_put_
-  - inner
   - index_select
+  - inner
+  - int
+  - inverse
   - isclose
   - isfinite
   - isinf
@@ -380,7 +421,6 @@ tensor:
   - le_
   - lerp
   - lerp_
-  - where
   - less
   - less_
   - less_equal
@@ -397,43 +437,47 @@ tensor:
   - log_
   - log_normal_
   - log_softmax
-  - logcumsumexp
-  - logdet
   - logaddexp
   - logaddexp2
+  - logcumsumexp
+  - logdet
   - logical_and
   - logical_and_
   - logical_not
-  - logit
   - logical_not_
   - logical_or
   - logical_or_
   - logical_xor
   - logical_xor_
+  - logit
   - logit_
   - logsumexp
+  - long
   - lstsq
   - lt
   - lt_
+  - lu
   - lu_solve
   - map2_
   - map_
   - masked_fill
-  - matmul
   - masked_fill_
   - masked_scatter
   - masked_scatter_
   - masked_select
+  - matmul
   - matrix_exp
+  - matrix_power
   - max
   - maximum
   - mean
-  - matrix_power
   - median
   - min
   - minimum
   - mm
   - mode
+  - moveaxis
+  - movedim
   - msort
   - mul
   - mul_
@@ -443,6 +487,11 @@ tensor:
   - mv
   - mvlgamma
   - mvlgamma_
+  - nan_to_num
+  - nan_to_num_
+  - nanmean
+  - nanmedian
+  - nanquantile
   - nansum
   - narrow
   - narrow_copy
@@ -452,20 +501,29 @@ tensor:
   - neg_
   - negative
   - negative_
+  - nextafter
+  - nextafter_
   - nonzero
   - norm
   - normal_
   - not_equal
   - not_equal_
+  - numpy
+  - orgqr
+  - ormqr
+  - outer
   - permute
   - pinverse
   - polygamma
+  - polygamma_
   - pow
   - pow_
-  - polygamma_
   - prelu
   - prod
   - put_
+  - q_zero_point
+  - qr
+  - quantile
   - rad2deg
   - rad2deg_
   - ravel
@@ -474,15 +532,16 @@ tensor:
   - relu
   - relu_
   - remainder
-  - repeat_interleave
-  - reshape
   - remainder_
   - renorm
   - renorm_
   - repeat
+  - repeat_interleave
+  - reshape
   - reshape_as
   - resize_
   - resize_as_
+  - resolve_neg
   - roll
   - rot90
   - round
@@ -496,6 +555,7 @@ tensor:
   - select
   - sgn
   - sgn_
+  - short
   - sigmoid
   - sigmoid_
   - sign
@@ -507,11 +567,13 @@ tensor:
   - sinc_
   - sinh
   - sinh_
+  - slice_scatter
   - slogdet
   - smm
   - softmax
   - solve
   - sort
+  - split
   - split_with_sizes
   - sqrt
   - sqrt_
@@ -521,21 +583,29 @@ tensor:
   - squeeze_
   - sspaddmm
   - std
+  - stft
+  - stride
   - sub
   - sub_
+  - subtract
   - sum
   - sum_to_size
   - svd
+  - swapaxes
+  - swapdims
+  - swapdims_
   - symeig
   - t
   - t_
   - take
+  - take_along_dim
   - tan
   - tan_
   - tanh
   - tanh_
   - tensor_split
   - tile
+  - to
   - topk
   - transpose
   - transpose_
@@ -543,8 +613,8 @@ tensor:
   - tril
   - tril_
   - triu
-  - true_divide
   - triu_
+  - true_divide
   - true_divide_
   - trunc
   - trunc_
@@ -552,37 +622,20 @@ tensor:
   - unbind
   - unflatten
   - unfold
+  - unique
+  - unique_consecutive
   - unsafe_chunk
-  - unsqueeze
   - unsafe_split
   - unsafe_split_with_sizes
+  - unsqueeze
+  - unsqueeze_
   - var
   - vdot
-  - unsqueeze_
   - view_as
+  - vsplit
+  - where
   - xlogy
   - xlogy_
-  - split
-  - stft
-  - nan_to_num
-  - dsplit
-  - orgqr
-  - bitwise_left_shift_
-  - arctan2
-  - histogram
-  - q_zero_point
-  - adjoint
-  - ormqr
-  - bitwise_right_shift_
-  - nanquantile
-  - lu
-  - quantile
-  - arctan2_
-  - qr
-  - diagonal_scatter
-  - corrcoef
-  - vsplit
-  - aminmax
 
 torch:
   - linalg.norm
@@ -642,13 +695,14 @@ torch:
   - addmv
   - addmv_
   - addr
-  - amax
   - affine_grid_generator
   - align_tensors
   - all
   - alpha_dropout
-  - amin
   - alpha_dropout_
+  - amax
+  - amin
+  - aminmax
   - angle
   - any
   - arange
@@ -661,12 +715,14 @@ torch:
   - arcsinh
   - arcsinh_
   - arctan
+  - arctan2
   - arctan_
   - arctanh
   - arctanh_
   - argmax
   - argmin
   - argsort
+  - argwhere
   - asin
   - asin_
   - asinh
@@ -687,13 +743,13 @@ torch:
   - batch_norm_elemt
   - batch_norm_gather_stats
   - batch_norm_gather_stats_with_counts
-  - bernoulli
   - batch_norm_stats
   - batch_norm_update_stats
+  - bernoulli
   - bilinear
+  - binary_cross_entropy_with_logits
   - bincount
   - binomial
-  - binary_cross_entropy_with_logits
   - bitwise_and
   - bitwise_not
   - bitwise_or
@@ -739,9 +795,9 @@ torch:
   - conv_transpose1d
   - conv_transpose2d
   - conv_transpose3d
-  - cos
   - convolution
   - copysign
+  - cos
   - cos_
   - cosh
   - cosh_
@@ -755,14 +811,16 @@ torch:
   - cummin
   - cumprod
   - cumsum
+  - cumulative_trapezoid
   - deg2rad
   - deg2rad_
   - det
   - diag
   - diag_embed
-  - diff
   - diagflat
   - diagonal
+  - diagonal_scatter
+  - diff
   - digamma
   - dist
   - div
@@ -771,12 +829,15 @@ torch:
   - dropout
   - dropout_
   - dsmm
+  - dsplit
   - dstack
   - eig
   - einsum
   - embedding
   - embedding_bag
   - embedding_renorm_
+  - empty
+  - empty_like
   - eq
   - equal
   - erf
@@ -791,12 +852,12 @@ torch:
   - expm1
   - expm1_
   - eye
-  - feature_dropout
   - feature_alpha_dropout
   - feature_alpha_dropout_
+  - feature_dropout
   - feature_dropout_
-  - fix
   - fill_
+  - fix
   - fix_
   - flatten
   - flip
@@ -811,8 +872,9 @@ torch:
   - fmod
   - frac
   - frac_
-  - full
+  - frexp
   - frobenius_norm
+  - full
   - full_like
   - gather
   - gcd
@@ -824,8 +886,8 @@ torch:
   - greater_equal
   - grid_sampler
   - grid_sampler_2d
-  - group_norm
   - grid_sampler_3d
+  - group_norm
   - gru
   - gru_cell
   - gt
@@ -835,23 +897,29 @@ torch:
   - heaviside
   - hinge_embedding_loss
   - histc
+  - histogram
+  - histogramdd
   - hsmm
+  - hsplit
   - hspmm
   - hstack
   - hypot
+  - i0
+  - i0_
   - igamma
   - igammac
   - index_add
   - index_copy
-  - inner
   - index_fill
   - index_put
   - index_put_
   - index_select
+  - inner
   - instance_norm
   - inverse
   - isclose
   - isfinite
+  - isin
   - isinf
   - isnan
   - isneginf
@@ -879,8 +947,8 @@ torch:
   - log1p_
   - log2
   - log2_
-  - log_softmax
   - log_
+  - log_softmax
   - logaddexp
   - logaddexp2
   - logcumsumexp
@@ -899,18 +967,18 @@ torch:
   - lt
   - lu_solve
   - lu_unpack
-  - masked_fill
   - margin_ranking_loss
+  - masked_fill
   - masked_scatter
   - masked_select
-  - matrix_exp
   - matmul
+  - matrix_exp
   - matrix_power
   - matrix_rank
   - max
   - max_pool1d
-  - max_pool2d
   - max_pool1d_with_indices
+  - max_pool2d
   - max_pool3d
   - maximum
   - mean
@@ -929,18 +997,20 @@ torch:
   - mvlgamma
   - nan_to_num
   - nan_to_num_
+  - nanmean
   - nanmedian
+  - nanquantile
   - nansum
   - narrow
+  - narrow_copy
   - native_batch_norm
   - native_group_norm
-  - narrow_copy
   - native_layer_norm
   - native_norm
   - ne
   - neg
-  - negative
   - neg_
+  - negative
   - negative_
   - nextafter
   - nonzero
@@ -972,30 +1042,31 @@ torch:
   - ravel
   - real
   - reciprocal
-  - relu
   - reciprocal_
+  - relu
   - relu_
   - remainder
   - renorm
   - repeat_interleave
   - reshape
   - resize_as_
+  - resolve_neg
   - roll
   - rot90
   - round
   - round_
+  - row_stack
   - rrelu
   - rrelu_
   - rsqrt
-  - row_stack
   - rsqrt_
   - rsub
   - saddmm
   - scalar_tensor
   - scatter
-  - select
   - scatter_add
   - searchsorted
+  - select
   - selu
   - selu_
   - sgn
@@ -1015,12 +1086,12 @@ torch:
   - solve
   - sort
   - sparse_coo_tensor
-  - square
   - split
   - split_with_sizes
   - spmm
   - sqrt
   - sqrt_
+  - square
   - square_
   - squeeze
   - sspaddmm
@@ -1042,8 +1113,8 @@ torch:
   - tan_
   - tanh
   - tanh_
-  - tensordot
   - tensor_split
+  - tensordot
   - threshold
   - threshold_
   - tile
@@ -1059,19 +1130,21 @@ torch:
   - true_divide
   - trunc
   - trunc_
-  - unique_consecutive
-  - xlogy
   - unbind
+  - unflatten
+  - unique_consecutive
   - unsafe_chunk
   - unsafe_split
-  - vander
-  - var
-  - vdot
   - unsafe_split_with_sizes
   - unsqueeze
+  - vander
+  - var
   - var_mean
+  - vdot
+  - vsplit
   - vstack
   - where
+  - xlogy
   - xlogy_
 
 _VF:
@@ -1165,6 +1238,27 @@ torch_npu:
   - npu_moe_finalize_routing
   - npu_moe_gating_top_k_softmax
   - npu_trans_quant_param
+  - npu_gelu
+  - npu_ffn
+  - npu_quant_matmul
+  - npu_format_cast_
+  - npu_dynamic_quant
+  - npu_moe_compute_expert_tokens
+  - npu_weight_quant_batchmatmul
+  - npu_dynamic_quant_asymmetric
+  - npu_grouped_matmul
+  - npu_quant_scatter_
+  - npu_group_quant
+  - npu_fused_infer_attention_score
+  - npu_quantize
+  - npu_fast_gelu
+  - npu_weight_quant_batchmatmul
+  - scatter_update
+  - scatter_update_
+  - npu_moe_init_routing
+  - npu_scatter_nd_update_
+  - npu_scatter_nd_update
+  - npu_prefetch
 
 aten:
   - signbit
-- 
Gitee


From 1d387d7ef5f63a659359f741e5395f66d9ebabb0 Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Thu, 27 Feb 2025 20:20:47 +0800
Subject: [PATCH 036/145] =?UTF-8?q?=E9=A2=84=E6=A3=80=E6=94=AF=E6=8C=81?=
 =?UTF-8?q?=E8=9E=8D=E5=90=88=E7=AE=97=E5=AD=90?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/core/common/const.py              |   3 +
 .../api_accuracy_checker.py                   |   4 +
 .../api_accuracy_checker/api_runner.py        |  11 +-
 .../bench_functions/flash_attention_score.py  | 603 ++++++++++++++++++
 .../bench_functions/fusion_operator.py        |  25 +
 5 files changed, 643 insertions(+), 3 deletions(-)
 create mode 100644 debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
 create mode 100644 debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py

diff --git a/debug/accuracy_tools/msprobe/core/common/const.py b/debug/accuracy_tools/msprobe/core/common/const.py
index d9623b80712..d8aaa7f1e75 100644
--- a/debug/accuracy_tools/msprobe/core/common/const.py
+++ b/debug/accuracy_tools/msprobe/core/common/const.py
@@ -543,6 +543,7 @@ class MsCompareConst:
     MINT = "Mint"
     MINT_FUNCTIONAL = "MintFunctional"
     TENSOR_API = "Tensor"
+    FUNCTIONAL_API = "Functional"
 
     API_NAME_STR_LENGTH = 4
     MAX_RECURSION_DEPTH = 20
@@ -559,6 +560,8 @@ class MsCompareConst:
     MT_VALID_API_TYPES = [
         MINDTORCH, MINDTORCH_FUNC, MINDTORCH_TENSOR
     ]
+    SUPPORTED_FUSION_LIST = ["flash_attention_score"]
+
 
     TASK_FIELD = "task"
     STATISTICS_TASK = "statistics"
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_accuracy_checker.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_accuracy_checker.py
index 98c6b4b9853..47bcc7e9f6c 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_accuracy_checker.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_accuracy_checker.py
@@ -156,6 +156,7 @@ class ApiAccuracyChecker:
         real_api_str = Const.SEP.join(api_name_str_list[1:-2])
         api_list = load_yaml(yaml_path)
         supported_tensor_api_list = api_list.get(MsCompareConst.SUPPORTED_TENSOR_LIST_KEY)
+        supported_fusion_api_list = MsCompareConst.SUPPORTED_FUSION_LIST
         if api_type_str in (MsCompareConst.MINT, MsCompareConst.MINT_FUNCTIONAL) \
                 and global_context.get_framework() == Const.MS_FRAMEWORK:
             return True
@@ -165,6 +166,9 @@ class ApiAccuracyChecker:
         if api_type_str == MsCompareConst.TENSOR_API and real_api_str in supported_tensor_api_list \
                 and global_context.get_framework() == Const.MS_FRAMEWORK:
             return True
+        if api_type_str == MsCompareConst.FUNCTIONAL_API and real_api_str in supported_fusion_api_list \
+                and global_context.get_framework() == Const.MS_FRAMEWORK:
+            return True
         return False
 
     def parse(self, api_info_path):
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
index f42702be0b1..de6678c7b62 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
@@ -20,6 +20,7 @@ from msprobe.core.common.exceptions import ApiAccuracyCheckerException
 from msprobe.mindspore.api_accuracy_checker.compute_element import ComputeElement
 from msprobe.mindspore.api_accuracy_checker.type_mapping import float_dtype_str_list, torch_dtype_to_dtype_str
 from msprobe.mindspore.api_accuracy_checker.utils import convert_to_tuple
+from msprobe.mindspore.api_accuracy_checker.bench_functions.fusion_operator import fusion
 from msprobe.mindspore.common.log import logger
 
 
@@ -64,7 +65,9 @@ api_parent_module_mapping = {
     (MsCompareConst.MINDTORCH_FUNC, Const.MT_FRAMEWORK): mindtorch_func,
     (MsCompareConst.MINDTORCH_FUNC, Const.PT_FRAMEWORK): torch.nn.functional,
     (MsCompareConst.MINDTORCH_DIST, Const.MT_FRAMEWORK): mindtorch_dist,
-    (MsCompareConst.MINDTORCH_DIST, Const.PT_FRAMEWORK): torch.distributed
+    (MsCompareConst.MINDTORCH_DIST, Const.PT_FRAMEWORK): torch.distributed,
+    (MsCompareConst.FUNCTIONAL_API, Const.MS_FRAMEWORK): mindspore.ops,
+    (MsCompareConst.FUNCTIONAL_API, Const.PT_FRAMEWORK): fusion
 
 }
 
@@ -83,7 +86,9 @@ api_parent_module_str_mapping = {
     (MsCompareConst.MINDTORCH_FUNC, Const.MT_FRAMEWORK): "mindtorch_func",
     (MsCompareConst.MINDTORCH_FUNC, Const.PT_FRAMEWORK): "torch.nn.functional",
     (MsCompareConst.MINDTORCH_DIST, Const.MT_FRAMEWORK): "mindtorch_dist",
-    (MsCompareConst.MINDTORCH_DIST, Const.PT_FRAMEWORK): "torch.distributed"
+    (MsCompareConst.MINDTORCH_DIST, Const.PT_FRAMEWORK): "torch.distributed",
+    (MsCompareConst.FUNCTIONAL_API, Const.MS_FRAMEWORK): "mindspore.ops",
+    (MsCompareConst.FUNCTIONAL_API, Const.PT_FRAMEWORK): "fusion"
 }
 
 
@@ -125,7 +130,7 @@ class ApiRunner:
             err_msg = f"ApiRunner.get_info_from_name failed: api_name_str: {api_name_str} is not in defined format"
             logger.error_log_with_exp(err_msg, ApiAccuracyCheckerException(ApiAccuracyCheckerException.WrongValue))
         api_type_str, api_sub_name = api_name_list[0], api_name_list[1]
-        if api_type_str not in [MsCompareConst.MINT, MsCompareConst.MINT_FUNCTIONAL, MsCompareConst.TENSOR_API] \
+        if api_type_str not in [MsCompareConst.MINT, MsCompareConst.MINT_FUNCTIONAL, MsCompareConst.TENSOR_API, MsCompareConst.FUNCTIONAL_API] \
                 and api_platform == Const.MS_FRAMEWORK:
             err_msg = f"ApiRunner.get_info_from_name failed: not mint, mint.nn.functional or Tensor api"
             logger.error_log_with_exp(err_msg, ApiAccuracyCheckerException(ApiAccuracyCheckerException.WrongValue))
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
new file mode 100644
index 00000000000..97883ba74a8
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
@@ -0,0 +1,603 @@
+import mindspore as ms
+
+from collections import namedtuple
+import torch
+import torch.nn as nn
+import numpy as np
+from einops import rearrange
+
+from msprobe.pytorch.common.utils import logger
+from msprobe.core.common.const import Const, CompareConst
+
+GTYPE = torch.float64  # arm host必须选择float64，x86环境选择float32即可，64也行。arm计算很慢，s=8k的场景建议使用x86
+SOFTMAX_BUILD_MODE = "QKV"  # "MAX_SUM"
+
+FaForwardParams = namedtuple("FaForwardParams",
+                             ["q", "k", "v", "drop_mask", "attn_mask", "pse", "scalar_value", "keep_prob"])
+FaBackwardParams = namedtuple("FaBackwardParams",
+                              ["dx", "q", "k", "v", "softmax_res", "drop_mask", "pse", "scalar_value", "keep_prob"])
+RebuildSoftmaxParams = namedtuple("RebuildSoftmaxParams",
+                                  ["q", "k", "attn_mask", "pse", "scalar_value", "softmax_max", "softmax_sum"])
+
+
+def softmax_forward(x):
+    x_max = torch.max(x, dim=-1, keepdims=True)[0]
+    x_sub = x.sub(x_max)
+    y = torch.exp(x_sub)
+    x_sum = y.sum(dim=-1, keepdims=True)
+    res = y.div(x_sum)
+    return res, x_max, x_sum
+
+
+def softmax_grad(dp, softmax_res):
+    muls = dp * softmax_res
+    muls_r = muls.sum(dim=-1, keepdims=True)
+    sub_r = dp - muls_r
+    res = sub_r * softmax_res
+    return res
+
+
+def broadcast_kv(num_heads, num_kv_heads, kv_tensor, dtype):
+    if num_kv_heads == 0 or num_kv_heads > num_heads:
+        raise ValueError(f"num_kv_heads must be non-zero and bigger than num_heads.")
+
+    factor = num_heads // num_kv_heads
+    kv_shape = kv_tensor.shape
+    b = kv_shape[0]
+    s = kv_shape[2]
+    d = kv_shape[3]
+    kv_res = torch.zeros([b, num_heads, s, d]).to(dtype)
+    for i in range(num_heads):
+        j = i // factor
+        kv_res[:, i:i + 1, :, :] = kv_tensor[:, j:j + 1, :, :]
+    return kv_res
+
+
+def calculate_qk(q, k, attn_mask, pse, scalar_value):
+    print(f"q shape: {q.shape if q is not None else 'None'}")
+    print(f"k shape: {k.shape if k is not None else 'None'}")
+    print(f"attn_mask shape: {attn_mask.shape if attn_mask is not None else 'None'}")
+    print(f"pse: {pse if pse is not None else 'None'}")
+    print(f"scalar_value: {scalar_value if scalar_value is not None else 'None'}")
+    # print(f"q shape: {q.shape}")
+    # print(f"k shape: {k.shape}")
+    assert k.dim() == 4, f"k tensor dimension must be 4, but got {k.dim()} dimensions (shape: {k.shape})"
+    if k.dim() == 3:
+        k = k.unsqueeze(1)  # 在head维度扩展
+        print(f"Adjusted k shape: {k.shape}")
+
+    if pse is None or len(pse.shape) == 0:
+        qk = torch.matmul(q, k.permute(0, 1, 3, 2)).mul(scalar_value)
+    else:
+        qk = (torch.matmul(q, k.permute(0, 1, 3, 2)) + pse).mul(scalar_value)
+    if attn_mask is None or len(attn_mask.shape) == 0:
+        return qk
+    else:
+        qk = qk + attn_mask.bool() * (-40000.0)  # -10000
+    return qk
+
+
+def fusion_attention_forward(forward_params):
+    q = forward_params.q
+    k = forward_params.k
+    v = forward_params.v
+    drop_mask = forward_params.drop_mask
+    attn_mask = forward_params.attn_mask
+    pse = forward_params.pse
+    scalar_value = forward_params.scalar_value
+    keep_prob = forward_params.keep_prob
+    print(f"q shape: {q.shape} | k shape: {k.shape} | attn_mask shape: {attn_mask.shape}")
+
+    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
+    softmax_res, softmax_max, softmax_sum = softmax_forward(qk)
+    if drop_mask is None or len(drop_mask.shape) == 0:
+        drop_res = softmax_res
+    else:
+        drop_res = softmax_res * drop_mask * (1.0 / keep_prob)
+    y = torch.matmul(drop_res, v)
+    return y, softmax_max, softmax_sum
+
+
+def fusion_attention_backward(backward_params):
+    dx = backward_params.dx
+    q = backward_params.q
+    k = backward_params.k
+    v = backward_params.v
+    softmax_res = backward_params.softmax_res
+    drop_mask = backward_params.drop_mask
+    pse = backward_params.pse
+    scalar_value = backward_params.scalar_value
+    keep_prob = backward_params.keep_prob
+    dp = torch.matmul(dx, v.permute(0, 1, 3, 2))
+    if drop_mask is None or len(drop_mask.shape) == 0:
+        drop_res = softmax_res.permute(0, 1, 3, 2)
+        dp_drop = dp
+    else:
+        drop_res = softmax_res.mul(drop_mask).mul(1.0 / keep_prob).permute(0, 1, 3, 2)
+        dp_drop = dp * drop_mask * (1.0 / keep_prob)
+    dv = torch.matmul(drop_res, dx)
+    softmax_grad_res = (softmax_grad(dp_drop, softmax_res) * scalar_value)
+    dq = torch.matmul(softmax_grad_res, k)
+    dk = torch.matmul(softmax_grad_res.permute(0, 1, 3, 2), q)
+    return dq, dk, dv
+
+
+def parse_bsnd_args(query, key, head_num, input_layout):
+    supported_input_layout = ["BSH", "SBH", "BSND", "BNSD", "TND"]
+    b, s1, s2, n1, n2, d, h1, h2 = None, None, None, head_num, None, None, None, None
+
+    if not isinstance(input_layout, str) or input_layout not in supported_input_layout:
+        raise ValueError(f"Invalid input_layout arg which must be one of {supported_input_layout}.")
+
+    if input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    try:
+        if input_layout == "BSH":
+            b, s1, h1 = query.shape
+            _, s2, h2 = key.shape
+            d = h1 // n1
+            n2 = h2 // d
+        elif input_layout == "SBH":
+            s1, b, h1 = query.shape
+            s2, _, h2 = key.shape
+            d = h1 // n1
+            n2 = h2 // d
+        elif input_layout == "BSND":
+            b, s1, n1, d = query.shape
+            _, s2, n2, _ = key.shape
+            h1 = n1 * d
+            h2 = n2 * d
+        elif input_layout == "BNSD":
+            b, n1, s1, d = query.shape
+            _, n2, s2, _ = key.shape
+            h1 = n1 * d
+            h2 = n2 * d
+    except Exception as e:
+        raise ValueError(f"query.shape: {query.shape}, key.shape: {key.shape}, parse_bsnd_args error: {e}") from e
+
+    if d == 0:
+        raise ValueError(f"Value d must be non-zero.")
+    _dtype = query.dtype
+    ret = (b, s1, s2, n1, n2, d, h1, h2, _dtype)
+    return ret
+
+
+def convert_from_bnsd(_input, input_layout):
+    """
+    transform qkv from bnsd to input_layout.
+    B: batch_size
+    S: sequence_length
+    N: num_heads
+    D: head_dim
+    Args:
+       _input (torch.Tensor): tensor of shape (B,N,S,D)
+        input_layout (str): "BSH" or "SBH" or "BSND" or "BNSD" or "TND"
+    Returns:
+        tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
+    """
+    if input_layout == "BSH":
+        # (B,N,S,D)=>(B,S,N*D)
+        out = rearrange(_input, 'b n s d -> b s (n d)').contiguous()
+    elif input_layout == "SBH":
+        # (B,N,S,D)=>(S,B,N*D)
+        out = rearrange(_input, 'b n s d -> s b (n d)').contiguous()
+    elif input_layout == "BSND":
+        # (B,N,S,D)=>(B,S,N,D)
+        out = rearrange(_input, 'b n s d -> b s n d').contiguous()
+    elif input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    else:
+        out = _input
+    return out
+
+
+def convert_to_bnsd(_input, n, input_layout):
+    """
+    transform qkv from input_layout to bnsd.
+    B: batch_size
+    S: sequence_length
+    N: num_heads
+    D: head_dim
+    Args:
+        _input (torch.Tensor): tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
+        n (int): num_heads
+        input_layout (str):"BSH" or "SBH" or "BSND" or "BNSD" or "TND"
+    Returns:
+        tensor of shape (B,N,S,D)
+    """
+    if input_layout == "BSH":
+        # (B,S,N*D)=>(B,N,S,D)
+        out = rearrange(_input, 'b s (n d) -> b n s d', n=n)
+    elif input_layout == "SBH":
+        # (S,B,N*D)=>(B,N,S,D)
+        out = rearrange(_input, 's b (n d) -> b n s d', n=n)
+    elif input_layout == "BSND":
+        # (B,S,N,D)=>(B,N,S,D)
+        out = rearrange(_input, 'b s n d -> b n s d', n=n)
+    elif input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    else:
+        out = _input
+    if out.dim() != 4:
+        raise ValueError(f"convert qkv format failed with input_layout {input_layout}.")
+    return out.to(GTYPE)
+
+
+def convert_from_bsnd(_input, input_layout):
+    """
+    transform qkv from bsnd to input_layout.
+    B: batch_size
+    S: sequence_length
+    N: num_heads
+    D: head_dim
+    Args:
+       _input (torch.Tensor): tensor of shape (B,S,N,D)
+        input_layout (str): "BSH" or "SBH" or "BSND" or "BNSD" or "TND"
+    Returns:
+        tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
+    """
+    if input_layout == "BSH":
+        # (B,S,N,D)=>(B,S,N*D)
+        out = rearrange(_input, 'b s n d -> b s (n d)').contiguous()
+    elif input_layout == "SBH":
+        # (B,S,N,D)=>(S,B,N*D)
+        out = rearrange(_input, 'b s n d -> s b (n d)').contiguous()
+    elif input_layout == "BNSD":
+        # (B,S,N,D)=>(B,N,S,D)
+        out = rearrange(_input, 'b s n d -> b n s d').contiguous()
+    elif input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    else:
+        out = _input
+    return out
+
+
+def convert_to_bsnd(_input, n, input_layout):
+    """
+    transform qkv from input_layout to bsnd.
+    B: batch_size
+    S: sequence_length
+    N: num_heads
+    D: head_dim
+    Args:
+        _input (torch.Tensor): tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
+        n (int): num_heads
+        input_layout (str):"BSH" or "SBH" or "BSND" or "BNSD" or "TND"
+    Returns:
+        tensor of shape (B,S,N,D)
+    """
+    if input_layout == "BSH":
+        # (B,S,N*D)=>(B,S,N,D)
+        out = rearrange(_input, 'b s (n d) -> b s n d', n=n)
+    elif input_layout == "SBH":
+        # (S,B,N*D)=>(B,S,N,D)
+        out = rearrange(_input, 's b (n d) -> b s n d', n=n)
+    elif input_layout == "BNSD":
+        # (B,N,S,D)=>(B,S,N,D)
+        out = rearrange(_input, 'b n s d -> b s n d', n=n)
+    elif input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    else:
+        out = _input
+    if out.dim() != 4:
+        raise ValueError(f"convert qkv format failed with input_layout {input_layout}.")
+    return out
+
+
+def generate_attn_mask(*args):
+    """
+    # 当sparse_mode=2、3、4时小算子到融合算子会走这个优化，反过来看就要拆解回原来的基本实现
+    ===> attn_mask = torch.from_numpy(np.triu(np.ones([2048, 2048]), k=1)).to(dtype)
+    """
+
+    sparse_mode, attn_mask, b, n1, s1, s2, pre_tocken, next_tocken, dtype = args
+    shape = [s1, s2]
+
+    if attn_mask is not None:
+        # 当FA的输入已经包含attn_mask时，可以认为已经是转换之后的mask矩阵了，有三种特殊场景，即稀疏矩阵场景，需要进行逆向还原
+        if sparse_mode == 2 or sparse_mode == 3 or sparse_mode == 4:
+            logger.info(f"s1: {s1}, s2:{s2}, attn_mask.shape:{attn_mask.shape}, attn_mask.dtype:{attn_mask.dtype}")
+
+            if attn_mask.dim() == 2 and attn_mask.shape[0] == 2048 and attn_mask.shape[1] == 2048:
+                if attn_mask.equal(torch.from_numpy(np.triu(np.ones([2048, 2048]), k=1)).to(attn_mask.dtype)):
+                    if sparse_mode == 2:
+                        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=1))
+                    elif sparse_mode == 3:
+                        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=s2 - s1 + 1))
+                    elif sparse_mode == 4:
+                        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
+                        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
+                        attn_mask = attn_mask_u + attn_mask_l
+                    logger.debug(f"反向转换attn_mask {attn_mask.shape}")
+                    return attn_mask.to(dtype)
+
+        return attn_mask.to(dtype)
+
+    if attn_mask is not None:
+        if attn_mask.dim() == 2:
+            if attn_mask.shape[0] != s1 or attn_mask.shape[1] != s2:
+                raise ValueError(f"Invalid attn_mask shape `SS` {attn_mask.shape}")
+            shape = [s1, s2]
+        elif attn_mask.dim() == 4:
+            if attn_mask.shape[1] == 1:
+                shape = [b, 1, s1, s2] if b != 1 else [1, 1, s1, s2]
+            else:
+                shape = [b, n1, s1, s2] if b != 1 else [1, n1, s1, s2]
+
+    if sparse_mode == 0:
+        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
+        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
+        attn_mask = attn_mask_u + attn_mask_l
+    elif sparse_mode == 1:  # no sparse
+        attn_mask = torch.from_numpy(np.zeros(shape))
+    elif sparse_mode == 2:
+        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=1))
+    elif sparse_mode == 3:
+        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=s2 - s1 + 1))
+    elif sparse_mode == 4:
+        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
+        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
+        attn_mask = attn_mask_u + attn_mask_l
+    # 注:不会出现sparse_mode=5的情况，该情况要求必须要传入attn_mask，且attn_mask矩阵数据格式须为BNSS或B1SS，
+    # 因此可以认为FA的输入已经是正确的attn_mask了
+    return attn_mask.to(dtype)
+
+
+def generate_kv(key, value, n1, n2):
+    # N不等长适配by cdy
+    if not (n1 == n2):
+        k_new = broadcast_kv(n1, n2, key, key.dtype)
+        v_new = broadcast_kv(n1, n2, value, value.dtype)
+    else:
+        k_new = key
+        v_new = value
+    return k_new, v_new
+
+
+def rebuid_softmax_by_qkv(q, k, attn_mask, pse, scalar_value):
+    """
+    attention = softmax(QK^T/sqrt(d))V
+    softmax(x_i) = e^(x_i - x_max) / sum(e^(x_i - x_max))
+    """
+    logger.info("Using QKV to rebuild original softmax")
+    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
+    softmax_res, _, _ = softmax_forward(qk)
+    return softmax_res
+
+
+def rebuild_softmax_by_max_sum(softmax_params):
+    """
+    attention = softmax(QK^T/sqrt(d))V
+    softmax(x_i) = e^(x_i - x_max_i) / x_sum_i)
+    """
+    q = softmax_params.q
+    k = softmax_params.k
+    attn_mask = softmax_params.attn_mask
+    pse = softmax_params.pse
+    scalar_value = softmax_params.scalar_value
+    softmax_max = softmax_params.softmax_max
+    softmax_sum = softmax_params.softmax_sum
+    logger.info("Using softmax_max and softmax_sum to rebuild original softmax")
+
+    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
+    if softmax_max.shape[-1] == 0:
+        raise ValueError(f"softmax_max.shape[-1] must be non-zero, softmax_max.shape: {softmax_max.shape}")
+    repeat_dim = qk.shape[-1] // softmax_max.shape[-1]
+    softmax_res = torch.exp(qk.sub(softmax_max.repeat(1, 1, 1, repeat_dim))).div(
+        softmax_sum.repeat(1, 1, 1, repeat_dim))
+    return softmax_res
+
+
+def get_head_num(*args, **kwargs):
+    if kwargs.get("head_num", None):
+        head_num = kwargs.get("head_num")
+    elif len(args) >= 4:
+        head_num = args[3]
+    else:
+        raise ValueError(f"Unsupported npu_fusion_attention args {args}.")
+    return head_num
+
+
+def get_input_layout(*args, **kwargs):
+    if kwargs.get("input_layout", None):
+        input_layout = kwargs.get("input_layout")
+    elif len(args) >= 5:
+        input_layout = args[4]
+    else:
+        raise ValueError(f"Unsupported npu_fusion_attention args {args}.")
+    return input_layout
+
+
+def npu_fusion_attention_forward_patch(*args, **kwargs):
+    if len(args) < 2:
+        raise RuntimeError("npu_fusion_attention_forward_patch: length of args should greater than or equal to 2.")
+
+    # query, key, value, head_num, input_layout
+    head_num = get_head_num(*args, **kwargs)
+    input_layout = get_input_layout(*args, **kwargs)
+
+    b, s1, s2, n1, n2, d, h1, h2, dtype = parse_bsnd_args(args[0], args[1], head_num, input_layout)
+    if n1 == n2 and s1 == s2:
+        logger.debug(f"running case : BNSD = {b}_{n1}_{s1}_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
+    else:
+        logger.debug(f"running case: BNSD = {b}_{n1}({n2})_{s1}({s2})_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
+    if not (n1 % n2 == 0 and n1 >= n2):
+        raise ValueError(f"N1与N2不匹配,请检查: n1 = {n1}, n2 = {n2}.")
+
+    dims_kwargs = {
+        "b": b, "s1": s1, "s2": s2, "n1": n1, "n2": n2,
+        "d": d, "h1": h1, "h2": h2, "dtype": dtype
+    }
+    print(f"kwargs123:{kwargs}")
+    new_kwargs = {
+        "keep_prob": 1,
+        "scalar_value": kwargs.get("scalar_value", 1 / (d ** 0.5)),
+        "sparse_mode": kwargs.get("sparse_mode", 0),
+        "prefix": kwargs.get("prefix"),
+        "pre_tockens": kwargs.get("pre_tockens", 2147483647),
+        "next_tockens": kwargs.get("next_tockens", 2147483647),
+        "pse": kwargs.get("pse"),
+        "padding_mask": kwargs.get("padding_mask"),
+        "attn_mask": kwargs.get("attn_mask")
+    }
+    print(f"new_kwargs123:{new_kwargs}")
+
+    return args, dims_kwargs, new_kwargs
+
+
+def npu_fusion_attention_backward_patch(*args, **kwargs):
+    if len(args) != 6:
+        raise ValueError(f"Unsupported npu_fusion_attention_grad args {args}.")
+
+    b, s1, s2, n1, n2, d, h1, h2, dtype = parse_bsnd_args(args[0], args[1], args[4], args[5])
+    if n1 == n2 and s1 == s2:
+        logger.info(f"running case : bnsd = {b}_{n1}_{s1}_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
+    else:
+        logger.info(f"running case: bnsd = {b}_{n1}({n2})_{s1}({s2})_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
+    if not (n1 % n2 == 0 and n1 >= n2):
+        raise ValueError(f"N1与N2不匹配,请检查: n1 = {n1}, n2 = {n2}.")
+
+    dims_kwargs = {
+        "b": b, "s1": s1, "s2": s2, "n1": n1, "n2": n2,
+        "d": d, "h1": h1, "h2": h2, "dtype": dtype
+    }
+
+    new_kwargs = {
+        "keep_prob": 1,
+        "scalar_value_value": kwargs.get("scalar_value_value", 1 / (d ** 0.5)),
+        "sparse_mode": kwargs.get("sparse_mode", 0),
+        "prefix": kwargs.get("prefix"),
+        "pre_tockens": kwargs.get("pre_tockens", 2147483647),
+        "next_tockens": kwargs.get("next_tockens", 2147483647),
+        "pse": kwargs.get("pse"),
+        "padding_mask": kwargs.get("padding_mask"),
+        "softmax_max": kwargs.get("softmax_max"),
+        "softmax_sum": kwargs.get("softmax_sum"),
+        "softmax_in": kwargs.get("softmax_in"),
+        "attention_in": kwargs.get("attention_in"),
+        "seed": kwargs.get("seed", 0),
+        "offset": kwargs.get("offset", 0),
+        "numels": kwargs.get("numels", 0),
+        "attn_mask": kwargs.get("attn_mask")
+    }
+
+    return args, dims_kwargs, new_kwargs
+
+
+class FlashAttentionScore(nn.Module):
+    def __init__(self):
+        super(FlashAttentionScore, self).__init__()
+        # You can initialize any parameters here if necessary
+
+    def forward(self, *inputs, **kwargs):
+        # Extract the inputs for the attention calculation
+        print(f"inputs: {inputs}")
+        print(f"kwargs: {kwargs}")
+
+        new_args, dims_kwargs, new_kwargs = npu_fusion_attention_forward_patch(*inputs, **kwargs)
+        query, key, value = new_args[0], new_args[1], new_args[2]
+        print(f"new_args: {new_args}, dims_kwargs: {dims_kwargs}, new_kwargs: {new_kwargs}")
+
+        input_layout = get_input_layout(*inputs, **kwargs)
+
+        n1 = dims_kwargs.get("n1")
+        n2 = dims_kwargs.get("n2")
+        s1 = dims_kwargs.get("s1")
+        s2 = dims_kwargs.get("s2")
+        b = dims_kwargs.get("b")
+        dtype = dims_kwargs.get("dtype")
+        attn_mask = new_kwargs.get("attn_mask")
+        keep_prob = new_kwargs.get("keep_prob")
+        sparse_mode = new_kwargs.get("sparse_mode")
+        pre_tockens = new_kwargs.get("pre_tockens")
+        next_tockens = new_kwargs.get("next_tokens")
+        pse = new_kwargs.get("real_shift")
+        scalar_value = new_kwargs.get("scalar_value")
+
+        args_temp = [sparse_mode, attn_mask, b, n1, s1, s2, pre_tockens, next_tockens, dtype]
+        print(f"args_temp: {args_temp}")
+
+        attn_mask = generate_attn_mask(*args_temp)
+        query = convert_to_bnsd(query, n1, input_layout)
+        key = convert_to_bnsd(key, n2, input_layout)
+        value = convert_to_bnsd(value, n2, input_layout)
+
+        k_new, v_new = generate_kv(key, value, n1, n2)
+
+        forward_params = FaForwardParams(
+            q=query,
+            k=key,
+            v=value,
+            drop_mask=None,
+            attn_mask=attn_mask,
+            pse=pse,
+            scalar_value=scalar_value,
+            keep_prob=keep_prob
+        )
+
+        out_golden, softmax_max, softmax_sum = fusion_attention_forward(forward_params)
+
+        # If output dimension is 5, reshape accordingly
+        if out_golden.dim() == 5:
+            out_golden = out_golden.reshape(out_golden.size(0), out_golden.size(1) * out_golden.size(2),
+                                            out_golden.size(3), out_golden.size(4))
+
+        out_golden = convert_from_bnsd(out_golden, input_layout)
+
+        # Ensure the output matches the desired layout
+        out_golden = out_golden.cpu(), softmax_max.repeat(1, 1, 1, 8).cpu(), softmax_sum.repeat(1, 1, 1, 8).cpu()
+
+        return out_golden
+
+    def backward(self, *inputs, **kwargs):
+        # The backward pass will be similar to what was described for the gradient computation
+        new_args, dims_kwargs, new_kwargs = npu_fusion_attention_backward_patch(*inputs, **kwargs)
+        query, key, value, dx, input_layout = new_args[0], new_args[1], new_args[2], new_args[3], new_args[5]
+        n1 = dims_kwargs.get("n1")
+        n2 = dims_kwargs.get("n2")
+        s1 = dims_kwargs.get("s1")
+        s2 = dims_kwargs.get("s2")
+        b = dims_kwargs.get("b")
+        dtype = dims_kwargs.get("dtype")
+        attn_mask = new_kwargs.get("attn_mask")
+        keep_prob = new_kwargs.get("keep_prob")
+        sparse_mode = new_kwargs.get("sparse_mode")
+        pre_tockens = new_kwargs.get("pre_tockens")
+        next_tockens = new_kwargs.get("next_tockens")
+        pse = new_kwargs.get("pse")
+        softmax_max = new_kwargs.get("softmax_max")
+        softmax_sum = new_kwargs.get("softmax_sum")
+        scalar_value = new_kwargs.get("scalar_value")
+
+        args_temp = [sparse_mode, attn_mask, b, n1, s1, s2, pre_tockens, next_tockens, dtype]
+        attn_mask = generate_attn_mask(*args_temp)
+
+        query = convert_to_bnsd(query, n1, input_layout)
+        dx = convert_to_bnsd(dx, n1, input_layout)
+        key = convert_to_bnsd(key, n2, input_layout)
+        value = convert_to_bnsd(value, n2, input_layout)
+
+        k_new, v_new = generate_kv(key, value, n1, n2)
+
+        if SOFTMAX_BUILD_MODE == "QKV":
+            softmax_res = rebuid_softmax_by_qkv(query, k_new, attn_mask, pse, scalar_value)
+        else:
+            softmax_params = RebuildSoftmaxParams(query, k_new, attn_mask, pse, scalar_value, softmax_max, softmax_sum)
+            softmax_res = rebuild_softmax_by_max_sum(softmax_params)
+
+        backward_params = FaBackwardParams(dx, query, k_new, v_new, softmax_res, None, pse, scalar_value, keep_prob)
+        dq, dk, dv = fusion_attention_backward(backward_params)
+
+        # Reshape as needed
+        if dq.dim() == 5:
+            dq = dq.reshape(dq.size(0), dq.size(1) * dq.size(2), dq.size(3), dq.size(4))
+        if dk.dim() == 5:
+            dk = dk.reshape(dk.size(0), dk.size(1) * dk.size(2), dk.size(3), dk.size(4))
+        if dv.dim() == 5:
+            dv = dv.reshape(dv.size(0), dv.size(1) * dv.size(2), dv.size(3), dv.size(4))
+
+        dq = convert_from_bnsd(dq, input_layout)
+        dk = convert_from_bnsd(dk, input_layout)
+        dv = convert_from_bnsd(dv, input_layout)
+
+        return dq.cpu(), dk.cpu(), dv.cpu()
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py
new file mode 100644
index 00000000000..78142f6d083
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py
@@ -0,0 +1,25 @@
+
+from msprobe.mindspore.api_accuracy_checker.bench_functions.flash_attention_score import FlashAttentionScore
+
+class FusionOperator:
+    """
+    所有融合算子的父类，定义了通用的接口和属性。
+    """
+
+    # 初始化操作符字典
+    def __init__(self):
+        self.flash_attention_score = None  # 用于存放 FlashAttentionScore 操作符
+        self._register_operators()
+
+    def _register_operators(self):
+        """ 注册操作符到父类，以便通过 ops.xxx 调用 """
+        self.flash_attention_score = FlashAttentionScore()
+
+    def __getattr__(self, name):
+        """ 动态获取算子类 """
+        if hasattr(self, name):
+            return getattr(self, name)
+        else:
+            raise AttributeError(f"'FusionOperator' object has no attribute '{name}'")
+
+fusion = FusionOperator()
\ No newline at end of file
-- 
Gitee


From 45afc5e983f6c0d3b19026b16d74c8ff5dac9762 Mon Sep 17 00:00:00 2001
From: qianggee <qjchenb@163.com>
Date: Fri, 28 Feb 2025 02:27:54 +0000
Subject: [PATCH 037/145] fix grad sync bug

---
 debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py b/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
index eea2bdbc2d2..286ec298ba2 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
@@ -1052,7 +1052,7 @@ class TrainerMon:
             self.enable_megatron = True
             logger.info("megatron version is > core_r0.8.0 <= core_r0.9.0")
         except ImportError:
-            self.enable_megatron = False
+            self.enable_megatron = False | self.enable_megatron
 
         if not self.enable_megatron:
             self._hook_weights()
-- 
Gitee


From ef229d0fedd79b0750d160019398d7bcdb323fe3 Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Fri, 28 Feb 2025 10:32:22 +0800
Subject: [PATCH 038/145] update_msprof_analyze_whl

---
 profiler/msprof_analyze/README.md   | 1 +
 profiler/msprof_analyze/version.txt | 2 +-
 2 files changed, 2 insertions(+), 1 deletion(-)

diff --git a/profiler/msprof_analyze/README.md b/profiler/msprof_analyze/README.md
index 7e2267a5559..d39aea89a52 100644
--- a/profiler/msprof_analyze/README.md
+++ b/profiler/msprof_analyze/README.md
@@ -117,6 +117,7 @@ Successfully installed msprof-analyze-{version}
 
 | profiler版本 | 发布日期       | 下载链接                                                                                                                                      | 校验码                                                       |
 |------------|------------|-------------------------------------------------------------------------------------------------------------------------------------------| ------------------------------------------------------------ |
+| 2.0.1      | 2025-02-28 | [msprof_analyze-2.0.1-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/profiler/package/2.0.1/msprof_analyze-2.0.1-py3-none-any.whl) | 82dfe2c779dbab9015f61d36ea0c32d832b6d182454b3f7db68e6c0ed49c0423 |
 | 2.0.0      | 2025-02-08 | [msprof_analyze-2.0.0-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/profiler/package/2.0.0/msprof_analyze-2.0.0-py3-none-any.whl) | 8e44e5f3e7681c377bb2657a600ad9841d3bed11061ddd7844c30e8a97242101 |
 | 1.3.4      | 2025-01-20 | [msprof_analyze-1.3.4-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/profiler/package/1.3.4/msprof_analyze-1.3.4-py3-none-any.whl) | 8de92188d1a97105fb14cadcb0875ccd5f66629ee3bb25f37178da1906f4cce2 |
 | 1.3.3      | 2024-12-26 | [msprof_analyze-1.3.3-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/profiler/package/1.3.3/msprof_analyze-1.3.3-py3-none-any.whl) | 27676f2eee636bd0c65243f81e292c7f9d30d7f985c772ac9cbaf10b54d3584e |
diff --git a/profiler/msprof_analyze/version.txt b/profiler/msprof_analyze/version.txt
index 359a5b952d4..10bf840ed53 100644
--- a/profiler/msprof_analyze/version.txt
+++ b/profiler/msprof_analyze/version.txt
@@ -1 +1 @@
-2.0.0
\ No newline at end of file
+2.0.1
\ No newline at end of file
-- 
Gitee


From 6c779c54bba5feb1a9f4bf8be8e00e70d3d15ec4 Mon Sep 17 00:00:00 2001
From: qianzhengxin <paulqian29@163.com>
Date: Fri, 28 Feb 2025 10:38:47 +0800
Subject: [PATCH 039/145] save tuple fix

---
 debug/accuracy_tools/msprobe/mindspore/common/utils.py | 4 ++--
 debug/accuracy_tools/msprobe/pytorch/common/utils.py   | 4 ++--
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/common/utils.py b/debug/accuracy_tools/msprobe/mindspore/common/utils.py
index ded3faaa22b..b205dabc6a3 100644
--- a/debug/accuracy_tools/msprobe/mindspore/common/utils.py
+++ b/debug/accuracy_tools/msprobe/mindspore/common/utils.py
@@ -182,9 +182,9 @@ def set_register_backward_hook_functions():
 
 def check_save_param(variable, name, save_backward):
     # try catch this api to skip invalid call
-    if not isinstance(variable, (list, dict, ms.Tensor, int, float, str)):
+    if not isinstance(variable, (list, dict, tuple, ms.Tensor, int, float, str)):
         logger.warning("PrecisionDebugger.save variable type not valid, "
-                       "should be one of list, dict, ms.Tensor, int, float or string. "
+                       "should be one of list, dict, tuple, ms.Tensor, int, float or string. "
                        "Skip current save process.")
         raise ValueError
     if not isinstance(name, str):
diff --git a/debug/accuracy_tools/msprobe/pytorch/common/utils.py b/debug/accuracy_tools/msprobe/pytorch/common/utils.py
index 16067f6d2be..4e82bee4a04 100644
--- a/debug/accuracy_tools/msprobe/pytorch/common/utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/common/utils.py
@@ -449,9 +449,9 @@ def is_recomputation():
 
 def check_save_param(variable, name, save_backward):
     # try catch this api to skip invalid call
-    if not isinstance(variable, (list, dict, torch.Tensor, int, float, str)):
+    if not isinstance(variable, (list, dict, tuple, torch.Tensor, int, float, str)):
         logger.warning("PrecisionDebugger.save variable type not valid, "
-                       "should be one of list, dict, torch.Tensor, int, float or string. "
+                       "should be one of list, dict, tuple, torch.Tensor, int, float or string. "
                        "Skip current save process.")
         raise ValueError
     if not isinstance(name, str):
-- 
Gitee


From aaba9961754296dbb65fb7904633c45e59d9147f Mon Sep 17 00:00:00 2001
From: qianzhengxin <paulqian29@163.com>
Date: Fri, 28 Feb 2025 10:48:09 +0800
Subject: [PATCH 040/145] doc fix

---
 debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md   | 2 +-
 debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md b/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
index db9a989c9d1..c2e33436e53 100644
--- a/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
+++ b/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
@@ -183,7 +183,7 @@ save(variable, name, save_backward=True)
 **参数说明**:
 | 参数名称        | 参数含义          |        支持数据类型    |   是否必选|
 | ----------     | ------------------| ------------------- | ------------------- |
-| variable       | 需要保存的变量     |dict, list, torch.tensor, int, float, str |  是  |
+| variable       | 需要保存的变量     |dict, list, tuple, torch.tensor, int, float, str |  是  |
 | name           | 指定的名称         | str                 | 是  |
 | save_backward  | 是否保存反向数据   | boolean             | 否 |
 
diff --git a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
index f7507facd2a..96d37c170fa 100644
--- a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
@@ -144,7 +144,7 @@ save(variable, name, save_backward=True)
 **参数说明**:
 | 参数名称        | 参数含义          |        支持数据类型    |   是否必选|
 | ----------     | ------------------| ------------------- | ------------------- |
-| variable       | 需要保存的变量     |dict, list, torch.tensor, int, float, str |  是  |
+| variable       | 需要保存的变量     |dict, list, tuple, torch.tensor, int, float, str |  是  |
 | name           | 指定的名称         | str                 | 是  |
 | save_backward  | 是否保存反向数据   | boolean             | 否 |
 
-- 
Gitee


From 1291b93f40d6e4c143116f4d63166c8a91920730 Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Fri, 28 Feb 2025 10:36:27 +0800
Subject: [PATCH 041/145] base_recipe_analysis_adapt_msprof

---
 .../recipes/base_recipe_analysis.py           | 47 +++++++++++++++----
 .../msprof_analyze/prof_common/constant.py    |  1 +
 .../prof_exports/base_stats_export.py         |  3 ++
 3 files changed, 43 insertions(+), 8 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
index a8b50359253..ed60873a1ef 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
@@ -14,6 +14,7 @@
 # limitations under the License.
 import argparse
 import os
+import re
 import shutil
 import sys
 import traceback
@@ -42,6 +43,7 @@ class BaseRecipeAnalysis(ABC):
         self._recipe_name = params.get(Constant.RECIPE_NAME, "")
         self._parallel_mode = params.get(Constant.PARALLEL_MODE, "")
         self._export_type = params.get(Constant.EXPORT_TYPE, "")
+        self._is_msprof = params.get(Constant.IS_MSPROF)
         self._cluster_analysis_output_path = os.path.join(
             params.get(Constant.CLUSTER_ANALYSIS_OUTPUT_PATH, self._collection_dir), Constant.CLUSTER_ANALYSIS_OUTPUT)
         self._output_path = self._cluster_analysis_output_path if self._export_type == "db" else os.path.join(
@@ -158,16 +160,40 @@ class BaseRecipeAnalysis(ABC):
         db_paths = []
         for rank_id in rank_ids:
             rank_path = self._data_map[rank_id]
-            db_path = os.path.join(rank_path, Constant.SINGLE_OUTPUT, f"ascend_pytorch_profiler_{rank_id}.db")
-            if os.path.exists(db_path):
-                db_paths.append({Constant.RANK_ID: rank_id, Constant.PROFILER_DB_PATH: db_path,
-                                 Constant.STEP_RANGE: self._get_step_range(db_path)})
+            db_path_dict = {Constant.RANK_ID: rank_id, Constant.PROFILER_DB_PATH: "", Constant.ANALYSIS_DB_PATH: "",
+                            Constant.STEP_RANGE: {}}
+            profiler_db_path = self._get_profiler_db_path(rank_id, rank_path)
+            analysis_db_path = os.path.join(rank_path, "analyze", "communication_analyzer.db") if self._is_msprof \
+                else os.path.join(rank_path, Constant.SINGLE_OUTPUT, f"analysis.db")
+            if os.path.exists(profiler_db_path):
+                db_path_dict[Constant.PROFILER_DB_PATH] = profiler_db_path
+                db_path_dict[Constant.STEP_RANGE] = self._get_step_range(profiler_db_path)
             else:
-                logger.warning(f"DB file not found, rank id: {rank_id}, db path: {db_path}.")
+                logger.warning(f"Profiler DB file not found, rank id: {rank_id}, db path: {profiler_db_path}.")
+
+            if os.path.exists(analysis_db_path):
+                db_path_dict[Constant.ANALYSIS_DB_PATH] = analysis_db_path
+            else:
+                logger.warning(f"Analysis DB file not found, rank id: {rank_id}, db path: {analysis_db_path}.")
+            if db_path_dict.get(Constant.PROFILER_DB_PATH):
+                db_paths.append(db_path_dict)
         if invalid_rank_id:
             logger.warning(f"Invalid Rank id: [{','.join(invalid_rank_id)}].")
         return db_paths
 
+    def _get_profiler_db_path(self, rank_id, data_path):
+        if self._is_msprof:
+            msprof_db_pattern = r"^msprof_\d{14}\.db$"
+            msprof_db_list = []
+            for file_name in os.listdir(data_path):
+                if re.match(msprof_db_pattern, file_name):
+                    msprof_db_list.append(file_name)
+            if msprof_db_list:
+                msprof_db_list.sort(key=lambda x: x.split(".")[0].split("_")[-1])
+                return os.path.join(data_path, msprof_db_list[-1])
+            return os.path.join(data_path, "msprof_xx.db")
+        return os.path.join(data_path, Constant.SINGLE_OUTPUT, f"ascend_pytorch_profiler_{rank_id}.db")
+
     def _get_step_range(self, db_path):
         step_range = {}
         if self._step_id == Constant.VOID_STEP:
@@ -204,9 +230,14 @@ class BaseRecipeAnalysis(ABC):
         Extract the profiling data required for cluster analysis from each device, and then aggregate the
         results from each device to be processed by a reduce function.
         Params:
-            data_map: eg. {"RANK_ID": 1,
-                           "profiler_db_path": "xxxx/ascend_pytorch_profiler_1.db",
-                           "step_range": {"id": 2, "startNs": 12345, "endNs": 12443]}
+            data_map: eg1. {"RANK_ID": 1,
+                            "profiler_db_path": "xxx/ASCEND_PROFILER_OUTPUT/ascend_pytorch_profiler_1.db",
+                            "analysis_db_path": "xxx/ASCEND_PROFILER_OUTPUT/analysis.db",
+                            "step_range": {"id": 2, "startNs": 12345, "endNs": 12443]}
+                      eg2. {"RANK_ID": 1,
+                            "profiler_db_path": "xxx/msprof_20250227145123.db",
+                            "analysis_db_path": "xxx/analyze/communication_analyzer.db",
+                            "step_range": {"id": 2, "startNs": 12345, "endNs": 12443]}
             analysis_class: hccl_sum, compute_op_sum, cann_api_sum, mstx_sum……
         """
         pass
diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index f34aeade895..c04e429321d 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -423,6 +423,7 @@ class Constant(object):
 
     CONCURRENT_MODE = "concurrent"
     PROFILER_DB_PATH = "profiler_db_path"
+    ANALYSIS_DB_PATH = "analysis_db_path"
     RANK_LIST = "rank_list"
     EXPORT_TYPE = "export_type"
     EXTRA_ARGS = "args"
diff --git a/profiler/msprof_analyze/prof_exports/base_stats_export.py b/profiler/msprof_analyze/prof_exports/base_stats_export.py
index 65ccd69ecde..6e0ff5e211e 100644
--- a/profiler/msprof_analyze/prof_exports/base_stats_export.py
+++ b/profiler/msprof_analyze/prof_exports/base_stats_export.py
@@ -35,6 +35,9 @@ class BaseStatsExport:
 
     def read_export_db(self):
         try:
+            if not self._db_path:
+                logger.error("db path is None.")
+                return None
             query = self.get_query()
             if query is None:
                 logger.error("query is None.")
-- 
Gitee


From 9513672ff9d91205a27135aecdb26b86529620c4 Mon Sep 17 00:00:00 2001
From: wangnan39 <wangnan39@huawei.com>
Date: Wed, 26 Feb 2025 17:31:45 +0800
Subject: [PATCH 042/145] bf16/int4 support dump npy for mindspore O2

---
 .../ccsrc/core/AclDumpDataProcessor.cpp       | 20 +++--
 .../msprobe/ccsrc/core/AclTensor.cpp          | 74 ++++++++++++++++---
 .../msprobe/ccsrc/core/AclTensor.hpp          |  4 +-
 3 files changed, 80 insertions(+), 18 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumpDataProcessor.cpp b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumpDataProcessor.cpp
index 0fe3443fa1f..3f66094c624 100644
--- a/debug/accuracy_tools/msprobe/ccsrc/core/AclDumpDataProcessor.cpp
+++ b/debug/accuracy_tools/msprobe/ccsrc/core/AclDumpDataProcessor.cpp
@@ -75,6 +75,11 @@ static const std::map<DebuggerSummaryOption, std::string> summaryOptionHeaderStr
     {DebuggerSummaryOption::MD5, kStatsHeaderMD5},
 };
 
+const static std::map<AclDtype, AclDtype> kDtypeTransMap = {
+    {AclDtype::DT_BF16, AclDtype::DT_FLOAT},
+    {AclDtype::DT_INT4, AclDtype::DT_INT8},
+};
+
 class AclTensorStats {
 public:
     AclTensorStats() = default;
@@ -603,7 +608,7 @@ static std::string GenDataPath(const std::string& path) {
 inline std::string GetTensorInfoSuffix(AclTensorInfo& tensor)
 {
     return "." + tensor.inout + "." + std::to_string(tensor.slot) +
-           "." + DataUtils::GetFormatString(tensor.hostFmt) + "." + DataUtils::GetDTypeString(tensor.dtype);
+           "." + DataUtils::GetFormatString(tensor.hostFmt) + "." + DataUtils::GetDTypeString(tensor.oriDtype);
 }
 
 static DebuggerErrno DumpOneAclTensorFmtBin(AclTensorInfo& tensor)
@@ -640,10 +645,13 @@ static DebuggerErrno DumpOneAclTensorFmtNpy(AclTensorInfo& tensor)
         return DebuggerErrno::OK;
     }
 
-    if (tensor.dtype == AclDtype::DT_BF16) {
-        ret = AclTensor::TransDtype(tensor, AclDtype::DT_FLOAT);
+    auto it = kDtypeTransMap.find(tensor.dtype);
+    if (it != kDtypeTransMap.end()) {
+        AclDtype dstDtype = it->second;
+        ret = AclTensor::TransDtype(tensor, dstDtype);
         if (ret != DebuggerErrno::OK) {
-            LOG_ERROR(ret, tensor + ": Failed to transform dtype from bf16 to fp32.");
+            LOG_ERROR(ret, tensor + ": Failed to transform dtype from " + DataUtils::GetDTypeString(it->first) + " to " +
+                      DataUtils::GetDTypeString(it->second)+ ".");
             return ret;
         }
     }
@@ -736,7 +744,9 @@ static DebuggerErrno DumpOneAclTensor(AclTensorInfo& tensor, std::vector<Debugge
 {
     DEBUG_FUNC_TRACE();
     if (tensor.dumpOriginData || !FileOperation::IsDtypeSupportByNpy(tensor.dtype)) {
-        return DumpOneAclTensorFmtBin(tensor);
+        if (kDtypeTransMap.find(tensor.dtype) == kDtypeTransMap.end()) {
+            return DumpOneAclTensorFmtBin(tensor);
+        }
     }
 
     DebuggerErrno ret = ConvertFormatDeviceToHost(tensor);
diff --git a/debug/accuracy_tools/msprobe/ccsrc/core/AclTensor.cpp b/debug/accuracy_tools/msprobe/ccsrc/core/AclTensor.cpp
index 45adff49621..4a5ec4c5551 100644
--- a/debug/accuracy_tools/msprobe/ccsrc/core/AclTensor.cpp
+++ b/debug/accuracy_tools/msprobe/ccsrc/core/AclTensor.cpp
@@ -291,7 +291,11 @@ static inline void AssertDim(const AclShape& shape, size_t dim)
 
 static inline void AssertConsis(const AclTensorInfo& tensor)
 {
-    if (EleNumOfTensor(tensor, false) * SizeOfAclDType(tensor) != tensor.dataSize) {
+    size_t tensor_size = EleNumOfTensor(tensor, false) * SizeOfAclDType(tensor);
+    // Processing dtype whose size < 1
+    // The ele num of quantization type(qint4*2) in MindSpore must be even.
+    if (tensor.dtype == AclDtype::DT_INT4) tensor_size = EleNumOfTensor(tensor, false) / 2;
+    if (tensor_size != tensor.dataSize) {
         throw std::runtime_error(tensor + ": The internal data of Tensor is inconsistent.");
     }
 }
@@ -343,7 +347,7 @@ AclTensorInfo ParseAttrsFromDumpData(const std::string& dumpPath, const uint8_t*
     }
 
     int32_t subFormat = tensor.sub_format();
-    return AclTensorInfo{dumpPath, data, dtype, dFmt, hFmt, dShape, hShape, dataSize, subFormat, io, slot, dumpOriginData};
+    return AclTensorInfo{dumpPath, data, dtype, dtype, dFmt, hFmt, dShape, hShape, dataSize, subFormat, io, slot, dumpOriginData};
 }
 
 template AclTensorInfo ParseAttrsFromDumpData<AclDumpMsg::OpOutput>(
@@ -763,34 +767,80 @@ static void TransBf16ToFp32(const uint8_t* input, size_t num, uint8_t* output, s
     }
 }
 
-DebuggerErrno TransDtype(AclTensorInfo& tensor, AclDtype to)
+static void TransInt4ToInt8(const uint8_t* input, size_t elemNums, uint8_t* output, size_t bufferSize)
 {
+    if (bufferSize < elemNums * sizeof(int8_t)) {
+        LOG_ERROR(DebuggerErrno::ERROR_BUFFER_OVERFLOW, "Insufficient space for converting data from int4 to int8.");
+        return;
+    }
+    const int8_t *srcData = reinterpret_cast<const int8_t *>(input);
+    int8_t *dstData = reinterpret_cast<int8_t *>(output);
+    size_t inputLength = elemNums / 2;
+    int maxValue = 7;
+    int minValue = -8;
+    int signBitShift = 3;
+    int signBitMask = 0x08;
+    for (size_t i = 0; i < inputLength; ++i) {
+        int8_t s = *srcData;
+        int8_t t = s & 0xf;
+        // keep the sign bit not change
+        int8_t signBit = (t & signBitMask) >> signBitShift;
+        if (signBit == 1) {
+            t = t | 0xf0;
+        } else {
+            t = t & 0x0f;
+        }
+        if (t < minValue || t > maxValue) {
+            LOG_ERROR(DebuggerErrno::ERROR_INVALID_VALUE, "Invalid int4 value.");
+        }
+        *dstData = t;
+        ++dstData;
+
+        int highByteShift = 4;
+        t = s >> highByteShift;
+        signBit = (t & signBitMask) >> signBitShift;
+        if (signBit == 1) {
+            t = t | 0xf0;
+        } else {
+            t = t & 0x0f;
+        }
+        if (t < minValue || t > maxValue) {
+            LOG_ERROR(DebuggerErrno::ERROR_INVALID_VALUE, "Invalid int4 value.");
+        }
+        *dstData = t;
+        ++dstData;
+        ++srcData;
+    }
+    return;
+}
 
-    const static std::set<std::pair<AclDtype, AclDtype>> kSupportedDtypeTrans = {
-        {AclDtype::DT_BF16, AclDtype::DT_FLOAT},
-    };
+DebuggerErrno TransDtype(AclTensorInfo& tensor, AclDtype to)
+{
 
     if (tensor.dtype == to) {
         return DebuggerErrno::OK;
     }
 
-    if (kSupportedDtypeTrans.find({tensor.dtype, to}) == kSupportedDtypeTrans.end()) {
-        return DebuggerErrno::ERROR_UNKNOWN_TRANS;
-    }
-
+    tensor.oriDtype = tensor.dtype;
     std::vector<uint8_t> buffer;
     AssertConsis(tensor);
     size_t bufferSize = EleNumOfTensor(tensor) * SizeOfAclDType(to);
-    buffer.reserve(bufferSize);
+    buffer.resize(bufferSize);
     const uint8_t* input = tensor.transBuf.empty() ? tensor.aclData : tensor.transBuf.data();
     uint8_t* output = buffer.data();
 
-    /* 目前仅支持bf16->fp32，若有通用转换需求再用更泛化的方式重写 */
     if (tensor.dtype == AclDtype::DT_BF16 && to == AclDtype::DT_FLOAT) {
         TransBf16ToFp32(input, EleNumOfTensor(tensor), output, bufferSize);
+    } else if (tensor.dtype == AclDtype::DT_INT4 && to == AclDtype::DT_INT8) {
+        TransInt4ToInt8(input, EleNumOfTensor(tensor), output, bufferSize);
+    } else {
+        LOG_ERROR(DebuggerErrno::ERROR_UNKNOWN_TRANS, tensor + ": Trans " + DataUtils::GetDTypeString(tensor.dtype)
+                  + " to " + DataUtils::GetDTypeString(to) + " is not supported.");
+        return DebuggerErrno::ERROR_UNKNOWN_TRANS;
     }
 
     tensor.transBuf = std::move(buffer);
+    tensor.dtype = to;
     return DebuggerErrno::OK;
 }
 
diff --git a/debug/accuracy_tools/msprobe/ccsrc/core/AclTensor.hpp b/debug/accuracy_tools/msprobe/ccsrc/core/AclTensor.hpp
index 8b5ba5b06d9..f2ac429a7f1 100644
--- a/debug/accuracy_tools/msprobe/ccsrc/core/AclTensor.hpp
+++ b/debug/accuracy_tools/msprobe/ccsrc/core/AclTensor.hpp
@@ -40,6 +40,7 @@ struct AclTensorInfo {
     std::string dumpPath;
     const uint8_t* aclData;
     AclDtype dtype;
+    AclDtype oriDtype;
     AclFormat deviceFmt;
     AclFormat hostFmt;
     AclShape deviceShape;
@@ -52,7 +53,7 @@ struct AclTensorInfo {
     std::vector<uint8_t> transBuf;
 
     std::string ToString() const {
-        return "AclTensor(path=" + dumpPath + ",dtype=" + std::to_string(dtype) + ",inout=" + inout + ")";
+        return "AclTensor(path=" + dumpPath + ",dtype=" + DataUtils::GetDTypeString(dtype) + ",inout=" + inout + ")";
     }
 };
 
@@ -71,6 +72,7 @@ AclTensorInfo ParseAttrsFromDumpData(const std::string &dumpPath, const uint8_t*
                                      const std::string& io, uint32_t slot);
 DebuggerErrno TransFormatD2H(AclTensorInfo& tensor);
 DebuggerErrno TransDtype(AclTensorInfo& tensor, AclDtype to);
+bool IsDtypeSupportTrans(AclDtype dtype);
 
 }
 }
-- 
Gitee


From e9052472a06af97ba6d12fa766c2cc63d87b0ee6 Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Fri, 28 Feb 2025 15:41:03 +0800
Subject: [PATCH 043/145] =?UTF-8?q?=E4=BF=AE=E6=94=B9=E6=A3=80=E8=A7=86?=
 =?UTF-8?q?=E6=84=8F=E8=A7=81?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/core/common/const.py              |  58 --
 .../api_accuracy_checker.py                   |   3 +-
 .../api_accuracy_checker/api_runner.py        |   6 +-
 .../base_compare_algorithm.py                 |   3 +-
 .../bench_functions/flash_attention_score.py  | 501 +-----------------
 .../bench_functions/fusion_operator.py        |  20 +-
 .../api_accuracy_checker/data_manager.py      |   3 +-
 .../multi_api_accuracy_checker.py             |   3 +-
 .../torch_mindtorch_importer.py               |   3 +-
 .../msprobe/mindspore/common/const.py         |  60 +++
 .../api_accuracy_checker/test_data_manager.py |   3 +-
 11 files changed, 117 insertions(+), 546 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/common/const.py b/debug/accuracy_tools/msprobe/core/common/const.py
index d8aaa7f1e75..b49b4fffd5e 100644
--- a/debug/accuracy_tools/msprobe/core/common/const.py
+++ b/debug/accuracy_tools/msprobe/core/common/const.py
@@ -538,64 +538,6 @@ class OverflowConst:
     OVERFLOW_DEBUG_MODE = 1
 
 
-class MsCompareConst:
-    # api_info field
-    MINT = "Mint"
-    MINT_FUNCTIONAL = "MintFunctional"
-    TENSOR_API = "Tensor"
-    FUNCTIONAL_API = "Functional"
-
-    API_NAME_STR_LENGTH = 4
-    MAX_RECURSION_DEPTH = 20
-
-    # Mindtorch api_info field
-    MINDTORCH_TENSOR = "Tensor"
-    MINDTORCH = "Torch"
-    MINDTORCH_FUNC = "Functional"
-    MINDTORCH_NPU = "NPU"
-    MINDTORCH_DIST = "Distributed"
-
-
-
-    MT_VALID_API_TYPES = [
-        MINDTORCH, MINDTORCH_FUNC, MINDTORCH_TENSOR
-    ]
-    SUPPORTED_FUSION_LIST = ["flash_attention_score"]
-
-
-    TASK_FIELD = "task"
-    STATISTICS_TASK = "statistics"
-    FRAMEWORK = "framework"
-    TENSOR_TASK = "tensor"
-    DUMP_DATA_DIR_FIELD = "dump_data_dir"
-    DATA_FIELD = "data"
-
-    # supported api yaml
-    SUPPORTED_API_LIST_FILE = "checker_support_api.yaml"
-    SUPPORTED_TENSOR_LIST_KEY = "tensor"
-
-    # detail_csv
-    DETAIL_CSV_API_NAME = "API Name"
-    DETAIL_CSV_BENCH_DTYPE = "Bench Dtype"
-    DETAIL_CSV_TESTED_DTYPE = "Tested Dtype"
-    DETAIL_CSV_SHAPE = "Shape"
-    DETAIL_CSV_PASS_STATUS = "Status"
-    DETAIL_CSV_MESSAGE = "Message"
-    DETAIL_CSV_FILE_NAME = "accuracy_checking_details"
-
-    # result_csv
-    RESULT_CSV_FORWARD_TEST_SUCCESS = "Forward Test Success"
-    RESULT_CSV_BACKWARD_TEST_SUCCESS = "Backward Test Success"
-    RESULT_CSV_FILE_NAME = "accuracy_checking_result"
-
-    EPSILON = 1e-8
-
-    class ProcessStatus:
-        SUCCESS = "success"
-        API_NOT_FOUND = "api_not_found"
-        EXCEPTION_SKIP = "exception_skip"
-
-
 class MsgConst:
     """
     Class for log messages const
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_accuracy_checker.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_accuracy_checker.py
index 47bcc7e9f6c..557d731e042 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_accuracy_checker.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_accuracy_checker.py
@@ -16,7 +16,7 @@
 import os
 from tqdm import tqdm
 
-from msprobe.core.common.const import Const, CompareConst, MsCompareConst
+from msprobe.core.common.const import Const, CompareConst
 from msprobe.core.common.file_utils import FileOpen, create_directory, write_csv, load_json, load_yaml
 from msprobe.core.common.utils import add_time_as_suffix
 from msprobe.mindspore.api_accuracy_checker.api_info import ApiInfo
@@ -25,6 +25,7 @@ from msprobe.mindspore.api_accuracy_checker.base_compare_algorithm import compar
 from msprobe.mindspore.api_accuracy_checker.data_manager import DataManager
 from msprobe.mindspore.api_accuracy_checker.utils import (check_and_get_from_json_dict, global_context,
                                                           trim_output_compute_element_list)
+from msprobe.mindspore.common.const import MsCompareConst
 from msprobe.mindspore.common.log import logger
 from msprobe.mindspore.api_accuracy_checker import torch_mindtorch_importer
 
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
index de6678c7b62..fdeea2a4a6d 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
@@ -15,12 +15,13 @@
 
 import mindspore
 from mindspore import ops
-from msprobe.core.common.const import Const, MsCompareConst
+from msprobe.core.common.const import Const
 from msprobe.core.common.exceptions import ApiAccuracyCheckerException
 from msprobe.mindspore.api_accuracy_checker.compute_element import ComputeElement
 from msprobe.mindspore.api_accuracy_checker.type_mapping import float_dtype_str_list, torch_dtype_to_dtype_str
 from msprobe.mindspore.api_accuracy_checker.utils import convert_to_tuple
 from msprobe.mindspore.api_accuracy_checker.bench_functions.fusion_operator import fusion
+from msprobe.mindspore.common.const import MsCompareConst
 from msprobe.mindspore.common.log import logger
 
 
@@ -130,7 +131,8 @@ class ApiRunner:
             err_msg = f"ApiRunner.get_info_from_name failed: api_name_str: {api_name_str} is not in defined format"
             logger.error_log_with_exp(err_msg, ApiAccuracyCheckerException(ApiAccuracyCheckerException.WrongValue))
         api_type_str, api_sub_name = api_name_list[0], api_name_list[1]
-        if api_type_str not in [MsCompareConst.MINT, MsCompareConst.MINT_FUNCTIONAL, MsCompareConst.TENSOR_API, MsCompareConst.FUNCTIONAL_API] \
+        if api_type_str not in [MsCompareConst.MINT, MsCompareConst.MINT_FUNCTIONAL, MsCompareConst.TENSOR_API,
+                                MsCompareConst.FUNCTIONAL_API] \
                 and api_platform == Const.MS_FRAMEWORK:
             err_msg = f"ApiRunner.get_info_from_name failed: not mint, mint.nn.functional or Tensor api"
             logger.error_log_with_exp(err_msg, ApiAccuracyCheckerException(ApiAccuracyCheckerException.WrongValue))
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/base_compare_algorithm.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/base_compare_algorithm.py
index ead03d25ea5..da2f8ad612f 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/base_compare_algorithm.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/base_compare_algorithm.py
@@ -18,9 +18,10 @@ from abc import ABC, abstractmethod
 import mindspore
 import numpy as np
 import torch
-from msprobe.core.common.const import CompareConst, MsCompareConst
+from msprobe.core.common.const import CompareConst
 from msprobe.core.common.exceptions import ApiAccuracyCheckerException
 from msprobe.mindspore.common.log import logger
+from msprobe.mindspore.common.const import MsCompareConst
 
 
 class CompareResult:
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
index 97883ba74a8..b1a248ee2ac 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
@@ -1,13 +1,28 @@
-import mindspore as ms
+# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
 
-from collections import namedtuple
 import torch
 import torch.nn as nn
-import numpy as np
-from einops import rearrange
 
-from msprobe.pytorch.common.utils import logger
-from msprobe.core.common.const import Const, CompareConst
+from collections import namedtuple
+
+from msprobe.pytorch.bench_fuctions.npu_fusion_attention import softmax_forward\
+    , softmax_grad, broadcast_kv, calculate_qk, fusion_attention_forward, fusion_attention_backward, parse_bsnd_args\
+    , convert_from_bnsd, convert_to_bnsd, convert_from_bsnd, convert_to_bsnd, generate_attn_mask,\
+    generate_kv, rebuid_softmax_by_qkv, rebuild_softmax_by_max_sum,\
+    get_head_num, get_input_layout, npu_fusion_attention_forward_patch, npu_fusion_attention_backward_patch
 
 GTYPE = torch.float64  # arm host必须选择float64，x86环境选择float32即可，64也行。arm计算很慢，s=8k的场景建议使用x86
 SOFTMAX_BUILD_MODE = "QKV"  # "MAX_SUM"
@@ -20,470 +35,6 @@ RebuildSoftmaxParams = namedtuple("RebuildSoftmaxParams",
                                   ["q", "k", "attn_mask", "pse", "scalar_value", "softmax_max", "softmax_sum"])
 
 
-def softmax_forward(x):
-    x_max = torch.max(x, dim=-1, keepdims=True)[0]
-    x_sub = x.sub(x_max)
-    y = torch.exp(x_sub)
-    x_sum = y.sum(dim=-1, keepdims=True)
-    res = y.div(x_sum)
-    return res, x_max, x_sum
-
-
-def softmax_grad(dp, softmax_res):
-    muls = dp * softmax_res
-    muls_r = muls.sum(dim=-1, keepdims=True)
-    sub_r = dp - muls_r
-    res = sub_r * softmax_res
-    return res
-
-
-def broadcast_kv(num_heads, num_kv_heads, kv_tensor, dtype):
-    if num_kv_heads == 0 or num_kv_heads > num_heads:
-        raise ValueError(f"num_kv_heads must be non-zero and bigger than num_heads.")
-
-    factor = num_heads // num_kv_heads
-    kv_shape = kv_tensor.shape
-    b = kv_shape[0]
-    s = kv_shape[2]
-    d = kv_shape[3]
-    kv_res = torch.zeros([b, num_heads, s, d]).to(dtype)
-    for i in range(num_heads):
-        j = i // factor
-        kv_res[:, i:i + 1, :, :] = kv_tensor[:, j:j + 1, :, :]
-    return kv_res
-
-
-def calculate_qk(q, k, attn_mask, pse, scalar_value):
-    print(f"q shape: {q.shape if q is not None else 'None'}")
-    print(f"k shape: {k.shape if k is not None else 'None'}")
-    print(f"attn_mask shape: {attn_mask.shape if attn_mask is not None else 'None'}")
-    print(f"pse: {pse if pse is not None else 'None'}")
-    print(f"scalar_value: {scalar_value if scalar_value is not None else 'None'}")
-    # print(f"q shape: {q.shape}")
-    # print(f"k shape: {k.shape}")
-    assert k.dim() == 4, f"k tensor dimension must be 4, but got {k.dim()} dimensions (shape: {k.shape})"
-    if k.dim() == 3:
-        k = k.unsqueeze(1)  # 在head维度扩展
-        print(f"Adjusted k shape: {k.shape}")
-
-    if pse is None or len(pse.shape) == 0:
-        qk = torch.matmul(q, k.permute(0, 1, 3, 2)).mul(scalar_value)
-    else:
-        qk = (torch.matmul(q, k.permute(0, 1, 3, 2)) + pse).mul(scalar_value)
-    if attn_mask is None or len(attn_mask.shape) == 0:
-        return qk
-    else:
-        qk = qk + attn_mask.bool() * (-40000.0)  # -10000
-    return qk
-
-
-def fusion_attention_forward(forward_params):
-    q = forward_params.q
-    k = forward_params.k
-    v = forward_params.v
-    drop_mask = forward_params.drop_mask
-    attn_mask = forward_params.attn_mask
-    pse = forward_params.pse
-    scalar_value = forward_params.scalar_value
-    keep_prob = forward_params.keep_prob
-    print(f"q shape: {q.shape} | k shape: {k.shape} | attn_mask shape: {attn_mask.shape}")
-
-    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
-    softmax_res, softmax_max, softmax_sum = softmax_forward(qk)
-    if drop_mask is None or len(drop_mask.shape) == 0:
-        drop_res = softmax_res
-    else:
-        drop_res = softmax_res * drop_mask * (1.0 / keep_prob)
-    y = torch.matmul(drop_res, v)
-    return y, softmax_max, softmax_sum
-
-
-def fusion_attention_backward(backward_params):
-    dx = backward_params.dx
-    q = backward_params.q
-    k = backward_params.k
-    v = backward_params.v
-    softmax_res = backward_params.softmax_res
-    drop_mask = backward_params.drop_mask
-    pse = backward_params.pse
-    scalar_value = backward_params.scalar_value
-    keep_prob = backward_params.keep_prob
-    dp = torch.matmul(dx, v.permute(0, 1, 3, 2))
-    if drop_mask is None or len(drop_mask.shape) == 0:
-        drop_res = softmax_res.permute(0, 1, 3, 2)
-        dp_drop = dp
-    else:
-        drop_res = softmax_res.mul(drop_mask).mul(1.0 / keep_prob).permute(0, 1, 3, 2)
-        dp_drop = dp * drop_mask * (1.0 / keep_prob)
-    dv = torch.matmul(drop_res, dx)
-    softmax_grad_res = (softmax_grad(dp_drop, softmax_res) * scalar_value)
-    dq = torch.matmul(softmax_grad_res, k)
-    dk = torch.matmul(softmax_grad_res.permute(0, 1, 3, 2), q)
-    return dq, dk, dv
-
-
-def parse_bsnd_args(query, key, head_num, input_layout):
-    supported_input_layout = ["BSH", "SBH", "BSND", "BNSD", "TND"]
-    b, s1, s2, n1, n2, d, h1, h2 = None, None, None, head_num, None, None, None, None
-
-    if not isinstance(input_layout, str) or input_layout not in supported_input_layout:
-        raise ValueError(f"Invalid input_layout arg which must be one of {supported_input_layout}.")
-
-    if input_layout == "TND":
-        raise ValueError(f"input_layout {input_layout} does not supported for now.")
-    try:
-        if input_layout == "BSH":
-            b, s1, h1 = query.shape
-            _, s2, h2 = key.shape
-            d = h1 // n1
-            n2 = h2 // d
-        elif input_layout == "SBH":
-            s1, b, h1 = query.shape
-            s2, _, h2 = key.shape
-            d = h1 // n1
-            n2 = h2 // d
-        elif input_layout == "BSND":
-            b, s1, n1, d = query.shape
-            _, s2, n2, _ = key.shape
-            h1 = n1 * d
-            h2 = n2 * d
-        elif input_layout == "BNSD":
-            b, n1, s1, d = query.shape
-            _, n2, s2, _ = key.shape
-            h1 = n1 * d
-            h2 = n2 * d
-    except Exception as e:
-        raise ValueError(f"query.shape: {query.shape}, key.shape: {key.shape}, parse_bsnd_args error: {e}") from e
-
-    if d == 0:
-        raise ValueError(f"Value d must be non-zero.")
-    _dtype = query.dtype
-    ret = (b, s1, s2, n1, n2, d, h1, h2, _dtype)
-    return ret
-
-
-def convert_from_bnsd(_input, input_layout):
-    """
-    transform qkv from bnsd to input_layout.
-    B: batch_size
-    S: sequence_length
-    N: num_heads
-    D: head_dim
-    Args:
-       _input (torch.Tensor): tensor of shape (B,N,S,D)
-        input_layout (str): "BSH" or "SBH" or "BSND" or "BNSD" or "TND"
-    Returns:
-        tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
-    """
-    if input_layout == "BSH":
-        # (B,N,S,D)=>(B,S,N*D)
-        out = rearrange(_input, 'b n s d -> b s (n d)').contiguous()
-    elif input_layout == "SBH":
-        # (B,N,S,D)=>(S,B,N*D)
-        out = rearrange(_input, 'b n s d -> s b (n d)').contiguous()
-    elif input_layout == "BSND":
-        # (B,N,S,D)=>(B,S,N,D)
-        out = rearrange(_input, 'b n s d -> b s n d').contiguous()
-    elif input_layout == "TND":
-        raise ValueError(f"input_layout {input_layout} does not supported for now.")
-    else:
-        out = _input
-    return out
-
-
-def convert_to_bnsd(_input, n, input_layout):
-    """
-    transform qkv from input_layout to bnsd.
-    B: batch_size
-    S: sequence_length
-    N: num_heads
-    D: head_dim
-    Args:
-        _input (torch.Tensor): tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
-        n (int): num_heads
-        input_layout (str):"BSH" or "SBH" or "BSND" or "BNSD" or "TND"
-    Returns:
-        tensor of shape (B,N,S,D)
-    """
-    if input_layout == "BSH":
-        # (B,S,N*D)=>(B,N,S,D)
-        out = rearrange(_input, 'b s (n d) -> b n s d', n=n)
-    elif input_layout == "SBH":
-        # (S,B,N*D)=>(B,N,S,D)
-        out = rearrange(_input, 's b (n d) -> b n s d', n=n)
-    elif input_layout == "BSND":
-        # (B,S,N,D)=>(B,N,S,D)
-        out = rearrange(_input, 'b s n d -> b n s d', n=n)
-    elif input_layout == "TND":
-        raise ValueError(f"input_layout {input_layout} does not supported for now.")
-    else:
-        out = _input
-    if out.dim() != 4:
-        raise ValueError(f"convert qkv format failed with input_layout {input_layout}.")
-    return out.to(GTYPE)
-
-
-def convert_from_bsnd(_input, input_layout):
-    """
-    transform qkv from bsnd to input_layout.
-    B: batch_size
-    S: sequence_length
-    N: num_heads
-    D: head_dim
-    Args:
-       _input (torch.Tensor): tensor of shape (B,S,N,D)
-        input_layout (str): "BSH" or "SBH" or "BSND" or "BNSD" or "TND"
-    Returns:
-        tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
-    """
-    if input_layout == "BSH":
-        # (B,S,N,D)=>(B,S,N*D)
-        out = rearrange(_input, 'b s n d -> b s (n d)').contiguous()
-    elif input_layout == "SBH":
-        # (B,S,N,D)=>(S,B,N*D)
-        out = rearrange(_input, 'b s n d -> s b (n d)').contiguous()
-    elif input_layout == "BNSD":
-        # (B,S,N,D)=>(B,N,S,D)
-        out = rearrange(_input, 'b s n d -> b n s d').contiguous()
-    elif input_layout == "TND":
-        raise ValueError(f"input_layout {input_layout} does not supported for now.")
-    else:
-        out = _input
-    return out
-
-
-def convert_to_bsnd(_input, n, input_layout):
-    """
-    transform qkv from input_layout to bsnd.
-    B: batch_size
-    S: sequence_length
-    N: num_heads
-    D: head_dim
-    Args:
-        _input (torch.Tensor): tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
-        n (int): num_heads
-        input_layout (str):"BSH" or "SBH" or "BSND" or "BNSD" or "TND"
-    Returns:
-        tensor of shape (B,S,N,D)
-    """
-    if input_layout == "BSH":
-        # (B,S,N*D)=>(B,S,N,D)
-        out = rearrange(_input, 'b s (n d) -> b s n d', n=n)
-    elif input_layout == "SBH":
-        # (S,B,N*D)=>(B,S,N,D)
-        out = rearrange(_input, 's b (n d) -> b s n d', n=n)
-    elif input_layout == "BNSD":
-        # (B,N,S,D)=>(B,S,N,D)
-        out = rearrange(_input, 'b n s d -> b s n d', n=n)
-    elif input_layout == "TND":
-        raise ValueError(f"input_layout {input_layout} does not supported for now.")
-    else:
-        out = _input
-    if out.dim() != 4:
-        raise ValueError(f"convert qkv format failed with input_layout {input_layout}.")
-    return out
-
-
-def generate_attn_mask(*args):
-    """
-    # 当sparse_mode=2、3、4时小算子到融合算子会走这个优化，反过来看就要拆解回原来的基本实现
-    ===> attn_mask = torch.from_numpy(np.triu(np.ones([2048, 2048]), k=1)).to(dtype)
-    """
-
-    sparse_mode, attn_mask, b, n1, s1, s2, pre_tocken, next_tocken, dtype = args
-    shape = [s1, s2]
-
-    if attn_mask is not None:
-        # 当FA的输入已经包含attn_mask时，可以认为已经是转换之后的mask矩阵了，有三种特殊场景，即稀疏矩阵场景，需要进行逆向还原
-        if sparse_mode == 2 or sparse_mode == 3 or sparse_mode == 4:
-            logger.info(f"s1: {s1}, s2:{s2}, attn_mask.shape:{attn_mask.shape}, attn_mask.dtype:{attn_mask.dtype}")
-
-            if attn_mask.dim() == 2 and attn_mask.shape[0] == 2048 and attn_mask.shape[1] == 2048:
-                if attn_mask.equal(torch.from_numpy(np.triu(np.ones([2048, 2048]), k=1)).to(attn_mask.dtype)):
-                    if sparse_mode == 2:
-                        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=1))
-                    elif sparse_mode == 3:
-                        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=s2 - s1 + 1))
-                    elif sparse_mode == 4:
-                        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
-                        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
-                        attn_mask = attn_mask_u + attn_mask_l
-                    logger.debug(f"反向转换attn_mask {attn_mask.shape}")
-                    return attn_mask.to(dtype)
-
-        return attn_mask.to(dtype)
-
-    if attn_mask is not None:
-        if attn_mask.dim() == 2:
-            if attn_mask.shape[0] != s1 or attn_mask.shape[1] != s2:
-                raise ValueError(f"Invalid attn_mask shape `SS` {attn_mask.shape}")
-            shape = [s1, s2]
-        elif attn_mask.dim() == 4:
-            if attn_mask.shape[1] == 1:
-                shape = [b, 1, s1, s2] if b != 1 else [1, 1, s1, s2]
-            else:
-                shape = [b, n1, s1, s2] if b != 1 else [1, n1, s1, s2]
-
-    if sparse_mode == 0:
-        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
-        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
-        attn_mask = attn_mask_u + attn_mask_l
-    elif sparse_mode == 1:  # no sparse
-        attn_mask = torch.from_numpy(np.zeros(shape))
-    elif sparse_mode == 2:
-        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=1))
-    elif sparse_mode == 3:
-        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=s2 - s1 + 1))
-    elif sparse_mode == 4:
-        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
-        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
-        attn_mask = attn_mask_u + attn_mask_l
-    # 注:不会出现sparse_mode=5的情况，该情况要求必须要传入attn_mask，且attn_mask矩阵数据格式须为BNSS或B1SS，
-    # 因此可以认为FA的输入已经是正确的attn_mask了
-    return attn_mask.to(dtype)
-
-
-def generate_kv(key, value, n1, n2):
-    # N不等长适配by cdy
-    if not (n1 == n2):
-        k_new = broadcast_kv(n1, n2, key, key.dtype)
-        v_new = broadcast_kv(n1, n2, value, value.dtype)
-    else:
-        k_new = key
-        v_new = value
-    return k_new, v_new
-
-
-def rebuid_softmax_by_qkv(q, k, attn_mask, pse, scalar_value):
-    """
-    attention = softmax(QK^T/sqrt(d))V
-    softmax(x_i) = e^(x_i - x_max) / sum(e^(x_i - x_max))
-    """
-    logger.info("Using QKV to rebuild original softmax")
-    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
-    softmax_res, _, _ = softmax_forward(qk)
-    return softmax_res
-
-
-def rebuild_softmax_by_max_sum(softmax_params):
-    """
-    attention = softmax(QK^T/sqrt(d))V
-    softmax(x_i) = e^(x_i - x_max_i) / x_sum_i)
-    """
-    q = softmax_params.q
-    k = softmax_params.k
-    attn_mask = softmax_params.attn_mask
-    pse = softmax_params.pse
-    scalar_value = softmax_params.scalar_value
-    softmax_max = softmax_params.softmax_max
-    softmax_sum = softmax_params.softmax_sum
-    logger.info("Using softmax_max and softmax_sum to rebuild original softmax")
-
-    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
-    if softmax_max.shape[-1] == 0:
-        raise ValueError(f"softmax_max.shape[-1] must be non-zero, softmax_max.shape: {softmax_max.shape}")
-    repeat_dim = qk.shape[-1] // softmax_max.shape[-1]
-    softmax_res = torch.exp(qk.sub(softmax_max.repeat(1, 1, 1, repeat_dim))).div(
-        softmax_sum.repeat(1, 1, 1, repeat_dim))
-    return softmax_res
-
-
-def get_head_num(*args, **kwargs):
-    if kwargs.get("head_num", None):
-        head_num = kwargs.get("head_num")
-    elif len(args) >= 4:
-        head_num = args[3]
-    else:
-        raise ValueError(f"Unsupported npu_fusion_attention args {args}.")
-    return head_num
-
-
-def get_input_layout(*args, **kwargs):
-    if kwargs.get("input_layout", None):
-        input_layout = kwargs.get("input_layout")
-    elif len(args) >= 5:
-        input_layout = args[4]
-    else:
-        raise ValueError(f"Unsupported npu_fusion_attention args {args}.")
-    return input_layout
-
-
-def npu_fusion_attention_forward_patch(*args, **kwargs):
-    if len(args) < 2:
-        raise RuntimeError("npu_fusion_attention_forward_patch: length of args should greater than or equal to 2.")
-
-    # query, key, value, head_num, input_layout
-    head_num = get_head_num(*args, **kwargs)
-    input_layout = get_input_layout(*args, **kwargs)
-
-    b, s1, s2, n1, n2, d, h1, h2, dtype = parse_bsnd_args(args[0], args[1], head_num, input_layout)
-    if n1 == n2 and s1 == s2:
-        logger.debug(f"running case : BNSD = {b}_{n1}_{s1}_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
-    else:
-        logger.debug(f"running case: BNSD = {b}_{n1}({n2})_{s1}({s2})_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
-    if not (n1 % n2 == 0 and n1 >= n2):
-        raise ValueError(f"N1与N2不匹配,请检查: n1 = {n1}, n2 = {n2}.")
-
-    dims_kwargs = {
-        "b": b, "s1": s1, "s2": s2, "n1": n1, "n2": n2,
-        "d": d, "h1": h1, "h2": h2, "dtype": dtype
-    }
-    print(f"kwargs123:{kwargs}")
-    new_kwargs = {
-        "keep_prob": 1,
-        "scalar_value": kwargs.get("scalar_value", 1 / (d ** 0.5)),
-        "sparse_mode": kwargs.get("sparse_mode", 0),
-        "prefix": kwargs.get("prefix"),
-        "pre_tockens": kwargs.get("pre_tockens", 2147483647),
-        "next_tockens": kwargs.get("next_tockens", 2147483647),
-        "pse": kwargs.get("pse"),
-        "padding_mask": kwargs.get("padding_mask"),
-        "attn_mask": kwargs.get("attn_mask")
-    }
-    print(f"new_kwargs123:{new_kwargs}")
-
-    return args, dims_kwargs, new_kwargs
-
-
-def npu_fusion_attention_backward_patch(*args, **kwargs):
-    if len(args) != 6:
-        raise ValueError(f"Unsupported npu_fusion_attention_grad args {args}.")
-
-    b, s1, s2, n1, n2, d, h1, h2, dtype = parse_bsnd_args(args[0], args[1], args[4], args[5])
-    if n1 == n2 and s1 == s2:
-        logger.info(f"running case : bnsd = {b}_{n1}_{s1}_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
-    else:
-        logger.info(f"running case: bnsd = {b}_{n1}({n2})_{s1}({s2})_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
-    if not (n1 % n2 == 0 and n1 >= n2):
-        raise ValueError(f"N1与N2不匹配,请检查: n1 = {n1}, n2 = {n2}.")
-
-    dims_kwargs = {
-        "b": b, "s1": s1, "s2": s2, "n1": n1, "n2": n2,
-        "d": d, "h1": h1, "h2": h2, "dtype": dtype
-    }
-
-    new_kwargs = {
-        "keep_prob": 1,
-        "scalar_value_value": kwargs.get("scalar_value_value", 1 / (d ** 0.5)),
-        "sparse_mode": kwargs.get("sparse_mode", 0),
-        "prefix": kwargs.get("prefix"),
-        "pre_tockens": kwargs.get("pre_tockens", 2147483647),
-        "next_tockens": kwargs.get("next_tockens", 2147483647),
-        "pse": kwargs.get("pse"),
-        "padding_mask": kwargs.get("padding_mask"),
-        "softmax_max": kwargs.get("softmax_max"),
-        "softmax_sum": kwargs.get("softmax_sum"),
-        "softmax_in": kwargs.get("softmax_in"),
-        "attention_in": kwargs.get("attention_in"),
-        "seed": kwargs.get("seed", 0),
-        "offset": kwargs.get("offset", 0),
-        "numels": kwargs.get("numels", 0),
-        "attn_mask": kwargs.get("attn_mask")
-    }
-
-    return args, dims_kwargs, new_kwargs
-
-
 class FlashAttentionScore(nn.Module):
     def __init__(self):
         super(FlashAttentionScore, self).__init__()
@@ -491,12 +42,8 @@ class FlashAttentionScore(nn.Module):
 
     def forward(self, *inputs, **kwargs):
         # Extract the inputs for the attention calculation
-        print(f"inputs: {inputs}")
-        print(f"kwargs: {kwargs}")
-
         new_args, dims_kwargs, new_kwargs = npu_fusion_attention_forward_patch(*inputs, **kwargs)
         query, key, value = new_args[0], new_args[1], new_args[2]
-        print(f"new_args: {new_args}, dims_kwargs: {dims_kwargs}, new_kwargs: {new_kwargs}")
 
         input_layout = get_input_layout(*inputs, **kwargs)
 
@@ -515,15 +62,12 @@ class FlashAttentionScore(nn.Module):
         scalar_value = new_kwargs.get("scalar_value")
 
         args_temp = [sparse_mode, attn_mask, b, n1, s1, s2, pre_tockens, next_tockens, dtype]
-        print(f"args_temp: {args_temp}")
 
         attn_mask = generate_attn_mask(*args_temp)
         query = convert_to_bnsd(query, n1, input_layout)
         key = convert_to_bnsd(key, n2, input_layout)
         value = convert_to_bnsd(value, n2, input_layout)
 
-        k_new, v_new = generate_kv(key, value, n1, n2)
-
         forward_params = FaForwardParams(
             q=query,
             k=key,
@@ -539,7 +83,8 @@ class FlashAttentionScore(nn.Module):
 
         # If output dimension is 5, reshape accordingly
         if out_golden.dim() == 5:
-            out_golden = out_golden.reshape(out_golden.size(0), out_golden.size(1) * out_golden.size(2),
+            out_golden = out_golden.reshape(out_golden.size(0),
+                                            out_golden.size(1) * out_golden.size(2),
                                             out_golden.size(3), out_golden.size(4))
 
         out_golden = convert_from_bnsd(out_golden, input_layout)
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py
index 78142f6d083..7f38232595e 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py
@@ -1,6 +1,21 @@
+# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
 
 from msprobe.mindspore.api_accuracy_checker.bench_functions.flash_attention_score import FlashAttentionScore
 
+
 class FusionOperator:
     """
     所有融合算子的父类，定义了通用的接口和属性。
@@ -12,7 +27,7 @@ class FusionOperator:
         self._register_operators()
 
     def _register_operators(self):
-        """ 注册操作符到父类，以便通过 ops.xxx 调用 """
+        """ 注册操作符到父类，以便通过 fusion.xxx 调用 """
         self.flash_attention_score = FlashAttentionScore()
 
     def __getattr__(self, name):
@@ -22,4 +37,5 @@ class FusionOperator:
         else:
             raise AttributeError(f"'FusionOperator' object has no attribute '{name}'")
 
-fusion = FusionOperator()
\ No newline at end of file
+
+fusion = FusionOperator()
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/data_manager.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/data_manager.py
index 748adf7d02c..fc2680d68a5 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/data_manager.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/data_manager.py
@@ -16,12 +16,13 @@
 import os
 import csv
 
-from msprobe.core.common.const import Const, CompareConst, MsCompareConst
+from msprobe.core.common.const import Const, CompareConst
 from msprobe.core.common.file_utils import FileOpen, create_directory, write_csv, read_csv
 from msprobe.core.common.utils import add_time_as_suffix, MsprobeBaseException
 from msprobe.mindspore.api_accuracy_checker.base_compare_algorithm import compare_algorithms
 from msprobe.core.common.file_utils import check_file_or_directory_path
 from msprobe.mindspore.common.log import logger
+from msprobe.mindspore.common.const import MsCompareConst
 
 
 class ResultCsvEntry:
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/multi_api_accuracy_checker.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/multi_api_accuracy_checker.py
index e764140badf..1913675ad16 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/multi_api_accuracy_checker.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/multi_api_accuracy_checker.py
@@ -27,10 +27,11 @@ import numpy as np
 from tqdm import tqdm
 
 # 本地应用/库特定导入
-from msprobe.core.common.const import Const, CompareConst, MsCompareConst
+from msprobe.core.common.const import Const, CompareConst
 from msprobe.mindspore.api_accuracy_checker.api_accuracy_checker import ApiAccuracyChecker, BasicInfoAndStatus
 from msprobe.mindspore.api_accuracy_checker.multi_data_manager import MultiDataManager
 from msprobe.mindspore.common.log import logger
+from msprobe.mindspore.common.const import MsCompareConst
 
 
 class MultiApiAccuracyChecker(ApiAccuracyChecker):
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/torch_mindtorch_importer.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/torch_mindtorch_importer.py
index 84f2706cc55..7b319382eb4 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/torch_mindtorch_importer.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/torch_mindtorch_importer.py
@@ -19,7 +19,8 @@ import sys
 from pathlib import Path
 import mindspore
 from msprobe.mindspore.common.log import logger
-from msprobe.core.common.const import Const, CompareConst, MsCompareConst
+from msprobe.core.common.const import Const, CompareConst
+from msprobe.mindspore.common.const import MsCompareConst
 import torch as mindtorch
 from torch import Tensor as mindtorch_tensor
 import torch.nn.functional as mindtorch_func
diff --git a/debug/accuracy_tools/msprobe/mindspore/common/const.py b/debug/accuracy_tools/msprobe/mindspore/common/const.py
index 9e8c79e5128..ca89549a842 100644
--- a/debug/accuracy_tools/msprobe/mindspore/common/const.py
+++ b/debug/accuracy_tools/msprobe/mindspore/common/const.py
@@ -70,6 +70,66 @@ class Const:
     }
 
 
+class MsCompareConst:
+    # api_info field
+    MINT = "Mint"
+    MINT_FUNCTIONAL = "MintFunctional"
+    TENSOR_API = "Tensor"
+    FUNCTIONAL_API = "Functional"
+
+    API_NAME_STR_LENGTH = 4
+    MAX_RECURSION_DEPTH = 20
+
+    # Mindtorch api_info field
+    MINDTORCH_TENSOR = "Tensor"
+    MINDTORCH = "Torch"
+    MINDTORCH_FUNC = "Functional"
+    MINDTORCH_NPU = "NPU"
+    MINDTORCH_DIST = "Distributed"
+
+
+
+    MT_VALID_API_TYPES = [
+        MINDTORCH, MINDTORCH_FUNC, MINDTORCH_TENSOR
+    ]
+    SUPPORTED_FUSION_LIST = ["flash_attention_score"]
+
+
+    TASK_FIELD = "task"
+    STATISTICS_TASK = "statistics"
+    FRAMEWORK = "framework"
+    TENSOR_TASK = "tensor"
+    DUMP_DATA_DIR_FIELD = "dump_data_dir"
+    DATA_FIELD = "data"
+
+    # supported api yaml
+    SUPPORTED_API_LIST_FILE = "checker_support_api.yaml"
+    SUPPORTED_TENSOR_LIST_KEY = "tensor"
+
+    # detail_csv
+    DETAIL_CSV_API_NAME = "API Name"
+    DETAIL_CSV_BENCH_DTYPE = "Bench Dtype"
+    DETAIL_CSV_TESTED_DTYPE = "Tested Dtype"
+    DETAIL_CSV_SHAPE = "Shape"
+    DETAIL_CSV_PASS_STATUS = "Status"
+    DETAIL_CSV_MESSAGE = "Message"
+    DETAIL_CSV_FILE_NAME = "accuracy_checking_details"
+
+    # result_csv
+    RESULT_CSV_FORWARD_TEST_SUCCESS = "Forward Test Success"
+    RESULT_CSV_BACKWARD_TEST_SUCCESS = "Backward Test Success"
+    RESULT_CSV_FILE_NAME = "accuracy_checking_result"
+
+    EPSILON = 1e-8
+
+    class ProcessStatus:
+        SUCCESS = "success"
+        API_NOT_FOUND = "api_not_found"
+        EXCEPTION_SKIP = "exception_skip"
+
+
+
+
 class FreeBenchmarkConst:
     ADD_NOISE = "add_noise"
     BIT_NOISE = "bit_noise"
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/api_accuracy_checker/test_data_manager.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/api_accuracy_checker/test_data_manager.py
index bb4c8b197ef..9cfad00d8ff 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/api_accuracy_checker/test_data_manager.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/api_accuracy_checker/test_data_manager.py
@@ -2,7 +2,8 @@ import unittest
 from unittest.mock import patch, mock_open, MagicMock
 import os
 from msprobe.mindspore.api_accuracy_checker.api_accuracy_checker import DataManager
-from msprobe.core.common.const import MsCompareConst, CompareConst
+from msprobe.core.common.const import CompareConst
+from msprobe.mindspore.common.const import MsCompareConst
 
 
 class TestDataManager(unittest.TestCase):
-- 
Gitee


From 6e8f12f50784936778af151de51e36c06680177b Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Fri, 28 Feb 2025 15:54:54 +0800
Subject: [PATCH 044/145] Update flash_attention_score.py

---
 .../bench_functions/flash_attention_score.py  | 63 ++++++++++++++++++-
 1 file changed, 61 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
index b1a248ee2ac..eaddb38a97a 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
@@ -18,9 +18,10 @@ import torch.nn as nn
 
 from collections import namedtuple
 
-from msprobe.pytorch.bench_fuctions.npu_fusion_attention import softmax_forward\
+from msprobe.pytorch.common.utils import logger
+from msprobe.pytorch.bench_functions.npu_fusion_attention import softmax_forward\
     , softmax_grad, broadcast_kv, calculate_qk, fusion_attention_forward, fusion_attention_backward, parse_bsnd_args\
-    , convert_from_bnsd, convert_to_bnsd, convert_from_bsnd, convert_to_bsnd, generate_attn_mask,\
+    , convert_from_bnsd, convert_to_bnsd, convert_from_bsnd, convert_to_bsnd,\
     generate_kv, rebuid_softmax_by_qkv, rebuild_softmax_by_max_sum,\
     get_head_num, get_input_layout, npu_fusion_attention_forward_patch, npu_fusion_attention_backward_patch
 
@@ -35,6 +36,64 @@ RebuildSoftmaxParams = namedtuple("RebuildSoftmaxParams",
                                   ["q", "k", "attn_mask", "pse", "scalar_value", "softmax_max", "softmax_sum"])
 
 
+def generate_attn_mask(*args):
+    """
+    # 当sparse_mode=2、3、4时小算子到融合算子会走这个优化，反过来看就要拆解回原来的基本实现
+    ===> attn_mask = torch.from_numpy(np.triu(np.ones([2048, 2048]), k=1)).to(dtype)
+    """
+
+    sparse_mode, attn_mask, b, n1, s1, s2, pre_tocken, next_tocken, dtype = args
+    shape = [s1, s2]
+
+    if attn_mask is not None:
+        # 当FA的输入已经包含attn_mask时，可以认为已经是转换之后的mask矩阵了，有三种特殊场景，即稀疏矩阵场景，需要进行逆向还原
+        if sparse_mode == 2 or sparse_mode == 3 or sparse_mode == 4:
+            logger.info(f"s1: {s1}, s2:{s2}, attn_mask.shape:{attn_mask.shape}, attn_mask.dtype:{attn_mask.dtype}")
+
+            if attn_mask.dim() == 2 and attn_mask.shape[0] == 2048 and attn_mask.shape[1] == 2048:
+                if attn_mask.equal(torch.from_numpy(np.triu(np.ones([2048, 2048]), k=1)).to(attn_mask.dtype)):
+                    if sparse_mode == 2:
+                        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=1))
+                    elif sparse_mode == 3:
+                        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=s2 - s1 + 1))
+                    elif sparse_mode == 4:
+                        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
+                        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
+                        attn_mask = attn_mask_u + attn_mask_l
+                    logger.debug(f"反向转换attn_mask {attn_mask.shape}")
+                    return attn_mask.to(dtype)
+
+        return attn_mask.to(dtype)
+
+    if attn_mask is not None:
+        if attn_mask.dim() == 2:
+            if attn_mask.shape[0] != s1 or attn_mask.shape[1] != s2:
+                raise ValueError(f"Invalid attn_mask shape `SS` {attn_mask.shape}")
+            shape = [s1, s2]
+        elif attn_mask.dim() == 4:
+            if attn_mask.shape[1] == 1:
+                shape = [b, 1, s1, s2] if b != 1 else [1, 1, s1, s2]
+            else:
+                shape = [b, n1, s1, s2] if b != 1 else [1, n1, s1, s2]
+
+    if sparse_mode == 0:
+        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
+        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
+        attn_mask = attn_mask_u + attn_mask_l
+    elif sparse_mode == 1:  # no sparse
+        attn_mask = torch.from_numpy(np.zeros(shape))
+    elif sparse_mode == 2:
+        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=1))
+    elif sparse_mode == 3:
+        attn_mask = torch.from_numpy(np.triu(np.ones(shape), k=s2 - s1 + 1))
+    elif sparse_mode == 4:
+        attn_mask_u = torch.from_numpy(np.triu(np.ones(shape), k=next_tocken + 1))
+        attn_mask_l = torch.from_numpy(np.tril(np.ones(shape), k=-pre_tocken - 1))
+        attn_mask = attn_mask_u + attn_mask_l
+    # 注:不会出现sparse_mode=5的情况，该情况要求必须要传入attn_mask，且attn_mask矩阵数据格式须为BNSS或B1SS，
+    # 因此可以认为FA的输入已经是正确的attn_mask了
+    return attn_mask.to(dtype)
+
 class FlashAttentionScore(nn.Module):
     def __init__(self):
         super(FlashAttentionScore, self).__init__()
-- 
Gitee


From 3cd54fef009da6054aa2dfbfb383b7355f4f3a8a Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Fri, 28 Feb 2025 16:04:04 +0800
Subject: [PATCH 045/145] =?UTF-8?q?=E4=BF=AE=E6=94=B9=E6=A3=80=E8=A7=86?=
 =?UTF-8?q?=E6=84=8F=E8=A7=81?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../mindspore/api_accuracy_checker/api_runner.py | 16 ++++++++++------
 .../msprobe/mindspore/common/const.py            |  1 +
 2 files changed, 11 insertions(+), 6 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
index fdeea2a4a6d..dd5c1523ec2 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
@@ -68,7 +68,7 @@ api_parent_module_mapping = {
     (MsCompareConst.MINDTORCH_DIST, Const.MT_FRAMEWORK): mindtorch_dist,
     (MsCompareConst.MINDTORCH_DIST, Const.PT_FRAMEWORK): torch.distributed,
     (MsCompareConst.FUNCTIONAL_API, Const.MS_FRAMEWORK): mindspore.ops,
-    (MsCompareConst.FUNCTIONAL_API, Const.PT_FRAMEWORK): fusion
+    (MsCompareConst.MsCompareConst.FUSION_API, Const.PT_FRAMEWORK): fusion
 
 }
 
@@ -89,7 +89,7 @@ api_parent_module_str_mapping = {
     (MsCompareConst.MINDTORCH_DIST, Const.MT_FRAMEWORK): "mindtorch_dist",
     (MsCompareConst.MINDTORCH_DIST, Const.PT_FRAMEWORK): "torch.distributed",
     (MsCompareConst.FUNCTIONAL_API, Const.MS_FRAMEWORK): "mindspore.ops",
-    (MsCompareConst.FUNCTIONAL_API, Const.PT_FRAMEWORK): "fusion"
+    (MsCompareConst.MsCompareConst.FUSION_API, Const.PT_FRAMEWORK): "fusion"
 }
 
 
@@ -146,7 +146,7 @@ class ApiRunner:
     def get_api_instance(api_type_str, api_sub_name, api_platform):
         """
         Args:
-            api_type_str: str, Union["MintFunctional", "Mint", "Tensor"]
+            api_type_str: str, Union["MintFunctional", "Mint", "Tensor", "Functional"]
             api_sub_name: str, e.g. "relu"
             api_platform: str: Union["mindpore", "torch"]
 
@@ -158,9 +158,13 @@ class ApiRunner:
             mindspore.mint.{api_sub_name} <--> torch.{api_sub_name}
             mindspore.mint.nn.functional.{api_sub_name} <--> torch.nn.functional.{api_sub_name}
         """
-
-        api_parent_module = api_parent_module_mapping.get((api_type_str, api_platform))
-        api_parent_module_str = api_parent_module_str_mapping.get((api_type_str, api_platform))
+        print(f"api_sub_name:{api_sub_name}")
+        if api_sub_name in MsCompareConst.SUPPORTED_FUSION_LIST:
+            api_parent_module = api_parent_module_mapping.get((MsCompareConst.FUSION_API, api_platform))
+            api_parent_module_str = api_parent_module_str_mapping.get((MsCompareConst.FUSION_API, api_platform))
+        else:
+            api_parent_module = api_parent_module_mapping.get((api_type_str, api_platform))
+            api_parent_module_str = api_parent_module_str_mapping.get((api_type_str, api_platform))
         full_api_name = api_parent_module_str + Const.SEP + api_sub_name
 
         if not hasattr(api_parent_module, api_sub_name):
diff --git a/debug/accuracy_tools/msprobe/mindspore/common/const.py b/debug/accuracy_tools/msprobe/mindspore/common/const.py
index ca89549a842..067e783842f 100644
--- a/debug/accuracy_tools/msprobe/mindspore/common/const.py
+++ b/debug/accuracy_tools/msprobe/mindspore/common/const.py
@@ -76,6 +76,7 @@ class MsCompareConst:
     MINT_FUNCTIONAL = "MintFunctional"
     TENSOR_API = "Tensor"
     FUNCTIONAL_API = "Functional"
+    FUSION_API = "FUSION"
 
     API_NAME_STR_LENGTH = 4
     MAX_RECURSION_DEPTH = 20
-- 
Gitee


From 9bf80c615917562c823f49db69895f76bde020fd Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Fri, 28 Feb 2025 16:05:03 +0800
Subject: [PATCH 046/145] Update api_runner.py

---
 .../msprobe/mindspore/api_accuracy_checker/api_runner.py      | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
index dd5c1523ec2..823faa2e49f 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
@@ -68,7 +68,7 @@ api_parent_module_mapping = {
     (MsCompareConst.MINDTORCH_DIST, Const.MT_FRAMEWORK): mindtorch_dist,
     (MsCompareConst.MINDTORCH_DIST, Const.PT_FRAMEWORK): torch.distributed,
     (MsCompareConst.FUNCTIONAL_API, Const.MS_FRAMEWORK): mindspore.ops,
-    (MsCompareConst.MsCompareConst.FUSION_API, Const.PT_FRAMEWORK): fusion
+    (MsCompareConst.FUSION_API, Const.PT_FRAMEWORK): fusion
 
 }
 
@@ -89,7 +89,7 @@ api_parent_module_str_mapping = {
     (MsCompareConst.MINDTORCH_DIST, Const.MT_FRAMEWORK): "mindtorch_dist",
     (MsCompareConst.MINDTORCH_DIST, Const.PT_FRAMEWORK): "torch.distributed",
     (MsCompareConst.FUNCTIONAL_API, Const.MS_FRAMEWORK): "mindspore.ops",
-    (MsCompareConst.MsCompareConst.FUSION_API, Const.PT_FRAMEWORK): "fusion"
+    (MsCompareConst.FUSION_API, Const.PT_FRAMEWORK): "fusion"
 }
 
 
-- 
Gitee


From 6281c1cb6ffd31e277c9e760b4e9d3d5f84f53aa Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Fri, 28 Feb 2025 16:20:43 +0800
Subject: [PATCH 047/145] =?UTF-8?q?=E4=BF=AE=E6=94=B9=E6=A3=80=E8=A7=86?=
 =?UTF-8?q?=E6=84=8F=E8=A7=81?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../api_accuracy_checker/api_runner.py        |   4 +-
 .../bench_functions/flash_attention_score.py  | 402 +++++++++++++++++-
 2 files changed, 399 insertions(+), 7 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
index 823faa2e49f..77957cc1413 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
@@ -148,7 +148,7 @@ class ApiRunner:
         Args:
             api_type_str: str, Union["MintFunctional", "Mint", "Tensor", "Functional"]
             api_sub_name: str, e.g. "relu"
-            api_platform: str: Union["mindpore", "torch"]
+            api_platform: str: Union["mindpore", "pytorch"]
 
         Return:
             api_instance: function object
@@ -159,7 +159,7 @@ class ApiRunner:
             mindspore.mint.nn.functional.{api_sub_name} <--> torch.nn.functional.{api_sub_name}
         """
         print(f"api_sub_name:{api_sub_name}")
-        if api_sub_name in MsCompareConst.SUPPORTED_FUSION_LIST:
+        if api_sub_name in MsCompareConst.SUPPORTED_FUSION_LIST and api_platform == "pytorch":
             api_parent_module = api_parent_module_mapping.get((MsCompareConst.FUSION_API, api_platform))
             api_parent_module_str = api_parent_module_str_mapping.get((MsCompareConst.FUSION_API, api_platform))
         else:
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
index eaddb38a97a..60e240cb783 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
@@ -19,11 +19,6 @@ import torch.nn as nn
 from collections import namedtuple
 
 from msprobe.pytorch.common.utils import logger
-from msprobe.pytorch.bench_functions.npu_fusion_attention import softmax_forward\
-    , softmax_grad, broadcast_kv, calculate_qk, fusion_attention_forward, fusion_attention_backward, parse_bsnd_args\
-    , convert_from_bnsd, convert_to_bnsd, convert_from_bsnd, convert_to_bsnd,\
-    generate_kv, rebuid_softmax_by_qkv, rebuild_softmax_by_max_sum,\
-    get_head_num, get_input_layout, npu_fusion_attention_forward_patch, npu_fusion_attention_backward_patch
 
 GTYPE = torch.float64  # arm host必须选择float64，x86环境选择float32即可，64也行。arm计算很慢，s=8k的场景建议使用x86
 SOFTMAX_BUILD_MODE = "QKV"  # "MAX_SUM"
@@ -36,6 +31,263 @@ RebuildSoftmaxParams = namedtuple("RebuildSoftmaxParams",
                                   ["q", "k", "attn_mask", "pse", "scalar_value", "softmax_max", "softmax_sum"])
 
 
+def softmax_forward(x):
+    x_max = torch.max(x, dim=-1, keepdims=True)[0]
+    x_sub = x.sub(x_max)
+    y = torch.exp(x_sub)
+    x_sum = y.sum(dim=-1, keepdims=True)
+    res = y.div(x_sum)
+    return res, x_max, x_sum
+
+
+def softmax_grad(dp, softmax_res):
+    muls = dp * softmax_res
+    muls_r = muls.sum(dim=-1, keepdims=True)
+    sub_r = dp - muls_r
+    res = sub_r * softmax_res
+    return res
+
+
+def broadcast_kv(num_heads, num_kv_heads, kv_tensor, dtype):
+    if num_kv_heads == 0 or num_kv_heads > num_heads:
+        raise ValueError(f"num_kv_heads must be non-zero and bigger than num_heads.")
+
+    factor = num_heads // num_kv_heads
+    kv_shape = kv_tensor.shape
+    b = kv_shape[0]
+    s = kv_shape[2]
+    d = kv_shape[3]
+    kv_res = torch.zeros([b, num_heads, s, d]).to(dtype)
+    for i in range(num_heads):
+        j = i // factor
+        kv_res[:, i:i + 1, :, :] = kv_tensor[:, j:j + 1, :, :]
+    return kv_res
+
+
+def calculate_qk(q, k, attn_mask, pse, scalar_value):
+    if k.dim() != 4:
+        raise ValueError(f"k tensor dimension must be 4, but got {k.dim()} dimensions (shape: {k.shape})")
+
+    if k.dim() == 3:
+        k = k.unsqueeze(1)  # 在head维度扩展
+
+    if pse is None or len(pse.shape) == 0:
+        qk = torch.matmul(q, k.permute(0, 1, 3, 2)).mul(scalar_value)
+    else:
+        qk = (torch.matmul(q, k.permute(0, 1, 3, 2)) + pse).mul(scalar_value)
+    if attn_mask is None or len(attn_mask.shape) == 0:
+        return qk
+    else:
+        qk = qk + attn_mask.bool() * (-40000.0)  # -10000
+    return qk
+
+
+def fusion_attention_forward(forward_params):
+    q = forward_params.q
+    k = forward_params.k
+    v = forward_params.v
+    drop_mask = forward_params.drop_mask
+    attn_mask = forward_params.attn_mask
+    pse = forward_params.pse
+    scalar_value = forward_params.scalar_value
+    keep_prob = forward_params.keep_prob
+
+    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
+    softmax_res, softmax_max, softmax_sum = softmax_forward(qk)
+    if drop_mask is None or len(drop_mask.shape) == 0:
+        drop_res = softmax_res
+    else:
+        drop_res = softmax_res * drop_mask * (1.0 / keep_prob)
+    y = torch.matmul(drop_res, v)
+    return y, softmax_max, softmax_sum
+
+
+def fusion_attention_backward(backward_params):
+    dx = backward_params.dx
+    q = backward_params.q
+    k = backward_params.k
+    v = backward_params.v
+    softmax_res = backward_params.softmax_res
+    drop_mask = backward_params.drop_mask
+    pse = backward_params.pse
+    scalar_value = backward_params.scalar_value
+    keep_prob = backward_params.keep_prob
+    dp = torch.matmul(dx, v.permute(0, 1, 3, 2))
+    if drop_mask is None or len(drop_mask.shape) == 0:
+        drop_res = softmax_res.permute(0, 1, 3, 2)
+        dp_drop = dp
+    else:
+        drop_res = softmax_res.mul(drop_mask).mul(1.0 / keep_prob).permute(0, 1, 3, 2)
+        dp_drop = dp * drop_mask * (1.0 / keep_prob)
+    dv = torch.matmul(drop_res, dx)
+    softmax_grad_res = (softmax_grad(dp_drop, softmax_res) * scalar_value)
+    dq = torch.matmul(softmax_grad_res, k)
+    dk = torch.matmul(softmax_grad_res.permute(0, 1, 3, 2), q)
+    return dq, dk, dv
+
+
+def parse_bsnd_args(query, key, head_num, input_layout):
+    supported_input_layout = ["BSH", "SBH", "BSND", "BNSD", "TND"]
+    b, s1, s2, n1, n2, d, h1, h2 = None, None, None, head_num, None, None, None, None
+
+    if not isinstance(input_layout, str) or input_layout not in supported_input_layout:
+        raise ValueError(f"Invalid input_layout arg which must be one of {supported_input_layout}.")
+
+    if input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    try:
+        if input_layout == "BSH":
+            b, s1, h1 = query.shape
+            _, s2, h2 = key.shape
+            d = h1 // n1
+            n2 = h2 // d
+        elif input_layout == "SBH":
+            s1, b, h1 = query.shape
+            s2, _, h2 = key.shape
+            d = h1 // n1
+            n2 = h2 // d
+        elif input_layout == "BSND":
+            b, s1, n1, d = query.shape
+            _, s2, n2, _ = key.shape
+            h1 = n1 * d
+            h2 = n2 * d
+        elif input_layout == "BNSD":
+            b, n1, s1, d = query.shape
+            _, n2, s2, _ = key.shape
+            h1 = n1 * d
+            h2 = n2 * d
+    except Exception as e:
+        raise ValueError(f"query.shape: {query.shape}, key.shape: {key.shape}, parse_bsnd_args error: {e}") from e
+
+    if d == 0:
+        raise ValueError(f"Value d must be non-zero.")
+    _dtype = query.dtype
+    ret = (b, s1, s2, n1, n2, d, h1, h2, _dtype)
+    return ret
+
+
+def convert_from_bnsd(_input, input_layout):
+    """
+    transform qkv from bnsd to input_layout.
+    B: batch_size
+    S: sequence_length
+    N: num_heads
+    D: head_dim
+    Args:
+       _input (torch.Tensor): tensor of shape (B,N,S,D)
+        input_layout (str): "BSH" or "SBH" or "BSND" or "BNSD" or "TND"
+    Returns:
+        tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
+    """
+    if input_layout == "BSH":
+        # (B,N,S,D)=>(B,S,N*D)
+        out = rearrange(_input, 'b n s d -> b s (n d)').contiguous()
+    elif input_layout == "SBH":
+        # (B,N,S,D)=>(S,B,N*D)
+        out = rearrange(_input, 'b n s d -> s b (n d)').contiguous()
+    elif input_layout == "BSND":
+        # (B,N,S,D)=>(B,S,N,D)
+        out = rearrange(_input, 'b n s d -> b s n d').contiguous()
+    elif input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    else:
+        out = _input
+    return out
+
+
+def convert_to_bnsd(_input, n, input_layout):
+    """
+    transform qkv from input_layout to bnsd.
+    B: batch_size
+    S: sequence_length
+    N: num_heads
+    D: head_dim
+    Args:
+        _input (torch.Tensor): tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
+        n (int): num_heads
+        input_layout (str):"BSH" or "SBH" or "BSND" or "BNSD" or "TND"
+    Returns:
+        tensor of shape (B,N,S,D)
+    """
+    if input_layout == "BSH":
+        # (B,S,N*D)=>(B,N,S,D)
+        out = rearrange(_input, 'b s (n d) -> b n s d', n=n)
+    elif input_layout == "SBH":
+        # (S,B,N*D)=>(B,N,S,D)
+        out = rearrange(_input, 's b (n d) -> b n s d', n=n)
+    elif input_layout == "BSND":
+        # (B,S,N,D)=>(B,N,S,D)
+        out = rearrange(_input, 'b s n d -> b n s d', n=n)
+    elif input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    else:
+        out = _input
+    if out.dim() != 4:
+        raise ValueError(f"convert qkv format failed with input_layout {input_layout}.")
+    return out.to(GTYPE)
+
+
+def convert_from_bsnd(_input, input_layout):
+    """
+    transform qkv from bsnd to input_layout.
+    B: batch_size
+    S: sequence_length
+    N: num_heads
+    D: head_dim
+    Args:
+       _input (torch.Tensor): tensor of shape (B,S,N,D)
+        input_layout (str): "BSH" or "SBH" or "BSND" or "BNSD" or "TND"
+    Returns:
+        tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
+    """
+    if input_layout == "BSH":
+        # (B,S,N,D)=>(B,S,N*D)
+        out = rearrange(_input, 'b s n d -> b s (n d)').contiguous()
+    elif input_layout == "SBH":
+        # (B,S,N,D)=>(S,B,N*D)
+        out = rearrange(_input, 'b s n d -> s b (n d)').contiguous()
+    elif input_layout == "BNSD":
+        # (B,S,N,D)=>(B,N,S,D)
+        out = rearrange(_input, 'b s n d -> b n s d').contiguous()
+    elif input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    else:
+        out = _input
+    return out
+
+
+def convert_to_bsnd(_input, n, input_layout):
+    """
+    transform qkv from input_layout to bsnd.
+    B: batch_size
+    S: sequence_length
+    N: num_heads
+    D: head_dim
+    Args:
+        _input (torch.Tensor): tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
+        n (int): num_heads
+        input_layout (str):"BSH" or "SBH" or "BSND" or "BNSD" or "TND"
+    Returns:
+        tensor of shape (B,S,N,D)
+    """
+    if input_layout == "BSH":
+        # (B,S,N*D)=>(B,S,N,D)
+        out = rearrange(_input, 'b s (n d) -> b s n d', n=n)
+    elif input_layout == "SBH":
+        # (S,B,N*D)=>(B,S,N,D)
+        out = rearrange(_input, 's b (n d) -> b s n d', n=n)
+    elif input_layout == "BNSD":
+        # (B,N,S,D)=>(B,S,N,D)
+        out = rearrange(_input, 'b n s d -> b s n d', n=n)
+    elif input_layout == "TND":
+        raise ValueError(f"input_layout {input_layout} does not supported for now.")
+    else:
+        out = _input
+    if out.dim() != 4:
+        raise ValueError(f"convert qkv format failed with input_layout {input_layout}.")
+    return out
+
+
 def generate_attn_mask(*args):
     """
     # 当sparse_mode=2、3、4时小算子到融合算子会走这个优化，反过来看就要拆解回原来的基本实现
@@ -94,6 +346,146 @@ def generate_attn_mask(*args):
     # 因此可以认为FA的输入已经是正确的attn_mask了
     return attn_mask.to(dtype)
 
+
+def generate_kv(key, value, n1, n2):
+    # N不等长适配by cdy
+    if not (n1 == n2):
+        k_new = broadcast_kv(n1, n2, key, key.dtype)
+        v_new = broadcast_kv(n1, n2, value, value.dtype)
+    else:
+        k_new = key
+        v_new = value
+    return k_new, v_new
+
+
+def rebuid_softmax_by_qkv(q, k, attn_mask, pse, scalar_value):
+    """
+    attention = softmax(QK^T/sqrt(d))V
+    softmax(x_i) = e^(x_i - x_max) / sum(e^(x_i - x_max))
+    """
+    logger.info("Using QKV to rebuild original softmax")
+    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
+    softmax_res, _, _ = softmax_forward(qk)
+    return softmax_res
+
+
+def rebuild_softmax_by_max_sum(softmax_params):
+    """
+    attention = softmax(QK^T/sqrt(d))V
+    softmax(x_i) = e^(x_i - x_max_i) / x_sum_i)
+    """
+    q = softmax_params.q
+    k = softmax_params.k
+    attn_mask = softmax_params.attn_mask
+    pse = softmax_params.pse
+    scalar_value = softmax_params.scalar_value
+    softmax_max = softmax_params.softmax_max
+    softmax_sum = softmax_params.softmax_sum
+    logger.info("Using softmax_max and softmax_sum to rebuild original softmax")
+
+    qk = calculate_qk(q, k, attn_mask, pse, scalar_value)
+    if softmax_max.shape[-1] == 0:
+        raise ValueError(f"softmax_max.shape[-1] must be non-zero, softmax_max.shape: {softmax_max.shape}")
+    repeat_dim = qk.shape[-1] // softmax_max.shape[-1]
+    softmax_res = torch.exp(qk.sub(softmax_max.repeat(1, 1, 1, repeat_dim))).div(
+        softmax_sum.repeat(1, 1, 1, repeat_dim))
+    return softmax_res
+
+
+def get_head_num(*args, **kwargs):
+    if kwargs.get("head_num", None):
+        head_num = kwargs.get("head_num")
+    elif len(args) >= 4:
+        head_num = args[3]
+    else:
+        raise ValueError(f"Unsupported npu_fusion_attention args {args}.")
+    return head_num
+
+
+def get_input_layout(*args, **kwargs):
+    if kwargs.get("input_layout", None):
+        input_layout = kwargs.get("input_layout")
+    elif len(args) >= 5:
+        input_layout = args[4]
+    else:
+        raise ValueError(f"Unsupported npu_fusion_attention args {args}.")
+    return input_layout
+
+
+def npu_fusion_attention_forward_patch(*args, **kwargs):
+    if len(args) < 2:
+        raise RuntimeError("npu_fusion_attention_forward_patch: length of args should greater than or equal to 2.")
+
+    # query, key, value, head_num, input_layout
+    head_num = get_head_num(*args, **kwargs)
+    input_layout = get_input_layout(*args, **kwargs)
+
+    b, s1, s2, n1, n2, d, h1, h2, dtype = parse_bsnd_args(args[0], args[1], head_num, input_layout)
+    if n1 == n2 and s1 == s2:
+        logger.debug(f"running case : BNSD = {b}_{n1}_{s1}_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
+    else:
+        logger.debug(f"running case: BNSD = {b}_{n1}({n2})_{s1}({s2})_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
+    if not (n1 % n2 == 0 and n1 >= n2):
+        raise ValueError(f"N1与N2不匹配,请检查: n1 = {n1}, n2 = {n2}.")
+
+    dims_kwargs = {
+        "b": b, "s1": s1, "s2": s2, "n1": n1, "n2": n2,
+        "d": d, "h1": h1, "h2": h2, "dtype": dtype
+    }
+    new_kwargs = {
+        "keep_prob": 1,
+        "scalar_value": kwargs.get("scalar_value", 1 / (d ** 0.5)),
+        "sparse_mode": kwargs.get("sparse_mode", 0),
+        "prefix": kwargs.get("prefix"),
+        "pre_tockens": kwargs.get("pre_tockens", 2147483647),
+        "next_tockens": kwargs.get("next_tockens", 2147483647),
+        "pse": kwargs.get("pse"),
+        "padding_mask": kwargs.get("padding_mask"),
+        "attn_mask": kwargs.get("attn_mask")
+    }
+
+    return args, dims_kwargs, new_kwargs
+
+
+def npu_fusion_attention_backward_patch(*args, **kwargs):
+    if len(args) != 6:
+        raise ValueError(f"Unsupported npu_fusion_attention_grad args {args}.")
+
+    b, s1, s2, n1, n2, d, h1, h2, dtype = parse_bsnd_args(args[0], args[1], args[4], args[5])
+    if n1 == n2 and s1 == s2:
+        logger.info(f"running case : bnsd = {b}_{n1}_{s1}_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
+    else:
+        logger.info(f"running case: bnsd = {b}_{n1}({n2})_{s1}({s2})_{d}, sparse = {kwargs.get('sparse_mode', 0)}")
+    if not (n1 % n2 == 0 and n1 >= n2):
+        raise ValueError(f"N1与N2不匹配,请检查: n1 = {n1}, n2 = {n2}.")
+
+    dims_kwargs = {
+        "b": b, "s1": s1, "s2": s2, "n1": n1, "n2": n2,
+        "d": d, "h1": h1, "h2": h2, "dtype": dtype
+    }
+
+    new_kwargs = {
+        "keep_prob": 1,
+        "scalar_value_value": kwargs.get("scalar_value_value", 1 / (d ** 0.5)),
+        "sparse_mode": kwargs.get("sparse_mode", 0),
+        "prefix": kwargs.get("prefix"),
+        "pre_tockens": kwargs.get("pre_tockens", 2147483647),
+        "next_tockens": kwargs.get("next_tockens", 2147483647),
+        "pse": kwargs.get("pse"),
+        "padding_mask": kwargs.get("padding_mask"),
+        "softmax_max": kwargs.get("softmax_max"),
+        "softmax_sum": kwargs.get("softmax_sum"),
+        "softmax_in": kwargs.get("softmax_in"),
+        "attention_in": kwargs.get("attention_in"),
+        "seed": kwargs.get("seed", 0),
+        "offset": kwargs.get("offset", 0),
+        "numels": kwargs.get("numels", 0),
+        "attn_mask": kwargs.get("attn_mask")
+    }
+
+    return args, dims_kwargs, new_kwargs
+
+
 class FlashAttentionScore(nn.Module):
     def __init__(self):
         super(FlashAttentionScore, self).__init__()
-- 
Gitee


From 21e516d893cba2db23e3e0418133d355f211e9d9 Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Fri, 28 Feb 2025 16:25:06 +0800
Subject: [PATCH 048/145] Update flash_attention_score.py

---
 .../bench_functions/flash_attention_score.py                    | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
index 60e240cb783..21a1dfe8f2d 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
@@ -15,7 +15,9 @@
 
 import torch
 import torch.nn as nn
+import numpy as np
 
+from einops import rearrange
 from collections import namedtuple
 
 from msprobe.pytorch.common.utils import logger
-- 
Gitee


From d1cf36f94b72be63d241cdb0e9afeddbf011c3b2 Mon Sep 17 00:00:00 2001
From: Mrtutu <zhangwei983@huawei.com>
Date: Thu, 27 Feb 2025 17:48:01 +0800
Subject: [PATCH 049/145] fix dyno param

---
 dynolog_npu/README.md                         | 121 ++++++++++++++----
 .../dynolog_npu/cli/src/commands/nputrace.rs  |   5 +
 dynolog_npu/dynolog_npu/cli/src/main.rs       |   5 +
 3 files changed, 103 insertions(+), 28 deletions(-)

diff --git a/dynolog_npu/README.md b/dynolog_npu/README.md
index 9cc015e66c6..d6ebd6f7ff0 100644
--- a/dynolog_npu/README.md
+++ b/dynolog_npu/README.md
@@ -85,32 +85,67 @@ nputrace子命令支持的参数选项
 
 | 子命令 | 参数类型 | 说明 |
 |-------|-------|-------|
-| record_shapes | action | 是否采集算子的InputShapes和InputTypes，设置参数采集，默认不采集 |
-| profile_memory | action | 是否采集算子内存信息，设置参数采集，默认不采集 |
-| with_stack | action | 是否采集Python调用栈，设置参数采集，默认不采集 |
-| with_flops | action | 是否采集算子flops，设置参数采集，默认不采集 |
-| with_modules | action | 是否采集modules层级的Python调用栈，设置参数采集，默认不采集 |
+| job-id | u64 | 采集任务的job id，默认值0，dynolog原生参数 |
+| pids | String | 采集任务的pid列表，多个pid用逗号分隔，默认值0，dynolog原生参数 |
+| process-limit | u64 | 最大采集进程的数量，默认值3，dynolog原生参数 |
+| profile-start-time | u64 | 用于同步采集的Unix时间戳，单位毫秒，默认值0，dynolog原生参数 |
+| duration-ms | u64 | 采集的周期，单位毫秒，默认值500，dynolog原生参数 |
+| iterations | i64 | 采集总迭代数，默认值-1，dynolog原生参数 |
+| log-file | String | 采集落盘的路径，必选值 |
+| start-step | u64 | 开始采集的迭代数，默认值0 |
+| record-shapes | action | 是否采集算子的InputShapes和InputTypes，设置参数采集，默认不采集 |
+| profile-memory | action | 是否采集算子内存信息，设置参数采集，默认不采集 |
+| with-stack | action | 是否采集Python调用栈，设置参数采集，默认不采集 |
+| with-flops | action | 是否采集算子flops，设置参数采集，默认不采集 |
+| with-modules | action | 是否采集modules层级的Python调用栈，设置参数采集，默认不采集 |
 | analyse | action | 采集后是否自动解析，设置参数解析，默认不解析 |
-| l2_cache | action | 是否采集L2 Cache数据，设置参数采集，默认不采集 |
-| op_attr | action | 是否采集算子属性信息，设置参数采集，默认不采集 |
-| data_simplification | String | 解析完成后是否数据精简，可选值范围[`true`, `false`]，默认值`true` |
+| l2-cache | action | 是否采集L2 Cache数据，设置参数采集，默认不采集 |
+| op-attr | action | 是否采集算子属性信息，设置参数采集，默认不采集 |
+| msprof-tx | action | 是否使能MSTX，设置参数采集，默认使能 |
+| data-simplification | String | 解析完成后是否数据精简，可选值范围[`true`, `false`]，默认值`true` |
 | activities | String | 控制CPU、NPU事件采集范围，可选值范围[`CPU,NPU`, `NPU,CPU`, `CPU`, `NPU`]，默认值`CPU,NPU` |
-| profiler_level | String | 控制profiler的采集等级，可选值范围[`Level_none`, `Level0`, `Level1`, `Level2`]，默认值`Level0`|
-| aic_metrics | String | AI Core的性能指标采集项，可选值范围[`AiCoreNone`, `PipeUtilization`, `ArithmeticUtilization`, `Memory`, `MemoryL0`, `ResourceConflictRatio`, `MemoryUB`, `L2Cache`, `MemoryAccess`]，默认值`AiCoreNone`|
-| export_type | String | profiler解析导出数据的类型，可选值范围[`Text`, `Db`]，默认值`Text`|
-| gc_detect_threshold | Option<f32> | GC检测阈值，单位ms，只采集超过阈值的GC事件。该参数为可选参数，默认不设置时不开启GC检测 |
+| profiler-level | String | 控制profiler的采集等级，可选值范围[`Level_none`, `Level0`, `Level1`, `Level2`]，默认值`Level0`|
+| aic-metrics | String | AI Core的性能指标采集项，可选值范围[`AiCoreNone`, `PipeUtilization`, `ArithmeticUtilization`, `Memory`, `MemoryL0`, `ResourceConflictRatio`, `MemoryUB`, `L2Cache`, `MemoryAccess`]，默认值`AiCoreNone`|
+| export-type | String | profiler解析导出数据的类型，可选值范围[`Text`, `Db`]，默认值`Text`|
+| gc-detect-threshold | Option<f32> | GC检测阈值，单位ms，只采集超过阈值的GC事件。该参数为可选参数，默认不设置时不开启GC检测 |
 
-- nputrace示例命令
 
+- nputrace使用方法
+
+Step1： 拉起dynolog daemon进程
+```bash
+# 方法1：使用systemd拉起service
+# 修改配置文件/etc/dynolog.gflags, 使能ipc_monitor
+echo "--enable_ipc_monitor" | sudo tee -a /etc/dynolog.gflags
+sudo systemctl start dynolog
+
+# 方法2：命令行执行
+dynolog --enable-ipc-monitor
+
+#dynolog daemon的日志路径为：/var/log/dynolog.log
+```
+
+Step 2：使能dynolog trace dump环境变量
+```bash
+export KINETO_USE_DAEMON=1
+```
+
+Step 3: 拉起训练任务
+```bash
+# 训练任务中需要使用pytorch的优化器/继承原生优化器
+bash train.sh
+```
+
+Step 4：使用dyno CLI动态触发trace dump
 ```bash
-# 示例1：采集框架、CANN和device数据，同时采集完后自动解析以及解析完成不做数据精简，落盘路径为/tmp/profile_data
-dyno nputrace --activities CPU,NPU --analyse --data_simplification false --log-file /tmp/profile_data
+# 示例1：从第10个step开始采集，采集2个step，采集框架、CANN和device数据，同时采集完后自动解析以及解析完成不做数据精简，落盘路径为/tmp/profile_data
+dyno nputrace --start-step 10 --iterations 2 --activities CPU,NPU --analyse --data-simplification false --log-file /tmp/profile_data
 
-# 示例2：只采集CANN和device数据，同时采集完后自动解析以及解析完成后开启数据精简，落盘路径为/tmp/profile_data
-dyno nputrace --activities NPU --analyse --data_simplification true --log-file /tmp/profile_data
+# 示例2：从第10个step开始采集，采集2个step，只采集CANN和device数据，同时采集完后自动解析以及解析完成后开启数据精简，落盘路径为/tmp/profile_data
+dyno nputrace --start-step 10 --iterations 2 --activities NPU --analyse --data-simplification true --log-file /tmp/profile_data
 
-# 示例3：只采集CANN和device数据，只采集不解析，落盘路径为/tmp/profile_data
-dyno nputrace --activities NPU --log-file /tmp/profile_data
+# 示例3：从第10个step开始采集，采集2个step，只采集CANN和device数据，只采集不解析，落盘路径为/tmp/profile_data
+dyno nputrace --start-step 10 --iterations 2 --activities NPU --log-file /tmp/profile_data
 ```
 
 ### NPU Monitor功能
@@ -129,20 +164,50 @@ dyno npu-monitor [SUBCOMMANDS]
 npu-monitor子命令支持的参数选项
 | 子命令 | 参数类型 | 说明 |
 |-------|-------|-------|
-| npu_monitor_start | action | 开启性能监控，设置参数开启，默认不采集 |
-| npu_monitor_stop | action | 停止性能监控，设置参数开启，默认不采集 |
-| report_interval_s | int | 性能监控数据上报周期，单位s，需要在启动时设置。默认值60 |
-| mspti_activity_kind | String | 性能监控数据上报数据类型，可以设置单个或多个，多个类型以逗号分隔，需要在启动时设置。可选值范围[`Marker`, `Kernel`, `API`, `Hccl`, `Memory`, `MemSet`, `MemCpy`] , 默认值`Marker`|
+| npu-monitor-start | action | 开启性能监控，设置参数开启，默认不采集 |
+| npu-monitor-stop | action | 停止性能监控，设置参数开启，默认不采集 |
+| report-interval-s | int | 性能监控数据上报周期，单位s，需要在启动时设置。默认值60 |
+| mspti-activity-kind | String | 性能监控数据上报数据类型，可以设置单个或多个，多个类型以逗号分隔，需要在启动时设置。可选值范围[`Marker`, `Kernel`, `API`, `Hccl`, `Memory`, `MemSet`, `MemCpy`] , 默认值`Marker`|
 
-- npu-monitor示例命令
+- npu-monitor使用方法
 
+Step1： 拉起dynolog daemon进程
+```bash
+# 方法1：使用systemd拉起service
+# 修改配置文件/etc/dynolog.gflags, 使能ipc_monitor
+echo "--enable_ipc_monitor" | sudo tee -a /etc/dynolog.gflags
+sudo systemctl start dynolog
+
+# 方法2：命令行执行
+dynolog --enable-ipc-monitor
+
+#dynolog daemon的日志路径为：/var/log/dynolog.log
+```
+
+Step 2：使能dynolog trace dump环境变量
+```bash
+export KINETO_USE_DAEMON=1
+```
+
+Step 3: 拉起训练任务
+```bash
+# 训练任务中需要使用pytorch的优化器/继承原生优化器
+bash train.sh
+```
+
+Step 4：使用dyno CLI使能npu-monitor
 ```bash
 # 示例1：开启性能监控，使用默认配置
-dyno npu-monitor --npu_monitor_start
+dyno npu-monitor --npu-monitor-start
 
 # 示例2：暂停性能监控
-dyno npu-monitor --npu_monitor_stop
+dyno npu-monitor --npu-monitor-stop
+
+# 示例3：性能监控过程中修改配置
+# 上报周期30s, 上报数据类型Marker和Kernel
+dyno npu-monitor --report-interval-s 30 --mspti-activity-kind Marker,Kernel
 
-# 示例3：开启性能监控，上报周期30s, 上报数据类型Marker和Kernel
-dyno npu-monitor --npu_monitor_start 30 --mspti_activity_kind Marker,Kernel
+# 示例4：性能监控开启时修改配置
+# 上报周期30s, 上报数据类型Marker和Kernel
+dyno npu-monitor --npu-monitor-start --report-interval-s 30 --mspti-activity-kind Marker,Kernel
 ```
\ No newline at end of file
diff --git a/dynolog_npu/dynolog_npu/cli/src/commands/nputrace.rs b/dynolog_npu/dynolog_npu/cli/src/commands/nputrace.rs
index 4bf7132de33..f70923bca4c 100644
--- a/dynolog_npu/dynolog_npu/cli/src/commands/nputrace.rs
+++ b/dynolog_npu/dynolog_npu/cli/src/commands/nputrace.rs
@@ -55,6 +55,7 @@ pub struct NpuTraceOptions {
     pub aic_metrics: String,
     pub l2_cache: bool,
     pub op_attr: bool,
+    pub msprof_tx: bool,
     pub gc_detect_threshold: Option<f32>,
     pub data_simplification: String,
     pub export_type: String,
@@ -75,6 +76,7 @@ PROFILE_PROFILER_LEVEL={}
 PROFILE_AIC_METRICS={}
 PROFILE_L2_CACHE={}
 PROFILE_OP_ATTR={}
+PROFILE_MSPROF_TX={}
 PROFILE_GC_DETECT_THRESHOLD={}
 PROFILE_DATA_SIMPLIFICATION={}
 PROFILE_EXPORT_TYPE={}"#,
@@ -89,6 +91,7 @@ PROFILE_EXPORT_TYPE={}"#,
             self.aic_metrics,
             self.l2_cache,
             self.op_attr,
+            self.msprof_tx,
             self.gc_detect_threshold.map_or("None".to_string(), |v| v.to_string()),
             self.data_simplification,
             self.export_type
@@ -213,6 +216,7 @@ ACTIVITIES_ITERATIONS=1000"#
                 aic_metrics: "AiCoreNone".to_string(),
                 l2_cache: true,
                 op_attr: true,
+                msprof_tx: true,
                 gc_detect_threshold: 0.1,
                 data_simplification: "true",
                 export_type: "Text".to_string(),
@@ -234,6 +238,7 @@ PROFILE_PROFILER_LEVEL=Level0
 PROFILE_AIC_METRICS=AiCoreNone
 PROFILE_L2_CACHE=true
 PROFILE_OP_ATTR=true
+PROFILE_MSPROF_TX=true
 PROFILE_GC_DETECT_THRESHOLD=0.1
 PROFILE_DATA_SIMPLIFICATION=true
 PROFILE_EXPORT_TYPE=Text"#
diff --git a/dynolog_npu/dynolog_npu/cli/src/main.rs b/dynolog_npu/dynolog_npu/cli/src/main.rs
index 8bc4a2af0e2..9fdea3d1254 100644
--- a/dynolog_npu/dynolog_npu/cli/src/main.rs
+++ b/dynolog_npu/dynolog_npu/cli/src/main.rs
@@ -172,6 +172,9 @@ enum Command {
         /// Whether to collect op attributes.
         #[clap(long, action)]
         op_attr: bool,
+        /// Whether to enable MSTX.
+        #[clap(long, action)]
+        msprof_tx: bool,
         /// GC detect threshold.
         #[clap(long)]
         gc_detect_threshold: Option<f32>,
@@ -290,6 +293,7 @@ fn main() -> Result<()> {
             aic_metrics,
             l2_cache,
             op_attr,
+            msprof_tx,
             gc_detect_threshold,
             data_simplification,
             export_type,
@@ -318,6 +322,7 @@ fn main() -> Result<()> {
                 aic_metrics,
                 l2_cache,
                 op_attr,
+                msprof_tx,
                 gc_detect_threshold,
                 data_simplification,
                 export_type,
-- 
Gitee


From ea63ef31717aab1904cff48fd3e7c83da14028a5 Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Fri, 28 Feb 2025 16:46:54 +0800
Subject: [PATCH 050/145] =?UTF-8?q?=E6=A3=80=E8=A7=86=E6=84=8F=E8=A7=81?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/mindspore/api_accuracy_checker/api_runner.py  | 1 -
 .../bench_functions/flash_attention_score.py              | 3 ++-
 .../bench_functions/fusion_operator.py                    | 8 ++++----
 3 files changed, 6 insertions(+), 6 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
index 77957cc1413..36e506f6773 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/api_runner.py
@@ -158,7 +158,6 @@ class ApiRunner:
             mindspore.mint.{api_sub_name} <--> torch.{api_sub_name}
             mindspore.mint.nn.functional.{api_sub_name} <--> torch.nn.functional.{api_sub_name}
         """
-        print(f"api_sub_name:{api_sub_name}")
         if api_sub_name in MsCompareConst.SUPPORTED_FUSION_LIST and api_platform == "pytorch":
             api_parent_module = api_parent_module_mapping.get((MsCompareConst.FUSION_API, api_platform))
             api_parent_module_str = api_parent_module_str_mapping.get((MsCompareConst.FUSION_API, api_platform))
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
index 21a1dfe8f2d..cb268efeae9 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
@@ -13,12 +13,13 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 
+from collections import namedtuple
 import torch
 import torch.nn as nn
 import numpy as np
 
 from einops import rearrange
-from collections import namedtuple
+
 
 from msprobe.pytorch.common.utils import logger
 
diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py
index 7f38232595e..e1344541e89 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/fusion_operator.py
@@ -26,10 +26,6 @@ class FusionOperator:
         self.flash_attention_score = None  # 用于存放 FlashAttentionScore 操作符
         self._register_operators()
 
-    def _register_operators(self):
-        """ 注册操作符到父类，以便通过 fusion.xxx 调用 """
-        self.flash_attention_score = FlashAttentionScore()
-
     def __getattr__(self, name):
         """ 动态获取算子类 """
         if hasattr(self, name):
@@ -37,5 +33,9 @@ class FusionOperator:
         else:
             raise AttributeError(f"'FusionOperator' object has no attribute '{name}'")
 
+    def _register_operators(self):
+        """ 注册操作符到父类，以便通过 fusion.xxx 调用 """
+        self.flash_attention_score = FlashAttentionScore()
+
 
 fusion = FusionOperator()
-- 
Gitee


From ef7d28deeaedd315cbba58a0e25898b06b747b91 Mon Sep 17 00:00:00 2001
From: cai-weiwei1989 <734267852@qq.com>
Date: Fri, 28 Feb 2025 16:44:47 +0800
Subject: [PATCH 051/145] =?UTF-8?q?[msprobe]10.accuracy=5Fcompare=5FPyTorc?=
 =?UTF-8?q?h.md=E6=AF=94=E5=AF=B9=E7=BB=93=E6=9E=9C=E6=88=AA=E5=9B=BE?=
 =?UTF-8?q?=E6=9B=B4=E6=96=B0?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/docs/img/compare_result.png       | Bin 77942 -> 62634 bytes
 1 file changed, 0 insertions(+), 0 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/docs/img/compare_result.png b/debug/accuracy_tools/msprobe/docs/img/compare_result.png
index 07cdb51707fe43d07723ed976275d99f55b50571..b6d7ec6dfcbc44b4b7056e1297a481f495ceb86e 100644
GIT binary patch
literal 62634
zcmd43dstHG`akSUGu3o*S7W86%+6_QQpYhf#{;mNOxm3sM~&2!DG#VvmSQT1t6kGc
zQ?|Rw(o&|VG*L)VOAM$f#WF-RKrNv%ML<PG&ailw)tvVJUBB!5e)s#wyDnX<^{n-r
z@8^E*!{=USzuS#kIL~RGot@pnzi$ir-p+2$b33~a$a7~yDVDC=CD6|Y8Q-J6wWD{g
zQb0E!VK?vEY-d+To^RRzF?9dQ;cbx_c6N&%&HR6G!EMn>D8uRG@V)rGyLS4=r5*fg
ze|*}3gs-v>9){kwvkOFKAKo8_OTd42AOV|v2)<U`!d?4Way)!3+Gp3-yAE$jNJ`#D
zNKXhO><*73;Ntw^*CG)M=LKf_LnRzc!0-Po`(Wy!4F7ES>bC{^L)SCOo~sdo>G6sF
z-v<T1e*?OMuTH|_5Bqz1W@Tl4mF4|aS~}L#%g@ix^Xm<s8#Z`AZ+K+n9K!F<_BfQ`
z`o4gmgp9cK<iq&nv_qfG6uAFDS|%R8Ix{ml-am1FqR)Z&cpr}g`@Q2myu9M~d+d+*
z_VS4L_Kx@U@%m;%qSt}d@2kfrC;ndlp^W##01b%e%o9(qufCpX^31h=NP2Pt)QXuZ
z5nh3BpZ_T>&~v6Ce`pxuT?*7!=<2tTnHi?vMmOOQG^AP3*t!37X}+D^RL$RmHiu`&
zj<N@e-)tiv>{#a&eA0wp<yW-Gb$8`F4L;}_$!kRTRj0<K$ld;qpSy}T?AWnn<*|pp
zj>rqe<yM2tW|hf5d^?4|pB`Gee!qEl^=x8)z@O9ZZ#Ud_{&Ug~YjS(PvdC;^z~`ey
zmRk=fPXEPe6(V&x$hE0$J%9OTqH;En@?V_N4Yy+q0901;+*O9K6G)%`;^YVQapJP$
ze^bQUyfft-W<GlvvJm`lPH(P&`^|t=0wj-w(<iWh0aaYk&BFQ+J;D19puZG4SVBYS
zFAI)D0QA?3!Dss(z-9plo-KtV&$}6zAL%<C?nQp}Mvxv#roSYcuFA3LTLJnb2dhxy
z{eV*DW{BJOc=_NwFdIW3hKll{5A)L(1Jj%bloi^Md5D+?FzrVG7;No&_qs8T=M-?>
z%}ABL6nH+fe_KghHfBP;ynIf1-bVB^N_~|%exnDO%5_2;_~#(vvspC*K>3jq>(CQe
zqt)(vfPUY>a(0~J_9CF;q_sI8WeCgo7$|vZl&^={4%mWZf;aO(_wl+LJZy#oP*Om^
ze+*1dUWbzN!F^|;y5lF&Go8RAV;)e}WZN=M>Q8lSwM^<eM1id1$ocw^zvFE$1+o!q
zTtzuQ!ZKL_-DG2~sj<hAKIkdb<JXKg+rfC5;3FV~{!*~y9>>#=F`qs{<^mQ8O%_Hm
z?Qenq9LrYZGXd{GCDf>vG<rMK=DSY@NAtl;p6I)k6P3gBzzItR<}J<AM+6rt$TR2r
zGb^I`I8vxtXye?SgPu5TmUCW)@Et5dUP*B)=COmNdBa=UL{IX#6)1)td&B{tKZ&q3
zKe1lBq6pFFBv*2eyO}dKRp#~PZKWG7J9eCmy-imN(u>!QK<OX9t5GR%s34ZiH)lA!
zyB`)rNS8aIHS!dwwhNZ#*T@%)Hv)(EE3^#Ccv8O^t&`9DogDYIQfT0YU!VbcDInb~
zKw@8nK@_`Bk!bYP+m>f*3yY7e0qAofl6njyrp9~%b?jeAG&FPu34?a{*GCjLIQ^WP
zF=Old)jJG5*CWwJUklWV)#xdCioP@bufXWTd>VTWD<6se7#j80_ORJfh>YU&T@mBu
zLkGZpi)R?gOfz-nWQZ?xTD<2zu~iss%iHflmCnr68#26!{?SZpC~oO%0E<cz@!KQ8
z1s8PN`}*>c3tE250@yMx@Os}p;f<HlAe#HwS||BB4{_A~-N3yev$Hr)G6d;f0KNT!
z<&_KrH)MFyN6EH3y^eyuN>cAQfa?U1muX;PTcq!qbZDJ@_<lj}6T)mOGq4#DF+vT4
z23`bBqxsvx6mZ`{Xtc_Zft>M=-#>U|tdu{6{k$GME#Llj4)(RetajfC1h3bF?#rzS
zKfW8oVRv9U<9pK1<b7H+w4{IXuDH0{e4A7(+jw^#8swjIJDdQ-T3?>MTaQG)%!f#D
zhS?1Z9CBILkmwKp4?Gl_4~t}L-eyq-G-K@%mgas^+|0~FYvFeuiJs!+MGkKNPx|XL
z@z1p!{uls#4Yfbf0=+N~D03|eAyK)2J}PjyJ45J#2<Qj>mVFOH3shko$p=@UCq|xt
z`#$*dTHuYt%nvS+Mmnuam%^o;uc5agqMDg@;~=Gy@ypw3n&ioR@8u1go}pOcyFwoO
z4Lv+c?1EP8n|Zzk`iDTwt6c&IOXQ3Bh6@mLdmS>f+_^#EzE&#DnBfDh>0dM<XQfD!
zbtiQFx`H@uNTt6PL_q7(l-;eyru#q(-2oz=?aP2QP}ez_p+-{k8RUF5uzebAUIH<y
zVl%Ik0r9EF<1je#1jHo`atbYQP7EJrv(AHNE|xp~$y;7ak_w>$KL(&BZ~#hI7m{NB
z;cXF`<Hz*q^voHCg3*K+Z(D&Oq+X)&_R|PHTOlR8<uLa>f(@of-Iq_I)GIB<mD=I$
zE-`!x?Z`|~CWzxbTmFuNe=gXJemM`kGD-e16yo4gZ$jP|Xbp<n2~BKoU0Wx#9<!13
zmor@ZTze%G>LYr(6`GM#`p0>8M>nA-*0O+Ui#s$B|GL+P`3KFw{9G^Wd&?vuznbRo
zpkWy1UzlN>rn}u5ZzzA;g<LQCYqEZLJEHs*c^nusx;3+q)$D(TAyT;;u$IKO^0#d6
zkGp>v&5$vi_Vb?qq%5tx26pUAv{t_Uch2+Yt2cq5z-B~-Ec`bq<!_yX#@wm>ErTi*
z&S=zBo_gi`JH`ILx%zsR{@otD2ncrhPl0C9pObDcL8Q+4bJE^VU`?1yyurFa7yE^?
z7Cf-d@;+>{d<Yx9&s~vQ$_ota=26YC)|g?A@(Q|qKK*0;C-L`QYZdgDJNPt9j>w;w
zA!)|6x<JeI<HNhM_kC#h;sgx*BwDuDm>~)$cLr?42n4};tFo^`P<d+4Rd1Eiy`SNa
z-lZM6x5Zo}X3r}h6M2v4*j9P9=xRG7!r=buE)Gsb4#pC+si+r7)aYiSdca1nT1zBS
zN%~RiJp3WJ?0l6xl+0jvRS*ybo$MQGjq!@^NJ*&?`<)tJ<Yv6ajQOB^2R5)D8S}0#
z%lJrM_1gxii^eP8R{whvYDEs|i5Te=qZg^NI9Ccy$B_V)1MRF;o>|lK2mvNqC3Vzh
zw#l-B;J4m35w_LLsFgkG=MB+@KeRi>HLAF&ch;&$T5R=e$JPk|b=SQ{EvjeCrmP|p
z%`{R2AjkY9=Vk?2nYi<<<j>0(Ws@mE8Y~k#Igi~*uu`?w1)&u-#BuGjLAReX6rlRP
z5Jb3;)4)-FD2W_Ql9|D?CKOvg;i(MRu_<gB*Qwan=hOS`@Rntm9UE=2Ova6<J1jtJ
ztW;)vl-HEf>D|@5f!uk;ywisFK%UMcTMDKu`WC9W%No-Pi`I)q%2-^8u$Qsy2V~F=
zF0to=LcH0AN3_D8OQI01l-k_mNGt+i2T%^%p8f!i<V?e-JfCP}s59fXGv4&b23u`L
zYV9mLJMdiKJxA}fbwA6?Eqv(;?2)~w;kad(0_&DJZCyaT%Yy(oa`fatCCWUNubOXL
z0=M0J?Z1-MRNN{UPSImGp_a{%<S|mVh)W*t6iJZ}tuK$vwwoa2xi8QDa9j+04$N-l
zxely&>^QX8a?D4i7Pt<0)6lEN(j>N>mKUtkNf;KUwon(D{ABQyK4j}gYRW(vngf(L
z(?j;CZ*3F|^2aF&Ll)O6<c=^(Eu(A+A3c;{iVV^OdBMmH`Nga!Fj&Df`k(w|$&s<A
zb&ngi3A)OPH6BTn?HyC=bIFa3JHFm>T~ViWg8fzLteuRyuHGy`c8l9KBEF5Fl~tf}
zs>ilM3D@>Mic|y7?xddDj`rxd{OSpKE-6Opj@Ds6nfhs`rp_JvBh%veR{|rYrVqHD
zT&P@3UTHOdD}R#W#_nG2k~S<jbCc&l_SMY1zdg*wcMAK_K*8EFz-_=%OqV<LIKd@O
zg~V%DguQzjB>kF26pSd-kEmRXCX)2zPmoznrw;)g`Byx`+4?f%YN)C08)0O8+~;%b
zUT!-Db{r+uS4)2wE3Cz0z{lOg6Ef}Na254RQHnYO=n$=n0rpU?Di3N@`o?VAYJ2h{
z-3{K+aW3v@ksCR@ph`#Aa%}A;;)wU&5O`CDjpQcfwm)<YRo??PogU5xA_^w_7K@~f
zwtl0o3)>|futZO2{afga_{lY;A(HQQY0(qgz~aSYZuttAYq5?OfE``Ylauc9ZFs~$
z3uRXvH5^y9EHnl~n<T9#dH7R0_ro(|$b1<8XDiibeM2nHgU&1FEThp9p|apzJ`G$6
zd)ZiYTz|kX^n*bW*vV1zk{SlFcUH_6Gh;Gs{xF3!CPG`E887~WjkAa6eT+55af0^V
z(@Z3FPNVd6ziQ%G1n4{@SY|O%&3cxp627{ct?JKPI95v#$JJKsSDDpO&$VKg#p+SA
z_S~6aayAxdxHDYkas&-Dz0|MZb59-ucap^#FJ#!JI5F{a9zjv&q{_B%vVJ-Q?pAk2
zTBQpHT869WPnE8h09|8a$d6-al9%O$&;<{KQi`wC;@SF3$cKao_<Ft|L6%9XC8yij
z6(x>5geHryCXdam_#8{AaubZU-tQ?_KX$XgHK3vk=bsK2Pj%`;cw#t_o@;Y=vx;7f
zn7*Vym*-U~(BJ+}P2-K>3%zXS$J#W%Y%WUId7HR8>N&68+@@r@IO9^Ty(m_xwCjBH
z9Z}}Ex^0&e;yF~m0~lPDSb{qsNeQW#rI%m0l?dDbu!e7@40UkYa>nbOK=3!jn{H-r
z0^s~O!t&S!8Tz!V3_E2B(@qe{DFM||f7y~ZDr1E~+9yqwT>$CexvpB<W6;pZWCQs~
zp?k+0Q)r0xUN>ser|$@UjHT6<p^VOge@NEEgej)c!rEGb+%|Vuc7_~%n?ru>^Evf7
z2G1Qa{_9O)SFOw|n)|ugOE+R~cX$(kNWHVXfLSHJv%F6E_vT-eckZoNFT6t3A@h?C
z#ffD%6t?l2W?gYe)?J|Ji>aaYPxnErt)%}<du6GSe!o<sCXrTmzL1G>PTH8gsnM~p
zgCQo;Pg#22nF`4QuFbvj0NGd+e-yx`Pg@o0f>9@FACk(l35Ms9DUb;FF?}>dZ^&)6
zW+nh7uban2L5NI=S~;2nu&GGmR1t{RFq*kiAtm9pu|r3bF&>qv%xA;(i~)7=rfZ%j
zKopsV*1Ryx_i;7TZud8;oQO5ZFqzkLnR0Bt-AmB|>%}qbfsp!WO44%u>JhFkXl5VW
zrkl`@2M(;{cp#p}X0fxHbj|CfvVd!n#4+t;CMx@9W^K7T6|d_vN(h!OCGwigfFd1m
z3LXo?GR#%TXtUt<X{2+W4JRSA<}yd5^g!IBkr(A02km%OCZaeXFz;pmNL-I>#|w;&
za5!SRKPG3-kc0jrA>&O{RuH@SGSa_=0+7u+h=OVV6Mb@qo0`Z_nJ*cP*Sx}rpA*!|
zD+m{>xv^V6VcUk6HjdVDOZ)q@SXF>-M6G7@#oF0L-?f|`tLR(4DUN|~#F>!ieOF))
zi&?}CQ>TuOAtb|s`b0KbhC~^NzT#0vM<HG2jx%jlsf;wo806&v8KsQM5_6Axi>Jd?
zw40#E<|34JtcsA3daLh5YRvPDHzN0F)4`dWfl$C7+BeRws9nh~7>*&@P)Pz;Asnw!
zr4sT!+7#z=QSRXFh_kkMmol2L+7CZl-GZt&1T2MPY9=?sGD5lR($ciZNbcG`7HGuT
z*JrM#zY);(GP!Q1^R<*#N&QVhAJ`j*iX#fg7(ExZtIniI=-fFdJ*8D3;rA;le45c;
zJV$+s$p93CU%y@)7+YAw_}5UvB)gYpizV6F1sm(`u7#17G-Yew#Cy)x-GHxe0K!$~
z%k<2AvMLvsIIW7;M%a=%*WHAR#n_}n4Qdb2sjSi(L2lO}j;m!NlsUXQyXjO)MG}WD
zRdJ+e4)n(zB%Kn7q)(OsnI*fS_c*6goX6CXGs^l)VuHoVMdqfe<K@o0hKiu#vQ%zS
zGUG}`1iMw++iBIWyQ$fVTXnM2xt5{1rFZo!PTaeXOubSi9ihKkb}h2xfSRQq&7N-A
zZ_O;<rY}=3AL?y(F`IUiCnn)m;k`9?^%nmUl{txVh_gQJ6O)@iMQl=s?o>7M=Jqr5
zQFW>6>YNy2|HZXYJ0>$j$&1Pbf^W8O!hT9VfU{_lJZmH1-<omc{F<~oz6=yEQr4J+
z9Js7p3^6H^wpX56SDWPd?w)GREL4Ks>PYu38JTI-s1Zv)^`Ub5n<t_0GSB?2E>XK1
zn^HpU2e=XvdvR+6uitdeeQk8Kq_)V~Oc~He9%pY=1>p>rbbF&I#Y0I*S(p!BpHxm_
zpGUHqFqljjMtYyp%BS-}i<ARV)v7Gl=dv>u$%tXWg%MLqY}2WKwR+<>jmh{jg>xi_
ztdd%D5y&2Y_>}Cn-zc$iraf^VVJO;m-Qw0vX=-pskNOlDSL;=uS8}nHYC4m2s4&9H
z%*@@#?lFE~7yE!*X$fYy&|JLADuXgZ?I~f-xTh1Usy$aTBS|;OZS{sEch@I{%G}+V
zHF&El{J_SL$xK(RtDmFDsq`jut6ymBr;G!Uxf@GfWuQ`m(*r{>@IBC5o>ZEi;7e(%
zk6P2+xarB+scYE|9j~c%Mf5gRwAkr!$8_r0PQ73B0ihG>swz=MTQ-zj)E2&ye`{mH
z=h%fDij9s-s*t!IoZc5#y_IkSdWcfG4ix#64CTPP>ofS0-ZM8@0%6>mZkBXMJ=t9f
zjrH8fgV2N`T(0^EkAzcN;Zc;K#K|=ybtN^M@==h`HImW*+(4Zh{*u!MNDyVq`6J}U
zJhxEf+ZKli*~w2SDBQWWrX||$IFW0x=2Ofd7YCDJd>B|B=ZpM=pk_i1;ZaiTkBmY>
z)o{jiV1Y6FQ&r0Jj>pr&y~|*Q35Gyh49>?hN>BvPTV}fvZ%T46Ah&JEt*}*SX$^C0
zJJP*L8%tVIagGQ9Ac=zJp5YedTeiHFHj_QVV5!>eL!rv^m4w)#^%v-6ND1Ri)gA>Q
zbu+dHbdoeigs~q=4C?;MC~9}`^qR;X9{VP*8tT#35laMlr+)G)9?q%9pMk4I5zoCz
zm~>yex{Q{e$#e3~4H4Nvvt0{`&G)6@+%d6rw)1p2_?v?GqTJ19*<mZd*giIR7Z6SX
zb`!S(L8F|aVna6bKOJ|!Cd(awq46LNhf_j90x2u<{&(i#S$2ov2Jfjq6>ewe_Uhr$
zKPMf#Fk?x-(m6P3(0nX=0Q>c+A-<kM-dfk9Ib{C8E<5Yc<bHDi=ZEpfl_sX1L(S{E
zd^g~>{zWJkZp}eZIyA;-Ut4Aazh-`U{%juNraZbTkJBs{AW_+YE`V<ONhbNtQ_?+?
zshnR*glCMgd+Seo_)O$kCPFs7`1GxM*4R5(_|v4p`o*v@7tAcA`X0{OFK8C%<n6ox
zAz4iaZWL|^doJW7cSyM1h{d^8uVUYu^)Hu20*T|?@y4knQlyt{+wMn6wsZ8nU_BV*
zcYz-DllL!T|20Y>U!>^BH`ZTqM;xbkDti>J_{{P{@j0SYCew45t>_S>wk5P$T>YX~
z#2~3On9!}-v=|6TR25dCd@+@tZo?hv^@h25oT`vYa+fHRRXh~ItSybn(5`y9&0=lR
zN{J!?(v_8&iHX+f$FJmAbqDy`0hXj#>Og*@Inh!l;<k7bt*`Vz-y!?s-mnFtGA#VB
z{bh!pFn*SA(Zmv<>B#i?d%)7ej|N**3{%vEJmVWv6n7Sw_kgCJu|&LqjA+c$NN+ub
zvnRzWWDN(gLX#b+R&SQcF~%yqvKw<8z|n7%r7aAt?PU0s)BTDM1@*^GP2SKb7L-ec
ze2JpMoiP<6N0WZ622gjv_eFT0qf>+;v?=Z-s8j|30o5SxOiGK<KPF@Kz?p`{fEylB
zezhlnW%M67KNJBfEY)rydW~o#;J*9OkYIzkmX+p_=Nqio&#U%PE7cBN@)xf3H0>4c
z$&eN?`Ysnse=e0EUsrL^uNg?!w3P^R+uiksSrbw8iElF#pl-g5l8hj0$hjHWsJFJx
zZ17g87OOThXtHSXFk~J8d??)_fs$E;Va1*vR>LXXS~Te>NB(9|l>{}5?K;IcP|FRq
z`DnMJxp!Rnw(ZxnG~)$2r-#C~I*8CowxTLqnW+(Pji8h>H2T!vGuaV)2B<DAXvwpC
zOGuX5A*K0*>Z*Q~KtcIf0wAB*ux3}ou5GY_A|F}%bQS74Zr|DTYtpiwWQWjQ4L6bE
zT-P3|OELY(nkQ!oxX!AZyzSSMF>pruh24TPV%fKQ0{W5N_>dXKQ(m#SmV2_a-&N>a
zL4NGp@T7v>`8PRlX5F0`k>bX!F0a?)iAubn)TO*xm;Ta(nhrdE$Tl#j>QPt}7E+c!
z&^bJ+%6Rtv0a1z!(LXe&#&BaB5-Vq=CXmfa2fe&R8d^x+$}3BYCp>fQ_Mr#)g{JWp
z4eSx|nTA7og$m;aL)mK;{uK4>F!{{Ja=(B(afOai7hAP~Pr_=c)hcl;6<b%uqn#0p
zwbUzFL%i=(HxNEEUvfs~asOWLIToQ<)-$+GFkx-Hqb#FFeFVONWMdD$Nw^@t^L87z
zsMr`#-G?#(klpvyq}eNP`W)+2jJ=r!&A6T2VSARO!xc}oc1m$dl{uhitg%P%1Aiys
z;Dz1fy-d)ZRl<>kTOIJYqh!yJ8|>qUtgh3YlulVzrG^)ljH(+p;We3rM`c>9urV7n
z7SStl)r)Q~Bi3wvDn%0jr8Qu?_U<$;DBfH!MS5D4Y2Q!lw(b+23*9;Sw!vY^L}6`R
zW?m0dy;!_MV3oK{;u2M8a4$zNNeF7R`B;5i6wVR58k#6a!u3f{85n;0M+26U3~?@F
zm;q74p6V#lgy$|Ws(~B3vmhaRmui8<cv4*Wbv>t*8dr;k`vYr)xwtNZ#qTtB;@jK4
z7nV1H5i{KN814W=pu54ih*FiDFBaW%9f%FEE?||iRFKROoznDutu|1>PV_k+s$hbG
z?pmPXke_2De{JX(@JQyW5RVS4ri(m$qHl=_dA%C4sBjoPDx8HVV7jCcg?vN{w|W!d
zh0?g7UsmB3C?dr6u;5+Bk{|e`M#;~(fe*_4rg*P~M^48UoU66!e~xDKFgge1vVti=
zJ1`F?Tb1Wzm__+kcL2FVXL$S?@_s;cN$2%gXXiW;5>8vAf01r63}#&=3O3MSf6pSl
zZS{bO_)jBkQodQ8>6WNRs%-89CX~vV3339MU}tv><q&7LdPFQcF-L%;O?WHZheNM_
zu<svA@Z_MEOrN`(-~jsk+`r`p$v=w&P9QAW{pPjObGpw~^_jPIw$!!3j<rnY`*O4L
zuD)F+mmYx5uWaziL$;<7X$Rg^dWA%atwVsoR|ew2P7Z>xmm;TVNA~%X$=ug+hlz?2
zQsZ)hnjV8?$j`wEFA75pmIDm)U{P-d$2M;KQDv|HK@0S8bo_Jhxq$>ao`o`_?C*w(
zYcAI{o$ll=m>$8Cb-+m^BJC)t7PIGRouxD8Jhvo?v&hm%rphT}uoyvU9<H>U8`os(
z1Mi!E7WfF++Q&28`hF>1FKfpgi~t(w8g-#gq7498rpOq9$EIq*h7Gb&LWFI%dN`mg
ziS3g&`bxGyiFtI6+mBJ9bQlq=R%KxXOC&~r8_NWl9!zK8W*q5`ZE-bNF6C!!6cTWj
z-iKVrXWTPr0}W^Q;;fsDiNh9DES=t`fZ9yS*&WHG3*mBQZb1#zRAQ_}g)eW-bRnnU
z^p&bit#gbGURv7I<-#<>_V2P4@6)zaE9fC;?t;!Yk(YtxdG7q-r>W)*RQ6+n*Txd<
zgyG8Q0aIK^go=x*tJ(CVuw6HdtrcVPT`E#{$MEz%)loKhenR8+3m21JnVu(+{<vkd
zk;IYdt-~GdfmIE~jTe0<*HTrCSo&5rvEAp=824^7)98KhBa3kr3%Agi@ug+PDYW*q
zoKgn2l(M02qm_|G`ovn)fXO+=S~IS98LREVDu!1+5Zv@WYQ<`A?8OZFKcBm2xyand
za&(>9p1K0bomHAbL-Y~6)lKWp+ZZ4{e~42==X7Ucgi?Q?8gzXs_I!W{jIl+Mz7$LD
zc5XT@+NvcStp0O;T0G9<0U=bjeO7zbc)-JPH@J%kH7?6v&%Mm;x%dMjdWSwCsIKPp
zT4HQhW-f+Wt(8&thSQ8tQwKn*W62L<ckwHUn3cMTPir5BJrI1#zw@aTl@f4G8Y-x<
z)c_(VL~Lul<N96lg4`7eH;;aq_%waB)!8t)%CK~PNn8%NPetA9pbuivsjS7xp}QQy
zuDzJc*T|z_t<`tec4s<^3bz%cRPRMySe~3$yG<YD=jtVLh{0q;gbh?}q&_*jF$SF(
z@{{+Huo$7%2kj#&-0nU4SWIQNxI}+b&(#%)+h5NEM_Y6Q-;ogm<OTQM%2H>Aa+g5U
zN^K$y8F_FSnspDYh%AyYujJQ!Rp1sQ-4mm~k>i9Okn_LO7QTMco*Vk2cZVdf5Dj15
zuu184Eg`9PxcVkbI27K$;cF~v52f|OSLz5t$)MI9d#WaFrof#N(pJBYc|g;@MA#!Y
zo^M&^tLyd&8H^y$tt}*+OLB~&HCNv{g!jA9wBYHjbGm}`^$QUNBl0*0SAC%rQ${OO
zhIYo{;Q`Q0mrEq5y7l8{@iC}O*Y0a&>u>VP7*Rh_ibX4nmx+SB3Qz`1wV1~o%y;)J
zSm}>0S(zMF$=W};UGGN->_%4i49*=>XQ1LD0=rrFzFJm1lyGD#_T0#H3)3WMpJg}7
zZ$E$Jk&ydICf*i0@tdCoQCf?HwfL)>V0J4W<{e4md;TTnY>R;FO9nvWX)FX(`r~oT
zA+W-te1^#-kvxz9_*PQ>-=IezlP_Tc`{si`mThOZ=a<uCe@=NP<$qJo8=RES=bS+P
z@u_5R8LUb3*D(HjIX(;gXNJ0&nnyHgauFBhnp^t~3qia4v_6%Q#6Y~yc^KJgX}({9
z<Z@<V$F)xz^#?j!nx5S^Pd-HU9S*b1I9DVG1okd4GLK^KZS~=3=3F6mlA4fIGQ0Rn
z<0_*;M$;!*w{=G8`nNnPk>b)_S*D#mkxWEnZn2BAs~@hbndx`!QmCkU*$_Uwv3jeY
zL)1kP7E&*-hWF2P)iO<s1OFu<hs3wp#!W=_lUpMxEub^;S)z6zx195-Ci!3qHax0T
z>>qcOPM3DA(ymcLTfA2fk)K;Eg+xYYqBzU2DkiG|6|{%OX5K5RPP}<XoMK-{qx&t6
zs8vRn-ij$RrREjV5Kp#|Zj3z;gZ{*4mEGsu4}~{Y6kqW;M`w&kTM(rst&p{cet9S%
zDQ1SS-LVabYnKm33b`G^%;{A>f2&>&x8d)>vX^SADHzz}GF3|^!<Fskk~XEG)Pe)$
z0T?E2BJN1YH(11qY99gN+XkP>%E~hJp;fQefT`H&ldSHh*Akb~{qs5cWfO8tFuT1<
z37eJnjcEQ26;c^@gZ~|0HinUtbw8V&nx-)=r^G4NGF7EtHIBsFM)HxJaoKMq)?pbf
zb*%uk1+2z(QgbX{@pEHlHVtPMM-25CQVFU(9%!}%hd-ZOaTnn%vbb7lgpivN;5h@b
zW5lu;H(c-<Vz$z{EK&rmKcf<GGdo_38cS0ZO(cy21Hh&&C&jAV3pZ7&{%Ty2GD;>i
z_6S9)+`M4T>YfYhVzuP-@aHG`K!0xKbBx?pe}J?7@_xK^!2p*K9|SqPu<>K_Y9%fM
zrr?`}Vw9o3hL>d9?u}O;r5`yqmmP8!0Nc!=@SB*;jW_ups~mGWD-x#tfS=y!5qDzm
z@a_|D!n0eQuo?-a_|8HK1QBqse30#-`!?;~^SHF5NQ1_+csVZiQHyDO*ZGwG5J4li
zTS4rBhK{=h*Ju+7bFd776e6DDMGV&|K%kNd;d%OskiHgMDtifEF3jLlZnPkr{mG^t
zEm<k~+1Rg6!ovrUHF0f7T6Bh$%*h+D0vlOP<LJ@>TfYg?Jyr1NampesQ6SyX4b<9P
z#w0=`!&?2q^^6!ZC~#+jBhABtYgVzzJ6d)G57>QE<Qg0Hiv7yZ##BhXAAB=pV_Fwm
z_MG@XNbUJmUqto5aGYXAD0!RY?vkM(whuPE2QtqzFe=c^+bgj_s<gk-oX23vthK*s
z9lz`x+wiq5P7WBH`ZZOVB{KFMXq~=Jf)yzbrbfo?0!u(w1MfkJIpJokKI54SHj>F*
zFX1uot()_5K`^YKk3E|6DS2#r%d7zqrCUBUlJir>ocd;;n>po(jtcgAT?KI=D1ACE
zs2#1V6dIedtBlcvE02ZD6x&luu_|MeaFpOObgpX*z{${GPZ`R}xhn3?8m|oiPuv*L
zAQxwf#qc?Z`=yifrI%~<WO4-g?~JXcn6tX2Ij_n8u4q95`{LvQi&KwgO?GF|M5g~k
zVUPwDRMvT={CQp5g4&MPP-VBop`uJ2L&)6wY%n4Sr!s|hwoJu+xycd!Pe=`bab^4Z
zF6yfB1&Slru?Da|I+Gvj@ga~7u#6>%)}+~6v3mzGympJTXw=n;?4vAZ8FwN7#Z$|V
zQ6+sJg7?-EoIQ>%C+jOj;|Fawtk%KL2<~`DlyGyIA59=OJ$t^7YG&S>TY!d>NTT^-
zs-*KC!v*HOY5?$Hn#uTrt@^3Cp@IP67(lib?pwK)L9_K26r0!Pe;HX@tZ-E^_LB)W
zRLL1`EKghGY#=RIFR#E83n4kRMx3ik>`*ekZ8)v0=pqISd_stqn}$q=#%Yx(+^ibW
zA$xqy{pZIg8#D8$8f?iSu&B>k_=DtNhkvwcy~QU|wft{KZM~!@_;5s+by4qN<XM+W
z#HQCFmC-xNuJAa4s*<VRe5Xxp+$G?k_Ikqg7{((;X)VSWXGHK+i$$PhT9SP|E8Iue
zpVt;TK=tD0`E)GCYoa?NHS97jNEwU1m7;yX-Dt!KL4ub@$t#~)ZwP1?<@-y!X&Jew
zF;+Wbxe%nO-K?6F2Siw1tf=hSo}Z$x_9MX;b2I|ZG;3=eE&WZ+QO1{{sSBCfVBOvk
zdKxd)T0iIlM@|2zJ{M~novd4q(hGVsAi?d^m1|TvYpad=eo73Clvi`RYy_89&!L*t
zI^Sx+*ZwqK;u9B4=+4K9ce1B_o|L_a4AxcG@X`LZg_>PziqPctPd<8JDM0|O%Uj5s
z2OltQU>G<1F({w3qq~B?3n`kYRQY&wy`nK*&xz1{-PVHs2M}Y;311oZ1&>qM>OPv6
zIdGq-n!DpXci9+MXUf^7()~>yecT5-j5$HioP!^3hZUfB&IFGQO*+|$L+ssL|11jN
z`2^`|`!ev*1i8oi0qpLEqd<SbEu{4FDF41Y3c;C>H$Hs|?M2(P`8Yps+lKFC3dg9d
zXY8is!rTGv*rnRj#IP6}6$V4;Vf)EeoHVMMKtwcUS|<a(uIE01g&ZYyek(5;UfIW8
zEFy-(B7u*_n5UGJjWsW9F{P7fkkLoZUCTm>pHa3p+Tdp`&9kWBsyc29l7sQGjcEOj
zqelh3>A=DAw2mmdwqiY*TS<<ZRrHYlJW|l-Z7{R`uc{h4PJfe&(%-|V!C@yrdYZ}@
za=Bu>c~lo0*y3VWG}JDy3<yLDzHWgkL>`4EOQIkizF-c>=ci}diYnA2AmfK;vf@=k
z&X!x>5CEKu4BItk8`os5VsmMNIfrKxFfwf(NA<$H*Ibw-HIERhv)&lZ7Z+Qy1Z(#J
zcjwS-9lFM}_R-BRg&8+`;QdI#{lfahfpd*;Jecq^s*>1XbF)n5FjY8f{ehyPtno5S
zV~{5ErQjQ;7Nv&jcZPNkW$PA~9Ruz$R(Drxfb~g`W>22mfY$GFu}TsuB9C&b)x%-V
zu>~fE1gkR%y7|64B(@PN%E+N~X8HI7crc0U5C!<+^9BI9Y(Qv@dJ4-jOLE8VlpKPG
zWLb;8hzgNMGASM-1pg3TDyel8q~@^lO6jEFE;BBzfjgch=0@T<XsT)uLWY`@At*Fb
z1z{uRcJ5s&J?%P9DdlyEB3pd5S&kz@h07Q+!z!-9K}I8g*=ki4Cm|17v0IOn^Qis(
zRs|u3gpvRuiNhNkc%vX{Zx8S}+Uj!a@rqk&e8NF6#!$EMGIP!eQs1lxmur@X#6{YZ
z1&>{xg1uoP$j#$UD@=E-XB#7F+Kbmtue}^5nIsifivjY1$lC9R68hUmcf2BZmbI>D
zIr@`|jT<)DuRj<+Hnhuft6e7-`kh;swUE_BM?MGa@oh;rLne6wX2Mu?EPNVK^t~1)
zy!b;A`l>1z7aiDxUC}IA&yKs!VIi1WSG*QC?aqtKA*9Md;-@qvvUuEt4~MigAMBf`
zr_->jO60c@$PE-_zOKu(I9HuixS%#V3>OZbn}+pqb&gw!SSz+lC-d^hG}-8RdtjSY
zk`1pZYG)Fqlp6(zVdc+@s8@C}E|sVC?YBjcPRleUR`N5I1>vH=>28ZD+b9WbwngPJ
zlG~SDhz+QXR9)YBM*y#@L2cr;QP~QoP+M)1y2^G2$+8!0Bel5=Ym#=0)8cm-0u$A+
zTJix`@>$w7;@K{1pLFy^QQ<mBfex44*H6D6zR=p?EL9fXOitW;Jd(NhGz3Yi@7u^&
zeHr)&8MaaO{WR>>*ck!}&IFlY1kM1tcoM5NmU~X^{|L!M#%|dZSF%*0zE76lr|iAG
zs^dSj!b?krf|Dwc64Sapt?**Hs_IZsRCrjcfAzg>8r)Xa+9!@@Z_!6gGul+}4abPx
z*A=X42!~R9NtsV)%;;a?Wufp=vW}77lpdcJcij^_SIjSlWZn?H<B<C-=AOomdF+no
z+r?oLQK0DBs*Zy8DL5qSLKB!5wDNIi{oU@NLS;nJRr92et5>aaq-Nl8Zu{%)7tlGi
zWy-cQdxr4wjgk9qO;sDi3(_}wt}a*^V_Q($)4vYV!jjeNu#PW)3rkzi(U02KOCw)+
zZ@^rDWcm?@C>ne^klImT!quokLq(m_lBinrF34ZBnx>6ELZvw?D9H}}(ZnDxvN(mF
zf<VQES|Jsp9I-<jP~aA^yAdf0_Z5#sb}opNxsN-RdUOa4+eksnVEg%y0iE1<Bt$}V
z9P#ds`+IKZl#l%nI`FZQc1d@41JxT>G48AR<@_Iqb9%2PqF~Cqo-m_)u1lPp3*mQ6
z*+=)yD3V*`Ptsj?slt8TV-*M#8D&Cc5>{QclE#y2@=;M2C9Q!FretO7>Uu&*rL0^u
zgZBF&Ex6*`ox{^<+nonw_h*d4?~h~p`?lpnS#QQQYX0EkwSScvOs1$j(DGJa``_U8
z?d|TXj3!fe7tG-K{DYTEdMSUGnSHP3%GgBizo@#2ufSicp7~w%KtMtEFrMf3cFx)C
zLs1H(<|5O8@kBdYUSt|m2o?kDtyRbed9zWYgXNarG}L3NI*EXM=WC5dRhvmXqBCU;
zI$Qc@ygs)*k(Q<Wr{_Ccu0g20#$L^=UwCR8cUoh#sGMX_!Eia^IYr2mZtDy<j-<?z
z+)kXXo4EB3in)tlgJkM4d(w_rokTt;A?qvkx<qr9w){|#A5|LEANy3tNNKTp?6P)`
zxLVy3m5rN}p~*8Ox1t(1wvBwIHgo$kYS}IyzVNQHY`IW0{s3}eb7rhMH@Vo)vGb`a
zY<MHp%&3|!1|7V$Q7g4o8{>j#=?g@SO{%MYghk(7)fZF%{-$ppT~<G}SO~a**eh(%
zt(2Vwdn{j`HF%z$^C*TfVBd21=+cTD?>)HAz`u4LLk@;(1`1v8J)(@A<9xTLKi~wC
z@*r+%p?vMvroD#n8Lvk=<n`!#Na=&T9=?3ery^33n%xNa%G{aO7SnFu)w`@cF4ZV_
zqGLJoweW?^pG)`pUZ#k!74?~JG;>iVG)R87GIF0v@;(2~sj8##K($+WEFW19x{FM%
z;o1SqjPjSW{@^L0*45>_z#du{v0C+|T1=T4xDE{2wy}#_8#%vBj|Tkhq;%~IBrs@Q
zk+T!__r~G&jMkPgqec<Vh>SKg5Xa_`8F2b@7x;#vQFf3`a5Q>ibbdy}#GIFnz4L1y
z#HrIDm(JZ^F5h%p3SU-~w={F@ADlWmus{hX&>>OL*l<xNfwZkPN^T`k&hf>`)n|q=
zJvP4_0GiLdP5zfneOHY*D}=kkvlsDYM9!jepR&qs?LH0pizuKF2(?zM8sNG@mq@{5
z`Dw`6BM8QZAp<r-I+(M60ez00d_OtU<^190(?0QPiTg41#Mr~55bE$|<^RW;*5E_i
z{?jwY7RoMt><?c`?G63a99I=&OwIaYAlH@9kX4wF^A~TGD3vWggY)fAiyte#LTwip
z9dL}ar*<=W*b=~}r~=yO!=-r}m=#aO#G<>wRBN!<<#FVjhv#eBWDFtvxne?UAg*&|
z`R3NJ0I3$t|39lsp|xJu6m{Qg_s*U^lQdR?=x(^_PgY_!Zwv{#u6WVc3?UJ^SnhOr
zXhn*1M9dwX6TDz6ylG;abY=KE#c8p{cpD!5dH)r1U!CKA4CF!axXCN7cm>HP(3)$U
zYk6!{3`dt~sg9qP?=J+LT{T(ZO!BlX9ta*8_O*t+b#@4D5<R<K;aW`FJ9_<P53O;L
zT;27{Y2l39&8VsIAC0fLEO_VF&w-}cKB6s@^l8fy+;H^yfPC#!7fOYX3bIjSh#S0Z
z?N*7FoHG7PJE)Iuf>iW+JxDdJJNh|+tAx}1kG)ne2GqUQYx?gpfm?ZVMw|b3*2VKb
zl$*xj8y>Sj_gQd%_(QQ$>1Lz4#7flt<|NBbe~MQNvX$qS)&e?_r;Dn;h<Yygrkc2M
zSi(rWbz3Xx=BN2FHH8!Mhq}J4)&1@3;FQf~TIsTmi88UHK{LO0<^FgQB<e>o2zYS&
zHKX`vtwB>>oks?<Dk1#_qKSJ*Z-zFemhIcf_zHPo2Y;&ND@a|VV{VWM2QpM<3*5r~
z5Vdc4f|$~0%7^P<{N=6mM`cFw8~XkRdB1k7EEpPyenuI$%&ow4mmmOg2YDv4%W4_D
zaW-LYXsUe$7o*pWuu=BeuxU;`k*^uoKONO<j-Y{G&A6#-{VKUn?ehXxiNxypfI#4s
zRL4rlmOI(_+{_}WY(y*T2kco|f9tksQ|kVvJp2B4N(%U}kov2VQi_~C!`hEE1NRYg
z5b<RSAWM8tLYR&0b)3{!k7SZ{cjmA<ql&5}2C)?f6SP|+L@>UKhOcyHYO&|}j7bm3
z7ou%hPaFk4iotrIM7UfP*ht2{0jrdEUP_)drjm<iQyz+mq#u>w300irpg?}z=L#Ef
zWxfPhL>gxgY9{X3KSxd`-k$TIU5ZMV7W#m8_ncaMt?(ySljn?Y(as^uJZDq{xl&)L
z1DVK%vRY(W3TGVjzg%prwz7{iC6u9dBZ@Ao^j6tYt-^3kc_uKzVpWhePV<RWeT5Xr
zdPUC=9M;K~V;T0m0}MZ~<+KWkn!ZOwA-SYp#4r86-ba@b-nm%FhYbHCN0B482^@F;
zJBAsF+dr0}Xqf?Z%))jL00TsyTIBH*P7zh!1NzHqASO6RWMM)`Bd$iCijOTQ>=wb;
zw#7D@u_!T~Q<~F2Y1MrzN5`@`bcwN2o3CT`u7mVJp*9m)j>J+mQK>)C!4WIjfZ=C3
z;O*@k2jJY3Ssb}|e3vz5HetrQCD_OHQ8|&FDd$mUL*M{ciK40m2AI(JyjCX4!dvz6
ziMzKDpN<1R`dCrvB6V@uxnk39w0M|2@vv+Ue=M=Vvt_aM3sGQU0z440miV>tzw`-J
zu6|BI$qk=R$i2I8?U|O{x_$GwGf^9lp*W;OdmvHGE!KbN7`0MF@srI(2_%XghhZzA
zTS2GHs|TYW(l;#_Wzf`km|z;(3G)xx%BcMtzM)9!AvCV0@H@V5J=byCX~ZSAnL~&F
z^3(!lg$$QFGOUTElPGz2A3lv0jFu@76$*${9R@&%!6h6<FcSQ5RfNLPTiq{7Lh~0b
zx;{8V8=CqCY+28`ICp?D#_t^KJ#!$^J|uHtZiq}$l>%YymWfjG?&O^oDf~O`n<8Sb
zZzbh&*Oe?D3a(4tRG_GnxYlO}H-U2p&g~Ea*PC1+ME6rumV`r%ddQ>g-L&O~BDdHc
zH^IcIi&ER%*LGu#ldCMub!BovBO*WINXT`SfAx%OBiw7vlfte*fUXU#$tSLkk%U4h
zjjEgZnc+Fb!;*abzqx&?uWakdjQBSX(L?0b^;D}55BXSHo&pm};gpwx7OLdy7BOX!
z^sP|&Xe7hl#ac*UiYPUk3fu-vk-4Af{t}wJqX%%jlvYxc1-WyK;*qkj<lq})o5e`T
z#X|fkT2VcA6}S7OIGJ664fl&o3%Qv*mQ=B%RXpP{+P;a>7NO5^a3ws8mK3JzK2u$8
zy^y-8ocQ_L1BDesPyeaqzdqIJFtmr2LWBywni<8AL+Xk6`T69i00>7{mtQUEu0bbH
zNP{HsmN^>*yarBwGTF`BpE<0^^Y#pke6du)DpCet-|7>wlk9_OT!#_%ue%c^^S+h?
z0mPu0fY53OTzx=dLo5oy?JX?#>?qt=8#Zt|`-XWH+(iKsDUST8(>GJ=*1IIf#4azG
zz!`Gkf-@->c2oBEP>Sc+^<FMs`_Lmkq&sV{3VyHP4;~iEk2d>T)AN6RIDWoG>WMD1
zO$v~<3B^p{`yY;D6B>EQLhGx^H^>A_n?!<6?yvk`!MrdSOa}nUkxsEC36T{xJ`eul
z*Fd?Y4`*8X`*GJRw`-Bz;YGQ<e~chH9A^00+3w|D2yWKx2}KemK~SxZ!O5<#Es35$
z4OusJM1(l|bk^@8y<y+m4B3$GQJOa}{O~AZTXi!NiMIVbVSFm9xp!bZWJ+$#%~N5$
z3W3$d_A@+rB4?k~`U;BT`g3Tp{i@bJy{J#c4S3r!1k$q7Px_36B0Zo~G=eXTCw}qB
z7_^6aa9@7SM(>?c7X)yTqu)W{yJ^ps&jg`Cfqucz%iPdEC&7i95EK*w9NEcXBudc8
zY0LRY^X7nx5A0Swv?taveet@?wxwx}!;xv<Ok$nMyul?IqmL_y{Y*(jHV^*6i$bOL
zgNe#n@52*U1N3Qif!m)V5Z}gg4U;QymatIROnc^7jICw%{V+@Vhj#a`=9;~ybl1%a
z&pnQY^P21)`xt%y(zgoLv0u2J|Ka<aV@H3a(R<o`V0Ygu*L*wXY@X^d?^+z+cLQ9x
zSmA`ecBSghFg|K)_|jU%e;CF)(%8fY<AiX0V=Ot{pJZPxwYT^+_~w2ggb&3D>xOB=
znQ+No{1p+3wYIw<SO6Kq;bpYC5lC_EfMieMkv%X)#WpAoMeh}$OQN?y^`bqZ1M;`>
zB1zYYt9Rk1U+_kIsm)Fh_zBaPI<{_^GgezXes*K6FaySnBM+yz`-^i$^^Mg3VI|UU
zpJgrNAe2G{8hccC$X1@0nTS>EWdFn4O@e>e`jKS=ylQI<$>tnwjodO6GE6~|@q(Jz
zIuS)^WG|cff`lU!OdyC2x@JH3t?3`Rvtb6c1p3k}|7QH($>?%n+4AXoGH>+g?=!Bx
z3>mY(zvr6yF>iFQ`iN~sD4!~KQkk+?uQD0N(t6%M$y>`_$AzYqZ}x!*pa#P2%myE^
z{(-DJ^fIJorD3V6Eficqej{7naX-~LiUC>UAQ9@{KRw`Qaj}dxVFsvz&|TWB&otOi
zwMoyo@?$pQ2s0i$_moklL=XR!`}s?*o!v_xNE9E44Ql#c)L(D`CBSxp!h-#c6_SR|
z`xH#lz+4vCT~k>T!&MC^qAw}VBJFtf!(jAz9Ny;woovHSSW+iPvhBsw?~;m;jlcbY
z^MHz0u4iswRF+4d|GTi*KYrSv$$JV^4e0KjS`7FnT4~Bm&YE_K1`a8YK+!(i&WfoW
zAA%5sHFk>``v!TEr<UnnZ(VnDYAr!i@9V01ez9ADg8a{tlV<K8OI7N#oL#{jc*pzT
z@;^jJYSf6Lmy68mZ@MW(0fwyW$gEz7yY4%m25U;oVP<8yaAj|bMoFK`2UbkVM|}OE
zO3)iol`wv>YR1!z{l$v;osnw31Ord#54)<>{{FUmh!$~iP{u1L^!ERDnjDcL589Yj
zS(IVQxV1+I@t@~L-G1|2;pOIh?8NNv1Q&MelK`TIb<#(bSTlB2;|XaL15_({3MIMq
znt<32L2Lrc!S$<Q^>-`COGI0}LMmsyINPY#xEMp9hAB)2U}qqb{2hNu9V+irO}Ib!
z?6*G?&3db9_-S?o-=TMdo|ZztU($?;$oRPFskOSy?RLUATD0#U9vR%~;d!a0<_I73
z4;?QU)qVx8QeYt2=8Q7*)U_eYq3{M|0iAmq$+!Zuvm58z6NOc=fupTYIHM<@yq8$W
zf=L#A(Cicec`94$``7udetwzK7zKPu$gcOxbbc?(l!$`&(!U>LTt-G=GU}yNlRF3a
z7|fLg++WZa$CIUjoQ?xgY2ntED;}mY9*0L**Vo_wy#3d--}(hzm?}U+|GA`t6y$~z
ztt9&`dY7RqZ-dSMv?o*{`}P&1c6<kGrQfp^C3!9`MN-4Ta8QvOxszB^E9iQWsxC!B
z_!s=qu_IZjA%q2XcIJseKLa*&qkw`VeM);>u}zX0?z`Hf`qqK%Kdrp_pCFo*e}#;P
zDS_RjA{TQ;Az8_+8KVrv!yC9t$Vg{xZbNA!#nWWzsL{8Xvir>}Fc%mdfy>nakoN8(
zqVD5|25Z-eA%H$z+utKecJI(sxeTQgZKy`o(Z%ifT1f?GcU)uzO1lo7@lz-~KeI9T
zCXTI}&UEUS3amyomr>6tLu+V08)8(Am5iRfCGt@C6Va-KaPol|$O{<7fRoDG>I2Ej
zQ2OvXDglDPFBD0hMHUUKOpp$KuK0@git@+uB+mFQVnmtOzcOZ1y^X8*5_U3UyLWJU
z=MVTVC{!cMcPt{gZCj_~xz0Bk8!`Hu?DhN=kNr*vOLL)uqz&jBj;?;#ul>&pAg9u0
zUG>Je&*ck(u~U9!3}R30g~W4ju58{Iwuv%qyd*|@jU7q2R?0N`q<yOWLRqY!*102`
zI?kjs{rMWNTE>C?!SNBP^dMkohh-|>qGopK63M>Dx$S}XDVhoH;#ES0diNdMZXk<g
z%`&z0jB$Hp<q+cs$MI%0{#Oy@Sg4E5qOqrR{+jUqckT>krVHj00*1AxK^U3~H%b0~
z;28ho&!=d#+D3~U0I9DMB1?vhvfLLBt-ogWvN-1aq1t0BAI^b5HS+s^hSvC=wD11_
z@?oh|Zr0Zij~+YqKF0cCnr@0`O7euE$Ie52h8Eqs<Cx%G2Dw~7QAiFVQspPEmj#$J
zwD$8Tf=ORD)aa}876?8sGezzkq-=v|?bn=tYwJUz1BuqG(=#=8%1_%qQ!8Q0@_#^3
z8#vCIbJ2bt1h(lyyn`f-w~ca7B&MkC-hb%fy`TjJbJu0MV+2TN?G^#n&n!Q}RMB7r
z@NtdxXJ-KvlKAR0yVq#*pEBlFOg)OO%@NNjGBAsHEAxJ4$t!fDnGVt;A$D0*0?E#z
zcppPwmNm(fst+2ox&~+E{U!fbVe{QMYPJIv4={>?*OYwIF(}>|0ey8voZH3Gc|m)G
z%Amu(8T-4w2UD|QVl7X4ox74a_6bBZ&<1yCgxD*80&7QlPVIPr`p2J3h1fdfV{)Y3
zu{ekiw@l6bFNCAnGH;djJ_X6MBQ73b5V(r}ABsmaU&K0AXRp<gF0@_K$Ch1$<RTgp
zS7mu@(a4L(OGR!?CU1YPWHt1$qt6Bfr^osVwoQL<6&xO%YLVt`Sx<OH!`m)LfZud`
z=K^E3tl_F<|3Ee)Z=#dz2Y{_;8mn8uG;l%z%Ps2%z1#6f<0WSmd>rOlodZP!#n^WH
z-W&Hpo)=6S_Fn%Iu}mv=4A+b_x3R$TU&WhWrJYqnGqSneqi{7hT(U|O4$RpA1c#D?
zt;9tJ?rFr1VL`j4`c__o%dbMhLyG<Lv90lL5w+~SIn%kb$6)LgdsL9u{2g}sXO$<P
z@T6bcA}t3~AUpD2@rxc@dLjL0w|3IDpn~Gz;;ep9miI1cvQqrpALHd)C1I@>B&(d4
zr4<@_yi}M7hQ?zvr$T*}4l`!FF=3~E!YrA<K)Q(2JIhv{t!cUEw_X>J!pj%gj*&9X
zPrH#$mJjZJ^}_atFO9slC{0wXGG=VBfs<7}MZ?<w|M8cyV(`U&8w6zE#Ub^&koH31
zn|Z)Czj}S~m8`f&6sm0GTumBAxC;8l5Q=VI1lnEsL=XINqnjDH`%V@!%6$CD|HIy!
zfHiflYyY_IuI^ULrjDp2yV6!GTB;E#V_F4bohTKIfFYGxqEZC}5|U-Lbzn-Vq5?uH
zQ9-82EWr?mDk_8+F^M1{C_(~(1jt0DmG2EW)pnoLbM`*x|6Tv<%f$sD5Rxob)_R}k
zx$ocou+dlPtA%$Nrdb^v2Fri)54Gr_RLU0@B^$u7noS<R@;|fEXjqj$k7{jpgeDsE
zuRc{seVyCqhOmy>yWF5<I)QU<%RPNyyvf6u+-C%@IhOJ$%}4!or{gwFgrom~z0E$e
zTZl<1TQqNTk)-DeV86Xyb<Su)E&PpYBs^}=wTa>Pe3pE9$AwP3GgQ;mAI`$4ZR6p0
zjJl@8gSJ)8TMmdLR+c-Lz__-#WKNhk%;V(lJ;Qs#U)*K~#k~9=$3k+S{#(-tMyA6X
z=K_YRS@J1cn0Y7ifqrQ}fsVj_+_}-KpSv_0oejC-=e8pVGSq74$E1F$0JAb5N9wYB
zd;&4m>YAr9={-1b_V4wz|74Qtb7!ouX#q8!MsJ39^n$e!!4TyVXg$oZIOm{>Q9tr2
zCllS71aFoX&C(r2i;-?buFmjpUL0g>5)y|8WUGO7&!4*A31iErZ^shCnF4|@zNm6J
zmrguc>T<6baf=y5Z&$3X6E5Fdj0F^<yP8wCW~wjVW1%{_tFD~u_HRi1_;K)D=ZAUA
zv~A&}mZwLETl>0mcE<*GeH~lU<#u9tMcTr_&Do@=Di#=RvM%kPcUM~p)X0-7fO}r3
zC?%nL>EPyv_U)K3i)YcMFESxl5*CC9=0OpU#d-|RZf%jz`zJ#jMC@BoR`Nl#<OyW|
zdEsjd0##zsW2lJjCW75eq5)7BTHY)Z7rMnXhxE*UIbWQ-`R|rF=s7eH*%tj|nTsyl
zY>0ogJOBA>{T6Zy*KEYxY^egvI=1f0QNs(+Tj(2JI_D!3C+6?1AHV)&_P&FxnQFDD
z1$1=ux4_zACKU)6+z|_oh==;9YF>zEMduRBYkvNEz^Lfmi92v#O;^8iO4LXOk+VH%
zy|LReAKhG{1HxRky86s*bk?0|FZ(bD)2pG1B#mD2p5+gm<yxD+?B=5%x=jU55u!k^
z{1p5J1oa$w;?QVS7NHS;fHOI$fPq9I9mJnQepOGwV9oEC)-%;^Kx8k)JSZ3Q`0Tal
zpZA(FE8sc$tazYJP&4jR&j+*VrO=OnV^Wy{#I1m$M(Z1*HFGK$6sc}WwdU{v_o-H&
zA3<tDC1%+ji8A@#L~8~4`BSbdB6j@y!GGFV0gI;Y*gdAi^;qaUoOIoKZK)a~9i%>d
zd0>BeMW|QKfH&Z0oBb_~mWApm5T&yJu%;HQ3aqv_*8@A5FOvp`W`B=%(R^$aJtFu{
z9Js9rJnc{1o@w24fH6+5)LIWv3oWk(9n?&F^8?+9w0blTQEg?_JT^HX6rA{z1Hz*A
zQ(~g_kVsuDjbS1B;`K9{q6CKT(NN|T&0;2AO=$-$6^@KpQ7Qerlp5~~Fd+rNNkv+X
zo#@Y;D!02;*b63f9$6Qii1M%lL%basz`Df<syi?{Ewfq=g#Eb!X#<$UVd9+T+7X&!
zIy(K9yS4$#?yOxwbcttVGlIk49$%&_i6CJ9<b#01$;wKMuA$!71}sSHChZEjh|e#F
z%g&80QF3V*X4E#uqd~6J7?K7S=m*o$$hs)U#k^@h=<_mK6hy<!OVS@14@|M!bZ@x8
z&V-!vh&Ru{l@D$x;yyL_m_~~<)4p}!nVy9mDAQhn(u@0faTy6FH_-@FXx!x4+#8m4
zaeVv3;Ha-(^jThOrC8P)`%X^0U;e(8W&Q>i=fBltcgJY!?Xf_uaOp84^viS5_R7+W
z`t0O8j(;0>w6aQ?If0SLD)+C|g!b{2wl$C{bbC1%e@*HU4^^;N%RV6p6~sh+DHzFw
z1;+U@?m97ZHwc@}s3b~VQvB6v1bz9$O|S1L>_Zbzg!bzl1H+fXc6#dDTm}WO+UnoZ
z5u27UDbKiBGTPm(l&`Kqpp!=c{!?So$hhfo$kpk${9&)y5KUw_+3=04DH^P9nBSR&
zuQfy`RxqUf&$xGuhGx3p^IUt=z?H)gMjv<71kO!PVChRz?G!aC$4wvfO^&{7piBxK
zRn<iHj*Hjx7B$G-#;1Pw@$Z)}R)i4+a`@fbehN<xT4X31Mp{|bDTi-rYy|LS2mO?s
z0*8D#57s>Co%>tM6Z#$!SClH#E%n3AR>tc~j{*74i~h!Y-z^bzb4kxID}67>dd(|G
zjqYomHvT%<;uzm5d-=i86cy(6@r<XPE$=~IysX!k<q1E0;|o-X#*_snCjkd+QCJ4#
zDz2)c%*8?0P>2iI=3RM6O`#tv=}}rXx#QhzAo#VpRfRy%dJ|qV9sMsXIRrm*R&4+W
ztEStGa(@}{{~|B-`j)@(!BAV)A0$jTA%;9#S?fo2m^J*-VrA6Hd$fD#e8;q1)LOM|
zZr-qm5+kFZX{+#%XAXZwonrMZlHxwiygapE7YDRs0k01+j_<esgYJfXc(NZp1M_ON
zQERF`TXs|ftU1z3v~axGvn3bi<$0Jt*0vu{xkgh^?N|~c`He+^eS2*PN$>i<(cIt-
z(8CE4`!2M&ZP0o~xR8EQw>{l(I`L#hx7WY<n}Vf|r95|JyMEb4kBUvJ<JPeIGYY%C
zJXSpi1o-XUR+Q{{Q5~=eto}rg8;7l}dUmfdfgZp?*4^%*QJ;}{In&1D5U}$hd)LWD
z$R9Q^UQSXzyVu*WJjK;Ae|~wXm&j<)>bI;uy9LhfPO53Y<+L5t9%Ng+W99e*+J2&p
zdU-di%kKlM)2na60nOSX(fT$D%xG3m{F#FrN4{%z|AagZdi85>_W);q(g*dRQ|uYd
zymfiW$R&7)r6?BXqo1W~Q0pGXIzosOY6U1puGxBV4Z)8}Cm;7((P#<e%ZjlZ-xNZD
z8mu29sStF?v_tp7Rel9f3{(r*3l%*=x1lGqzCyGAc6iCy*pgoHxb^!Ui~@S^a;V}9
z;w;9m+T%o@O1I0xE{vg_pQv9>r=FwtOZ9Do)jLE;uC&Z%8^Oy1EbUDTa83~!OK#_?
zPtPR&C|J<hyB@+6r{oVXYL95{Xwct?Md(iZdwx~Pf*y}@BY9e+v7~|;b42S@ICu_K
z(Eu$b|4^z&l{$XeCh*vM3AGGrlwmoH+{)Xuh@++ie}iIsuWym#ms>8BMn+RJb4-r6
z)VBGIAUw&-#m5<QzWjqhc4Sj}F{3Dt{Q%Q16DW!YF#@Ewkk@^rV&x#X>sM_vP^MbJ
zeFPsqy%ssZaOn*DVYjJPYT5}7b)|J>4^J;%l1lyTf%uN#?o<2pGCYpW(=V-%*4_tG
zCzj?6njXUaT4WtnIH3^hFvU5=g6;ZOq(4}XZAN~(cVd%5bE=W6NHn>;LnJ{T>M-<1
zBe)UCK8^yvq3E{laX&;?EIqI~s;uEib^l|6sKU1>u~iTo!ANNI%<s<Pn~Cq3yw5AX
z$Ghc)?W+#g&-Kxs<~RkRZ`v7G`b1?M8*|#G7RF_i^VMC|w`9fm+NRsCtgsL3gM7J8
zf&sh!fuA3Gu?n~QoGh)3K@%%h@*9=Q54^<)lI$*#@of4MO|GI@0|BN^rA>+2wa{3B
zFCt~$r*FS~(~c@w%BKhm2)ond9bu3iq2F&cq}dTxt)Gr#r^@wSrq$cZ8Ir)(ryG9>
zFbV&zrs};b)7#h)-@+Tf6Ur#V^Z1Ft=1^*8iZ?BE;f4kuCxTyCiVfq#P8XSAn$nJu
z>NCd1P2@<pBQB$3)5f2i*9!5y8$YAj@Z-G*yEbX_cKPjYNnvuMGkm>S!<pio-83-s
z%tB6VIn+nvU+k4lI}<EBSx&AKh>m-BE)@qQdbd4l;St(Y;$B#KX4tT9s{Y1bA<$Q1
z^d*n<ZWh0VXxR4a5F9CUlRxuaUFs2~`0^p3G8LEyz2K((W`ewSMRcr)Q6PgGiQcj&
z+f~G&VRi@s7aPmex#4)pLP28jJZ3jPc}rWVVc0kv?;X{yc8$~u&ne49fLV~J4|=#z
z<a@NAk<V!KEEymI>032$g`8?*TaaQ>0TAHPyoKAqq_U$+oKJCz)FKBE9ztVa4XsTZ
z1D5ExWciRVC^H1jq!2zQHu>5sSEWt$e-vk@weI?>=_e(iW#|}ZrpWh0mib}wTd_W5
z%T(@lD#4bb052zAF1%ftv589bV&2YPx@552g`SIW$ht^YcWvF(a&Ur8P<EgOIzLdL
zdUZ=qC-%NhIX>ci2?zwF#{7A<olt31u#CBYpOC)=d7V@*U{~{4dpp=Gw>A!ajoy$@
zp5oq;w*MbKjHrYR6bC;|9i*&AV7;Tt`?)puXdWszI_L|1`lF@|j`yM@0iuMCG^a!t
z$$<DIm&@$iRaXO<IutI-C8lWx4%m3?6M#pMM<FqQvn{8i%FsMZEmT$?izH3+(Z)Z7
zYoqG6958z|kVa+*z9~%Z!B-J32A#+HCwL<I%6ZjiG{+th&C!abnA-Jh2Oedyud%X!
zVGcrlEIz}*Z_C4AfOdC80Pmt>gjajmg~7@hQX5_;n11fsoPgl74@DOoTi@PL9p@%E
z1He5yxO8{E&+!;cC@&@Z)Ii|!!O>-fwF#!BQSX9vCuD@bDRjnyB{@~xthvBiCJH4k
z8nA6*Yqo*4YuYthO8(xa3xVj|FL}0taUn26VVn%>&AtG291ov?FQt^Ac}>e4hq|C$
zrU%gobw?;pv@{Tam$ooQx-UU?`Rx3rc^FOiEcJmj^nv`v%lDEC0YjlQWW<p!{P+fb
z8f)(DXmhckeE_r474njB)AveXLQ6Vhtv0f?HAIIxtRG}&7Ro#dv4{hDyGjplA@pq2
z=9YVa*@g*kT=^IguS{h2Epif1N6BK#AFq8Ts@g{>J>IlRP*FLpE;7NKzQ5mSQ-?HX
z_kB8*geC7W2NuG9yJJgOfho`6yTqXk+NE5{)=L#RF(rxHH~(-eVWtc{A*I9aIXMIm
z^rx-nE3Vn+xQw+o`xpl%y;wuZrg)7<k`ZPQhBu-&wbn%F)cB{JP>zi1funBWUan;l
z86*x@7I(EmT&v}c=fr!49e`4)*zN-sRD-?0VJi^pJyg>>Oba?4QUgrXi+SSxnllQ}
zALWYiz?w9Cw~a1AMVlpxGetpMLQoXwP1o%GAxjO~iUiZD?_SFGh$TAtXJ($i0m4F6
zWbc)I9nW$qsBvk)Id&{G_!2QfX`5e=RbGF}4_F{%F!f?1l+H4BRL|SZX8SPK3D}L0
zt0^E{nHaBZ8$7~Ebn;<{{ouB5QQmkG@JS971ez++hdycCYhMsgytUqZi&L+Gk>`Se
z`1r77;ZB*J4#(b#97NE9`|ES14uwJBNED<@*I|UMDfNV0ONX`!CcR&dyp?%PGf!lu
z%h)m7a7*$GCz5X^6oX@l%HFmCYCEf#)9OhJs2x<if0p};Nf?4=>=K3eBd;azX_>~+
zeECa}8-8N|Lnb?#<%zJv=hL;$L{q&+F<&H}L24tt%{aq0p~h%8?32DZ3SCEzhY!K^
zr<X!A6cVmL;#y8x<LRYuCwmV)scp-#;YbElEM7x`X^S|o+?3E(>#ydU=n27+qr#tX
zNLFU>aXnVcUG)q5=V&+r0|^Rck;;7Fjy=s`7*dwFLat=nk*ICxymI9(Ts-8_bs8;B
z1HCg{#jhR8J%P}#=H}Z5f^AC5g5ZAS&PX`os6Mj-Dnfn*lzTgPY8k)+QB~rpxaO_H
zP;8x?kqbElM}3a~tD4egOgEa=BX$E?LWQKv55YDYRSupH56iBrkAj&p^tAk2-y8NM
z<lSUv0f5o$eZ*2Ar@ABHK9SL7Y_o0%{ZKQ)1Px2P<qS;Yh$Ke|C=!$aq{#`962)MY
zx)IgL?$9UxLL}qfR{2I!wa#;J=29^`itF4+k(ha{ZRi^!q&TV#(wIiySq4$N%?K^z
zgx)cW#kfL|eXWoWigA*H>jjLq&PMYr{s`p}^og8Jx&mMJLe^0)Yi2%16;C>upngtI
zZURc6xvx9jGXZ#jUO*`hDN~#8J@+wDz(cx;hx8bfn>gRd3q+1>AB^Osq}g_wr<drW
zj_ZdT07~UOwR5ia-j1E-YW3xOxt`OFWc-pV4u!X?Qxiudo524BTG3ApV52}A&V1@(
zH~5Kxaku_a$WW!(Hr~W?VM3t#1$uI@Axr~bLn^rL40@YseW5zOz!qYfN}J{mM^*a8
zlZTxff%jN#`D5sxqgfuNGioe@wqIqmaoxIlYFV$8aIq{fcC&ms00Wb_Ngqw<6c0^U
zx1fG~d7$vJd0Dcxk74|(luME6vZQ+6w0o#{_<$_&6~ICS3+0T#i0I4$Z2Ggos{xzq
z*%cJqvv;f4K!MMa9qP@BC7+PTl%pTrajLq~yuZrTzC;mIsw)ga;{U>-C-Yl#3E}&E
zS4Y*JDk?4SPm8e!E}4b-<X!zGp*&{6-XmL_nF*&pUh=?47;=bAy<M2#A)1lDH@$4u
zE_+jTr&F<GYTG%4my^9e*`s4Y5c{p<z~KcIa_W*sA?U3VY;*C+=R5?1Ek|6c-MwWq
zSlbZ8xB*eu#;vjbWI*;{-0%FTSa`P9fTu_TTyV4;eGELEgWr)MtlA!6t_X*t_EGgf
z5hrAqDpV2Qwrx?|8LYk%6%Q|Mn(+`>j*T8(thNWr=H%=ORJe;@%C5nH;8agkxS<8q
zSEmPf@Z8hF0iQm_bWzFz=R#d!*IrLCMj1bofBO5gCFbei(7ysWr%r!Z57xv98PT3p
z0XF?1VM|SuU}*rgufAfXZ~c}Fi3IL1teL^|+?Hw~eEP#BGBF3eVGVvRHa=5|Koy3F
zT(d*e*ganXi?@2?{dGzeJnE&~g{Er2pxA&RWbkw+qw_J}psMN<KN|ZaEpa6h`6c1>
z`PjMDvP=7@F&(u6(mL7liwSe_Z_7&0Q1SU-`kz~5s2zX**@D2XcHGp-e_6^ftyhe^
z<BdE!a5Q0oGG3jgD%NL2Z(K#114h#HGgQ!#IRChbZjvSY0C8W&ULX6x>Wcz}pC3{M
z3~i3y)Z(_SeE}v9zb=L7&fumr{c>+8!#g}VuxoyfSV|0VFBnxWu)4NUr@ge-bmBqS
zI!?jWQ1YwBtHTX0rDy-{@yj!;n!=FV#MxL5ILTOjM`)v<AdTKGikqm>zo^T;TZA%y
zKmFRyt35Ys9eT_JT;CkzXE#WwG5leC4z|s5$JZ_+b5l%8>Jclei{m-~5Qj&S5T<?b
zOkmUb@3yopNVbYw)-zvw5X;psW+Ll;Q>%i&9WYtHfVYSPPxp)_8FhygldWURucxf)
z;5HXN5+&E0Kr<#EVCgR6L7{1~!+)lIw$;=@68o`-Hh0-QBFT%z1+Y7f+owyJAlF%q
z#At{V@$*vCDrF6i+pJ1?m(LE?8g-KCKzhe52x*XKoo%3E@#wxGweY*sE)I1=J2%ce
zC^-uKA|CkCybOr_8s?I&W~~C^pI^ZrXIJb~y)FNA$VJ-$FEU+ONZw6-1~lu6-Q?zc
zqiw#^jhIq|ebA|DAI1E;K%C9?2Jf#j%v}5-#D*g3*L;pj2)>;sWGr7&SmN<BW=ubt
z*_srLL-JQ+dP^`a8-PtfKOLp!8%qEfQ7fRIU9r0yRZ`p7QKAcIUzAZQS7v?~ocKeG
zJmLbP&z~9N*ET&^mR`0^at~C58}HK>w_{>3$B1P)fYT@=V)b`Y0#i<wP{K`qH6f%Z
zLingR(JP)6l>=(tK<e_n;Y>}&*s?t*bAo&y((@P(PGu9btFyCUpNmnWHa-F*k9pRn
zhFUOn(edt<U^xqGGNKBDvD(@QNYR!fj7@%`2XDyHkJ0SpABEU(jsE5$^w90<X}lck
zi!mIm#|NK`qqaDSMW5f;XzaM{5b~jqc)fq;wn(jWF#5*i_7X-;l;%M=18Lccbq3i2
zP|pRKPfC8aHw`DP)^_eTfAom`%`miUFu}7N>v8Y+F+uK5ZU~m%NSR|V#3Xnp(Aw2l
zoKUW^0XYk0o~!V;=*h6{xiPFnrdm4j^Xg{UwZxPtg=;D0fI!jo7F-^2z>M4MjIV|7
zz!}TB`I&#`SL8T`{t8N>4T}DSf$YLkg#f>9TahW-363Y8MBPM~YC|q*(1lo&_6$21
zI$2zo=bJEGxlMQ$qa2q?^`yda2Z7cldv0G@zQXoued<%I;7Zb(8{*gwk70G=N+uio
zb$K!tQmj><Z30xfZP+X5msC2%4a*qeNIp3XH^Gv?u<sA#joJ%S&xphmJJ#_?k#h4F
z|IND4(=4R`rXG&h5zhj~`~;~xATY(N^PA?XeYEYs;3ScOE(f!qfB-KCsM!lj1~8+!
zfx<6R1`ua_YY%9RHn9kw(P6?cF<d8T?r;%s-S0JR!4}L*N?FuEi8l$pQ>9oD0^`t~
zao2Nmv4vD_?G7?@8BOGtkvWG+H`VO7#h$ydi0iS-^p;tH&qa*KVqEWrle5%<vs+4!
z#S}W3-YAQFoIJKI-fS35&Mu87`qaR4t2%jb)<x0-<udGmDm~h?qV-|Zp*C9cvxT5D
z{WmzhO`M!{&QwpVtF0*Y!wCmeHdhk~Cbxwm*(uXPRBg+9YP!Gh-UMPIR7Kn-{Jh<m
z@HN8;E!!6mFNlFRl^Q$Nu~9(z_~e^t#gH%N+0mkQj~q7kTyCsJk7b>nY9K6c$-9t;
zZcjKx?{B$Z3yj6zIR9Kdceq}=fTYRIS<wi&`#~P)wCK9TZ{vM2!+27pEL`h*vT+*s
zduyx0WUI`NNz2QwYtIa9t-O%v-)ot`yip3iJzQ#WMa}V}%y#=Z8nOW|xUFq?d)N^{
z#6Az|n7^!ekXb8~zAF5tH7S8HsP(**lTGay?bYV3F+2##-n-HxQ#C`3CjsJ0iFc2$
z+}BzBpbU`Dr85Xd+58+fJ(qmmyaYg}U7<~8e@{Lw8lOE6z}agkI+1<5`(X7gCeyDf
z1Q2dQp0Ku>U0oqJvLi6tEg2l13k|t?Z|~B32_FivtRB1%WAhK}_lPUfd9Yu3Q9Cs>
z9zNDavlX?Ogr{urKgv00a#&+gZ>#x`owtzW#c&@|xrLHaE6jI#?NgHh4=dhu`mTXZ
z2Rq#gNwLo7Odv!M&0VZGm7xsYtjexDkl}IJsnig45+$KtHjOiuCw@}FKBw=5tG!J0
zN8SFU>hU|K6Y56`(OaFYugx7A{rgU>Xq#%ZMvbUI5GWbPc0+zmV16b4k`%zCIpnTP
z{iLH83I|x2TigQNR2;;a(dm$8cU-)+hJB&IGaK#4@P0Zd&i%a`%jM8sN{b7j$!!#D
z^1u@%L5*J{EM_bj=iAB|j9vNPquKYF;HU|VO=ap5jD+za0AU7E(F_3Dc~6PlTx(8L
zFL{iey|sWN`*A@3dHoskF6z>{>=Nu68gIb1gGjJdYnRr^&CyIl^P|T!57KpwfuM2?
zH#HiH+VS3NAdIu3Z11BKY?w-K*Qc1VW~-`pUOqY>2y+zo?i5tX);#^H2%E0Le=G+T
zwc3sBlGJ1acGE%gw%r%yqYV+3VtR3jni|e<;+}!xIjxC}7dzC7c;FOV!qfW=P2Uai
zOlT%t8p%(nYM4?tmfCE{im&F%872H?$%AJMZv%#Ej`0BHT!A#5cH@q^GAX`mCDHU6
zW5WDS4derFm3F5<u7Ky4E;4IE71SptV~2i6Q9{Q;U;78Nspwzx)IpNgWBp*Z(=F{{
zQi>EDz&(-#mFNcn6trA<lW?bk8q!?uWdi?t+xz&hR-3EnXaX;xTGtlNQMdF9$xXAs
zOK+Mnjw+>b1iG3}nQVmHRraOr?dV*^hO-{xQ)-M6+I^LM>UwigWdv*!*^fU^tdQyx
z^;!Pfqiu6=Y`Gq*UvKufpWx1iwUIKoL|0#xF!x|-FS5O>m(iReHn<RGSC|(?;n4>J
zf!YQ>?p*D045RV<S-H1tbXt$-GD(bnJIUSH(g<`udCU&yPEryMNLCr`;NZ#amn(19
z=CIgcmCbgoRwe?Jlqd%r(M@h&vzk7gs$WvwY{&y|1inICEy=^NmFDP33G#`Ysz6E5
z1~}=j*=&pgu+iDM$ey-E33ypAaoCmQ(XWy2b8c-!X)A<qYhcA~pxzJEDGD5ROg>4A
zM{Kv|A7j#n2LR51^!OGNSiSdlC&Jad>OLJXDa>==@v9x`T1w!`<}tTKV9+bnxsF7k
zBPF!_*aIedPQGFbEG@H6UY<}L-E?clF!UDign5}XUA~goqxyv$QbfgNa|iL!mPAve
zf{Oi`1I~(952K?V=-PFJ$_>w}wkgoENzh<bGaPkat?ie>fXbMlOw{vp)J5w|Jj3JA
zY|4i`qANEYErJ8^X%;gXvq_UDGEWD7VSSdDY<Qr#j7>D1q)Vvxa|&&(<iGN$Iktkf
zi&XA&nnr6c#9`hZii`Pm6S{o3UuKjIx-ns3+blZg0dSBva$)<1!Nh=e9PN2YW}Y>^
z^P+$Mqgz#ujbFoy2W~ywF1XnnSCx1DKi3Zhlw94kFo*mJsB5dYdpoZya$JS?>HqRV
zMj7ksakMQCQty8^2SViEJhor>liJQ3Fv^EgS~wuqU?Y8;>>~>ZDX!ZF)M_)(!K=f5
ztWXSCaGF{A7&DGsl(;<uv9Q{NDb@h81Umx0Hw(!P4KTTVqZ3#5>65@N1n%gg%FNMc
z=^U7Py869RUawO;yiGr3#F-EVS+T}>EpU-Bp$is7AwXU3$@f)EK_8AOS?GEcL-JDF
z1wzBDI<|)2ar)bt!}x)cOP*B}Z>+c+omx@-HhNvnfeQ*J=tqq>F9s@!a+w2mSY<|!
zP=k_o7dkQ34lEfXPS@eXgKd~w=5hy7Op~{T{B?d{-w`g3!m#thp$?WyP4jr7_WTNJ
zQLXm7YzxaAbkEB#7*-X6&3wY+$V+wiq*Lwo`f_5gWc%C1XmZWb%sYqu01T<nynYYn
zq1#}Nnx<yFZcL-MKK%4ndf=AxkSn_2FeF&3G&Ts{0PuM=*!<qDR++iX@qsZ2_(t~o
zgqAokn=Fh#zg<4rvvx5n1`C!(eRz>sC?iyWO_d$_=tM1sl;~0SK#h($;zS;eDvLdp
zcWWljp#{mWlY%N5SpJKf9=Lj>eiFa}#6g$*kaM+u<O`U}W1kkuw(i=v70*GQ(=|nY
zc(K-=(4D`V2KW(A13+at=tj0ZQ{C=Xr3dJTd_Z_c2QlskfqAP9F607MwlL6AJ8vaB
z0^-Dufw5IM?ZsE9!y|3keUba<CCFhsU>i<U&Fcu&UAC-2VAik$jzTPPc3Ls<Oh^{r
zHoLpr<FH2HWFb`y=)DM}k|b5_DGNZ6ug{M3?|dK)fcX9jOI>o2u!BH9^9_GtPDO1l
zeP21Y@M@Wl((0szcgQmpNlj${#)0S?@)lON&*Zcxliv`z6M^i*TZaH~2&Jp}PR%sg
zKJN)r+lv3h)OKgA>PjKXCmtLECq>%;b(s8X2m32^iF)*<aqJc8@SyK?%4ihF(aJ(P
zgg%<kYIC1i%EQ+#Hzr1%N1IRJ^Ys7!_q9#Fa9aZ8S??UhFv~~2bhEmqGmapi;Y{mT
zDBx5piYiAZ!oPgi(lx0hZIH4Z#+`4Ai<gWmod^F08#9QOU@A-G;~O^taa9o=d|Do5
zPT6~a3>4hxoLXc}uPyM1886RsGvhIyH15`dq*5oY{+bOW7)^5jbY*kFP(zUi3HM`S
z*Q{%z;t-@2<oa9y_p!2>oyfjt7<c%czS?E*NA2I546jMH;hxj8K+<mCW5Cy2BJzbQ
z?_HyvO*Gw4V0b*47#oKx@~g&+vUES)LT9udT@LRG_Y5BeW2q0)panVBfyVYbKrBM@
z0a;eltdc(RrA(P_)$=tteOGv~)z5yv=q_Jea$KPL9j>~szMJ)JqQ^335Ca2>#%TeH
zY4D=Xg`Ov*1!EHqHYJ!D{;Nu;f2Z7v@ueX`;<tHrT8$f>bgzw`yL9fZL?7+Re2kOd
z@(1#C`6q7Fn8NMnMYf`?2M~O(%Jq#XX3>y)$??#v15xq59m)Q)ZY>^elNMAdi$6~F
z?zBsK&scjuIyMUnDBI`%ltOD__JsVn(?YuYPlVv49^uy`|DissBkWG|;?1L##r18!
z<bujm09L9XuvG-0L(U^h1T&4t6MC0Iu1weuoiWf|a2=Mv^IH?bOgR0CR;rzw3>cM{
z;P-&Htq_r+*De}?tjVVUCr}4)bobn!oqo$W4^R@00G-+6v^xN=O{yG|0*W=7xUx*3
zd_h_GQi#u0pRAQ7vfRk;qCCLz4~WE}KPeLDjvay%r@fgu8S2vwk*o0baD1yC3mBFg
ze_}{Tg)$7hr~%G#?|bpQG!{NKRm>i~mG<?fK3`RTL@X#W951v}L5r>8-QTLaTYF76
zZ%)AaUnBE?<rxM(I|J(fH^{nBN44Ch9{j_JD8{#e3zlVZ!2;q+?C)-hvKtf?>553^
z8jFtX0C)?6#VPWD$6@480~4#$SfuCPogAhufh0Ayd_e`~HZ$GGODK71USp@;ISN1_
zbdX@u+CE^F7&>gaI^kSndcw$AT&}%;wbxJ<@|Jt{OIsnh0>?m+mo%a2&#pR5j90Ke
zmL)rwd;#ws&US+Ay=p=)9}%vwcLAjnz&Xfo*eKW|QGZ@@o+*5}m;qL`2Ahs<V;Nt+
zk$3Y1=aOu^$>%w!`o{k37%-~f>2pu05dbS|au|^qx~D|mLAb#br4~20ok$-P_wD8h
z-8CM9b$11VZl9O8y%eE>D_Tv|SDM`toO$<wmH?5Y>#xS==@T#PoyYy~RShNtITI|3
zd^P`1^92lTfh^57(bu>*3~@)!?gOIJgGUB)-5&Jb3$K<n`8)dyyRv{nKMz2qndg}O
znW`(RI)<2z{F!{G#PiMBcO!-5OM8ne8tj3NYfYnkW5T)wj@`h%h^meRe96KRf_y#I
z;eF0o4&%9;Ye!CW|85Frp*QO|@kK&RVOQA}Wy&TnRnS~<W7a1=Mp|9#*sZsOqmWLp
zI(jpD99LP7NZgIFZ(-u!w5PqMMhAwQ$;-DVo6%<D%_7u`8=ilCx%x5B9$N^k`4@K4
z-h1<C_}UTSHTmb8&UmY9wLKOm-ES^sKm1m04u1HT7ruQU2}^Q^Q?4hzf>eVa_o$6V
z9m>Sy934)%<F9<B2<!UKI`vjvR21~-WeJy2|D8rpxYBZVj^gsPD@e3)s%eY09(!(*
z+I6_u0-3(K3Cd6yr$`FoXv16{wUO7XS>HA{($FSI?7B<i1=^Rb89djyev8+I6+c!0
z{BmkVUHj?KruT-+$*U`fC+YF}=>eim5P*OCcLw2joy!%|5qD+HOR7#QI@d8uE9m?9
z+3OdUm!G+$j<(L<EaZ&`dEE1}w9Gp%jMnEdI%zRr<;*7|o`pAod>Ap#jXD^Vr#=>1
zP}WvllNqyyUwAe%t8+u}+v@4KM%f8Jeyc_k&C;|1{&||}n3T9~SOHr2>dtU-)fL`=
z&q);X!1;{J7ukb=L~UoEkW(RxDYzW~jK<t4%TyE#UI2MCNtq8?@vglAGH!^WInQY9
zpA#a^>M%@=p*+fnvMxj+H}P{B#I@gyM4gRkYTWn3>GA3e?A7V%O<Bb?<*oAAI?4}j
zI+QEn2L^{&EVsR+=$FM0Gf@5@+5(ui)*R9Zbq?j0HU@&jTJsqCn?@T?8qzcP^o|<J
z4^9pCLmjfct)3JxcwjJyxLpOs>~0V`^PSpMDvty6*8<L&(dYumr`R~$zZGmQoS#Sn
zlG_rCm=ycghtwUAeHwuk^-PadQXgW|hkVse=_&@GaoQV%YT?j18M=z?SLHg)h=={F
zLH&{9n#~5-e3?4=ZSDskv%q<Ac_Z4NO7sWYQL6fABx+_So<!JkUZ!_lcj1$g#|^iq
zELM3wfprTNN6o1SA!cj2%h--7j|U3cg*R%0xQHffs|rM*9{apRfwNcxIe$lNT4~9H
z$)wmvI<CH*Mew$4q^902uvfKQx0n$pCEDdOl-~O6WBrXkv#ZM*gz|$SNYUd`lPUgT
zEXxx^7Y0dO7T^>jE&Bje%|$b5mJWIR8XN<NMHHF(293T|z%3N6$;HIE`!yAn(!5DB
z_v&c$u-yQxXN8(E8pVA}w;c<e+;Ws1C}XS&7Tc)tbOoo|AiHmpQiO#{0-Em@KX-V7
zD;9w`K|Aa@jX~aWRC~nG>oh68Vh;@c$rY|GU$y=CYS3>EsCY17%hLzni2>OYx$>{L
zr8_RPqYBmapKUd~;|d{=uywQVNEFA&qo`9HvV|dOs?@!ne7Z;5Dp#ncu7I$mh+D|2
z1OGq<_>7FGNnBGZECD2EkW-n@elJ^yqpk;5<HXf`CdhgyhcFMRt@I1`Jv-QqvvAyF
zL!Bg_{i`yWP<%nm?F}vSIp`Ru<vJBD63?Zcy3Pa)_h`1g;Gm0-T<oEeGC>pm@dn{W
zb&P3)+s|3D>aw#6myxOPUXSq|b=_#sZK8I%)+jpmhhQ>PG~UugFFiI!f0X5ANISM#
z6bC$H3s5zmrpb~|7IiN58(zOWm+@eg1xOa+T~k+q>`Pf}fjMkC*1a6K6+r?`<$o=K
z<`-qN%C~Q;DMutcrEenu$n=6L9fFNlEZ%d<qaVEQRDqFt>JT8W>EMlE&rsApI%_kx
z-lfn(r!Se8&cnq)cB-KC`)YiuK{+R0)+T3{)GM)`aOQ`3vEi{G_Vhc)Lef7{hmWh#
zV{lFbTln|#eJVI)bUbe~7BteUSlm|Y<_99Ss5i==F`tF5(FRpH`3PwdEk;0<{R^}i
zUx~Onufr5ZWemEkbK)xwdeD~EnV0{T&&=(K(#n$JO-`t2#_|InQha&vseV0h7O>_X
zFNFwtg8Ku|yD9>4HJ4<VYJ*b^c6O;Ax!IZBch*UqJ+9noDEnJLIc_?&00@HAp~1^<
zz9EBR4f1pj$NPg13wpV-OZ|;EjhL;&W}Ica3G^iw9|*qTXlHb<9{#efI|u}AkWZDH
zFj}$N8CSW$kh(v!CqS0sDsn2X0ZKBTL<r&SjK7faSrAm)EM7`i?qM|rqOTx%CYxIt
z(1>jL)x<i|TDr6jsM$2T)sD(=$4m<4aM<07(?u<pRD%U0;o4@Y$!To>tsLDlWF#oH
zUr5|<%uB)p_%cc^!-jH~09hAbeBmx=TjEKks}~bUg(%89_Cia*O|w+}xRV_g521!!
z6t-Pt7<(VK)%os}<#BzdKs_fa4dRe+)5@zfv?xwgMp;8w+Kt}c{{zdiFNBEjWIs`;
zCL7qNJRilC;u0bE4GAWpiYjN*15tRNTJt;QX&Us{xZ4RQrMDsYFUTHNafRYeFQbJ0
zK1L+2RwsU-WIUA`qNoyQ%M%8PU}!-X-j=RStbwZvJwXboTV3nv;W^*_V6Q-$&+dD;
z;JZZ!L;}wx!++Is|9P)_#Qb?}vlaCyl<W*eiXU<WSfEvB<;GIsITL(HT0|WL8jvF$
z@!Z;KEthACav?T#=z&HFG>bo{4Vu2xjyJk8uAm*vnf+1|M*~{iIr+%UKB=r-1YsEL
z)m&@FcIb!&wEUL-YL*9u(KaDYisg1ScDqHj?RP3*Ltov7v^$>Yr?dj26fluAJ*k?O
zg_*!&n59$P?!AyGeUGr%N*E)}65th6x1_q95;qXWgzs~N-=hsH-ONKN)iNY!C?#<W
z6Ggrgb}7$Wxnj)*tQbU7bW4eI7kW$DDfw(g+Z+uZhy47sFJw%)0hgLM&wJcQmGc`Y
zb8zHDGw6_q{MZILMVe%qBH}~Ey?D5F6(F0hYdgjU&aWZUIaBr)@!=TA&JQk7W{wAQ
z81N;^+t{;zli#$_`fBGlq6pfH@TZd;kEjZ9ZbC-$wYb5cNd2xo&UgtPE9R-iCvse7
z4g+-iFkBLHq+gnRYkfsqFhAZP8$5kI$DN=Qe~+vih*2I`In?s$5A5m0$`^q-hJO)`
zHW8S!_X8!D9yi}lz5pQ3!6_F|iyLy#9bvm>v$<L7lNC*QjIkgmKIT4=yWYGPP6gc3
zR~_v}5I7X)|M(C{UUbufjG6%R@u7X>hg-v*!SkQofwA3|od)z50JLm$0cbOm!y&NU
z5C&3Wi41jPH!Flaos~(C#`%|O?-yvP8UalD#WW}XOCh6zrm$5DyZxxCbi+bs+k$0~
zE197a=iFo4L=IvqsQqR9(@){{&SFX=v{7mN3~)$A#_T3-N*!b<P?tm=;znp-AfK<(
zdYCuFJK8YOkMo|}dkO{@j2FD{4VUnZdrj$CLF(Jw${DKr`e<vrtZ8(RIOc86>dY)o
ze29`kH4xoYuPUx_GPy;@oDQ|X)5Q5m?sYWb4<I1_mL#1=6G=J)dZg3M+@^7qz_|sW
z%PO+_FqIJz<k`+XF(}qrU_j1}3=f*CP1kUxgKm}^^c$$58v@uzn`X57?MkhX5HO)Z
zjgiBNAA#<fLpBZk`aU|~)zT;M$bk85pXN9fNCnCs9W7+lVrHjF$Cj~z#CM)<+zJ}c
zBWZ!Lpqsr{T6=d4qncj6@NUb~EYBP3$#b|hA4&83u$|wO(aD(of?u9@$V-k6%n8i*
z8xVDVZE#)-QcOJTg;Bn^xMiH;ns<in)R$J%Q=@W=T1r(px|7Ae+e(wIs<pn`EH2(`
z+x$RfJUeGz!SdfF?kIRn-qj6TadE~51lFRay5CXNwZ7ezKQj#rEK0puuwOm`>z^E8
zUh24(<Zr<rFRr?}yh568lMlB&uf|Yg;dc8pu^U)1uLM`1jJYyRgKQgszDS%W_cS{s
z8<kvi$~!O9H79GNe}GD7>pCdOUFZ8AdsM9s$khz|^8)LQdh0je0^HEMAjxy`&%XG4
zZNvEGm-XNCN9=jd0kOLBmPN=kFXfdVr{~07is#&0^0r2>Q0$SvtilxIhZ>eV$0tX`
zK9yhVj>DKVDgaFTlq=bKb7Y}$%0X<kP-(Cv30p2b)z6bOVG;8Wk~Bpb7U{7tsBH(y
zaY8jU)M9P^qSNrD`n_Vu@wgS5B>M<=3i~*Kj6k?v>C7(Nqd0lB$wj}<S^o%ex8ufc
zafd#0vJBz-c=#{8d%U>j!u{IBQ&=AVfc~3S;W<_<^>zSt|H&=Lb0v8|vgAkI5M1gI
zl-Fl>-9Fhg?xh*Sk)#Rygw++y_jl22=b&m4!{@38To>R=Em|s2k2S7_4=4i+TQ|pn
z-{BrU+gk4zIoL>$_~8iE2*1`7U|b^b<6I0n*}n3d;9V`hAkGmI$*W3oJGv3&!tRa*
zmXIJDTx_w)ZYO~il2_(C*V$EcY`>2%v&KfC!s2R|7KNSvv^@dGX}>a<+AnpvmL(-K
z`+gV2DZh3MO^`Dxu(#JMQY{tRu2Luw@cU_;SDfZd_a3ShbQ>&w7Gjc)qaP>TIx!@D
zci)9Q5ul<_+fSCWDSHI#5&-fYsDcSl{<%U>qyb>0O%1yZzYEAUx<{kswH@%r%OL(H
zObC@DI2YCSWq0j>WGXRCGa43NOC<AU8<buqH4I?br3yUIPYvVMyKkpslt$FrzF244
zAV?@q9rTQ%npkdp^}?MODbMr^0oNJ4S=qV3ffx$N&WxSsp<4D9WCy!~9chg-XPGj7
z=I??oD2sA8tCvdJFB$E2)`c**sHFEU0el&VPcfY%KBTXe)nbYqzef}9g9MZ~K#mlG
z1TsHSo6~!j=QPsnji!FKstMU}nsG-8hkRMvk2C$KV0?n<!ixwGf;@*q8gKLx`kBLI
zlYQnO!9u#L>*<)+U(#cJjo_mHajiHV`MR4%R^V9ZdbC1#PUnh0k3SyW<e+nF$t4ZH
zCshL`K&Kdx`UJAL)x`3I0>CisCYuRbXM>S$07mr}HX5zGm_}f5cbk?I_t2A9H_z%L
zfe5{t`ZiRWroB5$&Ja6jpm6hhxM0)$I5lP<emt)hURJHP15u#*?jaWYJrPx&xWbjK
z*~(fM#iLj;A~~igtsbbPRvExp7q*(sk_ekVzRpTMEi*r-Ls$Pv^Y@?1;c<`}lQ%W-
zSZ=^SldGef26fw(F#x7+jwq!BLpmD)@*?(l2+wW-_2`}fJP<AI89?8QR_xx!2uSvO
zuhkFd2H7oRG$OJtRxVdWmn1}K(Lo^06q$qBc#d2JB`#qW*mTrt)1QSeN-#^^`RUoG
zR^~zv;Zui^5R<(EvEuNgfd*4HB`&>-O_K5wgxgQmXIGpa1oOxPAA&PLpo=)JXPQ(*
zw8DJ0pOKjE85#NLfm_L_Wz6y$!%+U3!-`-vBc5M%^;q$zrR6mdUvTFqXKJhW1cn{C
zLkCuwoZnbwTuYdHhn<LX(}-77qxay@_goHH%;afa)*m9Pdz%%`+y2NV(*;5!|6`j>
zwW0GHaq@8Odi=UI;$E!`cb-$#Yy@vV&z4Q#tq^5eA%=EkE*WIa%|qRIx&~9T1dmrA
zTFC@QfWska7PHGfsOivNQHKeuJ^<fq7H5SkGlo{s$E@Yv@z!3I9+fcg4xqH!1%*z4
zknDhfQ1BjLh^f=&=$>q68tO^L^ualF?NLq0#=6^5ef91fcB3bzhcVzFILy6)h_yK&
z-s4T9)^*?HE5FCvFMf<asQ?~$(*2NZxg<3*J#>R+9GSy-5IJh7QgpI|@g(WKTX*09
z>>e-tVfBMJvwDLuw?p3nlmC-cQe~<RPI=_nxIUoNx@n>u!lM4;{2evm(C>ulmo(-I
zxK&OdkOQ{vB3$Yxy&bzj^N--z6%$)g0D~+YeO|@(43O4`87WEd%$MhG>zs}Q!D47C
zIOsj_nP1NC?2SDM!k<FKWymh76h0P8ii<Z#JcUEn^#{xbylE1tPJcSNY93%GU#|=o
zwzT*86BB%sstjQ&c)__6u7DPC0It=Meu+aoc{gQ^CaKXuG*oRUjZu#_Ok@f1df67g
zj`kfeZ}Aui!CZ=|DbfoE2=_x0zldtnFkI;AJIoP<W<<O!LC<fvVH~DqnP*29NIj<*
zzxTZ@he(yG<`D`U&rPV-ccizSW{tY%{%_ZLJ@RqMBKfE=tO@jrI)SGa`m3UeZR`0&
zzmD?<MC*kxvPd((XLQ6-(a#;qE3`1d;d9$K^%!$%2MiYW+*OZ(7a)FoH&fEtVUS4S
z>O~$v)C8nW=G`7=ebw+UBqJ^#+eOQUFmWn4(m*4dTidLg_p8(cpoj%yG|5qH8Tuw)
zGWE;{q#bRATsMO7QUOYE8AEN{*_~gjwLC?Vh&GX}^Xp``j&y>9NDzP5v03^&TZj4N
zUsE>u3=B5v{KX4#+)%nSr4xiQiyA<YCz~o68=%sBAA$2*;Di-r+rW1Sdm#g8g5^j~
z{iD+RI>v2aKY{(JdR$H$Ezn{myJI_AUsy^5?G;Pf+t<Sk`+MTJZX2jn$4B$IJ*lWE
zt@k~AxZ%UQ_2WC9ld#=kVHqLay(sf%b>(Y&mz^KQi5ip77Nz`Ac1}eMQ`XLRJd8?y
zfyCZZt%+Eu&htl27JaRoprK0^81#QImD+Y`Y}KA{&4m$66en~Ju#+_1NwLkDmc6D*
zGxjkY9&h5etO$pb<KMHthg&B|oDBl=s+B98l}kv=GoET)stSOwR2dKg$QRRt6t)9m
z4u0hWi)LB{R7qiBpbvm9C1l0~Uk-T{pyN?NCB~$8A?+7+nC}@BgKnTIlwEf92w7K8
zxj-EPTUQ(gDYhh#ea@5%W%JGn_suR(i%}ywl`yXx@ZoFNg(#_>uU2}{;ZC<fKM-TL
zPH4fe7Ac&}Zd-NEH#V8>sCj2=_1|<s7CQG(?5+Z&kAQXo7)!JTTurRFI)uN;Dwt<*
zydif3ajH>BQ~<>pDssG@Qg=$;GQrZ;%oqGNP1QEAf=Vr8GzW^)+sx5N{6tTQi~78X
zYx4R7{FMpmtu*yNOUkhf2+pi*Ij#z{uocRV|7o^@9RPRhY8Q)U^`-ynkBujD0yZbm
zAEYl^@*p0^_wZ|5zbV06DBJ;(WR`I*FL9%4<iy<<WYEJI1pQO)cJXrOw1v!Vr;xW!
zWvl(V=3nBd-mwffa<g^;AyOxh9Vsj~3_4f@OeTbW)n}LspD+s;cE@)O=hlj|fuN$o
zpRz4C>sCey<^ovMMee(hdk&;g0=rM5zA6-%su3XkmKTB=ErtxL!_BOilA9n7;4W|l
zofCfCg5=rP?ETO&4WkFaHv#VLr+!I1h2OQYGE-xBH}J5)N1cthwYUUv5gVT11AIN}
zhQ-qZ$)G~rLGwu9fco#jvYJFo`sK2MT?L;q9z^wTE%Xd5@1L?1xHpy+8hm*M9Eh0p
zxYv<Z5mmG>w@9gfBV=eY7006!8x|N+(}Wi2ZJ1#C@{UNGvEN^||7C^P@cRl86AjVa
z7L-2C67(fh9s`-J4z6KdMcm6TB}zMg^<y7jeXmq7kp(?bBaMgG!6`$7S07WpU1Y}h
z4xS!>-L4gMnPBDv<76P~{)yjv_2~%!GA_{H?7hp_OzxG*N>>lJ|BleR;LX|Y8>3$E
zZ7zes=tG;8$eE6S7{xXB_afvkC&5pCJHP9i?-@PK>hm`!5LZ5#KwmEh!@_}iz>~Au
z9YO6IO^TjRsXmPsU`V<vF*L9KDKEK@Rw<uO+`%0%F*mXIDtEdeKje3H&`P1N$5S)_
z7<JbCPl=LJZeQlpA+^|U;)&3Z@ZqbaP;uhhgYUwsGPR`LbLp>u3}a<A{^5AN|Ld?i
zFtX$<fL8my0!gO+Ign)UzT+;M@Ni!`OjR)#+LIQjr&-ncu{^Ed_?M-*(GW5^1Z@PS
zi{EVD+**L{Wj~mA3q1$Wo&e?>kdDiAznHE&E&*vo_kN3f@-e(ZK283U8J0-6P*6V4
z{}(k!o;TNvr@=$r^ZvnPq)dRWuU1F^3j2SE%JkpRBGJ;Drcq{Gb%Z~B_^ySG^%sjA
z<QkBJI9lW&uWp*JmUI~BjcioHEl6-;$f6|F>8p?2qqU+T1TZDDLQBzfC27S2z%yF~
zmXignV_vZ*Q$T9wnB*|v#ZJUT-qZ@aLE>wS&G-pJ81YBVeG@jmw!{HsYYFE;nFH_s
zU1V{-6RC#gV=;hVuwBS*pK0-JKZ|qsoVzQP>di`cn-3z^D}j60Ldt%DlC*%cF*@ZX
zcZ!+x4m$J=WSd6QO!PRc#akY^ggq4?fr~M8*khVeypHyfGAf+H_h+xN)_pX^{8uY0
z#uH$w(=4vaE)j&3xf4APYp5YJO4VRG@HT8*EAzRpJ{{>1F|5Zawm?n*n6#WAA8=~$
z!A^jg-{x{bRHgRY&FsmWUQ&#}73_#al+-<R^c3TDlr><vNBTlQLzHZ4pFdg@CSaF@
zfC$JG5AiG<dQ5Uh&HWW|ls6%5nv@XbL$j2kV&n1ds~}riuekuwO`vj4cmgwCKLTm{
z<|r~0Gkz-`0B=H&2Xl)JxyNMCU49S9Mjy78b>}xLtUsBQ$ET0SsTSsEsfQhM>Fw11
zI|*VyyF$JBNCyenSH$dzYjFY4KP6Mf78kw{4w=`(?}}~yN03n#`DstP%TrLAQ7qZW
zzRe5F@l6pCrsYf+0bkuu0X;!y^pH25IC^=WgQ05PGPn9L`&3IBNwbWZsUY~*g3Q2{
z7<$*S-LVu9k$ge=<Zl1Nm&=N63wJhbs0B{5Xfo$6kvfQy8t05F$qFk}I5mIhzW}xF
zhEv`jtk&z^Y&C-8=?4mR)ef;x5>1{R?AD%rO!I!04z;1rw~y9#8uU^-^)omeO@WTC
z_S+OCL?kwA&No|GUADH!s^@zDX<4;R)zxCgZTnZqr%pI<i(s7rXaH1?XoM7hTEu3v
zlv4nmFbsGB9<R1JvpWuM`ZL(+{{mU^zW|Yvs(ioAz|*GxZr7fWJwI3Jtm3tH7;~Ld
ziL=yqRJ`qTkr@$Q4T1SDXw-@Ev5Gph)xqixl_d^c^D(KqdEs?@IHHG}JT9J|DSb_}
z^CrE?b@BuO@T*HF)&{;&FK&4L^#@>YjgeYYmzY0!<_zRD8`?cV6zS`4&Ofm-0KWoU
zyFsuLZRU*tnB<r-)>Hlje(`7K|F*w;E#t}I16Bv)EC{DpmxFmXrU83!^O#zlO&Q(k
z_QlQK(d`K8(IZcsNxCp{&1q_><}2`;U*e;#Nha^0R7$ui*&2}Z{^d8Ed{cvd+K=2Q
zb0mm8Lf@rHl)7@-t<~^xus6KCXLvfiL%y^v#4MV4B1+v8^qofiQDW3DO+CKcAjot0
z@Y)Fn^g-W4&_@2tllP>UscaOZR2kd-(5jSEfJ*s!W0U@zgx1<=-8nh~oPhx@Hs8#!
zr*S2p_+I7bMv;4tp=BUu<n);^UmwltLGyY><I1WcKgjCag?!o69^Yv%_6;suF^3D+
zKMZ(d>j%oXsBs6f-=7HI2#c)|XRtIs0E*m;%g6>W!~6tbmNTC`K03TX73}M2fhxWp
zu3gl=tS~ovGxVlQGMFM0y?a1NFDz9PPqq)B(pBUhuADrj&~VR^*YSTH<k5IHUhzHp
zjoml59Cpt$|An%v8`6b=0PF{hwr!B$YuyQ*gljKCm11|Rqv9zHZ}3j};x<4wSI^6m
za!vqe<2pFyr$0*1emy`VY5){KD<`+eAH`>+WH$c^J+Y^qa>nmg0b@l(^97)cx~O;i
zNry@$t{xP}T{C;A0s(fqAG=xYp#13t;u)-8_Bt-MP+xA{o1nf(Z(V)`eR&H9?GkJi
zREX7b6*%`<(lQD{{!Cg1<*!h;jd~9J<^sSGs_|991Zsl(-Z3<ASOutE#qU3p=?bL!
zEHtJ9`q=ly;^f=}Q>9lMOB!7~d#i31E4d>NoS-)js6fivLD_H8D-NR-&GyNR$snv3
zM-Fgc>3B+Iaozr6{%1VuCe6$TZr{ev_^&Jiu6HxmzPZ|%V;cSE+(?<N@!+P(nSYKm
zi6G!?f4okDpKPii`=}LLZ>dvG7Jr(W3|Kf`p5gmEkRO$#g%)g?c4ZbpA@LZap8*+;
zqvkV76vVmQk3y-&rTv%Ujh7N$e5kPoWt&%bKsU5t`~{?clFN-5kNefY=*X$~)dr3)
z8}*e0Zv&bxnc@l8K>`TcB<0PJ)g|*l&QFyi>0DKu+Zv1QsTY8QUK0f0%ebTIk17}7
zQxOHbx4Z_Cv^iA@($oPNT6nfhTkLtb4gWn_tbOmZb(%+a<&DcPs(twEmX1P3@(`))
z=+EWltc;hpy^euY40DT~kZ)7p)PR?bHpd$(6piVFrqdvIL&eGmxw5>F#b6J<WV~c-
z*HxX-Y!9ZLYv|}kK{cMK14AHN;ZcEVzLk~cNpsu?x9|@VeNQfR{sSA<nzg6qsrgCg
zL86sLvH;1C3Ve)ixl4?OK&0r4+=~Gut3w&PADs`t!aDd7kJKhk{BNgJ{L9M)5C>6=
zwJ#vQ4+>Ia1_(NU=s;vD26Iecm3ehjJnZEX*z{s4@c)7-ET^@9YcK`OxtFDcenxX8
z%3yTbF5@f!51nWXSRU!ld{aZ0AIQ3GoJ`12-h_TiR9matzL-qyO6i>T<0N~TcDqx1
zjrR77bNS?mol}g~qXJ%Gq#fG+6h@lb{89g-6ImV^dh`R?-t?he4*{&%N3FLSZ+~fK
zQYx(1eemXyxg0#)2WI8AarsosK6Mby-md)8(Am7)%BrmQH|D11Yey>*!(Z5&QWp49
z2CCkA(=1{oe-%XWzUf~8MB9^*<JBbmL21+fojxXu^86aZ+Q`)U=$kf#@koxG7F8)o
z0d(?*!(p9ry|#65PO!-~UrfjX5Y(S6Zu}wd5A_G{HxG@E8g6=72nceh`W_NPJfdK*
z0)TUN@yHTwv+AAUa|VVqCIAcMgB6bOqV|c-N^7PXp{3fq><xryb7^-aNh!-8%todW
zWiwueQ#|(^y|5r<j#)}YtI(4F@4EvNHS3A_$!7IkMLiftoKZ7Mgt}Azz;m@;AZgWQ
zzX_Fm?**ZHVn&5vLyyzuojY@nCgrqrTM{ES6d`BARy*d&&9B!O7Q%dzZ>G^D2Qnu;
zT!4u?kG4x3QLKmLmjT}A%EtifLG>&nfov@F`9%}Xnw3wvyx4d!Fk?h#Zb9eT3oWSF
zwjX|*!e!ZT-_C?hbn^Aj|Ij1kjs8db1cyuPnbLLRx3WHrjxO_mc~*z!WLX0+BIfvD
z;hCcLDe_-C4at+Ibg~isaRCie9C`eaJvudc*~<h6aK*%*=xe69Vy>D?x)mT9+c>bj
zm)2HaRt9L8;+r&V8>mpU{r{)EFOO^DY}dB6imgjrDm$b~Egr>UM0S!?MdDi*q>6wG
z0fR&Zr3lIrlBuF1vZU0?D#Q{6WM2f?BO(E1iL3z?BA^5a5FjKW+vIzKuh!b0bKduN
zmTx=xBfn&r8D=KWJab?7ecjg;R(0~AvA*c|3A||g3GM}N+k)({dT!t`_7piPvkR#3
zxt#e`CuY2vbvTFdCEBLv)(05?10$z<B6c$}C(qJ_??7Id%=i?l=Igm#9V@ue8{o2s
z7nKRc745_ey2Z|jbw`enblxxfQ2Lwmf@XjGFJS9oC}d(<hW^1;2seTQk@oE)few`a
zv8__sRz(57r;aRp@s7W4OncX>mL@QK+IafCjpwSlW*&NmxdU|%fc;agK&CdS^Hd7;
z6nS;KegIA^Ix7Qy14(-!JN<cXK85C_$`$gRAVq#FOd0j++FyH2z0C)_Z>Nczp5@Y@
zS$~z)&IhmW-l=X))3#Ior!4SsSzv2dwHmzjqui{WqLp@U^nI)HQQv=}Rax~MSH=KN
zl&V57@1a>HTkRoj+521z1ZjSO`Y8DK0{`xF3GKn7fDc_a*%(itpRUJ&BP-D(6lsLx
zLin}KLX3Zv!Fz|P_Q2`gaqB+X8%X~e2R3~Q3_Cy#{^sz5l(`K5KOmZ$Tq5tP&=||b
z?R4S^*Qd7=HAiF*X}z*fZN)cLyrH~Aw(uz7zu#K(U-j<<0Ak)e3i%bg%DnBL^LzLw
zx`~VY$y40;>Upi?H~-`H@c*aR!(0&be@o)tOD?tjXgceX4*JD$_%UliKnW@c?cxj1
z2cO!K!hz$+-Rbmcdv4?L=Y%ult3#e77U(BlpH}2Wtss!v2=nH3hpD*c5vhMRocwF9
zdG{h0*AAz_nBNoiXOu>Uyx$a#V$0w$mMJEaRhS0Nc(NEz6#i?$bSER=_?8gozr%6z
zudzJnjitMi%aPZELjgALQ(<#+6*gb0lCk)GQ8L!S^$`94rG8u>jk!rFp(#%Wy2PFc
zg3XcQAC>R=c$cW+kl$agm~$c^mXq$*zb~BkaPM4Rod9YA-!lM_{C59Tpb@oxN9|-%
zmAnA+ys_R<_BH51o&z(g?OyrKZ7?X22#C`2Nr)GcukH=Cz(*CKkGLjK(e(AQKd15^
za(#v3FycqWyin|qUlKV^AIg*Xybe4d)_ZFd<;O*Q@t`ScE<H|*fGdtSGK?qWaQ=?J
z@YVikk?ngvKy~6VJn-AL_Z(Ln4_r9!$0gXYx|Y6YJ#4MHgnw24W7>H@Y}nmYU`U!c
z1%xB}^~9h3X#R)ieYm`=jbWVoQC$eo5aNMD!Ib?@KmcH<thP10FejnO#?R-?3!5Hi
zHN3bnk<M^F@yfnsa4*)s_nq<67s~34kBSC0$a$qJSscc^&p=IO60m&NNplR5z|@-4
zFq471<8?IrTxwrp`>E9qd+(=VKi1CQ#1Kv_sNgxYb_S!Lj?ADlg0Yj_XMK|iw&Gv^
zk9^_>E_UFU&Pp?I>G<THo(kZ*+L@4C1&r1Hv9CQgYOt5`<OO7wC_tzP040H?H?av2
zY}1A=3a&c@*>S~(?|^{X16Wg|Nh`uJU(KMbDROvoYc(JX$T->4^)V^^GB2M_z>Hrc
zf1*HDZ6^)G8_N%Of?llojH{Qh#n^dA!Y2%Yhj>-Jf?)g3O#3RkYKZt$f5$&S7$DgE
z0^yD37o9&@l`4%jjs7V6vk)4ZBuy5*pq!^-aHgG{i%m3#4!VOfWj@URjrEJfWDDbT
zCO#od{>x9wPv`x_p5)eEAg$>6-qFkW(443s&iHC)uxq>3e2DVfd4pl;?xK{!3yR!;
zbRYLLLl}gOi87zPxviZCff5F-Mo?5oA4EI1zg_eP@8gZ~Aa!N+<kZRDVh`R?t@k1B
z-%)-~3viSQcp=dKPfZ)#<8aPL&T@rD+@~KE>|U`LGK)*rV+>%v^0Av`^_%9t-XJ;U
zhV?({X4#xRD_GK38&%2R4a)`6vBS8P%~!C>fAg)Lt`a0+rS_2%p>nbP3o!q9b3rxE
zz}9DILrRU#cW5V-r}lU=@4w2ED$!){oqu-Or$>e;|Gwq6QFNg4e7Yjwzn+dzGz-6{
zBj`a4iR{~mQ&kQ^{<)H2FMXLl?>7%GFCT;V%RXeOkfeiNCaJ|_xM7L97`>#I^sArx
z$EfE39rp0sslRC(`OAuF*gCb!7O3+4AUPmO7o0$i7nERj_!U(V0XO2y_MYPUUcie*
z&6_t?OXa?z?QFGya)l1r*GZsn#G&`v{fxBh|Kf1=@}G&7-j|JxN3*7O{T|GeK(RN3
z&*048D-!M4;36*PHN`3hF)L6M(8aeH{C~vA@}Hm^{1b-U2k{4p!2g=(^`C5{T{FA~
zgA<(h`D^#?);&ET?_4r(hI_UQu`3-qk}_~<RA%AqNh5=&&7<#fBNcQK>4D;tdAFL=
zRHjk+<~>R1zD4j_!91v?R%!R6?T4nBANy6kx2d#y+dub5uPR_A{Cof0n*T`uTr-=^
zo~9`!)T?p8W}6EMd=cVz?RAeQRdkKtUuT!hnODyLqZs+iFXsq~v4C7T69E)YwDqa=
z(}6ZymoR!7kvw`;$kAeZ)j7Z44@P5dgOqo=<jII%PEU-nI<f0RFaq<9dGWG8b0S0Z
zoggUCY*wIr;Ky`1y9Ko}?5H8BzUrAiH%Snv-1X~v(_g;d8~VushFJdTv0n}!+gf6>
z=LZAm^lSSl`Mnsd>2$gse2s2F!Y8AZ>2$U6?TdUdSh<EJ`JQZ<bS-2-hhIvz^~YAf
zp)TLPXw7548itd%L{^u~KyG=aArTl4N5~}_Gdp4VVz4&6fE<HWUaD@OLEG@JS&Z9;
zfw2EGgbi@oB%4}er5CyOo-^AjY*uZ*MwoR+UJzYraV1tx9r8;NUO50q7Uc5QNxN^L
z+4qS#S(D*jD+kUVq#?G$o8KL54Ax01t6Tl|!|rIHX-f{gJr_wR*8)EHOigt}p>j!G
zL#W7+aqFwg%RzL-h<RY%n+`djXrSE^?m(7L6n`TzxU4#z<qAcr9sJ>bRM%wtwT)9!
z#p3V43V>Qsd*N#kU}4qu2$g_Z5w)w{_v`E7rwK~{wc^&veNf~S5TG_)t5+Yh{+rAw
z)E+>s7@MEenc-IEN<AJAq~69IVco+=Y;K&imlO<Z4mt>|QU;y<Z@s~l8@6p$V<~`v
z=4N%kx`@PWO0rflGUdQ0Q+w!D83-s4%mHWr$f=AIemIbYiA9d2?5fqZ5d&+@8fV>z
zXq0}j_ryt{8#k?T(2Nh|QktUCnh}In6q6p?tOv|DT_|@*YnS>>z67GhY6M>+D`sFv
zVHq8GYc{G3Jl&V2fDZP)?FR!sqai!pKxj3doI?Xf-6a7f6yT%T)7K+S0LB<3B9Hj5
z{Lw6r$q-S4#e`02ZZ(AoBC0<)e7BE-%F4IkVtdGgx>Ly4Y!QpV8Rs#8uG?ZS$8u%!
z21sQqgz2)=BkYg(8LKk*c3XNBTF|&t&t0lNYq?x<KxXjxP^#i}{g|e>l!4nXcx4$~
zAl;+#_vRe9fRGgI+97v7s6+a$8H@qus7de7*n+bSK-cXxU}H`jc16+UsIJ$1joozf
zg+m4zJ_&;--;F2L;Gg^TO~UY@{NAnzuNhRvZ}8_Hu>Uq{Ib5avHo$5hL7H~tHGRSO
z`V}4wioRMJpk}Tqyt#pm$+ii^%<rONmSjmPuLfO}OBM{Be<;z|g4|+-&1#+j!s5ST
zx9c`Gz&hck&in2TDwJRJ(azXd^@YX+8x$;Tyyq`Dz?)9*dSjo{NIMLLVe<y~8Wfwv
zfM2~+Hhy%Qf+HRGuZGCa6LG_{wV*EZv>uNAN}nbEjH{~4z$QU8pe_@)eET)=cS;>e
zdOi%FF(%J>cH&({X(o)S<!Q($`HF$^lS=jn_m2D?gM+eygU}IWTi#!hzu#AKNkz0l
zX{}TXC$0Uv;G1yqn#-VAqhI19DGUhc;^5C&d+{HKXzM}IaB6!3$JGJ32h?h~iqD|S
z7OTdU@9$Chy`byZyjRvoxiY;_30K%t7X9_;ZdktV-+I$U<SI__XbY-HiBPF1JqHga
zp$pY$Z~k&}LRR1c{Jbe$_i{Dfi#YbC$fhLJ;rTMWwrTuCjT9#d6&xH4>|6IVf@!k{
z(uhIySfm7mPp6^~?N>@y(LrTr_GHt6kw9hMDn3gu({-)r8kK2t^IPcjF}R}~5IDdu
z!w0UPqb7sLES=nTbNEj|ge9dowXE)L6IYzeeHdHKx#_o{WJZyDYh(Uhe!!cf7dMd^
z8@Wc&v+((Jp-J>)7-|41daz`Obx8n-9o8}pFuelb@i04KzdQ1fs1Pwn_|$GZ9T*bH
z_SMI;GtMb!t<JGJb#@+Jf~rFT<DE<Gy9`?fdD@P-N)zqIa|TB0_qyt()S>$L><dn`
zI(FXASPuK!$4h#ufMPo*pht5^$C0dFv=dn-Mjx90WQh6P&g`nh&XHE<-THQv#bJxV
zNs{fMkh6AMA5i%-ZiCfVFM3grw`~8@TxdFM-{thWb>(Xu!O0bCa2Pm{+sCOKK*x-A
zYPIPSEzP7Hv_MTjM~&%uz0^ChN*|04kV48Ef+8;Y!ny)_!D(OtYJnKFyR*}>Q*&jV
zo!c#Jz5Hahw%FFHB@}e?I_xv;S`!g5Isix>nl>V?MPDaT3vl~9O!G0Ln1xh@Wpseh
z#cmXb7s=yZ0t@o5plXhFDOX-yTVT`@3dCwryPT*@=iHc)c&aH`Kl+5Peh1w-a$9-u
zR_3{=J@p~kBZ41|A_TYf>y9sJ>!hP%y*#Xj2zzN^1eaTC!u9HepL6x23XU4IqmW)w
z8{NhMn+#lmW~jgLWaJy|glLI#JGb9iox2Tvy-xE^7LH)V{*L@L>-c7UZvEk#p8m&M
zZojxetqDA;)0MfEzRGW5Z%W7#=HT=ELwB{3<4uM|uL+y=*;k7<G!H+%we5i+GIXlc
zEZgyvo#D`ua<oJ<vcA|o=X(<?6!F>klX^Fs+@)TQiLK$5p=a$e3kQAAIA^s*?rYMr
zMW0Z(-$K^PPcQL0nvlWGh9Y^F`fN?NR9VMH1=Mdz?KVOT$~A|a2+o5OubyMhkilRx
zOM-QRz%P<C)|gVQim|?XTVPt023dJ4_9*?kr3vszzR*O`?hfYo^x7_#|C+gH<J?<$
zb{;!5-2_Z}zc0JId_WXJR)p=?z6hnV1oa(81b3^Z_zzdYe1;aS++K-Lm{0#<`P^!c
zzmmp*K;w`5-0_THyykH=$Wiq_L(b$MTjcvW5b2!S&HtYBGxo!kTeo4qTfM!K`ohNh
zf!f~ShA#yNA(3mqL4FIuk}hmo-ua@Dc0RdL>Hm5zWO;jF-QUmnq1W`)$;2E^_#yH9
zF}6&*bSX(j5Q;KPpC<V6>kPB|!?Tr@Jd4~5dK{&ve6jMYR>1^DlPK|9APQbI!m~A{
z17}bt4o+4(oq*Xb)_-1s2%$bXT@;jnY3x)?`IDL(rVBI-uGgY;sQKM4ienx;6HmDS
z70*~+b%0UZ1t*;K5XRlM`?CG6U-AZ^IwUlJo@o%g6zhHREK^}?e{SBWOgn?`0G%3+
z%#o00AT>y{2Oj@H=p-rnOkbkeu_VI1e0Jw~vQ^XTK~wFr>fHpTQIz7vIIT1Mp{Yj|
zsibAan|@t~$e0|TJSj0oNUhRQulF~|qI$rX<XlKAAupL1hH^;$f`)u^Na$daYPGvy
z-@?X5Ie!M2vF*ZNmsq<|9hZ(RVAYZ0%le3yWD8idWqlFM&dMMqEW@;x=LY}evR^WY
zY%p&8g{kG36WJ5iL}}S1z=v0eq0fqd0caQ7D=4Q%gK-i#fW{Z?=y2K!96*~aAGs*T
zO^vf^{h8kIAyHynr@NIwqf((?Zlp%h68I6xM!9i&INMEWh7mWg%C>P+`qO$pT>?Ax
z2DLnF1XtVj;Ai10%S+NRiMnVEd;C6SYnS^v@!ED`&tb?IO7-QP`kVCnIlFsOqW?ga
zl+In@NY;(;XYQdGR%c>^^&L9v3wF`m*U292=;RDrMxSY|V>C%kZy@Wa9Xrrg=7m<h
zlI%liI9p-4;QYPO{vb2Y!QJ`QRim`JlS=(G<2%)c0`Z8yB4V?B++%izev+|v<3r~Q
z(S(?kf)mQkka`;;#UO(ULc2Rowo|R~YGjY8?Sc29(`&J*1$0XS@Ue>;{={?dko{Ku
zsG#`hv8mf3UVW=A37c>%%L5QqQ4^mdo3Az*x?3Irp3qg5uE0}%cHLw{*;-HT4J;HM
zTr3`2W`rb#51^Q#+CzA~63kKi)h|9#;Nme)`xFKa3bc%29fQ?6QXNsCu-@IFOkoGy
z$F#>}RELd3u7~bmnJ39<1`cFIJ27bQ1Sf-WTCoS0Z+^?Z<2IfSvxfLfTR>xDhcfw^
zl+zB}_>g<SE^LMT*Q}l<Y5jyx$B)%jTI0%-@z`P9>K7Mtkisgi#`dFX73}l)h>D*O
zmiRn24XQJGd`wjTAZ)y$oT4loQpL6AThN&+Ml7OjQ4VJ!-4E~lbyf2S71al_m3DUq
zEmqdq7NgR#`cW%SIcu=cH%qnxLl$_GM_I2l=Bn2tKl{6zmZA+3p~WU;{GTL6`ts0=
zZ^XJz0B|&p1s8?z{qDP_;V)(~=rRtSauaCDSA8n3O&nXXu#q4&DiS`BK2S4Z`yirI
z7zdz3*kAT3P5eh$qX7%}BgLgGlbpdk3$;quR@0DrAwfv5w(>t0eH7V3%Q4U)y0vs!
z;SNX|<;38yEa~*usa`*EiO+iQ4t&xNK#blemd-OUp5FaQ1aIVTuZml`@FN-Sx}*BH
zbO_y=L&v=}Vj1U^9#v~e+5OjTdEquw^_o5&!3Pc6e09T*r#{!Ly|2}EULm@k;onhM
zdTqUNW6u4%zX30_;ynJDMqLwI{hhYjqFc!?P|;fPaZ!UoUxpoyTmQgBUFdWwAth?3
zY2VJR<}JuN?|xRT$TY~{`h)@2v!2H{rimUMzIm1q_=m7sVw26d(u5TL<c2VSQC13*
z%sy)&ZH%?r4VZNve9e+gVsNe|3h!=Ltr13BtS#~$67>SxZk^3w_*9y`JYYl}DQfB>
z!b#>U(h{P%dZJPa5F~?sZ5$1d=grXF71ZT#3Z>wI!dT_P=RKCK5;)zmKTpQx;_sfw
zml^WB7CYp`2+!P|HrE02E0Eckbc-^fr8Lucz`BV2h4|{YhVqfr8`^0}+CqW?H=OyK
zzZrC;&IvwSBi`D^>P7M8v{K52s(d^DTgMEV>ZA_(T}*5Nc44m1;vTpl*dmO&ZK=@O
zO}uucWTf5--rUQav}iLCRZ_ZTOGLMOl;McME{<}#%Qb_r)FwCI!YqvKz#BGj-ee=r
z3mD)w4Y9iTgXBoI0WdV_sGr)!-=Bl1L17JBkirS>!^5pWYU-r3QoRTVLHZ>OZJ)r^
zj=5DmL6ad1vq3<=|AXLvxXEX*6*XkMjS&d%ONH$ohDZdIOnBlMu;S#!VP!QT9@5nr
z!P)ogs>D5u2d$+>j#1wq(GHGdGZ~t8DS`2rMtz}6b<isJ#F4<3VWwW)n7oAOIe}2G
zoiRvAmbEJqu1E-#X4Tje!pFr8xyBWgUc~{2H{Ll~D>@$u=nbHT^?dsw<rfEeSzth!
zh^C!%S+QQ7WMzSDemK*{vAHT^)aiMfGq!z`XKWK^lN+sM;nZUO-k}J_1nF2@K&uOW
zL9XR<Y=FSy*B)8H)18pUO6(V1$SO*ajHs^s@mtc*XArYvzj4+(F6(+67QP4hiC6C@
zW0ps-O#cy;f&qqJQLQB!0}6YsScT7P+M{EPYn6*71}Tx_kSub#p5)7w@lL@_qAf|v
zCzTEJe@KH?=DjkGU2?&A3mM#05s8Mq$Rj^vO$}fVzI_&kgSj*&Jrp@c+cY*MId@Z`
zC8?;FMrOe6J?;2{r5BW_s?=a*P5F@tY8Ib%TCsZv&7H}Kah@_RQKOcoIo&R*HV{)8
zTx#MDT^v!V`=lv!rebo0m(>3`8{ZK^>V_Xzx%oUwE)F=3iCO_&p55xrmyx~`*MbBF
zC7;oNQjF^MDtm+pE%D7n)dR<}yqbG0u?S`X??)UPn@E=dmz&-MA<+!4ySM@aun!u8
z?-~fp#pO{uX~&RR(0OO&9%7SpV|02smU?wOuSksG+1ns0@O{N<oaWVCVPZu>Rnw2`
zYN7>6*}bF7p7KokTJ4F*xK2S!F+2*@NJRNnwZj_KPLn#s!064rp+aJHHuVp1hd)_g
z-`ql#G=7I{<afu+I;6sy)4+*EMjQ9J0Mir3ffI{c-o}@^vo&IkPd{U9+N?~#04p*l
zH$^Ml16NsPLo?|+)Ug9RS2txKxksv%T^%JMbZpGWJn~;SM1btYMD-!0NCV^t1}v=D
z>6hLVDGJm&<x9pOpHzz75CL{qwuYGK9#fvoS60<X0|Z>}7LjoxLgp@08!YI%xlQ@t
zA($k+;b<i(6z$F$FzzWvv7R*=SQNss&r65UB33MB;?eN)XPmnZp(Fa)SU-i`km(qH
z9e>-QdhE~5$2Vl^W``p#C$wA}$fE2gz=g0gCbSbM+F_Pv*K}dat21LSq5@r8!|Nzn
zx+R!c##YjFBop*BXEzqgM=~dsH1mH65eNo%FZc2o)Q@;F9l4(N=8$4%871WNtq7(g
znvfk6MM}kFmDw0Q7&U$xl`*h3=Y?#$G?SScgw9q=)A3HZ^4Rupz{EP|fB>UJc5Sd*
zd251Uo0YKW<%(w-pUJ*Mq~2QL3@}G^>}{n{z~wC2;1khdv*`TNY>gSWzn%7w?A||r
zFrM<Yh4_~y{P^nZi_*3k=x;Oo$jm*;J@{{=dDAwIQFlRAr<2o$9a@_mYnXXaq8S<-
z=AGPAnr?#4Ixu1&jEk}|;2G<PBWIAO7PsO?jdg@MZa#}U^19x*``(O3d!Slp+nOM&
zn@YVxx%bQ3Tm+CQ)^9p?DgLgn(k*%YH=hb3hxNCtjcRtPa}+LBH#wpNj_Hk3qIA35
zCDAlxiNJV1`PeVoUel80Z;W&89^`FU#(k)nX51XVsOiWrFB4>hH9Y*nnFYt4``X4>
z*M{6l25p$t3{Szj=}!hL^-sl2Y|F7`L=pDJvKr3)=&Dm|p@ZMWNk(BQ=TnPq-E?!=
z%($<*8kp!YZA}MEV~$i%22r8#)=-lW=P*KyCqj}M7%2$86O?>W@a^BeZHe#*W+T6j
z*oG(!iZS|D$2=8I?apY~m7BA!J<hGlKp2&6_bd0_K&CY1<jcI?hUq;KqeeSH{MRs0
z=u2;B)SPw%IEE9ZN^Yu8RDCNibS(G=pU<hY9*X-TwCMMvXr4kWzG4wt!Dj>r^S~z8
zj`)c}UlwtRw|Y4}0)TGc1DzBmn)20%vUpRQf?c{@x2{*rv6iuGFMP0yYUQaFAE6~4
zZ@6A!{(7!of8-B&n7>GDzE9HrDNDJ?cN68+Pw$WB_v1RPLQfwZ#G1>CW<k*&uR?02
zpYh7!pm2Tz^7oadJPK*lorC~xdlyKJ25^C}zzEL_@d7(F-_Jf}l-0+J9zB6q3B8eV
zLLl@e4BnK-UL02E^C8Fz+yaCZCV?#`%N*EZ62s0PQ)Z7O3-q5P@B+m`>m(C)@X$+A
z!HK0u&OIhh)iPRb#`mVr2YKV%I(__|NTE0`p3M`oOrxtG_Fh5DFfV9ye#JypZ@89w
zo;Wt)<+5Jb3T5CuMf}=qZDYM_X6d4)+7Ml2Cuc#D32(71TJ>wU6`WPCZ<x;imf3GH
zs;N<P4(BG>Lp$N6I5|GN`^)xqjkV8@aO0b6HGYXQ-ao&l-00iT5dgNj0}dJL;Li>q
z2qhOf@x>GCCNtVLFRXXaV8jbge8VU=%P5GC{Qk%;W#>!1%#e=M_+^fLyT<qAox_dN
zc6RBAqJ1r*t(Yh)VA{&V+r>t(HzlUGS>?aX#GH1BOmExZ>}qB#T3vTya3Q!A;bo3K
zi<tdo%W;=T=NtP-Y!=p_yRtNQ6Hn&fQb{49&XFJF-t0V){X`I2QP9b#Xzw|)mK%0P
zx8n1bO07&wR`8Brv1AZbFju%frJbo9+*>W%dArSXlD~-#Qtu<8#F}ZcakoA9@IgsT
zG{|UDzD^cKNx3p{nFFR>;|E6V9;IGYCY2X)ygc6~ja67o8KO$Mg@)RA9hnC2Mdh(V
zxZ>4I3&;^EMvOLkD5Al$uf7i_WrSi^dl8gdGU0e^1`d^B0N(7=$}xJL(+`f~A;o5-
zpSA44D3XUmtxgW<z=z8G^5Co~qkucG%Rz<lQl-O=<WBPq<4*vPa@G+Ch@YPs`9y%y
z5UyW%eysIj<uW}eUfG?*N3g>rd+OtN<vo;UU*-4G21}P8DL`xWi;ol&&&bdEv&G9Y
zE%~GT)tY3M-ib3Io>9~Hy~tM-XuqYz>Q(-hnG=q)B2L4LORPRk02LNZxkkgc9~lqg
zT2`a1X>!T#4qii;1sFnLnwh$NRpJzugJ2)1yYQWIMH;m*K)LH6#De+zUfVNc`NzGL
zEh~i#u23(B<^OdiHq|6m9s_IAg$dENLL5-py&*Fn%{z>3Uop0nyUKK!ouMp}kU|AT
z3LPP2m<o$$l*3ZoDj~zrL18WNGb@4%WICp|e0=O=SnVN%)S>Qz8xKe3ORiWX#h|^#
zk9M_K*U0>S&C0VsiV!8N!{~&tYWPc1=RlRV{7?kodi)VRT?Jf^eOuG9%s@c-)Q*WB
z-1X(EPG)@W)%sm`+>hDh9bb_~v=#WQX&mpOZaumx#i?Ks(Bzgp*nC5_EFQ~yt<k%z
z=cUtk|M`fjaTHhe%6X@us6p5-cTx6O%=atlvP^u69|F+gXlI<^ievL_u%RvR^<d78
z)9^m1NcR{r$dvMvvW0Sav#3;~FNhVr{LQSYZUVI1PTN{V8#wGas6&V^(eRGmMNkZC
zrWiM~_Rzx6x_dhy+dJ;8o-)0`_=`ax)r<4ZKxNvPiLZSCmVo}YK9FpSJnQjqV5Ktb
z|30kbKS9f6tVq>1;Jx_16EeeWcT{?J3s1l%$-a*G#{r&st0$JeFov%Pd*JKmL>?k|
z^5FAdhP~l0BJ$+Dm-wgdAlF!RyGG@cAFQsVl}z-Hx=#Dqdhj9!K+$DT8zdxU)v5Y)
z)YlbCYlY);*L=$okx#IQc)9bDpEB5x(&7z2MMj8GuGEY!><`F#gJg#{wth1GigLAj
zx!lnh_fYyEzDP<k1ecNZZQ;|pBxubP-HlusZx-8c+GO&YWxP3W2a%#fjYc7b!}4TX
zMbuA{X|Cd+qW3o?{a%+bBnp)@%xv5*bUqb9;umQ!17=(@wN<G9+q_r1PlYwC0{Mv^
zI;PRwXYC#nJ(gB)DLp=!BWh|=)EozKQ;{E3jxE{@MY5UV^z4*U^&a5~c3uUv!OGGF
zGO$(jOB_5DIP{q{S<r$^q2u$mXIdo5#%N+=aUq)32aUnsrK0Q|{fslE;D3T#XGFp}
zLBQhf^qg(is=ECcDWCAj7s!s^_R$uHBNy;+z~P?8-t2?OXRM3&OH;1+G1vMhG!E_#
z^ly6T6;n_Q>*q`2Dd#8pl={z<cJRL(#AB|=SFo5O2H9CQSXC-e2)9C>q=aUrhwJN4
z{-qro?li4I{o>z4IxZzM500LM>=b;7M5`0BB1t!v)J%ZV*g-zlIiOMDD^wiF0a-$m
zrdjKi8y_c6^0l51^6Nve18Dw9x$JoH)$d7G0oCw;$*d?}5uVg~_EF1oYZQ%n4ZA%=
zyF{!&-<I_o19;Gle+&*kdO|rS1qfxRh!isd?m>>9ZL^CKXl}zG4b<GKKps<0G)Ya8
zjH9m{L#82{^#yr#h+a_!zGjp~p%hA;!h|e;W;SCWFjFQt*$rEfl=<-G<u5EpF-&n(
zYmg||{w1B+yP1y(8YhiYt*51m#zn9_YgI0z6axxL0h)?OMDvSktQBdbe2RbVd94I<
z!u^FJ#@5p+ti$Q2Qj?OAg1C#ASWbb#6x~*V0@$ocgnhvoljBTYaFXRUu1=+K&c;Ug
zj@!@?H`s)H6)go%54xgAK?3k=*gnjN@|a!q5T2423Qe5JI$1McWK%aMUzBun<{)*L
zVkeJSZV}xgyyqtIhQ_v;V&}^^Ng2S|DIV&EwsMvLtfvjIPCnc#w@fNhL=4qZy5X9@
z?0^%`l$-K}PF6{bL1mwteRt9FfWcnzvqki(enr{aQy@+#V}h27Qo<CQHX}xlNFQiB
zxNePB1nwvB2u(x$e)~8ThCx-p%M66p1;YV1LCoHWPecdV4e}o%jvOquFnQtXdEZ>i
zcwzJjQya`T74dNQfj3ety}-!)dQ?N#5GiK}e_cBz+x}KP+cfj2k_ZSWYaNfKoe#!;
z0p+v3vo8rB&Mc5NHrQm`Z+Y1mHhZIHlpc4aK`wAZ+I=b8m!Fp|yV1M*nCEos{7UsD
zGg>4!X{&!%7&=<S0x6z-<b_?DBeW6C1E*Z}s5KT7E`x+n2M*z_sCK;*@UR*r5=r;r
z?YYKufKl)xbm4>H$V}|Q7QIe4pu-I;m&psW!s`tV@`zTso37uBZ-zbv=)`lnN9b<F
zyzMy{I96k6$0fQ|6RFZpX@!vN<4BEvkpq3xJ=h>Tp;{&WZ2f?-9xxtdZ|WNm>fIfs
zjU&@^svpGYql}-{>D$S&y0Do<lvaG>wA19~h!g0=1q)t6D@yp2rCHRzRl8QR0KQo{
zL-gw}k34CV)&FF|{r#m<e{<X>iB{8v6y|?c<w;nAH6J=r<$m;Po>nK(e|jV2{H;Nz
zUT4!Na)gG=V;1UfSSpJM8QyZE;!CtADuxn3sZ3Pne9n~kHBp(FzV>$pZ8CIX)ZZK=
z?D|sY;$Kw3=+`5*Vx8`gQsY}RM;EnF3o?E?doa<V&Q`l6qTKNMNaSzPujHB$+M{-N
zwM3r0n&;WfL(U31X&6+K(S`bjzL)DxXb11FJCPrfhWxxGxfwrVAOU8L_gERzF61=h
zRSFzog=17SX7?c^%Ovw?NYqcN$j{oNOa&sLyPH6QkKssEeI?#eMt-mQ#`!{YRY)&b
zr0z7*DYrAL-YTHAWShHC%qHB~VI#Xyh#@=F;xfoeq7|>xIeap5LvE%|e!O?csn@O-
zGqGLRc8vj6TlSPkiS$ynr)lQY@D(fi^~Tcy!n<0lE(W=ry-R&f^gkaN&ir{FWcOv<
z8@F4_cg+Y2uAfw{DW##*O*`oERc@vUXWeu~ypOAf`UIQP4k322KDLK{T@}?6c$u1a
zP7!!P_u_e!nYO^~th&yr_^@*K!J89=$<hPZr?rENviXDx0_YnrurO1P0de;tk!H<|
zb<qeTMq~T6s*y@9+$}}Yetsez{v9e^Gb|Ev2~KkuXxN=$v2}W}t<%7Sg8xLyfs`Z3
zM}J@S-KTjJSRTFua>h%G@A-h*)y*`t-aAgpzY5*vNH-tjIn!y}qBXf!=E`*+gSz9(
z(cYkR{5xEG`)STKDNes+@tSXI%5x#t0c+Jheg}e}Ql|iPC=+t;kb8yxmQI^aS`}Nb
zvqG?=rAih(IzGbU2@kvGX)KH2e24|tJnrr0aqEwC3%KlnS53t!mSR_Lm)cm}DHr*q
z&sKX<`^Zm#;^S4o4Xp<d&!%aHJ==n?5Rb{c0SVI8&~q`7#j>bi6mg-I)A?x?8no+g
zFGZSX7p+H8Kb_F^gyl~|)@>#uO1hYRsa8Fus8lBu?uX{yi*KBQ0~C82XO<ZSq`|Gc
ztWmmpoqu;C5sdWn(<aF|$s?rvVl$C?=M!esimL0DfFiZbh|yNTBOXo*a4RzrQeE+m
z$l~?PP*mWzwhJaSY#^&Z<kKX6C6CL-ZTT2k`Ek82ETD8V3zA+nCH<Bt$Tqi?w5N}%
z#G3BPd-jP#%iBCHNEBv|0`Q{_IP2ikX!`<;F{@R-@wplJKv5XBNS61MsF1u|k0k7`
z4~Yb<m4k}&4`G{bY!|W<<++YcM0hIPB{y5TsHmIjBazVzRnp8j6O^Pv(g28JEL7$m
z60(1LN`wccsm_Ox><NO3I0WhCV-X^%5O+S(<%zH-)CF>;+$|Ck_T1fRMIZE0J)a^@
z9~7c!BMwVO^9B_4_s8tlZ1|COQYnuR*D@wk$ZDOp#>m@W`}f@-4!_4pRYGljUxh&*
zsy-n^=JWbY4bdkuYb|s+&{%ZhQJ}agKqQYWl39~rL*FaLXPmxy9zlcGo&9WXP=gaT
z;jzZxh-oxk(J#-2dq99U8^)^%UX;c1_n47JUgBwuQ{R{*qY_#EmnGI#%JmM4>s4GL
zSg#5Bh7_+{)WRC2?d{-PgG%+Y!}6tjaCUjD^`$ATAeYy!MVIWs#WUyv>dMZ%ZW3k9
z<Dl-UrU}xTC38UNn34?Q89kR!&gn@N$q5+VcV6??#ihn)m@zl!tbH0jH1koFrM+`f
zGkj}y1lQ5%(H{y+f(`2K!FF4f>YnG~?35cNHII$njat>6ma<G{l(H_1O5@KaP^C9(
z`o!~idZ_xFHN}+Y(h9F96Uc>KRJouS$K%(v3W!1j;~7|>ksa_@*J&YJdWy%-T~`5V
zI%B6<?1>JjOik*5*2z1)<yeRr1#!ZbR7-V~aSw={?x!@Y`V)oh#bPtuodVc*2`lau
z+VT<C9Rc7Ya>c1`mBEmOr<<!;G}l4*bmRtVGdh(>aEJ<6(Htefp=b?&m(;VCu45@}
zY?R7&|5614{ui41pmjZuTI^7-*|GMu{RD#NvqpeJf7M-k4T{{SjLa18Qy9wHFA9C6
z4!6+Q!7;cc1(0km2U?941zukN-~gmhh}Ve{IN_*l&l#)5W&vpd3awAjWtXs8q#WgS
zFM+Ms{en>#wIv6ftf!Fb=0T1Gn=z*A+yB8$tlb#StIn@k&cMn03KW+}8PD+<oKGt7
zF~gK80!RtGt!9y2v14RJx9$;{Ia+4&=yZP>RJ96AG=tty>tvdFxPv_8J?dagOUAj>
zGBWj8ZzzERXT}-0DULL`D5`E?5if`uE^h{!89&cD<YQd-=rm4h4{1$vHR9R7nJ}Vo
z_3_kT|MxYU<P8v28kq@O4-pRv7<7i})7-#lX(Hy3#rK^KZq(l4T7%Dw$);TGjCAE+
zlGOUs2U+WfpJ>7UJ>_sN!|5xYv9?J$uTkDOz<II<ku1a!b`4PtvuN(7basUsC{qp3
zntTy_?ke_JNiKuOU)>;$U`9@W+E`)W)z0UM{2uz%S=}G;<7GblOTBqV?wxDpTzO2r
zB*f+YQ>Y~Sb>o}%80^5)Zumap03=`5l0x&n01;Wn;8}4kksXcrTOsmRwuZ98wi77`
z8%b%RrRSee7{Dnziy=*bMF%*YS}s@v0dYuL8JdY5LbRh3u=ehaQk)zeaay?<bm-SH
zHg&TWkG(0-U%S^P%s_m+Sov63!0QUKuh6F8oxC#cr~7ev#+Xna#0y%f*7!GL*;T6q
zry^$!9#<4pjfjV>#k?MYNy`L(OmYQ0|9p*-k+v8~n7$r_NifV-HYl3q1ZjG^i!z4I
z9rc$>JW}#u1F^Y)I&!3jw&s;oKI?$K#=S&Bh&jhfy*MT|{gS#EzQn1%Pw=*i;!9T1
z#x_e&d?WqzGIvos+8J98V!?mEijvOqhR3A8U$cuOU%e1xg};hLxPtgdgp_4JmTx*J
zV0G08o0VvEBU|d_y#1a0Vd54ZqLFAtzrmW(>XtVlBOjpV^Kb`&&Z;O(0A_MnJySyD
z5zsm>7LOsg1o(W$Xuym~f-nqBpsi1c(k0%MAq4Y9{6(QbrX=rE(R$m36B4v&#*kmu
zTKpShH+>;E31~<f)#R1^8m%Ea(m<Msg>&qF)rcZs^*g$ynjjN3+kPU=e!f>zE~9pr
zVxN(;_sNst*Cu*eQH=RmZ->r-G0*(C-bH;Lm4Ozqos+Ygd4o39xeos!XmKDWhZRcJ
zbQoLzZc2r|82(M{Ab-T)IiAB;rMz#@#k54UJfRorB>JXf%|NQrv_r$($4qIIt#ol#
zd{2Y}?Q=&Fjd}hhl*ny4bf-XjMFBAlZtLa@f70U6OfA!_omti?*UMMK*D@!&Ylrei
z=~ty~rI@08nCLFtm@FAYmt|r>Y|tY`Ei8_9?MDmiQxc@R2@qY)0%wXHI=-acB%8I5
z;n4j3D%#?Sq_O8jk~RoETi}WfrLl{S(sG(x#=EaE3$;}qK8f$H%6g5#9{G|II3sM`
zu&EAVwhU#=TRONUq&Wjazk!$3p3`y|&+t5?+@+KUn#KzEpX$cH-l4`R!s@T#p(4U(
zDg=X_avz7yEi?jU>!B#pT0QPI(1EZ%U3*7r_o7GvHy#<~IGD1lK4`!B+D%XIF*O~J
z-jS365$8I8=6>9dl*pY+=R};pY5UQ&0}W&smz@8MTkqVlABZ?-^fgrov*NX!$LU;9
zz#QC$cteP+oFjT0F65A2w=!;<A5lCxSLFM35|Xr|7r3NkP_;)hcA`i>cQ!LusMn4j
z3@*OVv7Zx>eL+>X`ktSi*A{y<<)R<abjv0k^ZX0y_*07$h<7gB3269F*$pm#Hq-NN
zIP078i5~rj7TBwjPR*{;ExjqIW$dJ&{wGXyOtj$kSrGaki0TK-X7xIvheX9DY>kh?
z&CYIMQ;GE}oHYn^08u;(Vy*^d=$N^V0OFvvkZxlW{ZNW2u|5=q(~ckz^zqi$qnK+8
zLlEu!rZlCU>!LNHG=XR3l_KcC={(6>j{E!gc}i;*a-iTqawjEQsSwjr&iygCo(sqy
zzGcAib}R2pzV%AA$NiZ_`6pWK+%NKuef*YdJJ)f5Rf@3|l}3$)m9P_)1o%ULrz)eQ
rKCe~N;s??F*+~8Si`P81lw&_5t8H=nMoCk368vrFKHJ>wZkPTS0oMJr

literal 77942
zcmc$`30#_2zBf+VnP$4?wrNb<?>kOv>QcuVH6Th?ZIe`M6%iHbNR&iO3?eF`l9_hW
z8U-dvHEv)NYFt3565Mb}Cqd!{H42DpA^}tof<#bpc^|WMzwiCe{lE9Vem;JlhjR|+
zoab<!bH2at_xC%6ABTs%_?*LYAQ0%q4?lSC6A<VR-5}6YFa6;eAf<CQ=5ye(gYZe%
zJ0PyaX&(6SJM7yZy$u32(Vt)c%kP2D&z}AONdSRfy1D(oqr~$iM-XVM=EL{ij?PKc
zPrcZpYN2uOMwN$4oXGD4R~>`4?`8b^>ffIF@XNoY^%YbL+5&$6H`w16Pr9qWDOfjc
zZS0IM*xImet*_~L6x7`pQk7rCSuU66*Co6DOSgqVv!usg<&^fU%XR`i{o&8$?>@jY
zf<WKVU16IGJ3wcGkX>ODZGoWcr1fdwnXd0%zmWfDs&AM4YIBZVe4pl6Q_yWfD)|z3
zgHP^DVl*#fj`9TcUQAI;CavYXa*QqVBX8#}Ctjlt_BJ%<Cq2&h$V^PjE@ddjg_#DP
zb@zlUv0W?E_1vgC#mcEoTjU1kGdQT^YvKb1XSww!70T6yX36;tXln&!PjFZoq#!U?
zGWI6F32~dydsW4IRr=|ZibIfDJ-$~J<I#4~q$zIV)|dK%Cw=;97QBQMaEiieZDr&`
zR?9KuOW8)sS$V{SuoJgM%g?8dO{=GD)t8q?EN@KN5OTiBv%r`&Ep9c5y>W+LW21`a
z1py@@{@Ba-f)<HkJZ#QB1?tn{Cz0#~<uTFvr%&8#($@y$V}_kBiDH^38N}(grS*%b
z^y>voelrm&7lcJCqbRAuCDI9)Ao%VL*_6bf1rI2O$<0~n{8eT@Mj3Gu0rg=F4X*~_
zI^&?c)>@bkV<tk6?n~8@yHceQ{01c(H!i5=VPF{Hf<G1~<@D0;3)Y#Pi_?|Tp2`&m
zio$rLmUz2+c$0C{oJ!6PMyyvgrC;0fP%?A7SE4HAafAdr+c9N+uftr#$<d{mW?QlU
z_toQd>Yik)J??9m0EIkK=~sy*i}6CaUspx7SZY{AVVBI%^VKNbacZ247OQ~7u}a0O
zN&!tCQd3$0bIYp6uQRN4*eYh0ULD|4iQ%N27dKarUz1m;nqy0PES+6ud?Rzl{9sa^
z6aEwkVnR6YaKC?7UyyV3jN(4!EfHzc$18DFIAERi&FksM^;Nqq$fV^F{$%fH7sopj
zCdiI6idpL$-GALO@7n4d!CIujId+u%I(HbiQ@#Vl*xZ~Qn4137L)(Nu=|MX&!0F}v
zc{~bJp=zr0#HwZVLelt7*DhD1*eqU|i?bCl>hC%E#zj0Tp!GtLuOW)D;DvDMk)R{5
z71{DdeB4n2^y+L|>+ygV%r$23K`|y0AsJ-5?#7tXHr&V%XT{Y}JPSW$j=kp4;~AWt
zWjSQWqsI*?@F(HQs(nR@*Ak826ZwMK*v^mzeI5&UOn1EV!X>KnW!zkaOHqu<Q`n;o
zwNZP+2r2F3lGw)GVwIqR3ZJ|@?Ur>`xx!vi^6i}MrCi?9gSb!!1(c4OFBBXM>&4Kv
zJ0moFGSHy6Ub$V7gT@RWhZbQ;LCpf{<9>cn#rB50$yH!QM8;2&8j4S#G1y}H?J`Y{
z*FwL2AwiH#E2d}A92#qVhfJ}fC4?BOamvj@N6nZOjI>$(eTwX<VqgD(B2&(kcRZ|j
zR?wH^32|>3JP(YsW9!uv%<%4z-SfIgW1mgAO7wEfmO-QXki%Wgf`f^Dj#S<p6eY%_
z2Dpf?CC8{hXPU&Du4w(G?yhp&NZ?ZxmeqGr99Y~YR|dXX$s3XvLz#>7tG@1<a&Fa2
z?0o$=C1oSxA5-z2Fz4!x;^jdX{$U#5_hhLn2^udoW5NghP+;f0lZ!UN2!3Pr!=x^O
zyr73I{*z;?-H_#6+R=&OWhhK@6FO2dvfof+8x!<N2)$_$7Z<VK4kD_UFNm>;OxeTy
z6?-_eRTEV0w?=wz(#KH35XT)OO<y?_rpPR*y49NplOj6K21>I-un$I*(3AMdoXJX*
z>mJ1|xv9;v5l5X3TXiVmi>eMy&+AEg$ZnM~#5WAt-FjZ;5E8I9KdVe3Gxu2gEtL#0
z*N?TrSh3&ezQ(i0)}I%pz+jB&bUjwERCP;LQbF<H{dK0*f_X8C5u@@IbB8>Pj--!@
zw>YD(Yv$U-RT^3>t;GwWXi8B?9uI(DsS$=jE9&)_CcXB{Aw{X04D>EYN(cK&Gu4B!
z-CM;QZ8Xh$E>ekKQu}!GWE=Arxw1s8Gzl~A1zXB#VQR%yW!R1k?kw4HtDK=N?%x>7
z;8YK{N%0-bhAI(fNuO&We9>t1ZYB~>23NE1Mdx%&mJ6VjhDdws)hxnnVzwH~U?_|q
z+6opM{OdHY4=CYEscPJcYb6+NDH0k54z0K?dz<MfzVXmYpfa0cFFK~@gOf)q)#wvh
zOl}w77AyOUNP{cF!L7yM$d>S{7otiSBSZr$h3w!sk|hHtdQXRO-p%6i$*sO8J4)>v
z_nMQ!ziPZ#e{T{Q<Cu&YpC<JvH<hc|(mHb}nL1Y1l5>^I$LfxGfSo%Gx-S=)<qQHx
zQw5d^;kwJ#i&MPemAOq-XJq16L*{_p(h4=*psibQDAih_;}c0P(q29(Yf%@IjGGZH
zq@n!lIwnX}i+2|f&wOH(IRsoiNtAfPt#Wd%y1Y7ipdp)K`cN=vp=)_e<2l=x*uu`U
z)7(QhxWl9v?4X9a@NpM*VAxL4V6Z1#anq9iz7UejW0Sx2J=qkhT=(+PyvHWA9hP`H
zgX!v2TWMU3K{to=LdSC=lOuK$uB0)J?$<uYG6UJ%zrZk55C1xOy$3gNfu31i+i!Ug
z;3tG3`oNy-i>Ua#nhYjii)M&=uPy2$lW{f@XR)rzIG3L}X;rRranAfWHjc+B$m+7~
zd-{4H<N+nG3EezyxLz<%o~Xf9p*$~kfkhj$EB3~MG;Uk1eSUbiZJMpGN_4fglTS4Y
zT0Me4E5eCPeumAl%;47~8XP$=|7e$UvK60F@OR_o%!qW<^y*jw2`x-C?em<{!O2+-
zRTDS}nG2Vf&lgO3@QMygUM?{sQroZCawcR=y+L#B)j69-t+=oIt^O82@~MUP&U{C9
zQA<!A)Fms%v1g#1DmR5|bFT<xpHyF*ev@s=Zj1M3$maHFl~Xq~B5|ZE8fbN6EZWeA
z%Xq+<i5c+BkMd?)1rDyOz1o_o2n9GRHCjow=9Q3~u`RgjbXc~O9GzT^V7#xJ`-nts
z_C@sJWu4DWASOIl60wq=sL%A9kkq;?Ny&U%?G=m<N~Mnj-KV<P5YG0t8e_UaS$VRA
zdwKD&vOvz{>U`g($~#yZWv={wo>G;%cz|JR*frBp+fqAV=o=T#Be?~|M4yw{pK9-0
zuNBjYRqYsO6l<xCq0}9KjU1Os;v8mtShnLq4YonvH(I$RGuOwmQp|jMSZ3vFZ=bc2
zmUMfok5peAe^ojK;mJnkRP4q1Y15=^<J#Re4o%K{L+Flcu(h*sCv3l)>dCH-sdn!S
zgVmJAg`GUCiXr17_iLY}$Cu1#BN_hp{j(%56B)V^I$n|3aW(+-)=&f*m<Ly!)5B4r
zT2tUFozp=s7lpw-K`X%~Xg8fj?{g3Fp?_=JvN%jmDaB{ShqCWkKi8)C56b83S{ox#
zT74om*?*sD(w$*%yvy6sDREA$+!L|FFn<*n@}0YE=@!BITtq{1jAvq$k#MhF*A7i=
z`^-%`m3~Q<Y9&@R60I}OPf7Rm%t-uY3|#w-g=@LAV_>0w;^OjiD4S7!Cl#g5Rc}lQ
zO1FQ84N6|5Fnxu!%TuU>XD+VN_^$X%goHjr)6(UXT04CBB<{hAaqTN@%_2dDS&Bx{
zKim(S&>d}rsY&+4YHW0Nk?^p@uo={WyC2T-!{vur<6qX!ccf%b1vyL=O%rNLk&@%n
zsf{IW=4@-f<dh=uVgoz%Tb#AK8El-j{)4d^rQ7&0)OwX@A544e5@Ti$)Sa+49_&Uw
z+97vQl3b2;$lLqpob0S?G{fbE_|(<ss^bP2=Bi*_t^Bq{;Mes@%`-w`92Id4H@S!x
zvJW#n{3q&lBQ8Zbi9&9t9oAY-U4&+b5kkEHsKLTfose42R9Du*i=dTO^!lZ%n@h#%
z2a(~u6kl9r*NNo3U0Wxb{bv)IyS26mzlH3oiIobxHxA#WWXcuQZxm%W`dw6uZN4Ti
z7GWiVm0zOn4dz!Jg<cZq*ZsP~h>SMv@W#<(Y8l3RDRz)=rx=u*opid0OCq7Xd^qo<
ziJ1T$Igs9~nUC15=*xK11eIq=?&ZO@?1wC7@a9M|UMIGbI$Qe<1GAfcEwbDSO#a4v
zbB+Q6XSZV|7YlW(aSaz(Di)M3?jCOIp9Lyt_Uk%VJw)l)=PDZ(Q>|<m%FcDMHWR8r
z&QN-<g5^nQct(|`exK`9CEd}8pfv0&vLVgE3^8T~F42d!OH@tO<&A3d?7EkWqRCDQ
zSL@ayvi}q!^zjSgEu#j9eYH(#Ubp?PQAYLaVXOA*wL!1YwT0Mvrebz&<YuRrd(;%6
z*LuJDHJ!LCui7j70YAQFb9d?q4sR97>>WHX{lDUEuL}|u_lole*OU=~=Xl4=vl|FS
z;?%^;AuvmcSO7NS29KE{hp6Ht*lzPR5o9nm`SEl6Aq(VmY@zng({z}dGkr)wMETFf
zVP6}lUiOC#jFc5BLJ1gPwU<aRvu(839nIBEA}~L=kp~QeF|PKXOT<$FGpg|_tAEO@
z0I5#Ri+Q@WznqFY%JaiJquw2|=rm;U21i6L&WHEafA2q8hpvxun&~UF-CULQKB(=p
z+^%-RN8nibhz4!7n%c|ZB{4M)((T?TuHwoU+6NCPoRHX?1Xa~O^x_^$MI?-yJfwIU
z#MwydIoS1jmy7z?!PX0|R80y_G|7QEM!5|1Hq1JVzsaidO7Xxu4<x0$>T0jXnlY#3
z(%vg&x(B&mT^yb~T=1%vT!~b}L#}b;f3CQw7U55pM~2(^m9){4ef`eSk9W6}!>1Q~
z?S~Y)$na2t=c-=`@nD#_xvUW1B`*cP=@Osv)kV?K{ag%kuy}S)NqYs0gdDu7JAN=?
zC?oS|{K0{~q^qycF+4lzWtjh|Bn~8`Bg>Zy^XFzBtsLm>Y*&`C@3ob&e#k=(9xq7F
zD`6?h%h;J|U$H_-*jc>(%V7r;zE;J&xQr=E!JOA{HG{oJiHwp*$t6xT3RYFICT59s
zD0?)p0N6r#LaO{pmm{l!794xzn&vWlQBbj5{`g6@lY{8VnAd2@`8`>zmHy+*M0&=X
z74dzpg}R%9W_&t6fl-K6c?>L<+N+QGMiuH}?Er}Q!Jz9h6>X#i4HbF&^>06(qRA^I
z)O5ZK_PCjc^JSnoqq(g9Cef>?JTmW38v2?9qbw`Lu&c&?`lFzSNy_!K$#^G(X?!pP
zVLGIV0V{KgPdFBWS$RVPy&s8PGsOAV9u8CV%~e*nIW~E)vcI?SeLUxa>dCLztA#7d
z)uN`uiB5Erm-sld<){<v0(*AsK>D8~*+^(_^Jdynl9%Jtpuzk>H1T&((L!ZMz*QK&
zONM#sG2wv7S?H;JK%hG;G_Rd_m&fTH2Z5vyRIM`ws)*bjKd=%Y(EUTO%{vtQw~N*p
z%9fPZv$>|&Bl-GYCqEt$AD}Y`zSU*3!R;q4fS|9S^M2aobvKh}?|)uk?7m7&r}*nx
zr9YO<0={`iv+~Ecsts|QCb27}^@E;Uz7wq%M&7oz=lT#beNw?$DLg*{RYE`cC&wa!
zpk7%v(PuiF&*RQ4;73f6G*Xh}Wt0vsN2=#m4v3>O5)k2{^Ms-3?S!_L;{lqEjE}>d
z$(b-8UTpd|&5EfET3jPsNhoDunik`R8ugKVZ#xt9!yBEQNnPjr6P>{j?#W{TS)-|q
z3#3pm#BRc#zse5I%=_wT&>`b)inx1eLsde)YrenU&O<-=u5fY61KT!$q*m|88DqdV
zP!fl!ngT@C4aJbWJ4tF-&Pu?ed$&KNN?)Eh(sS!CCo{S5@Gllf9huXJWj%u|iI$G2
z2lE-_?93N&E<ve+a41iZqd80~BFRrz$+DwW?3-e+!Bxz6;>U?6y|rI*mpycxjM<!0
zOpLDch@#y?7j3=ml-_{j9eyd5lQqf<vznX9UFH3W*#qEzYIyQGJ+f~Y4^-YSm&g$%
z=ID%%F#=XWa7Xo}Dcw-CWuf1<LbZ4}i#Ci*Q0q&aoLe<bo*c<;F~92N0kfug-~Gc%
z!k>%&@{!JNLI{_fzQnHxV$@um8X30Ir{eT_f0g!-P=aE#w+dx7DzBDMtr@EhUnc(z
zt$*8h?cYhPGI8wCIyP-|NvZeMx2&n>Oc4Z8aPZ|)Q$j&X31h<pvFP8y3peRUmqI#p
zAJ;E>y6V!8E$6Gvryg{|)}VD9LJE(SWzB8Qp@iW+t{-w&80%su&avpvYB*Uz^rx9v
z3mLauv5-5}mEn_YR#l{COO+MaMoCrSDq?i0auNDk&edVuH%k=@{osYcgk<fP*eD^k
zx>1>&dDah`s4mk_LrbYUc-PI%bh&p+zwr<2H*}T{C7t5V%Ic{J_mFDi$JnnuHrTZF
zzpsAo&fj{o-7~e&BXveQCFq>Mtlrbw2_{vpZ6zqzjXTbOg-hf&^+Q<g4HrI>TKl!%
z=}C*BQfv{r1}E)@lvEumh-tw__tn=;qTf$ucv{bOSe{C3w6)vLEq4&BS5JBP7poBR
zjXm_&PygL8vxgUJG#Iip{iN9yCHYX$R`~MMrzw^oG4yWs7mV{W`0D>f=J9cq5T?j{
zZzg0>Kv*{K)YhQ$3iUe%Tn<vP`PBFMPE=~fVA@gY(!r}>mngQWVL0zMGk~R>y*``+
zu!7;@W_(m%`7jA9$CvnL=9R!4q_fDu`PhI{9$-I+aS+1AP+yLZn)$bxjTBd47VojX
z@7)tt)53BpBHtj4VeDP`!x&CdcrwF{jGUaHxsmhFMfCKrSIyob>CyYKXT>|;YIW;D
zNH$;6Wwn|?vE(IVl{+)v%4acbw-N>#Cv~WWzZp+kNcG!1%Qc6sXck$XBUi*892g!u
zARg=;J+Mti`3fA2G0OCVT%c4Lz`2}cu5{O7V;Lt7GDR3K9TpQR_CE#iumpZngVJG}
z6teG<^nPUL=gU=0D@=$6W=+Kx6q~Kchku1yFn@f~7BI6mK3l<dqMw-I$qsO56Y;Km
zh%^=2?3;dmXb31!l8*qpjC7;fkqM%%*^m?>Q`WYG2N;!exP@FiO%qzehiAm(F)bTw
zbvevoWah3RdWud2u5c6)IijEDv9Nt(4$~gm2F)TQm-$A^3^GhwupI0X9I<!8h)S{M
ze)AGL!O<EpkzRtqr<Z=Ay)RB%-p9)T-ueuvVThX@ZOQGR+1P^{qie4VVd+^t=M|rp
z@>Pzh&+BKGo7~wG=V$)HtFxWo9$%3z>)18xg8!z(PpE&vrIInl==y@O$^zS2vouHD
zy19YEXQoeDI<Mh&6Ox$ajpk?d1)c9__1II%FnM2G0-;3Z3p}KQ2tMg)z{F^g)NHnX
zFClZ1JCy1yb=+_=5oLNPPlNp)7#d}{%4vv*gcXVMInGl9B0(m@EmY@7mr8>Bhs`<R
zuc|^2HeW3~Z$_DKPsh#hd@a_!=#FzO6~<lnJdcr;M9aN$aBkv&HLEvuGjKGcCijiq
z1VQySVbR$?H=P|hP;K1sioX#b69#Xbun&`r)abftRgAch_?i~BQxRJk*XBy$N?kDg
z{(4SSUsIcdx^a8BlpD!S5uCSovP&FfQOV#i<$Bv2XFBx6vaT!ycn@z<_ripat?Lzx
z5{W)RWa{&bP@nsmC5lmrPSUH=DR0KMScJhQJ<HFrh&%x{rX{u*4I$TGc9ss5?asep
zo-l|f?AfbGZ{F?Ym7ayptDjVJZR6(`gCSA|9Ctj)FiZ}*02op-BA3HpxU=t$<SpcP
z#n1B~xqt7!Xq(bMt6h}TC7-H&Bce_n^znd7zZoXYF6!wB;hQtt7rN`zx*-cJqlIOS
ztUtMbr}TVqSQc|<2{Fq$ZtCwc{80#_lZyQNk|Ou-6h|UH<*qq2IRQXvsQzAbX9myN
z+19l-=x5~YzyBwhB24X1yhm(xs0RDBzAN6uDh@%mKIm2>L(VvmyKbHh!BS?r{~6?J
zV=u6bzqb%tq^avs#3?>3yK}lco#WFTwkF!kd;l|}Tc#W8)Y2^6vw44{1m{&`Pwo}u
zxdyQUy9&O@UVQ%R-hyh<z>0Af#Tz#R&tNV%TmM2Xn6<foKSWWi=%Q_@%fL>U;juld
zJCLZv_8E33tMvNrRb$webA3LX^btHGZE-lKCB0WVw>sW)VbNFEidZ6BZ1V2rF_h$m
zygzO+_D;C3joKhLDB^-8RmctUV3oq1ObM9TT;DNxa+B_p-Rm<EGWyEQrw_h!>rdPz
zYY$6k(j3+5s^Sc?+nSqv16PoQOC1?|xn#V%W3#PR7`#j0zS*Ft)Q$6-!}q(>5Xs~d
zBV{9aI&SMgWot*zxqb+W43D-th|Xls7cep#v8&?;1EQ3knplc<5Cz62lW*Eqf5)ra
z|7VP}XJs5>?$pOgmjox$t~Mh|{mwbx)taw1c@nF-ie`Azt(K{UL58+9e;U5))6cd0
zxnFJ2HeOS1piQ|0iQ?*yZRwQF&i>jEN=RS5PxsB8t$!qcQq~_AW)&_xoAbbFPY|vE
z=S>V(v`a=mL2eF%g`w7h&oxoNOVV|*u~ty5upgKY`C>pa(u7E`KBrXHtMMppCtyLN
zz->FpRkP*{tuL1|QW7;Rki6VdFljDnwvn|Y3BVEwnGr#RGZDvle_yE>ha<IxWVo_`
zJ>$vfxdAcoa+$QQGqt+hsq%gZ+sP5OCcL4S=%T^zE?Y;=4HfG2W6BA=#Bsji`S0s>
zr1C~g^H`v=ealY(?LaG3uFk<<@Ja0UlC{j4OT0@%JWddV-mKd<0d!+-kWHrMIalxH
z`3bdF0X(ZqxJgUfQg&4?tR9rE$w+=OViFC-GYn)_nJ#Y3{yuI`f3<#meaC&Ak?j={
ze?-(-rZSBo`2J9sq{t)#CsYN#qTp+AYXU3WuDY=%DRI!0qh~7}n66sU%7Rn5tV-Fo
zZG|eDG`Lmh)_kbRen3WIwU=}%yRb2<d^}xL@ER90q*x+tj!<X)O4(+>^dj-eu+*$A
z4^6D_on<I$Hc_4xIY2QcH+nFa`w0%g)fTpgV6p#ghT_i_-m9)Rro=e{T6_Ex?0OS0
z3^;Oph>NY^LKHk$aX6U)4|kGg45m6q0mv<VjJ3=v)kZUgVVPVl?q)YzPi(Dn%VUfo
zToiW1YFw!F>wGv^>M32H?>yT?R{_9|p<8umGJ25V8JUxn=WwwDa$lhOAP*cVAwIhP
zZTH|WEDZ6rdbed-p7+*?Py!mYH;>2FCb!V~X7SFr>ibSs@`GwOzRkKll8KGUgGFE$
zdcJ@B4YR6qpKIe?l|+o$s%xwE4{o(*^o<ENGg&L=)M7iT<f2+KXkhnidkYRu9MPVj
zh>yFXM*xxm*$7vgF*C;#l1;;;1Sf@)jxCGZ<BTg?fS_#oMQF}j(=i7XX3U_93s|M8
z07Pdw`8mK|q5C=$e6gW~U|28I;9)v+H3bX_==Wur+)VpMn$90`cc9{+j`YxWz_`sR
z-92B0+zd|?c~A~=O=(aEb&Bt96*BxALdt3oY0p~9?)f-nE<T}hWE05>PEY_ld%EZ7
z5*E0G4QiZ`ybD_0iK6DRxS>E4xUNu;2M<Qr<^kIR>Z|=ynHy#)Z&byAAtC*~0IAeo
zQstJSb3#&DXz>pXkgB2Krm@pbM7<0p-Yz^$3^k`<45z^Gj+mB|0E2f0wOuxrHc4W(
z45m&-XMB5=_zhD_RNz~t&*x_{hC7vImFl_JwA6sBNz-20$%2?4zLP-W23(?&qWDea
z!&So$th}#B=12j#(?d(yD!jg)Hc8jy78H{v;j{RofO((x6(&>_HtTCArULf3XC@W+
z(#mjKUs9;{rk$uMk|HAT*ZUz5N(rogI46KR8(ZqA=vy04Nt&*MsYv4qc79>1aB*;$
z%|p{3S&(w=?0j4p+<bb82YKpDdQJL4M3-{x(p!nkp_cxxKQ^l1*p<?_C-y1`TD}!_
zd(#{R>}yjZ`b>e13S&I|qu~d-u3BIDY|ATu!q~I5S&gP_Eb~08-uAYAJP<P4yi1^e
z_g}i*0pg_?gV*6<KWPD!^QZ2WANm7ioC%vP^7+pTe0x_+cil=I3-kWb$khYiygp=l
z|4hh~U|mIrZJsK3Lu=aB@N#}aJ7Q8i@tj~C30z(lny>UjA_l=%2wh5t4tmSr0hb{S
zE*{u-qph6cY!2aOT4O)S100swh(Ol5g^2-!7J#*|D;-+kl|M|YFQ&_Z33Np{M%y;>
zpuV;73T6p0u>@fJsys6nkq^HV2EKZMaC48YaWKO}``FHHVd1*A7hh+E-B53Ia%XdR
zEjQRx*ZHOxp5Z~$gQFfb*Pb>waVt&#Wq)GWwuv0w+eM8ARv9PIX^HzLv$0#8nWIiz
zISS1-%<s*|i!G;0{3g|$Ug-rvHoNNX8(6C0lO9jWU0n(e-GsH~265YbRNEf}+Tz7p
zv?gbH(}SsAFyHKwTq)hU=GL(g1MC&skBc>X5QskM4IPr=Av(DV#s8zBa`8ly4A~){
z|0G!I@yM#pRPP%yX=WYdfchk#dD%LJ5;lkXyBD#6iF#@X1GqLkH1<hJ;jIs!&cmIC
z1tVe^?1tv>uty6fgVmu3Vgmr9++SSTz>Sg#5|bGVi504k;8ur5qlYeYdo!1K5;}<6
z!|5qLP75rdimFb@_&w(qdm!(s2W3@W-LvM*Q+7`$zD|BA#g}tpDv8|MZ*RzmA=L6S
zo5^uq;`fAtF(s~7iqB#QA%yg7_7O2MF+U=^VP^Mwl20njCnNn;^FDU@Rxvd$q%!#I
zlpgF$rsb@UB;X?eP?xrqy<Tu@;lZn;OC(N+2|rOkVSwNz!Z9#Jl5vdT=HKEUwi@Qj
zKDulQ%AmY4FoVRV#8kG?QMiKTX%n9lZdbIt{wKCgxU~A<tB#n|@8Pvm#Mvr$_UPB1
z?ooYjca;jWTzks<Cxf6C#H5X#$>{2!iISKL5Ge|7FrIVBJG^1|npJAd1@!wC3UuV~
zAa7bBNqntR)x=mn^Agm@c6=%+$ZRt?lBPmFTn>J%<6Y-<{d9<FHSY_^Od(9(R{MYl
zS=y`F?b0TMeOI@?p)S8VTX7qvk9O*tTJFyUrognTU|p<?8xx4=bsTelmq#;EG6zuv
z4W{D137zr});ViQ@4ToVp9SXPe1H9yxXyPJN>5$pBK&1*pGA^{&749jAbSwZ)l>vC
zAIo@y$7PX{y@dev@mjn#+(TQbj$VlFBYnXoOf7F3G=<9{0ICwQbeq7htd73v-%OlJ
z(=$A@5VA!$9dt&T(nB8HU9dG~zZ$%1-)w~nEm{>48nH=Lyp-s@F?-~g&x-zio{7V2
zI$p|ZilmiO>mwifFr@k?`d9pRhT%8u;^wn7-clG)c@fwdAPV<mL$wT~n8>-@q0k+}
z=HA}<QtGo9B2D_&$c>HFSIpISP}tTDZr&T&ybUg7@lN(l7%k*fY1qc*VkP=WSf*_L
z76cGJ&UvD1V<HN6ai|NU%bn{F#Gl5v3$6QFbrI}7&NHYS@2Jl_J7?R;H!r%Xkltt_
zx+Oy0RK?gcm-R1O(6mnRG4ssZ(r+OnfR}_g7GS1}X}HN_CNE722F~|C$R)Y><ua(1
zUMWclye^)K7ae@Wf7jNw1())^<HqgbHtWgmWr4{5S9WsFG0gNID=UElo;Gd<^lE-j
z46E%NS(HDx0A=IV+lu!d#pv>^(-74I%f821fiBvXBTY~if6k@Cbx2-BI2d?N7hCkx
zyfEo2aJjh((X`Rol{CZ6&vQ=Ca_(ASRxN55_t?7EHVuQ-PxIHd6@J)<Vr7`1&`TO$
zibi1-hP4oBB?_%>a7aK+2pgcM?5q~5|F|z34sf|BN;6j*-4c%VK53{6E@Wi4PUlL6
zxP2)1mWZ#d7iE2_=?)|Ln(=V*v|(J>87gmvkR~TQr4|piLxTEf@Um~=;)nXqApbFj
z^~5>}chWK@T_6&@d3nV`i9wgc*OhR)=;L6|(*mXWHus~!LQ+bL#Qj^F$xgYEa?r35
z>yE<@!D-@aMn&qY2t2Qij$~l{ryHBmgTr`X0GkL+e?YjYfb-3r71eLs3K~<eG{Qke
z@`jh4wJ9spXRqQmk+!cf9U2m3JrE{Ufg_7;35((?gef0uO@?ywdwR!a(0TJ7<Eh=S
zfAIdXn5<A<#A@b9-ZR@4?99glB@69G2W17@-UMb37J24<Z%Vh-uX(vSuKNPxy9uE*
z<9C9*Zcez62w?cN_yp>bVNQl^UGD1Y2;Gb|d}*G>7hGEGf((?CDa{M26nwfdH=+98
zp!szP`S1{*z?I}*4NtxHXo$N$TbzhAy6ILnQV6u~iAlEK<-(AR*?ihk)))l8QQI)u
zXH>)^oOuBqmu@XZS0PZ^1MzN#{LhD+1=-)`)8+GNFLt9iD9gUii6|EpOVGL0okGUi
zxRU2G=W-HztL7Y;Gg+`{N$ij`l~lqNZ^5<xfZZ{rprsjyNd`{bySoYW>522}%0wQQ
zki4jeB44c5L>YBchbgjQ&uHePF(u+qdUmKcA&5wN$9v|laZIdqBU^sc(!I27?YFT?
zrFV!+ErbYVCtJ7mo^Y8em_*gi_6vgG(s_Y7pwj#mx#xMFcgD<mo>_ag6)}4EqOScm
z9C+wM)t|K^<n?P~$sPnLhw^uTN8wnJ1u^MD!D1Y+cHqOp7Ba6sQytgC9$X+Md-Dp4
zXO^Kkitg)y-zpGkbLP)yP{uqxuYumEvtnRa8>bfrR|MM#VjW|(cWsvZ4La}chg*JI
z$-2gKahqwarPpf<UEjGz$JD9)?h7egGg!ylfsV2P+chg~^CI)<0%^g_IHE+`I%Jb;
zDKUOk<{_!OwO`@9Y+z?6J5M6SxbNimuPPcYjNCovZ#-`42>RqRB_wQ&iB+`m4>KUC
zpW<>xbm_w+USbeXu`q4Z(?xYS+&$i=&)>1nY^9Hd4A)L8>^Flf7hSFP(-=)>2+O((
z*tsB0z?S$@km}M&*VJd%KZKoG!M$T+gt~qn@^|^Lu683lqP}K|4An`DGyM=Dnb=4W
z2${HE$<>cAZ%jvpD(<(B&zzTWGfJ~fHknPnd223&KlW0*yJSd?uHUwCUsmM&oy$ka
z=f?*CHFBIMCsKsEV_;Sp+aQS3IyYd^N|gJ6y(ne23ck4~3-@nuV2>(P@m`Vsg~kND
zY#z}7GqDtS?O{n!CIgqv;5z8J7l(?h!zWt9hYb*<<bcM5j6_%VW{q{qn0rcy9T^>C
z72^k6JOM|=>OHW}nD5&{#lhT-Q_fa+vMoUn@NLl(tDl!k?|WkNgAAj4(OCua$9kfV
zCO5KdsO9JNb6}4w`MNxAp^8gj)Ymkxvj|yK!^R(mYD-}=HZC`Ayvk2oR;X>y;Q7_5
ziHZ3VT9=3P3$Au>+p^~m$gl`rU6gnYMQ_?R(Bm5Ugl;~>X!I!Q=wxLLPo*m1yW`!a
z6|!XmN1e*xlIuBUT3pPS{cL+yqr86FC?PfA(0!6`2^PdT;zB`Uj3zF8(p)&(m8EFD
z!Y>Wd9kVL%%(SVXZwbUn!1N<19HKMj^B&oC>FO7<*)@znru%f5x;yc5M$8>q2lJ8=
z@>)^;MTQL)HNdhFgExnV35P0ME8^=Ttof_C%Ju#Zmid5?*5r)R6-zoh6t@&6k_o~m
z7og*l6+)fymZf@1SkH_wbI^>yD3rTqY<Z#ksMsE+^hx|0etEr*JLC%Lv2^#(@&(a9
zGiK3@8zPb$J{Z@16-`Dbo0M@L8j%wquvawRUBxFB^CahyL*-Pmmj#fFaowd-bM>iL
ztD6!Sfq))aIYmw>fjL@Z_1Ia6JkPsY3!6F+f@z1O1EO!B(CRE(&VyQlMEuwwGKKe^
zw>4VV^2uXRtOcxLfE!IFug2=b_?-)hy<!aI3#r2HMBZ1srIf4Td)NY6RoH}mNw6mX
zY3|)LO*yGBO+B6fc1A`bYcBvFcu?-iFg5g%MFDsQOkY88M;afh3{K8gyGD7T3MttW
zqity5jGPA)9Y93V9zYFDyupCQ;Yy;~dma-F0B)AEIecJ>BWcJ+OrF=aE{|%=umBtv
zpa@y*;BsFG+7{G6<^pK#)^@EgcZceY_gBZW=GTYg*j2JNq-<iYt@Q)IRw<U?Sz>-h
z%-8QK%x}hvkD1zNf`}ZNEqG0OUb$i0CSQ2+H-9$DboqU}R@Fp_o|INFCyFJ<^l_Aq
z$UM;!rYKa~mw`>O!qo%}tYWdoe60s_jn11ljY&E3hNaaefcbA;nS;JT!_k&ysg2K7
zJKDnF(%X1V`cl!JTNCGg(=fh@c|$XJoU0X=iBbDq#G_te;!tqP!Gb@zU?2gnXy0Su
zsaVzUfxx2jebS6SGW-T+`q;5*dapl|8pfIgU=MVlFjL}1ap%1=llErG@<De^>K13%
zg-Za0%iwL{vP%YL<D_ytU=Sv?BobXwn1fhAW|y3rPCF{<L>i8^&;kVx*<ro>POpF~
zxMB@loD_s<k(^(~>e^^d&c;D|wX<)$?v@LmIO!24=63>O^jD%Q%5`V{GEMInF9z&<
zua-K9UHm~uVSk#`4GWMH06DV#*$<#7+W+}D4Uz!}m>3W6o{sReHxi|D>%*Naup3}4
zx~j_nH?qgIH9jl_kQ+>OvTB+eFrm9;pQ39+(r6;UsI1a(GCUuX9lBe?fc9EWZEuT7
z4u36PTv?>>gHR5pm+&33`FQ7|j~aW!LRVR<|HCB3H)cK<nRe`2X!OvHzMh3YfVxY%
zhZB}lFzBa9GDjsKvt6Sh7<c1SpMAmu+&{MI`k_r4VXC(h_reNni-DV&FFncJzS7OA
zU7P#|CjpwmMk&}>R`hUBKl88h6OU*Ox@@Uu%Qn-)EwG5U?u#$L0VC@P-+>X_19+7m
z8b1Ac_k*WEZO{EwX+LfMFzsjR`{`#NraAny-1jt}E)Xd3ua5#09#wf<bSV)8;{9_k
z`iCY!*TCkQORlhjb=lLPuQhwg=6#QCeE)({PFFmzNQ2oX{v4@!pS-yv*_V?{97u{C
zSSS^p35T|>J?S{Vp@vE(AYZ^Cr+!uN+ftc#(O<mT@pd=jVp_e<3OJ`86^#ADQx0X>
zpxsPvx#%Ag8@Hcd{yj*)rUsamJabcZlSz|NEE}ZshI-SRD&7a&W&Rxch!1)NbVfUy
z-}&1Fk<=4MY87ktShL~Yrd@3B?K(f$YH-`S(7Ss&!La$-2S1^7Kp^h<0@MCxpY&r}
z;#YoC2>p*0(q!~aq`GW4*I~qo{yy8}&U)lvL7JW`ILKV~2mIdyor^-j(^ed!FB0(b
z2`M^(1{RtBxh%J7@efn$=Tur%qdKyL7z%#abrcwwgF8SuXM1{9-X!}80xiY8UFqgV
zo;SC>-&FR{Mcc!$$Lh;Ab9&tz&34L3pa5E#{VNsF_$45FW}Wn~N#v_`e1|bXA>c(l
z_#fVr-V|N}YU*i-3OF@%0-X%z=OQvDQ=M_)gp%G)SHe*{KL=|8^pbyY{Nn<6?<rur
zi_ygrD%b}#8)ca0GQfaTwR7f`&3Ih6&10YtHy={s)EXzQ7)hw{HHw`sihw3urO6*j
zOR4dMaRf3v;fS^VUYiUeuhMu>Nia>B*S3w7^9C-rC2g`|q`N<3Hm)OLzqnD}q&bK<
zF$jp0buz&Gd1#fjmdUO^vC#fo?&libPG%r!sLHb4=A(%4*0x#$R&h0htAs>gt#77+
zK$$CmLcNxf+nd_mRmhlPc}xs&RgUuu&@d@(b=#)dIvZD!=Bgla7a$RVLibeCpq^Q$
z_T`hWly=1s9hBvWdaH-_mdcKx>O2KNrokeDz9P;r^sCF-hXSWXOoKL#ak)b>GGr)>
zbMgCmed592PORrY!zMP6MO6pl0UiqM5yTTNZKl{ls8a)VJ3!xGet>Z9`seQHN&VAj
zTZ34o<OfHygC<5EuO<n6E4@~(J!Q=QkpxzZ<ieT^+3)-oA)MFfsoNN(^!6nn-9exb
z)SBp0#M;;2i$Xq)MRmdfb$C&}l$!h6$wP0jS^iF!WWx@$fraBQZe11Jb^TWQV@z0g
zsXX5CVU{?Vc<rpJ84`B`k92N)=o5T8Atns>V-4K%vT=t^Z}xeA5a`>i$}QCZL)mjv
zbK`x$6K33L^Us%eKHeS3&Emg{uRi${GLv|O8TNk&LVFf;y^FCnJ0PiCpS$t)Hq1{Z
zD+MCyp<LQIhJStX44~>QMLiy<$yP$TaJg<&&Q+;e`sZ`krRT79W967;Qi%g6qfTAz
z;UBC1cmM`Z{kH#dDWzfb(-Oj^xKNa~U+#<4M@9Z7%bqE_&5_SHSW&L6+_>rGO%N#O
z9D4mD!m?&Qy<>cxIswo;%`0i%d(25RF$O&(zrTLSrx&3;ji3G?L0Z9^S4<<2c`c>q
zNWNlK6E6jqQ&6>61^DD2k``wKNs<A097+x;oMCMp9L=Er>@uUDULUu46p_0F8b?xn
z_L?(a%nlG^nqaRe`fobnx@)&_IbN!`szooVlbGDQ5+D-C5;hxGUWOU6KG;^M46EZ0
z*4bSNgCqWvN+-H#^MeG>-2~1mvtTj5L==p!WKsl|ibx%2g8+(i%(W1goJ8}V8QFfO
zHZ5+%%(G<pMkr2W2~azm8@}-t22#rC<49@%H&VJT)^Tz5PX+W%V4?>9mo9)~)0h1a
z-!L=hv0v&RD=$q|7HV&Ira4~}VXap0^=^zS=u8P(|Ix^Q0kCS4XagBTUX(x=F*7w2
z#<EqajlHU|D5?RQN#U<g<v5WWhBt~0>7_l6bWFshsdzvs6164bikk6@!m^9ti!4AZ
zi|Ug(NsD~x!hH(d$;be1{$9eH*o=crD%PXDLPhe`;P<L>8@>B`1;(Us%~4t}-*j|8
zf&ldabUA<p6uhr&v!Dk1s`>yyiCKRym8KN|;JR2RXgT1h=q>`6`+*&#y?*@3;n-4K
z%Bs+G$P&%6*-y><f9|+{NA>W=W5p}f>etbO+&l%P1<U3NLal)VGgNU?t;3XbZu6&=
zAL!}V!sWwGLjym!gO&_;4nrOei|rZHW>3>Ipfka>kNg~Kw%+gkVE@k1=G~9p<0Fp|
z)12v{yQS{Jj|d8QL8@FS_qU#%u-E_{ORE5MEZuY1C(!8U8}EOb8tc7f>)G1SEnq3@
zyC_~rk@-g<Eau41oG>rV9`OO4Vc-9$-{qyd+i9LZ^ToV$=V7^RFUzw9>nkS8i`vL1
z&jXtN><63}_(1HM_iy?PxcA2M{>r_$6wHc}lgRgd{HWLSO*MN#*SFh)_A6m4nq88u
zx4or&A6ZTm>rii~zoQ7y$_%|BuH+lwA6M=tO5Tn(KXmTh>_33+)S(}Ic0BEon`G*`
z7xIy)B7Zq(!r)pkvoU?e&Dudo50lfgEaX}@>)JK))2CnH8J|=HKpGV%#Zo@v=sy|u
z%l$woxCTvs;}P7{ofcJKGpogl5r6)^3?VxAayRG<s%LEH$1K+mx_(5L(xx?}bM~t0
z{;LRP$wTonzgeot8iGCT@~ir>srFiXz$1AdIoaE28S9+g<TmWz{EMIlsM>iRO}ytC
zT76%WVGVpcm6T}N_0fv>yqFp%ajxJ0<Ak}haoeZ+J<AvB&ELON^RLMa+_cW6_dj>T
z(W2#Ff~TVcPAxtcCU12D%*^Gr>+n!%{5FKGKV<kwd?k`*-57^wj2>_=k|vES@QA|y
zxvYCDvzfmNv!1W3X^dQ52d{A&9=Y*Rn)w1KAm$widlX4pdrk|ClJx$zc94FRwX4y=
z+C9|T-O{G<5Muy2!2cY(4Ukzm621dHZ7}{AVH+JL&-{uP=R&j9w<_F9{F|L{04G`B
z(Or$J`Q(d|eg`DYAKo{g`DCofl;yRAF2glmb5&cZA*v70CUU?-a0he2pfBL$K4~*0
z$RDIB+x%;R2#=eB%<99m_(sgo3GVGOD~1MW=&EVDw)rY{ptljc$o6vQ*4U!|ujALz
z94g-Bm!@Vy<Pr1;5T-ce3B+gm#cSg;WnVW-yu=TY=~d6#_{k_M9~T8yq%mswWP1Rl
zK-M=zd-MH*G5#~tHzkJ15`g13Q8S55mR69Lj^$`5?|LITQctH)`zH;y?xzI53z;$K
zu-L>ZjDl?~F1xsq2%rYvK#8tJxGCv8B<9wur+<Bc)tAm3AVa_XRj_>)?gSz2)NAp6
z1L(zgly*MFI*R;E29b3=4n1@#VJJ`}3O~QP*N{940?mEA#-=6SeK!4+Wyg&PM*d;%
z#gHsqSNvzn_H`%=a7ZQXOnvt2**>0dY6gz@5yU0kWbPVm`vGq~S%;vPOS5{%PBQ?c
z_#tn?Q};X2_1YsnEC1ZNUaj2u0=uZyBXyPUCb(uo<hQY_j)=WsLGk;w&g)R#r?%tH
zZ$d&EqW156%O^4WC)n*vJ@`}U&Z=Ln5dbI6@Wr)-#^7)(t(;Ifa1OxuBfm4)$^&J6
zje4TfbCHQ7wg6FzU9(;@pB%a4c)vsU<3{m$u*Kr^G1S%a%iSUZ;eGN&m(N_bpXzs@
zJJaF7l5Bn#_e+@AQ(wv=2S<HYKIJbp*q$4GW#y$H-sLF;N=-baFa={u9{!l^anN@~
z5~qtpYycO&>%A3S|DDGdahvs@d<K6>upU+O47*A=x)dL&`^m!l=+=BLZhWnUKCTP|
zIK8F_8T<%8u9iKWoj=);N>bRK2HknRz!W$ntE}yrPc;Xg`Y+P0zA6H%Ev1DEL?}@u
zd&~#L6UTYT@V#i51+iYhirtB0*^2V_D(<iPMi4rwmI`&IX&K|1^S6}_{#9Nu4uGMP
zX2HDf)V~7wjt(|y$Pc~3ta&GMH)V-$XyzRZX*6*X<xkv_La;n9;^EUUc^^r8#s@@D
z)C~sUldPxT6ujvxt}s4CzuV2OBFOD!wYWAu*rjOWe4Cy8TH@%U(=U&nP&U?RPZU_n
z6`T<30uUai`Vkxl37}V+!v}|<kK@MbZ)uXPDYNYdeYS~I<wpMVJ;t$}pik9%$s-S1
zuCy~<F)rC9IZjc0Cuc{1mRLETQ#@Z*1oo@Ytpbn@QMet6J`Bj&_EgtGaT%?#ID<Ik
z<xb;eJQ$yE3n-z+3;WBvLfhHPvnw89JO&LHrEC+h^?J2yr|Ju1q!Wf!L7iPeTGpxm
z?a;6!VaU|E&)il7L@?PUtH!f^-3hOSsgyaI4-Bm%aiX)BW{2DxzQ`B5?v`=RPM<y+
z^KLqD%EaYBr;D=h9cg{3b0?F(3aSYD2^0)ng@^E(X`17SKZH*4iZxVu`9p*p_@#A=
z3apZP@G@|?!u8gQ{1qnkE|#A=)O$K&bAOHUQi%un>r%$!(?cFpbZ^mJdp0bNlna0O
zadQWq5wDtdZaurv0)*adz<|&j9U5`yv;WfBBT8}V>de-L5siS^RFoA=p9k~O59?1;
z+!D~$9~y3Z6%B*{B|JWm<WX|l3lGx@f64*2{qA8J6-Wzw0L0>K;SSM%aM-%<k~jZ*
z(EaD~Ouuit41^GU_UR>d>O8uxuRGSy@rE>Ixq|wnMMKd;+z7OHCsMNcT_EN3=B`u{
zGrzvK(m~`K(4ag35U8gEEvsXWk{?&+CnvBxd!4a*`}v-CL7=dWE3WTh9{bg(ut0q8
z!^jfam@;eYzRh5@b8c5K$U)5o*Z4C*z<uqM;~7j&zV*jCU9kRqY1MSy-H_jSyVRt|
ztmJ<{Hi`fT=Z&`(sDYP&V>dSa0#ZpdnRKCT!1asTwk6K!E5Ja`UCi%p!EM^#KlID`
z!BGQ;q&Z%WH^%-W&hgJ{p9fwN_B{K^fVr7+{GTuy^wemE;b#n_@zOQ{3G=f0oIdcc
z5|FAApFcVw3Ewn_4w|k41Q_B_b2nh{H?b8vxo_r9r$TkOqau7d#EzQLX;g48utLGe
zJiC!@n(*-dT$Y=7Z|$#W$cQlSlhl5#bQlY#o}h`Z$W|^g{tuj_bN+GJf7O$u-7`$?
zRL?oDj*Tj*3YRT!BzTrUIMMQ38JzmV;k8f33UH57Xcvh8FQMLlPE~&0iz_z&@(3gC
zxwy58Y5n+W;`Z4eO32I=_A@2K6mZtbq=#pGOwBSos!^5w?I}7a;}HRO*XYwdS2+*(
zc357^%Az-<`3Pz0->}V2!8|oN2;;xym<o6!eCCIX)@03C_tfpbznX=H1(|1^go$0)
zn^k)2CoQzXc6?&%)N-~)1kU=%+xqLv#)pFSP^Idx!B0@w6FkF@KT?Sy_$e!po2fGo
zS;|_814mwO*z@>+hB|$xq2E@yXgiqY!+Hkv))%+Y#0Sqs<Pi9~_Dvh~QK=`aP4T)Z
zhe3&2Yfr5Nr1y`Hfc8WbOf7D5JD&RiEx+Ps$@{uD_*Vn=tl*ko?^#^}(io9DmH31;
z+#7OdYw!os(7C>b+Ou#2rA~mHT2(4Nz{WdT((fn2bpHTEFNOyglxzAaW_$0LbO$-)
z4)m961PK7H#mF1}&2jNJdXoK{fzz<$r_7YRcE8Q<YNg@c-ZL8132Ooyhy_ZV--BHR
zyk}?5C{RCIPy6*vt=coQtG|ZS9jPa9_xC;6j_U;MCTrG0kq^T)&J*W6<pWT{-UYqG
zglIiy^&^4Pl&;)iP|qc0%^<!my`DWrdU3Ja;K3sZX-0eY!yi*3o3;1I(v+no0=Um9
zb+z{Ji!tEQrHG#piIX*@Gw0%dvhY4y%&QTjx8<$*qmu52(tQIru0jSuEqCiwa`=F7
z+7$$fFctNj;7&s~K0;LX;2)~Kzu|KKhQzT@hcx?dY%_pT`6s?UnjEM_miD5QZcfT0
z((J1pMgDwZu#4?fCbz5>JRM3N%IH{GYwDS`I*K5%j#Fs8u<fjrPO4Cyyr%G~E#kS_
zuJ697VEE@RBF%u{4`4QQ_WwO@@c#!?{Pybdl~dX$Z^IMdFFoZQ9AV~5J5!e15tNSY
zF#LdV^M~s$8?``?#>*u@h=T@+1~R4v;qM3d2m^OZYe?IJE;ShASMtRnAdqLzSmo8$
zJwwau0D5BIRFzez=YR;g;$Heq%u#W|VEJ%@ln%hR!%$j1Am{?2fXCNAfc9plC4a@n
zrGW9<QQhHyJ966OIB+O{e?O{muNVQ&UCd0_4roRtV|}*nIK%Sjv-=!nX|IZ<&D!+;
zhYVs^Mh`>o5%2@(dr^GM|G{rzLr>P^@Z?W9!hYTo>2Z|&llbrCgXz}*9Uq`hyWj5I
zO6TkVeJZVgs2<DoH>_zdz$#_9fV1Q!pVx=FInjMP1p4=$sF9D*R_^-BV(ZMx#rJ-|
zWWWtnLWiwH%(ZT8+KgMP%L?>X$3N|Vxg0*30KYA0{*W3ou(fHVY;~+DUAJzy9*Hq^
z{@@@_mtENI>XX0gH7mED2i@@iaNLt5(DmepX@`H7w*O&T>O;J@Edrx&kRD>5?Qfm2
zKI9D%cL1;V7dK2hU4JJ`fFId<=Oc@#Lb<OXfUQV-;c@M!0pCFYH*U8_&#>(3Uj58W
z`FOyrKjJ?<dVtmxITVTq>I-U;_Ktr`{}mM84<c%g_^iLQ1LU-PWc|+#zlx=XBw;5u
zZWx6#@tOA$vki;4)`leoM&Q0WD;-3;yFB$H+dwLo4TPkpvd)r!wdf!9_Lf#Y7Ox>d
z#Fzb)*0h{C<aKt^a4E6Q2lT1J$FgJe=B^rf4guVos)1pEV4K(t4o$d@&pGEQJ-n?O
zpTQ}yA8*=!`zwMW8h3&O9NXqw+|^u~O-@V1QxLLOw!R(z1P!`Q+xC&(#R9gkc3b7Y
z3!u`}mCx6@27bZ}e!8+g_Txi5IjV4*Gn{^X+asA0Ye3)m*g?AHP?Q380L(jOnS=Vo
z_91IADmZKPw=?>CJ-5EkJT`Q`-@#Y>@cq4eYpwKMZ!tH~wXJ`S#0I!W-#y~4`PhT~
zrf#(GFwH@I%!E8@g8<<*|6^G+2-}geGV&`6i6+0DaZ++lofGv$Uk{2OV0q|@Gqxj_
zi#jqIauS~c-G6~XF(q44AZw=^@WzQe9dPc|ue^y(w|YC@4+v!8jR*@$opTg$kPXG}
zv7WP)$w)D(egcBV0e^yY8)&-f0cJGlZ0#`~#MmDYBZ9XpA^AZkfIksDsZ96ZCNhhU
z`2sx@6ObePWR<+i0x#XIxSj6-J|&>}*R~(VOw+-y0SC&FVa$OFrnh6O=C^pu@5*E{
zM`F;g<`S1%!_y6M8OFVj0(!kWQa?swOEHSq9v$%JZK$^?1@%?97RiXRtJnbqat2NX
zEb1<2HdUmjCt<C1{g!6kN@xc}I&6;XZuN^X_gpUZMEM`$hbEu0=A-`__f&Pdb(!zy
zBWcpf$f1LM1wP5TvNA_4aRNnoNF$DBq;Io{KfeGcex)Y~9+b*lh`(GG2`#03l3gpl
zL@lnWdniEvOR}=<tGMxey*#(|89rf^6siI|mtPuv<t@=gbhfaE&HYhIzIhH7cKTNo
z>tuUr7WW}zcv8xbz$Y_6pq0$|z37nn&)(T<JM$N!DF$$Y{@?7qdt93L-T!ZQXzp%H
zvo+1hc-WRD={&?4qeeV!Ypa_%*i?~t05^$}h|wqlA|lzcCiMhs6O1Qd4UH!hsss-p
z+BQ)d4^U$eQNculs2~K1pyJ{C!K7{4q`U9!zQ2#({rx@aABo}8D{!Ho>-~AZU$5s2
z_hG5uTKyJ04KvfGK>;m##|5T#TbgU*>tW(>Z2bd=>24k8%N2ZMZOu8b8pPc!|19<F
z=Jit9XW&ww6b`JLG!lJclKK8MF{laGXG8xm5-guhqgBCjyJI`AmwxPj4=exbU0qV<
zj6b`lLU}HwJzfhP9LC3hIaJ?qn;PO2Jq!^fwp@kBuN1SiwIi|S%G3aX+{d>}0XOSA
zxxe-Ni}53~<0wf9MQCx(6FvZMV!WP42Q1QPeZRM&<JnU1$xONZ2vFF}PJH#Wo-AAf
z^cl3GA{9loPc=iJFwX%X9nGCs$kf$q;KnTu=W7<bCl0|f7;Dw+fr++nsrX*rp)I+!
z(6CgoF}g*e>&kXuf?RB=Ef=+7f_EoGTr4e_tWXGm9nl{G>mPE;V2M%!;CZVfi6&b~
zl5<0e!OH?qxTzHf4Ve5!(WOJ(aw_TGOOrZDMW>~K@OYHW75<O)_+s`=oiqn;yc#gU
z4qpFPCfH>~3(cj$VJDwxh`zW3Br|>ZHxgEXF;g8<aTPdb7t776a{JKyyY}F7+k*%4
zIo_6U3L8LS4P2V&{>K){je+rre43QqzzV3i`Xw33okd__A5V-oPp*=Yn;jg8$5(-y
z@L^+$YbWZ-Fm(Jf`HyET$=4%Zu1((mWV83A3i@0v&gfe0VgBkX1)qb%z0CZTPsqRT
z`kz4YG{vo1$?G<`OuDw{x^}X;Q2Q0kxS{lG#>WF2Qa{-Jr@f8`ZrbI4u&?<a4}7xm
zn0lkeTQsTH9VK6(c{(=Pdxag}1G>WWX;8=hd_+?px4a{@*=xAJ=OHgvl!AQn($CvA
zX3_TlFXsx6{BXdvYW)K6L?qUm0O+;2B-O7F_&&!ANPfc?pHlUFF<E$__N&?O<fRj5
z|2wl`WCOxNhyt_WXR2yc>KTG6;js#F7&sNA(;-xD4LZg90j}%O?@2E>2=kk^{9|AK
zYy6(dKJOTx^<BI9LE>2yc3eZf8I?eY*$|8-^o3lQm!5y7sZbMlq^}6TWB#nC*-<d&
zLYuI@bn%j`boqM@xDUy)_sBa*pH}uMCw@?;A;jF=f7b|qx*G_VsV}a^Qwuw&I3FGd
zH=SSFZf322@6w&;LQlAk1M=q{fcYVoE>-`ppBCSZRW9CSx;%6HzfoF>#>9AtD>sO{
zaV4P&MVt#X7IlU77`GeMZ3aqElwA(T^B)?#6jef;n2Jw~e-54`+;7UWxg8WwUCqX4
zhRHC7Fl(bqemowIhEGWOZ`a+7NG|aZSJXeq7UYudxv{j3K&hBZ;vn$<o`&#$q`dpj
z$I>tNG;mb4W6uaMFj!9#JOekE*9CNi{b}@!LFk2E2+v9A_ZS$Qo*Ai>a*k;dcvyzy
z@dVaBh<`Njs92Uq+!`nhhk_D9?0-i_pfKd~B6?HB`euH@O#LV2zHS(yabwJwC*(5e
zgiJtUQ28Vsw-A3FFTOQ?m^)@z-e?_GmlEwA#IOIg_F-K9R`&JQ221TTH$NV~YJk^P
z!uANAdP9a~q~jv#z9$=_l<re+C?Mq#k`oGol4kWEv!2l-!ZtgcfBAaX?DRIq!>JV4
z-*hMyHFxhAkgdZ)-!gii)W^}ER)zmZse>D1MKHDs$8P(wRkt^0CE%~mwpAtk8<=i;
zmoS6KAQgT&GoJsW>#Ks1e|KmM7R-+^Gg`vg=gfyw)?caIvLhImdS(f>{<}{N?J@R(
z@{YS?-jn}>&KJ1Cr&b7{>ry>actOy&QIE&9Po~4k+GF{T?*F5CcyP5@1T3~Fr{M5z
zNyS8T-=K(5_esB@0%axrF!iOpOLY0?1|4S}(yCizH1%#2?+Koa50X%n+fz^J2fsci
zmcUaB$ZxGb^|T&;Is`uw-!~i`NIa!0^RU!`MrDjHTV~@><6)l0Try~jbbGB;x96H4
z`NPky^~`;%WH94b9Mph(L)rHnibqOb`l|q~xsan54z>dvW6th5-@chiop`NqBI8xv
zpU!5Jn~al=A)!-eD6NACUe$rleEs($f0~FNe#A!&JXRW#l#O54{QWojdjE6;{Ljn7
zPZJsdJ=FVC$1j`LPjp{ZKrk>H=~J=WI=G<{lvY_K-?aq4O;i}3Wx|v+J=0^tp#v&>
z;*gJJj~nX2l6iI>BH4Lhu;WYmX5y}a-HpKD1LT7lKQ*rJMmso+U}iT!7rwTK!A}OD
z_ZcfkB6wcz(5&Bj20p1YfAF{rI`8t>JMycaJt>Pe{@U=4Y+e4}?;S~>wlgo}U@QFO
z^*G!M-slf*Tb%syx!1`npKSW%08DnL>#fVArWC)6%z;^7z^i=xF}`D?Rs>#^Pgqr}
z7c$oFt+?Ku53;>o;_q9COpE57a010JWwChtnN<r+FEI87po_f$SR^78KbZkLh8`JK
zHD+BDR$*^RT5Ojl@LjFbpNS0PWA81n=&P!k&qN_}DhH>VI^kD4?D@m&U0B^S3=tv!
z5dq@=Pj!KduKzJ69r<UyKSZRhI1lyBI)xYC2lOF1X%qk@c&;Qc@lMW{g&(S`)->~U
z-S_13{r`RnZ2vidHIwnN|AGQA)I<K=&^L6-{v%?%u{@5pk8^q0&NpG3-E{p~`q5h(
zSp$OZU~H(+kA@i-CP0K&PXHg+O<?99^dACEy18R|y$e)<0DYZ5z_eeZ=&@f!4cGS1
zbsF8@I&#lE*O`yAPjE%K(swudKh9hKQ+vqejSZ2L_cG8~GKnx|CR-Pz)H5LHkK$?s
zu>OK(>_J);tJy4YH)gaLhejUv6*nyOLH7p+LjIH^<k=0};`By5`Zs}BnW#emDQWzz
z=L^w6OW0PMaMtb1UpBj7`JUpDd1Y&;JamAzu=XLjr@i^OgF~L+QIXe5-{=3njt`vq
zf1)I_Kf`})VK#1T-@wL%7`V`VmF~YZc<F+j&emsXMi((N9|PK=Jj1QI)i3%8(G2Cr
zc-<L?cwNX9_UgttYGRMuew*kD@UrJzETjkQtAstH%==<Oi{H={pS#YHiXKm2CFF}I
z8;77qVMsch-=SN5!QtVnU5k}dvjamD+5Dy5t>0p8zCYRVUK_(Val;Am9Ct^Vsr^KP
zPrO{+WDL_5K0RV}&+j_XaDhL#+TB@%UR-&4GP@<{cX`U#AvweMi8BM+`Y%Z4{&~Ih
z-!O#y7#-(6i+lN-g_eH!ZEc(0hZ{>W$N=LVpcYCjd9QSZub;uC65dFrm$3*>;O|lI
z4fGiXZeh+K?3gs3&9*&%qG^l6$Gu*b>Y1}|KA%wLy#tf-Em*VoU7Fd7*yB!#nrRTl
zVvmNw(R_#{SukC<2}(f(0>Zdm+@nzRh31I2Ogs_Wn|S)A-9YmP=%u6A(h_V3rcOy7
zoDSM8jn48Fo0Iz02YMFb;;)o|)QzhCawlM8E|1_$<sklt2Dbh0CFo^41HRluJ!wTL
z8a1zx50SsCwCv8^Z*%E>S807$Y5iZ5;(b?X{o77pa0mac()zB_dfEf=U8VJ1rS)B<
z<-hh_PwTs$)>Agu?|NFmMe$vw^<Aa)T~F(~p4NZe2Krr3>${%TKbaotrLU~delbx4
zd(rfJAi&MW-sDjBH6hozz!mQU4h<{7Q}8v>7a)=B`?qQLWdE;+vaK$vsp~5ynCr)z
z6+2#7Ti3n18G>$)bI<<^@(P;(3zdXhW*cNb;)A#dLF4dXrly^hxmC`tYS(pMX(Zqp
zDLh@<{P<wo;6jqhK;XQkz|ef^U+<qA>5I-P)(rGeYYpx5y^h%rrrUNkV&2dsY=is$
zrW6)%q_l?k25-DK-yJ2_g%HCf(?<ifGdP@dP_!$N`@Y&uJJUNe%twh=XW9ze!{q^(
zM2>o`N<$Bb>In6(@1FHYKa@xhXpNt1KPVuBXQW@KuNrI**J10bM3d92bHlg$vnE4k
zdu?n;GeslGa#N>YY3&`%<U?%z+q8n^pq_a*t*_AfLx;n&+QjP6wRNwt&=CFA2IXbp
zvI^0@qjRgYNp4%UPOKxLt}!+x^+NFe7}P`UfHT8q-f8V6{x~eaCgaqXgrFuzc}?)U
z^S=E49=9ftMCPp2_43}}iJF@t^u1<R`@gDW&{lx#=d&?5OK%qCqa}kL;tUd{>oLmS
zj`ToO<AYP2QS=q{<Orpgu}#LC*jsZ@TiffhEfD3bY3mJevz0}7^aWf)ih2W%C3D$X
z2LWLgt1lm@YZ&v*@P8Z~fXh0_#^U63g#vj+4Ut~1)AJ#imdIpdd9RDR3<I^~q9pFo
z5@=K0{`l5c#%|a32h=x*cZ1vt^>#dKi6+8jNoEhjl8-~NXRpqk2#!qV9&I55GJXM&
zAU4K7GC)QZ;1Za-j1B8)D|O^Dm#)vYa(xg*EbIm!|Id;J3`~eMWLvx;*O1({9+{S$
zOfvL$F3uOpKgsX0tn2>v{l^B}r8LV<98Y^oA29jNcsO2e$LvppwHj-E&@e2>H7!5E
zT&u*;mDYE281AX<Z!37Z1ejr)c4twtDI*grf(1k-S-0wblQq?e*O4~Scz8{8cBA<e
z%~3!6YYCxQ>G%dJm5}X)Pmz9>6ua^x*jzH&Fg#ClqmH>_LXLGz9EH){h{1#U&N&9k
z3a`_oi=-n;AIWWfl_=Mx2rBu9o3@Tqt|92B+s_|(0?S_}&W$Nt)5)W*=TPL+8S?GS
z_6=r!3@ZOx;N4xd%Nj0oeUjU^Kj`XQF+OBJ|BY>YquCIrnrpf-@w&{%`8E*b5a{|m
z+*#8e!Egb3T$B%+2FVbfU5zcUTrmdws4Q*;V5Hyy@W~JqmM&^OE=L@Qmv%3Dv>uVK
ziq!hZN4)@~C+JX{4E4!!2pj<qH&evMhF<kBDH1NFwe@V(t^WwVz`5JXUJE4BNh{oj
zq0@98D!;i`G|}isGv}F+Ke~6AoRRaXadY6Fu8EMFhO24yi|_vjC!g}?19nFW^-W98
zX<#DusL-4SAtNcs)GIai+%*uwTQY@y?twt(L;z0ZfdDp0sok?#ED7XM*bN^%FKEsg
zT|82;jIdIqp)l2i`-wg+B)%0NGz_OyiQWdN<r6J2d1t#9kjGnlN8$WD4Wi9LK>BuN
zk;Wsfy4EC%W2-2sN~@7l?jmE1`*ro77%-goeX>qP77>M`?!dh|k?xr|^O@Rjh{Rnh
z>*fW2GRTW(3>!Z~PTFqet<=qT1kI1n)mv#)(`kA+YbiWid9`=;Y5;H3xw{JO^`1jw
z<RFN^Dlx>WV-t~s9^v+on%z;XAiJCSZfZy6>hC&Q`cEg=W9fFNO`}dr&42J)cYgE}
zwoeJT1jWg#Y5mh}Abd`ml<tSSb(%gnYEPjHJ(#|c+iK~gbiKXcA?wJP2O_+NmsQsW
zjZXiryfFmu-D5J3!M!Ad<F#3UI#MVFk#(-yq&|=$!v{-)X`;j7fV4s3=R9=`^T=Zt
zh*Z-g$U2-mE&4Ui__{}6C5XS^cI-$TtAvNc42gfXQAYzCXQ$E{;=1;<<1f>dNL3gx
zJ(NL708v}2)k(8BF$z2`Kcke_EW9eF=--JGg{N^^mA(x9XQa^fFr}4Hz1>e**|-$|
z^9><k@`AaDmbKY&5UA6<5HvN{PZ}FPA^dURk(eRq<{*P-{LSdBdN*P&0Qe`)(1=SU
zTd?Z3{wSi-z+=YtO%Zrl+zhE3_rv(sEL`v<&6^?kQgvnqF8E-aTEc-~l9eYY-5mq7
z@cZbTK8txVRVsr7N*eeOs#v7Jw!-u;IQbG0qhDYve*hTqzZ6c``H{L)&x2tK6|R)A
z9mj8UhyI2d07;jp@G07oe9EFA6~};?eNKbaKz%=m0TeVayC*}2DFzK7O9Id?Ru9=~
zPra*9ufp^T5uHYTXR(-Xluyh8U-n7o4j`_~px$PuG61CKKA|b-Yn~e!2ITIpZsgcQ
z!>pY}acfx9Rf<{RsA`7Prz&yXe0P*!D;KF5zdO&2OP+&Is&J&1bOn;$NNg30Poey2
zHV{RlNXSq)=1XEFw7hi?C|ukqS??A7U4D=~R!b?>mBbkX-Zlz(n6cIVQvou^Xl?9x
ze9LhfXX_Xon4$U62;OTw&3ty6p;q}xx#MC&2Fnp@e{13ru=>FHUQuzQajusnXmn}y
zXc2@aMnUCu{p{v;7Ve!k4xDNj1Vqm!D5YEW+LrZ)APpu<pqsPh^bOY=+5wn4bc`b-
zOpdZT$`w`ml|Z6HI5x-&dHm64X@=0%4l6?OJ0j%j^?I}8`prk>fP2IX%`ujKGg*(#
zmV_HbH{Gqd*CRz-ciLJ#3-%vWrKbXOdyIafZ~Qo%@m3#@go+ibREBXo8Ba2ty9hu)
ziu#30%@XF;n9_v`qt8r-ApEZmPy=A~RqNBil#VQ~e)O5l-PV}8cInb~nV<}6I4(-O
zp38_(dDO68R0Jhjf9+=N>@^WBetnI4>x|^?&ntBc%(@4~dc#tkA={`xs_Uth;*OGG
zAD(HCF7L<Og1*^TFqE7mI`=Rpc>pGJ8xsQu_pkyhK!1)+bXfZ{w{GO~8Z-VLRJAlB
z4n1YOMn1_T{o?nH8*u;l)sB)pB*_#Ez+w-p*2`BZ9|>~U*Gfaj8uvadSXnr?3Aa5X
zclA|VOe!H#X-(HPx}eF__CCy~P)Uf{Q_6~<rv!jl0i2gp6tKM$Uzf~IALHVK+Eq9y
z8w1Nq@f~T@wN}XPKwU0J`m<k<wmZ(=<?0p!<1dLfOBg>^J<7c_5FhM?3J}^tj$J?Q
zpps6!j<mhO%uPfs8fPQ($5EXNN4%g2=HS)1yz$)+OCDR`$-Ga1-*n<n58KuI6}k@~
zt(ElGD|=K0aR{+wEBcBo^E#SdpElP<&ejkpBLOz3il6c3_2U~0K3yL~!`LC@AOdXU
zXcezFv_98D>xIxkHs45Wpf=Nwt6r;b=DXX(Rnxsb_*|?AUpz~G<lP<z^JMFala!p3
z=B-edRzqA2)7^N5j(WAS{U%A&tYYVm$ATNb?j&ILQ+g#Q+o@%ka5_p~`w8$!Ye}D~
z|7QHu{0gi$A4a~cKjOvm%Bgyfl=-VM+nJF2E+O4DA!5cPK=psBj!B}T{kTuWx668r
z?w{cL$?%oy#Ekez^e(PX=};zRaJA7w6-Y2KK|~EgAXz)ZPiUX75@Ol?1ngONY<(5U
zx&)HS-__|E+G2Mj;Bt-j^>{|kF`6#Zf5Fhv>wOggX4yh#yl0?jxzmmcXmBw{P!s`?
z31iEd^w~97vyXm!f+IuFD)MqY@y5N9vBn|8T6MG5(EiKHt@1ihxXES2x#6GJhwNjE
znghz|J}@~*`}i}~lIqDSi;6|zxoibU0#MbxeOW1>*WooL_JdO(hfj>X)+-QBjtZ^V
zTkaMI%4{wo#V!OshBK@m^`si)3yb05();=?BWhPcxWcu6cL{d=zUV&<{fi^tkm&nU
z_?*7s7*MON&UTc~LcGNsm^B$9S&YVM$*|K<_R0Ny($pFq2!c)zBT}a-WhzeAMQBiu
z9%Ar~^J2C4$csV5+Oi_9T(J~G6!z|lG415((!6}*CZHBPPn6WDjTvrjOLSG-JO#4i
zcqAprkV6Dhi<TJiu@jT|q*GfiYm5&DEWV}02Wj5^ftSq*(pdWS`Yf`dodcoruqbqo
zPxrXK-%!ufF<8Dl3>?ewNwH=<sA5;#$}Jwg(V-amY+7HPwN{>%2p<xoY}t%pj_;^^
zo>FzDg;Lol{{`cZODdWZPtYY16;JheUv8uU2K?BN*p1jANtaAbgXr4<OCh>M0(MS%
z8Yu?lA8wTDr(z}G-s$7&9WNET+4?0M;u|4=mz;v~%WUjz4+~JH5SLGCJW7SV?5Vav
z!a=ajS_+JoAOenrZ%$I3o=_mF!R?71JTQpaHDET$2<}#(*l`Xv&!%nT1(O<@sT$6F
zj1}dk1$!u-Xflq?!`F=`YCPapKwOT-xM?{Rb2CWVDn-Q{8mDJ!2{fmz<}g&q@8wR7
zt-Z1IJ~2vLf_{yDRa0WYut>fcI6vPCq$#b09(<k!(jQQh`^I!<!mJgy4WT_pQJyGm
z{M?)y>SQ;vpS!R{zzh9c(t}?+7gWg#U}2&sdwODsZzvokJu46kY!Xu6Op)MOD}#t|
z`MVfo`nZ_O=Y|o>d*gUZ2RK{1fk4i+F*%ct;*9s5(uMQP(ZfwnyP1uwdID3wk(5qd
zCmSaSR)=$c?YOkUWUIo{n1P~jc&5vS(9J#_{_RC_!B2`8cf1iY01``R`Xa9lVCZ6u
zC7(6-qlx)9H-ij3s}1P&?O$#GSj=7{2Mn%{-QK@=*OvQ3kU#qPar>X=d;m~>EHT*O
z<9=YTT7QtnTThn!x8vI1x@qhS`35T#NbbKTMgfwy|5{-CS5Nj^&hRAB-S-=ODDZv2
zHg^6PdBr52I9Bo)7_sRgByXt!u<JrxzsB?Y!a(rCJ)aRHCgbB1LF9+2>sA0Pob0|h
zUhCJCKl=B0+0@H?;iR`d&it99()tlg*9nzZ;A^*>*FAI$m84cD{+4yo1~7wPdc0oL
z-y__8Ms18k&)7rVUN0Fw;OESRRFHev)(R63aKSbndf>Lu-h8peAnEFJH1QBv6+ZAu
zu3K7(L@Vv3&t9@F+13{)BRfXI(_>r#U3=^7O(bydf6w8qtD=nDV(VRG?Ox6)=`R@J
z&zQtet)+lUY#PxIihpmrSTTGGd#7UZFuQX2?+^)e)_ldWbNR?mjSsJgzqfb_w01tO
zT-+UGH{^XTUH?n8!gqoZN_h<HV)U*p`L6lQK|w#_d=q;ezMX3(+ipydR)lYL^sSRj
z$&ZqHCoLa7s@}-?&K!?F<k&YE+Yq6ZOu+yeIuwI4Qy-irUwJyr+nu*$PsI)Z5#i&<
z)1AIb`F`rad7)!)qVKmd?EkXAcID;=Azet0eTy{lw~c3Ojb3U<4`Y7fYd7x4s3Z9{
z)T^=1DahlP8_v*jcEBj*^8lJ}4#F}*Lb%yCP|;4-?Ik@Rs+)bMowo!Jz<;1kpcDU<
z7;odb>Gj2=$XAJ5=c^-~$e6+aZ?E00+Z!!+0xF2nI2UE#fP{x^VQgU5fw*ok)r-z*
z4^P$(ipKRpz4l@}wFObd0;)%GTu}VpnoqSUL7k(0fJ3UQ1zrrNIn*KlIJy#K73Zb*
zsM#WWfZ2<N^hXIBoPc+}1j(CxQ7KPb_&)|N<U;;pt~WafAd7&eRWhl4sFcpyb-mY*
zySUySF4IUGrf?wNMAE>TRNSC+;&Ax`cHM7x!;2e8Cx9D$lP$`oOu5kL;npmkxh+CM
zUktE6WnAL3yA9St30QSqG}DBj{e_uK_G+2g?aLj<Vu;48b8+ht5VHM)u@B7k#PTv?
z_IkwHbda##+A6#xVH=V`Q1z<&63eWg6?ECR9W{OK)`I{l3EW=qY`DF|6Z`EHp+9aQ
zp<Eum6ecA{ktF8P#jP95py7-qHh7KKb$cGhl(BVr0w`V5mNhrMjX1z?1znSDS=Jj`
z=Q@0Uuz<Xmob3X=O}Hiu-k#nfXS){ljw%Svj`r1d2PboJeespC6Kj7Pr@MCVU*Sl6
zpwsz6+uMCeoPo>U$Giv_1h)}2_*Li5PmMe8MMjb~PyB4-DTG|jS7|Zpov=0Ghx^xw
zY&TI?WT&*8;+P!@6Re4l+VW1ByK50g<j^7cz^iklC<q-sGak6|e(UPOQSLu%X96R%
zAXWJV2ht<_qO%I-aMu)IU&p{37*d(9l3!Hc$cL>9KZF?;Ud|<tcK#8!K1{jOj?dwY
ztmW=Y5Tk>0`w1TBrP%2rFWAFG4`c3-De)ZhJoxp1h-{=E8fn3n4!LorK{M@p8;Nmx
za@`)qI$KdxCEKM7W=PIKgvi-U_xI+|w$MMua6xR+qnE4?f52Q``DB&WwfKJUACGOX
ztb2eL{XFfscqvS)0C<8B>CY-Auw(@!MVl6`?YL~`8#9x&3p`sz-&A)QeB+(tOdR>x
zzmV(vxc~ccaP}(kuW8OVQR`|%EKe8`vhf!E<Nb++HboW1Tq0qC1Q|a-hP}%_E=S(i
zEq3J46~SHH#%3LWft|8R4a#U~4PlrosjTB{#prXfiPh@j90r+W>Sq3cwf{ob-}y_I
z`?QOIciHF~pZ9)`D0>{l86j^(CSY)kVkuSE*2dtswXSE!jxRTL^9Ce_rjZHn(fyo&
zz{qD)mO7J`ATTXDp=8oD?!yCB-8X`pxAn=}A&KhLSE<?;8A%Hjys5_|cy4mcHxQj}
z)Ssn-8%X=|&?!u~PP}AKc4odNgryc7u(atg=e3_a4>2goRG_dv%N^;>*rQJ%@zMER
zYeUWj@ri246bNRjDGl+r=P1pEq?-bMN;oPGBX;v2b38%UWsni6vFbuuv77TKPhN7|
zQ<sGIJ`B#jd78T?FCC;qiLx0Me6hvk3piNivN&i+sHLO_y4{s7?#>)&>WpiI4mMq^
z;|%d#8FPt=c}@HO()zOvkCPqDo*bqI;B_U49Rhj8Nh&+E{g4+3HUgOU^1-$qUZ(%<
zs7#PPT-Ms$>-uz<^5sE7=JD-5thVx!H`$=44~XxluT*v)1*xIC=sUEhynPBQ6(>K;
zxR&~=c%(LkbvVCT3Ma4iJP-R099sKRhfy`9tN?|hx4+KD-`yQLIE~;DsqL{7T;*#N
z<3FgO(hHbx0(`)|6V!Gq8yF|jUk63b1!xaSIUrS0WDr0q^-0kc_cSLw_HRYL)$afN
zm+eNNRh92qVpM8i!-Grgl@kD8pSexkJl=MESndak)zw|np{eGw07pE;5HJe!mX^%>
zuzZioA@voPq|h}s#ld0ybN|m5_d%X9gndyf`C5!|sLjmVu49qJ;?RZ8bB*6|LjO4@
zG(0cN@Qh#o?knd(IMI%Ls)GY%xeKhyyFaV_g@66A2BzPGdVW)fGIS+>6nXAHMM71{
ziUkXHO5RtrgxX}LGHyADUfI2oPK0es8t@TF)w-FA*q^j3y+m&TY7?hxo$6)TbaU;}
z&C$n|-qGtJmfvZQIx{VYzn}p;${j^L00}0~oIC{+)PuzIKL-qYj|=&9j=p-WrzUXz
zcYl9|4ZmhA@?wQf4@_D%X;oM3Rg@crSQLf?A+pe!am7jmfHR{EY59A_BRQI){}8BB
z|Ca-v>_J)yx7U=(8nbqqSO27Sep@m;U)u{|Ic?xSIaL5{3-%~CKUh~6i3Ue2JN!v%
zK6)!A3E`LS88>$wbI4k&4-#Chq@%=X!5gM^07<$gLqNhY)LsdT*sdU4(Kbd~>0ff2
z{@*5j+SihQ&Ghy9QjwQs3Yl@kji@dOfI_%}s|D@hR_+6;gvZV$3yISpT5#W#i?Zwe
zP>7V1CUV~Je;roKp2mApjKS=xL1I|Kf62LTC!K^Bhlnd?wJI5E{J(_qya^ILM<~ty
zO+IE8$G`hY5tpCqxw?katNQeMS}s0xAG~(&`NI8O1{@g%f9FeNoISBEs4|~Hp42Ya
zv^T4mkEDlT!!J3UkHmw@%JRZ5H_EmS!q{4FHSF`%8_w4;p-rXviQKmWgcRy598lv!
zrS2mkahHn0KLN$>^P;b@Ho@s1CM**WyT6|Avr)DA8}O?|Nn_Tiki&VYo{5=}fhg`>
z;rr$Y?%}>xP!7M?VfZo+?ez^-Tu5Ha#;OMDd_&_(_tnA5<w5`Di2Mx}(|=SBWp)k{
za3G&Z$~#ye3-e?>57%xXhBan2PaIJ|U`79ha3A{{0-IePuLP{1k(${R)Vt5XIJuzU
z-#tBDa(5z!zf{>OH373zd}zz!FMe*gt_HAjXBKI)f@eOJm!BZ+UTEkRt=9BS4pTiD
zX8|d;dyO&}k~yFtq~sx9mG=!lvU~5#|6ljsR}2>l=+E4Lg#5b!2W<W57$$K6TmlgK
z$qHuPG7gd}=y5J5V)sv-W-Qnbz;)55%*{j}Q^I3JlYXu9oe8}D`wkz?gKIsqyY}BH
z!C=0<@`dKA!=1f@=o<B?J?g^^WpUJShKtl}ClL<9IR+L$PBZT+`60!%GyE}RM~zaL
z{r|NXo^NHXSHI5=VC?wU3}$=UN7&w3Uz#?b1WW;k^oh08Yfr`d?AE}RI(i`$EJAF5
z^dzLTyZ^P$gBAX9s14uP#Lrdh{vbBtqnZ^v;(X2fe~0@X?Dx()<|kUdL0$)Y`1gQ8
z9{l2c`Qh?4<odUL!N(Wv$W3<LH(;9JEcVl-EvrEgV)_>q^?CXIJ`@1`K3w`5{QOIx
zx&!l*d?xYxoR2X-q1#J{<qr!tx1Tthw0h$gt@Q)WsrYW>2!HB5UxD$@;c^n2<7<4&
z)j@vWH@`}DwCjA>X6xMWo%xRTC-ICUpO|aE^3*>eQRs*7XlKSfE;=^C(;x`!q4i>z
z(N~QE1ci-<K7-C;k~g1K(#cnSCsCr=4kPXok*Ha7CMq21(k2={G^9;6u`b?0e!Dv)
ziwD+9B;zetmzyDgig#Y1Ck-JxYFu9T%-l<S*%UPU90z~@R8Fxtg&MMb)c@{{eeBD_
zuZm-pH!j}I<h;$Sx%*I-crNEsP0;p__p1T3L3L~59>`7k!TJ2PEg$xBmQq$SACpZV
zMq8v@6Y~rg3@IIo;j6~x9Qp-vVxjxW#E!(Uu0J)m1>f)Z^|M_l8gPP0LH)HSVAS<%
zGKSu?&K_SW@;Fccv|ipV{z~8Q)PZ}PFe&WYvw7~l<hFjVMrtf$0|~{5{|BYuXW-*t
zXb8J<5Or>&K$0y+&8_WvGv<<_Y{=<sICLtN(y}M}c=Be()nFX+YJ^>908pN9vYI>?
z-Syd^K7>i&(*ZE8O9{%fvu{~ZHkesb3671Y>E9iMu=vOXu84eU{FL`rb?zL=nS6aV
zww{pF`8s%ih_8%P{@tJS_F`oe$UFpFtJD0eKso@7+|!7390R1zZdlK+mc$pu5NDhQ
zg53hC22G0g#D>s-w=n56Py$lkCIK^hTZq5fBty6Wy+OEayiI#Ll+`{stFL}P>ORKD
z1*Eun&)Iy>;aS>xJ6y^0)EC^#LT-Rh-&1isFE9>t#x!)xi()kZGzqQ_etYO8V}1;?
z(d_AlonQPzOOFRR#kUphMaQQ&Z<AJIAMtr+G@~3GPx1ZexrL+{nq{~ptpnN!o~;mb
zNS?gvvEAB)%l6tKzk{WeH6rEZJFV@bawlU~5*Id4LRpi8fRdsI^=mR{WE|?{@b*hz
zro)tdx5imE*nGHF0Tp#AgR>D>FOVK@NWASzN5SN)$+}Z+0dPe7)elNP){c=p_4c?$
z$XZCO=2TZCXc_dEn9oQ4CU>oJ7Q>MDFzqOBhjWoU>8y#ldaSf-xd8#!4mHkZ_t4Pc
z+!3^8<sLy%!!F$eG5$e>eA1b#jgV|r&NZFmi3Bc1d#tMaG@|GZ=$KIgSIBt<bFYz`
z=Oon0%LJIV+%3CHNvhL$2U_LO%aN~p{zZC<J0x6tIq^RJCl70CIxiaE-MGNaBcVof
zJ9)x=9e(HXx(G^BP3)i09u40tV7kNCRZZrj6SFkxn{tE$Li_oSME#o#J}cYcoPYbN
z(yNPK>To_}IdJ7=qr1cGqSLUwN$%jlJQiw1-^>I7_Tb!LIKN30dUoPhLh?rK76eNp
z2XE!5`7Xgz;CERIdDMN?ebK8FFPd5OYKsJH00+8iwezpmUKgTDXU!hYdQ|bCDd2Hi
z+<Iuafnwu{4N&R?=urlFF?BL2?K2C1mH8{Se5-NK^52MyuQHdNZW1>-W-mPMm<21&
z{(sdmlPv@0Aj*%8g}1Z_QoVFA?Lf4=0ALsdUPGB-<9%J7i<4U(PXEQS;~#$H$wjC2
zndY_yWKrbDZC5EEi5#?o3eXbCWz$lo^A0(0yVdfzn9FHVD1x`!0>f;#d{Nrl4f7~_
zWp^||T*1|tS88^5!#onTvw0=#6G04ON{qYDH<HVr?x}qo)qubZcWeYCn)&@-r&@j*
zr}6&%K)R<Vj9igsIK6s!0;F}XY)!UCcn)^E;7Kn(3>tYRAn9>oWgiL1kJ%mck1MNQ
zqns?*lc_@|h^s)a?Cu?HPv?AFi&E?vvgw!9nUT}nw$dqplzqZQuUpAqMIB=Q<%|0D
zWZzSlBxb%Ijomqi{hPF8^>oWs$&kHl?W`6fLwRxR)Ekr{bp?`y&2E&nO`S|^9Il@}
zc{5r*GrGmPV6WJ|uRr_7w{*t*?cs<ZLU5nmTc2`>V@ewz=!s519rBuLY?u$X_t#h_
z(zp9~Gc>2N5mlE#VUwPM9CX9mzck2ElLFS;*yCZ^?ts|-;>i@h?K8VSe3F+!Va{OW
z%&zCfD*~_mN<qZ}punF#-V)Y7u$(^^W{Nx{kn2^*^kFO7zfc`Gt(KbaJttu3D?2{(
zPuUsala58meY;y*ko@DIq%2lIz#T*Wn2fnK+HmaoFFOLU7d7>VPHoB(4V%5@M!o`K
zA``lsJp4JA7x)9WI!=(gG2u&(`(<8`gU|HMP;Tphqj{b@U5U)QQ1wi(4p<ZHALkuy
z_(tAEqlUU(6TBs4q4Oi-|7D;ixY3@6@vJUii&gx$N2O0Dp<kC#+fx^(7JvC$rXg<4
zBz7gY{-NtL@3GeRhcurdxQD6NN{yHYh?E%JberGR5<*c5lJh<$S{z5ifEf0K%D$eC
zIz<^^5VG~{K%#thFs&b}DU&V!Oco4t(~bW+TpS({j%|d+*1V65Q6K0V3Qhv22$XPY
z%t-sW_JoW1Z}OVhRmv!>c&gbuW8(zbx=~)U1VqV$W8N$^s|sMXp;`T@d2d<=OLuj{
zlh@p|wLIO-%E&cE84*gMpoMXA1RHBlkGE?N(oh{pI`nvQ9$#)h3H?MYie^7e{Var+
z31?Moa%g+83mN)jBmM9Ntu!=$FzJ>ho#r#HY3Px@|0G_##PD{PyX3wu1)bQ0vgQVI
z+Pu{EfAF>M&RtJ@@R1)x?q(k}&AuuPhS=PVMj8>`s6*82PE-78CEZoM2$?xrvBE=_
z^|reOgkd`B(vD()#!gaI6O}BTZ9gQgoE>FXT<*q0Ee*8|n3}4?42=_ilvm$;+;@MG
z>vh{nb6I_r_Fc|G_GYw86ip<^DxS)Tl3^j(xjMA{;Dcz%5N)UtE$sy{b>Mt)ja$XM
zDpm}!BK7$8i4TYb@J(q6TJg%0Ge^ijn(~G!bTs?Zf!F17XfjA<P@gv&dvtHOxRH<s
zOO_T&urU~SBGmqWjma`O;9H{`EeE$(HoD5o8hO39Pcr<kcAtm!GA@9S^tjfM#{eu@
zRdC-nYgVf{s6@FgA!^^1KZ?@jPN@trS1G&^P+l`>fif?1(Y8-cpXgAoKExw^&CI3~
zeJGyzqp{hm?}<YPwpkzjEv^T%R1U>i*!{DndLR9@(h2tb$wX7$M@yLlESwaJo7gi+
z;M8g&lBFCByd74B^eFA_>Xt1aG(iQ*$cCGrmD^N}R_ADmiWW7<ms|#9!1$WO+S@qv
zPw90UFgq;|-UGzf?g{*>jqUM$u==2MZvWCDQ@#%zTd!YugJ)|YGL-o1rNV^}Bwl)W
zKM!M>C3wUHT&S<A5u}uAn^@ZK2_AOnS=gevX(K-a(8IAQhHVBMqsD9{WiS_)Cj%~&
z+j;ssKHbU)TALKPrxv)SPH2^O=<19s&W-W_gco)k$At)67JmlU-SRacy4<ss7?55P
zGv+Q*w?lG|dgcS33#aNpCX*+SAYyCKURN8nNqMDX*L7>EOw0b<WRZISTxH6^%bL;j
z16&S^AXejJG?}{28jdz1L0zyweut9_n;nC$(?ybyHQ4Z(8xn<2XskwMjH&D;bS`=S
z@LW}wf6#sFMf!Ua8EwC}sLsgOmJb(c=ekIv=%rb$bnErRyn=?`#=d6{i{Czwb;z&R
zo9FG@J5)B6bF{IC9cH$V*`GZ?r*OfI2DF0%ocnr??L~!Y>9Jzy@aHDz+UcMoly?nM
z(N_1Mf4aj**GBOTOFKsTey+GuN3&WZ?#{PMhUc8A*sFU$@2c*7%$3G%iSe1MWkZe4
zIGAT*`woh1{x$XzO{dNmBzA4%$=l|(se`-#=G=vs8yXASjALSGRqyQ~#*L53Kuz1c
zibF3&guAqs8;A>H560X}6ozvCMt-=<)`|U7>PVVa^PV;xCgSE5hwJ*C212jtI-_H{
z`pbdbM-t-oL=eDC&6Ykt!axZ&7&)aZQ!Hc9<P)$55-xvu@{pr+(z{yTBq}m=L8Ra%
zi%$+qdx|OO@lz&`sT3rX=X;1laPi5dgAGp#n0tx1YHoD!5nrPcAnp6~e`js^?B7im
z%}W5;0h1Mi4P}4^;Mun^Ye-!oZVXiRcIE44mLeC--@`yXV|wbCb~^T8%f;5-_Ig5K
z-kf3;-o74-^UI+5AP8QaE&f6ZXT0lEiz^==CmT?l<mZQH8TSPWfjSg4D81RsBW<l7
zQaMwT(AaF$uc$mw$#^fSv*O46T<S<dh7cX3c+ZxfRU$B&k9wvt{Nwk}x3wxs#XzY`
zOIww-y9b1y(h>T{%55z`eY*o!+EC4Q%mHHFi$DYnwLEI`7j}XweBNduc3f7Jclaq$
zp}f)obBa!X$5uG^qn31yKKJFmqCA6#Sgq3Mp1RRPhhwLD1uUl`LZwXjsr+H-oYo{`
z0E0<YEE?-VCGvFX+>!4ePPKI0u<yL=yRet^`5kZKy6o`<!?)v}L+Hg9*}6q;T2q^4
zH4Zvl|DgY5r$TW=96WVMPDlhft3*)*ZhKb@+?w9;g_e3Pk%&LPw{?JpK5W4qBvx%!
zYDRP>QQJ%Jd;R7Qe|_b{x1n9qU5x5K{Kv0O)Eg*pbKumSpun)D5~|b^TsXLzbM#g5
zDq>DtCIo?zm|d>&&cx8$p{{u|qYq~Dy~drJ`FaSkDFtUmn^cmM%Jpr)VWPZR&@?KY
zKjr3)-$h@2Ep^GJkTyF#7G6^d+uez|uW*sc6L;sk77FK}lcO8LYcyR$8r312MPOlY
z^M>NMtsa+*nC+OoiR6@5w~AwIT^P>?{Qg<LdRBKXYgnwmYnw@%z%j}_s^c!qlKc#w
zeNop5Nkq4?`0J&;=<T5J!qb$2sgdWZU(DyWo+tq)rTLysz%~SCY2$k4iNY*;I$Q3!
zJDx7Z)Tc6fNl=`z7XFJVzHV@rDB0}SQrMK~TX?gpgX6<0GvwMJs^$clFN}a&Qc>dO
z_D{KV5A+*uTgaz2{|P3>>_T4SKFk{<09Cpml&ygZ5bHvVE{13rja=YQ$7RrJmUGK@
zj`78?cC$Xv#N&q%J0teuTbK<OjZ;w)=yDCk@D`yAF@X3}Mr4>LCVY1OWq#fdQ`@DI
z&|KBo71;veQ<wT$4T?RSv0W>Dx3xy(f}cBscji|18K~Z{dOg`%ya&&Dhv0d3d`bjO
zHCXeu*;Uv2_i`t$3z!k(9@Ri~O=4K#(UQ(WlMk`7J7(CHjY|Ey(yqF`RqO;eM+ML5
z6=-!mw~|WOt?}V4(Ss7-k>5(j7I+7$nj|oN`}<~2T(WM2U&6%tMdCLLBtN{DXkip?
zCPBJ3Av9;Wt56%^l6=zHl0)P0U<@WV0rlue=;EiZTLOtuaqtf4iM|Qv4Y~E|!yl~u
z_+4L7{*D${>e5jqsx^--A0_t$Y0A&hMAAH(w)X9s*#6^m3Fn<)THI)d|APjK>e2GM
zcup&wz&A$pH@q0GTZRs#&bV=J*Hp^Rqc|5K3%cBO$^1jXCko!ZV_fP-wiv0#V`^Gp
ztbTjH16LdRSZ~eoSs^Y&A*?lXo1~Lc@ihL|4A+iNk!w2=8T}JgAnI|_edp>wsLj^b
z7gXtMeV6>5iF;EC&SQ}cCt}1jP7pNK(3YRA$;UY<Y)}M0eM4>CfoVM6!t4!!xe)|O
z{ioCRsd$AGP^B$mZ=^PEG+W=W$Cimp6fe~`kJA>AN3%7IKqcI`Cv0JYbc_R1z)~55
zCtKaK@~`#khT(m)y!i-4ei+gx^01t~fRL$g3&28$B%Ot{xQ`(<PTo@m5bMZ^3qo{?
zjdV%=QsR%LdpTD~-2Ce`bK0on30TMnmY`7U;$5w_ILbAzpu6ES#1Eow^Mxv?*P<Z=
z6aXvr{JTVf1zTO(JBc?2q-I;39V0!-p~U@tHT+`vuA-R{@pK-0fyG&^+GYjnS75wp
zEOmz&%%_!Z)^Ye)1h9RDF6Tj$+>#h9TY$RP++!0AHxr7Y!mT5>EkCs`M93<f6hL2{
zALkjUByl)#aTFOEQQ#eJ*@}q|ovP!I_m16s&+N>PW50bllB*fy-Lg@JXQr2{o2Ldz
zZ{i~RqcTr5vN#Cc>CM+>(amx0!u^<2QrS4HIk>@sXiR<;=|-S%u)brjkIUVmsaZGD
zQL}Kus+)KDPNdvBGWs?#x}WqYA<%I0`y;Z2gcQP2KMTz%V7)xfz>zO3hYM}zaETg~
zGT5jOM=~u5i3_>O9vR{Q;e0k-X<j6mAeiiRMtrh7-0b>ZV`!kT&Jd|?NEBsMSM2W@
zS(r_zMpEgWwu>>l&6kc;x{iRmXtOEyz&3SKF;(1Ip?SENljxK<ceC3TmK1_!Y;Xgg
zb9@g^fbugUo0tWJ2Eu_ZX_sJdvABDd#3H(9@_48i6OZ5u8Wa7<0n8F<O;*x_@`y3+
zR>l`p(n)gtid)Y~VZ=h7V9Q+BkN6!i3m)$5pv;h>x<W$3o9tEn9qf&+KBElC`dqZU
zvcgoxPW-7xxPZ}mdRtU*VsX=U@D5_{5c%Zj<blEn24^STy1jA!){;kxJawQxf)P<H
z?aq%bsjSnZ!ttHE;Ntk`g4nqL3CcT#ru`B3B&NFA6?}_mG69Z`nV;_P--bEaH{UQ^
zKc#4j8;VZKJ7B@z!ZtX=(R}S}Twn|uSKk0F7$js2x<yt=lQ<uZ0w;(4vwk;f-K}h0
z9IryGMNTwMl~B<|G2WS7!=PLOHFRNtIrb>DAL)6=<WVhP?u03M-Lo(sfpyyPV-81q
zun*a6Die?H4^roctwRn5cG)S8YFS)Q+fKE*iJKA-6r$Pzwt{)8r98c{VonilMdC1L
ziWe5xyGyA02jz2eaZ=(;$L<C96kFXq5g7_0TIvTOj3IkRq!+5OiaQ50X(d#Pda|Pj
zbVRbC*$;jr3xez58sXW`#tM6K^PJ3?uw7J4>UI`}wbQ3!Viy$&(I)j5f6F2NSBwQ=
zW(Z>-oHdfxf6L^t?+!7=6h7$|V`34UrBkdEX?`h_Ior3+1oIa6WNup?2)>gL+j*Ef
zaHi|^maq@Ky@9i~R--#*!>~;K9@N356UDIuC2@x;$F8?GR{^z=wP*XlRI!Ab)So8N
zKZxzl9^@xs6jlDdl|Gq>%D$<NH+capGq25=mk<cDKiYWSkR9=dDt#cKg$m!kR-VLz
z8s9y=qG(I=s8Et`c}z$kyu;GVzE=mpHXIYC4fn2oW$0|nlmy|HDJvTkY<#z{H*J6}
zik?4pY+&lHoBfM~Zc8!V5N3BWa+iqwsw>hha~Du2>MJy3u{Ez~mr|N|JLyH96$AE1
z6aH*JT?)betdF9O)+j1AUfU4xMts%*JVt~lUOVf_`HFjJD%Z-mfl65i`_>yQVpu?!
z>9;k57{6QtxQ=4=xNtOp`uvNZsXE=Cmfxcd#=YvQ#V75d%gfTh8x<aALiO+nTeWVh
z+o%JR?u18c(3RK1#5}?_ZSzRkejU29Ad|ILEIxx#lqsC?5TiHHKS@d^eOOM_?o`mC
z|Fn(_Qsz3{R(tYg{&?F@Kf9cNE`jd~B=6c)w++pry^nJ*YJ_=R>UeGwc{pUQ+;#&)
zvYFJI$Yv0I`Q^v?R`cABbuaCu)s-bPHFSN&Y;>=BX6EzFLE<wb+9zM|f&-q%3|@%}
z|ML9clbj=Y55J1P0}o^rZ0UUZ3+{QEKH2f~108!q7Qg4PDbHq^3!VEBzQObZe3h93
zVxhnI7^i|WY!N5kvCeQb+{CW6Gv)Lxai_f5E6h_^;H{$5M<xC9(+O#VX~&^c?u2^5
zJaoQ4Df@t*Z)FtR8&+%hby1OdlyXwZHOqEp9KPsinc*bEI-xG$hocNyEJ1^xJkBei
z=P>a2p@`zTsn2nI4&RLcNy<imAK$=hK8bt99%0sNXHWT|+{|oWT()NHwog&rgLa?l
zczFda2<}~7@%q><{8ZhoHt5mhe16Q{lyFpM1SPiE@TUD2qojYTKh?$I+{+WF(4zHm
z4YvD4P#}4UlTkf_Xl%Yzqn9lrnk}ic;GksgVAL$WJ0vKh)K=&#G&^T@w-;*%vJ&}I
z#f>$tEp5cr$lrT%hoEB-F7(zZWc~Z%p5{#GZ63=#ac|__Fm2-!h#&_GB>R=2f#I^o
zt=2=MuwqjaJX6#bgALu+6MM5$hW@L-5Qo#mYrra49IMH6R3C%RN6TmL@~6I7Je!)*
zg6;&VIME8?n|mW+#e+LD>MLsM-I>Z(LF+5X>`)aBYGt9LEq+5Zqa+C5V_$3EukqQp
zn|g@a%5t;S*FKm@Kw~qK8zcHDoIKpbtSX`y>;a+_3B`4_hW+!lN2;`+v_)Bdl7c)r
zB<Ozf>ZkMw&f&fxi#c7tvh1^%7Ti(IjFbDIh;eX;CCggQi0<mgufFNmQj@WE2Kd)~
z{Zf}ydS88t^p<{?$?jh-SA9^*TUc5H@vZs$$gb`}Lr$o%C-jeU71Gmvfz!E9nO4$f
z=ykSb(L~C2R|j(YED5%RI9afCC>;GKr1#6~vV|b5rv0yTdkmiSxAbLnB7gWYx?SC$
zFHC*-Yra!m6*untyNfatW%{L)vO2S`J*0LV+{k8dQ@*=y8%#|?>88Vsz7Wt%Vmw^6
z&~ua&2*$XL(Za-QyW}~xTh<-Ye)1B!r0c`=yYF@VO!dKAk>uai?X9mRF=6sM<o4Q;
zg4M!W4YoN~!7nk^J}5B5I%AaW?pk*3gF1b%ggOs=<4bPX`or@T_u^P6RZmlmuoS-J
zMwra2Mu$equ$>W%!|P`Z4axF2?!z-g@^wy};X%3V-ZoqNPz{sYN5_uFx)+fIbaU{V
z<HiPqaj^oREY>?0U!I6cqvjcJZsV+p{-U*X<#>@hA6@WzPxMK%e>nw3axO~ohWHhF
z^8$PehrCNn-uw!#qmm0e+2U)l#gr0oZ#Z5unSB(QceHVeF5ymwn-w{JQ`rY9{b^;p
zM8=~ou-hM)*^7gDevFa;df(Ksy(wYFz{_IngSV7Rod;73;Kr5ygeH97^{%_9^%rQ}
z9Yt-{^wNp=?$e<{g2UYs6@DAfnzC0LNb1tRqC2~KvTG;rW+JuB>^@SbXgIFq-i{hb
z{anMon^moAU?O<EO9J#cG4UQ<H0evI#}i`o3$=O^TyjBr&eDDtyo9FHzUy^is9})6
z2z=#X;xO+NznZX2NVRuJb&OdVgPzIT&QkLZv&^WZutzQf_mP9ALv~Y<xz1zk>1Fn6
z@f6Q=xOBmO?}MZ_o6`CRrs`7yvJ=#K{nJ>#jArkx;)PKggj_R=sL$kDq?-~`DxFq0
zou?2d46U6lWteShU~)kFI>Is=+bFSfC|_4aRqJPlf$27@yN;8Tw-KMHcH?Z5d$U&?
zrf5?11Q*(0w=@~-xEpGTDTp=MZW!gl$^0<lpzooO3QdvqblR)tlSM@Kt%gMsFi^lV
zLxscwx22#LF?X|=GUQ#vfaTl*T7&Lql-G<ZZ1tsnM$aPi3a_lz5r1h`B{e9F))e`!
ziM}*Zgo^`~W`%bfh`eT1dGJzsvn4`6)u$o4Vvo|4x`8a`>$ZY9`ba)6moxi7t!j2M
zrb91qFvK-{g9d7w>m}}^cDck7e>B!Nn@21AnNT`*S)#mu6rRG#KgQ@~ZbkD@$v8{R
z-EQlNfGy{)Dlli{`+9C2_UQvXj3Cu712e+J8+P!igzm*M(5wLR>jZZWGR77=fG^T@
z^WAKw%sCss{z3h%{*xU6&7~4s+0aQX$=RBppgW*Iti)mI%AC;MMY@w?@V@SZ3Y7S@
zE|W>o8SX7`r4~%KO|VyYVs<3raR=0DaIy9;X)k!eD-)E)cZ9FEl)_OUe9MsUsT$kG
zwsrm96IO3K2uh_`#?ie~2Ut8;Ao>rr?TYPeC<R$^wuUg4CAy_`QQ$(Ns{?rBk+OEY
zP##};vnR&8SIta98Bw=<sKfDdH5HqFs{|`glTCG_Jts1{puC9~K1a)TjV)Oj=av0P
z2%``9rW%tT1$BE1DcITEV~qN@FC1VZ`rrsEPck(q|5eNW+A8DG&66bDs*E{6V<%p&
z$!$d?w{+<j2+M?ryC96dom)xoXvZY#xnkLBtS9%*!tw+^v2_$9&#&jcDbHmG$>e>v
zMmWKpy>!$>0khF})C_fN=dGUd&GTnwaqfg-voH1De3WYW9+7x3wLI|ctN2=tyFF=E
zQL`_&R%1IUit*Ei?#_X0aXK|0t62383tnB=IR`fH4B0Cm`x<g4pq(`xvo?t`NyNiU
zm@4uFKGLn+KTg<8bhHBceQYv3^pBc6CgOq*VnLt3AU}o6XTa{cSP(^<Nviv{ks*YQ
zZ85*h?S`$j%dwVT^G)N9=_~mU-?^m6TdHqt*si+*<Br@Ly5+h&Dt1X-3Rqlv7-T_A
zE*!pO4FA|?uEXDb;>Sz*1eXb~bzdT*HcIs3cI`24*ZUI35t8$SRxlp~)#Rbj=N|dy
z?Z<^><dXiT#4n)dqr=gqCi%yhRM+2bv4vdWM?R|4LT+}}gv?;cqxla#*7Az;cidb0
z#64(=Y|`9b87MFVxzLW)zZi`#&9RQ_rWb}nvSOHvM`qqL4#EisBNxj}FJlWQA*fSC
zeLwjYTTTV{gh;%WI5UKmH`{OERnqJ^@hK}bOI&swu4O-HpLdEphw@~jOL`D>0_*-J
z(V3wpSo1<)YV5`aeySl+Aw3O7R5LM3d4zTew8_|vjO*{$II@n3amm_~jTuQtX_~qR
zWd9cOSqScjeZ)t;4xCRh1@6IfC}8Q)=WbG1X_2+T(k%$h-A##;l}*1SZmo>qC>J=(
z7n_9C!aV_9sh$fA4vAiOy?Iedq&U(^mwKZ5CZze%Fwft4CJv-J>&VwBe1xe#TQ<`x
z5(m-vg5l1a?}<i(n_fI|{dhTN=e?m3jO#=cT%d~bj@+9eA62F$4s(7gO<Qe?fx!jy
zRevVFs}=SRf^9!1?^u`zIl+7!MmM?-ADo34W!S)awu)wk$6jFT#-KI8U+ue#fCY-s
zsRJ#>lR|vRmXO!wm~xG`Vg#1;U<H-hE=0(6u5*T)3KETow|4McOGu*_l1xWy>TuTT
zdxx+%soL7D>mOVtrqkfA1LQYa*7W*nL1+mtf1$G+>}!#7Hl~~sj9WJBjyv1$df;sS
zpSmoay*;S*=;9*p5D<%5dQ+_?W#;j>>@e;wSZW{~|CZy_{#k~igW8?HZ>njkeI;al
zHcaiaooy{KG~ODJFk-u<QzQ?Ik2lp<s<AG?{2iH1Cq)_A8GF-lmOb@Lc_9{)7pQbo
z&%zA-YD^PXU{Twv-0X&JnBw{9;X8y3*buham#x(`*GDCX(sthM&V9R2EkG-18MOUi
zYhCRgxv?`BG)iFn-mO~RPF^n(?4;q?#&ntp7Cj%Gl&z{Pv{#M)hrKrsYw}Ll$7yG#
z&U9KmYE?v*Gj-IKMFtTO639$jVFpo3St4OcON3~GA_fQ$l5{z(Rko@PdqQif2!W&!
zqd-Vvt4Wk4DMAQg2?|13vKS%>A%y%sL2d0+&p9*K*{<L9eg9CBH@qQllJ|4p&vW1R
zgAIiT3t&c>`*y8x@CYo}&2ro?y-lJ8PiR=kS91aAG;Oqh+7$48a&vZa@~Dt^2$HuG
z9)JWeG0Ur_gm|seKbUC;PM2xv`%D*zoHM5hK;#1x;coKdyGy2mj$e^77hm*9l%|x5
z50Cqla3XR<*23j1@Wo#_gA7h#hL1>$LUy0b$#3^AE;+f-ZZHpw`VFz`v|{z-9mm;O
zaF*N@w|$3LB|`q4T>lw(moaL>BqC)R)iLxeXl;p@luBWA=t_w6arZ558nH092$*#y
z>K_nLWO$ah3xR(JKlH`54Mp<{dnd=4yIfU$o*^o*^zRn<x{5O;!t%|}*>(Jn%JoH)
zS<tGIkS0a>>G8PmZ%kcdB{yRl0M>a1{eD<QxO6T8m8^ER?TDlLF(Lrd&ZgKrI%g(A
z#w+3g9^!P+4YHQi?0m>9V9l7W!pTDun}vYX!0Q{XRpJ?~iuSpI$aYE1>A$#e)V+zF
zaeQjlBTm}|7%{sXaQGCQlDQ`yi(bQq+BtIS2D*XXB3p_{#cI{yJa<2)M3izDcD^iY
zw|I)S)n}{EP7!l*1VfUqP;ux%R7jJob>PAbc;>1`4*OIXt)VqdvO<ZM);|98Mt-Eu
z5L9VxB@$Pt4Or*9s|x1>Z%6yVcAaq>ft^_uSVUv@;QR|<fv!NOF3H{9KR#Yw!tKbZ
zjsom_i?F<BNs{ASU<g5_8hnFwP4tDmg7sUb+eL>_sk?)Boq_q%x~ulWr&&2^8<Dr^
zCV(S-z`14YEfb2Mamb<Y!Y%V?=t0n~@6xvP=9cvE&tx2b&28GM2m((3H$tO}2%kpT
z`qnz+$1E0E>(jNr;Ff=Ovyw60zu?Tj`e~*+&_}FrW|r>%SDg9uR(I)snZ$Q*)a~B2
zbOT(R@HMtOj8^POl_rn1?{N;bE@t*O&zhO{>u#2JEV)O(?fi`bb@2&gfvQUD3Z0`s
zb&kFJ<YzRWcUTjBm>v=P;DB-f^4!G&SCfQomy*%l6=5_kpwL6N(vF9wG=gei?M?8R
z4n3UP?h@H5@DLRx?>=?)$evXWQ{R~eq~A*qR)1$OuylyRe~uG3b<)mCRNu^QZn!`F
zIbckpgg-C|nf6y!zPCnL?l_JbK+kt$3W+0N!0%$UTX*8^sG{4V7{7?nM=vnZCj`}A
zC*iEr5ZY1U{)y7c63t8?a@(Z~9wl5HQdXXp5MyXaZp&(nyNyHJIWfFmi@kVGb<`&?
zy<1#7(;)}UE1WW^za(i$X;L<0?;cn9mKS|+V0PmWBgXjPOI{_L&^qQBF(l<S8QiRj
z3VkIBlPIm$9L<^@D43YaC&jKXT#t`?F60mvCu>BQNhFG1s_Ra=ah#DJ61;qrxwjY6
zck*iRsGITK{SDB2LAKqoB{B=$<E6f7Oe_++S9h9o#dL7^e4-nOp2^}%g7A4W{ODmf
zjyir8+~A(n`LG6W!#Z(gl0XF!UVXHbJwC6#6W6&_(!b2;pOdkMWK1Zsiy^rW<Dv!l
zhZ|brjcR>@E072@j#~!dV_A@yE*?B*kffyAJdMWFI&WG9nQ9%GU4Ib}+D-ReTwRC8
z&zt_{6}eAiX>Ti4tf@Ln9bkQq7?U-tI+(}uLqSO)9AF(`CZn2l;asi9b_qH;ymV6z
zo?_ZxW-q?9^$%vKDglr%o}Xw%$dw-M*ep%0N5r+3+O(QPcfWx+^2Q-zafgzd*%)*C
zys%JxQxa{IT?E-L<-TCGGAb`N$I3}|Mw~4z*5><C44MY=MA8fYI;V@#Js^sWw@jf4
zU(d0ZUZD-y#&}ESJ8Ssw7+>mC9uB0<XL(i%rv}~-bxroYaZtQl1OmqRm`uU5`7b_D
zaK^10Jr0Dzt!c{W<kW|J-`s?4r=CTA<!9f{Qdv4KZ#z-U!^aBx@WKxRUqHU9Gm#Z0
zSo&5<Ijf6SduR(+NtCqBwZCO@)eI{oQyqrs%TXZZ2kcf;1=5&&neNlYwn2HMORVLG
z++)|*Doj;fQ*m}a{y#)!kutp{Im=tt0=EFN#6D2`a_zYCnx&ED^$eC4x<};&+!}#e
zYeyTy(G5tG89gm$u)?e^42+RGVF2WJ0}jK_DG`NGcrnSbOTik;JhP>yCn@vQqLS1V
zo-2g*k15@KJV-T0YaV=9s!h5O7F_Zj@NE}2nLfSNWB>fm2S$e8#V*wAvLI}K#$WDd
zRS1Fg4{@wrF~2r3w|FW^cO+OK1xad@VG4ALVX9>WM=%^Q3LBBhy%cd<Wy)oPr~v{+
zwVGkLnVWu{k}ACjBP-agd8F|rF58e(pl;s`SY^X`&NE2+s26jSyk0G~CmGbAW32N<
z=_hX?0(C&APBmo>TQVBChY5PDEGv85n&!zw9m9KV!X2f#(3eCYkH%FvMS^ZWGfrX|
zQC*RIfqMy++PMIF^NW95Hs9SZ-wrqFHZB#Wd2uC44HY9+MEf=0SQGhE1T)%{lH6cq
zLo33%5<}3iGl*r9(YHB2&Z{ZJ>m!t!H+JkHZTid$SueI7)_sj9L?}oaXI3`eYrKLz
z5BI_AT4%Jxxa0A?Lp>buk*lm3|2${3Copqj`b*8d-x1!6xEv)M;WYG}M)V)DKMK+}
z^#*Kqt)5TkASQ0lxhA4Bm1)p;|ML^Ss!x^1&9^25eS)Ux@E@r3*`k@{hEn)+o>e!<
z0_mVwm`r{F%Zs7S%%&u#$z72X61MK9wBJc%cBc$0NX<_Cw_;iKJ8FO~xhAmfM$e|P
zgU=zJ+rCZJos~(4nU00CH%%U2iALX6DyNBtD^@<rtENrGHBu&w9DL?Pzy)?NwRIO<
zC8!i!QqoAJJ9K9e##TmY+;ODkb1g4>lG|K-$yXqFNy!|zHfg#v=K3N2f^?_!gup{k
zmYq9@CCf<4dz_q8K}i>9)fAP=L*9B`R*qO5yztfsB-NV2YaqXjO9u%nMYikLF3ExT
z_63IpPu;@k?~PpXdJ`eki%ZtEp`@YEEM(0L)AXh7+9xpaAbFL}m=N5mjHpZDxF$hL
z<jahpi={Q!lX@XDQ_>RH+k^gt$kxSq`O@H*#bUNY#3d>7>SG294|<A$isqJv#n_@%
zR&PFZ^O|rs%<q<j<N-pjkGdx?&w6D|^#{_(r3vdTX*1}@fu(Tz%yjGuS_fC)Rs8x6
z%f#jKT5Mw&Z3aPa+FFlwT?=A*+D^hYpuxX7pNN!3rWK@tHLIa{lM)1`w~28`Tg*cz
z)0mt<!;#*mt!jQTF(sMSfq-jwG*^S}^l!PkdY)Tdl$-=UP+?c$K@n)`mFa=Fh|AY%
zw)MX}AjJKfN6<aX#k@gMaEy^Su^uBe;A$HB^%aX@2Z;|R{(29173=N~ChF?b9l4gv
zd(Rmd{qO0f2jvwA_kvNL>T-_)e+0@|vZ_O~Wb69Y>As`gUZ@T}FhT6yfa65e`9IhY
zGb)H6mxQu%q=L7-P>Bt0ruC?<5yI7ZcdU}b!cb$|<}%qqH;MZaE%_=0V!0*t(mGrj
zysvKTC<ltD4eOGnt)T?QBnLw0D;SsinrA)X{cm=%1Lbjw+`{5S-l~6{$*YN>=~z>@
z%+kJ-cpg&@8yq>swz!+L+FUfu$#O-tSTFZL<w7J1N-YQt6YC1(6?BVf*qs|(Y5P3Q
zs!$xrB0Hh2GNOzF&kZlEyT6ArjQ>BvH%}*yNZ*>@oKW{HF!fcLJiyq*;+8T@`(r@Y
zL8MAXX0a}63Ogz{*nuKw7=yHxOY2se5>ki=O3@C*_r?7RutRuvl#IeUSG#V7$@cF8
z3^O!Z4xXmfjsbimDwOSW8Nc2=m$uOm-IksniGCFj-~(MBXu1%-*)^mhcLHcyyz*_b
zw20(KSG^Hj=2QlFe@+)lv!0d+qmx}KsG}>bbBq@%p-`_MfU})l-E;-xbmw3lI269y
zm{xD`;kND;EiQugcWCxpmvI)=#L83_EpA|2qs_b~H);?;cEm+GJ>FCkH&H)lL5)te
zbcjMN85v2a23BmV`$JNCXte20lgfj5?bY1)o<k)is9>%8c*a4%w2r@q3Nb*&Gs0B~
zg%!`+6*3mob0kU3HXnJds;FWwP54fp)N}c-2|{<$Zq~RWfA^VgQMj`-`E?$8Bl(Za
zw*;+dck}M;BIX?VoGgyL_>R+h6x^(jOO<{f`MBQ-AiN-O@@2Lk-ngrC9JH@Uuc1<L
zmkZ`EF~y0IopDU6Uuy0!V2q56t@a+NrZA31U1CF-TUUCo9;xC-JW%U`YKt-Yj{C%c
z=Gbxn)Yl+YkmS;IG&Rok+L<0RX86|eF88a+rRW_t&l0YO{g=0kx|2OpbF=59b1geW
zne}S42-OU_#ly$LH$tkSDCHF$R;TsjW7Yoe%csnngCf`q^zjUBqNX|&6%<@-ZebLP
z1N;hlS|bZLck2qpO?%UKr|yA`8(bl0N(_*uvl49hp45=>t@H)oaYg%S9A){8I8{%9
z=GojyuhGF>XK-<8T`S`FmPoQ_{7P$Dm%122H92Y+j;auSn69W>I9s7!4)@b;IA{fp
z%Lg&j{zeABb+k#eemFw{0rtno8}Xs7&JTOtWhu^b1+DFs%xl1y-lbRn^~rww|4PX<
z<dT5zW;6i3_41NIDqx*>>F);|zWdmY`MfUb%HT@i_4~EMa5u^LAOct~f7+hYEdA*L
zA6~n;3i;DbV5BZxxchqt=LedhYql#M!@qc44kuus-3oOk|7{esiv%R=Vr@!x@R75^
zhLz7$-L~S(Q13%Sxwa3A5ylI}PbDk_0lCx(*DUqQ3vpfMoy&Xide(xgC2m1+n*LC6
z&uktq(KY?+;6K&O1jKDE?YwKd&2Hw7h0Mr5`O$r@5YOC_>Rq8_kNy_%OwL2gMZs!P
zMEgtH(x6Wij{R4TH}McDYa$ek0B#wW+kVB`z6E0IsiAIWP1p9%cPVJGWo$x|WnM9z
z^CP!9{b`f&VK=Nu)+G>yc#T%^J{uYH|7M|ZVWGBlEL`_)r(!XmJn*(x)7-zApdjtc
zRrl08c+bYGQ&-xIdp}b>vS|{kt)yvFG5<w;CoPE9i2{F;9wKvP4Mn20yzfCPQ@ez2
zx)za7)^~LgXJ(Tq%Tb|8U*L0cmbxv`ed}WS_)-RTT96Q}zDe5Gw=RdO4oZ>lDGqw%
zo^-g2Tt>gHd!TB)D#j1&P)cRw)LS?Uvc{M+Id4r|{I2Yl@_j{BxR}i^-p6)y0ksuH
zwUcnVT(nS*=!O?*<<IVG9aO>fbaNVX3ofv%yDF@!P>J7O!npr~Ic5oTx1^$KNs8gp
zI$yepdV4(Z<YjF>a`TGb;K9oZH|UTb`POe8Y%;y|JzSTT6Og`{Du2oOY|v0e5Bn0z
zX&gi~FGm$g8lK%2<Tm!-F@r`MIwM3Sy;(RFRCz;u0W<_%#Sa6o!h7c7md$`pWq8h_
zfhZ(v_%L8rRoyY&CqaC(xx8mKO?eo#y?B;m%36M<lWpLZF*U$a_!JfS=6{QdfG^{N
zu;tM|C>PS#INTc1Tkjb1*w_s!-V5-`pt9wq6zSxQxyYcCNXEUI4XK&KmZpRK$D
zlA|EF_(+0~GZvW2sgdPhYe`CAG`raqvWze$cyokRTd~vaASf<NDbLV}Iofj?AuC3%
zC^E5|K%&tIC!y<NZg%0^7PlG=;WfHNU;ak1g*RB@14&z>%r@jKsS`wYViGY2+K+8}
zTH9=Y?J4O1WgfM#QZd335+JB78yxr$vXI+F7+B}|x|_o(nMV5M2^|`?wX;mN4!iPk
zyzXHp`{s=cLLL594ql#)&5GQUl(?gFRdhFvJ%ek_dr1l%)qVfZG@RPcYrY%m;X(BY
zp<gc7(IGcK4nE7fuA~(rCX4$fTrlRB!E|$ivF>kcR<a@Qx+}=(1M^fe?F9$jU8b(A
z)O*haHWhchcbeVlJM2v=$-7X?Gr~10m!tyxz<3Ps9psYuC#kIWL7PdyKM%Uv(8B`u
zshcxnjes<1k9d6)F%ElRJ@tjL>5**`j5-ds;!=)<iOs&Rx34E=bBGrrg5;ZxyqUkT
zEWO50(0Uc>p>L^b73)E{O<1<W;J*W82VO@$T*VjcxKa|>NS8-g8~{OmcWKQgQnA}g
zNQJ{)Ked3{Y}@{;Y`ycnum}t8_2uCi*T-ELY0wz^lk;x*0q^~wK9J_#nl0zfY!Ust
zB1=nTBInnSzMF_8|KB<E4ePDD;%`hH+OsC1ZdSp9jv{-`8fxk$w0Vgv@)hnHv?)eA
zGGdUBb{mgM=VMrK(Oh;l+ap4*2r3!f#PSU_=~`p5iMwrU6^m?k)y(p4$)d~>JsjZ|
zQFuBx#JyGbaK!)0U^y&daOpZpL!=Z*Pu4kZLghn^GS5?Dv1M!l<F-@jzs?Y6sD9r5
z3R%$em54#?Gd10oLuz!gE0)%&Gq8^D4n{TQjZP`UhSloOXai8)jU)TkadS2<Mvsy~
z<CWO{SyKt|Df!ZpvyLvkU~DQ`Sxf@?$UJK(>+OUahy;5}<ocN)|3z6LjlPh8N%*l1
zk^Mi_hCoy_au{u8m|;f#|2lkp(HJQPaiFLA&*ssdTITk-5RSOisRC9`Y1Y+Zip6ic
zNEncQo!MjX&7=KKE8@2DU<GbP=+xZk|A*iH^Z0Fza{MV2_vFVHug^cmZmXd%5Eq*`
z8vX=C>3N4WGIv5wM-siZPj`lxqx3Xwz-Fr;V`p%irBxGrO!wya2v}N%X|d+t5Xogh
zTcJCGa%}Toml7MY`&g?uYE;(!AmvjC?ok}9r0-5LFGYTRq#6CEEjKFry{^I;>U(bz
z{LrS8!Z^D!3Z;TAvVF(>tbJ{?fT7-*xnfpNuW4yS`A*1av{Ko0mvz|Bzyc0CQ!48N
zf5P@u>E|WnN)O4y)tu@^sp%AeOCAw9(qFZ#*6Hm57Y+^)_XK4>M`fy3Li_PhYOCpG
zdjUS)nyA=ux8k;*_t1M9mUUm4d+L;Uv^`?qld|=4=RV;<HT)f~kL0(NQQ61F0VMoL
zDk8N1BB%odi$azNZ!hun?>s?iFi7rk+icWmrvmpd<|0tdH~decG>~YLwpd0qW<4z1
z%Yf~;V=odfCP)ftelER^ZUwOh-~dZ?kuC;q1bj8kP7^V&)!Km@#&7f(rxaWv1A_~E
z1IgP{-_i9r2X8F0Yn<#Buro}-pmat46bA#!Ue@?_fE9<+n3&SH#eNcTVG`P~eT#2~
z-2-O8*K032nJ~8e2Ps!?_js2FYKh#@#ldF*p2IjW_rae&u4FZE&*(u$1;?p~(Gr^=
z29?c9crXh9JfGT0yRIo(5x*@}r~^f0-5JYf%|7`L3r9-5mGq`apyt*#u49jx0GPrH
zt!nMI`uhgQu1I_6E7;0qHS2}{i&folica;0;1?nzvhg<qXB$)GiUL127g=Dk7fo63
zc2Z{e;e|3#u8ca}+Bu~T1zr~^DWue!v8{h4umZ%D$nTQ1>uu0mh0Cw7=2Y**1%HJx
zR>#zI%6xMs&7@7)u3&D1R*K1`Fy%I;wM|Cj8l#9_ZT;~Rb^N65qHK*mMhmqZTuN)~
zp|Re(P1WpR+~b<R1k@U!uV~jxaQ3Ewq4QvB!`Zg>x4n=bA!ul6u;27w>`7Z-<G%#3
zQF_O6;gQ{|pwwV4^oCV=Px?iTaS+L=!RL7K=SBlEsl2(R{E5Jtl&p&+8wH4VUbjlz
zT+?Iv=J27|-{m{mK1x5p0&BEArQ$ygw^XjN==3~mOwfw#M*YIQ1By=&FOqxQ7M5v0
z1kYS4PJ(HEwO6EkTVHl~1$909OAF<cUL{@ie}9v7E%V`(njmmZsO{jh^54?rlC&TA
z^<P3EWp!)#H~mqcZh&xE=dgGlD8C0=KGtdJV}F&f5c_$xSR@)#=Secr=ppFQul0R%
zCbpX_X8%giFnB>r+W@+wqZH5+7nv|Y!+#MHORdjME=*)eQUZ+w)7<nU93OJa74t{d
zL5usAnu+&7SAQW#&4^oFQeqP7Wx)yU>3^JLPX;`1|1Jh0)eyYVQc*6hRLxnIfP+DL
zs6puubiV!&Lh1%sm8oe!dK20YEgMxKM~>u+lIQt7JW7i~QF3__C^N)@%iFT`o)7Ez
zwr@kcEIF^D+$<pa@fmARExpuU!y9wz9}5IU!WUxItv#&Nht5LPd*jVepdHR_Ab!uD
zML%S1Wg9FUQ_LP<%=x+8=F1x@s#LtpRL~A&!BYLpfO*1hak+JnrXT?s4MoC@6eM4*
zaToX->1;I1sc}4j2sQdL5@JYX^%fVnV&MpErvzI#FLQ@eM%^rsdcrgiz43=WYi~T#
zAQt<$;VJsPwLs<Sf5wMyrh>~JZl|d0dAqjiX-A$_uS?zltCZ{0f}Mn^fUKf@&MJKi
zVC&#tj}H4%@>fcCu-h{Yam3e)PB$@@7ChPL7c7@iZWzVevwsbeeqG92x$*NX^?>-!
z|K%#$=I*tiitVegR$zubs)5hY;V$D&x*ATz2~b5lTE?sK4L_E!7N=}c*!~Y83v9qL
zhHI&_LnUsog)M)!f6<?8?bLL^0+|R?tE4sLC9|rAjJ)>>M)C8P4Y0+}f<(bdde#FN
z6Sk!qo7pmh7c7?vN*l&nAC;>Bwk?sJv)d@1Y}YR?{P25+yY5fB6|SeO+!yw<`?jsz
zhXMEHe3d@Rx7t1f0>39mVSRTh3B)4Z{lxqFudItg?~fCi^%u!sZMVGNowiy~CBp(`
z!=o){XYj)p9a?_xmj7LRfMwI@lF%%;Jdtbs+9@5gySOQ`J7oOvBR^CH8ou7Ny!?X0
zx3gU914qtdl*BJ<cvR(@{amA&LXu$Cw4Rv;v=q!>!DVZ>jgrOVsuxZ;>*k;2`dgwg
zM}6p@1;xF}`ye9r?eu~3vLCh>5Boj*ySrwZ+fq=6I%i6YvRYnOZ62}c^DBL~yse!&
zm2}zL;qGPK@}}>NetSqQ>ZVGweBkm#KrD<g9=ROYULZ@7R)30EmP4q(^KtiY4^3}r
zP(Wkw6opv%(a>CZ^gtvY?FANw;S4?lbDA7?tPULe^M^Hob8C*a-&j*tYx|dPN>x<r
zS1&E^d%U`=oRFG7TJP>ZOpepK-F^2T?aIUVAkANi4oc336+4a}NHO#?-%GqPSvN84
zf^`@Pkv7<S`B53lD#<>&qt3!%+`Jqaz9)D~FJA&wO8s&lP_>y(*nLLNM{>goorH(S
z**==tc1GcU^{+8{bd+G)h?{t<J-!Hy(-r<y{Cx5$_hx{pV05P`P|`berIL(BV_O;L
z(67<$cr6khzCj8;le&8~YxrHHawh2`|9`d--{b)a2z3u=cEr}N>wS~C$)tuJ-!^1>
zL-p5fp&L;LKr>7@KSukg)`{m0N>>U?Sk1i5a?s*lP{FHp_c=}xSN0ydh*FmL00an{
z{Vm?uwrgq1%3gj)a`MhZ(DI4RZ3rle37oV#qMAVrin7Gge2LIG*%+W<cy6D(ll5PJ
zkQlu(tvgbimY>a!P@%K?=Jvwa^ir|8!i58sNY$4oGDxYRUL^)!2qw3>MiJR*SP3sf
zC0AEWnBChj?*gAs6Lvkg4cev~<$WNCE!ybUY0#=Y=`T6_`4l;L;Q}mNdT1mac2mNP
zqyQkNUp0+^aV?x2JN&Y}%t@H8|E|KBLf}d@$x7eZcROv9JdDd-N^!6}RNJYHV$^K*
z*>2%~IpO28M=94FS>9?A64aFlSFX1bCGVRXAnIMYmrBLj0@J|!4%waRM4T$W22|+(
z{<_$$4wpIIEdLx~?0=t9+ZJ1Ry4fxYV5SMQ9ft0HqJMU2<gXmQdV8g}4p}<EM*gWi
zNKxB&N0M=+KNS0?p)wtMce=X|3q*cJw;L?lDN{Y;rxu1Ov!QODByPk1{qwqE%$|L7
zN$`H|IB)*7N8zw#qz4n{Ns&{@g7*(Sa%zKksY%`91hd(jdTk*sol*{eU>*LhzbEi;
zCMmi$?3E9b+I3H*x#}*?_kTu=b7}kl85@cnD3kR#8B?;ZJnJs(Vb0ahY#o@xuR1t1
zJjR4;n#>ay#AgwRB^mkbiA*E|=t{Ji;v{~U*GH@mO^H9PA@=L}52r>OS9&oZ7ZDAa
z|E_E+?0%@gIr^lASq9$GJ*3A4xG;`0bw2#n)Z$4fSIcZkN+Dt@3T8)m!9Qqj`Q|@t
zmD=A=VEJ=jc|Thb!*2`E62h~Q7heK06LVSEtFb<PbKVrEhUCi=NO!+OLg>ZP#Id+$
zLq*yvwtZet+CfjQp>z1SSJi_e{JWieL}d((nFpKCnysIRlCE;N&Rx*LcEe#%>nY|Q
z+jknd5&#>|vNJyu&a#a6#)w;eYW$?r&)M%YZVK^1m&(E5kRs!T@!g`KBaLz4Wj%cO
z690|K&XbGwuvuDiwJ2vxqhG=Fu0j6?tH%rs>9;F(SXb78(KQTCLSe77HmwjO)&8}M
za@waq|G<ijHwerKBy&m&GAeISfi7vl?R4udA5kT1<!@;bV|%Tv{*yijalj@Dz~@#U
z_;%4DgWn2BHRT*@v&j%UMMqcT_lU&F<UdY!+;qh9FFko$lK{~v+}nLm0<MValA8&>
z!EWOZlQf|jURXXJG)zrzF10Vq%(*Dog;Lv`VG*uU6<I$=EO$z0k<=Q0<5rB>8^$7M
zk(2`^mnQ`O{)6ePr2U|=>_^85osO&&3;Rwcb-GZXJ|W``EM(#yC8hRtt~aFWwB=5V
zXUT05T4ixx8g5$SaJ>U>`Fi@;zGt>LeW*B})R5=wir*~6NIbVoSji6ur`z{Xy5qSY
ztAg4jZzLH~d@@KI=<<UqPF<REa067Q4O}k3FHI00Lx}}yuweNWJB|e`oU>2SZcHq^
zU46O-fYGSaGRKkv(5N13Nx~L1=W4i)=L6P*?rHv|bqpWZP2&7vVFs^%V~SxA@3S4Z
z9XM6Z;oD+S(4C+|TQHv2=+!aF(ItmZh8Gs24HaPxqMQWaQr;v6(QIFKV@HMMT@{YN
zYV0c;h^z*Wa4+cP_m=N9{VoLEt4~Wx$r!{ttycwqH<f1B@_HV$97K%`?{K6Z0FGFS
z@aX8#@M_Di>FntoFvD%H22yky2NKlwfCI*CtR>d^WN6nHN-lw3Z^zgb-R|uYFq1%$
z39W+1RU4_Io2_`iK<QNe<HmB4#5ZvC4St7?algm0s8bZ4lAvn#@pVFO9`Wx0P#oxz
z`5)&jvkv{r;kr-la@|&kh5A%MzI5^dH;$Kz175f<?x=5sQ5@gxJouyMbp@1sCB6ny
zWFPpSevH{x{>y=klJvH>$OF<Em~Fuzh1vMuZ+@y8{g3<@+i5eyYzC7|N3wd8z2bzp
zpYSeYn_blWWczTx{_9N+*JJE$-zVFLoe%8yQGRyc{+0V=;Jycc9_14)wpUe8$|4R9
zNuR9YfxPVNtB@bATAVLH{+gQ*v)}gT1IF(v70x7ohCIz4C~w~$B;-&1#^J=K;DwK`
zoiuv$%>@QBSTfab`zia5IHTy5MIr$I+Xi$TrDSnNur=xz{qJA@py@i5v=IEF!@ztZ
z`Rk&`#l|AtHY_VvaU;qYm`s2ymW@Wh;;#^5VaWMHu307tjQAGZ7==*R{`pni?2i~X
z{~}^APJ`c<9x6R<BF>|~`1>_6DRI9bLf0*_j~v)Cdt#pi82rc0yU}|-8}3=NGIAht
zRI@3LE*QugKh^2Vs2~>=A!w+1cA)D7>jrl~!H{3d3&8|jjknj3u0OEY3EC4>_UOj|
zM5o%-ZJeXP{X+=%L&0IemLZPK-+AVj+y)dw?ymm^lnm8n!|F|m&o0v;{o0Vv?)iFD
zmDui46t@H3yS)|&n$wgB|L*uW@#N){gNCHm)h9mfG1S`|v(eS2OSqmlL>7|9-3Rm9
z`68+43d_LU1>~>cpimaLsVKQ!CugpshxjNK(!wo)I`{wbU$dW9O1)dlW-GJ)ao?Cq
zZJc0+(IN|rj~15fOZ16>f;k24cBHk-@<HHY=Sde6e<YoF%tz%e5(D2OW;b&Tk>SD~
zlwyLL1JciqRP|)&;QfieFbjH=B(9v4v%*6_kg~Iqz$w*XFTQt*5?1Ufs;s}6*)t4h
z{U&ou5Cec$nFTk`|KCKe|1pNPkF9UNGh<4!!_)r;xC*9X|1O_T*VU{5(!6=!t)j!D
zWuQzW0@*As-Q@c~v6~pxiFyWHUH)dJq6Y~PfI$U19%D3vk*ge0hg1CyP1G?rpe}eu
z0Ckwh5Q{sP&(0bxqNemYI84234=#GJ8U{Y}ucSv9-{f4uIXBMtICU8(fFb~B6g)s(
zZG&!!4_V~Rxc_)bwSPD7@}_kL-2%bNU71lZ`gleGfT5qlUa?ZGAAgXgj|EQ6Yf<~F
z1hZw_4t}O`j153x(sw4@s`${^FF@P{)!oM-PtTwIiNe~)O)1NkgITZ2Z()wTYNN<*
zIXO5SB6QitI?pTIk`0~vO15&YEHG@Z-<#sc0>AC>bTKa<%zQ$=pyU2{p?bH|^d&F#
zQ3K)cKwd;c%GDjt_GbhygQfuvyyB%V+^i?x1@Ssbz<fHiu=$Y!(nEGKv)|XRJfPB`
zZUZB9uggz;!vdP6KOz41&R?QW+z-lpNQCFs3}r1<G@ZH4_fE-WZZy4{ao_d)2)yn)
z_s<Z^7vK9N<`vG;{-@ArMBT)W=0MTl7*Ij~{JNGK=EWuHy64JwRO@$AZLc<U^v39F
z`NzQ|*cmg3de}5-JvBLVs@C>{Y!cS;ywc)-RC-KZQob?SHMasY`9H$UyR9g}_tGuG
zz(ZT8-p0hPdnWPTBK;l&c4O~%IC1cUonsbBCEwJL3nE$U7!?110)y5xyf^f6BgH6K
z_lt9x<u&i>KX@aJ73X@sNDKuTG?u?D6)wx1>n4iBXpZ!ZemQIB7F|cw*^x48_f6u_
z6_m*~5I2yt1FIa~pWs@5czE?fldBs*XfdMkYT!;7enV6^i5HEROIjU$>Cf5KSeWdG
z-nd=`_sP>_CRKGzHYVOv2htZ}BzpyCz?cIA7;})Wc{x<BN4Af9kJ49W8aRn{&FH=V
zAmXDOD$=(AC*4jU%(?nTm7HJTQ{ij3Y@ywooW?UUy2OdjVCq%m9u{#EY8N^g;5KP=
zvY%*t4A{c<GUbC8(vmDYMTaFfr*ihxC{7dcY<4X6tAKh_{so1Zk=5fYBLw%Tmt<{6
zif4jqj$|)m5_gBr(;{|5$ef*(^gQW~N~!>{sXLOVTHh@}HWo}?RvJ#Hs#yK|aM3y+
z`a+NO|3Sn5WoUTa(mcAAM~$?br+|5%vErSQII=5svB15&O-l7i^&4$$V^P9r5L6e2
zAD@Nvpnz<Va-fKs;m5k?Y72cB=HoJAWAxncW)ui#sJ9^OF)X5n$rtipMF&6p-n16X
zk<u-8V$vSrNld<X9D&o}N^6#{9UAHpERhx!7e?5N=6dvSH!Hh8_hb7F<#eF~CI@MH
zQrb{;AP~nbBVE7~0iLw@wuluC46oayBLE3eR<cc6A=|eI-b+COy)z!TSV3kU<H9+W
zwmfYqj6#e7f1b<vB4k}N3)tScAWO<4#ux)$Ha>h0f6O$^1Hwgn;njtCD>uYMg4RrS
ziN1g=e!Xet_YQk!xYl!+hh?$pOD7Z{RMy_|#x;;)#q_1DoJ|nI{9v^7uU_J8tbH<%
zBj{=Tv|2s>F%(-dGLCBBL(n!%^d?n7B={IFy*I;a{x=TJXMy%``42_-g?n=k-9GM{
z1J3Ba>!5uDj+L~{lGw+z3Mzp3T3eX=DU%ojPO{<UL`yw5!;>4@j4|MS>+;CdFwUtY
z<?yLNxcwbt{lH<_->#&uu}J%S1&-vv0`~lE&B*uJ$mA^O?Chc41wBoXg%#a(fE5Bz
zS0~GtO_81rYguW*%b_u;JM1;bLj9%YT<pm1^c0sWdTBs6VIuJQh7c*^|4QlB4#42`
zr1I2<-1-%;$}r=zua<J%b3=UW=^-1lgwgth7abnB0t-*4`qcE4cPB6cWeesx!s=fb
zq0F~HfL69W>;f5w|3xGS3!0s>a#B_bv291RG6WxdPh4W3)NA+Qki3mQ9DCR>(_(__
zq>l=-r&}|rVTJJ%O_RH0r^`*K!rLIWl>pOrR%*Sfu1#KHHJ6v~m)lc|T(JjHl;T{N
z2n1Jw+>vp9!?Y5de0z2GzvUpWfOGdCj4?_$P<T26#1J#4>i@D$>M3H{Z(s7b6rT_!
zXJexja!)Cj%`OC}%LSaog5^I2p|S+le}QmAVgNc4yL|&f>9q1O9*D}cdGwvU$ao2T
zGFqz%Hf^v^ZYk!Ii-$Mqn!r$kLdWw&WXD{&;}+d)_HNr*%UDqM0k4t~uosKTRX>Gg
z7tgN<4AqWSS8TnYFuCv)*^->m<ZvMM0VADS+KoW610yl%21k9>zbo)EVKj5!6`
z-c8GYdWbjv{xg{{egkJ|<e=BFWhPSVZn=|NAO*oMxxX2ex}>=@z6~V!S@ky^ri2#e
zPudi_1||o&XldV*u$95_TY|@K#X2~=uko=Jct@m?KkxS56ja=IXN<L6@NaYrLesbo
zR|_%D#Q@a*o1fKUvCU48a)|zc%Ru{Ea{klTk={4s*NE-K<bR~Z>H^+FKj+*vF2vCo
zr7GKnoZ67wtlJ+)V+ezyom=fe86e8<>r!%E-}@Wh_OiYA6VUC7!YIBox=24p{gPi#
zwyhvrR<uE4`|QxfbiFAGd5wt(p3et_szA5=Hg5h#FL?@Ma2tM}dhtI}H~Ny&U&E#5
zg3j~E5v0#SRC`f>r7-isa1-*Lswml|p-8gHvU3s?6rPk;0p@kf*`z0;4~!D*qaQL#
z<d<~Zf20NqVk*1k53xE%+VD7MdKr#wb*v2-Rsgk+^=!GvdQ^kCa^=+!K;W<q<F#pg
z_bJGhaa0p*9WEug&=0v1C~1FM3$k${xq9*h8kO&93{7Spq_Csy>n(8XkS})d-R*Cy
zzIEWq>L*%AP(NPjAof&=$4e#ECwP<P@v<m!tSPWQUINh|0do2A8tMy-L*#wBj5w0-
zQ0QY7W=|!s1WqBl&my!S_{zr#O|;H5>zU9E3Zg<0K3pbB0l}NWkWu(ORWZ@QA(lV1
z=0LiK)2!YOF;k$Dy0}6KNTE7HLPLwEs|!HM@7cSCJKl)JrT)B@Dq;GbK~5AJ7>;1v
z7i*<ycp}rqCWI`{1v#zES<P75N%+j3Wbg~fT6YsuC>H(?R9&e9iR@trRx;ND-1Vf5
z@?%$(l3?KLN%RSX70m95Pe;44p<0l<StHD<YP`lSiF3un3nkLAw(kBRh4_(U2c0pJ
zI;&BmO2s1}DT3W{oIRgy^ywVe0)J0j!Zk%6#8N(yfd^@go;#g{CE6OHn@b5!hsmV%
zm_zh2B;>Xd(UF8bsqW)}WknS|3msGZNLt)dkAAOd!%YKO2(H(~0rSAnavknxnIP;r
zHQGJnS9QbJeCo?ox7hldA0o0ZJZkIPVT^qX;#(KT*DP=Usk-UldS6xIMm9M(_&(j0
zcc6V{+m`8YXwhug@pLg197DO@E&oUT0l0lVe(V!(`@x@V&rT@3{=(>6Hy#hGT6yI4
z$WfA2FSc1=4iPDCzrK55kj^e;B<O$TOg~h_UCdI(G1##leRJkEOuQWv6+<vz;m(R<
zlZP=<dO~RbU`i`GAeP{dma4P~opDP?KmdYngNxsv7>-nbc2IoUM7XSl0utQZbL+9)
zl1l;6g&=yV<AYR7Wt|oq%2^$noQ*k=-3Z@I)psp>s?ItU8k1AaAkIydhgTD0)8VJ<
z?j*QRY6jq0jg)fL6e)b$rTW=?$y_(ER0U~O;jgxVX04%hgi{k+J432Z4#xjcH$p(h
zX~faV_4OR}Q@{9<!?*Y3y3qpyqQz+Y%)Ha`rg}cJo!Rm|JV!)YUNVdEkjcxBJvRRd
zdFa~sPEy*DEgI~G-U$gOP)IB>l2m4G!tC$bB#%y(Jxl_`B`m<ftI)>TE0jA$>TijK
z#xZvS>!xFo{*pF<@d)}qvJ&noEkeGj)l4l?pdf<59!nUV;zhldx-=W<qf+E=r5Lhg
zUtt^JJ;Yq@TNhulA6pJ@<|SDx%}#NU@3p;%R1gEs-Cg4^YxOSDU){<?X{Jak_gqW7
zS|Uq|C6ufLA^L#C$RGT8n$Im)vmfTKJbA$DlUJ_Js+El}Oy~fS&PmvoS~h986ll8W
zqs+D^(T+rH+m6amChU1>_)Wq~Y@ddsBgu~l2OLGtZ6trhn^jvYK#=mtfLZg&Z<Uh%
z8`#CVEaLYHZGr&h)!Ab%Y;2#KHy;;#=w$u0ZwTvFWqJ(zf2njWw9ExD(sb|&**G)E
zd7oDk*67rj8H9`=9n>ARlxr@&SIa~wTT4OQVC`+pQB>39)*3`7)u}K+ujYSWVa=A^
zJwnTo);dzT3?;~L;HI&tthlRqsSbOTJJtYi-wr=*X@BqHOBt{T=0y;I*!VUSbT1Qq
zbl)_aa+Gwx&rOHjbD7zb`L5%pA^8Av?`Thu;H_a5#oh0+y0%T_DG}EPe0Urfwtx#N
zNN>@cHzO0=vL=-t&|@&2R=Z|z`-{?7Qu#LPJZ$OMgViO)8vSj{H>H;^7>P-VowdAD
zBk^)uEp-6$Zl}CM^1gfzpMFl&QI2103JPR(B)4Hs!~l&b<1;$?h6o=$mnpnyW;gql
zTvqcyj0CoEXNI?8IqB%t8YTj~)}tJ5hXSYVvrw^ZY<z(q7v0_eEmmrBrw~(o;B^f+
z6)EZKxyt-GGi1aJjhSmV%w`|fEq7^^@wsc--%3Hob;Y>PMjLS|+6(P48_l$O)E}fH
zl5cES`oz87@GFn}zy2ByLq(jo(;Yfm{2Z%Q4Bhf<8r0tVEVq?=Kqd*O$D|^*Pc2T-
zUU#!=iin<TDR$mk8b!X+J|-{nkm7e>PM=}QZ_!xgH<(EMu%^E6D*)fZ67d+aF(1OR
zDLDKKkzSF8KD72t%S_(Y;Cq(qE*6k;0fk7l#Y|Nlu;8*gPipvNRvsUX<yUI{CQZzx
zwIwr?XLDwE4O-F~scgyIVNY$E7hbNu(`2fhu1^78-_){+K_WkKTk6gJhGBf_tMAJd
zs`u;>85d+rwN79##xs3rc(!1{SlaUsyS_Az6PqWB!N5E#HTOKQ$ui|ixfv2;dasCk
z2TTrVN&y4-Y!80O&<$Dp<r{GzEV1iI`0nQ>DgJyXD_?me|FxedPtbFVKYxy_cyl-I
z9eeP^uF@OvDM(q%R;Wpx4`-4~HQn(kC2*P$2j(zLb<A@ITthV@ip{aCp4HNOnqv9Y
zW{Iar)vn08v<~HNX$?!!L>AU`532Kh!7za|7d8T$t%JW;H}NuOsQ{MV->@B>*?$Fv
zg!4q~c6I=);2QW=@f7ovOjy%C7fZ86z3jp!6iYPC33L$X#vQa^)&#l@?Hnpljz+>e
z?`dw)3Uw)z+I3MMnDW>OXG?SqejOYXzMG+NZBIcPh|0D0=>`R9F6oMV3iGUHM2zq6
zI2mIYXt`EC{&`1bVk|*!E|iFkzjonVvABb4=Z0*Sf9D4CLK+BjjRP7#HL$Z~A4?7|
z^kqY9uK&W#wz=qZ$WM8dTm>>@$TsuIwS}@?Ao~1=!x}wH64CaMMq-hE*#$dtTmB>&
zV<%9S3rpvLVw&XfU1De#u(R3tugw0O5Vm=*M{#N<Zbv6;cLiD^!JvphBRZfxB`aFi
z=CT0?H$MDhlDLCkmr^A6#p-s_zGF(;LzcsHA?G}}x(=17KT5F(#42p-O=1YWTxJHo
zJ(X!m+3dIlPT$*rJzXjDEt8pw^H|3Du&X640(XHtKKoKR;Wha_)B36orY`4zq>p=E
z{zojUdGHg7_$p&gt^J&^w-Th~V!cqNyv~zqW(rPEOXOme-x=?E4HeW_ip$-*?Y~^Y
zWMB^mWXtFB-jPA~fF-aZA*;JWO^aMTYC7UV1?}!Mh$p{IRo`+dt;n9Y&M6$3_3Dg_
zW2|HE;)+GU)SR6KE%VvF__FjGRcueNWFtV1#k>G3*twi?B@w=Sl2m5fXAZMxK`KaK
zOyY0&r<)Q9`4othzaAEky`oBlpmiry2z=hDN6K(D?2?IHCi$5%T+23;(C}NxSwz~m
zr`$28At@}CdULhj(q2S6uc&6+%xuMZWrez^lREEtO?HTuXfAQC?{+eBiM*m2<CV&!
zrkWVZ$Rd~pLEgY+{SD6>74{lw8Zq<Ok_ROI6Feyde={(KR?95MpUl?91xa$kyohc}
zcXa-|vP5m}1%ZGsfROB@`zw)=mfj?SW&g2s>KO7XSPw+4cTYsKpfF^sWXj$U3I(~5
zrBCHXt~Xom{VvU0S!f*nNJBx4P1EKKx@jq0lO98l>ynry{OvN1r=+SU*qA?$&{of@
z4LrKR?}5Azhas1Z;Kk;esUzLHmYs4AYCN_;;?t!XGsl+6C6H^;xa{KNcqZqDQKqj9
zn$NG9>8+{VIg-`P&Ye9G+Sq2ySNV!f>+c$-Os^lSnTnETeP$y)_)<O+-0;3z*n^ke
zAP0xIVeXlKjF>$2Dlix>yj)Ly@CDDU-jvNI9`PL{Z@`!lS5=3^4gH{83Kr}8R1@i9
z!%m7kNaUO$!zKrCHfwav7I(im5a$4*??dAb9t*K>)qEMqRRU2<fin`0<l7*O@1TD_
ztMBCQ&w`T3=^+*-T}gu*u(sQoqkN=B>RcDqzJp;Kp<QK-v`G%Drn<<K4(!}&RnEtf
zK%xA)dXii#_oA7)lz3fZ`>I`(a^GU@tb2xc#22#P=J?U}Crnddt9C7a{hI_2%iUW$
z`e-UuK=AzLEdh@dSB-@rtucW+n}Su$E6Psd-8O`tB*_pnL5Y^YsQoE=uF2Ui(6YLy
zw$vu$U7hGfh-M3gnQBxfU$z)2CrQo_Sk)J?x|-O|)e(^Wa_oI~vpP@&CdarG_k+ce
z<6){8L8E*(x}liEs2xK$X7X9ae+!Ih$9mO#t7>6EuobfVzwKOWa>l`vX|HQLnLwbJ
zGn2~&p_T{n(6Z1uml1ej(`<R|>yvfr9ZASP#QSPz4`#q9fmy=gKQNEVGmsm6A|~?n
zfl;@Ce^!0V=xU<W-F#<+Fq(B(3MsCZj*Www2$1fJq2Pfasj-~>?+lYLZW`2kxB7C)
zYm;tI@7`nCk7u7}^-|ql{PtN9maMrFkYkY+o10h~pU5elXPCO94L2RRNz~3vbyG*|
zB07}OC_EOIe>J8XL<45{A_$p+xJHdT;ZTtn1k7TK=2CX|=Sco)D4avL?qXXT`?D!Q
z4WPf2h{o1MlHhTp-Ti0uuJO0i$4NZ)XSYG(VRwI)J;*r=wo^n%+a@To%uAfM1C_gf
zy!?<_qD)S^x<l3E${ySg(p43F=3og}&Z;vaeD(~nxfosB<QwR#EQS%sQRLz!&GFY5
zsO+veb3zJrMhS1N_t{w>%f+R_VlocUTiLm)42mNg7mVKxGL??M7Vk4uCXJb6NzfqW
z0z__gRkYMAltkt^a;dm6*&SWr6Dr@e(YJDlGgu~t_ZPHwy-`!qy)RCUiC_Z=KY6@q
zH9auKxCOUa;9Z4NR5IpMv56mWXi~WGPaTvZE*;%lO?Rf0*XMlZi)ALqV$Dl4;Vy*Y
zfIf`%EJK2BCZwu-8CFm>?cLCOG%L6UsY#)TyCs`&m*di|f}HgjMt(3dPSvFxuMW%;
z$?W_LlN~H;V#yG}g1}xXK~kt~(tC=}`hA#~D4nRtINvybJOtf+SXF|$#4dg6^do1H
zo@nw%)!owNU4yn}1TICNK`JHeDASks5E=PB$7vlc1+!v;HLo9eIv{3SiBcD$r*pD#
zHwmb;1Tl-l3c*%{F%{OGlc&e{spinuv;>_moSD+R)RP9IKsTZcY-qiceA+I-&$p2G
zkFcE_^1mPpQfw3T>EB$Hoag@y*#uIB9&_kFk6jY%e(3~_{O9|<?KfK0pLjo3PpOBv
zS3UA6YcNM#Sb^Sdc~6M=UETn)Me6k6wPh%25NAH98YAn0V*JVGI{Ad;kCKREHl^f%
zn!F2SYS@-6FQb1_pZ;Cj{Kw}1FBC>AO_2Q#m+x6p+<vZ>0?(*i_s<pxfM_b>?`i~g
zTfpAn-~R9<OJm>SUy2oNKv@F8jx>Q-XjT(jy0*KiBdS8MwM2r2xOb+2@t;<TAMlpg
z=VIU}<y%9{nL)=edw_iU(k@sh-7t7TF}ya>3^HkwV{=!=4}eFxB$|J`0h(oaS<B{;
z^H+USP4ND5drW9gnj|LqU62b}oL>ntIXy(w?kIbKfS&IodNO~*r*o}*4g|7fAKiH@
zv{9Sb__cxVh(o`E0Wq;>BXC`F)kQrZ`cqL2bP!#|VSLANd!%ScDlUfMEF(4~J2<GI
z8iG2}au5BA<gVGAKRUm!_!sIer=W`@xcY`6wUu><4H;bvukN%vNMo?Y1Bk`Htj5xb
zjmd4pt+BN&x*nwtI!eV-dzz%>s4vB$STl<0VF2tuI|R=^3u+@Pk&4lBgq@MMw(P)$
znvR1xd-eBy?9&Pi(ODB*NQo#X3e*Hv5*rOi3jJeN5*=BWEOXhPVu08dR071{2$#Xg
zhfqFvmfGgnZI{L*obWEc&Q0SDbuxZ-KcWdlHi_mN>RM{)mdHx!5VOPlR6XElzq>MB
z0b!q-&{a&$_mNa~OeTkK8XBJ&)~ChgKerBG_=Z;wF`;Ii&6|D42m-7P55Zlnm0d)6
zm(mU9xZL-w{Bt_vm=m#yr@!#TXhC4h!63=1h9@T1zo-644@P5A<IKOPSY3upv~eir
z6MF7gP$;$TFWa@eyx=WW)VfOaMG%-cLhKf?0+C&W2?Tn$l{JIdvvE8mDN%6N*HYhq
zbm9mNqtWxnaPQ{EX4lmA<ZPcDNu2$Bs~IfaQ%ViLMaiTS_-~8NyY%@Kr%d5pL;GA@
zK&9#y!gs{H3vC#3MKxx-G+w*iZ){>)UMvQ#8~Y^58C^+@Xx8{z#83pq)-`85ExiZf
z@4Oyo_t~aDz~@9Q_+PBO@D%M|-k$)xwl0@JmeU{*%0OtbwunCwb~5uuQn3<eUiw6u
z(!==hcpHu40uNd<Q|xyE-gk0xgC%$02$--lQy<lpab;sf<2}es-myeDAKuPqt1x@;
z6o{O#j|YpH2>LT`G-`q~(gUVdsNQ5!s9#?oNWm9Pf`6!nw9(c&oLIJw&*+dYX(hUE
zr4iZl(my1P+7_>%X`?89@yY~*2a1B{%sF6$m}Y@zr0K{;Itq;HsfwcSwcBi?7`e62
z8g&qJa%u^rJk=DTQ3qAcxlyMpdMuLr87=`Kp0&&G6NTQd!fCpLeRG^-tA}TB|I87Z
zJDE7v7Mi7k)X(OQ<{n7OFpl_n9W*Up0i#oEhdhjajPs0}(C&j?Qkt$#dLBaH?@Y{U
zhUz`DsT1T5MMg;v?oVt3G-koD5m%|@?4sxMYg_mMZLF}a&HT|8f1Iq1?T73(exqWx
zA5ZjIfQBZGGtm=MY?(EocuvuBE#ikr-_FQ7ajk5%H2Xg@Ho>KN$)4KM*l?2nF;iph
zNeTgTAe=iF!38GQ#os;>0$f_y&VkH~;M9kKRsQxQ<vb0MDu@E9l6w=z?QWJcu*Hip
zVqUr_9vR=&`U_idNtz`7u*sgHLdk-ISq;D=OwZULKQmh{BgGmzR3PreeX=iK?^*;x
z!=9RiK<7<4Ik|Pu2?@LRfU#D>rz0mvc!xbtUF+c2XN2Zx6=r6F&2y;gT8AqOTA(tf
z%6llYf{y`@>cQnUN+wT-fRL#wVYTcm%P@>7#qUv}^`$~HnC}>jx^gf&u2;m1IT<_t
z`sfXe*A`Q1hDWFg$4Ns{3G+^Ioiq2b-N{Pf<>T<`^eg=xJ(ko!30}zW^3<h)T0I!X
zkddBUBxUEVc3(1=g8+AvV|uoWx#e1n<V;xb=y{f#dBHtm+ob}X+;sI$Q|*W!Ym(zi
z?Kb6xzM@2mvF(Nib%XDjMrKURZS=U(^Z4OX)E?8X;c6)^uS&MMrBmGsMnygn4*nWg
zh0jv$?(34Q=9MDK-%Xt0<{Yn`4atb$T5g}L>{)PG@*I>JeIW!u2R;CkK*s|6v*jm!
z$|e;)9qIY`S9OtvS~2RvUabiO6AcTW@O3A-Ju5U(h#b+ax%p_=<8RUb)Ue0q8u@Zp
zoHZ+;DzqqRc5ikzPn%B-@w@zhz)L}&X${Sw)?)`-uE}Ui4WSD>HYZsdSq)*=cmM#O
zt)yomgwgUmzo95-K^#^0c@KhhLTGNQt~)<E>jjDG3OaLxP!+UFame_}z<_52WrPtj
zi*L9XYfei@$&e9&3+fPwgOHlYB5fu9+n}6I<Cu!S^(9@p(Fu*h2YJwZdwKotHAM_&
zR?Xp9T}7N%b9K!j2sGk3gB=-TN)9qezGE=J((u`aUyO5<&c7LE>+5lGPd^7|uaf_J
zwA+keFP0qk3pf|bi>I;%bndFO;3_tDi=bnJ-w8IaCeCywFfs0wZ-}K{E1w<HboeS;
z``6;N(_M&&25M_El2Oezr%9N{oRRTH=Y{fX3+lrtpNNgPcTyVJ#rGj?EG^HCqOq+P
z=E0M$F&*=1YCoe-y1w<6C`1~zv8ql~(Sr!3-u53dNh-9)`@9z-QgzgUA5<=U?-BDL
zYvyZ0D>g!RX||%iue^qF9RV8LN~nOHz9)9mkCyP)$uQ_gw&auptkF*a8z;RQ+u4I1
zNmNPlmz@E@1~gWwM_;Z{NE?ZC>*`Y7OrS<>F19*14VHBidS`E)%qeJI@J+??&QWn!
zYPC*X{q@bx_F0c~Q%b%YEy_-NYlC(yq%HHNyKpLLJIpjlZpIIwuCUPsng!Baan_5>
zAN1Dd`dRDHMT6zTiMdO1*5O%Lo$@-QM^`i$+*3=NeZ{tH{!*T3y6`GtDa*y0Pa2$E
z-Od&-*)uo=4M0b<@N$UY`a25C*Lmswwu>EA#k_SKsHp#pN{YEMSMMZ&PIG`;{zHEk
zTtBP*cum45XJ+C+uSQ}$M9WDp6(n=Kt9mb?Kok$|W(7wb9K;H!^yYd`Ce>*{)#z9t
z7{Rh*w7^(2ud83LjUgUmw9UB?j~6$j=t2G_rMUm@=MZ^)M^fhwt#5OXm<S4qHv%4T
zJFr~3$7qjgx=RUf9&VG;39i!;f0XLZCDe!~8aj0Os$zhd7IasZvoqtO+OlJr!m|Z`
zo!YLo&wgAbusfp`zKA}&rtDET=c?R)hocK>c;}zb(W5)*guN$~k~WPJRcucRQgAqs
zOseqY%^>kGr5qC7U+9x)fg(O(7}+=a3kfBGCJw@5z5E)f>%2yP3xOWUWB9R&vCgf!
zDFo|ZOc;5;_J^1qkJ<Z!1S3KyXT44+g69InV6Tg%x|`dK8&K-N$?0>AoWapJJdO3b
zR=k)2gA4DrsySy^$bCj9)?8+gN2t~(RJWz>{%lfjToM-FGV@BuoY*kjwDV8B&l&qT
z+Cz|0q^PbQj*1CQWYwwkma(kKspX(+poBLGdp(|<ogFn&BZ?E`jfR5|C7?%X4HvsM
z8ApE4b8itGy<-0T^Bh|Lk%Q}O+=%b<{rSF(h38M6;A68%8&D027xRKgP8pG(B3$7k
zs_-r_rUnd|aJTdjIIR4Hs(Ni}J)}nUIdPM`(>`k=G`b(mc9=_ON*~MXAFHG|0%gIz
zz~KLHU7fFEcg~kxT^pLo2Rse#^rNufkjupk!TlGLc5~6|8>g)ez1e@Ry1S%CBzaY#
z_SMg!m3=qLfftpp0AAwg=v%I9{pqO8V&L^5T877fw>Flp3l%I*1@;8gj>(=42Cf3$
zw;H&1e2r}B^PfI3`s+gPp4aMs*@dc4bk^b7U9TgocTEFFVDXWEeO`S#-shaRdcXG2
zW0Sg&$*1fZ_(;8bV*Rb1_U}&4ns*j>u)^-hK8f8z#Ygvs{Mfru{_M3&zqiyM!FyP!
zRnd&BdF#Gzc)nZo7F}+3bk@dpv!m&zt#>nQF3BwZArahp`bCWxu)qXff2bVx)9tb3
zS>s*nfxXfxy{?;o11ERdpPl}6?%5qJwR73PR_u1;`A3gb=BA(d6!Piy-;J)j4MBG+
z&R7S!Ok!&3mwz{|<bcjS)ic`)>YR3k&bwIQ_POWX>T^fMQj;&fsS5{3Zu-wvuQU20
z|A-ncz5yB&4#`{>xX-I6@+i<L#!~&DJ1Oo~0z0RldX6cdHQb$^4m`f}T@NUFp*m~Q
z&vXE9Xq<IcHt=M4C-4d~@#2@ZAFEv6&jsdz>pO3Rxouor?M~XAjV|w_kIo9snX~@L
zi-<R*-8L~_@~J^A@H{HMTG)A_{A*U%W!!9cnD>SG<Ep=)agg`nD?w{3!Qg=QkN?G+
z>;H<(uUhB-8GNSbS!tLgh=!agI)@r(iuPaqRR8b%|39@~cgO!f9q%3XF$TV0_;}Vy
n^m9Xj^Rc4HE~!uk9t%~^STn<tsYA#9CP>QD)z4*}Q$iB}sO24`

-- 
Gitee


From 6c488ab6e6211916063b0d7100c7603784e49c9a Mon Sep 17 00:00:00 2001
From: jiangchao_j <chaojiang_j@163.com>
Date: Sat, 1 Mar 2025 10:20:42 +0800
Subject: [PATCH 052/145] add introduction of madater dump and overflow_check

---
 debug/accuracy_tools/msprobe/README.md        |  15 +-
 .../msprobe/docs/02.config_introduction.md    |  30 +-
 .../msprobe/docs/05.data_dump_PyTorch.md      |   2 +-
 .../msprobe/docs/06.data_dump_MindSpore.md    |   2 +-
 .../msprobe/docs/27.dump_json_instruction.md  | 286 +++++++++++++++++-
 .../msprobe/docs/28.kernel_dump_MindSpore.md  |   2 +-
 .../msprobe/docs/29.data_dump_MSAdapter.md    | 229 ++++++++++++++
 .../docs/30.overflow_check_MSAdapter.md       |  31 ++
 8 files changed, 567 insertions(+), 30 deletions(-)
 create mode 100644 debug/accuracy_tools/msprobe/docs/29.data_dump_MSAdapter.md
 create mode 100644 debug/accuracy_tools/msprobe/docs/30.overflow_check_MSAdapter.md

diff --git a/debug/accuracy_tools/msprobe/README.md b/debug/accuracy_tools/msprobe/README.md
index e31490f01e9..6b7d483078a 100644
--- a/debug/accuracy_tools/msprobe/README.md
+++ b/debug/accuracy_tools/msprobe/README.md
@@ -44,6 +44,7 @@ export MSPROBE_LOG_LEVEL={x}
 
 - msprobe支持AscendPyTorch 1.11.0或更高版本，支持的PyTorch和CANN以及PyTorch和python软件版本配套关系请参见《[Ascend Extension for PyTorch插件](https://gitee.com/ascend/pytorch)》。
 - msprobe支持MindSpore 2.4.0或更高版本，支持的MindSpore和CANN以及MindSpore和python软件版本配套关系请参见《[MindSpore版本发布列表](https://www.mindspore.cn/versions)》。
+- msprobe支持MSAdapter 2.1.0。
 - msprobe支持的固件驱动版本与配套CANN软件支持的固件驱动版本相同，开发者可通过“[昇腾社区-固件与驱动](https://gitee.com/link?target=https%3A%2F%2Fwww.hiascend.com%2Fhardware%2Ffirmware-drivers%2Fcommunity%3Fproduct%3D2%26model%3D28%26cann%3D8.0.RC3.alpha003%26driver%3D1.0.25.alpha)”页面根据产品型号与CANN软件版本获取配套的固件与驱动。
 
 
@@ -69,15 +70,17 @@ export MSPROBE_LOG_LEVEL={x}
 
 ### 1 数据采集
 
-msprobe 通过在训练脚本中添加 PrecisionDebugger 接口的方式对 API 执行精度数据 dump 操作，对应 config.json 中的 task 为 statistics 或 tensor。
+msprobe 通过在训练脚本中添加 PrecisionDebugger 接口的方式对 API 执行精度数据 dump 操作。对应 config.json 中的 "statistics" 或 "tensor" task。
 
 [PyTorch 场景的数据采集](./docs/05.data_dump_PyTorch.md)
 
 [MindSpore 场景的数据采集](./docs/06.data_dump_MindSpore.md)
 
+[MSAdapter 场景的数据采集](./docs/29.data_dump_MSAdapter.md)
+
 ### 2 精度预检
 
-精度预检旨在昇腾 NPU 上扫描训练模型中的所有 API 进行 API 复现，给出精度情况的诊断和分析。对应 config.json 中的 task 为 run_ut。
+精度预检旨在昇腾 NPU 上扫描训练模型中的所有 API 进行 API 复现，给出精度情况的诊断和分析。对应 config.json 中的 "run_ut" task。
 
 PyTorch 场景的[离线预检](./docs/07.accuracy_checker_PyTorch.md)和[在线预检](./docs/08.accuracy_checker_online_PyTorch.md)
 
@@ -143,12 +146,14 @@ MindSpore 动态图场景的[离线预检](./docs/09.accuracy_checker_MindSpore.
 
 ### 12 溢出检测与解析
 
-溢出检测与解析是在执行精度数据 dump 时，判断是否存在输入正常但输出存在溢出的 API，从而判断是否为正常溢出。对应 config.json 中的 overflow_check。 
-推荐直接使用[数据采集](#1-数据采集)功能采集统计量信息检测溢出问题。
+溢出检测用于采集溢出 API 或 模块的精度数据，而溢出解析则是通过对溢出数据的分析，进一步判断是否为正常溢出。对应 config.json 中的 "overflow_check" task。 
+推荐直接使用[数据采集](#1-数据采集)功能采集统计量信息,检测溢出问题。
 
 [PyTorch 场景的溢出检测与解析](./docs/12.overflow_check_PyTorch.md)
 
-[MindSpore 场景的溢出检测与解析](./docs/13.overflow_check_MindSpore.md)
+[MindSpore 场景的溢出检测](./docs/13.overflow_check_MindSpore.md)
+
+[MSAdapter 场景的溢出检测](./docs/30.overflow_check_MSAdapter.md)
 
 ## 📑 补充材料
 
diff --git a/debug/accuracy_tools/msprobe/docs/02.config_introduction.md b/debug/accuracy_tools/msprobe/docs/02.config_introduction.md
index f134bd45362..a5f17637dae 100644
--- a/debug/accuracy_tools/msprobe/docs/02.config_introduction.md
+++ b/debug/accuracy_tools/msprobe/docs/02.config_introduction.md
@@ -12,23 +12,23 @@
 
 | 参数    | 解释                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       | 是否必选 |
 | ----------------- |------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| -------- |
-| task              | dump 的任务类型，str 类型。可选参数：<br/>  "statistics"：仅采集统计信息，默认值；<br/> "tensor"：采集统计信息和完全复刻整网的真实数据；<br/> "run_ut"：精度预检，仅 PyTorch 场景支持，采集数据时勿选；<br/> "overflow_check"：溢出检测；<br/>  "free_benchmark"：无标杆比对；<br/>  "grad_probe"：梯度监控； <br/> "structure"：仅采集模型结构以及调用栈信息，不采集具体数据。 <br/> 根据 task 参数取值的不同，可以配置不同场景参数，详见：<br/>[1.2 task 配置为 statistics](#12-task-配置为-statistics)，<br/>[1.3 task 配置为 tensor](#13-task-配置为-tensor)，<br/>[1.4 task 配置为 run_ut](#14-task-配置为-run_ut)，<br/>[1.5 task 配置为 overflow_check](#15-task-配置为-overflow_check)，<br/>[1.6 task 配置为 free_benchmark](#16-task-配置为-free_benchmark)，<br/>[1.7 task 配置为 grad_probe](#17-task-配置为-grad_probe)。 <br/>  **配置示例**："task": "tensor"。 | 否       |
+| task              | dump 的任务类型，str 类型。可选参数：<br/>  "statistics"：仅采集统计信息，默认值；<br/> "tensor"：采集统计信息和完全复刻整网的真实数据；<br/> "run_ut"：精度预检，仅 PyTorch 场景支持，采集数据时勿选；<br/> "overflow_check"：溢出检测；<br/>  "free_benchmark"：无标杆比对，不支持 MSAdapter 场景；<br/>  "grad_probe"：梯度监控， 不支持 MSAdapter 场景； <br/> "structure"：仅采集模型结构以及调用栈信息，不采集具体数据。 <br/> 根据 task 参数取值的不同，可以配置不同场景参数，详见：<br/>[1.2 task 配置为 statistics](#12-task-配置为-statistics)，<br/>[1.3 task 配置为 tensor](#13-task-配置为-tensor)，<br/>[1.4 task 配置为 run_ut](#14-task-配置为-run_ut)，<br/>[1.5 task 配置为 overflow_check](#15-task-配置为-overflow_check)，<br/>[1.6 task 配置为 free_benchmark](#16-task-配置为-free_benchmark)，<br/>[1.7 task 配置为 grad_probe](#17-task-配置为-grad_probe)。 <br/>  **配置示例**："task": "tensor"。 | 否       |
 | dump_path         | 设置 dump 数据目录路径，str 类型。<br/>  **配置示例**："dump_path": "./dump_path"。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        | 是       |
 | rank              | 指定对某张卡上的数据进行采集，list[Union[int, str]] 类型，默认未配置（表示采集所有卡的数据），应配置元素为 ≥0 的整数或类似"4-6"的字符串，且须配置实际可用的 Rank ID。<br/>  PyTorch 场景: Rank ID 从 0 开始计数，最大取值为所有节点可用卡总数-1，若所配置的值大于实际训练所运行的卡的 Rank ID，则 dump 数据为空，比如当前环境 Rank ID 为 0 到 7，实际训练运行 0 到 3 卡，此时若配置 Rank ID 为 4 或不存在的 10 等其他值，dump 数据为空。<br/>  MindSpore 场景：所有节点的 Rank ID 均从 0 开始计数，最大取值为每个节点可用卡总数-1，config.json 配置一次 rank 参数对所有节点同时生效。<br/> 注意，单卡训练时，rank必须为[]，即空列表，不能指定rank。<br/>**配置示例**："rank": [1, "4-6"]。                                                                                                                                                                                                                                | 否       |
 | step              | 指定采集某个 step 的数据，list[Union[int, str]] 类型。默认未配置，表示采集所有 step 数据。采集特定 step 时，须指定为训练脚本中存在的 step，可逐个配置，也可以指定范围。<br/>  **配置示例**："step": [0, 1 , 2, "4-6"]。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 否       |
-| level             | dump 级别，str 类型，根据不同级别采集不同数据。可选参数：<br/>"L0"：dump 模块级精度数据，仅 PyTorch 与 MindSpore 动态图场景支持，使用背景详见 [1.1.1 模块级精度数据 dump 说明](#111-模块级精度数据-dump-说明)；<br/>"L1"：dump API 级精度数据，默认值，仅 PyTorch 与 MindSpore 动态图场景支持；<br/>"L2"：dump kernel 级精度数据，PyTorch场景详细介绍见 [PyTorch 场景的 kernel dump 说明](./04.kernel_dump_PyTorch.md)；MindSpore场景详细介绍见 [MindSpore 场景的 kernel dump 说明](./28.kernel_dump_MindSpore.md)；<br/>"mix"：dump module 模块级和 API 级精度数据，即"L0"+"L1"，仅 PyTorch 与 MindSpore 动态图场景支持。<br/>"debug"：单点保存功能，细节详见[单点保存工具 README](./28.debugger_save_instruction.md)<br/>  **配置示例**："level": "L1"。                                                                                                                                                                                                                                                                 | 否 |
+| level             | dump 级别，str 类型，根据不同级别采集不同数据。可选参数：<br/>"L0"：dump 模块级精度数据，仅 PyTorch、MSAdapter 以及 MindSpore 动态图场景支持，使用背景详见 [1.1.1 模块级精度数据 dump 说明](#111-模块级精度数据-dump-说明)；<br/>"L1"：dump API 级精度数据，默认值，仅 PyTorch、MSAdapter 以及 MindSpore 动态图场景支持；<br/>"L2"：dump kernel 级精度数据，PyTorch 场景详细介绍见 [PyTorch 场景的 kernel dump 说明](./04.kernel_dump_PyTorch.md)；MindSpore 动态图场景详细介绍见 [MindSpore 动态图场景的 kernel dump 说明](./28.kernel_dump_MindSpore.md)；MindSpore 静态图场景详细介绍见《MindSpore 场景的数据采集》中的 ["**8.1 静态图场景**"](./06.data_dump_MindSpore.md#81-静态图场景)小节；<br/>"mix"：dump module 模块级和 API 级精度数据，即"L0"+"L1"，仅 PyTorch、MSAdapter 以及 MindSpore 动态图场景支持。<br/>"debug"：单点保存功能，细节详见[单点保存工具 README](./28.debugger_save_instruction.md)<br/>  **配置示例**："level": "L1"。                                                                                                                                                                                                                                                                 | 否 |
 | enable_dataloader | 自动控制开关，bool 类型，仅 PyTorch 场景支持。可选参数 true（开启）或 false（关闭），默认为 false。配置为 true 后自动识别 step 参数指定的迭代，并在该迭代执行完成后退出训练，此时 start、stop 和 step 函数可不配置，开启该开关要求训练脚本是通过 torch.utils.data.dataloader 方式加载数据。仅支持 PyTorch 单卡训练使用，分布式训练场景下存在数据 dump 不全问题。 **这个特性下个版本将被废弃**                                                                                                                                                                                                                                                                                                                                                                                                                                    | 否       |
 | async_dump        | 异步 dump 开关，bool 类型。可选参数 true（开启）或 false（关闭），默认为 false。配置为 true 后开启异步 dump，即采集的精度数据会在当前 step 训练结束后统一落盘，训练过程中工具不触发同步操作。由于使用该模式有**显存溢出**的风险，当 task 配置为 tensor 时，即真实数据的异步dump模式，必须配置 [list](#13-task-配置为-tensor) 参数，指定需要 dump 的 tensor 。该模式暂不支持复数类型 tensor <br/>的统计量计算。                                                                                                                                                                                                                                                                                                                                                                                                                      | 否       |
 
 #### 1.1.1 模块级精度数据 dump 说明
 
-仅 PyTorch 与 MindSpore 动态图场景支持。
+仅 PyTorch、MSAdapter以及 MindSpore 动态图场景支持。
 
 大模型场景下，通常不是简单的利用自动迁移能力实现从 GPU 到 NPU 的训练脚本迁移，而是会对 NPU 网络进行一系列针对性的适配，因此，常常会造成迁移后的 NPU 模型存在部分子结构不能与 GPU 原始模型完全对应。模型结构不一致导致 API 调用类型及数量不一致，若直接按照 API 粒度进行精度数据 dump 和比对，则无法完全比对所有的 API。
 
 本小节介绍的功能是对模型中的大粒度模块进行数据 dump，使其比对时，对于无法以 API 粒度比对的模块可以直接以模块粒度进行比对。
 
-模块指的是继承 nn.Module 类（PyTorch场景）或 nn.Cell 类（MindSpore场景）的子类，通常情况下这类模块就是一个小模型，可以被视为一个整体，dump 数据时以模块为粒度进行 dump。
+模块指的是继承 nn.Module 类（PyTorch 与 MSAdapter 场景）或 nn.Cell 类（MindSpore 场景）的子类，通常情况下这类模块就是一个小模型，可以被视为一个整体，dump 数据时以模块为粒度进行 dump。
 
 
@@ -36,21 +36,23 @@
 
 <table>
     <tr><th>参数</th><th>解释</th><th>是否必选</th></tr>
-    <tr><td>scope</td><td>PyTorch 和 MindSpore 动态图场景 dump 范围，list[str] 类型，默认未配置（list 也未配置时表示 dump 所有 API 的数据）。该参数可以在 [ ] 内配置两个模块名或 API 名，要求列表长度必须为2，需要配置按照工具命名格式的完整模块名或API名称，用于锁定区间，dump 该范围内的数据。<br/><b>配置示例</b>：
+    <tr><td>scope</td><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景 dump 范围，list[str] 类型，默认未配置（list 也未配置时表示 dump 所有 API 的数据）。该参数可以在 [ ] 内配置两个模块名或 API 名，要求列表长度必须为2，需要配置按照工具命名格式的完整模块名或API名称，用于锁定区间，dump 该范围内的数据。<br/><b>配置示例</b>：
     "scope": ["Module.conv1.Conv2d.forward.0", "Module.fc2.Linear.forward.0"],
     或 "scope": ["Cell.conv1.Conv2d.forward.0", "Cell.fc2.Dense.backward.0"], 或"scope": ["Tensor.add.0.forward", "Functional.square.2.forward"]。与 level 参数取值相关，level 为 L0 级别时，可配置模块名；level 为 L1 级别时，可配置 API 名， level为 mix 级别时，可配置为模块名或API名。</td><td>否</td></tr>
     <tr><td rowspan="4">list</td><td>自定义采集的算子列表，list[str] 类型，默认未配置（scope 也未配置时表示 dump 所有 API 的数据），包含以下配置方法：</td><td rowspan="4">否</td></tr>
-    <tr><td>PyTorch 和 MindSpore 动态图场景配置具体的 API 全称，dump 该 API 数据。在 PyTorch 场景，如果 level 配置成 L2，该配置为必填项。<br/><b>配置示例</b>："list": ["Tensor.permute.1.forward", "Tensor.transpose.2.forward", "Torch.relu.3.backward"]。<br/> PyTorch 和 MindSpore 动态图场景在level为 mix 级别时可以配置模块名称，dump该模块展开数据 （dump该模块从执行开始到执行结束期间的所有数据）。
+    <tr><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景配置具体的 API 全称，dump 该 API 数据。在 PyTorch 场景，如果 level 配置成 L2，该配置为必填项。<br/><b>配置示例</b>："list": ["Tensor.permute.1.forward", "Tensor.transpose.2.forward", "Torch.relu.3.backward"]。<br/> PyTorch 和 MindSpore 动态图场景在level为 mix 级别时可以配置模块名称，dump该模块展开数据 （dump该模块从执行开始到执行结束期间的所有数据）。
     <br/><b>配置示例</b>："list": ["Module.module.language_model.encoder.layers.0.mlp.ParallelMlp.forward.0"], 或 "list": ["Cell.network_with_loss.language_model.encoder.layers.0.mlp.ParallelMlp.forward.0"]</td></tr>
-    <tr><td>PyTorch 和 MindSpore 动态图场景指定某一类 API，dump 某一类的 API 级别输入输出数据。<br/><b>配置示例</b>："list": ["relu"]。 <br/>    PyTorch 和 MindSpore 动态图场景在level为 mix 级别时, 会dump名称中包含list中配置的字符串的API数据，还会将名称中包含list中配置的字符串的模块进行展开dump （dump该模块从执行开始到执行结束期间的所有数据）。</td></tr>
-    <tr><td>MindSpore 静态图场景配置 kernel_name，可以是算子的名称列表，也可以指定算子类型（"level": "L2"时不支持），还可以配置算子名称的正则表达式（当字符串符合“name-regex(xxx)”格式时，后台则会将其作为正则表达式。<br/><b>配置示例</b>：list: ["name-regex(Default/.+)"]<br/>可匹配算子名称以“Default/”开头的所有算子。</td></tr>
+    <tr><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景指定某一类 API，dump 某一类的 API 级别输入输出数据。<br/><b>配置示例</b>："list": ["relu"]。 <br/>    PyTorch、MSAdapter 以及 MindSpore 动态图场景在level为 mix 级别时, 会dump名称中包含list中配置的字符串的API数据，还会将名称中包含list中配置的字符串的模块进行展开dump （dump该模块从执行开始到执行结束期间的所有数据）。</td></tr>
+    <tr><td>MindSpore 静态图场景配置 kernel_name，可以是算子的名称列表，也可以指定算子类型（jit_level=O2 时不支持），还可以配置算子名称的正则表达式（当字符串符合“name-regex(xxx)”格式时，后台则会将其作为正则表达式。<br/><b>配置示例</b>：list: ["name-regex(Default/.+)"]<br/>可匹配算子名称以“Default/”开头的所有算子。</td></tr>
     <tr><td rowspan="3">data_mode</td><td>dump 数据过滤，str 类型。</td><td rowspan="3">否</td></tr>
-    <tr><td>PyTorch 与 MindSpore 动态图场景：支持"all"、"forward"、"backward"、"input"和"output"，除"all"外，其余参数可以自由组合。默认为["all"]，即保存所有 dump 的数据。<br/> <b>配置示例</b>："data_mode": ["backward"] （仅保存反向数据）或 "data_mode": ["forward", "input"]（仅保存前向的输入数据）。</td></tr>
+    <tr><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景：支持"all"、"forward"、"backward"、"input"和"output"，除"all"外，其余参数可以自由组合。默认为["all"]，即保存所有 dump 的数据。<br/> <b>配置示例</b>："data_mode": ["backward"] （仅保存反向数据）或 "data_mode": ["forward", "input"]（仅保存前向的输入数据）。</td></tr>
     <tr><td>MindSpore 静态图场景：仅支持"all"、"input"和"output"参数，且各参数只能单独配置，不支持自由组合。<br/><b>配置示例</b>："data_mode": ["all"]。</td></tr>
-    <tr><td rowspan="2">summary_mode</td><td>控制 dump 文件输出的模式，str 类型，仅 PyTorch 与 MindSpore 动态图场景支持，可选参数：<br/> md5：dump 输出包含 CRC-32 值以及 API 统计信息的 dump.json 文件，用于验证数据的完整性；<br/> statistics：dump 仅输出包含 API 统计信息的 dump.json 文件，默认值。<br/><b>配置示例</b>："summary_mode": "md5"。</td><td rowspan="2">否</td><tr><td>MindSpore静态图jit_level=O2场景L2级dump，支持上述配置的同时额外支持配置统计项列表，可选统计项为max、min、mean、l2norm，可从中任意选取组合搭配。其中mean、l2norm的结果为float数据格式。<br/><b>配置示例</b>："summary_mode": ["max", "min"]。</td></tr></tr>
+    <tr><td rowspan="3">summary_mode</td><td>控制 dump 文件输出的模式，str 类型，支持 PyTorch、MSAdapter、MindSpore 动态图以及 MindSpore 静态图 jit_level=O2 场景。</td><td rowspan="3">否</td></tr>
+    <tr><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景：可选参数为<br/> md5：dump 输出包含 CRC-32 值以及 API 统计信息的 dump.json 文件，用于验证数据的完整性；<br/> statistics：dump 仅输出包含 API 统计信息的 dump.json 文件，默认值。<br/><b>配置示例</b>："summary_mode": "md5"。</td></tr>
+    <tr><td>MindSpore 静态图 jit_level=O2 场景：支持上述配置的同时额外支持配置统计项列表，可选统计项为max、min、mean、l2norm，可从中任意选取组合搭配。其中mean、l2norm的结果为float数据格式。<br/><b>配置示例</b>："summary_mode": ["max", "min"]。</td></tr>
 </table>
 
-**说明**："summary_mode"配置为"md5"时，所使用的校验算法为CRC-32算法。
+**说明**："summary_mode" 配置为 "md5" 时，所使用的校验算法为 CRC-32 算法。
 
 ### 1.3 task 配置为 tensor
 
@@ -86,16 +88,16 @@
 
 ### 1.5 task 配置为 overflow_check
 
-PyTorch 与 MindSpore 动态图场景下，"level"须为"L0"或"L1"；MindSpore 静态图场景下，"level"须为"L2"，且模型编译优化等级（jit_level）须为"O2"。
+PyTorch、MSAdapter 以及 MindSpore 动态图场景下，"level"须为"L0"或"L1"；MindSpore 静态图场景下，"level"须为"L2"，且模型编译优化等级（jit_level）须为"O2"。
 
 | 参数        | 解释                 | 是否必选 |
 | ------------- | ---------------------- | -------- |
 | overflow_nums | 最大溢出次数，int 类型，默认为 1，仅 PyTorch 与 MindSpore 动态图场景支持。表示第 N 次溢出后，不再进行溢出检测。过程中检测到溢出 API 对应的 输入输出 数据均 dump。<br/>**配置示例**："overflow_nums": 3。配置为 -1 时，表示持续检测溢出直到训练结束。 | 否       |
-| check_mode    | 溢出类型，str 类型，仅 MindSpore 场景支持，可选参数：<br/>"aicore"：开启 AI Core 的溢出检测，不支持 MindSpore v2.3.0 以上版本；<br/>"atomic"：开启 Atomic 的溢出检测，不支持 MindSpore v2.3.0 以上版本；<br/>"all"：开启算子的溢出检测，默认值。<br/>**配置示例**："check_mode": "all"。 | 否       |
+| check_mode    | 溢出类型，str 类型，仅 MindSpore v2.3.0 以下版本的静态图场景支持，可选参数：<br/>"aicore"：开启 AI Core 的溢出检测；<br/>"atomic"：开启 Atomic 的溢出检测；<br/>"all"：开启算子的溢出检测，默认值。<br/>**配置示例**："check_mode": "all"。 | 否       |
 
 ### 1.6 task 配置为 free_benchmark
 
-仅 PyTorch 场景与 MindSpore 动态图场景支持，且"level"为"L1"。
+仅 PyTorch 与 MindSpore 动态图场景支持，且"level"为"L1"。
 
 - task 配置为 free_benchmark 时，开启**无标杆比对**，在 NPU 环境下通过对当前模型 API 的输入添加扰动因子，二次执行，将得到的输出与未添加扰动因子前的输出进行比对，从而**得出该模型中可能存在因迁移等变化导致精度降低的 API**。
 
diff --git a/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md b/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
index db9a989c9d1..9a99ab1c2eb 100644
--- a/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
+++ b/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
@@ -355,7 +355,7 @@ if __name__ == "__main__":
 ```
 * `rank`：设备 ID，每张卡的数据保存在对应的 `rank{ID}` 目录下。非分布式场景下没有 rank ID，目录名称为 rank。
 * `dump_tensor_data`：保存采集到的张量数据。
-* `dump.json`： 保存API或Module前反向数据的统计量信息。包含dump数据的API名称或Module名称，各数据的dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置summary_mode="md5"时的CRC-32数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#1-dumpjson文件介绍pytorch)。
+* `dump.json`： 保存API或Module前反向数据的统计量信息。包含dump数据的API名称或Module名称，各数据的dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置summary_mode="md5"时的CRC-32数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#1-PyTorch场景下的dump.json文件)。
 * `stack.json`：API/Module的调用栈信息。
 * `construct.json`：分层分级结构，level为L1时，construct.json内容为空。
 
diff --git a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
index f7507facd2a..ba76836cb5d 100644
--- a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
@@ -372,7 +372,7 @@ dump 结果目录结构示例如下：
 
 * `rank`：设备 ID，每张卡的数据保存在对应的 `rank{ID}` 目录下。非分布式场景下没有 rank ID，目录名称为 rank。
 * `dump_tensor_data`：保存采集到的张量数据。
-* `dump.json`： 保存API或Cell前反向数据的统计量信息。包含dump数据的API名称或Cell名称，各数据的dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置summary_mode="md5"时的CRC-32数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#2-dumpjson文件示例mindspore)。
+* `dump.json`： 保存API或Cell前反向数据的统计量信息。包含dump数据的API名称或Cell名称，各数据的dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置summary_mode="md5"时的CRC-32数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#2-MindSpore场景下的dump.json文件)。
 * `stack.json`：API/Cell的调用栈信息。
 * `construct.json`：分层分级结构，level为L1时，construct.json内容为空。
 
diff --git a/debug/accuracy_tools/msprobe/docs/27.dump_json_instruction.md b/debug/accuracy_tools/msprobe/docs/27.dump_json_instruction.md
index f994dc2301b..bf5998bce0b 100644
--- a/debug/accuracy_tools/msprobe/docs/27.dump_json_instruction.md
+++ b/debug/accuracy_tools/msprobe/docs/27.dump_json_instruction.md
@@ -1,8 +1,8 @@
 # dump.json文件说明及示例  
 
-## 1. dump.json文件示例（PyTorch）  
+## 1. PyTorch 场景下的 dump.json 文件
 
-### 1.1 L0级别
+### 1.1 L0 级别
 L0级别的dump.json文件包括模块的前反向的输入输出，以及模块的参数和参数梯度。以PyTorch的Conv2d模块为例，网络中模块调用代码为:  
 `output = self.conv2(input) # self.conv2 = torch.nn.Conv2d(64, 128, 5, padding=2, bias=True)`  
 
@@ -168,7 +168,7 @@ dump.json文件中包含以下数据名称：
 }
 ```
 
-### 1.2 L1级别
+### 1.2 L1 级别
 L1级别的dump.json文件包括API的前反向的输入输出。以PyTorch的relu函数为例，网络中API调用代码为:  
 `output = torch.nn.functional.relu(input)`  
 
@@ -264,13 +264,13 @@ dump.json文件中包含以下数据名称：
 }  
 ```  
 
-### 1.3 mix级别
+### 1.3 mix 级别
 
 mix级别的dump.json文件同时包括L0和L1级别的dump数据，文件格式与上述示例相同。  
 
-## 2. dump.json文件示例（MindSpore） 
+## 2. MindSpore 场景下的 dump.json 文件 
 
-### 2.1 L0级别  
+### 2.1 L0 级别  
 
 L0级别的dump.json文件包括模块的前反向的输入输出，以及模块的参数和参数梯度。
 以MindSpore的Conv2d模块为例，dump.json文件中使用的模块调用代码为:  
@@ -429,7 +429,7 @@ dump.json文件中包含以下数据名称：
 }
 ```
 
-### 2.2 L1级别
+### 2.2 L1 级别
 L1级别的dump.json文件包括API的前反向的输入输出，以MindSpore的relu函数为例，网络中API调用代码为:  
  `output = mindspore.ops.relu(input)`  
 
@@ -521,5 +521,275 @@ L1级别的dump.json文件包括API的前反向的输入输出，以MindSpore的
 }  
 ```  
 
-### 2.3 mix级别
+### 2.3 mix 级别
+
 mix级别的dump.json文件同时包括L0和L1级别的dump数据，文件格式与上述示例相同。
+
+## 3. MSAdapter 场景下的 dump.json 文件
+
+### 3.1 L0 级别
+
+L0 级别的 dump.json 文件包括模块的前反向的输入输出，以及模块的参数和参数梯度。以 Conv2d 模块为例，网络中模块调用代码为:  
+`output = self.conv2(input) # self.conv2 = torch.nn.Conv2d(64, 128, 5, padding=2, bias=True)`  
+
+dump.json文件中包含以下数据名称：  
+
+- `Module.conv2.Conv2d.forward.0`：模块的前向数据，其中input_args为模块的输入数据（位置参数），input_kwargs为模块的输入数据（关键字参数），output为模块的输出数据，parameters为模块的参数数据，包括权重（weight）和偏置（bias）。  
+- `Module.conv2.Conv2d.parameters_grad`：模块的参数梯度数据，包括权重（weight）和偏置（bias）的梯度。  
+- `Module.conv2.Conv2d.backward.0`：模块的反向数据，其中input为模块反向的输入梯度（对应前向输出的梯度），output为模块的反向输出梯度（对应前向输入的梯度）。
+
+**说明**：当dump时传入的model参数为List[torch.nn.Module]或Tuple[torch.nn.Module]时，模块级数据的命名中包含该模块在列表中的索引index，命名格式为`{Module}.{index}.*`，*表示以上三种模块级数据的命名格式，例如：`Module.0.conv1.Conv2d.forward.0`。     
+
+```json
+{
+ "task": "tensor",
+ "level": "L0",
+ "framework": "mindtorch",
+ "dump_data_dir": "/dump/path",
+ "data": {
+  "Module.conv2.Conv2d.forward.0": {
+   "input_args": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      8,
+      16,
+      14,
+      14
+     ],
+     "Max": 1.638758659362793,
+     "Min": 0.0,
+     "Mean": 0.2544615864753723,
+     "Norm": 70.50277709960938,
+     "requires_grad": true,
+     "data_name": "Module.conv2.Conv2d.forward.0.input.0.npy"
+    }
+   ],
+   "input_kwargs": {},
+   "output": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      8,
+      32,
+      10,
+      10
+     ],
+     "Max": 1.6815717220306396,
+     "Min": -1.5120246410369873,
+     "Mean": -0.025344856083393097,
+     "Norm": 149.65576171875,
+     "requires_grad": true,
+     "data_name": "Module.conv2.Conv2d.forward.0.output.0.npy"
+    }
+   ],
+   "parameters": {
+    "weight": {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      5,
+      5
+     ],
+     "Max": 0.05992485210299492,
+     "Min": -0.05999220535159111,
+     "Mean": -0.0006165213999338448,
+     "Norm": 3.421217441558838,
+     "requires_grad": true,
+     "data_name": "Module.conv2.Conv2d.forward.0.parameters.weight.npy"
+    },
+    "bias": {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32
+     ],
+     "Max": 0.05744686722755432,
+     "Min": -0.04894155263900757,
+     "Mean": 0.006410328671336174,
+     "Norm": 0.17263513803482056,
+     "requires_grad": true,
+     "data_name": "Module.conv2.Conv2d.forward.0.parameters.bias.npy"
+    }
+   }
+  },
+  "Module.conv2.Conv2d.parameters_grad": {
+   "weight": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      5,
+      5
+     ],
+     "Max": 0.018550323322415352,
+     "Min": -0.008627401664853096,
+     "Mean": 0.0006675920449197292,
+     "Norm": 0.26084786653518677,
+     "requires_grad": false,
+     "data_name": "Module.conv2.Conv2d.parameters_grad.weight.npy"
+    }
+   ],
+   "bias": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32
+     ],
+     "Max": 0.014914230443537235,
+     "Min": -0.006656786892563105,
+     "Mean": 0.002657240955159068,
+     "Norm": 0.029451673850417137,
+     "requires_grad": false,
+     "data_name": "Module.conv2.Conv2d.parameters_grad.bias.npy"
+    }
+   ]
+  },
+  "Module.conv2.Conv2d.backward.0": {
+   "input": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      8,
+      32,
+      10,
+      10
+     ],
+     "Max": 0.0015069986693561077,
+     "Min": -0.001139344065450132,
+     "Mean": 3.3215508210560074e-06,
+     "Norm": 0.020567523315548897,
+     "requires_grad": false,
+     "data_name": "Module.conv2.Conv2d.backward.0.input.0.npy"
+    }
+   ],
+   "output": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      8,
+      16,
+      14,
+      14
+     ],
+     "Max": 0.0007466732058674097,
+     "Min": -0.00044813455315306783,
+     "Mean": 6.814070275140693e-06,
+     "Norm": 0.01474067009985447,
+     "requires_grad": false,
+     "data_name": "Module.conv2.Conv2d.backward.0.output.0.npy"
+    }
+   ]
+  }
+ }
+}
+```
+
+### 3.2 L1 级别
+L1级别的dump.json文件包括API的前反向的输入输出。以 relu API 为例，网络中 API 调用代码为:  
+`output = torch.nn.functional.relu(input)`  
+
+dump.json文件中包含以下数据名称：  
+- `Functional.relu.0.forward`：API的前向数据，其中input_args为API的输入数据（位置参数），input_kwargs为API的输入数据（关键字参数），output为API的输出数据。  
+- `Functional.relu.0.backward`：API的反向数据，其中input为API的反向输入梯度（对应前向输出的梯度），output为API的反向输出梯度（对应前向输入的梯度）。
+
+```json
+{
+ "task": "tensor",
+ "level": "L1",
+ "framework": "mindtorch",
+ "dump_data_dir":"/dump/path",
+ "data": {
+  "Functional.relu.0.forward": {
+   "input_args": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      28,
+      28
+     ],
+     "Max": 1.3864083290100098,
+     "Min": -1.3364859819412231,
+     "Mean": 0.03711778670549393,
+     "Norm": 236.20692443847656,
+     "requires_grad": true,
+     "data_name": "Functional.relu.0.forward.input.0.npy"
+    }
+   ],
+   "input_kwargs": {},
+   "output": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      28,
+      28
+     ],
+     "Max": 1.3864083290100098,
+     "Min": 0.0,
+     "Mean": 0.16849493980407715,
+     "Norm": 175.23345947265625,
+     "requires_grad": true,
+     "data_name": "Functional.relu.0.forward.output.0.npy"
+    }
+   ]
+  },
+  "Functional.relu.0.backward": {
+   "input": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      28,
+      28
+     ],
+     "Max": 0.0001815402356442064,
+     "Min": -0.00013352684618439525,
+     "Mean": 0.00011915402356442064,
+     "Norm": 0.007598237134516239,
+     "requires_grad": false,
+     "data_name": "Functional.relu.0.backward.input.0.npy"
+    }
+   ],
+   "output": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      28,
+      28
+     ],
+     "Max": 0.0001815402356442064,
+     "Min": -0.00012117840378778055,
+     "Mean": 2.0098118724831693e-08,
+     "Norm": 0.006532244384288788,
+     "requires_grad": false,
+     "data_name": "Functional.relu.0.backward.output.0.npy"
+    }
+   ]
+  }
+ }
+}  
+```  
+
+### 3.3 mix 级别
+
+mix级别的dump.json文件同时包括L0和L1级别的dump数据，文件格式与上述示例相同。  
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/docs/28.kernel_dump_MindSpore.md b/debug/accuracy_tools/msprobe/docs/28.kernel_dump_MindSpore.md
index 6b8cc558aa2..4988586c056 100644
--- a/debug/accuracy_tools/msprobe/docs/28.kernel_dump_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/28.kernel_dump_MindSpore.md
@@ -1,4 +1,4 @@
-# MindSpore 场景的 kernel dump 说明
+# MindSpore 动态图场景的 kernel dump 说明
 
 当使用 msprobe 数据采集功能时，level 配置为 "L2" 表示采集 kernel 层级的算子数据，仅支持昇腾 NPU 平台。 
 
diff --git a/debug/accuracy_tools/msprobe/docs/29.data_dump_MSAdapter.md b/debug/accuracy_tools/msprobe/docs/29.data_dump_MSAdapter.md
new file mode 100644
index 00000000000..cefcabafbcb
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/docs/29.data_dump_MSAdapter.md
@@ -0,0 +1,229 @@
+# MSAdapter 场景的精度数据采集
+
+MSAdapter 是一款 MindSpore 生态适配工具，可以将 PyTorch 训练脚本高效迁移至 MindSpore 框架执行，以实现在不改变原有 PyTorch 用户开发习惯的情况下，使得 PyTorch 代码能在昇腾上获得高效性能。
+
+msprobe 工具主要通过在训练脚本内添加 dump 接口、启动训练的方式采集精度数据。
+
+本工具提供固定的 API 支持列表，若需要删除或增加 dump 的 API，可以在 msprobe/pytorch/hook_module/support_wrap_ops.yaml 文件内手动修改，如下示例：
+
+```yaml
+functional:  # functional为算子类别，找到对应的类别，在该类别下按照下列格式删除或添加API
+  - conv1d
+  - conv2d
+  - conv3d
+```
+
+删除 API 的场景：部分模型代码逻辑会存在 API 原生类型校验，工具执行dump操作时，对封装后的模型 API 可能与模型的原生 API 类型不一致，此时可能引发校验失败，详见《[FAQ](FAQ.md)》中“异常情况”的第10和11条。
+
+## 1. 工具安装
+
+请参见[《msprobe 工具安装指南》](./01.installation.md)。
+
+## 2 接口介绍
+
+### 2.1 msprobe.mindspore.PrecisionDebugger
+
+**功能说明**：通过加载 dump 配置文件的方式来确定 dump 操作的详细配置。
+
+**原型**：
+
+```Python
+PrecisionDebugger(config_path=None, task=None, dump_path=None, level=None, step=None)
+```
+
+**参数说明**:
+
+1. config_path：指定 dump 配置文件路径，string 类型。参数示例："./config.json"。未配置该路径时，默认使用 [config.json](../config.json) 文件的默认配置，配置选项含义可见 [config.json 介绍](./02.config_introduction.md)。
+
+2. 其他参数与 [config.json](../config.json) 文件中的同名配置字段含义相同，具体可见 [config.json 介绍](./02.config_introduction.md)。当参数值非None时，优先级高于 [config.json](../config.json) 文件中的同名配置。
+
+#### 2.1.1 start
+
+**功能说明**：启动精度数据采集。需要与 [**stop**](#212-stop) 接口一起添加在训练迭代的 for 循环内。
+
+**原型**：
+
+```Python
+start(model=None)
+```
+
+**参数说明**:
+
+1. model：指定需要采集 Module 级数据的模型，支持传入 torch.nn.Module、list[torch.nn.Module]或Tuple[torch.nn.Module] 类型，默认未配置。level 配置为 "L0" 或 "mix" 时，必须在该接口中配置该参数。API级别（"L1" level）dump 时，传入 model 可以采集 model 内包含 primitive op 对象在内的所有 API 数据，若不传入 model 参数，则只采集非 primitive op 的 API 数据。
+
+#### 2.1.2 stop
+
+**功能说明**：停止精度数据采集。在 **start** 接口调用之后的任意位置添加。若 **stop** 接口添加在反向计算代码之后，则会采集 **start** 和该接口之间的前反向数据。
+若 **stop** 接口添加在反向计算代码之前，则需要将 [**step**](#213-step) 接口添加到反向计算代码之后，才能采集 **start** 和该接口之间的前反向数据。
+
+**注意**：**stop** 接口必须调用，否则可能导致精度数据落盘不全。
+
+**原型**：
+
+```Python
+stop()
+```
+
+#### 2.1.3 step
+
+**功能说明**：进行训练 step 数的自增，完成当前 step 所有数据的落盘并更新 dump 参数。在一个 step 训练结束的位置添加，且必须在 **stop** 接口之后的位置调用。该接口需要配合 **start** 和 **stop** 函数使用，尽量添加在反向计算代码之后，否则可能会导致反向数据丢失。
+
+**原型**：
+
+```Python
+step()
+```
+
+#### 2.1.4 forward_backward_dump_end
+
+**功能说明**：停止精度数据采集。与 **stop** 接口功能相同，该函数在将来会被移除，建议使用 **stop** 接口。
+
+**原型**：
+
+```Python
+forward_backward_dump_end()
+```
+
+#### 2.1.5 save
+
+**功能说明**：单点保存网络执行过程中正反向数值，并以统计值/张量文件落盘。
+
+**原型**：
+```python
+save(variable, name, save_backward=True)
+```
+
+**参数说明**:
+| 参数名称        | 参数含义          |        支持数据类型    |   是否必选|
+| ----------     | ------------------| ------------------- | ------------------- |
+| variable       | 需要保存的变量     |dict, list, tuple, torch.tensor, int, float, str |  是  |
+| name           | 指定的名称         | str                 | 是  |
+| save_backward  | 是否保存反向数据   | boolean             | 否 |
+
+### 2.2 msprobe.mindspore.seed_all
+
+**功能说明**：用于固定网络中的随机性和开启确定性计算。
+
+**原型**：
+```python
+seed_all(seed=1234, mode=False, rm_dropout=True)
+```
+
+**参数说明**:
+
+1. seed: 随机性种子，默认值：1234，非必选。参数示例: seed=1000。该参数用于 random、numpy.random, mindspore.common.Initializer、mindspore.nn.probability.distribution的随机数生成以及 Python 中 str、bytes、datetime 对象的 hash 算法。
+
+2. mode：确定性计算使能，可配置 True 或 False，默认值：False，非必选。参数示例：mode=True。该参数设置为 True 后，将会开启算子确定性运行模式与归约类通信算子（AllReduce、ReduceScatter、Reduce）的确定性计算。注意：确定性计算会导致 API 执行性能降低，建议在发现模型多次执行结果不同的情况下开启。
+
+3. rm_dropout：控制 dropout 失效的开关。可配置 True 或 False，默认值：True，非必选。参数示例：rm_dropout=True。该参数设置为 True 后，将会使 mindspore.ops.Dropout，mindspore.ops.Dropout2D，mindspore.ops.Dropout3D，mindspore.mint.nn.Dropout和mindspore.mint.nn.functional.dropout 失效，以避免因随机 dropout 造成的网络随机性。建议在采集数据前调用。
+
+**注意**：通过 rm_dropout 控制 dropout 失效或生效需要在初始化 Dropout 实例前调用才能生效。
+
+## 3 示例代码
+
+以下为添加了 msprobe 工具 dump 接口的示例训练脚本。
+
+```python
+import mindspore as ms
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+
+# 导入工具的数据采集接口
+from msprobe.pytorch import PrecisionDebugger
+
+# 在模型训练开始前实例化PrecisionDebugger
+debugger = PrecisionDebugger(config_path='./config.json')
+
+
+# 定义网络
+class Net(nn.Module):
+    def __init__(self) -> None:
+        super().__init__()
+        self.linear1 = nn.Linear(in_features=8, out_features=4)
+        self.linear2 = nn.Linear(in_features=4, out_features=2)
+
+    def forward(self, x):
+        x1 = self.linear1(x)
+        x2 = self.linear2(x1)
+        logits = F.relu(x2)
+        return logits
+
+
+net = Net()
+
+
+def train_step(inputs):
+    return net(inputs)
+
+
+if __name__ == "__main__":
+    data = (torch.randn(10, 8), torch.randn(10, 8), torch.randn(10, 8))
+    grad_fn = ms.value_and_grad(train_step, grad_position=0)
+
+    for inputs in data:
+        # 开启数据 dump
+        debugger.start(model=net)
+
+        out, grad = grad_fn(inputs)
+
+        # 停止数据 dump
+        debugger.stop()
+        # 更新 step 信息
+        debugger.step()
+```
+
+## 4 dump 结果文件介绍
+
+训练结束后，工具将 dump 的数据保存在 dump_path 参数指定的目录下。目录结构示例如下：
+
+```lua
+├── dump_path
+│   ├── step0
+│   |   ├── rank0
+│   |   │   ├── dump_tensor_data
+|   |   |   |    ├── Tensor.permute.1.forward.npy
+|   |   |   |    ├── Functional.linear.5.backward.output.npy    # 命名格式为{api_type}.{api_name}.{API调用次数}.{forward/backward}.{input/output}.{参数序号}, 其中，“参数序号”表示该API的第n个输入或输出，例如1，则为第一个参数，若该参数为list格式，则根据list继续排序，例如1.1，表示该API的第1个参数的第1个元素。
+|   |   |   |    ...
+|   |   |   |    ├── Module.conv1.Conv2d.forward.0.input.0.npy          # 命名格式为{Module}.{module_name}.{class_name}.{forward/backward}.{调用次数}.{input/output}.{参数序号}, 其中，“参数序号”表示该Module的第n个参数，例如1，则为第一个参数，若该参数为list格式，则根据list继续排序，例如1.1，表示该Module的第1个参数的第1个元素。
+|   |   |   |    ├── Module.conv1.Conv2D.forward.0.parameters.bias.npy  # 模块参数数据：命名格式为{Module}.{module_name}.{class_name}.forward.{调用次数}.parameters.{parameter_name}。
+|   |   |   |    └── Module.conv1.Conv2D.parameters_grad.weight.npy     # 模块参数梯度数据：命名格式为{Module}.{module_name}.{class_name}.parameters_grad.{parameter_name}。因为同一模块的参数使用同一梯度进行更新，所以参数梯度文件名不包含调用次数。
+|   |   |   |                                                          # 当dump时传入的model参数为List[torch.nn.Module]或Tuple[torch.nn.Module]时，模块级数据的命名中包含该模块在列表中的索引index，命名格式为{Module}.{index}.*，*表示以上三种模块级数据的命名格式，例如：Module.0.conv1.Conv2d.forward.0.input.0.npy。
+│   |   |   ├── dump.json
+│   |   |   ├── stack.json
+│   |   |   └── construct.json
+│   |   ├── rank1
+|   |   |   ├── dump_tensor_data
+|   |   |   |   └── ...
+│   |   |   ├── dump.json
+│   |   |   ├── stack.json
+|   |   |   └── construct.json
+│   |   ├── ...
+│   |   |
+|   |   └── rank7
+│   ├── step1
+│   |   ├── ...
+│   ├── step2
+```
+* `rank`：设备 ID，每张卡的数据保存在对应的 `rank{ID}` 目录下。非分布式场景下没有 rank ID，目录名称为 rank。
+* `dump_tensor_data`：保存采集到的张量数据。
+* `dump.json`： 保存 API 或 Module 前反向数据的统计量信息。包含 dump 数据的 API 名称或 Module 名称，各数据的 dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置 summary_mode="md5" 时的 CRC-32 数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#3-MSAdapter场景下的dump.json文件)。
+* `stack.json`：API/Module 的调用栈信息。
+* `construct.json`：分层分级结构，level 为 L1 时，construct.json 内容为空。
+
+
+当 task 为 tensor 时，dump 过程中，npy 文件在对应算子或者模块被执行后就会落盘，而 json 文件则需要在正常执行 PrecisionDebugger.stop() 后才会写入完整数据。因此如果程序异常终止，终止前被执行算子的相关 npy 文件得以保存，但 json 文件中的数据可能丢失。
+
+其中 rank 为设备上各卡的 ID，每张卡上 dump 的数据会生成对应 dump 目录。非分布式场景下没有 rank ID，目录名称为 rank。
+
+npy 文件名的前缀含义如下：
+
+| 前缀        | 含义                          |
+| ----------- | ---------------------------- |
+| Tensor      | torch.Tensor API数据          |
+| Torch       | torch API数据                 |
+| Functional  | torch.nn.functional API数据   |
+| NPU         | NPU 亲和API数据               |
+| Distributed | torch.distributed API数据     |
+| Jit         | 被 "jit" 装饰的模块或函数数据   |
+| Module      | torch.nn.Module 类（模块）数据 |
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/docs/30.overflow_check_MSAdapter.md b/debug/accuracy_tools/msprobe/docs/30.overflow_check_MSAdapter.md
new file mode 100644
index 00000000000..01d64c808d4
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/docs/30.overflow_check_MSAdapter.md
@@ -0,0 +1,31 @@
+# MSAdapter 场景的溢出检测
+
+msprobe 工具提供 MSAdapter 场景下的溢出检测功能。其检测对象为 **API** 级别(除 Primitive 和 Jit 类 API)或**模块**级别，分别对应 config.json 配置中的 **"L1"** 、**"L0"** level。
+
+需要注意，本工具仅支持在 INF/NAN 模式<sup>a</sup>下进行溢出检测。INF/NAN 模式的使能方式如下：
+
+```Shell
+# 使能 CANN 侧 INF/NAN 模式
+export INF_NAN_MODE_ENABLE=1
+# 使能 MindSpore 框架侧 INF/NAN 模式
+export MS_ASCEND_CHECK_OVERFLOW_MODE="INFNAN_MODE"
+```
+
+**a**：在处理浮点数计算溢出问题时，NPU 当前支持两种溢出模式：INF/NAN 模式与饱和模式。INF/NAN 模式遵循 IEEE 754 标准，根据定义输出 INF/NAN 的计算结果。与之对应的饱和模式在计算出现溢出时，饱和为浮点数极值（+-MAX）。对于 CANN 侧配置，Atlas 训练系列产品，默认为饱和模式，且不建议使用 INF/NAN 模式；Atlas A2训练系列产品，默认为 INF/NAN 模式，且不建议使用饱和模式。对于 MindSpore 框架侧配置，仅支持对 Atlas A2 训练系列产品进行设置，默认为 INF/NAN 模式。CANN 侧 与 MindSpore 框架侧配置须一致。
+
+溢出检测任务的配置示例见["**MindSpore 动态图场景 task 配置为 overflow_check**"](./03.config_examples.md#33-task配置为overflow_check)小节。
+
+
+## 1 接口介绍
+
+溢出检测功能提供的接口与数据采集任务一致，详见 MSAdapter 场景的精度数据采集中的["**2 接口介绍**"](./29.data_dump_MSAdapter.md#2-接口介绍)小节。
+
+需要注意，目前暂不支持 "L1" level 下 primitive op 的溢出检测。
+
+## 2 示例代码
+
+溢出检测功能使用方式与数据采集任务一致，详见 MSAdapter 场景的精度数据采集中的["**3 示例代码**"](./29.data_dump_MSAdapter.md#3-示例代码)小节。
+
+## 3 溢出检测结果文件介绍
+
+溢出检测结果文件目录结构与含义与数据采集任务一致，但仅保存溢出 API 或 模块 的真实数据或统计信息。详见 MSAdapter 场景的精度数据采集中的["**4 dump 结果文件介绍**"](./29.data_dump_MSAdapter.md#4-dump-结果文件介绍)小节。
\ No newline at end of file
-- 
Gitee


From 3caacf2e2b845191d28e0b13a042b13908943f4b Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Mon, 3 Mar 2025 09:17:25 +0800
Subject: [PATCH 053/145] Update 09.accuracy_checker_MindSpore.md

---
 .../msprobe/docs/09.accuracy_checker_MindSpore.md               | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md b/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
index 8e5ab781ce0..cfbd0a7b30d 100644
--- a/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
@@ -2,7 +2,7 @@
 
 ## 1 简介
 
-**MindSpore 动态图精度预检**<sup>a</sup>通过扫描昇腾 NPU 上用户训练 MindSpore 模型中的所有 Mint API，输出精度情况的诊断和分析。工具以模型中所有 Mint API 前反向的 dump 结果为输入，构造相应的 API 单元测试，将 NPU 输出与标杆（CPU 高精度）比对，计算对应的精度指标，从而找出 NPU 中存在精度问题的 Mint API。本工具支持**随机生成模式和真实数据模式**<sup>b</sup>。
+**MindSpore 动态图精度预检**<sup>a</sup>通过扫描昇腾 NPU 上用户训练 MindSpore 模型中的所有 Mint API 以及部分融合算子，输出精度情况的诊断和分析。工具以模型中所有 API 前反向的 dump 结果为输入，构造相应的 API 单元测试，将 NPU 输出与标杆（CPU 高精度）比对，计算对应的精度指标，从而找出 NPU 中存在精度问题的 API。本工具支持**随机生成模式和真实数据模式**<sup>b</sup>。
 
 a. 支持 Mindspore 版本：2.4/2.5；
 
-- 
Gitee


From 6568963f31dc7d225e58c40b89f3016245c2b172 Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Mon, 3 Mar 2025 10:06:31 +0800
Subject: [PATCH 054/145] Update 09.accuracy_checker_MindSpore.md

---
 .../msprobe/docs/09.accuracy_checker_MindSpore.md               | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md b/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
index cfbd0a7b30d..ec60cffde93 100644
--- a/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
@@ -2,7 +2,7 @@
 
 ## 1 简介
 
-**MindSpore 动态图精度预检**<sup>a</sup>通过扫描昇腾 NPU 上用户训练 MindSpore 模型中的所有 Mint API 以及部分融合算子，输出精度情况的诊断和分析。工具以模型中所有 API 前反向的 dump 结果为输入，构造相应的 API 单元测试，将 NPU 输出与标杆（CPU 高精度）比对，计算对应的精度指标，从而找出 NPU 中存在精度问题的 API。本工具支持**随机生成模式和真实数据模式**<sup>b</sup>。
+**MindSpore 动态图精度预检**<sup>a</sup>通过扫描昇腾 NPU 上用户训练 MindSpore 模型中的所有 Mint API 以及 Msadapter场景下迁移的mindspore API，输出精度情况的诊断和分析。工具以模型中所有 API 前反向的 dump 结果为输入，构造相应的 API 单元测试，将 NPU 输出与标杆（CPU 高精度）比对，计算对应的精度指标，从而找出 NPU 中存在精度问题的 API。本工具支持**随机生成模式和真实数据模式**<sup>b</sup>。
 
 a. 支持 Mindspore 版本：2.4/2.5；
 
-- 
Gitee


From 20d6f57029f8b8b935d6c84abcce9e7362551c8c Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Mon, 3 Mar 2025 10:09:53 +0800
Subject: [PATCH 055/145] Update 09.accuracy_checker_MindSpore.md

---
 .../msprobe/docs/09.accuracy_checker_MindSpore.md               | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md b/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
index ec60cffde93..3bf65032eda 100644
--- a/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/09.accuracy_checker_MindSpore.md
@@ -2,7 +2,7 @@
 
 ## 1 简介
 
-**MindSpore 动态图精度预检**<sup>a</sup>通过扫描昇腾 NPU 上用户训练 MindSpore 模型中的所有 Mint API 以及 Msadapter场景下迁移的mindspore API，输出精度情况的诊断和分析。工具以模型中所有 API 前反向的 dump 结果为输入，构造相应的 API 单元测试，将 NPU 输出与标杆（CPU 高精度）比对，计算对应的精度指标，从而找出 NPU 中存在精度问题的 API。本工具支持**随机生成模式和真实数据模式**<sup>b</sup>。
+**MindSpore 动态图精度预检**<sup>a</sup>通过扫描昇腾 NPU 上用户训练 MindSpore 模型中的所有 Mint API 以及 Msadapter场景下迁移的 Mindspore API，输出精度情况的诊断和分析。工具以模型中所有 API 前反向的 dump 结果为输入，构造相应的 API 单元测试，将 NPU 输出与标杆（CPU 高精度）比对，计算对应的精度指标，从而找出 NPU 中存在精度问题的 API。本工具支持**随机生成模式和真实数据模式**<sup>b</sup>。
 
 a. 支持 Mindspore 版本：2.4/2.5；
 
-- 
Gitee


From 7b1a62ba2c52a73fed626c9281726b138e5dafe3 Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Mon, 3 Mar 2025 10:14:49 +0800
Subject: [PATCH 056/145] update 1.2.2 whl

---
 debug/accuracy_tools/msprobe/docs/01.installation.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/docs/01.installation.md b/debug/accuracy_tools/msprobe/docs/01.installation.md
index 1ab5f6419ba..530783e87d0 100644
--- a/debug/accuracy_tools/msprobe/docs/01.installation.md
+++ b/debug/accuracy_tools/msprobe/docs/01.installation.md
@@ -16,7 +16,7 @@ pip install mindstudio-probe
 
 |版本|发布日期|支持 PyTorch 版本|支持 MindSpore 版本|下载链接|校验码|
 |:--:|:--:|:--:|:--:|:--:|:--:|
-|1.2.2|2025.2.26|1.11/2.0/2.1/2.2|2.4.0|[mindstudio_probe-1.2.2-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/msprobe/1.2/mindstudio_probe-1.2.2-py3-none-any.whl)|1db0cf4572bc0305c68705b74775f652c6cb2c2bedb6c6e57f43e31ab273b288|
+|1.2.2|2025.3.03|1.11/2.0/2.1/2.2|2.4.0|[mindstudio_probe-1.2.2-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/msprobe/1.2/mindstudio_probe-1.2.2-py3-none-any.whl)|961411bb460d327ea51d6ca4d0c8e8c5565f07c0852d7b8592b781ca35b87212|
 |1.2.1|2025.2.07|1.11/2.0/2.1/2.2|2.4.0|[mindstudio_probe-1.2.1-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/msprobe/1.2/mindstudio_probe-1.2.1-py3-none-any.whl)|b64b342118558e0339b39237f88a49b93fd24551b0cb202c872fbfef4260c86b|
 |1.2.0|2025.1.13|1.11/2.0/2.1/2.2|2.4.0|[mindstudio_probe-1.2.0-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/msprobe/1.2/mindstudio_probe-1.2.0-py3-none-any.whl)|1e3aeea1706112f6ee52fd1165037936bb209138f0b9ec42ea21e2c1c8942cdc|
 |1.1.1|2024.12.09|1.11/2.0/2.1/2.2|2.4.0|[mindstudio_probe-1.1.1-py3-none-any.whl](https://ptdbg.obs.myhuaweicloud.com/msprobe/1.1/mindstudio_probe-1.1.1-py3-none-any.whl)|577b597555dc155b76ba1a62d575c3546004644e140a456c3ba0824d46283735|
-- 
Gitee


From f54ae7594d04d3a42af973ec69fc8e793a2fe566 Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Mon, 3 Mar 2025 10:15:32 +0800
Subject: [PATCH 057/145] Update PULL_REQUEST_TEMPLATE.zh-CN.md

---
 .gitee/PULL_REQUEST_TEMPLATE.zh-CN.md | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/.gitee/PULL_REQUEST_TEMPLATE.zh-CN.md b/.gitee/PULL_REQUEST_TEMPLATE.zh-CN.md
index fc9e09f3503..e9cc1deb82f 100644
--- a/.gitee/PULL_REQUEST_TEMPLATE.zh-CN.md
+++ b/.gitee/PULL_REQUEST_TEMPLATE.zh-CN.md
@@ -17,6 +17,11 @@
 
 ---
 
+## 3. 分支合并要求
+- [ ] **代码合并**（请确保将 master 分支的最新代码同步合并至 poc 分支及 pre-research 分支，同时保证 poc 分支的代码也已正确合并到 pre-research 分支。）
+
+---
+
 ## 3. 代码检视
 - **要求：**
   - 合入代码超过 200 行，需三人以上会议检视。
-- 
Gitee


From e00afd4314238bf3e3b48440ec42eb5e9c81d694 Mon Sep 17 00:00:00 2001
From: curry3 <485078529@qq.com>
Date: Mon, 3 Mar 2025 11:01:05 +0800
Subject: [PATCH 058/145] =?UTF-8?q?=E3=80=90=E8=B5=84=E6=96=99=E4=BC=98?=
 =?UTF-8?q?=E5=8C=96=E3=80=91=E7=BA=A0=E6=AD=A3Atlas=E8=AE=AD=E7=BB=83?=
 =?UTF-8?q?=E7=B3=BB=E5=88=97=E4=BA=A7=E5=93=81=E4=B8=8D=E6=94=AF=E6=8C=81?=
 =?UTF-8?q?INF/NAN=E6=A8=A1=E5=BC=8F=E7=9A=84=E8=AF=B4=E6=98=8E?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md  | 2 +-
 .../accuracy_tools/msprobe/docs/13.overflow_check_MindSpore.md  | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md b/debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md
index 97b049000c6..983477554e1 100644
--- a/debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md
+++ b/debug/accuracy_tools/msprobe/docs/12.overflow_check_PyTorch.md
@@ -28,7 +28,7 @@ msprobe 工具在 PyTorch 场景下提供溢出数据采集功能和溢出数据
 
 溢出数据采集功能在昇腾 NPU 上支持饱和模式（仅支持 Atlas 训练系列产品）和 INF/NAN 模式。
 
-INF/NAN 模式遵循 IEEE 754 标准，根据定义输出 INF/NAN 的计算结果。与之对应的饱和模式在计算出现溢出时，饱和为浮点数极值（+-MAX）。对于 CANN 侧配置，Atlas 训练系列产品，默认为饱和模式，且不建议使用 INF/NAN 模式；Atlas A2 训练系列产品，默认为 INF/NAN 模式，且不建议使用饱和模式。
+INF/NAN 模式遵循 IEEE 754 标准，根据定义输出 INF/NAN 的计算结果。与之对应的饱和模式在计算出现溢出时，饱和为浮点数极值（+-MAX）。对于 CANN 侧配置，Atlas 训练系列产品，默认为饱和模式，且不支持使用 INF/NAN 模式；Atlas A2 训练系列产品，默认为 INF/NAN 模式，且不建议使用饱和模式。
 
 INF/NAN 模式的使能方式如下：
 
diff --git a/debug/accuracy_tools/msprobe/docs/13.overflow_check_MindSpore.md b/debug/accuracy_tools/msprobe/docs/13.overflow_check_MindSpore.md
index 33ff4a0259a..ef83aa17237 100644
--- a/debug/accuracy_tools/msprobe/docs/13.overflow_check_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/13.overflow_check_MindSpore.md
@@ -11,7 +11,7 @@ export INF_NAN_MODE_ENABLE=1
 export MS_ASCEND_CHECK_OVERFLOW_MODE="INFNAN_MODE"
 ```
 
-**a**：在处理浮点数计算溢出问题时，NPU 当前支持两种溢出模式：INF/NAN 模式与饱和模式。INF/NAN 模式遵循 IEEE 754 标准，根据定义输出 INF/NAN 的计算结果。与之对应的饱和模式在计算出现溢出时，饱和为浮点数极值（+-MAX）。对于 CANN 侧配置，Atlas 训练系列产品，默认为饱和模式，且不建议使用 INF/NAN 模式；Atlas A2训练系列产品，默认为 INF/NAN 模式，且不建议使用饱和模式。对于 MindSpore 框架侧配置，仅支持对 Atlas A2 训练系列产品进行设置，默认为 INF/NAN 模式。CANN 侧 与 MindSpore 框架侧配置须一致。
+**a**：在处理浮点数计算溢出问题时，NPU 当前支持两种溢出模式：INF/NAN 模式与饱和模式。INF/NAN 模式遵循 IEEE 754 标准，根据定义输出 INF/NAN 的计算结果。与之对应的饱和模式在计算出现溢出时，饱和为浮点数极值（+-MAX）。对于 CANN 侧配置，Atlas 训练系列产品，默认为饱和模式，且不支持使用 INF/NAN 模式；Atlas A2训练系列产品，默认为 INF/NAN 模式，且不建议使用饱和模式。对于 MindSpore 框架侧配置，仅支持对 Atlas A2 训练系列产品进行设置，默认为 INF/NAN 模式。CANN 侧 与 MindSpore 框架侧配置须一致。
 
 溢出检测任务的配置示例见[MindSpore 静态图场景下 task 配置为 overflow_check](https://gitee.com/ascend/mstt/blob/master/debug/accuracy_tools/msprobe/docs/03.config_examples.md#23-task-%E9%85%8D%E7%BD%AE%E4%B8%BA-overflow_check)、[MindSpore 动态图场景下 task 配置为 overflow_check](https://gitee.com/ascend/mstt/blob/master/debug/accuracy_tools/msprobe/docs/03.config_examples.md#33-task-%E9%85%8D%E7%BD%AE%E4%B8%BA-overflow_check)。
 
-- 
Gitee


From 75f2ca747be7c86992e053e3120d3538b9bf7bdc Mon Sep 17 00:00:00 2001
From: TAJh <taojiaheng1@huawei.com>
Date: Mon, 3 Mar 2025 11:01:10 +0800
Subject: [PATCH 059/145] bugfix

---
 debug/accuracy_tools/msprobe/mindspore/monitor/utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/monitor/utils.py b/debug/accuracy_tools/msprobe/mindspore/monitor/utils.py
index f628e8b501f..506ad6c3f91 100644
--- a/debug/accuracy_tools/msprobe/mindspore/monitor/utils.py
+++ b/debug/accuracy_tools/msprobe/mindspore/monitor/utils.py
@@ -258,7 +258,7 @@ def validate_config(config):
     step_interval = config.get('step_interval', 1)
     validate_step_interval(step_interval)
 
-    collect_times = config.get('collect_times', 1e8)
+    collect_times = config.get('collect_times', int(1e8))
     validate_collect_times(collect_times)
 
     if not targets:
-- 
Gitee


From 1f95912509574c7994bb10d97fc36c7fdd108b6d Mon Sep 17 00:00:00 2001
From: eveyin <qianyin2022@hotmail.com>
Date: Mon, 3 Mar 2025 14:20:45 +0800
Subject: [PATCH 060/145] =?UTF-8?q?=E4=BF=AE=E6=94=B9=E6=96=87=E4=BB=B6?=
 =?UTF-8?q?=E5=90=8D?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 {flight_recoder => flight_recorder}/analysis_flight.py            | 0
 {flight_recoder => flight_recorder}/check_path.py                 | 0
 .../flight_recoder.md => flight_recorder/flight_recorder.md       | 0
 3 files changed, 0 insertions(+), 0 deletions(-)
 rename {flight_recoder => flight_recorder}/analysis_flight.py (100%)
 rename {flight_recoder => flight_recorder}/check_path.py (100%)
 rename flight_recoder/flight_recoder.md => flight_recorder/flight_recorder.md (100%)

diff --git a/flight_recoder/analysis_flight.py b/flight_recorder/analysis_flight.py
similarity index 100%
rename from flight_recoder/analysis_flight.py
rename to flight_recorder/analysis_flight.py
diff --git a/flight_recoder/check_path.py b/flight_recorder/check_path.py
similarity index 100%
rename from flight_recoder/check_path.py
rename to flight_recorder/check_path.py
diff --git a/flight_recoder/flight_recoder.md b/flight_recorder/flight_recorder.md
similarity index 100%
rename from flight_recoder/flight_recoder.md
rename to flight_recorder/flight_recorder.md
-- 
Gitee


From c32417773fc425d743ad45a14a773bc4a904c314 Mon Sep 17 00:00:00 2001
From: curry3 <485078529@qq.com>
Date: Mon, 3 Mar 2025 16:24:29 +0800
Subject: [PATCH 061/145] =?UTF-8?q?=E3=80=90bugfix=E3=80=91=E4=BF=AE?=
 =?UTF-8?q?=E5=A4=8D=E6=B2=A1=E6=9C=89=E5=AE=9E=E9=99=85=E5=85=83=E7=B4=A0?=
 =?UTF-8?q?=E7=9A=84tensor=E8=AE=A1=E7=AE=97=E7=BB=9F=E8=AE=A1=E9=87=8F?=
 =?UTF-8?q?=E6=8A=A5=E9=94=99=E9=97=AE=E9=A2=98?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../core/data_dump/data_processor/pytorch_processor.py |  2 +-
 .../data_dump/data_processor/test_pytorch_processor.py | 10 ++++++++++
 2 files changed, 11 insertions(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
index 2cd98b12568..f29c6f6b993 100644
--- a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
+++ b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
@@ -145,7 +145,7 @@ class PytorchDataProcessor(BaseDataProcessor):
         if data.is_meta:
             return tensor_stat
         data_clone = data.detach()
-        if data_clone.numel() == 0:
+        if not data_clone.numel() or not data_clone.data_ptr():
             return tensor_stat
         else:
             if data_clone.device.type == Const.CPU_LOWERCASE or not async_dump:
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/data_dump/data_processor/test_pytorch_processor.py b/debug/accuracy_tools/msprobe/test/core_ut/data_dump/data_processor/test_pytorch_processor.py
index 34064e7cc2b..3d31a1bb516 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/data_dump/data_processor/test_pytorch_processor.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/data_dump/data_processor/test_pytorch_processor.py
@@ -19,6 +19,7 @@ from msprobe.core.data_dump.data_processor.pytorch_processor import (
     KernelDumpDataProcessor
 )
 from torch import distributed as dist
+from torch._subclasses import FakeTensorMode
 
 
 class TestPytorchDataProcessor(unittest.TestCase):
@@ -62,6 +63,15 @@ class TestPytorchDataProcessor(unittest.TestCase):
         result = PytorchDataProcessor.get_stat_info(mock_data)
         self.assertIsInstance(result, TensorStatInfo)
 
+    def test_get_stat_info_with_fake_tensor(self):
+        with FakeTensorMode() as fake_tensor_mode:
+            fake_tensor = fake_tensor_mode.from_tensor(torch.randn(1, 2, 3))
+        result = PytorchDataProcessor.get_stat_info(fake_tensor)
+        self.assertIsNone(result.max)
+        self.assertIsNone(result.min)
+        self.assertIsNone(result.mean)
+        self.assertIsNone(result.norm)
+
     def test_get_stat_info_float(self):
         tensor = torch.tensor([1.0, 2.0, 3.0])
         result = self.processor.get_stat_info(tensor)
-- 
Gitee


From be625cba7c9fc549589418d5ca6d14e4002c2e77 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=AD=94=E7=82=B3=E7=BF=94?= <1120200577@qq.com>
Date: Mon, 3 Mar 2025 17:33:53 +0800
Subject: [PATCH 062/145] update freq_analysis

---
 .../msprof_analyze/cluster_analyse/README.md  |   1 +
 .../recipes/freq_analysis/__init__.py         |   0
 .../recipes/freq_analysis/freq_analysis.py    | 114 ++++++++++++++++++
 .../recipes/test_freq_analysis.py             |  83 +++++++++++++
 4 files changed, 198 insertions(+)
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/__init__.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
 create mode 100644 profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_freq_analysis.py

diff --git a/profiler/msprof_analyze/cluster_analyse/README.md b/profiler/msprof_analyze/cluster_analyse/README.md
index 325a0984793..6612d0f1989 100644
--- a/profiler/msprof_analyze/cluster_analyse/README.md
+++ b/profiler/msprof_analyze/cluster_analyse/README.md
@@ -79,6 +79,7 @@ experimental_config = torch_npu.profiler._ExperimentalConfig(
    | compute_op_sum       | 集群场景性能数据的device运行算子信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。--export_type为db时，输出交付件cluster_analysis.db；--export_type为notebook时，在cluster_analysis_output/ComputeOpSum目录下输出交付件stats.ipynb；可根据实际情况决定是否是否打开--exclude_op_name。 | 否       |
    | hccl_sum             | 集合通信算子耗时分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。--export_type为db时，输出交付件cluster_analysis.db；--export_type为notebook时，在cluster_analysis_output/HcclSum目录下输出交付件stats.ipynb。 | 否       |
    | mstx_sum             | 集群场景mstx打点信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。--export_type为db时，输出交付件cluster_analysis.db；--export_type为notebook时，在cluster_analysis_output/MstxSum目录下输出交付件stats.ipynb。 | 否       |
+   | freq_analysis        | 集群场景aicore frequency信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。打屏输出是否存在aicore存在空闲（频率为800MHz）、异常（频率不为1800MHz或800MHz）的现象。如果有，则在输出交付件cluster_analysis.db增加对应的卡和频率信息。 | 否       |
    | 自定义分析参数       | 与cann_api_sum、compute_op_sum、hccl_sum等参数功能类似，用户可自定义一套性能数据的分析规则，需要详细了解性能分析的开发人员，具体开发指导请参见“[自定义分析规则开发指导](#自定义分析规则开发指导)”。 | 否       |
    
    --parallel_mode参数示例如下：
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/__init__.py b/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/__init__.py
new file mode 100644
index 00000000000..e69de29bb2d
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
new file mode 100644
index 00000000000..0bc7afa393a
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
@@ -0,0 +1,114 @@
+# Copyright (c) 2024, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+from collections import defaultdict
+import pandas as pd
+
+from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.prof_common.database_service import DatabaseService
+
+logger = get_logger()
+
+
+class FreqAnalysis(BaseRecipeAnalysis):
+    COMMON_FREQ = 1800
+    FREE_FREQ = 800
+
+    def __init__(self, params):
+        super().__init__(params)
+        self.free_freq_ranks = []
+        self.abnormal_freq_ranks = []
+        self.abnormal_freq_ranks_map = {}
+
+    @property
+    def base_dir(self):
+        return os.path.basename(os.path.dirname(__file__))
+    
+    def reducer_func(self, mapper_res):
+        if self._is_msprof:
+            logger.warning("Freq analysis do not support msprof db now.")
+            return
+        
+        mapper_res = list(filter(lambda res: res is not None, mapper_res))
+        if not mapper_res:
+            logger.error("Mapper data is None, load profiling data failed.")
+            return 
+        
+        for freqs, rank_id in mapper_res:
+            if freqs == [self.COMMON_FREQ]:
+                continue
+            elif set(freqs) == {self.COMMON_FREQ, self.FREE_FREQ}:
+                self.free_freq_ranks.append(rank_id)
+            else:
+                self.abnormal_freq_ranks.append(rank_id)
+                self.abnormal_freq_ranks_map[rank_id] = str(freqs)
+
+        self.free_freq_ranks.sort()
+        self.abnormal_freq_ranks.sort()
+
+    def save_db(self):
+        if len(self.free_freq_ranks) > 0:
+            logger.info(f"Found {len(self.free_freq_ranks)} ranks with free time, "
+                        f"aicore frequency in {[self.FREE_FREQ, self.COMMON_FREQ]}.")
+            free_ranks_df = pd.DataFrame()
+            free_ranks_df["rankId"] = self.free_freq_ranks
+            free_ranks_df["aicoreFrequency"] = str([self.FREE_FREQ, self.COMMON_FREQ])
+            free_ranks_df.set_index(["rankId"], inplace=True)
+            self.dump_data(free_ranks_df, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER, "FreeFrequencyRanks")
+        else:
+            logger.info("No rank found with free time.")
+        if len(self.abnormal_freq_ranks) > 0:    
+            logger.info(f"Found {len(self.abnormal_freq_ranks)} ranks with abnormal aicore frequency.")
+
+            abnormal_ranks_df = pd.DataFrame.from_dict(self.abnormal_freq_ranks_map, 
+                                                       orient="index", columns=["aicoreFrequency"])
+            abnormal_ranks_df = abnormal_ranks_df.reset_index().rename(columns={"index": "rankId"})
+            abnormal_ranks_df.set_index(["rankId"], inplace=True)
+            self.dump_data(abnormal_ranks_df, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER, "AbnormalFrequencyRanks")
+        else:
+            logger.info("No rank found with abnormal aicore frequency.")
+        if len(self.free_freq_ranks) > 0 or len(self.abnormal_freq_ranks) > 0:
+            logger.info("Please verify result in output file.")
+
+    def run(self, context):
+        mapper_res = self.mapper_func(context)
+        self.reducer_func(mapper_res)
+        self.save_db()
+
+    def _mapper_func(self, data_map, analysis_class):
+        profiler_db_path = data_map.get(Constant.PROFILER_DB_PATH)
+        service = DatabaseService(profiler_db_path, None)
+        service.add_table_for_query("AICORE_FREQ", ["deviceId", "freq"])
+        service.add_table_for_query("RANK_DEVICE_MAP", ["rankId"])
+        service_res = service.query_data()
+        aic_freq = service_res.get("AICORE_FREQ", None)
+        rank_id = service_res.get("RANK_DEVICE_MAP", None)
+
+        if aic_freq is None or aic_freq.empty:
+            logger.error(f"No aic freq data found in {profiler_db_path}.")
+            return None
+        
+        if rank_id is None or rank_id.empty:
+            logger.error(f"No rank_id data found in {profiler_db_path}.")
+            return None
+        
+        rank_id = rank_id["rankId"].values[0]
+        freq_arr = aic_freq["freq"].values
+        freqs = list(set(freq_arr))
+        freqs.sort()
+        return freqs, rank_id
diff --git a/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_freq_analysis.py b/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_freq_analysis.py
new file mode 100644
index 00000000000..0a559b79178
--- /dev/null
+++ b/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_freq_analysis.py
@@ -0,0 +1,83 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+import random
+import unittest
+
+import pandas as pd
+
+from msprof_analyze.cluster_analyse.recipes.freq_analysis.freq_analysis import FreqAnalysis
+
+
+class TestFreqAnalysis(unittest.TestCase):
+
+    freq = [1800]
+    free_freq = [800, 1800]
+    abnormal_freq = [1200, 1300, 1800]
+
+    def test_no_error_freq(self):
+        params = {}
+        recipe = FreqAnalysis(params)
+        mapper_res = [(self.freq, 0)] * 10
+        recipe.reducer_func(mapper_res)
+        self.assertEqual(recipe.free_freq_ranks, [])
+        self.assertEqual(recipe.abnormal_freq_ranks, [])
+        self.assertEqual(recipe.abnormal_freq_ranks_map, {})
+
+
+    def test_free_rank_map(self):
+        params = {}
+        recipe = FreqAnalysis(params)
+        mapper_res = [
+            (self.freq, 0),
+            (self.free_freq, 1),
+            (self.free_freq, 2),
+            (self.freq, 3)
+        ]
+        recipe.reducer_func(mapper_res)
+        self.assertEqual(recipe.free_freq_ranks, [1, 2])
+        self.assertEqual(recipe.abnormal_freq_ranks, [])
+        self.assertEqual(recipe.abnormal_freq_ranks_map, {})
+    
+    def test_abnormal_rank_map(self):
+        params = {}
+        recipe = FreqAnalysis(params)
+        mapper_res = [
+            (self.freq, 0),
+            (self.abnormal_freq, 1),
+            (self.abnormal_freq, 2),
+            (self.freq, 3)
+        ]
+
+        recipe.reducer_func(mapper_res)
+        self.assertEqual(recipe.free_freq_ranks, [])
+        self.assertEqual(recipe.abnormal_freq_ranks, [1, 2])
+
+    def test_mix_freq_case(self):
+        params = {}
+        recipe = FreqAnalysis(params)
+        mapper_res = []
+        rank_case = [[], [], []]
+        random_freq = {0: self.freq, 1: self.free_freq, 2: self.abnormal_freq}
+
+        for i in range(1000):
+            random_num = random.choice([0, 1, 2])
+            mapper_res.append((random_freq.get(random_num, self.freq), i))
+            rank_case[random_num].append(i)
+
+        recipe.reducer_func(mapper_res)
+        self.assertEqual(recipe.free_freq_ranks, rank_case[1])
+        self.assertEqual(recipe.abnormal_freq_ranks, rank_case[2])
-- 
Gitee


From 07d3f03a4b988473521469dc6c96fd20addd2bba Mon Sep 17 00:00:00 2001
From: fanglanyue <fanglanyue@huawei.com>
Date: Mon, 3 Mar 2025 18:03:09 +0800
Subject: [PATCH 063/145] dynolog_npu use glog

---
 .../plugin/ipc_monitor/DynoLogNpuMonitor.cpp  | 12 ++-------
 .../plugin/ipc_monitor/NpuIpcClient.cpp       | 21 +++++++--------
 .../ipc_monitor/PyDynamicMonitorProxy.h       | 26 ++++++++++++-------
 dynolog_npu/plugin/ipc_monitor/utils.cpp      |  4 +--
 dynolog_npu/plugin/ipc_monitor/utils.h        |  2 +-
 dynolog_npu/plugin/setup.py                   | 15 ++++++-----
 6 files changed, 40 insertions(+), 40 deletions(-)

diff --git a/dynolog_npu/plugin/ipc_monitor/DynoLogNpuMonitor.cpp b/dynolog_npu/plugin/ipc_monitor/DynoLogNpuMonitor.cpp
index 940f5aae167..bba66d7297a 100644
--- a/dynolog_npu/plugin/ipc_monitor/DynoLogNpuMonitor.cpp
+++ b/dynolog_npu/plugin/ipc_monitor/DynoLogNpuMonitor.cpp
@@ -1,7 +1,4 @@
 #include "DynoLogNpuMonitor.h"
-
-#include <iostream>
-
 #include "utils.h"
 
 namespace dynolog_npu {
@@ -10,13 +7,13 @@ namespace ipc_monitor {
 bool DynoLogNpuMonitor::Init()
 {
     if (isInitialized_) {
-        std::cout << "[WRARNING] DynoLog npu monitor already initialized" << std::endl;
+        LOG(ERROR) << "DynoLog npu monitor already initialized";
         return true;
     }
     bool res = ipcClient_.RegisterInstance(npuId_);
     if (res) {
         isInitialized_ = true;
-        std::cout << "[INFO] DynoLog npu monitor initialized success !" << std::endl;
+        LOG(INFO) << "DynoLog npu monitor initialized success!";
     }
     return res;
 }
@@ -24,11 +21,6 @@ bool DynoLogNpuMonitor::Init()
 std::string DynoLogNpuMonitor::Poll()
 {
     std::string res = ipcClient_.IpcClientNpuConfig();
-    if (res.empty()) {
-        std::cout << "[INFO] Request for dynolog server is empty !" << std::endl;
-        return "";
-    }
-    std::cout << "[INFO] Received NPU configuration successfully" << std::endl;
     return res;
 }
 
diff --git a/dynolog_npu/plugin/ipc_monitor/NpuIpcClient.cpp b/dynolog_npu/plugin/ipc_monitor/NpuIpcClient.cpp
index 97966e8eeac..ca2429f1e36 100644
--- a/dynolog_npu/plugin/ipc_monitor/NpuIpcClient.cpp
+++ b/dynolog_npu/plugin/ipc_monitor/NpuIpcClient.cpp
@@ -1,6 +1,5 @@
 #include "NpuIpcClient.h"
 
-#include <iostream>
 
 namespace dynolog_npu {
 namespace ipc_monitor {
@@ -15,14 +14,14 @@ bool IpcClient::RegisterInstance(int32_t id)
     std::unique_ptr<Message> message = Message::ConstructMessage<decltype(context)>(context, "ctxt");
     try {
         if (!SyncSendMessage(*message, std::string(DYNO_IPC_NAME))) {
-            std::cout << "[WARNING]Failed to send register ctxt for pid " << context.pid << " with dyno" << std::endl;
+            LOG(ERROR) << "Failed to send register ctxt for pid " << context.pid << " with dyno";
             return false;
         }
     } catch (const std::exception &e) {
-        std::cout << "[WARNING] Error when SyncSendMessage: " << e.what() << std::endl;
+        LOG(ERROR) << " Error when SyncSendMessage: " << e.what();
         return false;
     }
-    std::cout << "[INFO] Resigter pid " << context.pid << " for dynolog success !" << std::endl;
+    LOG(INFO) << "Resigter pid " << context.pid << " for dynolog success !";
     return true;
 }
 std::string IpcClient::IpcClientNpuConfig()
@@ -37,7 +36,7 @@ std::string IpcClient::IpcClientNpuConfig()
     }
     std::unique_ptr<Message> message = Message::ConstructMessage<NpuRequest, int32_t>(*req, "req", size);
     if (!SyncSendMessage(*message, std::string(DYNO_IPC_NAME))) {
-        std::cout << "[WARNING] Failed to send config  to dyno server fail !" << std::endl;
+        LOG(ERROR) << " Failed to send config  to dyno server fail !";
         free(req);
         req = nullptr;
         return "";
@@ -45,7 +44,7 @@ std::string IpcClient::IpcClientNpuConfig()
     free(req);
     message = PollRecvMessage(MAX_IPC_RETRIES, MAX_SLEEP_US);
     if (!message) {
-        std::cout << "[WARNING] Failed to receive on-demand config !" << std::endl;
+        LOG(ERROR) << " Failed to receive on-demand config !";
         return "";
     }
     std::string res = std::string(ReinterpretConvert<char *>(message->buf.get()), message->metadata.size);
@@ -65,7 +64,7 @@ std::unique_ptr<Message> IpcClient::ReceiveMessage()
 bool IpcClient::SyncSendMessage(const Message &message, const std::string &destName, int numRetry, int seepTimeUs)
 {
     if (destName.empty()) {
-        std::cout << "[WARNING] Can not send to empty socket name !" << std::endl;
+        LOG(ERROR) << " Can not send to empty socket name !";
         return false;
     }
     int i = 0;
@@ -79,7 +78,7 @@ bool IpcClient::SyncSendMessage(const Message &message, const std::string &destN
             seepTimeUs *= 2;  // 2: double sleep time
         }
     } catch (const std::exception &e) {
-        std::cout << "[ERROR] Error when SyncSendMessage: " << e.what() << std::endl;
+        LOG(ERROR) << " Error when SyncSendMessage: " << e.what();
         return false;
     }
     return i < numRetry;
@@ -94,7 +93,7 @@ bool IpcClient::Recv()
         try {
             successFlag = ep_.TryPeekMessage(*peekCtxt);
         } catch (std::exception &e) {
-            std::cout << "[ERROR] Error when TryPeekMessage: " << e.what() << std::endl;
+            LOG(ERROR) << " Error when TryPeekMessage: " << e.what();
             return false;
         }
         if (successFlag) {
@@ -108,7 +107,7 @@ bool IpcClient::Recv()
             try {
                 successFlag = ep_.TryRcvMessage(*recvCtxt);
             } catch (std::exception &e) {
-                std::cout << "[ERROR] Error when TryRecvMsg: " << e.what() << std::endl;
+                LOG(ERROR) << " Error when TryRecvMsg: " << e.what();
                 return false;
             }
             if (successFlag) {
@@ -118,7 +117,7 @@ bool IpcClient::Recv()
             }
         }
     } catch (std::exception &e) {
-        std::cout << "[ERROR] Error in Recv(): " << e.what() << std::endl;
+        LOG(ERROR) << " Error in Recv(): " << e.what();
         return false;
     }
     return false;
diff --git a/dynolog_npu/plugin/ipc_monitor/PyDynamicMonitorProxy.h b/dynolog_npu/plugin/ipc_monitor/PyDynamicMonitorProxy.h
index 8b5f88abf9d..0471a70a341 100644
--- a/dynolog_npu/plugin/ipc_monitor/PyDynamicMonitorProxy.h
+++ b/dynolog_npu/plugin/ipc_monitor/PyDynamicMonitorProxy.h
@@ -1,7 +1,7 @@
 #ifndef PYDYNAMIC_MONITOR_PROXY_H
 #define PYDYNAMIC_MONITOR_PROXY_H
 
-#include <iostream>
+#include <glog/logging.h>
 #include <memory>
 #include "MonitorBase.h"
 #include "DynoLogNpuMonitor.h"
@@ -14,15 +14,21 @@ public:
     PyDynamicMonitorProxy() = default;
     bool InitDyno(int npuId)
     {
-         try {
-             monitor_ = DynoLogNpuMonitor::GetInstance();
-             monitor_->SetNpuId(npuId);
-             bool res = monitor_->Init();
-             return res;
-         } catch (const std::exception &e) {
-             std::cout << "[ERROR] Error when init dyno " << e.what() << std::endl;
-             return false;
-         }
+        try {
+            if (!google::IsGoogleLoggingInitialized()) {
+                google::InitGoogleLogging("DynoLogNpuMonitor");
+                google::SetLogDestination(google::GLOG_INFO, "/var/log/dynolog_npu_");
+                google::SetLogFilenameExtension(".log");
+            }
+            monitor_ = DynoLogNpuMonitor::GetInstance();
+            monitor_->SetNpuId(npuId);
+            bool res = monitor_->Init();
+            LOG(ERROR) << res;
+            return res;
+        } catch (const std::exception &e) {
+            LOG(ERROR) << "Error when init dyno " << e.what();
+            return false;
+        }
     }
 
     std::string PollDyno()
diff --git a/dynolog_npu/plugin/ipc_monitor/utils.cpp b/dynolog_npu/plugin/ipc_monitor/utils.cpp
index 936821fd34b..b57942082e0 100644
--- a/dynolog_npu/plugin/ipc_monitor/utils.cpp
+++ b/dynolog_npu/plugin/ipc_monitor/utils.cpp
@@ -68,11 +68,11 @@ std::pair<int32_t, std::string> GetParentPidAndCommand(int32_t pid)
     if (std::getline(statFile, line)) {
         int ret = sscanf(line.c_str(), "%*d (%[^)]) %*c %d", command.data(), &parentPid);
         if (ret == 2) { // 2: 接收到2个字符
-            std::cout << "[INFO] Success to get parent pid: " << parentPid << std::endl;
+            LOG(INFO) << "Success to get parent pid: " << parentPid;
             return std::make_pair(parentPid, command);
         }
     }
-    std::cout << "[WARNING] Failed to parse /proc/" << pid << "/stat" << std::endl;
+    LOG(ERROR) << " Failed to parse /proc/" << pid << "/stat";
     return std::make_pair(0, "");
 }
 
diff --git a/dynolog_npu/plugin/ipc_monitor/utils.h b/dynolog_npu/plugin/ipc_monitor/utils.h
index 0d8ceb8cfd0..2374a27d417 100644
--- a/dynolog_npu/plugin/ipc_monitor/utils.h
+++ b/dynolog_npu/plugin/ipc_monitor/utils.h
@@ -10,7 +10,7 @@
 #include <sstream>
 #include <chrono>
 #include <iomanip>
-#include <iostream>
+#include <glog/logging.h>
 #include <unordered_map>
 
 
diff --git a/dynolog_npu/plugin/setup.py b/dynolog_npu/plugin/setup.py
index 151b9b3fb3f..55e924c6b69 100644
--- a/dynolog_npu/plugin/setup.py
+++ b/dynolog_npu/plugin/setup.py
@@ -13,25 +13,28 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 import os
+from glob import glob
 from setuptools import setup
 from pybind11.setup_helpers import Pybind11Extension
 
 BASE_DIR = os.path.dirname(os.path.realpath(__file__))
+DYNOLOG_PATH = os.path.join(os.path.dirname(BASE_DIR), "third_party", "dynolog")
+GLOG_INC_PATH = os.path.join(DYNOLOG_PATH, "third_party", "glog", "src")
+GLOG_LIB_PATH = os.path.join(DYNOLOG_PATH, "build", "third_party", "glog")
 
 # Define the extension module
 ext_modules = [
     Pybind11Extension(
         "IPCMonitor",  # Name of the Python module
-        sources=["bindings.cpp",
-                 "ipc_monitor/utils.cpp",
-                 "ipc_monitor/DynoLogNpuMonitor.cpp",
-                 "ipc_monitor/NpuIpcClient.cpp",
-                 ],  # Source files
-        include_dirs=[os.path.join(BASE_DIR, "ipc_monitor")],  # Include Pybind11 headers
+        sources=["bindings.cpp"] + list(glob("ipc_monitor/*.cpp")), # Source files
+        include_dirs=[os.path.join(BASE_DIR, "ipc_monitor"), GLOG_INC_PATH, GLOG_LIB_PATH],  # Include Pybind11 headers
+        library_dirs=[GLOG_LIB_PATH],
+        libraries=["glog"],
         language="c++",  # Specify the language
     ),
 ]
 
+
 # Set up the package
 setup(
     name="dynolog_npu_plugin",
-- 
Gitee


From c0e8c1b7fb6319219bcdf6e0e8d5128721e45d93 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Fri, 28 Feb 2025 17:51:15 +0800
Subject: [PATCH 064/145] compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve

compare bench_data_name get improve
---
 .../msprobe/core/compare/acc_compare.py       | 88 +++++--------------
 .../core/compare/multiprocessing_compute.py   | 10 +--
 .../msprobe/core/compare/utils.py             | 14 +--
 .../docs/10.accuracy_compare_PyTorch.md       | 10 +--
 .../msprobe/mindspore/compare/ms_compare.py   |  8 ++
 .../test/core_ut/compare/test_acc_compare.py  | 42 +++------
 .../core_ut/compare/test_acc_compare_utils.py | 16 ++--
 .../test_cmp_multiprocessing_compute.py       |  8 +-
 .../mindspore_ut/compare/test_ms_compare.py   | 27 +++++-
 9 files changed, 100 insertions(+), 123 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
index f0ac97a0293..f2aa8c479ec 100644
--- a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
@@ -329,7 +329,9 @@ class Comparator:
                 else:
                     result_item.append(CompareConst.NONE)
                 if self.dump_mode == Const.ALL:
-                    result_item.append(npu_ops_all.get(ms_op_name).get("data_name", None))
+                    ms_data_name = npu_ops_all.get(ms_op_name).get("data_name", None)
+                    pt_data_name = bench_ops_all.get(bench_op_name).get("data_name", None)
+                    result_item.append([ms_data_name, pt_data_name])
                 result.append(result_item)
             elif ms_op_name not in npu_ops_all:
                 logger.warning(f'Can not find npu op name : `{ms_op_name}` in npu dump json file.')
@@ -349,47 +351,48 @@ class Comparator:
         result_df = self.make_result_table(result)
         return result_df
 
-    def compare_by_op(self, npu_op_name, bench_op_name, op_name_mapping_dict, input_param, bench_data):
+    def compare_by_op(self, npu_op_name, bench_op_name, op_name_mapping_dict, input_param):
         """
         :param npu_op_name: excel中的NPU_Name，例如：MintFunctional.conv2d.0.forward.input.3.0
         :param bench_op_name: excel中的Bench_Name，例如：Functional.conv2d.0.forward.input.3.0
         :param op_name_mapping_dict: op_name和npy或pt文件的映射关系
         :param input_param: npu_json_path/bench_json_path/stack_json_path等参数
-        :param bench_data: bench的dump数据中"data"字段
         :return: result_list，包含余弦相似度、最大绝对误差、最大相对误差、千分之一误差率、千分之五误差率和错误信息
-        用于读取excel中的NPU_Name和Bench_Name，根据映射关系找到npy或pt文件，然后读取文件中的数据进行比较，计算余弦相似度、
+        用于读取excel中的NPU_Name和Bench_Name，根据映射关系找到npy或pt文件，然后读取文件中的数据进行比较，计算余弦相似度、欧式距离
         最大绝对误差、最大相对误差、千分之一误差率、千分之五误差率并生成错误信息
         """
-        npu_bench_name_list = op_name_mapping_dict[npu_op_name]
-        data_name = safe_get_value(npu_bench_name_list, 1, "npu_bench_name_list")
         error_file, relative_err, error_flag = None, None, False
-        bench_data_name = get_bench_data_name(bench_op_name, bench_data)
-        if data_name == '-1' or data_name == -1:  # 没有真实数据路径
-            n_value, b_value = CompareConst.READ_NONE, CompareConst.READ_NONE
-            error_flag = True
-        elif not bench_data_name:
+
+        data_name_pair = op_name_mapping_dict.get(npu_op_name)
+        npu_data_name = data_name_pair[0]
+        bench_data_name = data_name_pair[1]
+
+        if str(npu_data_name) == '-1':  # 没有npu真实数据
+            n_value, b_value, error_flag = CompareConst.READ_NONE, CompareConst.READ_NONE, True
+        elif str(bench_data_name) == '-1':  # 没有bench真实数据
             n_value, b_value, error_flag = CompareConst.READ_NONE, CompareConst.READ_NONE, True
             error_file = 'no_bench_data'
         else:
+            npu_dir = input_param.get("npu_dump_data_dir")
+            bench_dir = input_param.get("bench_dump_data_dir")
             try:
-                read_npy_data = getattr(self, "read_npy_data")
                 frame_name = getattr(self, "frame_name")
+                read_npy_data = getattr(self, "read_npy_data")
                 if frame_name == "MSComparator":
-                    n_value = read_npy_data(input_param.get("npu_dump_data_dir"), npu_op_name + Const.NUMPY_SUFFIX)
+                    n_value = read_npy_data(npu_dir, npu_data_name)
                     if self.cross_frame:
-                        b_value = read_npy_data(input_param.get("bench_dump_data_dir"), bench_data_name,
-                                                load_pt_file=True)
+                        b_value = read_npy_data(bench_dir, bench_data_name, load_pt_file=True)
                     else:
-                        b_value = read_npy_data(input_param.get("bench_dump_data_dir"), bench_data_name)
+                        b_value = read_npy_data(bench_dir, bench_data_name)
                 else:
-                    n_value = read_npy_data(input_param.get("npu_dump_data_dir"), npu_op_name + Const.PT_SUFFIX)
-                    b_value = read_npy_data(input_param.get("bench_dump_data_dir"), bench_data_name)
+                    n_value = read_npy_data(npu_dir, npu_data_name)
+                    b_value = read_npy_data(bench_dir, bench_data_name)
             except IOError as error:
                 error_file = error.filename
                 n_value, b_value = CompareConst.READ_NONE, CompareConst.READ_NONE
                 error_flag = True
             except (FileCheckException, CompareException):
-                error_file = data_name
+                error_file = npu_data_name
                 n_value, b_value = CompareConst.READ_NONE, CompareConst.READ_NONE
                 error_flag = True
 
@@ -464,7 +467,7 @@ class Comparator:
         err_mess = []
 
         is_print_compare_log = input_param.get("is_print_compare_log")
-        bench_data = load_json(input_param.get("bench_json_path")).get('data')
+
         for i in range(len(result_df)):
             npu_op_name = result_df.iloc[i, 0]
             bench_op_name = result_df.iloc[i, 1]
@@ -472,7 +475,7 @@ class Comparator:
                 logger.info("start compare: {}".format(npu_op_name))
 
             cos_sim, euc_dist, max_abs_err, max_relative_err, one_thousand_err_ratio, five_thousand_err_ratio, err_msg \
-                = self.compare_by_op(npu_op_name, bench_op_name, dump_path_dict, input_param, bench_data)
+                = self.compare_by_op(npu_op_name, bench_op_name, dump_path_dict, input_param)
 
             if is_print_compare_log:
                 logger.info(
@@ -508,46 +511,3 @@ class Comparator:
         except ValueError as e:
             logger.error('result dataframe is not found.')
             raise CompareException(CompareException.INVALID_DATA_ERROR) from e
-
-
-def get_bench_data_name(bench_op_name, bench_data):
-    bench_name_list = re.split(r'\.(input|output|kwargs|parameters|parameters_grad)\.', bench_op_name)
-    if len(bench_name_list) > 1 and bench_name_list[1] == Const.PARAMS_GRAD:
-        bench_data_bundle = bench_data.get(bench_name_list[0] + Const.SEP + bench_name_list[1], {})
-    else:
-        bench_data_bundle = bench_data.get(bench_name_list[0], {})
-    if not bench_data_bundle or len(bench_name_list) < 3:
-        return None
-    layers = bench_name_list[2].split(Const.SEP)
-
-    def _get(key, container):
-        if isinstance(container, dict):
-            return container.get(key)
-        if isinstance(container, list):
-            try:
-                return container[int(key)]
-            except (ValueError, IndexError):
-                return None
-        return None
-
-    def get_by_layer(container, params_grad=False):
-        data = container
-        # dump.json中parameters_grad的结构为key：[{}], 如果存在key，有且只有一个列表元素，而op_name中只命名到了key，因此加'0'
-        if params_grad:
-            layers.append('0')
-        for layer in layers:
-            data = _get(layer, data)
-        return _get(CompareConst.DATA_NAME.lower(), data)
-
-    if Const.INPUT == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle.get(Const.INPUT, bench_data_bundle.get(Const.INPUT_ARGS)))
-    elif Const.KWARGS == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle.get(Const.INPUT_KWARGS))
-    elif Const.OUTPUT == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle.get(Const.OUTPUT))
-    elif Const.PARAMS == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle.get(Const.PARAMS))
-    elif Const.PARAMS_GRAD == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle, params_grad=True)
-    else:
-        return None
diff --git a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
index f79671827c1..71b0f29d64f 100644
--- a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
+++ b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
@@ -25,7 +25,7 @@ from msprobe.core.common.utils import CompareException
 from msprobe.core.common.const import CompareConst
 
 
-def _handle_multi_process(func, input_parma, result_df, lock):
+def _handle_multi_process(func, input_param, result_df, lock):
     process_num = max(int((multiprocessing.cpu_count() + 1) // 4), 1)
     op_name_mapping_dict = read_dump_data(result_df)
 
@@ -55,7 +55,7 @@ def _handle_multi_process(func, input_parma, result_df, lock):
         idx = df_chunk_size * process_idx
         chunk_size = len(df_chunk)
         result = pool.apply_async(func,
-                                  args=(idx, op_name_mapping_dict, df_chunk, lock, input_parma),
+                                  args=(idx, op_name_mapping_dict, df_chunk, lock, input_param),
                                   error_callback=err_call,
                                   callback=partial(update_progress, chunk_size, lock)
                                   )
@@ -97,12 +97,12 @@ def _ms_graph_handle_multi_process(func, result_df, mode):
 def read_dump_data(result_df):
     try:
         npu_dump_name_list = result_df.iloc[0:, 0].tolist()
-        npu_dump_tensor_list = result_df.iloc[0:, -1].tolist()
+        dump_tensor_pair_list = result_df.iloc[0:, -1].tolist()
         op_name_mapping_dict = {}
         for index, _ in enumerate(npu_dump_name_list):
             npu_dump_name = npu_dump_name_list[index]
-            npu_dump_tensor = npu_dump_tensor_list[index]
-            op_name_mapping_dict[npu_dump_name] = [npu_dump_tensor, npu_dump_tensor]
+            dump_tensor_pair = dump_tensor_pair_list[index]
+            op_name_mapping_dict[npu_dump_name] = dump_tensor_pair
         return op_name_mapping_dict
     except ValueError as e:
         logger.error('result dataframe is not found.')
diff --git a/debug/accuracy_tools/msprobe/core/compare/utils.py b/debug/accuracy_tools/msprobe/core/compare/utils.py
index 72b75ab254e..8656daf7cae 100644
--- a/debug/accuracy_tools/msprobe/core/compare/utils.py
+++ b/debug/accuracy_tools/msprobe/core/compare/utils.py
@@ -321,8 +321,8 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
         has_stack = npu_stack_info and bench_stack_info
 
         if dump_mode == Const.ALL:
-            npu_data_name = n_dict.get("data_name", None)
-            bench_data_name = b_dict.get("data_name", None)
+            npu_data_name_list = n_dict.get("data_name", None)
+            bench_data_name_list = b_dict.get("data_name", None)
 
         for index in range(min_len):
             n_name = safe_get_value(n_dict, n_start + index, "n_dict", key="op_name")
@@ -353,7 +353,9 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
             result_item.append(err_msg)
             result_item = stack_column_process(result_item, has_stack, index, key, npu_stack_info)
             if dump_mode == Const.ALL:
-                result_item.append(safe_get_value(npu_data_name, n_start + index, "npu_data_name"))
+                npu_data_name = safe_get_value(npu_data_name_list, n_start + index, "npu_data_name_list")
+                bench_data_name = safe_get_value(bench_data_name_list, n_start + index, "bench_data_name_list")
+                result_item.append([npu_data_name, bench_data_name])
 
             result.append(result_item)
 
@@ -388,7 +390,9 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
                 result_item.append(err_msg)
                 result_item = stack_column_process(result_item, has_stack, index, key, npu_stack_info)
                 if dump_mode == Const.ALL:
-                    result_item.append(safe_get_value(npu_data_name, n_start + index, "npu_data_name"))
+                    npu_data_name = safe_get_value(npu_data_name_list, n_start + index, "npu_data_name_list")
+                    bench_data_name = safe_get_value(bench_data_name_list, n_start + index, "bench_data_name_list")
+                    result_item.append([npu_data_name, bench_data_name])
 
                 result.append(result_item)
 
@@ -467,7 +471,7 @@ def get_un_match_accuracy(result, n_dict, dump_mode):
         result_item.append(err_msg)
         append_stack_info(result_item, npu_stack_info, index)
         if dump_mode == Const.ALL and result_item[1] == CompareConst.N_A:
-            result_item.extend(["-1"])
+            result_item.extend([["-1", "-1"]])
         result.append(result_item)
 
 
diff --git a/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md b/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
index a5f83d8dfcb..6f886215b0a 100644
--- a/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
+++ b/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
@@ -257,11 +257,11 @@ PyTorch 精度比对是以 CPU 或 GPU 的计算结果为标杆，通过计算
 
 统计量有 4 种：最大值（max）、最小值（min）、平均值（mean）和 L2-范数（L2 norm）。
 
-|dump 数据模式|Cosine (tensor 余弦相似度)|EucDist (tensor 欧式距离)|MaxAbsErr (tensor 最大绝对误差)|MaxRelativeErr (tensor 最大相对误差)|One Thousandth Err Ratio (tensor 相对误差小于千分之一的比例)|Five Thousandth Err Ratio (tensor 相对误差小于千分之五的比例)|NPU 和 bench 的统计量绝对误差 (max, min, mean, L2 norm) diff| NPU 和 bench 的统计量相对误差 (max, min, mean, L2 norm) RelativeErr |NPU 和 bench 的统计量 (max, min, mean, L2 norm)|NPU MD5 (NPU 数据 CRC-32 值)|BENCH MD5 (bench 数据 CRC-32 值)|Result (比对结果)|Accuracy Reached or Not (计算精度是否达标)|Err_message (错误信息提示)|NPU_Stack_Info (堆栈信息)|Data_Name (NPU 真实数据名)|
-|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
-|真实数据模式|√|√|√|√|√|√|||√||||√|√|√|√|
-|统计数据模式|||||||√|√|√|||√||√|√||
-|MD5 模式||||||||||√|√|√|||√||
+|dump 数据模式|Cosine (tensor 余弦相似度)|EucDist (tensor 欧式距离)|MaxAbsErr (tensor 最大绝对误差)|MaxRelativeErr (tensor 最大相对误差)|One Thousandth Err Ratio (tensor 相对误差小于千分之一的比例)|Five Thousandth Err Ratio (tensor 相对误差小于千分之五的比例)|NPU 和 bench 的统计量绝对误差 (max, min, mean, L2 norm) diff| NPU 和 bench 的统计量相对误差 (max, min, mean, L2 norm) RelativeErr |NPU 和 bench 的统计量 (max, min, mean, L2 norm)|NPU MD5 (NPU 数据 CRC-32 值)|BENCH MD5 (bench 数据 CRC-32 值)|Result (比对结果)|Accuracy Reached or Not (计算精度是否达标)|Err_message (错误信息提示)|NPU_Stack_Info (堆栈信息)| Data_Name ([NPU真实数据名，Bench真实数据名]) |
+|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---------------------------------:|
+|真实数据模式|√|√|√|√|√|√|||√||||√|√|√|                 √                 |
+|统计数据模式|||||||√|√|√|||√||√|√|                                   |
+|MD5 模式||||||||||√|√|√|||√|                                   |
 
 上表中NPU_Stack_Info字段需要配置-s参数生成。
 
diff --git a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
index de507e87665..1f95dbd2347 100644
--- a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
+++ b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
@@ -78,6 +78,11 @@ class MSComparator(Comparator):
             raise TypeError(f"The type of parameter `data_mapping` must be dict, str or None, but got "
                             f"{type(self.data_mapping)}")
 
+    @staticmethod
+    def process_data_name(result):
+        result['data_name_x'] = result.apply(lambda row: [row['data_name_x'], row['data_name_y']], axis=1)
+        return result
+
     def calc_accuracy(self, result_df, header):
         condition_no_bench = result_df[CompareConst.BENCH_NAME] == CompareConst.N_A
         result_df[condition_no_bench] = result_df[condition_no_bench].fillna(CompareConst.N_A)
@@ -140,6 +145,8 @@ class MSComparator(Comparator):
             header.append(CompareConst.STACK)
         if self.dump_mode == Const.ALL:
             header.append(CompareConst.DATA_NAME)
+            result = self.process_data_name(result)
+
         result.rename(columns={'op_name_x': CompareConst.NPU_NAME,
                                'op_name_y': CompareConst.BENCH_NAME,
                                'dtype_x': CompareConst.NPU_DTYPE,
@@ -170,6 +177,7 @@ class MSComparator(Comparator):
 
         result[npu_summary] = result['summary_x'].apply(set_summary).tolist()
         result[bench_summary] = result['summary_y'].apply(set_summary).tolist()
+
         result_df = pd.DataFrame(columns=header)
         for h in header:
             if h in result.columns:
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
index c882e331f55..1b2f6bb2fde 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
@@ -11,7 +11,7 @@ import torch
 
 from msprobe.core.common.const import CompareConst, Const
 from msprobe.core.common.utils import CompareException
-from msprobe.core.compare.acc_compare import Comparator, ModeConfig, get_bench_data_name
+from msprobe.core.compare.acc_compare import Comparator, ModeConfig
 from msprobe.core.compare.highlight import find_error_rows, find_compare_result_error_rows, ApiBatch
 from msprobe.core.compare.utils import get_accuracy
 from msprobe.pytorch.compare.pt_compare import PTComparator
@@ -636,11 +636,11 @@ class TestUtilsMethods(unittest.TestCase):
     def test_do_multi_process(self):
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']]
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', ['-1', '-1']]]
         o_data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                    'torch.float32', 'torch.float32', [2, 2], [2, 2],
                    'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                   1, 1, 1, 1, 1, 1, 1, 1, 'None', 'No bench data matched.', '-1']]
+                   1, 1, 1, 1, 1, 1, 1, 1, 'None', 'No bench data matched.', ['-1', '-1']]]
         columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
         result_df = pd.DataFrame(data, columns=columns)
         o_result = pd.DataFrame(o_data, columns=columns)
@@ -670,7 +670,7 @@ class TestUtilsMethods(unittest.TestCase):
         mode_config = ModeConfig(stack_mode, auto_analyze, fuzzy_match, dump_mode)
 
         pt_comparator = PTComparator(mode_config)
-        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param, {})
+        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param)
 
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
                                   'unsupported', 'No bench data matched.'])
@@ -688,43 +688,23 @@ class TestUtilsMethods(unittest.TestCase):
         pt_comparator = PTComparator(mode_config)
 
         pt_name = '-1'
-        pt_path = os.path.join(base_dir, pt_name)
-        op_name_mapping_dict = {'Functional.linear.0.forward.input.0': [pt_path, pt_path]}
+        op_name_mapping_dict = {'Functional.linear.0.forward.input.0': [pt_name, pt_name]}
         input_param = {'npu_dump_data_dir': base_dir, 'bench_dump_data_dir': base_dir}
-        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param,
-                                              {'Functional.linear.0.forward': {'input_args': [
-                                                  {'data_name': 'Functional.linear.0.forward.input.0.pt'}]}})
+        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param)
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                                  'unsupported', f'Dump file: {pt_path} not found.'])
+                                  'unsupported', 'No bench data matched.'])
 
         pt_name = 'Functional.linear.0.forward.input.0.pt'
-        pt_path = os.path.join(base_dir, pt_name)
-        op_name_mapping_dict = {'Functional.linear.0.forward.input.0': [pt_path, pt_path]}
+        op_name_mapping_dict = {'Functional.linear.0.forward.input.0': [pt_name, pt_name]}
         input_param = {'npu_dump_data_dir': base_dir, 'bench_dump_data_dir': base_dir}
-        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param, {})
+        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param)
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                                  'unsupported', 'Bench does not have data file.'])
+                                  'unsupported', 'Dump file: Functional.linear.0.forward.input.0.pt not found.'])
 
         generate_pt(base_dir)
-        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param,
-                                              {'Functional.linear.0.forward': {'input_args': [
-                                                  {'data_name': 'Functional.linear.0.forward.input.0.pt'}]}})
+        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param)
         self.assertEqual(result, [1.0, 0.0, 0.0, 0.0, 1.0, 1.0, ''])
 
-    def test_get_bench_data_name_input(self):
-        bench_op_name = "Functional.linear.0.forward.input.0"
-        bench_data = {"Functional.linear.0.forward": {"input_args": [{"data_name": "Functional.linear.0.forward.input.0.pt"}], "input_kwargs": {}, "output": []}}
-        result = get_bench_data_name(bench_op_name, bench_data)
-
-        self.assertEqual(result, "Functional.linear.0.forward.input.0.pt")
-
-    def test_get_bench_data_name_output(self):
-        bench_op_name = "Functional.linear.0.forward.output.0"
-        bench_data = {"Functional.linear.0.forward": {"input_args": [], "input_kwargs": {}, "output": [{"data_name": "Functional.linear.0.forward.output.0.pt"}]}}
-        result = get_bench_data_name(bench_op_name, bench_data)
-
-        self.assertEqual(result, "Functional.linear.0.forward.output.0.pt")
-
 
 class TestComparator(unittest.TestCase):
     def setUp(self):
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
index 2e9a4657266..bf23f4de1da 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
@@ -224,31 +224,31 @@ o_result_unmatch_3 = [
     ['Functional.conv2d.0.forward.input.0', 'N/A', 'torch.float32', 'N/A', [1, 1, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      3.029174327850342, -2.926689624786377, -0.06619918346405029, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'No bench data matched.', 'None', '-1'],
+     'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.input.1', 'N/A', 'torch.float32', 'N/A', [16, 1, 5, 5], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      0.19919930398464203, -0.19974489510059357, 0.006269412115216255, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'No bench data matched.', 'None', '-1'],
+     'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.input.2', 'N/A', 'torch.float32', 'N/A', [16], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      0.19734230637550354, -0.18177609145641327, 0.007903944700956345, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'No bench data matched.', 'None', '-1'],
+     'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.parameters.weight', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.parameters.bias', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.output.0', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      2.1166646480560303, -2.190781354904175, -0.003579073818400502, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'No bench data matched.', 'None', '-1'],
+     'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.parameters_grad.weight', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.parameters_grad.bias', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1']
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', ['-1', '-1']]
 ]
 
 # test_merge_tensor
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
index 3fa16b0d9d4..49f084ce07c 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
@@ -18,12 +18,12 @@ data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.inp
          'torch.float32', 'torch.float32', [2, 2], [2, 2],
          '', '', '', '', '', '',
          1, 1, 1, 1, 1, 1, 1, 1,
-         'Yes', '', '-1']]
+         'Yes', '', ['-1', '-1']]]
 o_data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
            'torch.float32', 'torch.float32', [2, 2], [2, 2],
            'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
            1, 1, 1, 1, 1, 1, 1, 1,
-           'None', 'No bench data matched.', '-1']]
+           'None', 'No bench data matched.', ['-1', '-1']]]
 columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
 result_df = pd.DataFrame(data, columns=columns)
 o_result = pd.DataFrame(o_data, columns=columns)
@@ -54,9 +54,9 @@ class TestUtilsMethods(unittest.TestCase):
 
         func = Comparator(mode_config).compare_ops
         generate_dump_json(base_dir)
-        input_parma = {'bench_json_path': os.path.join(base_dir, 'dump.json')}
+        input_param = {'bench_json_path': os.path.join(base_dir, 'dump.json')}
         lock = multiprocessing.Manager().RLock()
-        result = _handle_multi_process(func, input_parma, result_df, lock)
+        result = _handle_multi_process(func, input_param, result_df, lock)
         self.assertTrue(result.equals(o_result))
 
     def test_read_dump_data(self):
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
index b5cbff9784a..2c0b2efea78 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
@@ -7,6 +7,7 @@ import tempfile
 import unittest
 
 import numpy as np
+import pandas as pd
 import torch
 import yaml
 
@@ -533,4 +534,28 @@ class TestUtilsMethods(unittest.TestCase):
 
         api_list = ["Mint"]
         with self.assertRaises(CompareException):
-            ms_comparator.get_api_name(api_list)
\ No newline at end of file
+            ms_comparator.get_api_name(api_list)
+
+    def test_process_data_name(self):
+        stack_mode = True
+        auto_analyze = True
+        fuzzy_match = False
+        dump_mode = Const.ALL
+
+        mode_config = ModeConfig(stack_mode, auto_analyze, fuzzy_match, dump_mode)
+        mapping_config = MappingConfig()
+        ms_comparator = MSComparator(mode_config, mapping_config)
+
+        data = pd.DataFrame({
+            'data_name_x': ['A', 'B', 'C'],
+            'data_name_y': ['X', 'Y', 'Z']
+        })
+
+        result = ms_comparator.process_data_name(data.copy())
+
+        expected = pd.DataFrame({
+            'data_name_x': [['A', 'X'], ['B', 'Y'], ['C', 'Z']],
+            'data_name_y': ['X', 'Y', 'Z']
+        })
+
+        pd.testing.assert_frame_equal(result, expected)
-- 
Gitee


From 25761e0df5d4a81269048666074cd6cfbb846ac3 Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Tue, 4 Mar 2025 11:10:27 +0800
Subject: [PATCH 065/145] fix to bug

---
 .../msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py       | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
index 905687c1bfc..c7a48844ee8 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
@@ -65,6 +65,7 @@ DETAILS_FILE_NAME = "accuracy_checking_details_" + current_time + ".csv"
 
 not_backward_list = ['repeat_interleave']
 unsupported_backward_list = ['masked_select']
+unsupported_api_list = ["to"]
 
 
 tqdm_params = {
@@ -218,6 +219,7 @@ def blacklist_and_whitelist_filter(api_name, black_list, white_list):
     If api is both in black_list and black_list, black_list first.
     return: False for exec api, True for not exec
     """
+    black_list.extend(unsupported_api_list)
     if black_list and api_name in black_list:
         return True
     if white_list and api_name not in white_list:
-- 
Gitee


From e190788325c7165d8a72dc62c3d90d2f3ca96839 Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Mon, 3 Mar 2025 18:47:34 +0800
Subject: [PATCH 066/145] bug_fix_for_matrix

---
 .../analysis/comm_matrix_analysis.py          | 69 ++++++++++++++-----
 1 file changed, 51 insertions(+), 18 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
index 2ad5797cc92..3839fe66aac 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
@@ -22,6 +22,8 @@ from msprof_analyze.prof_common.db_manager import DBManager
 from msprof_analyze.cluster_analyse.common_func.utils import increase_shared_value
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.cluster_analyse.common_func.utils import double_hash
+from msprof_analyze.prof_common.file_manager import FileManager
 
 logger = get_logger()
 
@@ -70,30 +72,46 @@ class CommMatrixAnalysis(BaseAnalysis):
         self.combine_link_info(step_dict)
 
     def merge_same_links(self, step_dict: dict):
-        def process_link_key(rank_id, rank_dict):
+        def update_rank_map(step_dict):
+            for op_name, op_dict in step_dict.items():
+                group_name = op_name.split("@")[-1]
+                for rank_id, rank_dict in op_dict.items():
+                    for link_key in rank_dict:
+                        if '-' not in link_key:
+                            logger.warning("%s has an invalid link key %s!", str(op_name), str(link_key))
+                            break
+                        src_rank = link_key.split('-')[0]
+                        dst_rank = link_key.split('-')[1]
+                        if src_rank == dst_rank:
+                            if src_rank not in project_local_global_rank_map.get(group_name, {}):
+                                project_local_global_rank_map.setdefault(group_name, {})[src_rank] = rank_id
+                            elif project_local_global_rank_map.get(group_name, {}).get(src_rank) != rank_id:
+                                logger.warning(f"In the same communication group {group_name}, global rank {rank_id} "
+                                               f"and {project_local_global_rank_map.get(group_name, {}).get(src_rank)} "
+                                               f"get the same local rank {src_rank}!")
+
+        def process_link_key(rank_dict):
             for link_key in rank_dict:
                 if '-' not in link_key:
                     logger.warning("%s has an invalid link key %s!", str(op_name), str(link_key))
                     break
-                src_rank = link_key.split('-')[0]
-                dst_rank = link_key.split('-')[1]
-                if src_rank == dst_rank:
-                    if src_rank not in project_local_global_rank_map:
-                        project_local_global_rank_map[src_rank] = rank_id
-                    elif project_local_global_rank_map.get(src_rank) != rank_id:
-                        logger.warning("In the same communication group, local ranks projecting to global ranks "
-                                       "repeat!")
                 self.combine_link(link_info[link_key], rank_dict[link_key])
 
-        def convert_local_to_global_rank():
+        def convert_local_to_global_rank(rank_map):
             tmp_link = {}
             for link_key, link_dict in link_info.items():
                 src_rank = link_key.split('-')[0]
                 dst_rank = link_key.split('-')[1]
-                src_rank = project_local_global_rank_map[src_rank] \
-                    if src_rank in project_local_global_rank_map else src_rank
-                dst_rank = project_local_global_rank_map[dst_rank] \
-                    if dst_rank in project_local_global_rank_map else dst_rank
+                if src_rank not in rank_map:
+                    logger.warning(f"The src local rank {src_rank} of the operator {op_name} "
+                                   f"cannot be mapped to the global rank.")
+                    continue
+                if dst_rank not in rank_map:
+                    logger.warning(f"The dst local rank {dst_rank} of the operator {op_name} "
+                                   f"cannot be mapped to the global rank.")
+                    continue
+                src_rank = rank_map[src_rank]
+                dst_rank = rank_map[dst_rank]
                 link_dict[Constant.BANDWIDTH_GB_S] = \
                     self.compute_ratio(link_dict.get(Constant.TRANSIT_SIZE_MB, 0),
                                        link_dict.get(Constant.TRANSIT_TIME_MS, 0))
@@ -106,12 +124,14 @@ class CommMatrixAnalysis(BaseAnalysis):
             Constant.TRANSIT_SIZE_MB: 0,
             Constant.OP_NAME: ''
         }
+        project_local_global_rank_map = self.get_parallel_group_info()
+        update_rank_map(step_dict)
         for op_name, op_dict in step_dict.items():
             link_info = defaultdict(lambda: copy.deepcopy(default_value))
-            project_local_global_rank_map = dict()
-            for rank_id, rank_dict in op_dict.items():
-                process_link_key(rank_id, rank_dict)
-            step_dict[op_name] = convert_local_to_global_rank()
+            group_name = op_name.split("@")[-1]
+            for rank_dict in op_dict.values():
+                process_link_key(rank_dict)
+            step_dict[op_name] = convert_local_to_global_rank(project_local_global_rank_map.get(group_name, {}))
 
     def combine_link_info(self, step_dict: dict):
         default_value = {
@@ -131,6 +151,19 @@ class CommMatrixAnalysis(BaseAnalysis):
                                    link_dict.get(Constant.TRANSIT_TIME_MS, 0))
         step_dict[Constant.TOTAL_OP_INFO] = total_op_info
 
+    def get_parallel_group_info(self):
+        parallel_group_info = {}
+        for profiler_path in self.data_map.values():
+            meta_json = os.path.join(profiler_path, "profiler_metadata.json")
+            if os.path.exists(meta_json):
+                meta_data = FileManager.read_json_file(meta_json)
+                for group_name, group_info in meta_data.get("parallel_group_info", {}).items():
+                    global_ranks = group_info.get("global_ranks")
+                    if isinstance(global_ranks, list) and global_ranks:
+                        global_ranks.sort()
+                        parallel_group_info[double_hash(group_name)] = dict(enumerate(global_ranks))
+        return parallel_group_info
+
 
 class CommMatrixAnalysisOptimized(CommMatrixAnalysis):
     SAVED_JSON = "cluster_communication_matrix.json"
-- 
Gitee


From 037f073f60a0213ad33277e4e280bf240898e596 Mon Sep 17 00:00:00 2001
From: Mrtutu <zhangwei983@huawei.com>
Date: Tue, 4 Mar 2025 14:58:11 +0800
Subject: [PATCH 067/145] add plugin docs

---
 dynolog_npu/README.md | 10 +++++++++-
 1 file changed, 9 insertions(+), 1 deletion(-)

diff --git a/dynolog_npu/README.md b/dynolog_npu/README.md
index d6ebd6f7ff0..86a23b7f829 100644
--- a/dynolog_npu/README.md
+++ b/dynolog_npu/README.md
@@ -51,6 +51,8 @@ sudo yum install -y cmake ninja
 
 ### 3. 编译
 
+- dynolog编译
+
 默认编译生成dyno和dynolog二进制文件, -t参数可以支持将二进制文件打包成deb包或rpm包.
 
 ```bash
@@ -64,6 +66,10 @@ bash scripts/build.sh -t deb
 bash scripts/build.sh -t rpm
 ```
 
+- dynolog_npu_plugin wheel包编译
+
+dynolog_npu_plugin wheel包提供IPCMonitor，MsptiMonitor等公共能力，使用nputrace和npu-monitor功能前必须安装该wheel包，具体编译安装指导可参考dynolog_npu\plugin\README.md。
+
 ## 使用方式
 
 ### Profiler trace dump功能
@@ -112,7 +118,9 @@ nputrace子命令支持的参数选项
 
 - nputrace使用方法
 
-Step1： 拉起dynolog daemon进程
+Step0: 参考`3.编译`章节完成dynolog的编译，以及dynolog_npu_plugin wheel包的编译和安装。
+
+Step1：拉起dynolog daemon进程
 ```bash
 # 方法1：使用systemd拉起service
 # 修改配置文件/etc/dynolog.gflags, 使能ipc_monitor
-- 
Gitee


From ed13394f641f433681ea9a291cb8781e3d031655 Mon Sep 17 00:00:00 2001
From: fanglanyue <fanglanyue@huawei.com>
Date: Wed, 19 Feb 2025 18:11:24 +0800
Subject: [PATCH 068/145] dynolog plugin readme

---
 dynolog_npu/plugin/README.md | 42 ++++++++++++++++++++++++++++++++++++
 dynolog_npu/plugin/Readme.md | 17 ---------------
 2 files changed, 42 insertions(+), 17 deletions(-)
 create mode 100644 dynolog_npu/plugin/README.md
 delete mode 100644 dynolog_npu/plugin/Readme.md

diff --git a/dynolog_npu/plugin/README.md b/dynolog_npu/plugin/README.md
new file mode 100644
index 00000000000..0cd51633bb1
--- /dev/null
+++ b/dynolog_npu/plugin/README.md
@@ -0,0 +1,42 @@
+
+
+# Plugins for Dynolog NPU
+## 模块说明
+### IPCMonitor
+提供IPC(Inter-Process Communication)通信接口，用于实现
+1. IPC控制通道: profiler backend向dynolog daemon获取profiler配置
+
+
+__PyDynamicMonitorProxy__:  
+* `init_dyno` 向dynolog daemon发送注册请求
+  * input: npuId(int)
+  * return： None
+* `poll_dyno` 向dynolog daemon获取Profiler控制参数
+  * input: None
+  * return: str, 返回控制参数
+
+## 安装方式
+### 1. 通过shell脚本一键安装
+```
+chmod +x build.sh
+./build.sh
+```
+### 2. 手动安装
+* 安装依赖
+```
+pip install wheel
+pip install pybind11
+```
+* 编译whl包
+```
+python3 setup.py bdist_wheel
+```
+以上命令执行完成后在plugn/dist目录下生成dynolog_npu插件whl安装包dynolog-npu-plugin-{version}.whl
+* 安装
+```
+pip install dist/{dynolog-npu-plugin-{version}.wheel}
+```
+* 卸载
+```
+pip uninstall dynolog-npu-plugin
+```
\ No newline at end of file
diff --git a/dynolog_npu/plugin/Readme.md b/dynolog_npu/plugin/Readme.md
deleted file mode 100644
index c59bfffad5a..00000000000
--- a/dynolog_npu/plugin/Readme.md
+++ /dev/null
@@ -1,17 +0,0 @@
-
-
-# Build and Install npu-dynolog-plugin
-```
-# install pybind11
-pip install pybind11
-
-# build dynolog_npu_plugin wheel
-python3 setup.py bdist_wheel
-# install
-pip install dist/{dynolog-npu-plugin-xxx.wheel}
-
-# example
-import IPCMonitor
-dyno_worker = IPCMonitor.PyDynamicMonitorProxy()
-dyno_worker.init_dyno(0)
-```
-- 
Gitee


From 3eb34ae8e919ffbe06cb956e7c229cf77117cd0d Mon Sep 17 00:00:00 2001
From: l30044004 <louyujing@huawei.com>
Date: Tue, 4 Mar 2025 16:46:21 +0800
Subject: [PATCH 069/145] =?UTF-8?q?=E4=BF=AE=E5=A4=8Dp2pop=E5=9C=A8tensor?=
 =?UTF-8?q?=E6=A8=A1=E5=BC=8F=E4=B8=8B=E8=A7=A3=E6=9E=90=E9=94=99=E8=AF=AF?=
 =?UTF-8?q?=E9=97=AE=E9=A2=98?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../core/data_dump/data_processor/pytorch_processor.py      | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
index f29c6f6b993..4c56419dcb1 100644
--- a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
+++ b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
@@ -230,7 +230,7 @@ class PytorchDataProcessor(BaseDataProcessor):
         if isinstance(element, dist.ProcessGroup):
             return self._analyze_process_group(element)
         if isinstance(element, dist.P2POp):
-            return self._analyze_p2pop(element)
+            return self._analyze_p2pop(element, Const.SEP.join([str(suffix) for suffix in suffix_stack]))
         if isinstance(element, dist.ReduceOp):
             return self._analyze_reduce_op(element)
         converted_numpy, numpy_type = self._convert_numpy_to_builtin(element)
@@ -249,10 +249,10 @@ class PytorchDataProcessor(BaseDataProcessor):
             module_input_output.update_output_with_args_and_kwargs()
         return super().analyze_forward_output(name, module, module_input_output)
 
-    def _analyze_p2pop(self, arg):
+    def _analyze_p2pop(self, arg, suffix):
         p2pop_info = {"class_type": "torch.distributed.P2POp"}
         try:
-            tensor_info = self._analyze_tensor(arg.tensor, [])
+            tensor_info = self._analyze_tensor(arg.tensor, suffix)
             p2pop_info.update({"tensor": tensor_info})
             p2pop_info.update({"op": arg.op.__name__})
             p2pop_info.update({"peer": arg.peer})
-- 
Gitee


From e935846aa24a4edbb81b1e466d80ae551a539bd4 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Tue, 4 Mar 2025 19:48:05 +0800
Subject: [PATCH 070/145] compare dtype match check bugfix

compare dtype match check bugfix
---
 .../msprobe/core/common/const.py               | 11 ++++-------
 .../msprobe/core/compare/check.py              |  8 ++------
 .../msprobe/mindspore/compare/ms_compare.py    | 18 +++++++++---------
 3 files changed, 15 insertions(+), 22 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/common/const.py b/debug/accuracy_tools/msprobe/core/common/const.py
index 27dc231c75c..ce72b22d63b 100644
--- a/debug/accuracy_tools/msprobe/core/common/const.py
+++ b/debug/accuracy_tools/msprobe/core/common/const.py
@@ -364,13 +364,10 @@ class CompareConst:
                              MAX_RELATIVE_ERR, MIN_RELATIVE_ERR, MEAN_RELATIVE_ERR, NORM_RELATIVE_ERR]
 
     # dtype match
-    MS_TYPE = [
-        [Const.FLOAT16, Const.FLOAT32], [Const.FLOAT32, Const.FLOAT16],
-        [Const.FLOAT16, Const.BFLOAT16], [Const.BFLOAT16, Const.FLOAT16]
-    ]
-    TORCH_TYPE = [
-        [Const.TORCH_FLOAT16, Const.TORCH_FLOAT32], [Const.TORCH_FLOAT32, Const.TORCH_FLOAT16],
-        [Const.TORCH_FLOAT16, Const.TORCH_BFLOAT16], [Const.TORCH_BFLOAT16, Const.TORCH_FLOAT16]
+
+    DTYPE_MATCH_GROUPS = [
+        {Const.FLOAT16, Const.FLOAT32, Const.BFLOAT16},
+        {Const.TORCH_FLOAT16, Const.TORCH_FLOAT32, Const.TORCH_BFLOAT16}
     ]
 
     # read_op
diff --git a/debug/accuracy_tools/msprobe/core/compare/check.py b/debug/accuracy_tools/msprobe/core/compare/check.py
index 653823e20b2..9429d7ffa1a 100644
--- a/debug/accuracy_tools/msprobe/core/compare/check.py
+++ b/debug/accuracy_tools/msprobe/core/compare/check.py
@@ -82,12 +82,8 @@ def check_type_shape_match(npu_struct, bench_struct):
                          f'should both be 2, please check!')
             raise CompareException(CompareException.INDEX_OUT_OF_BOUNDS_ERROR) from error
         shape_match = npu_shape == bench_shape
-        type_match = npu_type == bench_type
-        if not type_match:
-            if ([npu_type, bench_type] in CompareConst.MS_TYPE) or ([npu_type, bench_type] in CompareConst.TORCH_TYPE):
-                type_match = True
-            else:
-                type_match = False
+        type_match = ((npu_type == bench_type) or
+                      any(npu_type in group and bench_type in group for group in CompareConst.DTYPE_MATCH_GROUPS))
         struct_match = shape_match and type_match
         if not struct_match:
             return False
diff --git a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
index 9f1523c03aa..afd88db7b5b 100644
--- a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
+++ b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
@@ -270,15 +270,15 @@ class MSComparator(Comparator):
             bench_dtype = match_result['dtype_y']
             if self.cross_frame:
                 npu_dtype = npu_dtype.map(dtype_mapping).fillna(npu_dtype)
-            return ((npu_dtype == bench_dtype) |
-                    ((npu_dtype == Const.FLOAT16) & (bench_dtype == Const.FLOAT32)) |
-                    ((npu_dtype == Const.FLOAT32) & (bench_dtype == Const.FLOAT16)) |
-                    ((npu_dtype == Const.FLOAT16) & (bench_dtype == Const.BFLOAT16)) |
-                    ((npu_dtype == Const.BFLOAT16) & (bench_dtype == Const.FLOAT16)) |
-                    ((npu_dtype == Const.TORCH_FLOAT16) & (bench_dtype == Const.TORCH_FLOAT32)) |
-                    ((npu_dtype == Const.TORCH_FLOAT32) & (bench_dtype == Const.TORCH_FLOAT16)) |
-                    ((npu_dtype == Const.TORCH_FLOAT16) & (bench_dtype == Const.TORCH_BFLOAT16)) |
-                    ((npu_dtype == Const.TORCH_BFLOAT16) & (bench_dtype == Const.TORCH_FLOAT16)))
+
+            equal_condition = npu_dtype == bench_dtype
+            match_condition = (
+                    (npu_dtype.isin(CompareConst.DTYPE_MATCH_GROUPS[0]) & bench_dtype.isin(
+                        CompareConst.DTYPE_MATCH_GROUPS[0])) |
+                    (npu_dtype.isin(CompareConst.DTYPE_MATCH_GROUPS[1]) & bench_dtype.isin(
+                        CompareConst.DTYPE_MATCH_GROUPS[1]))
+            )
+            return equal_condition | match_condition
 
         match_result.loc[~gen_dtype_condition(), [i + '_y' for i in bench_df.columns]] = CompareConst.N_A
         return self.make_result_df(match_result)
-- 
Gitee


From 05cd197fc9823edd63ce4c1375a0e11229926d26 Mon Sep 17 00:00:00 2001
From: qianzhengxin <paulqian29@163.com>
Date: Tue, 4 Mar 2025 21:23:42 +0800
Subject: [PATCH 071/145] fix

---
 .../mindspore/debugger/precision_debugger.py    | 17 ++++++++++++-----
 1 file changed, 12 insertions(+), 5 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
index 7694d71dd98..affe289ec70 100644
--- a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
+++ b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
@@ -84,7 +84,7 @@ class PrecisionDebugger:
         common_config.dump_path = dump_path if dump_path else common_config.dump_path
         self.config = DebuggerConfig(common_config, task_config)
 
-        if _msprobe_c:
+        if self._need_msprobe_c() and _msprobe_c:
             _msprobe_c._PrecisionDebugger(framework="MindSpore", config_path=config_path)
 
         self.config.execution_mode = self._get_execution_mode()
@@ -151,7 +151,7 @@ class PrecisionDebugger:
         instance = cls._instance
         if not instance:
             raise Exception(MsgConst.NOT_CREATED_INSTANCE)
-        if _msprobe_c:
+        if cls._need_msprobe_c() and _msprobe_c:
             _msprobe_c._PrecisionDebugger().start()
         if instance.task in PrecisionDebugger.task_not_need_service:
             return
@@ -180,7 +180,7 @@ class PrecisionDebugger:
         instance = cls._instance
         if not instance:
             raise Exception(MsgConst.NOT_CREATED_INSTANCE)
-        if _msprobe_c:
+        if cls._need_msprobe_c() and _msprobe_c:
             _msprobe_c._PrecisionDebugger().stop()
         if instance.task == Const.GRAD_PROBE:
             instance.gm.stop()
@@ -195,7 +195,7 @@ class PrecisionDebugger:
         instance = cls._instance
         if not instance:
             raise Exception(MsgConst.NOT_CREATED_INSTANCE)
-        if _msprobe_c:
+        if cls._need_msprobe_c() and _msprobe_c:
             _msprobe_c._PrecisionDebugger().step()
         if instance.task in PrecisionDebugger.task_not_need_service:
             return
@@ -241,4 +241,11 @@ class PrecisionDebugger:
         if instance.config.execution_mode != MsConst.PYNATIVE_MODE:
             return False
         else:
-            return instance.config.task != Const.FREE_BENCHMARK and not instance._is_graph_dump(instance.config)
\ No newline at end of file
+            return instance.config.task != Const.FREE_BENCHMARK and not instance._is_graph_dump(instance.config)
+
+    @classmethod
+    def _need_msprobe_c(cls):
+        instance = cls._instance
+        if not instance:
+            raise Exception(MsgConst.NOT_CREATED_INSTANCE)
+        return cls.config.level_ori == Const.LEVEL_L2
\ No newline at end of file
-- 
Gitee


From 455e66d8277c1f504831370b24e94947c3701699 Mon Sep 17 00:00:00 2001
From: fanglanyue <fanglanyue@huawei.com>
Date: Thu, 27 Feb 2025 17:14:11 +0800
Subject: [PATCH 072/145] compare with pg_name

---
 .../compare_bean/overall_metrics_bean.py      | 50 ++++++++++++++++---
 .../compare_bean/profiling_info.py            | 11 +++-
 .../profiling_parser/base_profiling_parser.py | 16 ++++++
 .../msprof_analyze/prof_common/constant.py    |  6 ++-
 4 files changed, 73 insertions(+), 10 deletions(-)

diff --git a/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/overall_metrics_bean.py b/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/overall_metrics_bean.py
index 059416ec15e..4c040612033 100644
--- a/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/overall_metrics_bean.py
+++ b/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/overall_metrics_bean.py
@@ -68,11 +68,39 @@ class OverallMetricsBean:
 
         base_group_data = self._base_data.get("group", {})
         comparison_group_data = self._comparison_data.get("group", {})
+        base_pg_name_dict = self._base_data.get("pg_name_dict", {})
+        comparison_pg_name_dict = self._comparison_data.get("pg_name_dict", {})
         default_value = [0, 0, "/"]
+        # deal base and comparsion data which can match with pg_name
+        for base_pg_name, base_group_name_list in base_pg_name_dict.items():
+            if len(base_group_name_list) != 1 or base_pg_name == Constant.UNKNOWN:
+                continue
+            comparison_group_name_list = comparison_pg_name_dict.get(base_pg_name, [])
+            if len(comparison_group_name_list) != 1:
+                continue
+
+            base_data = base_group_data.pop(base_group_name_list[0], {})
+            comparison_data = comparison_group_data.pop(comparison_group_name_list[0], {})
+            description = f"\t{base_pg_name}: Communication"
+            ExcelConfig.ROW_STYLE_MAP[description] = CellFormatType.LIGHT_BLUE_NORMAL
+            self._append_data(rows_data,
+                              self._get_row_data(description,
+                                                base_data.get(ExcelConfig.COMMUNICATION_TIME, default_value),
+                                                comparison_data.get(ExcelConfig.COMMUNICATION_TIME, default_value)))
+            self._append_data(rows_data,
+                              self._get_row_data(ExcelConfig.WAIT, base_data.get(ExcelConfig.WAIT, default_value),
+                                                 comparison_data.get(ExcelConfig.WAIT, default_value)))
+            self._append_data(rows_data,
+                              self._get_row_data(ExcelConfig.TRANSMIT,
+                                                 base_data.get(ExcelConfig.TRANSMIT, default_value),
+                                                 comparison_data.get(ExcelConfig.TRANSMIT, default_value)))
+
         for group_name, base_data in base_group_data.items():
             comparison_data = comparison_group_data.pop(group_name, {})
-            self._append_data(rows_data, self._get_row_data(group_name, base_data.get("group", default_value),
-                                                            comparison_data.get("group", default_value)))
+            self._append_data(rows_data,
+                              self._get_row_data(base_data.get("description", group_name),
+                                                 base_data.get(ExcelConfig.COMMUNICATION_TIME, default_value),
+                                                 comparison_data.get(ExcelConfig.COMMUNICATION_TIME, default_value)))
             self._append_data(rows_data,
                               self._get_row_data(ExcelConfig.WAIT, base_data.get(ExcelConfig.WAIT, default_value),
                                                  comparison_data.get(ExcelConfig.WAIT, default_value)))
@@ -81,8 +109,10 @@ class OverallMetricsBean:
                                                  base_data.get(ExcelConfig.TRANSMIT, default_value),
                                                  comparison_data.get(ExcelConfig.TRANSMIT, default_value)))
         for group_name, comparison_data in comparison_group_data.items():
-            self._append_data(rows_data, self._get_row_data(group_name, default_value,
-                                                            comparison_data.get("group", default_value)))
+            self._append_data(rows_data,
+                              self._get_row_data(comparison_data.get("description", group_name),
+                                                 default_value,
+                                                 comparison_data.get(ExcelConfig.COMMUNICATION_TIME, default_value)))
             self._append_data(rows_data, self._get_row_data(ExcelConfig.WAIT, default_value,
                                                             comparison_data.get(ExcelConfig.WAIT, default_value)))
             self._append_data(rows_data, self._get_row_data(ExcelConfig.TRANSMIT, default_value,
@@ -373,13 +403,17 @@ class OverallMetricsInfo:
         }
         if self._comm_group_list:
             for group_name in self._comm_group_list:
-                group_name_index = f"\t{group_name}"
-                ExcelConfig.ROW_STYLE_MAP[group_name_index] = CellFormatType.LIGHT_BLUE_NORMAL
-                overall_metrics_data.setdefault("group", {})[group_name_index] = {
-                    "group": self.communication_data_by_group(group_name),
+                pg_name = self._profiling_info.get_pg_name_by_group(group_name)
+                description = " ".join([pg_name + ":" if pg_name != Constant.UNKNOWN else "", group_name]).strip()
+                ExcelConfig.ROW_STYLE_MAP[f"\t{description}"] = CellFormatType.LIGHT_BLUE_NORMAL
+                overall_metrics_data.setdefault("group", {})[group_name] = {
+                    "description": f"\t{description}",
+                    ExcelConfig.COMMUNICATION_TIME: self.communication_data_by_group(group_name),
                     ExcelConfig.WAIT: self.wait_data_by_group(group_name),
                     ExcelConfig.TRANSMIT: self.transmit_data_by_group(group_name)
                 }
+                overall_metrics_data.setdefault("pg_name_dict", {}).setdefault(pg_name, []).append(group_name)
+
         for kernel_name in self._profiling_info.mc2_time_dict.keys():
             mc2_name_index = f"\t{kernel_name}"
             ExcelConfig.ROW_STYLE_MAP[mc2_name_index] = CellFormatType.LIGHT_BLUE_NORMAL
diff --git a/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/profiling_info.py b/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/profiling_info.py
index bcbce59c016..36f8a0c7186 100644
--- a/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/profiling_info.py
+++ b/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/profiling_info.py
@@ -27,7 +27,7 @@ class ProfilingInfo:
                  'page_attention_time', 'page_attention_num', 'vector_time_trans', 'vector_num_trans',
                  'vector_time_notrans', 'vector_num_notrans', 'sdma_time_tensor_move', 'sdma_num_tensor_move',
                  'sdma_time_stream', 'sdma_num_stream', 'other_cube_time', 'other_cube_num', 'rdma_bandwidth',
-                 'sdma_bandwidth', 'communication_group_time', 'mc2_time_dict']
+                 'sdma_bandwidth', 'communication_group_time', 'mc2_time_dict', 'pg_name_dict']
     TABLE_NAME = Constant.PERFORMANCE_TABLE
     HEADERS = []
     OVERHEAD = []
@@ -93,6 +93,9 @@ class ProfilingInfo:
 
         # 按group展示通信的卡间等待和传输耗时
         self.communication_group_time = {}
+        # communication_group与pg_name的对应关系
+        self.pg_name_dict = {}
+
 
     @property
     def e2e_time_ms(self):
@@ -334,6 +337,9 @@ class ProfilingInfo:
         for time in time_dict.values():
             self.wait_time += time.get(Constant.WAIT_TIME, 0)
 
+    def update_communication_group_pg_name(self, pg_name_dict: dict):
+        self.pg_name_dict = pg_name_dict
+
     def set_memory_used(self, memory: float):
         self.memory_used = memory
 
@@ -401,3 +407,6 @@ class ProfilingInfo:
 
     def get_mc2_number_by_name(self, kernel_name: str):
         return self.mc2_time_dict.get(kernel_name, {}).get(Constant.MC2_NUMBER, 0)
+
+    def get_pg_name_by_group(self, group: str):
+        return self.pg_name_dict.get(group, Constant.UNKNOWN)
\ No newline at end of file
diff --git a/profiler/msprof_analyze/compare_tools/compare_backend/profiling_parser/base_profiling_parser.py b/profiler/msprof_analyze/compare_tools/compare_backend/profiling_parser/base_profiling_parser.py
index b3d9a29944f..844528f3029 100644
--- a/profiler/msprof_analyze/compare_tools/compare_backend/profiling_parser/base_profiling_parser.py
+++ b/profiler/msprof_analyze/compare_tools/compare_backend/profiling_parser/base_profiling_parser.py
@@ -12,6 +12,7 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+import os
 from abc import abstractmethod, ABC
 from decimal import Decimal
 
@@ -156,6 +157,7 @@ class BaseProfilingParser(ABC):
             self._dispatch_events()
             self._update_kernel_dict()
             self._update_communication_dict()
+            self._update_pg_name_map()
         if self._enable_memory_compare:
             self._update_memory_list()
         if self._enable_profiling_compare:
@@ -369,3 +371,17 @@ class BaseProfilingParser(ABC):
         with open(self._json_path, 'r') as file:
             for event in ijson.items(file, item):
                 yield TraceEventBean(event)
+
+    def _update_pg_name_map(self):
+        meta_file = os.path.join(self._profiling_path, Constant.PROFILER_METADATA)
+        if not os.path.exists(meta_file):
+            return
+        meta_data = FileManager.read_json_file(meta_file)
+        if Constant.PARALLEL_GROUP_INFO not in meta_data:
+            return
+        pg_name_map = {}
+        for group_id, group_info in meta_data[Constant.PARALLEL_GROUP_INFO].items():
+            if group_id not in pg_name_map:
+                format_group_id = " ".join(["Group", group_id, "Communication"])
+                pg_name_map[format_group_id] = group_info.get('group_name', "")
+        self._result_data.overall_metrics.update_communication_group_pg_name(pg_name_map)
diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index c04e429321d..8a8df08dd4d 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -136,6 +136,7 @@ class Constant(object):
 
     # metadata key
     DISTRIBUTED_ARGS = "distributed_args"
+    PARALLEL_GROUP_INFO = "parallel_group_info"
 
     # mode
     ALL = "all"
@@ -433,4 +434,7 @@ class Constant(object):
 
     # hccl_sum
     UINT32_BITS = 32
-    UINT32_MASK = 0xffffffff
\ No newline at end of file
+    UINT32_MASK = 0xffffffff
+
+    UNKNOWN = "unknown"
+
-- 
Gitee


From 30b34e5e4e17fc6615b895d06aaa7c3974cc8b46 Mon Sep 17 00:00:00 2001
From: z30043230 <zhaiyibo@huawei.com>
Date: Tue, 4 Mar 2025 14:34:41 +0800
Subject: [PATCH 073/145] clean code:Inconsistent number of return values from
 different branches.

---
 .../ai_core_performance_checker.py               |  4 ++--
 .../recipes/freq_analysis/freq_analysis.py       | 16 +++++-----------
 2 files changed, 7 insertions(+), 13 deletions(-)

diff --git a/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py b/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
index fa62cd6f895..983cd296252 100644
--- a/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
+++ b/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
@@ -306,7 +306,7 @@ class AICorePerformanceChecker:
         aic_fixpipe_ratio = self.safe_divide(aic_fixpipe_ratio, length)
         aic_mte2_ratio = self.safe_divide(aic_mte2_ratio, length)
         if aic_mte2_ratio is None or aic_fixpipe_ratio is None:
-            return None, None, None
+            return None, None, None, None
         aic_fixpipe_ratio_rule, aic_mte2_ratio_rule = None, None
         for rule in self._operator_rules["fa_operators"]:
             if rule["target"] == "aic_fixpipe_ratio":
@@ -341,7 +341,7 @@ class AICorePerformanceChecker:
         aiv_vec_ratio = self.safe_divide(aiv_vec_ratio, length)
         aic_mte2_ratio = self.safe_divide(aic_mte2_ratio, length)
         if aiv_vec_ratio is None or aic_mte2_ratio is None:
-            return None, None, None
+            return None, None, None, None
         aiv_vec_ratio_rule, aic_mte2_ratio_rule = None, None
         for rule in self._operator_rules["fa_operators"]:
             if rule["target"] == "aiv_vec_ratio":
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
index 0bc7afa393a..2c65fda98e0 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
@@ -38,17 +38,15 @@ class FreqAnalysis(BaseRecipeAnalysis):
     @property
     def base_dir(self):
         return os.path.basename(os.path.dirname(__file__))
-    
+
     def reducer_func(self, mapper_res):
         if self._is_msprof:
             logger.warning("Freq analysis do not support msprof db now.")
             return
-        
-        mapper_res = list(filter(lambda res: res is not None, mapper_res))
+        mapper_res = list(filter(lambda res: res[0] is not None, mapper_res))
         if not mapper_res:
             logger.error("Mapper data is None, load profiling data failed.")
-            return 
-        
+            return
         for freqs, rank_id in mapper_res:
             if freqs == [self.COMMON_FREQ]:
                 continue
@@ -57,7 +55,6 @@ class FreqAnalysis(BaseRecipeAnalysis):
             else:
                 self.abnormal_freq_ranks.append(rank_id)
                 self.abnormal_freq_ranks_map[rank_id] = str(freqs)
-
         self.free_freq_ranks.sort()
         self.abnormal_freq_ranks.sort()
 
@@ -98,15 +95,12 @@ class FreqAnalysis(BaseRecipeAnalysis):
         service_res = service.query_data()
         aic_freq = service_res.get("AICORE_FREQ", None)
         rank_id = service_res.get("RANK_DEVICE_MAP", None)
-
         if aic_freq is None or aic_freq.empty:
             logger.error(f"No aic freq data found in {profiler_db_path}.")
-            return None
-        
+            return None, None
         if rank_id is None or rank_id.empty:
             logger.error(f"No rank_id data found in {profiler_db_path}.")
-            return None
-        
+            return None, None
         rank_id = rank_id["rankId"].values[0]
         freq_arr = aic_freq["freq"].values
         freqs = list(set(freq_arr))
-- 
Gitee


From 1f2594f38f48d34fa27e4f02367e7f164959e845 Mon Sep 17 00:00:00 2001
From: fanglanyue <fanglanyue@huawei.com>
Date: Fri, 28 Feb 2025 16:40:09 +0800
Subject: [PATCH 074/145] comm_group_map recipe

---
 .../msprof_data_preprocessor.py               |   5 +-
 .../common_func/table_constant.py             |   4 +
 .../recipes/base_recipe_analysis.py           |   2 +-
 .../recipes/comm_group_map/__init__.py        |   0
 .../recipes/comm_group_map/comm_group_map.py  | 122 ++++++++++++++++++
 .../msprof_analyze/prof_common/constant.py    |   2 +
 6 files changed, 133 insertions(+), 2 deletions(-)
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/__init__.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py

diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
index 04953b0edfc..5c3e3f11fe1 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
@@ -86,7 +86,10 @@ class MsprofDataPreprocessor(DataPreprocessor):
 
     def _find_info_json_file(self, dir_name):
         for file_name in os.listdir(dir_name):
-            for device_file in os.listdir(os.path.join(dir_name, file_name)):
+            file_path = os.path.join(dir_name, file_name)
+            if not os.path.isdir(file_path):
+                continue
+            for device_file in os.listdir(file_path):
                 if re.match(self.INFO_JSON_PATTERN, device_file):
                     return os.path.join(dir_name, file_name, device_file)
         return None
diff --git a/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py b/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
index 27daae78cb9..deec149e08c 100644
--- a/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
+++ b/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
@@ -39,3 +39,7 @@ class TableConstant:
     DST_RANK = "dst_rank"
     TRANSPORT_TYPE = "transport_type"
     OPNAME = "op_name"
+    GROUP_ID = "group_id"
+    PG_NAME = "pg_name"
+    NAME = "name"
+    VALUE = "value"
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
index ed60873a1ef..4b966c69684 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
@@ -109,7 +109,7 @@ class BaseRecipeAnalysis(ABC):
             result_db = custom_db_path if custom_db_path else os.path.join(self.output_path, file_name)
             conn, cursor = DBManager.create_connect_db(result_db)
             if isinstance(data, pd.DataFrame):
-                data.to_sql(table_name, conn, if_exists='replace', index=True)
+                data.to_sql(table_name, conn, if_exists='replace', index=index)
             else:
                 logger.error(f"Unknown dump data type: {type(data)}")
             DBManager.destroy_db_connect(conn, cursor)
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/__init__.py b/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/__init__.py
new file mode 100644
index 00000000000..e69de29bb2d
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py b/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py
new file mode 100644
index 00000000000..5fc51d6bc73
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py
@@ -0,0 +1,122 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import json
+import os
+import pandas as pd
+
+from cluster_analyse.common_func.utils import double_hash
+from cluster_analyse.common_func.table_constant import TableConstant
+from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.logger import get_logger
+from prof_common.database_service import DatabaseService
+
+logger = get_logger()
+
+
+class CommGroupMap(BaseRecipeAnalysis):
+    COMMUNICATION_GROUP_MAPPING_TABLE = "CommunicationGroupMapping"
+
+    def __init__(self, params):
+        super().__init__(params)
+        logger.info("CommGroupMap init.")
+        self.group_df = None
+
+    @property
+    def base_dir(self):
+        return os.path.basename(os.path.dirname(__file__))
+
+    @staticmethod
+    def get_comm_type_from_op_name(op_name: str):
+        op_name_lower = op_name.lower()
+        return Constant.P2P if ("send" in op_name_lower or "receive" in op_name_lower or "recv" in op_name_lower) \
+               else Constant.COLLECTIVE
+
+    def run(self, context):
+        mapper_res = self.mapper_func(context)
+        self.reducer_func(mapper_res)
+        if self._export_type == Constant.DB:
+            self.save_db()
+        else:
+            logger.error(f"CommGroupMap: {self._export_type} is not supported for export type.")
+
+    def reducer_func(self, mapper_res):
+        # concat and process all comm group
+        comm_group_df_list = [df for df, _ in mapper_res]
+        comm_group_combined_df = pd.concat(comm_group_df_list).drop_duplicates()
+        comm_group_combined_df = (comm_group_combined_df.groupby([TableConstant.TYPE, TableConstant.GROUP_NAME])
+                                  [TableConstant.RANK_ID].apply(lambda x: sorted(set(x))).reset_index())
+        comm_group_combined_df[TableConstant.RANK_SET] = (comm_group_combined_df[TableConstant.RANK_ID].
+                                                          apply(lambda x: "(" + ",".join(str(i) for i in x) + ")"))
+
+        comm_group_combined_df = comm_group_combined_df.drop(columns=[TableConstant.RANK_ID])
+        # concat all parallel group info
+        parallel_info_df_list = [df for _, df in mapper_res]
+        parallel_info_combined_df = pd.concat(parallel_info_df_list).drop_duplicates()
+        # merge by group_name
+        group_df = pd.merge(comm_group_combined_df, parallel_info_combined_df, on=TableConstant.GROUP_NAME, how="left")
+        group_df.fillna("", inplace=True)
+        # column order
+        column_order = [TableConstant.TYPE, TableConstant.RANK_SET, TableConstant.GROUP_NAME,
+                        TableConstant.GROUP_ID, TableConstant.PG_NAME]
+        self.group_df = group_df[column_order]
+
+    def save_db(self):
+        self.dump_data(self.group_df, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER,
+                       self.COMMUNICATION_GROUP_MAPPING_TABLE, index=False)
+
+    def _mapper_func(self, data_map, analysis_class):
+        rank_id = data_map.get(Constant.RANK_ID)
+        # read CommAnalyzerTime table
+        analysis_db_path = data_map.get(Constant.ANALYSIS_DB_PATH)
+        analysis_data_service = DatabaseService(analysis_db_path, {})
+        analysis_data_service.add_table_for_query(Constant.TABLE_COMM_ANALYZER_TIME,
+                                                  [TableConstant.HCCL_OP_NAME, TableConstant.GROUP_NAME])
+        comm_time_res = analysis_data_service.query_data()
+        # process comm_time_df: group_name, type, rank_id
+        comm_time_df = comm_time_res.get(Constant.TABLE_COMM_ANALYZER_TIME)
+        comm_time_df[TableConstant.RANK_ID] = rank_id
+        comm_time_df[TableConstant.TYPE] = (comm_time_df[TableConstant.HCCL_OP_NAME].
+                                            apply(lambda x: self.get_comm_type_from_op_name(x)))
+        comm_time_df = comm_time_df.drop(columns=[TableConstant.HCCL_OP_NAME])
+        comm_time_df = comm_time_df.drop_duplicates()
+
+        # read META_DATA table
+        profiler_db_path = data_map.get(Constant.PROFILER_DB_PATH)
+        profiler_data_service = DatabaseService(profiler_db_path, {})
+        profiler_data_service.add_table_for_query(Constant.TABLE_META_DATA,
+                                                  [TableConstant.NAME, TableConstant.VALUE])
+        meta_data_res = profiler_data_service.query_data()
+        meta_data_df = meta_data_res.get(Constant.TABLE_META_DATA)
+        # process parallel_info_df
+        parallel_info_df = pd.DataFrame(columns=[TableConstant.GROUP_NAME,
+                                                 TableConstant.GROUP_ID, TableConstant.PG_NAME])
+        if Constant.PARALLEL_GROUP_INFO not in meta_data_df[TableConstant.NAME].values:
+            return comm_time_df, parallel_info_df
+        info_str = meta_data_df.loc[meta_data_df[TableConstant.NAME] == Constant.PARALLEL_GROUP_INFO,
+                                    TableConstant.VALUE].values[0]
+        info_dict = json.loads(info_str)
+        for group_id, parallel_info in info_dict.items():
+            group_name = str(double_hash(group_id))  # group_name is hashed group_id
+            pg_name = parallel_info.get(TableConstant.GROUP_NAME, "")
+            if not pg_name:
+                continue
+            parallel_info_df.loc[parallel_info_df.shape[0]] = [group_name, group_id, pg_name]
+
+        return comm_time_df, parallel_info_df
+
+
+
+
diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index c04e429321d..b83b405cb19 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -128,6 +128,7 @@ class Constant(object):
     TABLE_HOST_INFO = "HostInfo"
     TABLE_RANK_DEVICE_MAP = "RankDeviceMap"
     TABLE_CLUSTER_BASE_INFO = "ClusterBaseInfo"
+    TABLE_META_DATA = "META_DATA"
 
     # data config key
     CONFIG = "config"
@@ -136,6 +137,7 @@ class Constant(object):
 
     # metadata key
     DISTRIBUTED_ARGS = "distributed_args"
+    PARALLEL_GROUP_INFO = "parallel_group_info"
 
     # mode
     ALL = "all"
-- 
Gitee


From 86689a28f8b97c7d95e50d4472e3cfabb981fd22 Mon Sep 17 00:00:00 2001
From: fanglanyue <fanglanyue@huawei.com>
Date: Wed, 5 Mar 2025 10:41:41 +0800
Subject: [PATCH 075/145] modify clusterBaseInfo Table structure

---
 .../cluster_analyse/analysis/cluster_base_info_analysis.py | 7 +++----
 .../cluster_analyse/common_func/tables_config.py           | 3 ++-
 2 files changed, 5 insertions(+), 5 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/cluster_base_info_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/cluster_base_info_analysis.py
index cb280978c41..664ef3ba1a4 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/cluster_base_info_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/cluster_base_info_analysis.py
@@ -28,7 +28,6 @@ logger = get_logger()
 
 
 class ClusterBaseInfoAnalysis(BaseAnalysis):
-    KEY_DISTRIBUTED_ARGS = "distributed_args"
 
     def __init__(self, param: dict):
         super().__init__(param)
@@ -56,7 +55,7 @@ class ClusterBaseInfoAnalysis(BaseAnalysis):
         result_db = os.path.join(output_path, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER)
         conn, curs = DBManager.create_connect_db(result_db)
         DBManager.create_tables(result_db, Constant.TABLE_CLUSTER_BASE_INFO)
-        save_distributed_args = [[json.dumps(self.distributed_args)]]
+        save_distributed_args = [[Constant.DISTRIBUTED_ARGS, json.dumps(self.distributed_args)]]
         sql = "insert into {} values ({value})".format(Constant.TABLE_CLUSTER_BASE_INFO,
                                                        value="?," * (len(save_distributed_args[0]) - 1) + "?")
         DBManager.executemany_sql(conn, sql, save_distributed_args)
@@ -72,9 +71,9 @@ class ClusterBaseInfoAnalysis(BaseAnalysis):
             except RuntimeError as e:
                 logger.error("Read json failed. %s", str(e))
                 continue
-            if not meta_data.get(self.KEY_DISTRIBUTED_ARGS):
+            if not meta_data.get(Constant.DISTRIBUTED_ARGS):
                 continue
-            for key, value in meta_data[self.KEY_DISTRIBUTED_ARGS].items():
+            for key, value in meta_data[Constant.DISTRIBUTED_ARGS].items():
                 if key == "rank":
                     continue
                 self.distributed_args.setdefault(key, value)
diff --git a/profiler/msprof_analyze/cluster_analyse/common_func/tables_config.py b/profiler/msprof_analyze/cluster_analyse/common_func/tables_config.py
index 42c509694cf..7a40d9977d8 100644
--- a/profiler/msprof_analyze/cluster_analyse/common_func/tables_config.py
+++ b/profiler/msprof_analyze/cluster_analyse/common_func/tables_config.py
@@ -139,6 +139,7 @@ class TablesConfig:
             ("pg_name", "TEXT, null")
         ],
         "ClusterBaseInfoMap": [
-            ("distributed_args", "TEXT, null")
+            ("key", "TEXT, null"),
+            ("value", "TEXT, null")
         ]
     }
-- 
Gitee


From 54ce12e8104b90798e57428165f78475747f41af Mon Sep 17 00:00:00 2001
From: qianzhengxin <paulqian29@163.com>
Date: Wed, 5 Mar 2025 14:47:57 +0800
Subject: [PATCH 076/145] fix code + ut

---
 .../msprobe/mindspore/debugger/precision_debugger.py           | 2 +-
 .../test/mindspore_ut/debugger/test_ms_precision_debugger.py   | 3 +++
 2 files changed, 4 insertions(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
index affe289ec70..97db42ba587 100644
--- a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
+++ b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
@@ -248,4 +248,4 @@ class PrecisionDebugger:
         instance = cls._instance
         if not instance:
             raise Exception(MsgConst.NOT_CREATED_INSTANCE)
-        return cls.config.level_ori == Const.LEVEL_L2
\ No newline at end of file
+        return instance.config.level_ori == Const.LEVEL_L2
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/debugger/test_ms_precision_debugger.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/debugger/test_ms_precision_debugger.py
index 066ff537ce6..86fdcc08385 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/debugger/test_ms_precision_debugger.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/debugger/test_ms_precision_debugger.py
@@ -98,6 +98,9 @@ class TestPrecisionDebugger(unittest.TestCase):
             def __init__(self):
                 self.task = Const.TENSOR
                 self.service = None
+                self.config = MagicMock()
+                self.config.level_ori = MagicMock()
+                self.config.level_ori.return_value = Const.LEVEL_L1
         PrecisionDebugger._instance = None
         with self.assertRaises(Exception) as context:
             PrecisionDebugger.stop()
-- 
Gitee


From 1018ff004562af9dd2703b4af5ecc5d74fda2b7b Mon Sep 17 00:00:00 2001
From: fanhong <2532845962@qq.com>
Date: Sat, 1 Mar 2025 17:57:40 +0800
Subject: [PATCH 077/145] =?UTF-8?q?=E6=96=B0=E5=A2=9ECommunicationTimeSumR?=
 =?UTF-8?q?ecipe,=E8=AE=A1=E7=AE=97Time=EF=BC=8CBandwidth?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../communication_time_sum/__init__.py        |  14 ++
 .../communication_time_sum.py                 | 207 ++++++++++++++++++
 2 files changed, 221 insertions(+)
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/communication_time_sum/__init__.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/communication_time_sum/communication_time_sum.py

diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/communication_time_sum/__init__.py b/profiler/msprof_analyze/cluster_analyse/recipes/communication_time_sum/__init__.py
new file mode 100644
index 00000000000..a355e5a7f08
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/communication_time_sum/__init__.py
@@ -0,0 +1,14 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/communication_time_sum/communication_time_sum.py b/profiler/msprof_analyze/cluster_analyse/recipes/communication_time_sum/communication_time_sum.py
new file mode 100644
index 00000000000..2291be34051
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/communication_time_sum/communication_time_sum.py
@@ -0,0 +1,207 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+import os
+
+import numpy as np
+import pandas as pd
+
+from msprof_analyze.cluster_analyse.common_func.table_constant import TableConstant
+from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.database_service import DatabaseService
+from msprof_analyze.prof_common.logger import get_logger
+
+logger = get_logger()
+
+
+class CommunicationTimeSumRecipe(BaseRecipeAnalysis):
+    TABLE_CLUSTER_COMM_TIME = "ClusterCommunicationTime"
+    TABLE_CLUSTER_COMM_BANDWIDTH = "ClusterCommunicationBandwidth"
+
+    def __init__(self, params):
+        super().__init__(params)
+        logger.info("CommunicationSum init.")
+        self.communication_time = None
+        self.communication_bandwidth = None
+
+    @property
+    def base_dir(self):
+        return os.path.basename(os.path.dirname(__file__))
+
+    def run(self, context):
+        mapper_res = self.mapper_func(context)
+        self.reducer_func(mapper_res)
+        if self._export_type == Constant.DB:
+            self.save_db()
+        else:
+            logger.error("Unknown export type.")
+
+    def reducer_func(self, mapper_res):
+        mapper_res_time = list(item[0] for item in mapper_res if item[0] is not None)
+        mapper_res_bw = list(item[1] for item in mapper_res if item[1] is not None)
+        if not mapper_res_time and not mapper_res_bw:
+            logger.error("Mapper data is None.")
+            return
+        cluster_db_path = os.path.join(self.output_path, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER)
+        data_service = DatabaseService(cluster_db_path, None)
+        data_service.add_table_for_query("CommunicationGroupMapping",
+                                         [TableConstant.RANK_SET, TableConstant.GROUP_NAME])
+        df_dict = data_service.query_data()
+        rank_set_df = df_dict.get("CommunicationGroupMapping", None)
+        if rank_set_df is None or rank_set_df.empty:
+            logger.error(f"There is no CommunicationGroupMapping data in {cluster_db_path}.")
+            return
+        communication_time = pd.concat(mapper_res_time)
+        communication_bandwidth = pd.concat(mapper_res_bw)
+        self._compute_time_info(communication_time, rank_set_df)
+        self._compute_bandwidth_info(communication_bandwidth, rank_set_df)
+
+    def save_db(self):
+        self.dump_data(self.communication_time, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER,
+                       self.TABLE_CLUSTER_COMM_TIME, index=False)
+        self.dump_data(self.communication_bandwidth, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER,
+                       self.TABLE_CLUSTER_COMM_BANDWIDTH, index=False)
+
+    def _compute_time_info(self, communication_time, rank_set_df):
+        """
+        communication_time: ['hccl_op_name', 'group_name', 'start_timestamp', 'elapse_time',
+                            'transit_time', 'wait_time', 'synchronization_time', 'idle_time',
+                            'step', 'type', 'rank_id']
+        rank_set_df: ['rank_set', 'group_name']
+        output: ['step', 'rank_id', 'hccl_op_name', 'group_name', 'start_timestamp', 'elapse_time', 'transit_time',
+                'wait_time', 'synchronization_time', 'idle_time', 'synchronization_time_ratio', 'wait_time_ratio']
+
+        按"step", "rank_id", "rank_set"字段进行分组，汇总"elapse_time", "transit_time", "wait_time",
+        "synchronization_time", "idle_time"等时间数据，新增汇总行插入communication_time
+        """
+        merged_df = pd.merge(communication_time, rank_set_df, on=TableConstant.GROUP_NAME, how='left')
+        summed_df = merged_df.groupby([TableConstant.STEP, TableConstant.RANK_ID, TableConstant.RANK_SET]).agg({
+            TableConstant.GROUP_NAME: "first",
+            TableConstant.ELAPSED_TIME: "sum",
+            TableConstant.TRANSIT_TIME: "sum",
+            TableConstant.WAIT_TIME: "sum",
+            TableConstant.SYNCHRONIZATION_TIME: "sum",
+            TableConstant.IDLE_TIME: "sum"
+        }).reset_index()
+        summed_df[TableConstant.HCCL_OP_NAME] = Constant.TOTAL_OP_INFO
+        summed_df[TableConstant.START_TIMESTAMP] = 0
+        # 计算 synchronization_time_ratio，wait_time_ratio
+        summed_df[TableConstant.SYNCHRONIZATION_TIME_RATIO] = (
+                summed_df[TableConstant.SYNCHRONIZATION_TIME] /
+                (summed_df[TableConstant.TRANSIT_TIME] + summed_df[TableConstant.SYNCHRONIZATION_TIME]).replace(0,
+                                                                                                                np.nan)
+        ).fillna(0).round(4)
+        summed_df[TableConstant.WAIT_TIME_RATIO] = (
+                summed_df[TableConstant.WAIT_TIME] /
+                (summed_df[TableConstant.TRANSIT_TIME] + summed_df[TableConstant.WAIT_TIME]).replace(0, np.nan)
+        ).fillna(0).round(4)
+
+        communication_time[TableConstant.SYNCHRONIZATION_TIME_RATIO] = 0
+        communication_time[TableConstant.WAIT_TIME_RATIO] = 0
+        desired_order = [TableConstant.STEP, TableConstant.RANK_ID, TableConstant.HCCL_OP_NAME,
+                         TableConstant.GROUP_NAME, TableConstant.START_TIMESTAMP, TableConstant.ELAPSED_TIME,
+                         TableConstant.TRANSIT_TIME, TableConstant.WAIT_TIME, TableConstant.SYNCHRONIZATION_TIME,
+                         TableConstant.IDLE_TIME, TableConstant.SYNCHRONIZATION_TIME_RATIO,
+                         TableConstant.WAIT_TIME_RATIO]
+        # 合并汇总数据DataFrame
+        final_df = pd.concat([communication_time, summed_df], axis=0).reindex(columns=desired_order)
+        final_df.rename(columns={'elapse_time': 'elapsed_time'}, inplace=True)
+        self.communication_time = final_df
+
+    def _compute_bandwidth_info(self, communication_bandwidth, rank_set_df):
+        """
+        communication_bandwidth: ['hccl_op_name', 'group_name', 'transport_type', 'transit_size',
+                                  'transit_time', 'bandwidth', 'large_packet_ratio', 'package_size',
+                                  'count', 'total_duration', 'step', 'type', 'rank_id']
+        output: ['step', 'rank_id', 'hccl_op_name', 'group_name', 'band_type', 'transit_size', 'transit_time',
+                'bandwidth', 'large_packet_ratio', 'package_size', 'count', 'total_duration']
+        rank_set_df: ['rank_set', 'group_name']
+        按'rank_set', 'step', 'rank_id', 'transport_type', 'package_size'进行分组，对'count', 'total_duration'进行求和；
+        对于同一'rank_set', 'step', 'rank_id', 'transport_type'下的数据，对'transit_size', 'transit_time'求和，
+        其中如果'hccl_op_name'+'group_name'相同，求和时只累加一次
+        """
+        merged_df = pd.merge(communication_bandwidth, rank_set_df, on=TableConstant.GROUP_NAME, how='left')
+        # 计算每个rank_set/step/rank_id/transport_type分组下去重后的transit_size和transit_time总和
+        sum_transit_size = 'sum_transit_size'
+        sum_transit_time = 'sum_transit_time'
+        sum_transit = merged_df.groupby(
+            [TableConstant.RANK_SET, TableConstant.STEP, TableConstant.RANK_ID, TableConstant.TRANSPORT_TYPE]).apply(
+            self._get_sum_distinct_op).reset_index().rename(columns={
+                TableConstant.TRANSIT_SIZE: sum_transit_size,
+                TableConstant.TRANSIT_TIME: sum_transit_time
+            })
+        joined_df = pd.merge(merged_df, sum_transit,
+                             on=[TableConstant.RANK_SET, TableConstant.STEP, TableConstant.RANK_ID,
+                                 TableConstant.TRANSPORT_TYPE])
+        # 按'rank_set', 'step', 'rank_id', 'transport_type', 'package_size'进行聚合
+        agg_result = joined_df.groupby(
+            [TableConstant.RANK_SET, TableConstant.STEP, TableConstant.RANK_ID, TableConstant.TRANSPORT_TYPE,
+             TableConstant.PACKAGE_SIZE]
+        ).agg({
+            TableConstant.COUNT: 'sum',
+            TableConstant.TOTAL_DURATION: 'sum',
+            TableConstant.HCCL_OP_NAME: 'first',
+            TableConstant.GROUP_NAME: 'first',
+            sum_transit_size: 'first',
+            sum_transit_time: 'first'
+        }).reset_index()
+        agg_result[TableConstant.LARGE_PACKET_RATIO] = 0
+        agg_result[TableConstant.HCCL_OP_NAME] = Constant.TOTAL_OP_INFO
+        # 计算聚合数据带宽
+        agg_result[TableConstant.BANDWIDTH] = (
+                agg_result[sum_transit_size] / agg_result[sum_transit_time].replace(0, np.nan)
+        ).fillna(0).round(4)
+        agg_result = agg_result.rename(columns={
+            sum_transit_size: TableConstant.TRANSIT_SIZE,
+            sum_transit_time: TableConstant.TRANSIT_TIME
+        })
+        desired_order = [TableConstant.STEP, TableConstant.RANK_ID, TableConstant.HCCL_OP_NAME,
+                         TableConstant.GROUP_NAME, TableConstant.TRANSPORT_TYPE, TableConstant.TRANSIT_SIZE,
+                         TableConstant.TRANSIT_TIME, TableConstant.BANDWIDTH, TableConstant.LARGE_PACKET_RATIO,
+                         TableConstant.PACKAGE_SIZE, TableConstant.COUNT, TableConstant.TOTAL_DURATION]
+        final_df = pd.concat([communication_bandwidth, agg_result], axis=0).reindex(columns=desired_order)
+        final_df.rename(columns={TableConstant.TRANSPORT_TYPE: TableConstant.BAND_TYPE}, inplace=True)
+        self.communication_bandwidth = final_df
+
+    def _get_sum_distinct_op(self, op_df):
+        return op_df.drop_duplicates(subset=[TableConstant.HCCL_OP_NAME, TableConstant.GROUP_NAME])[
+            [TableConstant.TRANSIT_SIZE, TableConstant.TRANSIT_TIME]].sum()
+
+    def _mapper_func(self, data_map, analysis_class):
+        analysis_db_path = data_map.get(Constant.ANALYSIS_DB_PATH)
+        rank_id = data_map.get(Constant.RANK_ID)
+        step_range = data_map.get(Constant.STEP_RANGE)
+        date_service = DatabaseService(analysis_db_path, step_range)
+        date_service.add_table_for_query(Constant.TABLE_COMM_ANALYZER_TIME)
+        date_service.add_table_for_query(Constant.TABLE_COMM_ANALYZER_BANDWIDTH)
+        df_dict = date_service.query_data()
+        time_df = df_dict.get(Constant.TABLE_COMM_ANALYZER_TIME)
+        bandwidth_df = df_dict.get(Constant.TABLE_COMM_ANALYZER_BANDWIDTH)
+
+        is_time_df_empty = time_df is None or time_df.empty
+        is_bandwidth_df_empty = bandwidth_df is None or bandwidth_df.empty
+        if is_time_df_empty or is_bandwidth_df_empty:
+            logger.warning(f"There is no stats data in {analysis_db_path}.")
+            return None, None
+        # 补充step、rank_id字段
+        time_df[TableConstant.RANK_ID] = rank_id
+        bandwidth_df[TableConstant.RANK_ID] = rank_id
+        if TableConstant.STEP not in time_df.columns:
+            time_df[TableConstant.STEP] = TableConstant.STEP
+        if TableConstant.STEP not in bandwidth_df.columns:
+            bandwidth_df[TableConstant.STEP] = TableConstant.STEP
+        return time_df, bandwidth_df
-- 
Gitee


From 69e0a9d5581fd5bba480532f8d4908b68d57af51 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=AD=94=E7=82=B3=E7=BF=94?= <1120200577@qq.com>
Date: Wed, 5 Mar 2025 15:01:01 +0800
Subject: [PATCH 078/145] update slow rank ranlysis

---
 debug/accuracy_tools/msprobe/README.md        |  15 +-
 .../msprobe/core/compare/acc_compare.py       |  88 ++----
 .../core/compare/multiprocessing_compute.py   |  10 +-
 .../msprobe/core/compare/utils.py             |  14 +-
 .../data_processor/pytorch_processor.py       |   8 +-
 .../msprobe/docs/02.config_introduction.md    |  30 +-
 .../msprobe/docs/05.data_dump_PyTorch.md      |   2 +-
 .../msprobe/docs/06.data_dump_MindSpore.md    |   2 +-
 .../docs/10.accuracy_compare_PyTorch.md       |  10 +-
 .../accuracy_tools/msprobe/docs/19.monitor.md | 126 +++++---
 .../msprobe/docs/27.dump_json_instruction.md  | 286 +++++++++++++++++-
 .../msprobe/docs/28.kernel_dump_MindSpore.md  |   2 +-
 .../msprobe/docs/29.data_dump_MSAdapter.md    | 229 ++++++++++++++
 .../docs/30.overflow_check_MSAdapter.md       |  31 ++
 .../msprobe/mindspore/compare/ms_compare.py   |   8 +
 .../monitor/distributed/wrap_distributed.py   |   2 +-
 .../msprobe/mindspore/monitor/utils.py        |   4 +-
 .../api_accuracy_checker/run_ut/run_ut.py     |   2 +
 .../msprobe/pytorch/monitor/module_hook.py    |  97 +++---
 .../test/core_ut/compare/test_acc_compare.py  |  42 +--
 .../core_ut/compare/test_acc_compare_utils.py |  16 +-
 .../test_cmp_multiprocessing_compute.py       |   8 +-
 .../data_processor/test_pytorch_processor.py  |  10 +
 .../mindspore_ut/compare/test_ms_compare.py   |  27 +-
 dynolog_npu/README.md                         |  10 +-
 dynolog_npu/plugin/README.md                  |  42 +++
 dynolog_npu/plugin/Readme.md                  |  17 --
 .../plugin/ipc_monitor/DynoLogNpuMonitor.cpp  |  12 +-
 .../plugin/ipc_monitor/NpuIpcClient.cpp       |  21 +-
 .../ipc_monitor/PyDynamicMonitorProxy.h       |  26 +-
 dynolog_npu/plugin/ipc_monitor/utils.cpp      |   4 +-
 dynolog_npu/plugin/ipc_monitor/utils.h        |   2 +-
 dynolog_npu/plugin/setup.py                   |  15 +-
 .../ai_core_performance_checker.py            |   4 +-
 .../msprof_analyze/cluster_analyse/README.md  |   2 +
 .../analysis/comm_matrix_analysis.py          |  69 +++--
 .../msprof_data_preprocessor.py               |   5 +-
 .../common_func/table_constant.py             |   4 +
 .../recipes/base_recipe_analysis.py           |   2 +-
 .../recipes/comm_group_map/__init__.py        |   0
 .../recipes/comm_group_map/comm_group_map.py  | 122 ++++++++
 .../recipes/freq_analysis/__init__.py         |   0
 .../recipes/freq_analysis/freq_analysis.py    | 108 +++++++
 .../recipes/slow_rank/dixon_table.py          | 117 +++++++
 .../recipes/slow_rank/slow_rank.py            | 175 +++++++++++
 .../compare_bean/overall_metrics_bean.py      |  50 ++-
 .../compare_bean/profiling_info.py            |  11 +-
 .../profiling_parser/base_profiling_parser.py |  16 +
 .../msprof_analyze/prof_common/constant.py    |  13 +-
 .../cluster_time_summary_export.py            |  42 +++
 .../recipes/test_freq_analysis.py             |  83 +++++
 .../cluster_analyse/recipes/test_slow_rank.py | 102 +++++++
 52 files changed, 1815 insertions(+), 328 deletions(-)
 create mode 100644 debug/accuracy_tools/msprobe/docs/29.data_dump_MSAdapter.md
 create mode 100644 debug/accuracy_tools/msprobe/docs/30.overflow_check_MSAdapter.md
 create mode 100644 dynolog_npu/plugin/README.md
 delete mode 100644 dynolog_npu/plugin/Readme.md
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/__init__.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/__init__.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/dixon_table.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/slow_rank.py
 create mode 100644 profiler/msprof_analyze/prof_exports/cluster_time_summary_export.py
 create mode 100644 profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_freq_analysis.py
 create mode 100644 profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_slow_rank.py

diff --git a/debug/accuracy_tools/msprobe/README.md b/debug/accuracy_tools/msprobe/README.md
index e31490f01e9..6b7d483078a 100644
--- a/debug/accuracy_tools/msprobe/README.md
+++ b/debug/accuracy_tools/msprobe/README.md
@@ -44,6 +44,7 @@ export MSPROBE_LOG_LEVEL={x}
 
 - msprobe支持AscendPyTorch 1.11.0或更高版本，支持的PyTorch和CANN以及PyTorch和python软件版本配套关系请参见《[Ascend Extension for PyTorch插件](https://gitee.com/ascend/pytorch)》。
 - msprobe支持MindSpore 2.4.0或更高版本，支持的MindSpore和CANN以及MindSpore和python软件版本配套关系请参见《[MindSpore版本发布列表](https://www.mindspore.cn/versions)》。
+- msprobe支持MSAdapter 2.1.0。
 - msprobe支持的固件驱动版本与配套CANN软件支持的固件驱动版本相同，开发者可通过“[昇腾社区-固件与驱动](https://gitee.com/link?target=https%3A%2F%2Fwww.hiascend.com%2Fhardware%2Ffirmware-drivers%2Fcommunity%3Fproduct%3D2%26model%3D28%26cann%3D8.0.RC3.alpha003%26driver%3D1.0.25.alpha)”页面根据产品型号与CANN软件版本获取配套的固件与驱动。
 
 
@@ -69,15 +70,17 @@ export MSPROBE_LOG_LEVEL={x}
 
 ### 1 数据采集
 
-msprobe 通过在训练脚本中添加 PrecisionDebugger 接口的方式对 API 执行精度数据 dump 操作，对应 config.json 中的 task 为 statistics 或 tensor。
+msprobe 通过在训练脚本中添加 PrecisionDebugger 接口的方式对 API 执行精度数据 dump 操作。对应 config.json 中的 "statistics" 或 "tensor" task。
 
 [PyTorch 场景的数据采集](./docs/05.data_dump_PyTorch.md)
 
 [MindSpore 场景的数据采集](./docs/06.data_dump_MindSpore.md)
 
+[MSAdapter 场景的数据采集](./docs/29.data_dump_MSAdapter.md)
+
 ### 2 精度预检
 
-精度预检旨在昇腾 NPU 上扫描训练模型中的所有 API 进行 API 复现，给出精度情况的诊断和分析。对应 config.json 中的 task 为 run_ut。
+精度预检旨在昇腾 NPU 上扫描训练模型中的所有 API 进行 API 复现，给出精度情况的诊断和分析。对应 config.json 中的 "run_ut" task。
 
 PyTorch 场景的[离线预检](./docs/07.accuracy_checker_PyTorch.md)和[在线预检](./docs/08.accuracy_checker_online_PyTorch.md)
 
@@ -143,12 +146,14 @@ MindSpore 动态图场景的[离线预检](./docs/09.accuracy_checker_MindSpore.
 
 ### 12 溢出检测与解析
 
-溢出检测与解析是在执行精度数据 dump 时，判断是否存在输入正常但输出存在溢出的 API，从而判断是否为正常溢出。对应 config.json 中的 overflow_check。 
-推荐直接使用[数据采集](#1-数据采集)功能采集统计量信息检测溢出问题。
+溢出检测用于采集溢出 API 或 模块的精度数据，而溢出解析则是通过对溢出数据的分析，进一步判断是否为正常溢出。对应 config.json 中的 "overflow_check" task。 
+推荐直接使用[数据采集](#1-数据采集)功能采集统计量信息,检测溢出问题。
 
 [PyTorch 场景的溢出检测与解析](./docs/12.overflow_check_PyTorch.md)
 
-[MindSpore 场景的溢出检测与解析](./docs/13.overflow_check_MindSpore.md)
+[MindSpore 场景的溢出检测](./docs/13.overflow_check_MindSpore.md)
+
+[MSAdapter 场景的溢出检测](./docs/30.overflow_check_MSAdapter.md)
 
 ## 📑 补充材料
 
diff --git a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
index f0ac97a0293..f2aa8c479ec 100644
--- a/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
+++ b/debug/accuracy_tools/msprobe/core/compare/acc_compare.py
@@ -329,7 +329,9 @@ class Comparator:
                 else:
                     result_item.append(CompareConst.NONE)
                 if self.dump_mode == Const.ALL:
-                    result_item.append(npu_ops_all.get(ms_op_name).get("data_name", None))
+                    ms_data_name = npu_ops_all.get(ms_op_name).get("data_name", None)
+                    pt_data_name = bench_ops_all.get(bench_op_name).get("data_name", None)
+                    result_item.append([ms_data_name, pt_data_name])
                 result.append(result_item)
             elif ms_op_name not in npu_ops_all:
                 logger.warning(f'Can not find npu op name : `{ms_op_name}` in npu dump json file.')
@@ -349,47 +351,48 @@ class Comparator:
         result_df = self.make_result_table(result)
         return result_df
 
-    def compare_by_op(self, npu_op_name, bench_op_name, op_name_mapping_dict, input_param, bench_data):
+    def compare_by_op(self, npu_op_name, bench_op_name, op_name_mapping_dict, input_param):
         """
         :param npu_op_name: excel中的NPU_Name，例如：MintFunctional.conv2d.0.forward.input.3.0
         :param bench_op_name: excel中的Bench_Name，例如：Functional.conv2d.0.forward.input.3.0
         :param op_name_mapping_dict: op_name和npy或pt文件的映射关系
         :param input_param: npu_json_path/bench_json_path/stack_json_path等参数
-        :param bench_data: bench的dump数据中"data"字段
         :return: result_list，包含余弦相似度、最大绝对误差、最大相对误差、千分之一误差率、千分之五误差率和错误信息
-        用于读取excel中的NPU_Name和Bench_Name，根据映射关系找到npy或pt文件，然后读取文件中的数据进行比较，计算余弦相似度、
+        用于读取excel中的NPU_Name和Bench_Name，根据映射关系找到npy或pt文件，然后读取文件中的数据进行比较，计算余弦相似度、欧式距离
         最大绝对误差、最大相对误差、千分之一误差率、千分之五误差率并生成错误信息
         """
-        npu_bench_name_list = op_name_mapping_dict[npu_op_name]
-        data_name = safe_get_value(npu_bench_name_list, 1, "npu_bench_name_list")
         error_file, relative_err, error_flag = None, None, False
-        bench_data_name = get_bench_data_name(bench_op_name, bench_data)
-        if data_name == '-1' or data_name == -1:  # 没有真实数据路径
-            n_value, b_value = CompareConst.READ_NONE, CompareConst.READ_NONE
-            error_flag = True
-        elif not bench_data_name:
+
+        data_name_pair = op_name_mapping_dict.get(npu_op_name)
+        npu_data_name = data_name_pair[0]
+        bench_data_name = data_name_pair[1]
+
+        if str(npu_data_name) == '-1':  # 没有npu真实数据
+            n_value, b_value, error_flag = CompareConst.READ_NONE, CompareConst.READ_NONE, True
+        elif str(bench_data_name) == '-1':  # 没有bench真实数据
             n_value, b_value, error_flag = CompareConst.READ_NONE, CompareConst.READ_NONE, True
             error_file = 'no_bench_data'
         else:
+            npu_dir = input_param.get("npu_dump_data_dir")
+            bench_dir = input_param.get("bench_dump_data_dir")
             try:
-                read_npy_data = getattr(self, "read_npy_data")
                 frame_name = getattr(self, "frame_name")
+                read_npy_data = getattr(self, "read_npy_data")
                 if frame_name == "MSComparator":
-                    n_value = read_npy_data(input_param.get("npu_dump_data_dir"), npu_op_name + Const.NUMPY_SUFFIX)
+                    n_value = read_npy_data(npu_dir, npu_data_name)
                     if self.cross_frame:
-                        b_value = read_npy_data(input_param.get("bench_dump_data_dir"), bench_data_name,
-                                                load_pt_file=True)
+                        b_value = read_npy_data(bench_dir, bench_data_name, load_pt_file=True)
                     else:
-                        b_value = read_npy_data(input_param.get("bench_dump_data_dir"), bench_data_name)
+                        b_value = read_npy_data(bench_dir, bench_data_name)
                 else:
-                    n_value = read_npy_data(input_param.get("npu_dump_data_dir"), npu_op_name + Const.PT_SUFFIX)
-                    b_value = read_npy_data(input_param.get("bench_dump_data_dir"), bench_data_name)
+                    n_value = read_npy_data(npu_dir, npu_data_name)
+                    b_value = read_npy_data(bench_dir, bench_data_name)
             except IOError as error:
                 error_file = error.filename
                 n_value, b_value = CompareConst.READ_NONE, CompareConst.READ_NONE
                 error_flag = True
             except (FileCheckException, CompareException):
-                error_file = data_name
+                error_file = npu_data_name
                 n_value, b_value = CompareConst.READ_NONE, CompareConst.READ_NONE
                 error_flag = True
 
@@ -464,7 +467,7 @@ class Comparator:
         err_mess = []
 
         is_print_compare_log = input_param.get("is_print_compare_log")
-        bench_data = load_json(input_param.get("bench_json_path")).get('data')
+
         for i in range(len(result_df)):
             npu_op_name = result_df.iloc[i, 0]
             bench_op_name = result_df.iloc[i, 1]
@@ -472,7 +475,7 @@ class Comparator:
                 logger.info("start compare: {}".format(npu_op_name))
 
             cos_sim, euc_dist, max_abs_err, max_relative_err, one_thousand_err_ratio, five_thousand_err_ratio, err_msg \
-                = self.compare_by_op(npu_op_name, bench_op_name, dump_path_dict, input_param, bench_data)
+                = self.compare_by_op(npu_op_name, bench_op_name, dump_path_dict, input_param)
 
             if is_print_compare_log:
                 logger.info(
@@ -508,46 +511,3 @@ class Comparator:
         except ValueError as e:
             logger.error('result dataframe is not found.')
             raise CompareException(CompareException.INVALID_DATA_ERROR) from e
-
-
-def get_bench_data_name(bench_op_name, bench_data):
-    bench_name_list = re.split(r'\.(input|output|kwargs|parameters|parameters_grad)\.', bench_op_name)
-    if len(bench_name_list) > 1 and bench_name_list[1] == Const.PARAMS_GRAD:
-        bench_data_bundle = bench_data.get(bench_name_list[0] + Const.SEP + bench_name_list[1], {})
-    else:
-        bench_data_bundle = bench_data.get(bench_name_list[0], {})
-    if not bench_data_bundle or len(bench_name_list) < 3:
-        return None
-    layers = bench_name_list[2].split(Const.SEP)
-
-    def _get(key, container):
-        if isinstance(container, dict):
-            return container.get(key)
-        if isinstance(container, list):
-            try:
-                return container[int(key)]
-            except (ValueError, IndexError):
-                return None
-        return None
-
-    def get_by_layer(container, params_grad=False):
-        data = container
-        # dump.json中parameters_grad的结构为key：[{}], 如果存在key，有且只有一个列表元素，而op_name中只命名到了key，因此加'0'
-        if params_grad:
-            layers.append('0')
-        for layer in layers:
-            data = _get(layer, data)
-        return _get(CompareConst.DATA_NAME.lower(), data)
-
-    if Const.INPUT == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle.get(Const.INPUT, bench_data_bundle.get(Const.INPUT_ARGS)))
-    elif Const.KWARGS == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle.get(Const.INPUT_KWARGS))
-    elif Const.OUTPUT == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle.get(Const.OUTPUT))
-    elif Const.PARAMS == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle.get(Const.PARAMS))
-    elif Const.PARAMS_GRAD == bench_name_list[1]:
-        return get_by_layer(bench_data_bundle, params_grad=True)
-    else:
-        return None
diff --git a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
index f79671827c1..71b0f29d64f 100644
--- a/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
+++ b/debug/accuracy_tools/msprobe/core/compare/multiprocessing_compute.py
@@ -25,7 +25,7 @@ from msprobe.core.common.utils import CompareException
 from msprobe.core.common.const import CompareConst
 
 
-def _handle_multi_process(func, input_parma, result_df, lock):
+def _handle_multi_process(func, input_param, result_df, lock):
     process_num = max(int((multiprocessing.cpu_count() + 1) // 4), 1)
     op_name_mapping_dict = read_dump_data(result_df)
 
@@ -55,7 +55,7 @@ def _handle_multi_process(func, input_parma, result_df, lock):
         idx = df_chunk_size * process_idx
         chunk_size = len(df_chunk)
         result = pool.apply_async(func,
-                                  args=(idx, op_name_mapping_dict, df_chunk, lock, input_parma),
+                                  args=(idx, op_name_mapping_dict, df_chunk, lock, input_param),
                                   error_callback=err_call,
                                   callback=partial(update_progress, chunk_size, lock)
                                   )
@@ -97,12 +97,12 @@ def _ms_graph_handle_multi_process(func, result_df, mode):
 def read_dump_data(result_df):
     try:
         npu_dump_name_list = result_df.iloc[0:, 0].tolist()
-        npu_dump_tensor_list = result_df.iloc[0:, -1].tolist()
+        dump_tensor_pair_list = result_df.iloc[0:, -1].tolist()
         op_name_mapping_dict = {}
         for index, _ in enumerate(npu_dump_name_list):
             npu_dump_name = npu_dump_name_list[index]
-            npu_dump_tensor = npu_dump_tensor_list[index]
-            op_name_mapping_dict[npu_dump_name] = [npu_dump_tensor, npu_dump_tensor]
+            dump_tensor_pair = dump_tensor_pair_list[index]
+            op_name_mapping_dict[npu_dump_name] = dump_tensor_pair
         return op_name_mapping_dict
     except ValueError as e:
         logger.error('result dataframe is not found.')
diff --git a/debug/accuracy_tools/msprobe/core/compare/utils.py b/debug/accuracy_tools/msprobe/core/compare/utils.py
index 72b75ab254e..8656daf7cae 100644
--- a/debug/accuracy_tools/msprobe/core/compare/utils.py
+++ b/debug/accuracy_tools/msprobe/core/compare/utils.py
@@ -321,8 +321,8 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
         has_stack = npu_stack_info and bench_stack_info
 
         if dump_mode == Const.ALL:
-            npu_data_name = n_dict.get("data_name", None)
-            bench_data_name = b_dict.get("data_name", None)
+            npu_data_name_list = n_dict.get("data_name", None)
+            bench_data_name_list = b_dict.get("data_name", None)
 
         for index in range(min_len):
             n_name = safe_get_value(n_dict, n_start + index, "n_dict", key="op_name")
@@ -353,7 +353,9 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
             result_item.append(err_msg)
             result_item = stack_column_process(result_item, has_stack, index, key, npu_stack_info)
             if dump_mode == Const.ALL:
-                result_item.append(safe_get_value(npu_data_name, n_start + index, "npu_data_name"))
+                npu_data_name = safe_get_value(npu_data_name_list, n_start + index, "npu_data_name_list")
+                bench_data_name = safe_get_value(bench_data_name_list, n_start + index, "bench_data_name_list")
+                result_item.append([npu_data_name, bench_data_name])
 
             result.append(result_item)
 
@@ -388,7 +390,9 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
                 result_item.append(err_msg)
                 result_item = stack_column_process(result_item, has_stack, index, key, npu_stack_info)
                 if dump_mode == Const.ALL:
-                    result_item.append(safe_get_value(npu_data_name, n_start + index, "npu_data_name"))
+                    npu_data_name = safe_get_value(npu_data_name_list, n_start + index, "npu_data_name_list")
+                    bench_data_name = safe_get_value(bench_data_name_list, n_start + index, "bench_data_name_list")
+                    result_item.append([npu_data_name, bench_data_name])
 
                 result.append(result_item)
 
@@ -467,7 +471,7 @@ def get_un_match_accuracy(result, n_dict, dump_mode):
         result_item.append(err_msg)
         append_stack_info(result_item, npu_stack_info, index)
         if dump_mode == Const.ALL and result_item[1] == CompareConst.N_A:
-            result_item.extend(["-1"])
+            result_item.extend([["-1", "-1"]])
         result.append(result_item)
 
 
diff --git a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
index 2cd98b12568..4c56419dcb1 100644
--- a/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
+++ b/debug/accuracy_tools/msprobe/core/data_dump/data_processor/pytorch_processor.py
@@ -145,7 +145,7 @@ class PytorchDataProcessor(BaseDataProcessor):
         if data.is_meta:
             return tensor_stat
         data_clone = data.detach()
-        if data_clone.numel() == 0:
+        if not data_clone.numel() or not data_clone.data_ptr():
             return tensor_stat
         else:
             if data_clone.device.type == Const.CPU_LOWERCASE or not async_dump:
@@ -230,7 +230,7 @@ class PytorchDataProcessor(BaseDataProcessor):
         if isinstance(element, dist.ProcessGroup):
             return self._analyze_process_group(element)
         if isinstance(element, dist.P2POp):
-            return self._analyze_p2pop(element)
+            return self._analyze_p2pop(element, Const.SEP.join([str(suffix) for suffix in suffix_stack]))
         if isinstance(element, dist.ReduceOp):
             return self._analyze_reduce_op(element)
         converted_numpy, numpy_type = self._convert_numpy_to_builtin(element)
@@ -249,10 +249,10 @@ class PytorchDataProcessor(BaseDataProcessor):
             module_input_output.update_output_with_args_and_kwargs()
         return super().analyze_forward_output(name, module, module_input_output)
 
-    def _analyze_p2pop(self, arg):
+    def _analyze_p2pop(self, arg, suffix):
         p2pop_info = {"class_type": "torch.distributed.P2POp"}
         try:
-            tensor_info = self._analyze_tensor(arg.tensor, [])
+            tensor_info = self._analyze_tensor(arg.tensor, suffix)
             p2pop_info.update({"tensor": tensor_info})
             p2pop_info.update({"op": arg.op.__name__})
             p2pop_info.update({"peer": arg.peer})
diff --git a/debug/accuracy_tools/msprobe/docs/02.config_introduction.md b/debug/accuracy_tools/msprobe/docs/02.config_introduction.md
index f134bd45362..a5f17637dae 100644
--- a/debug/accuracy_tools/msprobe/docs/02.config_introduction.md
+++ b/debug/accuracy_tools/msprobe/docs/02.config_introduction.md
@@ -12,23 +12,23 @@
 
 | 参数    | 解释                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       | 是否必选 |
 | ----------------- |------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| -------- |
-| task              | dump 的任务类型，str 类型。可选参数：<br/>  "statistics"：仅采集统计信息，默认值；<br/> "tensor"：采集统计信息和完全复刻整网的真实数据；<br/> "run_ut"：精度预检，仅 PyTorch 场景支持，采集数据时勿选；<br/> "overflow_check"：溢出检测；<br/>  "free_benchmark"：无标杆比对；<br/>  "grad_probe"：梯度监控； <br/> "structure"：仅采集模型结构以及调用栈信息，不采集具体数据。 <br/> 根据 task 参数取值的不同，可以配置不同场景参数，详见：<br/>[1.2 task 配置为 statistics](#12-task-配置为-statistics)，<br/>[1.3 task 配置为 tensor](#13-task-配置为-tensor)，<br/>[1.4 task 配置为 run_ut](#14-task-配置为-run_ut)，<br/>[1.5 task 配置为 overflow_check](#15-task-配置为-overflow_check)，<br/>[1.6 task 配置为 free_benchmark](#16-task-配置为-free_benchmark)，<br/>[1.7 task 配置为 grad_probe](#17-task-配置为-grad_probe)。 <br/>  **配置示例**："task": "tensor"。 | 否       |
+| task              | dump 的任务类型，str 类型。可选参数：<br/>  "statistics"：仅采集统计信息，默认值；<br/> "tensor"：采集统计信息和完全复刻整网的真实数据；<br/> "run_ut"：精度预检，仅 PyTorch 场景支持，采集数据时勿选；<br/> "overflow_check"：溢出检测；<br/>  "free_benchmark"：无标杆比对，不支持 MSAdapter 场景；<br/>  "grad_probe"：梯度监控， 不支持 MSAdapter 场景； <br/> "structure"：仅采集模型结构以及调用栈信息，不采集具体数据。 <br/> 根据 task 参数取值的不同，可以配置不同场景参数，详见：<br/>[1.2 task 配置为 statistics](#12-task-配置为-statistics)，<br/>[1.3 task 配置为 tensor](#13-task-配置为-tensor)，<br/>[1.4 task 配置为 run_ut](#14-task-配置为-run_ut)，<br/>[1.5 task 配置为 overflow_check](#15-task-配置为-overflow_check)，<br/>[1.6 task 配置为 free_benchmark](#16-task-配置为-free_benchmark)，<br/>[1.7 task 配置为 grad_probe](#17-task-配置为-grad_probe)。 <br/>  **配置示例**："task": "tensor"。 | 否       |
 | dump_path         | 设置 dump 数据目录路径，str 类型。<br/>  **配置示例**："dump_path": "./dump_path"。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        | 是       |
 | rank              | 指定对某张卡上的数据进行采集，list[Union[int, str]] 类型，默认未配置（表示采集所有卡的数据），应配置元素为 ≥0 的整数或类似"4-6"的字符串，且须配置实际可用的 Rank ID。<br/>  PyTorch 场景: Rank ID 从 0 开始计数，最大取值为所有节点可用卡总数-1，若所配置的值大于实际训练所运行的卡的 Rank ID，则 dump 数据为空，比如当前环境 Rank ID 为 0 到 7，实际训练运行 0 到 3 卡，此时若配置 Rank ID 为 4 或不存在的 10 等其他值，dump 数据为空。<br/>  MindSpore 场景：所有节点的 Rank ID 均从 0 开始计数，最大取值为每个节点可用卡总数-1，config.json 配置一次 rank 参数对所有节点同时生效。<br/> 注意，单卡训练时，rank必须为[]，即空列表，不能指定rank。<br/>**配置示例**："rank": [1, "4-6"]。                                                                                                                                                                                                                                | 否       |
 | step              | 指定采集某个 step 的数据，list[Union[int, str]] 类型。默认未配置，表示采集所有 step 数据。采集特定 step 时，须指定为训练脚本中存在的 step，可逐个配置，也可以指定范围。<br/>  **配置示例**："step": [0, 1 , 2, "4-6"]。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 否       |
-| level             | dump 级别，str 类型，根据不同级别采集不同数据。可选参数：<br/>"L0"：dump 模块级精度数据，仅 PyTorch 与 MindSpore 动态图场景支持，使用背景详见 [1.1.1 模块级精度数据 dump 说明](#111-模块级精度数据-dump-说明)；<br/>"L1"：dump API 级精度数据，默认值，仅 PyTorch 与 MindSpore 动态图场景支持；<br/>"L2"：dump kernel 级精度数据，PyTorch场景详细介绍见 [PyTorch 场景的 kernel dump 说明](./04.kernel_dump_PyTorch.md)；MindSpore场景详细介绍见 [MindSpore 场景的 kernel dump 说明](./28.kernel_dump_MindSpore.md)；<br/>"mix"：dump module 模块级和 API 级精度数据，即"L0"+"L1"，仅 PyTorch 与 MindSpore 动态图场景支持。<br/>"debug"：单点保存功能，细节详见[单点保存工具 README](./28.debugger_save_instruction.md)<br/>  **配置示例**："level": "L1"。                                                                                                                                                                                                                                                                 | 否 |
+| level             | dump 级别，str 类型，根据不同级别采集不同数据。可选参数：<br/>"L0"：dump 模块级精度数据，仅 PyTorch、MSAdapter 以及 MindSpore 动态图场景支持，使用背景详见 [1.1.1 模块级精度数据 dump 说明](#111-模块级精度数据-dump-说明)；<br/>"L1"：dump API 级精度数据，默认值，仅 PyTorch、MSAdapter 以及 MindSpore 动态图场景支持；<br/>"L2"：dump kernel 级精度数据，PyTorch 场景详细介绍见 [PyTorch 场景的 kernel dump 说明](./04.kernel_dump_PyTorch.md)；MindSpore 动态图场景详细介绍见 [MindSpore 动态图场景的 kernel dump 说明](./28.kernel_dump_MindSpore.md)；MindSpore 静态图场景详细介绍见《MindSpore 场景的数据采集》中的 ["**8.1 静态图场景**"](./06.data_dump_MindSpore.md#81-静态图场景)小节；<br/>"mix"：dump module 模块级和 API 级精度数据，即"L0"+"L1"，仅 PyTorch、MSAdapter 以及 MindSpore 动态图场景支持。<br/>"debug"：单点保存功能，细节详见[单点保存工具 README](./28.debugger_save_instruction.md)<br/>  **配置示例**："level": "L1"。                                                                                                                                                                                                                                                                 | 否 |
 | enable_dataloader | 自动控制开关，bool 类型，仅 PyTorch 场景支持。可选参数 true（开启）或 false（关闭），默认为 false。配置为 true 后自动识别 step 参数指定的迭代，并在该迭代执行完成后退出训练，此时 start、stop 和 step 函数可不配置，开启该开关要求训练脚本是通过 torch.utils.data.dataloader 方式加载数据。仅支持 PyTorch 单卡训练使用，分布式训练场景下存在数据 dump 不全问题。 **这个特性下个版本将被废弃**                                                                                                                                                                                                                                                                                                                                                                                                                                    | 否       |
 | async_dump        | 异步 dump 开关，bool 类型。可选参数 true（开启）或 false（关闭），默认为 false。配置为 true 后开启异步 dump，即采集的精度数据会在当前 step 训练结束后统一落盘，训练过程中工具不触发同步操作。由于使用该模式有**显存溢出**的风险，当 task 配置为 tensor 时，即真实数据的异步dump模式，必须配置 [list](#13-task-配置为-tensor) 参数，指定需要 dump 的 tensor 。该模式暂不支持复数类型 tensor <br/>的统计量计算。                                                                                                                                                                                                                                                                                                                                                                                                                      | 否       |
 
 #### 1.1.1 模块级精度数据 dump 说明
 
-仅 PyTorch 与 MindSpore 动态图场景支持。
+仅 PyTorch、MSAdapter以及 MindSpore 动态图场景支持。
 
 大模型场景下，通常不是简单的利用自动迁移能力实现从 GPU 到 NPU 的训练脚本迁移，而是会对 NPU 网络进行一系列针对性的适配，因此，常常会造成迁移后的 NPU 模型存在部分子结构不能与 GPU 原始模型完全对应。模型结构不一致导致 API 调用类型及数量不一致，若直接按照 API 粒度进行精度数据 dump 和比对，则无法完全比对所有的 API。
 
 本小节介绍的功能是对模型中的大粒度模块进行数据 dump，使其比对时，对于无法以 API 粒度比对的模块可以直接以模块粒度进行比对。
 
-模块指的是继承 nn.Module 类（PyTorch场景）或 nn.Cell 类（MindSpore场景）的子类，通常情况下这类模块就是一个小模型，可以被视为一个整体，dump 数据时以模块为粒度进行 dump。
+模块指的是继承 nn.Module 类（PyTorch 与 MSAdapter 场景）或 nn.Cell 类（MindSpore 场景）的子类，通常情况下这类模块就是一个小模型，可以被视为一个整体，dump 数据时以模块为粒度进行 dump。
 
 
@@ -36,21 +36,23 @@
 
 <table>
     <tr><th>参数</th><th>解释</th><th>是否必选</th></tr>
-    <tr><td>scope</td><td>PyTorch 和 MindSpore 动态图场景 dump 范围，list[str] 类型，默认未配置（list 也未配置时表示 dump 所有 API 的数据）。该参数可以在 [ ] 内配置两个模块名或 API 名，要求列表长度必须为2，需要配置按照工具命名格式的完整模块名或API名称，用于锁定区间，dump 该范围内的数据。<br/><b>配置示例</b>：
+    <tr><td>scope</td><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景 dump 范围，list[str] 类型，默认未配置（list 也未配置时表示 dump 所有 API 的数据）。该参数可以在 [ ] 内配置两个模块名或 API 名，要求列表长度必须为2，需要配置按照工具命名格式的完整模块名或API名称，用于锁定区间，dump 该范围内的数据。<br/><b>配置示例</b>：
     "scope": ["Module.conv1.Conv2d.forward.0", "Module.fc2.Linear.forward.0"],
     或 "scope": ["Cell.conv1.Conv2d.forward.0", "Cell.fc2.Dense.backward.0"], 或"scope": ["Tensor.add.0.forward", "Functional.square.2.forward"]。与 level 参数取值相关，level 为 L0 级别时，可配置模块名；level 为 L1 级别时，可配置 API 名， level为 mix 级别时，可配置为模块名或API名。</td><td>否</td></tr>
     <tr><td rowspan="4">list</td><td>自定义采集的算子列表，list[str] 类型，默认未配置（scope 也未配置时表示 dump 所有 API 的数据），包含以下配置方法：</td><td rowspan="4">否</td></tr>
-    <tr><td>PyTorch 和 MindSpore 动态图场景配置具体的 API 全称，dump 该 API 数据。在 PyTorch 场景，如果 level 配置成 L2，该配置为必填项。<br/><b>配置示例</b>："list": ["Tensor.permute.1.forward", "Tensor.transpose.2.forward", "Torch.relu.3.backward"]。<br/> PyTorch 和 MindSpore 动态图场景在level为 mix 级别时可以配置模块名称，dump该模块展开数据 （dump该模块从执行开始到执行结束期间的所有数据）。
+    <tr><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景配置具体的 API 全称，dump 该 API 数据。在 PyTorch 场景，如果 level 配置成 L2，该配置为必填项。<br/><b>配置示例</b>："list": ["Tensor.permute.1.forward", "Tensor.transpose.2.forward", "Torch.relu.3.backward"]。<br/> PyTorch 和 MindSpore 动态图场景在level为 mix 级别时可以配置模块名称，dump该模块展开数据 （dump该模块从执行开始到执行结束期间的所有数据）。
     <br/><b>配置示例</b>："list": ["Module.module.language_model.encoder.layers.0.mlp.ParallelMlp.forward.0"], 或 "list": ["Cell.network_with_loss.language_model.encoder.layers.0.mlp.ParallelMlp.forward.0"]</td></tr>
-    <tr><td>PyTorch 和 MindSpore 动态图场景指定某一类 API，dump 某一类的 API 级别输入输出数据。<br/><b>配置示例</b>："list": ["relu"]。 <br/>    PyTorch 和 MindSpore 动态图场景在level为 mix 级别时, 会dump名称中包含list中配置的字符串的API数据，还会将名称中包含list中配置的字符串的模块进行展开dump （dump该模块从执行开始到执行结束期间的所有数据）。</td></tr>
-    <tr><td>MindSpore 静态图场景配置 kernel_name，可以是算子的名称列表，也可以指定算子类型（"level": "L2"时不支持），还可以配置算子名称的正则表达式（当字符串符合“name-regex(xxx)”格式时，后台则会将其作为正则表达式。<br/><b>配置示例</b>：list: ["name-regex(Default/.+)"]<br/>可匹配算子名称以“Default/”开头的所有算子。</td></tr>
+    <tr><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景指定某一类 API，dump 某一类的 API 级别输入输出数据。<br/><b>配置示例</b>："list": ["relu"]。 <br/>    PyTorch、MSAdapter 以及 MindSpore 动态图场景在level为 mix 级别时, 会dump名称中包含list中配置的字符串的API数据，还会将名称中包含list中配置的字符串的模块进行展开dump （dump该模块从执行开始到执行结束期间的所有数据）。</td></tr>
+    <tr><td>MindSpore 静态图场景配置 kernel_name，可以是算子的名称列表，也可以指定算子类型（jit_level=O2 时不支持），还可以配置算子名称的正则表达式（当字符串符合“name-regex(xxx)”格式时，后台则会将其作为正则表达式。<br/><b>配置示例</b>：list: ["name-regex(Default/.+)"]<br/>可匹配算子名称以“Default/”开头的所有算子。</td></tr>
     <tr><td rowspan="3">data_mode</td><td>dump 数据过滤，str 类型。</td><td rowspan="3">否</td></tr>
-    <tr><td>PyTorch 与 MindSpore 动态图场景：支持"all"、"forward"、"backward"、"input"和"output"，除"all"外，其余参数可以自由组合。默认为["all"]，即保存所有 dump 的数据。<br/> <b>配置示例</b>："data_mode": ["backward"] （仅保存反向数据）或 "data_mode": ["forward", "input"]（仅保存前向的输入数据）。</td></tr>
+    <tr><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景：支持"all"、"forward"、"backward"、"input"和"output"，除"all"外，其余参数可以自由组合。默认为["all"]，即保存所有 dump 的数据。<br/> <b>配置示例</b>："data_mode": ["backward"] （仅保存反向数据）或 "data_mode": ["forward", "input"]（仅保存前向的输入数据）。</td></tr>
     <tr><td>MindSpore 静态图场景：仅支持"all"、"input"和"output"参数，且各参数只能单独配置，不支持自由组合。<br/><b>配置示例</b>："data_mode": ["all"]。</td></tr>
-    <tr><td rowspan="2">summary_mode</td><td>控制 dump 文件输出的模式，str 类型，仅 PyTorch 与 MindSpore 动态图场景支持，可选参数：<br/> md5：dump 输出包含 CRC-32 值以及 API 统计信息的 dump.json 文件，用于验证数据的完整性；<br/> statistics：dump 仅输出包含 API 统计信息的 dump.json 文件，默认值。<br/><b>配置示例</b>："summary_mode": "md5"。</td><td rowspan="2">否</td><tr><td>MindSpore静态图jit_level=O2场景L2级dump，支持上述配置的同时额外支持配置统计项列表，可选统计项为max、min、mean、l2norm，可从中任意选取组合搭配。其中mean、l2norm的结果为float数据格式。<br/><b>配置示例</b>："summary_mode": ["max", "min"]。</td></tr></tr>
+    <tr><td rowspan="3">summary_mode</td><td>控制 dump 文件输出的模式，str 类型，支持 PyTorch、MSAdapter、MindSpore 动态图以及 MindSpore 静态图 jit_level=O2 场景。</td><td rowspan="3">否</td></tr>
+    <tr><td>PyTorch、MSAdapter 以及 MindSpore 动态图场景：可选参数为<br/> md5：dump 输出包含 CRC-32 值以及 API 统计信息的 dump.json 文件，用于验证数据的完整性；<br/> statistics：dump 仅输出包含 API 统计信息的 dump.json 文件，默认值。<br/><b>配置示例</b>："summary_mode": "md5"。</td></tr>
+    <tr><td>MindSpore 静态图 jit_level=O2 场景：支持上述配置的同时额外支持配置统计项列表，可选统计项为max、min、mean、l2norm，可从中任意选取组合搭配。其中mean、l2norm的结果为float数据格式。<br/><b>配置示例</b>："summary_mode": ["max", "min"]。</td></tr>
 </table>
 
-**说明**："summary_mode"配置为"md5"时，所使用的校验算法为CRC-32算法。
+**说明**："summary_mode" 配置为 "md5" 时，所使用的校验算法为 CRC-32 算法。
 
 ### 1.3 task 配置为 tensor
 
@@ -86,16 +88,16 @@
 
 ### 1.5 task 配置为 overflow_check
 
-PyTorch 与 MindSpore 动态图场景下，"level"须为"L0"或"L1"；MindSpore 静态图场景下，"level"须为"L2"，且模型编译优化等级（jit_level）须为"O2"。
+PyTorch、MSAdapter 以及 MindSpore 动态图场景下，"level"须为"L0"或"L1"；MindSpore 静态图场景下，"level"须为"L2"，且模型编译优化等级（jit_level）须为"O2"。
 
 | 参数        | 解释                 | 是否必选 |
 | ------------- | ---------------------- | -------- |
 | overflow_nums | 最大溢出次数，int 类型，默认为 1，仅 PyTorch 与 MindSpore 动态图场景支持。表示第 N 次溢出后，不再进行溢出检测。过程中检测到溢出 API 对应的 输入输出 数据均 dump。<br/>**配置示例**："overflow_nums": 3。配置为 -1 时，表示持续检测溢出直到训练结束。 | 否       |
-| check_mode    | 溢出类型，str 类型，仅 MindSpore 场景支持，可选参数：<br/>"aicore"：开启 AI Core 的溢出检测，不支持 MindSpore v2.3.0 以上版本；<br/>"atomic"：开启 Atomic 的溢出检测，不支持 MindSpore v2.3.0 以上版本；<br/>"all"：开启算子的溢出检测，默认值。<br/>**配置示例**："check_mode": "all"。 | 否       |
+| check_mode    | 溢出类型，str 类型，仅 MindSpore v2.3.0 以下版本的静态图场景支持，可选参数：<br/>"aicore"：开启 AI Core 的溢出检测；<br/>"atomic"：开启 Atomic 的溢出检测；<br/>"all"：开启算子的溢出检测，默认值。<br/>**配置示例**："check_mode": "all"。 | 否       |
 
 ### 1.6 task 配置为 free_benchmark
 
-仅 PyTorch 场景与 MindSpore 动态图场景支持，且"level"为"L1"。
+仅 PyTorch 与 MindSpore 动态图场景支持，且"level"为"L1"。
 
 - task 配置为 free_benchmark 时，开启**无标杆比对**，在 NPU 环境下通过对当前模型 API 的输入添加扰动因子，二次执行，将得到的输出与未添加扰动因子前的输出进行比对，从而**得出该模型中可能存在因迁移等变化导致精度降低的 API**。
 
diff --git a/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md b/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
index c2e33436e53..e45be7736b9 100644
--- a/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
+++ b/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
@@ -355,7 +355,7 @@ if __name__ == "__main__":
 ```
 * `rank`：设备 ID，每张卡的数据保存在对应的 `rank{ID}` 目录下。非分布式场景下没有 rank ID，目录名称为 rank。
 * `dump_tensor_data`：保存采集到的张量数据。
-* `dump.json`： 保存API或Module前反向数据的统计量信息。包含dump数据的API名称或Module名称，各数据的dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置summary_mode="md5"时的CRC-32数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#1-dumpjson文件介绍pytorch)。
+* `dump.json`： 保存API或Module前反向数据的统计量信息。包含dump数据的API名称或Module名称，各数据的dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置summary_mode="md5"时的CRC-32数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#1-PyTorch场景下的dump.json文件)。
 * `stack.json`：API/Module的调用栈信息。
 * `construct.json`：分层分级结构，level为L1时，construct.json内容为空。
 
diff --git a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
index 96d37c170fa..158c5e3011e 100644
--- a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
@@ -372,7 +372,7 @@ dump 结果目录结构示例如下：
 
 * `rank`：设备 ID，每张卡的数据保存在对应的 `rank{ID}` 目录下。非分布式场景下没有 rank ID，目录名称为 rank。
 * `dump_tensor_data`：保存采集到的张量数据。
-* `dump.json`： 保存API或Cell前反向数据的统计量信息。包含dump数据的API名称或Cell名称，各数据的dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置summary_mode="md5"时的CRC-32数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#2-dumpjson文件示例mindspore)。
+* `dump.json`： 保存API或Cell前反向数据的统计量信息。包含dump数据的API名称或Cell名称，各数据的dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置summary_mode="md5"时的CRC-32数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#2-MindSpore场景下的dump.json文件)。
 * `stack.json`：API/Cell的调用栈信息。
 * `construct.json`：分层分级结构，level为L1时，construct.json内容为空。
 
diff --git a/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md b/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
index a5f83d8dfcb..6f886215b0a 100644
--- a/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
+++ b/debug/accuracy_tools/msprobe/docs/10.accuracy_compare_PyTorch.md
@@ -257,11 +257,11 @@ PyTorch 精度比对是以 CPU 或 GPU 的计算结果为标杆，通过计算
 
 统计量有 4 种：最大值（max）、最小值（min）、平均值（mean）和 L2-范数（L2 norm）。
 
-|dump 数据模式|Cosine (tensor 余弦相似度)|EucDist (tensor 欧式距离)|MaxAbsErr (tensor 最大绝对误差)|MaxRelativeErr (tensor 最大相对误差)|One Thousandth Err Ratio (tensor 相对误差小于千分之一的比例)|Five Thousandth Err Ratio (tensor 相对误差小于千分之五的比例)|NPU 和 bench 的统计量绝对误差 (max, min, mean, L2 norm) diff| NPU 和 bench 的统计量相对误差 (max, min, mean, L2 norm) RelativeErr |NPU 和 bench 的统计量 (max, min, mean, L2 norm)|NPU MD5 (NPU 数据 CRC-32 值)|BENCH MD5 (bench 数据 CRC-32 值)|Result (比对结果)|Accuracy Reached or Not (计算精度是否达标)|Err_message (错误信息提示)|NPU_Stack_Info (堆栈信息)|Data_Name (NPU 真实数据名)|
-|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
-|真实数据模式|√|√|√|√|√|√|||√||||√|√|√|√|
-|统计数据模式|||||||√|√|√|||√||√|√||
-|MD5 模式||||||||||√|√|√|||√||
+|dump 数据模式|Cosine (tensor 余弦相似度)|EucDist (tensor 欧式距离)|MaxAbsErr (tensor 最大绝对误差)|MaxRelativeErr (tensor 最大相对误差)|One Thousandth Err Ratio (tensor 相对误差小于千分之一的比例)|Five Thousandth Err Ratio (tensor 相对误差小于千分之五的比例)|NPU 和 bench 的统计量绝对误差 (max, min, mean, L2 norm) diff| NPU 和 bench 的统计量相对误差 (max, min, mean, L2 norm) RelativeErr |NPU 和 bench 的统计量 (max, min, mean, L2 norm)|NPU MD5 (NPU 数据 CRC-32 值)|BENCH MD5 (bench 数据 CRC-32 值)|Result (比对结果)|Accuracy Reached or Not (计算精度是否达标)|Err_message (错误信息提示)|NPU_Stack_Info (堆栈信息)| Data_Name ([NPU真实数据名，Bench真实数据名]) |
+|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---------------------------------:|
+|真实数据模式|√|√|√|√|√|√|||√||||√|√|√|                 √                 |
+|统计数据模式|||||||√|√|√|||√||√|√|                                   |
+|MD5 模式||||||||||√|√|√|||√|                                   |
 
 上表中NPU_Stack_Info字段需要配置-s参数生成。
 
diff --git a/debug/accuracy_tools/msprobe/docs/19.monitor.md b/debug/accuracy_tools/msprobe/docs/19.monitor.md
index 1c197ba5496..fa1b7d06d6c 100644
--- a/debug/accuracy_tools/msprobe/docs/19.monitor.md
+++ b/debug/accuracy_tools/msprobe/docs/19.monitor.md
@@ -107,6 +107,37 @@ monitor.set_monitor(
 ) 
 ```
 
+请注意以下两点：
+- Mindspore功能在1.2.2版本后支持, <1.2.2版本不支持
+- 上述接口使用方式为1.2.2后更新的最新接口使用方式, <1.2.2版本的Pytorch旧接口使用方式为：
+```Python
+from msprobe.pytorch import TrainerMon
+monitor = TrainerMon(
+    config_file_path="./monitor_config.json",
+    params_have_main_grad=True,  # 权重是否使用main_grad，通常megatron为True，deepspeed为False。默认为True。
+    opt_ty=None  # 优化器类型，默认为None，具体取值参考公开接口
+) 
+monitor.set_wrapped_optimizer(optimizer)
+# 挂载监控对象
+monitor.monitor_gnorm_with_ad(
+    model,
+    grad_acc_steps=args.global_batch_size//args.data_parallel_size//args.micro_batch_size,
+    optimizer=optimizer,
+    dp_group=None,
+    tp_group=None,
+    start_iteration=0  # 断点续训时提供当前iteration，默认从0开始
+) 
+```
+
+具体接口变更说明如下：
+
+| 变更        | 说明                                                                                                        |
+|-----------|-----------------------------------------------------------------------------------------------------------|
+| 初始化接口统一精简 | TrainerMon.__init__(config_file_path, process_group=None, param_have_main_grad=True), 去除了需用户手动传入的opt_ty参数 |
+| 主调接口修改    | 从monitor_gnorm_with_ad(...)改名为set_monitor(...)， 且此时optimizer从可选项改为必传项                                     |
+| 优化器包装接口废除 | set_wrapped_optimizer接口废除， optimizer传入由set_monitor主调完成                                                    |
+
+**其中老版接口目前仍能使用，但预计将在2026年废弃，请及时更新到最新版使用方式**
 
 ### 权重监控
 - 工具配置示例：
@@ -434,14 +465,16 @@ if {some condition}:
 ## 公开接口
 - monitor工具初始化
 ```python
-TrainerMon.__init__(config_file_path, process_group=None, params_have_main_grad=True) -> None
+TrainerMon.__init__(config_file_path, process_group=None, params_have_main_grad=True, opt_ty=None) -> None
 ```
 
-| 参数                  | 说明                                                         | 是否必选 |
-| --------------------- | ------------------------------------------------------------ | -------- |
-| config_file_path      | json配置文件路径。                                           | 是       |
-| process_group         | 传入ProcessGroup对象，用以确定pipeline并行不同rank异常间时序，megatron下通过core.parallel_state.get_pipeline_model_parallel_group()获得。仅在异常时序判断功能中使用。 | 否       |
-| params_have_main_grad | 权重是否使用main_grad，通常megatron为True，deepspeed为False。默认为True。 | 否       |
+| 参数                  | 说明                                                                                                                                                                                                                                                                                                                                                                                                                                    | 是否必选 |
+| --------------------- |---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------|
+| config_file_path      | json配置文件路径。                                                                                                                                                                                                                                                                                                                                                                                                                           | 是    |
+| process_group         | 传入ProcessGroup对象，用以确定pipeline并行不同rank异常间时序，megatron下通过core.parallel_state.get_pipeline_model_parallel_group()获得。仅在异常时序判断功能中使用。                                                                                                                                                                                                                                                                                                        | 否    |
+| params_have_main_grad | 权重是否使用main_grad，通常megatron为True，deepspeed为False。默认为True。                                                                                                                                                                                                                                                                                                                                                                              | 否    |
+| opt_ty                | 优化器类型，默认为None。**该参数将在26年废除，只需在版本<msprobe1.2.2时传入**，值选项可为<br/>-Megatron_DistributedOptimizer：megatron分布式优化器；<br/>-Megatron_Float16OptimizerWithFloat16Params：megatron混合精度优化器；<br/>-Megatron_ChainedDistributedOptimizer：megatron分布式优化器序列；<br/>-Megatron_ChainedFloat16OptimizerWithFloat16Params：megatron混合精度优化器序列；<br/>-DeepSpeedZeroOptimizer_Stage1_or_2：DeepSpeed Zero1和Zero2；<br/>-DeepSpeedZeroOptimizer_Stage3：DeepSpeed Zero3。 | 否    |
+
 
 - 模型挂载monitor工具
 ```python
@@ -451,7 +484,7 @@ TrainerMon.set_monitor(model, grad_acc_steps, optimizer, dp_group=None, tp_group
 | --------------- | ------------------------------------------------------------ | -------- |
 | model           | 需要监控的模型，需要是一个torch.nn.Module或者mindspore.nn.Cell。 | 是       |
 | grad_acc_steps  | 梯度累积步数。                                               | 是       |
-| optimizer       | 需要patch的优化器。                                          | 否       |
+| optimizer       | 需要patch的优化器。                                          | 是       |
 | dp_group        | 数据并行的通信组。<br>dp域通信后，且没有使用分布式优化器时，group内所有rank的梯度相同，落盘数据冗余。<br>提供dp_group后，工具仅保留每个dp_group的第一个rank的梯度。 | 否       |
 | tp_group        | 张量并行的通信组。<br/>tp域通信后，group内部分参数所有rank的梯度相同，落盘数据冗余。<br/>提供tp_group后，工具仅保留每个tp_group中冗余参数在第一个rank的梯度。<br/>当前适配Megatron core_r0.6.0, 通过权重属性"tensor_model_parallel"判断是否冗余。 | 否       |
 | start_iteration | 训练的起始iteration，影响工具计数。**仅PyTorch场景支持此参数**。 | 否       |
@@ -486,6 +519,25 @@ TrainerMon.generate_xy_metrics() -> tuple[dict, dict]
 actv, actv_grad = monitor.generate_xy_metrics()
 ```
 
+- 老版接口说明， **将在26年废弃**：
+```python 
+TrainerMon.set_wrapped_optimizer(optimizer) -> None
+```
+| 参数        | 说明                            | 是否必选 |
+|-----------|-------------------------------|------|
+| optimizer | megatron、deepspeed创建好的混合精度优化器 | 是    |
+
+```python 
+TrainerMon.monitor_gnorm_with_ad(model, grad_acc_steps, optimizer, dp_group, tp_group, start_iteration) -> None
+```
+| 参数            | 说明                                                         | 是否必选 |
+| --------------- | ------------------------------------------------------------ | -------- |
+| model           | 需要监控的模型，需要是一个torch.nn.Module或者mindspore.nn.Cell。 | 是       |
+| grad_acc_steps  | 梯度累积步数。                                               | 是       |
+| optimizer       | 需要patch的优化器。                                          | 否       |
+| dp_group        | 数据并行的通信组。<br>dp域通信后，且没有使用分布式优化器时，group内所有rank的梯度相同，落盘数据冗余。<br>提供dp_group后，工具仅保留每个dp_group的第一个rank的梯度。 | 否       |
+| tp_group        | 张量并行的通信组。<br/>tp域通信后，group内部分参数所有rank的梯度相同，落盘数据冗余。<br/>提供tp_group后，工具仅保留每个tp_group中冗余参数在第一个rank的梯度。<br/>当前适配Megatron core_r0.6.0, 通过权重属性"tensor_model_parallel"判断是否冗余。 | 否       |
+| start_iteration | 训练的起始iteration，影响工具计数。**仅PyTorch场景支持此参数**。 | 否       |
 
 
 ##  详细配置
@@ -526,33 +578,33 @@ actv, actv_grad = monitor.generate_xy_metrics()
 
 下面详细解释各个字段：
 
-| 字段名字                | 是否必选 | 解释                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
-| ----------------------- | -------- |---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
-| "targets"               | 可选     | 指定需要监控的模型层和监控对象， 例如transformer的第0层language_model.encoder.layers.0，可选择监控input、output、input_grad、output_grad。如果不清楚模型结构， 可以将 "print_struct" 字段设置为 true， 监控工具会打印模型中torch module的名字和详细结构，并在第1个step后退出。未配置时默认为全量监控。                                                                                                                                                                                                                                                                                                                                                                   |
-| "input"                 | 可选     | "tuple[2]:0"的意思是目标module的前向input参数为长度为2的tuple， 我们关心的是tuple第0个元素。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
-| "output"                | 必选     | "tensor"的意思是目标module的前向output参数类型为tensor                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
-| "input_grad"            | 可选     | "tuple[2]:0"的意思是目标module的后向input_grad参数是长度为2的tuple， 我们关心的是tuple的第0个元素。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
-| "output_grad"           | 必选     | "tuple[1]:0"的意思是目标module的后向input_grad参数是长度为1的tuple， 我们关心的是tuple的第0个元素。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
-| "dynamic_on"            | 可选     | 在动态启停时使用，true代表打开监控，false代表关闭监控，默认值为false，且达到collect_times之后会自动将该值置为false待下次改true重启。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
-| "collect_times"         | 可选     | 设置采集次数，达到该次数后停止监控，默认值为100000000，目的是一直采集。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| "start_step"            | 可选     | 设置开始采集step，模型训练达到start_step后开始监控采集，默认值为0，表示从step0开始监控采集。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| "step_interval"         | 可选     | 设置采集step间隔，默认值为1，表示每个step均采集监控数据。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |
-| "print_struct"          | 可选     | 设置为true后监控工具会打印模型中torch module的名字和详细结构，并在第1个step后退出。不填默认为false。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             |
-| "module_ranks"          | 可选     | 用于在分布式训练场景中希望控制在哪些rank开启module监控。如果不填，则默认在所有rank开启。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             |
-| "ur_distribution"       | 可选     | 若为true则会统计adam优化器指定模块（targets中指定）参数的update和ratio向量的数值分布，并展示在heatmap里，默认为false，同时format字段必须设置为tensorboard。<br/>依赖histc算子， 需要CANN8.0.rc2以上版本， 否则会有严重的性能问题。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                    |
-| "xy_distribution"       | 可选     | 若为true则会监控指定module（targets中指定）的输入输出张量。 默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
-| "all_xy"                | 可选     | 开启xy_distribution后生效，若为true，监控所有module。默认为false。<br/>与targets同时生效，all_xy配置为true时，若targets配置module_xx和指定对象，则module_xx按targets配置生效，其他module则监控全部对象，包含input、output、input_grad、output_grad。                                                                                                                                                                                                                                                                                                                                                                                         |
-| "forward_only"          | 可选     | 开启xy_distribution后生效，若为true，仅监控指定module的前向，targets中的input_grad、output_grad不生效。默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |
-| "backward_only"         | 可选     | 开启xy_distribution后生效，若为true，仅监控指定module的反向，targets中的input、output不生效。默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |
-| "mv_distribution"       | 可选     | 若为true则会监控指定模块中的参数的优化器状态， 默认为false。需要在TrainerMon构造函数正确指定opt_ty。 目前支持megatron和Deepspeed的分布式优化器。<br/>-Megatron_DistributedOptimizer：megatron分布式优化器；<br/>-Megatron_Float16OptimizerWithFloat16Params：megatron混合精度优化器；<br/>-Megatron_ChainedDistributedOptimizer：megatron分布式优化器序列；<br/>-Megatron_ChainedFloat16OptimizerWithFloat16Params：megatron混合精度优化器序列；<br/>-DeepSpeedZeroOptimizer_Stage0：DeepSpeed Zero0<br/>-DeepSpeedZeroOptimizer_Stage1_or_2：DeepSpeed Zero1和Zero2；<br/>-DeepSpeedZeroOptimizer_Stage3：DeepSpeed Zero3。<br/>未使用megatron和deepspeed框架时，opt_ty默认为None，无需传入。 |
-| "wg_distribution"       | 可选     | 若为true则会监控指定模块的参数梯度， 默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
-| "param_distribution"    | 可选     | 若为true则会监控指定模块的参数， 默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| "alert"                 | 可选     | "rules": 指定自动报警的异常检测机制及其相应的阈值。目前实现的异常检测是AnomalyTurbulence， 如果统计标量超出历史均值的指定浮动范围（threshold 0.5意味着上浮或者下浮50%）则在控制台打印报警信息。当"dump"字段配置为true表示异常事件写入文件，默认为false。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                   |
-| "cc_distribution"       | 可选     | 其中"enable"字段控制通信监控模块的开关；需要监控通信算子时，务必尽量早地实例化`TrainerMon`, 因为监控通过劫持原始func后挂hook实现，部分加速库初始化时会保存原始function，避免监控失效。"cc_codeline"字段指定监控的代码行，如:`train.py\\[23\\]`，默认为空列表，不特别指定；"cc_pre_hook"字段控制是否监控通信前的数据； 模块会在第二个optimize.step之前打印通信日志，包括通信api的调用栈、输入dtype、通信group。 "cc_log_only"为true时，仅打印日志，不监控通信的输入输出，并在打印后中断训练。可以根据通信日志设置"cc_codeline"，规避与训练过程不相关的通信，比如一些时间、metrics的同步。**仅PyTorch场景支持此参数**。                                                                                                                                                                                      |
-| "format"                | 可选     | 数据落盘格式，默认值为"csv"，可选 \["csv", "tensorboard", "api"\]。仅PyThon和MindSpore动态图场景支持此参数，且MindSpore动态图场景仅支持\["csv"\]。                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
-| "ops"                   | 可选     | 类型为list，与ur_distribution、xy_distribution、mv_distribution、wg_distribution、mg_direction、cc_distribution配合，监控所选张量的统计指标，目前支持"min"、"max"、"norm"、"mean"、"zeros"、"nans"。其中，zeros代表监控所选张量的元素小于eps的比例，nans代表张量中nan的数量。当ops中无有效指标时，默认监控norm指标。                                                                                                                                                                                                                                                                                                                                            |
-| "eps"                   | 可选     | 若ops里包含"zeros"则需要配置，默认为1e-8。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| "ndigits"               | 可选     | "format"为"csv"时，设置落盘文件中的小数位数，默认为6。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
-| "step_count_per_record" | 可选     | "format"为"csv"时生效，每个csv记录多少个step的数据，默认为1。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       |
-| "append_output"         | 可选     | 适用于断点续训场景。多卡场景下生效，指定两个时间戳，将输出续写到这两个时间戳范围间的输出件中，不在范围内的rank不被续写。时间戳应来自原有输出件目录前缀，例如["Dec03_21-34-40", "Dec03_21-34-41"]。默认为[]，不续写。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                             |
-| "squash_name"           | 可选     | 是否简化参数名/模块名，多模态场景建议关闭，默认为True                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |
+| 字段名字                | 是否必选 | 解释                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
+| ----------------------- | -------- |-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
+| "targets"               | 可选     | 指定需要监控的模型层和监控对象， 例如transformer的第0层language_model.encoder.layers.0，可选择监控input、output、input_grad、output_grad。如果不清楚模型结构， 可以将 "print_struct" 字段设置为 true， 监控工具会打印模型中torch module的名字和详细结构，并在第1个step后退出。未配置时默认为全量监控。                                                                                                                                                                                                                                                                                                                                                                                   |
+| "input"                 | 可选     | "tuple[2]:0"的意思是目标module的前向input参数为长度为2的tuple， 我们关心的是tuple第0个元素。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
+| "output"                | 必选     | "tensor"的意思是目标module的前向output参数类型为tensor                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
+| "input_grad"            | 可选     | "tuple[2]:0"的意思是目标module的后向input_grad参数是长度为2的tuple， 我们关心的是tuple的第0个元素。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
+| "output_grad"           | 必选     | "tuple[1]:0"的意思是目标module的后向input_grad参数是长度为1的tuple， 我们关心的是tuple的第0个元素。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
+| "dynamic_on"            | 可选     | 在动态启停时使用，true代表打开监控，false代表关闭监控，默认值为false，且达到collect_times之后会自动将该值置为false待下次改true重启。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
+| "collect_times"         | 可选     | 设置采集次数，达到该次数后停止监控，默认值为100000000，目的是一直采集。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
+| "start_step"            | 可选     | 设置开始采集step，模型训练达到start_step后开始监控采集，默认值为0，表示从step0开始监控采集。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
+| "step_interval"         | 可选     | 设置采集step间隔，默认值为1，表示每个step均采集监控数据。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
+| "print_struct"          | 可选     | 设置为true后监控工具会打印模型中torch module的名字和详细结构，并在第1个step后退出。不填默认为false。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             |
+| "module_ranks"          | 可选     | 用于在分布式训练场景中希望控制在哪些rank开启module监控。如果不填，则默认在所有rank开启。 列表内rank要求为int类型。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            |
+| "ur_distribution"       | 可选     | 若为true则会统计adam优化器指定模块（targets中指定）参数的update和ratio向量的数值分布，并展示在heatmap里，默认为false，同时format字段必须设置为tensorboard。<br/>依赖histc算子， 需要CANN8.0.rc2以上版本， 否则会有严重的性能问题。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                    |
+| "xy_distribution"       | 可选     | 若为true则会监控指定module（targets中指定）的输入输出张量。 默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
+| "all_xy"                | 可选     | 开启xy_distribution后生效，若为true，监控所有module。默认为false。<br/>与targets同时生效，all_xy配置为true时，若targets配置module_xx和指定对象，则module_xx按targets配置生效，其他module则监控全部对象，包含input、output、input_grad、output_grad。                                                                                                                                                                                                                                                                                                                                                                                                         |
+| "forward_only"          | 可选     | 开启xy_distribution后生效，若为true，仅监控指定module的前向，targets中的input_grad、output_grad不生效。默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |
+| "backward_only"         | 可选     | 开启xy_distribution后生效，若为true，仅监控指定module的反向，targets中的input、output不生效。默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |
+| "mv_distribution"       | 可选     | 若为true则会监控指定模块中的参数的优化器状态， 默认为false。版本<msprobe1.2.2时需要在TrainerMon构造函数正确指定opt_ty。|
+| "wg_distribution"       | 可选     | 若为true则会监控指定模块的参数梯度， 默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
+| "param_distribution"    | 可选     | 若为true则会监控指定模块的参数， 默认为false。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
+| "alert"                 | 可选     | "rules": 指定自动报警的异常检测机制及其相应的阈值。目前实现的异常检测是AnomalyTurbulence， 如果统计标量超出历史均值的指定浮动范围（threshold 0.5意味着上浮或者下浮50%）则在控制台打印报警信息。当"dump"字段配置为true表示异常事件写入文件，默认为false。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                   |
+| "cc_distribution"       | 可选     | 其中"enable"字段控制通信监控模块的开关；需要监控通信算子时，务必尽量早地实例化`TrainerMon`, 因为监控通过劫持原始func后挂hook实现，部分加速库初始化时会保存原始function，避免监控失效。"cc_codeline"字段指定监控的代码行，如:`train.py\\[23\\]`，默认为空列表，不特别指定；"cc_pre_hook"字段控制是否监控通信前的数据； 模块会在第二个optimize.step之前打印通信日志，包括通信api的调用栈、输入dtype、通信group。 "cc_log_only"为true时，仅打印日志，不监控通信的输入输出，并在打印后中断训练。可以根据通信日志设置"cc_codeline"，规避与训练过程不相关的通信，比如一些时间、metrics的同步。                                                                                                                                                                                                                          |
+| "format"                | 可选     | 数据落盘格式，默认值为"csv"，可选 \["csv", "tensorboard", "api"\]。仅PyThon和MindSpore动态图场景支持此参数，且MindSpore动态图场景仅支持\["csv"\]。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
+| "ops"                   | 可选     | 类型为list，与ur_distribution、xy_distribution、mv_distribution、wg_distribution、mg_direction、cc_distribution配合，监控所选张量的统计指标，目前支持"min"、"max"、"norm"、"mean"、"zeros"、"nans"。其中，zeros代表监控所选张量的元素小于eps的比例，nans代表张量中nan的数量。当ops中无有效指标时，默认监控norm指标。                                                                                                                                                                                                                                                                                                                                                            |
+| "eps"                   | 可选     | 若ops里包含"zeros"则需要配置，默认为1e-8。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
+| "ndigits"               | 可选     | "format"为"csv"时，设置落盘文件中的小数位数，默认为6。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
+| "step_count_per_record" | 可选     | "format"为"csv"时生效，每个csv记录多少个step的数据，默认为1。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       |
+| "append_output"         | 可选     | 适用于断点续训场景。多卡场景下生效，指定两个时间戳，将输出续写到这两个时间戳范围间的输出件中，不在范围内的rank不被续写。时间戳应来自原有输出件目录前缀，例如["Dec03_21-34-40", "Dec03_21-34-41"]。默认为[]，不续写。**仅PyTorch场景支持此参数**。                                                                                                                                                                                                                                                                                                                                                                                                                                             |
+| "squash_name"           | 可选     | 是否简化参数名/模块名，多模态场景建议关闭，默认为True                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |
diff --git a/debug/accuracy_tools/msprobe/docs/27.dump_json_instruction.md b/debug/accuracy_tools/msprobe/docs/27.dump_json_instruction.md
index f994dc2301b..bf5998bce0b 100644
--- a/debug/accuracy_tools/msprobe/docs/27.dump_json_instruction.md
+++ b/debug/accuracy_tools/msprobe/docs/27.dump_json_instruction.md
@@ -1,8 +1,8 @@
 # dump.json文件说明及示例  
 
-## 1. dump.json文件示例（PyTorch）  
+## 1. PyTorch 场景下的 dump.json 文件
 
-### 1.1 L0级别
+### 1.1 L0 级别
 L0级别的dump.json文件包括模块的前反向的输入输出，以及模块的参数和参数梯度。以PyTorch的Conv2d模块为例，网络中模块调用代码为:  
 `output = self.conv2(input) # self.conv2 = torch.nn.Conv2d(64, 128, 5, padding=2, bias=True)`  
 
@@ -168,7 +168,7 @@ dump.json文件中包含以下数据名称：
 }
 ```
 
-### 1.2 L1级别
+### 1.2 L1 级别
 L1级别的dump.json文件包括API的前反向的输入输出。以PyTorch的relu函数为例，网络中API调用代码为:  
 `output = torch.nn.functional.relu(input)`  
 
@@ -264,13 +264,13 @@ dump.json文件中包含以下数据名称：
 }  
 ```  
 
-### 1.3 mix级别
+### 1.3 mix 级别
 
 mix级别的dump.json文件同时包括L0和L1级别的dump数据，文件格式与上述示例相同。  
 
-## 2. dump.json文件示例（MindSpore） 
+## 2. MindSpore 场景下的 dump.json 文件 
 
-### 2.1 L0级别  
+### 2.1 L0 级别  
 
 L0级别的dump.json文件包括模块的前反向的输入输出，以及模块的参数和参数梯度。
 以MindSpore的Conv2d模块为例，dump.json文件中使用的模块调用代码为:  
@@ -429,7 +429,7 @@ dump.json文件中包含以下数据名称：
 }
 ```
 
-### 2.2 L1级别
+### 2.2 L1 级别
 L1级别的dump.json文件包括API的前反向的输入输出，以MindSpore的relu函数为例，网络中API调用代码为:  
  `output = mindspore.ops.relu(input)`  
 
@@ -521,5 +521,275 @@ L1级别的dump.json文件包括API的前反向的输入输出，以MindSpore的
 }  
 ```  
 
-### 2.3 mix级别
+### 2.3 mix 级别
+
 mix级别的dump.json文件同时包括L0和L1级别的dump数据，文件格式与上述示例相同。
+
+## 3. MSAdapter 场景下的 dump.json 文件
+
+### 3.1 L0 级别
+
+L0 级别的 dump.json 文件包括模块的前反向的输入输出，以及模块的参数和参数梯度。以 Conv2d 模块为例，网络中模块调用代码为:  
+`output = self.conv2(input) # self.conv2 = torch.nn.Conv2d(64, 128, 5, padding=2, bias=True)`  
+
+dump.json文件中包含以下数据名称：  
+
+- `Module.conv2.Conv2d.forward.0`：模块的前向数据，其中input_args为模块的输入数据（位置参数），input_kwargs为模块的输入数据（关键字参数），output为模块的输出数据，parameters为模块的参数数据，包括权重（weight）和偏置（bias）。  
+- `Module.conv2.Conv2d.parameters_grad`：模块的参数梯度数据，包括权重（weight）和偏置（bias）的梯度。  
+- `Module.conv2.Conv2d.backward.0`：模块的反向数据，其中input为模块反向的输入梯度（对应前向输出的梯度），output为模块的反向输出梯度（对应前向输入的梯度）。
+
+**说明**：当dump时传入的model参数为List[torch.nn.Module]或Tuple[torch.nn.Module]时，模块级数据的命名中包含该模块在列表中的索引index，命名格式为`{Module}.{index}.*`，*表示以上三种模块级数据的命名格式，例如：`Module.0.conv1.Conv2d.forward.0`。     
+
+```json
+{
+ "task": "tensor",
+ "level": "L0",
+ "framework": "mindtorch",
+ "dump_data_dir": "/dump/path",
+ "data": {
+  "Module.conv2.Conv2d.forward.0": {
+   "input_args": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      8,
+      16,
+      14,
+      14
+     ],
+     "Max": 1.638758659362793,
+     "Min": 0.0,
+     "Mean": 0.2544615864753723,
+     "Norm": 70.50277709960938,
+     "requires_grad": true,
+     "data_name": "Module.conv2.Conv2d.forward.0.input.0.npy"
+    }
+   ],
+   "input_kwargs": {},
+   "output": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      8,
+      32,
+      10,
+      10
+     ],
+     "Max": 1.6815717220306396,
+     "Min": -1.5120246410369873,
+     "Mean": -0.025344856083393097,
+     "Norm": 149.65576171875,
+     "requires_grad": true,
+     "data_name": "Module.conv2.Conv2d.forward.0.output.0.npy"
+    }
+   ],
+   "parameters": {
+    "weight": {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      5,
+      5
+     ],
+     "Max": 0.05992485210299492,
+     "Min": -0.05999220535159111,
+     "Mean": -0.0006165213999338448,
+     "Norm": 3.421217441558838,
+     "requires_grad": true,
+     "data_name": "Module.conv2.Conv2d.forward.0.parameters.weight.npy"
+    },
+    "bias": {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32
+     ],
+     "Max": 0.05744686722755432,
+     "Min": -0.04894155263900757,
+     "Mean": 0.006410328671336174,
+     "Norm": 0.17263513803482056,
+     "requires_grad": true,
+     "data_name": "Module.conv2.Conv2d.forward.0.parameters.bias.npy"
+    }
+   }
+  },
+  "Module.conv2.Conv2d.parameters_grad": {
+   "weight": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      5,
+      5
+     ],
+     "Max": 0.018550323322415352,
+     "Min": -0.008627401664853096,
+     "Mean": 0.0006675920449197292,
+     "Norm": 0.26084786653518677,
+     "requires_grad": false,
+     "data_name": "Module.conv2.Conv2d.parameters_grad.weight.npy"
+    }
+   ],
+   "bias": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32
+     ],
+     "Max": 0.014914230443537235,
+     "Min": -0.006656786892563105,
+     "Mean": 0.002657240955159068,
+     "Norm": 0.029451673850417137,
+     "requires_grad": false,
+     "data_name": "Module.conv2.Conv2d.parameters_grad.bias.npy"
+    }
+   ]
+  },
+  "Module.conv2.Conv2d.backward.0": {
+   "input": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      8,
+      32,
+      10,
+      10
+     ],
+     "Max": 0.0015069986693561077,
+     "Min": -0.001139344065450132,
+     "Mean": 3.3215508210560074e-06,
+     "Norm": 0.020567523315548897,
+     "requires_grad": false,
+     "data_name": "Module.conv2.Conv2d.backward.0.input.0.npy"
+    }
+   ],
+   "output": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      8,
+      16,
+      14,
+      14
+     ],
+     "Max": 0.0007466732058674097,
+     "Min": -0.00044813455315306783,
+     "Mean": 6.814070275140693e-06,
+     "Norm": 0.01474067009985447,
+     "requires_grad": false,
+     "data_name": "Module.conv2.Conv2d.backward.0.output.0.npy"
+    }
+   ]
+  }
+ }
+}
+```
+
+### 3.2 L1 级别
+L1级别的dump.json文件包括API的前反向的输入输出。以 relu API 为例，网络中 API 调用代码为:  
+`output = torch.nn.functional.relu(input)`  
+
+dump.json文件中包含以下数据名称：  
+- `Functional.relu.0.forward`：API的前向数据，其中input_args为API的输入数据（位置参数），input_kwargs为API的输入数据（关键字参数），output为API的输出数据。  
+- `Functional.relu.0.backward`：API的反向数据，其中input为API的反向输入梯度（对应前向输出的梯度），output为API的反向输出梯度（对应前向输入的梯度）。
+
+```json
+{
+ "task": "tensor",
+ "level": "L1",
+ "framework": "mindtorch",
+ "dump_data_dir":"/dump/path",
+ "data": {
+  "Functional.relu.0.forward": {
+   "input_args": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      28,
+      28
+     ],
+     "Max": 1.3864083290100098,
+     "Min": -1.3364859819412231,
+     "Mean": 0.03711778670549393,
+     "Norm": 236.20692443847656,
+     "requires_grad": true,
+     "data_name": "Functional.relu.0.forward.input.0.npy"
+    }
+   ],
+   "input_kwargs": {},
+   "output": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      28,
+      28
+     ],
+     "Max": 1.3864083290100098,
+     "Min": 0.0,
+     "Mean": 0.16849493980407715,
+     "Norm": 175.23345947265625,
+     "requires_grad": true,
+     "data_name": "Functional.relu.0.forward.output.0.npy"
+    }
+   ]
+  },
+  "Functional.relu.0.backward": {
+   "input": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      28,
+      28
+     ],
+     "Max": 0.0001815402356442064,
+     "Min": -0.00013352684618439525,
+     "Mean": 0.00011915402356442064,
+     "Norm": 0.007598237134516239,
+     "requires_grad": false,
+     "data_name": "Functional.relu.0.backward.input.0.npy"
+    }
+   ],
+   "output": [
+    {
+     "type": "mindspore.Tensor",
+     "dtype": "Float32",
+     "shape": [
+      32,
+      16,
+      28,
+      28
+     ],
+     "Max": 0.0001815402356442064,
+     "Min": -0.00012117840378778055,
+     "Mean": 2.0098118724831693e-08,
+     "Norm": 0.006532244384288788,
+     "requires_grad": false,
+     "data_name": "Functional.relu.0.backward.output.0.npy"
+    }
+   ]
+  }
+ }
+}  
+```  
+
+### 3.3 mix 级别
+
+mix级别的dump.json文件同时包括L0和L1级别的dump数据，文件格式与上述示例相同。  
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/docs/28.kernel_dump_MindSpore.md b/debug/accuracy_tools/msprobe/docs/28.kernel_dump_MindSpore.md
index 6b8cc558aa2..4988586c056 100644
--- a/debug/accuracy_tools/msprobe/docs/28.kernel_dump_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/28.kernel_dump_MindSpore.md
@@ -1,4 +1,4 @@
-# MindSpore 场景的 kernel dump 说明
+# MindSpore 动态图场景的 kernel dump 说明
 
 当使用 msprobe 数据采集功能时，level 配置为 "L2" 表示采集 kernel 层级的算子数据，仅支持昇腾 NPU 平台。 
 
diff --git a/debug/accuracy_tools/msprobe/docs/29.data_dump_MSAdapter.md b/debug/accuracy_tools/msprobe/docs/29.data_dump_MSAdapter.md
new file mode 100644
index 00000000000..cefcabafbcb
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/docs/29.data_dump_MSAdapter.md
@@ -0,0 +1,229 @@
+# MSAdapter 场景的精度数据采集
+
+MSAdapter 是一款 MindSpore 生态适配工具，可以将 PyTorch 训练脚本高效迁移至 MindSpore 框架执行，以实现在不改变原有 PyTorch 用户开发习惯的情况下，使得 PyTorch 代码能在昇腾上获得高效性能。
+
+msprobe 工具主要通过在训练脚本内添加 dump 接口、启动训练的方式采集精度数据。
+
+本工具提供固定的 API 支持列表，若需要删除或增加 dump 的 API，可以在 msprobe/pytorch/hook_module/support_wrap_ops.yaml 文件内手动修改，如下示例：
+
+```yaml
+functional:  # functional为算子类别，找到对应的类别，在该类别下按照下列格式删除或添加API
+  - conv1d
+  - conv2d
+  - conv3d
+```
+
+删除 API 的场景：部分模型代码逻辑会存在 API 原生类型校验，工具执行dump操作时，对封装后的模型 API 可能与模型的原生 API 类型不一致，此时可能引发校验失败，详见《[FAQ](FAQ.md)》中“异常情况”的第10和11条。
+
+## 1. 工具安装
+
+请参见[《msprobe 工具安装指南》](./01.installation.md)。
+
+## 2 接口介绍
+
+### 2.1 msprobe.mindspore.PrecisionDebugger
+
+**功能说明**：通过加载 dump 配置文件的方式来确定 dump 操作的详细配置。
+
+**原型**：
+
+```Python
+PrecisionDebugger(config_path=None, task=None, dump_path=None, level=None, step=None)
+```
+
+**参数说明**:
+
+1. config_path：指定 dump 配置文件路径，string 类型。参数示例："./config.json"。未配置该路径时，默认使用 [config.json](../config.json) 文件的默认配置，配置选项含义可见 [config.json 介绍](./02.config_introduction.md)。
+
+2. 其他参数与 [config.json](../config.json) 文件中的同名配置字段含义相同，具体可见 [config.json 介绍](./02.config_introduction.md)。当参数值非None时，优先级高于 [config.json](../config.json) 文件中的同名配置。
+
+#### 2.1.1 start
+
+**功能说明**：启动精度数据采集。需要与 [**stop**](#212-stop) 接口一起添加在训练迭代的 for 循环内。
+
+**原型**：
+
+```Python
+start(model=None)
+```
+
+**参数说明**:
+
+1. model：指定需要采集 Module 级数据的模型，支持传入 torch.nn.Module、list[torch.nn.Module]或Tuple[torch.nn.Module] 类型，默认未配置。level 配置为 "L0" 或 "mix" 时，必须在该接口中配置该参数。API级别（"L1" level）dump 时，传入 model 可以采集 model 内包含 primitive op 对象在内的所有 API 数据，若不传入 model 参数，则只采集非 primitive op 的 API 数据。
+
+#### 2.1.2 stop
+
+**功能说明**：停止精度数据采集。在 **start** 接口调用之后的任意位置添加。若 **stop** 接口添加在反向计算代码之后，则会采集 **start** 和该接口之间的前反向数据。
+若 **stop** 接口添加在反向计算代码之前，则需要将 [**step**](#213-step) 接口添加到反向计算代码之后，才能采集 **start** 和该接口之间的前反向数据。
+
+**注意**：**stop** 接口必须调用，否则可能导致精度数据落盘不全。
+
+**原型**：
+
+```Python
+stop()
+```
+
+#### 2.1.3 step
+
+**功能说明**：进行训练 step 数的自增，完成当前 step 所有数据的落盘并更新 dump 参数。在一个 step 训练结束的位置添加，且必须在 **stop** 接口之后的位置调用。该接口需要配合 **start** 和 **stop** 函数使用，尽量添加在反向计算代码之后，否则可能会导致反向数据丢失。
+
+**原型**：
+
+```Python
+step()
+```
+
+#### 2.1.4 forward_backward_dump_end
+
+**功能说明**：停止精度数据采集。与 **stop** 接口功能相同，该函数在将来会被移除，建议使用 **stop** 接口。
+
+**原型**：
+
+```Python
+forward_backward_dump_end()
+```
+
+#### 2.1.5 save
+
+**功能说明**：单点保存网络执行过程中正反向数值，并以统计值/张量文件落盘。
+
+**原型**：
+```python
+save(variable, name, save_backward=True)
+```
+
+**参数说明**:
+| 参数名称        | 参数含义          |        支持数据类型    |   是否必选|
+| ----------     | ------------------| ------------------- | ------------------- |
+| variable       | 需要保存的变量     |dict, list, tuple, torch.tensor, int, float, str |  是  |
+| name           | 指定的名称         | str                 | 是  |
+| save_backward  | 是否保存反向数据   | boolean             | 否 |
+
+### 2.2 msprobe.mindspore.seed_all
+
+**功能说明**：用于固定网络中的随机性和开启确定性计算。
+
+**原型**：
+```python
+seed_all(seed=1234, mode=False, rm_dropout=True)
+```
+
+**参数说明**:
+
+1. seed: 随机性种子，默认值：1234，非必选。参数示例: seed=1000。该参数用于 random、numpy.random, mindspore.common.Initializer、mindspore.nn.probability.distribution的随机数生成以及 Python 中 str、bytes、datetime 对象的 hash 算法。
+
+2. mode：确定性计算使能，可配置 True 或 False，默认值：False，非必选。参数示例：mode=True。该参数设置为 True 后，将会开启算子确定性运行模式与归约类通信算子（AllReduce、ReduceScatter、Reduce）的确定性计算。注意：确定性计算会导致 API 执行性能降低，建议在发现模型多次执行结果不同的情况下开启。
+
+3. rm_dropout：控制 dropout 失效的开关。可配置 True 或 False，默认值：True，非必选。参数示例：rm_dropout=True。该参数设置为 True 后，将会使 mindspore.ops.Dropout，mindspore.ops.Dropout2D，mindspore.ops.Dropout3D，mindspore.mint.nn.Dropout和mindspore.mint.nn.functional.dropout 失效，以避免因随机 dropout 造成的网络随机性。建议在采集数据前调用。
+
+**注意**：通过 rm_dropout 控制 dropout 失效或生效需要在初始化 Dropout 实例前调用才能生效。
+
+## 3 示例代码
+
+以下为添加了 msprobe 工具 dump 接口的示例训练脚本。
+
+```python
+import mindspore as ms
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+
+# 导入工具的数据采集接口
+from msprobe.pytorch import PrecisionDebugger
+
+# 在模型训练开始前实例化PrecisionDebugger
+debugger = PrecisionDebugger(config_path='./config.json')
+
+
+# 定义网络
+class Net(nn.Module):
+    def __init__(self) -> None:
+        super().__init__()
+        self.linear1 = nn.Linear(in_features=8, out_features=4)
+        self.linear2 = nn.Linear(in_features=4, out_features=2)
+
+    def forward(self, x):
+        x1 = self.linear1(x)
+        x2 = self.linear2(x1)
+        logits = F.relu(x2)
+        return logits
+
+
+net = Net()
+
+
+def train_step(inputs):
+    return net(inputs)
+
+
+if __name__ == "__main__":
+    data = (torch.randn(10, 8), torch.randn(10, 8), torch.randn(10, 8))
+    grad_fn = ms.value_and_grad(train_step, grad_position=0)
+
+    for inputs in data:
+        # 开启数据 dump
+        debugger.start(model=net)
+
+        out, grad = grad_fn(inputs)
+
+        # 停止数据 dump
+        debugger.stop()
+        # 更新 step 信息
+        debugger.step()
+```
+
+## 4 dump 结果文件介绍
+
+训练结束后，工具将 dump 的数据保存在 dump_path 参数指定的目录下。目录结构示例如下：
+
+```lua
+├── dump_path
+│   ├── step0
+│   |   ├── rank0
+│   |   │   ├── dump_tensor_data
+|   |   |   |    ├── Tensor.permute.1.forward.npy
+|   |   |   |    ├── Functional.linear.5.backward.output.npy    # 命名格式为{api_type}.{api_name}.{API调用次数}.{forward/backward}.{input/output}.{参数序号}, 其中，“参数序号”表示该API的第n个输入或输出，例如1，则为第一个参数，若该参数为list格式，则根据list继续排序，例如1.1，表示该API的第1个参数的第1个元素。
+|   |   |   |    ...
+|   |   |   |    ├── Module.conv1.Conv2d.forward.0.input.0.npy          # 命名格式为{Module}.{module_name}.{class_name}.{forward/backward}.{调用次数}.{input/output}.{参数序号}, 其中，“参数序号”表示该Module的第n个参数，例如1，则为第一个参数，若该参数为list格式，则根据list继续排序，例如1.1，表示该Module的第1个参数的第1个元素。
+|   |   |   |    ├── Module.conv1.Conv2D.forward.0.parameters.bias.npy  # 模块参数数据：命名格式为{Module}.{module_name}.{class_name}.forward.{调用次数}.parameters.{parameter_name}。
+|   |   |   |    └── Module.conv1.Conv2D.parameters_grad.weight.npy     # 模块参数梯度数据：命名格式为{Module}.{module_name}.{class_name}.parameters_grad.{parameter_name}。因为同一模块的参数使用同一梯度进行更新，所以参数梯度文件名不包含调用次数。
+|   |   |   |                                                          # 当dump时传入的model参数为List[torch.nn.Module]或Tuple[torch.nn.Module]时，模块级数据的命名中包含该模块在列表中的索引index，命名格式为{Module}.{index}.*，*表示以上三种模块级数据的命名格式，例如：Module.0.conv1.Conv2d.forward.0.input.0.npy。
+│   |   |   ├── dump.json
+│   |   |   ├── stack.json
+│   |   |   └── construct.json
+│   |   ├── rank1
+|   |   |   ├── dump_tensor_data
+|   |   |   |   └── ...
+│   |   |   ├── dump.json
+│   |   |   ├── stack.json
+|   |   |   └── construct.json
+│   |   ├── ...
+│   |   |
+|   |   └── rank7
+│   ├── step1
+│   |   ├── ...
+│   ├── step2
+```
+* `rank`：设备 ID，每张卡的数据保存在对应的 `rank{ID}` 目录下。非分布式场景下没有 rank ID，目录名称为 rank。
+* `dump_tensor_data`：保存采集到的张量数据。
+* `dump.json`： 保存 API 或 Module 前反向数据的统计量信息。包含 dump 数据的 API 名称或 Module 名称，各数据的 dtype、 shape、max、min、mean、L2norm（L2范数，平方根）统计信息以及当配置 summary_mode="md5" 时的 CRC-32 数据。具体介绍可参考[dump.json文件说明](./27.dump_json_instruction.md#3-MSAdapter场景下的dump.json文件)。
+* `stack.json`：API/Module 的调用栈信息。
+* `construct.json`：分层分级结构，level 为 L1 时，construct.json 内容为空。
+
+
+当 task 为 tensor 时，dump 过程中，npy 文件在对应算子或者模块被执行后就会落盘，而 json 文件则需要在正常执行 PrecisionDebugger.stop() 后才会写入完整数据。因此如果程序异常终止，终止前被执行算子的相关 npy 文件得以保存，但 json 文件中的数据可能丢失。
+
+其中 rank 为设备上各卡的 ID，每张卡上 dump 的数据会生成对应 dump 目录。非分布式场景下没有 rank ID，目录名称为 rank。
+
+npy 文件名的前缀含义如下：
+
+| 前缀        | 含义                          |
+| ----------- | ---------------------------- |
+| Tensor      | torch.Tensor API数据          |
+| Torch       | torch API数据                 |
+| Functional  | torch.nn.functional API数据   |
+| NPU         | NPU 亲和API数据               |
+| Distributed | torch.distributed API数据     |
+| Jit         | 被 "jit" 装饰的模块或函数数据   |
+| Module      | torch.nn.Module 类（模块）数据 |
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/docs/30.overflow_check_MSAdapter.md b/debug/accuracy_tools/msprobe/docs/30.overflow_check_MSAdapter.md
new file mode 100644
index 00000000000..01d64c808d4
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/docs/30.overflow_check_MSAdapter.md
@@ -0,0 +1,31 @@
+# MSAdapter 场景的溢出检测
+
+msprobe 工具提供 MSAdapter 场景下的溢出检测功能。其检测对象为 **API** 级别(除 Primitive 和 Jit 类 API)或**模块**级别，分别对应 config.json 配置中的 **"L1"** 、**"L0"** level。
+
+需要注意，本工具仅支持在 INF/NAN 模式<sup>a</sup>下进行溢出检测。INF/NAN 模式的使能方式如下：
+
+```Shell
+# 使能 CANN 侧 INF/NAN 模式
+export INF_NAN_MODE_ENABLE=1
+# 使能 MindSpore 框架侧 INF/NAN 模式
+export MS_ASCEND_CHECK_OVERFLOW_MODE="INFNAN_MODE"
+```
+
+**a**：在处理浮点数计算溢出问题时，NPU 当前支持两种溢出模式：INF/NAN 模式与饱和模式。INF/NAN 模式遵循 IEEE 754 标准，根据定义输出 INF/NAN 的计算结果。与之对应的饱和模式在计算出现溢出时，饱和为浮点数极值（+-MAX）。对于 CANN 侧配置，Atlas 训练系列产品，默认为饱和模式，且不建议使用 INF/NAN 模式；Atlas A2训练系列产品，默认为 INF/NAN 模式，且不建议使用饱和模式。对于 MindSpore 框架侧配置，仅支持对 Atlas A2 训练系列产品进行设置，默认为 INF/NAN 模式。CANN 侧 与 MindSpore 框架侧配置须一致。
+
+溢出检测任务的配置示例见["**MindSpore 动态图场景 task 配置为 overflow_check**"](./03.config_examples.md#33-task配置为overflow_check)小节。
+
+
+## 1 接口介绍
+
+溢出检测功能提供的接口与数据采集任务一致，详见 MSAdapter 场景的精度数据采集中的["**2 接口介绍**"](./29.data_dump_MSAdapter.md#2-接口介绍)小节。
+
+需要注意，目前暂不支持 "L1" level 下 primitive op 的溢出检测。
+
+## 2 示例代码
+
+溢出检测功能使用方式与数据采集任务一致，详见 MSAdapter 场景的精度数据采集中的["**3 示例代码**"](./29.data_dump_MSAdapter.md#3-示例代码)小节。
+
+## 3 溢出检测结果文件介绍
+
+溢出检测结果文件目录结构与含义与数据采集任务一致，但仅保存溢出 API 或 模块 的真实数据或统计信息。详见 MSAdapter 场景的精度数据采集中的["**4 dump 结果文件介绍**"](./29.data_dump_MSAdapter.md#4-dump-结果文件介绍)小节。
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
index 9f1523c03aa..c3767abf871 100644
--- a/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
+++ b/debug/accuracy_tools/msprobe/mindspore/compare/ms_compare.py
@@ -78,6 +78,11 @@ class MSComparator(Comparator):
             raise TypeError(f"The type of parameter `data_mapping` must be dict, str or None, but got "
                             f"{type(self.data_mapping)}")
 
+    @staticmethod
+    def process_data_name(result):
+        result['data_name_x'] = result.apply(lambda row: [row['data_name_x'], row['data_name_y']], axis=1)
+        return result
+
     def calc_accuracy(self, result_df, header):
         condition_no_bench = result_df[CompareConst.BENCH_NAME] == CompareConst.N_A
         result_df[condition_no_bench] = result_df[condition_no_bench].fillna(CompareConst.N_A)
@@ -140,6 +145,8 @@ class MSComparator(Comparator):
             header.append(CompareConst.STACK)
         if self.dump_mode == Const.ALL:
             header.append(CompareConst.DATA_NAME)
+            result = self.process_data_name(result)
+
         result.rename(columns={'op_name_x': CompareConst.NPU_NAME,
                                'op_name_y': CompareConst.BENCH_NAME,
                                'dtype_x': CompareConst.NPU_DTYPE,
@@ -170,6 +177,7 @@ class MSComparator(Comparator):
 
         result[npu_summary] = result['summary_x'].apply(set_summary).tolist()
         result[bench_summary] = result['summary_y'].apply(set_summary).tolist()
+
         result_df = pd.DataFrame(columns=header)
         for h in header:
             if h in result.columns:
diff --git a/debug/accuracy_tools/msprobe/mindspore/monitor/distributed/wrap_distributed.py b/debug/accuracy_tools/msprobe/mindspore/monitor/distributed/wrap_distributed.py
index 33fd58c7278..e8a4739445e 100644
--- a/debug/accuracy_tools/msprobe/mindspore/monitor/distributed/wrap_distributed.py
+++ b/debug/accuracy_tools/msprobe/mindspore/monitor/distributed/wrap_distributed.py
@@ -281,7 +281,7 @@ def create_hooks(context, monitor):
     global RANK
     pre_hooks = []
     hooks = []
-    RANK = str(get_rank())
+    RANK = get_rank()
     if communication.GlobalComm.INITED and RANK not in monitor.module_rank_list and monitor.module_rank_list != []:
         return [pre_hooks, hooks]
 
diff --git a/debug/accuracy_tools/msprobe/mindspore/monitor/utils.py b/debug/accuracy_tools/msprobe/mindspore/monitor/utils.py
index 506ad6c3f91..c85e66a65ba 100644
--- a/debug/accuracy_tools/msprobe/mindspore/monitor/utils.py
+++ b/debug/accuracy_tools/msprobe/mindspore/monitor/utils.py
@@ -98,8 +98,8 @@ def validate_ranks(ranks):
     if not isinstance(ranks, list):
         raise TypeError("module_ranks should be a list")
     for rank in ranks:
-        if not isinstance(rank, str):
-            raise TypeError(f"element in module_ranks should be a str, get {type(rank)}")
+        if not isinstance(rank, int):
+            raise TypeError(f"element in module_ranks should be a int, get {type(rank)}")
 
 
 def validate_targets(targets):
diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
index 905687c1bfc..c7a48844ee8 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
@@ -65,6 +65,7 @@ DETAILS_FILE_NAME = "accuracy_checking_details_" + current_time + ".csv"
 
 not_backward_list = ['repeat_interleave']
 unsupported_backward_list = ['masked_select']
+unsupported_api_list = ["to"]
 
 
 tqdm_params = {
@@ -218,6 +219,7 @@ def blacklist_and_whitelist_filter(api_name, black_list, white_list):
     If api is both in black_list and black_list, black_list first.
     return: False for exec api, True for not exec
     """
+    black_list.extend(unsupported_api_list)
     if black_list and api_name in black_list:
         return True
     if white_list and api_name not in white_list:
diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py b/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
index 0c9efaab999..3032bdcb3fa 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
@@ -176,7 +176,8 @@ class GradContext:
 class TrainerMon:
     tensor_metrics = TensorMetrics()
 
-    def __init__(self, config_file_path, process_group=None, params_have_main_grad=True) -> None:
+    # 保留原opt_ty参数, 兼容msprobe1.2.2前旧版本
+    def __init__(self, config_file_path, process_group=None, params_have_main_grad=True, opt_ty=None) -> None:
         # TYPE1: 只在这里初始化的变量, 不会随着训练中途config配置改变而重置
         self.config_file_path = config_file_path
         self.process_group = get_process_group(process_group)
@@ -222,6 +223,7 @@ class TrainerMon:
         self.micro_batch_number = 1
         self.optimizer_class = None
         self.optimizer_mon = None
+        self.optimizer_trans = None
 
         # TYPE3: 会随着训练中途config配置更新或监控状态改变而重置的变量
         self.module_fwd_hook_context_by_module = defaultdict(ModuleHookContext)
@@ -379,45 +381,19 @@ class TrainerMon:
         if not self.cc_distribution.get('enable', False):
             logger.info_on_rank_0("> cc operator is not monitored.")
 
-    def hook_modules(self):
-        if self.module_rank_list and (self.rank not in self.module_rank_list):
-            return
-
-        targets = self.config['targets']
-        module_in_all_stage = [key for key in targets.keys() if MonitorConst.NAME_SEP not in key]
-        for key in module_in_all_stage:
-            struct = targets.pop(key)
-            targets.update({f'{vpp_stage}{MonitorConst.NAME_SEP}{key}': struct for vpp_stage in range(len(self.model))})
-
-        hooked_count = 0
-        for vpp_stage, model_chunk in enumerate(self.model):
-            vpp_stage = f'{vpp_stage}{MonitorConst.NAME_SEP}'
-            targets = [x for x, _ in model_chunk.named_modules()] if self.print_struct else self.config[
-                'targets'].keys()
-            hooked_count += self._hook_module(targets, model_chunk, vpp_stage)
-
-        logger.info_on_rank_0(f"> {hooked_count} modules are monitored.")
-
-        def clone_if_tensor(args):
-            if isinstance(args, tuple):
-                return tuple([clone_if_tensor(arg) for arg in args])
-            elif isinstance(args, torch.Tensor):
-                return args.clone()
-            else:
-                return args
-
-        @torch.no_grad
-        def wrap_hook_setup(setup):
-            def wrapped_setup(*args, **kwargs):
-                args = setup(*args, **kwargs)
-                args = clone_if_tensor(args)
-                return args
-
-            return wrapped_setup
+    # 保留原接口, 兼容msprobe1.2.2前旧版本
+    def monitor_gnorm_with_ad(self, model, optimizer=None, grad_acc_steps=1, tp_group=None, dp_group=None,
+                              start_iteration=0):
+        if optimizer is None:
+            optimizer = getattr(self, "optimizer_trans", None)  # 兼容老版本可传None的情况, 从set_wrapped_optimizer获取
+            if optimizer is None:
+                logger.error("monitor_gnorm_with_ad: please set_wrapped_optimizer before it or input optimizer!=None")
+                return
+        self.set_monitor(model, optimizer, grad_acc_steps, tp_group, dp_group, start_iteration)
 
-        BackwardHook.setup_input_hook = wrap_hook_setup(BackwardHook.setup_input_hook)
-        BackwardHook.setup_output_hook = wrap_hook_setup(BackwardHook.setup_output_hook)
-        return
+    # 保留原接口, 兼容msprobe1.2.2前旧版本
+    def set_wrapped_optimizer(self, optimizer):
+        self.optimizer_trans = optimizer
 
     def set_monitor(
             self,
@@ -557,9 +533,9 @@ class TrainerMon:
     def write_mv_tb(self, opt_context):
         if not self.mv_distribution:
             return
-        self.summary_writer.write_metrics(self.ops, opt_context.exp_avg_metric, 
+        self.summary_writer.write_metrics(self.ops, opt_context.exp_avg_metric,
                                           opt_context.step, MonitorConst.EXP_AVG)
-        self.summary_writer.write_metrics(self.ops, opt_context.exp_avg_sq_metric, 
+        self.summary_writer.write_metrics(self.ops, opt_context.exp_avg_sq_metric,
                                           opt_context.step, MonitorConst.EXP_AVG_SQ)
 
     def write_grad_tb(self, step):
@@ -738,7 +714,46 @@ class TrainerMon:
 
         optimizer.__class__.step = patch_step(optimizer.__class__.step, optimizer)
         self.origin_step_func = optimizer.__class__.step
+        return
+
+    def hook_modules(self):
+        if self.module_rank_list and (self.rank not in self.module_rank_list):
+            return
+
+        targets = self.config['targets']
+        module_in_all_stage = [key for key in targets.keys() if MonitorConst.NAME_SEP not in key]
+        for key in module_in_all_stage:
+            struct = targets.pop(key)
+            targets.update({f'{vpp_stage}{MonitorConst.NAME_SEP}{key}': struct for vpp_stage in range(len(self.model))})
+
+        hooked_count = 0
+        for vpp_stage, model_chunk in enumerate(self.model):
+            vpp_stage = f'{vpp_stage}{MonitorConst.NAME_SEP}'
+            targets = [x for x, _ in model_chunk.named_modules()] if self.print_struct else self.config[
+                'targets'].keys()
+            hooked_count += self._hook_module(targets, model_chunk, vpp_stage)
+
+        logger.info_on_rank_0(f"> {hooked_count} modules are monitored.")
 
+        def clone_if_tensor(args):
+            if isinstance(args, tuple):
+                return tuple([clone_if_tensor(arg) for arg in args])
+            elif isinstance(args, torch.Tensor):
+                return args.clone()
+            else:
+                return args
+
+        @torch.no_grad
+        def wrap_hook_setup(setup):
+            def wrapped_setup(*args, **kwargs):
+                args = setup(*args, **kwargs)
+                args = clone_if_tensor(args)
+                return args
+
+            return wrapped_setup
+
+        BackwardHook.setup_input_hook = wrap_hook_setup(BackwardHook.setup_input_hook)
+        BackwardHook.setup_output_hook = wrap_hook_setup(BackwardHook.setup_output_hook)
         return
 
     def _remove_all_hooks(self, optimizer):
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
index c882e331f55..1b2f6bb2fde 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
@@ -11,7 +11,7 @@ import torch
 
 from msprobe.core.common.const import CompareConst, Const
 from msprobe.core.common.utils import CompareException
-from msprobe.core.compare.acc_compare import Comparator, ModeConfig, get_bench_data_name
+from msprobe.core.compare.acc_compare import Comparator, ModeConfig
 from msprobe.core.compare.highlight import find_error_rows, find_compare_result_error_rows, ApiBatch
 from msprobe.core.compare.utils import get_accuracy
 from msprobe.pytorch.compare.pt_compare import PTComparator
@@ -636,11 +636,11 @@ class TestUtilsMethods(unittest.TestCase):
     def test_do_multi_process(self):
         data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                  'torch.float32', 'torch.float32', [2, 2], [2, 2],
-                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', '-1']]
+                 '', '', '', '', '', '', 1, 1, 1, 1, 1, 1, 1, 1, 'Yes', '', ['-1', '-1']]]
         o_data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
                    'torch.float32', 'torch.float32', [2, 2], [2, 2],
                    'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                   1, 1, 1, 1, 1, 1, 1, 1, 'None', 'No bench data matched.', '-1']]
+                   1, 1, 1, 1, 1, 1, 1, 1, 'None', 'No bench data matched.', ['-1', '-1']]]
         columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
         result_df = pd.DataFrame(data, columns=columns)
         o_result = pd.DataFrame(o_data, columns=columns)
@@ -670,7 +670,7 @@ class TestUtilsMethods(unittest.TestCase):
         mode_config = ModeConfig(stack_mode, auto_analyze, fuzzy_match, dump_mode)
 
         pt_comparator = PTComparator(mode_config)
-        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param, {})
+        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param)
 
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
                                   'unsupported', 'No bench data matched.'])
@@ -688,43 +688,23 @@ class TestUtilsMethods(unittest.TestCase):
         pt_comparator = PTComparator(mode_config)
 
         pt_name = '-1'
-        pt_path = os.path.join(base_dir, pt_name)
-        op_name_mapping_dict = {'Functional.linear.0.forward.input.0': [pt_path, pt_path]}
+        op_name_mapping_dict = {'Functional.linear.0.forward.input.0': [pt_name, pt_name]}
         input_param = {'npu_dump_data_dir': base_dir, 'bench_dump_data_dir': base_dir}
-        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param,
-                                              {'Functional.linear.0.forward': {'input_args': [
-                                                  {'data_name': 'Functional.linear.0.forward.input.0.pt'}]}})
+        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param)
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                                  'unsupported', f'Dump file: {pt_path} not found.'])
+                                  'unsupported', 'No bench data matched.'])
 
         pt_name = 'Functional.linear.0.forward.input.0.pt'
-        pt_path = os.path.join(base_dir, pt_name)
-        op_name_mapping_dict = {'Functional.linear.0.forward.input.0': [pt_path, pt_path]}
+        op_name_mapping_dict = {'Functional.linear.0.forward.input.0': [pt_name, pt_name]}
         input_param = {'npu_dump_data_dir': base_dir, 'bench_dump_data_dir': base_dir}
-        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param, {})
+        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param)
         self.assertEqual(result, ['unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
-                                  'unsupported', 'Bench does not have data file.'])
+                                  'unsupported', 'Dump file: Functional.linear.0.forward.input.0.pt not found.'])
 
         generate_pt(base_dir)
-        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param,
-                                              {'Functional.linear.0.forward': {'input_args': [
-                                                  {'data_name': 'Functional.linear.0.forward.input.0.pt'}]}})
+        result = pt_comparator.compare_by_op(npu_op_name, bench_op_name, op_name_mapping_dict, input_param)
         self.assertEqual(result, [1.0, 0.0, 0.0, 0.0, 1.0, 1.0, ''])
 
-    def test_get_bench_data_name_input(self):
-        bench_op_name = "Functional.linear.0.forward.input.0"
-        bench_data = {"Functional.linear.0.forward": {"input_args": [{"data_name": "Functional.linear.0.forward.input.0.pt"}], "input_kwargs": {}, "output": []}}
-        result = get_bench_data_name(bench_op_name, bench_data)
-
-        self.assertEqual(result, "Functional.linear.0.forward.input.0.pt")
-
-    def test_get_bench_data_name_output(self):
-        bench_op_name = "Functional.linear.0.forward.output.0"
-        bench_data = {"Functional.linear.0.forward": {"input_args": [], "input_kwargs": {}, "output": [{"data_name": "Functional.linear.0.forward.output.0.pt"}]}}
-        result = get_bench_data_name(bench_op_name, bench_data)
-
-        self.assertEqual(result, "Functional.linear.0.forward.output.0.pt")
-
 
 class TestComparator(unittest.TestCase):
     def setUp(self):
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
index 2e9a4657266..bf23f4de1da 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare_utils.py
@@ -224,31 +224,31 @@ o_result_unmatch_3 = [
     ['Functional.conv2d.0.forward.input.0', 'N/A', 'torch.float32', 'N/A', [1, 1, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      3.029174327850342, -2.926689624786377, -0.06619918346405029, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'No bench data matched.', 'None', '-1'],
+     'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.input.1', 'N/A', 'torch.float32', 'N/A', [16, 1, 5, 5], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      0.19919930398464203, -0.19974489510059357, 0.006269412115216255, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'No bench data matched.', 'None', '-1'],
+     'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.input.2', 'N/A', 'torch.float32', 'N/A', [16], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      0.19734230637550354, -0.18177609145641327, 0.007903944700956345, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'No bench data matched.', 'None', '-1'],
+     'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.parameters.weight', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.parameters.bias', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.forward.output.0', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
      2.1166646480560303, -2.190781354904175, -0.003579073818400502, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     'No bench data matched.', 'None', '-1'],
+     'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.parameters_grad.weight', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1'],
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', ['-1', '-1']],
     ['Functional.conv2d.0.parameters_grad.bias', 'N/A', 'torch.float32', 'N/A', [1, 16, 28, 28], 'N/A',
      'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'N/A',
-     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', '-1']
+     1.0, 1.0, 1.0, 1.0, 'N/A', 'N/A', 'N/A', 'N/A', 'N/A', 'No bench data matched.', 'None', ['-1', '-1']]
 ]
 
 # test_merge_tensor
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
index 3fa16b0d9d4..49f084ce07c 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_cmp_multiprocessing_compute.py
@@ -18,12 +18,12 @@ data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.inp
          'torch.float32', 'torch.float32', [2, 2], [2, 2],
          '', '', '', '', '', '',
          1, 1, 1, 1, 1, 1, 1, 1,
-         'Yes', '', '-1']]
+         'Yes', '', ['-1', '-1']]]
 o_data = [['Functional.linear.0.forward.input.0', 'Functional.linear.0.forward.input.0',
            'torch.float32', 'torch.float32', [2, 2], [2, 2],
            'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported', 'unsupported',
            1, 1, 1, 1, 1, 1, 1, 1,
-           'None', 'No bench data matched.', '-1']]
+           'None', 'No bench data matched.', ['-1', '-1']]]
 columns = CompareConst.COMPARE_RESULT_HEADER + ['Data_name']
 result_df = pd.DataFrame(data, columns=columns)
 o_result = pd.DataFrame(o_data, columns=columns)
@@ -54,9 +54,9 @@ class TestUtilsMethods(unittest.TestCase):
 
         func = Comparator(mode_config).compare_ops
         generate_dump_json(base_dir)
-        input_parma = {'bench_json_path': os.path.join(base_dir, 'dump.json')}
+        input_param = {'bench_json_path': os.path.join(base_dir, 'dump.json')}
         lock = multiprocessing.Manager().RLock()
-        result = _handle_multi_process(func, input_parma, result_df, lock)
+        result = _handle_multi_process(func, input_param, result_df, lock)
         self.assertTrue(result.equals(o_result))
 
     def test_read_dump_data(self):
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/data_dump/data_processor/test_pytorch_processor.py b/debug/accuracy_tools/msprobe/test/core_ut/data_dump/data_processor/test_pytorch_processor.py
index 34064e7cc2b..3d31a1bb516 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/data_dump/data_processor/test_pytorch_processor.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/data_dump/data_processor/test_pytorch_processor.py
@@ -19,6 +19,7 @@ from msprobe.core.data_dump.data_processor.pytorch_processor import (
     KernelDumpDataProcessor
 )
 from torch import distributed as dist
+from torch._subclasses import FakeTensorMode
 
 
 class TestPytorchDataProcessor(unittest.TestCase):
@@ -62,6 +63,15 @@ class TestPytorchDataProcessor(unittest.TestCase):
         result = PytorchDataProcessor.get_stat_info(mock_data)
         self.assertIsInstance(result, TensorStatInfo)
 
+    def test_get_stat_info_with_fake_tensor(self):
+        with FakeTensorMode() as fake_tensor_mode:
+            fake_tensor = fake_tensor_mode.from_tensor(torch.randn(1, 2, 3))
+        result = PytorchDataProcessor.get_stat_info(fake_tensor)
+        self.assertIsNone(result.max)
+        self.assertIsNone(result.min)
+        self.assertIsNone(result.mean)
+        self.assertIsNone(result.norm)
+
     def test_get_stat_info_float(self):
         tensor = torch.tensor([1.0, 2.0, 3.0])
         result = self.processor.get_stat_info(tensor)
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
index 035fe0c53a4..6f737789400 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/compare/test_ms_compare.py
@@ -8,6 +8,7 @@ import unittest
 from unittest.mock import patch
 
 import numpy as np
+import pandas as pd
 import torch
 import yaml
 
@@ -534,4 +535,28 @@ class TestUtilsMethods(unittest.TestCase):
 
         api_list = ["Mint"]
         with self.assertRaises(CompareException):
-            ms_comparator.get_api_name(api_list)
\ No newline at end of file
+            ms_comparator.get_api_name(api_list)
+
+    def test_process_data_name(self):
+        stack_mode = True
+        auto_analyze = True
+        fuzzy_match = False
+        dump_mode = Const.ALL
+
+        mode_config = ModeConfig(stack_mode, auto_analyze, fuzzy_match, dump_mode)
+        mapping_config = MappingConfig()
+        ms_comparator = MSComparator(mode_config, mapping_config)
+
+        data = pd.DataFrame({
+            'data_name_x': ['A', 'B', 'C'],
+            'data_name_y': ['X', 'Y', 'Z']
+        })
+
+        result = ms_comparator.process_data_name(data.copy())
+
+        expected = pd.DataFrame({
+            'data_name_x': [['A', 'X'], ['B', 'Y'], ['C', 'Z']],
+            'data_name_y': ['X', 'Y', 'Z']
+        })
+
+        pd.testing.assert_frame_equal(result, expected)
diff --git a/dynolog_npu/README.md b/dynolog_npu/README.md
index d6ebd6f7ff0..86a23b7f829 100644
--- a/dynolog_npu/README.md
+++ b/dynolog_npu/README.md
@@ -51,6 +51,8 @@ sudo yum install -y cmake ninja
 
 ### 3. 编译
 
+- dynolog编译
+
 默认编译生成dyno和dynolog二进制文件, -t参数可以支持将二进制文件打包成deb包或rpm包.
 
 ```bash
@@ -64,6 +66,10 @@ bash scripts/build.sh -t deb
 bash scripts/build.sh -t rpm
 ```
 
+- dynolog_npu_plugin wheel包编译
+
+dynolog_npu_plugin wheel包提供IPCMonitor，MsptiMonitor等公共能力，使用nputrace和npu-monitor功能前必须安装该wheel包，具体编译安装指导可参考dynolog_npu\plugin\README.md。
+
 ## 使用方式
 
 ### Profiler trace dump功能
@@ -112,7 +118,9 @@ nputrace子命令支持的参数选项
 
 - nputrace使用方法
 
-Step1： 拉起dynolog daemon进程
+Step0: 参考`3.编译`章节完成dynolog的编译，以及dynolog_npu_plugin wheel包的编译和安装。
+
+Step1：拉起dynolog daemon进程
 ```bash
 # 方法1：使用systemd拉起service
 # 修改配置文件/etc/dynolog.gflags, 使能ipc_monitor
diff --git a/dynolog_npu/plugin/README.md b/dynolog_npu/plugin/README.md
new file mode 100644
index 00000000000..0cd51633bb1
--- /dev/null
+++ b/dynolog_npu/plugin/README.md
@@ -0,0 +1,42 @@
+
+
+# Plugins for Dynolog NPU
+## 模块说明
+### IPCMonitor
+提供IPC(Inter-Process Communication)通信接口，用于实现
+1. IPC控制通道: profiler backend向dynolog daemon获取profiler配置
+
+
+__PyDynamicMonitorProxy__:  
+* `init_dyno` 向dynolog daemon发送注册请求
+  * input: npuId(int)
+  * return： None
+* `poll_dyno` 向dynolog daemon获取Profiler控制参数
+  * input: None
+  * return: str, 返回控制参数
+
+## 安装方式
+### 1. 通过shell脚本一键安装
+```
+chmod +x build.sh
+./build.sh
+```
+### 2. 手动安装
+* 安装依赖
+```
+pip install wheel
+pip install pybind11
+```
+* 编译whl包
+```
+python3 setup.py bdist_wheel
+```
+以上命令执行完成后在plugn/dist目录下生成dynolog_npu插件whl安装包dynolog-npu-plugin-{version}.whl
+* 安装
+```
+pip install dist/{dynolog-npu-plugin-{version}.wheel}
+```
+* 卸载
+```
+pip uninstall dynolog-npu-plugin
+```
\ No newline at end of file
diff --git a/dynolog_npu/plugin/Readme.md b/dynolog_npu/plugin/Readme.md
deleted file mode 100644
index c59bfffad5a..00000000000
--- a/dynolog_npu/plugin/Readme.md
+++ /dev/null
@@ -1,17 +0,0 @@
-
-
-# Build and Install npu-dynolog-plugin
-```
-# install pybind11
-pip install pybind11
-
-# build dynolog_npu_plugin wheel
-python3 setup.py bdist_wheel
-# install
-pip install dist/{dynolog-npu-plugin-xxx.wheel}
-
-# example
-import IPCMonitor
-dyno_worker = IPCMonitor.PyDynamicMonitorProxy()
-dyno_worker.init_dyno(0)
-```
diff --git a/dynolog_npu/plugin/ipc_monitor/DynoLogNpuMonitor.cpp b/dynolog_npu/plugin/ipc_monitor/DynoLogNpuMonitor.cpp
index 940f5aae167..bba66d7297a 100644
--- a/dynolog_npu/plugin/ipc_monitor/DynoLogNpuMonitor.cpp
+++ b/dynolog_npu/plugin/ipc_monitor/DynoLogNpuMonitor.cpp
@@ -1,7 +1,4 @@
 #include "DynoLogNpuMonitor.h"
-
-#include <iostream>
-
 #include "utils.h"
 
 namespace dynolog_npu {
@@ -10,13 +7,13 @@ namespace ipc_monitor {
 bool DynoLogNpuMonitor::Init()
 {
     if (isInitialized_) {
-        std::cout << "[WRARNING] DynoLog npu monitor already initialized" << std::endl;
+        LOG(ERROR) << "DynoLog npu monitor already initialized";
         return true;
     }
     bool res = ipcClient_.RegisterInstance(npuId_);
     if (res) {
         isInitialized_ = true;
-        std::cout << "[INFO] DynoLog npu monitor initialized success !" << std::endl;
+        LOG(INFO) << "DynoLog npu monitor initialized success!";
     }
     return res;
 }
@@ -24,11 +21,6 @@ bool DynoLogNpuMonitor::Init()
 std::string DynoLogNpuMonitor::Poll()
 {
     std::string res = ipcClient_.IpcClientNpuConfig();
-    if (res.empty()) {
-        std::cout << "[INFO] Request for dynolog server is empty !" << std::endl;
-        return "";
-    }
-    std::cout << "[INFO] Received NPU configuration successfully" << std::endl;
     return res;
 }
 
diff --git a/dynolog_npu/plugin/ipc_monitor/NpuIpcClient.cpp b/dynolog_npu/plugin/ipc_monitor/NpuIpcClient.cpp
index 97966e8eeac..ca2429f1e36 100644
--- a/dynolog_npu/plugin/ipc_monitor/NpuIpcClient.cpp
+++ b/dynolog_npu/plugin/ipc_monitor/NpuIpcClient.cpp
@@ -1,6 +1,5 @@
 #include "NpuIpcClient.h"
 
-#include <iostream>
 
 namespace dynolog_npu {
 namespace ipc_monitor {
@@ -15,14 +14,14 @@ bool IpcClient::RegisterInstance(int32_t id)
     std::unique_ptr<Message> message = Message::ConstructMessage<decltype(context)>(context, "ctxt");
     try {
         if (!SyncSendMessage(*message, std::string(DYNO_IPC_NAME))) {
-            std::cout << "[WARNING]Failed to send register ctxt for pid " << context.pid << " with dyno" << std::endl;
+            LOG(ERROR) << "Failed to send register ctxt for pid " << context.pid << " with dyno";
             return false;
         }
     } catch (const std::exception &e) {
-        std::cout << "[WARNING] Error when SyncSendMessage: " << e.what() << std::endl;
+        LOG(ERROR) << " Error when SyncSendMessage: " << e.what();
         return false;
     }
-    std::cout << "[INFO] Resigter pid " << context.pid << " for dynolog success !" << std::endl;
+    LOG(INFO) << "Resigter pid " << context.pid << " for dynolog success !";
     return true;
 }
 std::string IpcClient::IpcClientNpuConfig()
@@ -37,7 +36,7 @@ std::string IpcClient::IpcClientNpuConfig()
     }
     std::unique_ptr<Message> message = Message::ConstructMessage<NpuRequest, int32_t>(*req, "req", size);
     if (!SyncSendMessage(*message, std::string(DYNO_IPC_NAME))) {
-        std::cout << "[WARNING] Failed to send config  to dyno server fail !" << std::endl;
+        LOG(ERROR) << " Failed to send config  to dyno server fail !";
         free(req);
         req = nullptr;
         return "";
@@ -45,7 +44,7 @@ std::string IpcClient::IpcClientNpuConfig()
     free(req);
     message = PollRecvMessage(MAX_IPC_RETRIES, MAX_SLEEP_US);
     if (!message) {
-        std::cout << "[WARNING] Failed to receive on-demand config !" << std::endl;
+        LOG(ERROR) << " Failed to receive on-demand config !";
         return "";
     }
     std::string res = std::string(ReinterpretConvert<char *>(message->buf.get()), message->metadata.size);
@@ -65,7 +64,7 @@ std::unique_ptr<Message> IpcClient::ReceiveMessage()
 bool IpcClient::SyncSendMessage(const Message &message, const std::string &destName, int numRetry, int seepTimeUs)
 {
     if (destName.empty()) {
-        std::cout << "[WARNING] Can not send to empty socket name !" << std::endl;
+        LOG(ERROR) << " Can not send to empty socket name !";
         return false;
     }
     int i = 0;
@@ -79,7 +78,7 @@ bool IpcClient::SyncSendMessage(const Message &message, const std::string &destN
             seepTimeUs *= 2;  // 2: double sleep time
         }
     } catch (const std::exception &e) {
-        std::cout << "[ERROR] Error when SyncSendMessage: " << e.what() << std::endl;
+        LOG(ERROR) << " Error when SyncSendMessage: " << e.what();
         return false;
     }
     return i < numRetry;
@@ -94,7 +93,7 @@ bool IpcClient::Recv()
         try {
             successFlag = ep_.TryPeekMessage(*peekCtxt);
         } catch (std::exception &e) {
-            std::cout << "[ERROR] Error when TryPeekMessage: " << e.what() << std::endl;
+            LOG(ERROR) << " Error when TryPeekMessage: " << e.what();
             return false;
         }
         if (successFlag) {
@@ -108,7 +107,7 @@ bool IpcClient::Recv()
             try {
                 successFlag = ep_.TryRcvMessage(*recvCtxt);
             } catch (std::exception &e) {
-                std::cout << "[ERROR] Error when TryRecvMsg: " << e.what() << std::endl;
+                LOG(ERROR) << " Error when TryRecvMsg: " << e.what();
                 return false;
             }
             if (successFlag) {
@@ -118,7 +117,7 @@ bool IpcClient::Recv()
             }
         }
     } catch (std::exception &e) {
-        std::cout << "[ERROR] Error in Recv(): " << e.what() << std::endl;
+        LOG(ERROR) << " Error in Recv(): " << e.what();
         return false;
     }
     return false;
diff --git a/dynolog_npu/plugin/ipc_monitor/PyDynamicMonitorProxy.h b/dynolog_npu/plugin/ipc_monitor/PyDynamicMonitorProxy.h
index 8b5f88abf9d..0471a70a341 100644
--- a/dynolog_npu/plugin/ipc_monitor/PyDynamicMonitorProxy.h
+++ b/dynolog_npu/plugin/ipc_monitor/PyDynamicMonitorProxy.h
@@ -1,7 +1,7 @@
 #ifndef PYDYNAMIC_MONITOR_PROXY_H
 #define PYDYNAMIC_MONITOR_PROXY_H
 
-#include <iostream>
+#include <glog/logging.h>
 #include <memory>
 #include "MonitorBase.h"
 #include "DynoLogNpuMonitor.h"
@@ -14,15 +14,21 @@ public:
     PyDynamicMonitorProxy() = default;
     bool InitDyno(int npuId)
     {
-         try {
-             monitor_ = DynoLogNpuMonitor::GetInstance();
-             monitor_->SetNpuId(npuId);
-             bool res = monitor_->Init();
-             return res;
-         } catch (const std::exception &e) {
-             std::cout << "[ERROR] Error when init dyno " << e.what() << std::endl;
-             return false;
-         }
+        try {
+            if (!google::IsGoogleLoggingInitialized()) {
+                google::InitGoogleLogging("DynoLogNpuMonitor");
+                google::SetLogDestination(google::GLOG_INFO, "/var/log/dynolog_npu_");
+                google::SetLogFilenameExtension(".log");
+            }
+            monitor_ = DynoLogNpuMonitor::GetInstance();
+            monitor_->SetNpuId(npuId);
+            bool res = monitor_->Init();
+            LOG(ERROR) << res;
+            return res;
+        } catch (const std::exception &e) {
+            LOG(ERROR) << "Error when init dyno " << e.what();
+            return false;
+        }
     }
 
     std::string PollDyno()
diff --git a/dynolog_npu/plugin/ipc_monitor/utils.cpp b/dynolog_npu/plugin/ipc_monitor/utils.cpp
index 936821fd34b..b57942082e0 100644
--- a/dynolog_npu/plugin/ipc_monitor/utils.cpp
+++ b/dynolog_npu/plugin/ipc_monitor/utils.cpp
@@ -68,11 +68,11 @@ std::pair<int32_t, std::string> GetParentPidAndCommand(int32_t pid)
     if (std::getline(statFile, line)) {
         int ret = sscanf(line.c_str(), "%*d (%[^)]) %*c %d", command.data(), &parentPid);
         if (ret == 2) { // 2: 接收到2个字符
-            std::cout << "[INFO] Success to get parent pid: " << parentPid << std::endl;
+            LOG(INFO) << "Success to get parent pid: " << parentPid;
             return std::make_pair(parentPid, command);
         }
     }
-    std::cout << "[WARNING] Failed to parse /proc/" << pid << "/stat" << std::endl;
+    LOG(ERROR) << " Failed to parse /proc/" << pid << "/stat";
     return std::make_pair(0, "");
 }
 
diff --git a/dynolog_npu/plugin/ipc_monitor/utils.h b/dynolog_npu/plugin/ipc_monitor/utils.h
index 0d8ceb8cfd0..2374a27d417 100644
--- a/dynolog_npu/plugin/ipc_monitor/utils.h
+++ b/dynolog_npu/plugin/ipc_monitor/utils.h
@@ -10,7 +10,7 @@
 #include <sstream>
 #include <chrono>
 #include <iomanip>
-#include <iostream>
+#include <glog/logging.h>
 #include <unordered_map>
 
 
diff --git a/dynolog_npu/plugin/setup.py b/dynolog_npu/plugin/setup.py
index 151b9b3fb3f..55e924c6b69 100644
--- a/dynolog_npu/plugin/setup.py
+++ b/dynolog_npu/plugin/setup.py
@@ -13,25 +13,28 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 import os
+from glob import glob
 from setuptools import setup
 from pybind11.setup_helpers import Pybind11Extension
 
 BASE_DIR = os.path.dirname(os.path.realpath(__file__))
+DYNOLOG_PATH = os.path.join(os.path.dirname(BASE_DIR), "third_party", "dynolog")
+GLOG_INC_PATH = os.path.join(DYNOLOG_PATH, "third_party", "glog", "src")
+GLOG_LIB_PATH = os.path.join(DYNOLOG_PATH, "build", "third_party", "glog")
 
 # Define the extension module
 ext_modules = [
     Pybind11Extension(
         "IPCMonitor",  # Name of the Python module
-        sources=["bindings.cpp",
-                 "ipc_monitor/utils.cpp",
-                 "ipc_monitor/DynoLogNpuMonitor.cpp",
-                 "ipc_monitor/NpuIpcClient.cpp",
-                 ],  # Source files
-        include_dirs=[os.path.join(BASE_DIR, "ipc_monitor")],  # Include Pybind11 headers
+        sources=["bindings.cpp"] + list(glob("ipc_monitor/*.cpp")), # Source files
+        include_dirs=[os.path.join(BASE_DIR, "ipc_monitor"), GLOG_INC_PATH, GLOG_LIB_PATH],  # Include Pybind11 headers
+        library_dirs=[GLOG_LIB_PATH],
+        libraries=["glog"],
         language="c++",  # Specify the language
     ),
 ]
 
+
 # Set up the package
 setup(
     name="dynolog_npu_plugin",
diff --git a/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py b/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
index fa62cd6f895..983cd296252 100644
--- a/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
+++ b/profiler/msprof_analyze/advisor/analyzer/computation/ai_core_performance/ai_core_performance_checker.py
@@ -306,7 +306,7 @@ class AICorePerformanceChecker:
         aic_fixpipe_ratio = self.safe_divide(aic_fixpipe_ratio, length)
         aic_mte2_ratio = self.safe_divide(aic_mte2_ratio, length)
         if aic_mte2_ratio is None or aic_fixpipe_ratio is None:
-            return None, None, None
+            return None, None, None, None
         aic_fixpipe_ratio_rule, aic_mte2_ratio_rule = None, None
         for rule in self._operator_rules["fa_operators"]:
             if rule["target"] == "aic_fixpipe_ratio":
@@ -341,7 +341,7 @@ class AICorePerformanceChecker:
         aiv_vec_ratio = self.safe_divide(aiv_vec_ratio, length)
         aic_mte2_ratio = self.safe_divide(aic_mte2_ratio, length)
         if aiv_vec_ratio is None or aic_mte2_ratio is None:
-            return None, None, None
+            return None, None, None, None
         aiv_vec_ratio_rule, aic_mte2_ratio_rule = None, None
         for rule in self._operator_rules["fa_operators"]:
             if rule["target"] == "aiv_vec_ratio":
diff --git a/profiler/msprof_analyze/cluster_analyse/README.md b/profiler/msprof_analyze/cluster_analyse/README.md
index 325a0984793..c66afcc6a5d 100644
--- a/profiler/msprof_analyze/cluster_analyse/README.md
+++ b/profiler/msprof_analyze/cluster_analyse/README.md
@@ -79,6 +79,8 @@ experimental_config = torch_npu.profiler._ExperimentalConfig(
    | compute_op_sum       | 集群场景性能数据的device运行算子信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。--export_type为db时，输出交付件cluster_analysis.db；--export_type为notebook时，在cluster_analysis_output/ComputeOpSum目录下输出交付件stats.ipynb；可根据实际情况决定是否是否打开--exclude_op_name。 | 否       |
    | hccl_sum             | 集合通信算子耗时分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。--export_type为db时，输出交付件cluster_analysis.db；--export_type为notebook时，在cluster_analysis_output/HcclSum目录下输出交付件stats.ipynb。 | 否       |
    | mstx_sum             | 集群场景mstx打点信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。--export_type为db时，输出交付件cluster_analysis.db；--export_type为notebook时，在cluster_analysis_output/MstxSum目录下输出交付件stats.ipynb。 | 否       |
+   | freq_analysis        | 集群场景aicore frequency信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。打屏输出是否存在aicore存在空闲（频率为800MHz）、异常（频率不为1800MHz或800MHz）的现象。如果有，则在输出交付件cluster_analysis.db增加对应的卡和频率信息。 | 否       |
+   | slow_rank            | 集群场景通信算子快慢卡汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。输出交付件cluster_analysis.db中展示各个rank按照当前的快慢卡统计算法得出的快慢卡影响次数。
    | 自定义分析参数       | 与cann_api_sum、compute_op_sum、hccl_sum等参数功能类似，用户可自定义一套性能数据的分析规则，需要详细了解性能分析的开发人员，具体开发指导请参见“[自定义分析规则开发指导](#自定义分析规则开发指导)”。 | 否       |
    
    --parallel_mode参数示例如下：
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
index 2ad5797cc92..3839fe66aac 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
@@ -22,6 +22,8 @@ from msprof_analyze.prof_common.db_manager import DBManager
 from msprof_analyze.cluster_analyse.common_func.utils import increase_shared_value
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.cluster_analyse.common_func.utils import double_hash
+from msprof_analyze.prof_common.file_manager import FileManager
 
 logger = get_logger()
 
@@ -70,30 +72,46 @@ class CommMatrixAnalysis(BaseAnalysis):
         self.combine_link_info(step_dict)
 
     def merge_same_links(self, step_dict: dict):
-        def process_link_key(rank_id, rank_dict):
+        def update_rank_map(step_dict):
+            for op_name, op_dict in step_dict.items():
+                group_name = op_name.split("@")[-1]
+                for rank_id, rank_dict in op_dict.items():
+                    for link_key in rank_dict:
+                        if '-' not in link_key:
+                            logger.warning("%s has an invalid link key %s!", str(op_name), str(link_key))
+                            break
+                        src_rank = link_key.split('-')[0]
+                        dst_rank = link_key.split('-')[1]
+                        if src_rank == dst_rank:
+                            if src_rank not in project_local_global_rank_map.get(group_name, {}):
+                                project_local_global_rank_map.setdefault(group_name, {})[src_rank] = rank_id
+                            elif project_local_global_rank_map.get(group_name, {}).get(src_rank) != rank_id:
+                                logger.warning(f"In the same communication group {group_name}, global rank {rank_id} "
+                                               f"and {project_local_global_rank_map.get(group_name, {}).get(src_rank)} "
+                                               f"get the same local rank {src_rank}!")
+
+        def process_link_key(rank_dict):
             for link_key in rank_dict:
                 if '-' not in link_key:
                     logger.warning("%s has an invalid link key %s!", str(op_name), str(link_key))
                     break
-                src_rank = link_key.split('-')[0]
-                dst_rank = link_key.split('-')[1]
-                if src_rank == dst_rank:
-                    if src_rank not in project_local_global_rank_map:
-                        project_local_global_rank_map[src_rank] = rank_id
-                    elif project_local_global_rank_map.get(src_rank) != rank_id:
-                        logger.warning("In the same communication group, local ranks projecting to global ranks "
-                                       "repeat!")
                 self.combine_link(link_info[link_key], rank_dict[link_key])
 
-        def convert_local_to_global_rank():
+        def convert_local_to_global_rank(rank_map):
             tmp_link = {}
             for link_key, link_dict in link_info.items():
                 src_rank = link_key.split('-')[0]
                 dst_rank = link_key.split('-')[1]
-                src_rank = project_local_global_rank_map[src_rank] \
-                    if src_rank in project_local_global_rank_map else src_rank
-                dst_rank = project_local_global_rank_map[dst_rank] \
-                    if dst_rank in project_local_global_rank_map else dst_rank
+                if src_rank not in rank_map:
+                    logger.warning(f"The src local rank {src_rank} of the operator {op_name} "
+                                   f"cannot be mapped to the global rank.")
+                    continue
+                if dst_rank not in rank_map:
+                    logger.warning(f"The dst local rank {dst_rank} of the operator {op_name} "
+                                   f"cannot be mapped to the global rank.")
+                    continue
+                src_rank = rank_map[src_rank]
+                dst_rank = rank_map[dst_rank]
                 link_dict[Constant.BANDWIDTH_GB_S] = \
                     self.compute_ratio(link_dict.get(Constant.TRANSIT_SIZE_MB, 0),
                                        link_dict.get(Constant.TRANSIT_TIME_MS, 0))
@@ -106,12 +124,14 @@ class CommMatrixAnalysis(BaseAnalysis):
             Constant.TRANSIT_SIZE_MB: 0,
             Constant.OP_NAME: ''
         }
+        project_local_global_rank_map = self.get_parallel_group_info()
+        update_rank_map(step_dict)
         for op_name, op_dict in step_dict.items():
             link_info = defaultdict(lambda: copy.deepcopy(default_value))
-            project_local_global_rank_map = dict()
-            for rank_id, rank_dict in op_dict.items():
-                process_link_key(rank_id, rank_dict)
-            step_dict[op_name] = convert_local_to_global_rank()
+            group_name = op_name.split("@")[-1]
+            for rank_dict in op_dict.values():
+                process_link_key(rank_dict)
+            step_dict[op_name] = convert_local_to_global_rank(project_local_global_rank_map.get(group_name, {}))
 
     def combine_link_info(self, step_dict: dict):
         default_value = {
@@ -131,6 +151,19 @@ class CommMatrixAnalysis(BaseAnalysis):
                                    link_dict.get(Constant.TRANSIT_TIME_MS, 0))
         step_dict[Constant.TOTAL_OP_INFO] = total_op_info
 
+    def get_parallel_group_info(self):
+        parallel_group_info = {}
+        for profiler_path in self.data_map.values():
+            meta_json = os.path.join(profiler_path, "profiler_metadata.json")
+            if os.path.exists(meta_json):
+                meta_data = FileManager.read_json_file(meta_json)
+                for group_name, group_info in meta_data.get("parallel_group_info", {}).items():
+                    global_ranks = group_info.get("global_ranks")
+                    if isinstance(global_ranks, list) and global_ranks:
+                        global_ranks.sort()
+                        parallel_group_info[double_hash(group_name)] = dict(enumerate(global_ranks))
+        return parallel_group_info
+
 
 class CommMatrixAnalysisOptimized(CommMatrixAnalysis):
     SAVED_JSON = "cluster_communication_matrix.json"
diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
index 04953b0edfc..5c3e3f11fe1 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
@@ -86,7 +86,10 @@ class MsprofDataPreprocessor(DataPreprocessor):
 
     def _find_info_json_file(self, dir_name):
         for file_name in os.listdir(dir_name):
-            for device_file in os.listdir(os.path.join(dir_name, file_name)):
+            file_path = os.path.join(dir_name, file_name)
+            if not os.path.isdir(file_path):
+                continue
+            for device_file in os.listdir(file_path):
                 if re.match(self.INFO_JSON_PATTERN, device_file):
                     return os.path.join(dir_name, file_name, device_file)
         return None
diff --git a/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py b/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
index 27daae78cb9..deec149e08c 100644
--- a/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
+++ b/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
@@ -39,3 +39,7 @@ class TableConstant:
     DST_RANK = "dst_rank"
     TRANSPORT_TYPE = "transport_type"
     OPNAME = "op_name"
+    GROUP_ID = "group_id"
+    PG_NAME = "pg_name"
+    NAME = "name"
+    VALUE = "value"
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
index ed60873a1ef..4b966c69684 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
@@ -109,7 +109,7 @@ class BaseRecipeAnalysis(ABC):
             result_db = custom_db_path if custom_db_path else os.path.join(self.output_path, file_name)
             conn, cursor = DBManager.create_connect_db(result_db)
             if isinstance(data, pd.DataFrame):
-                data.to_sql(table_name, conn, if_exists='replace', index=True)
+                data.to_sql(table_name, conn, if_exists='replace', index=index)
             else:
                 logger.error(f"Unknown dump data type: {type(data)}")
             DBManager.destroy_db_connect(conn, cursor)
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/__init__.py b/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/__init__.py
new file mode 100644
index 00000000000..e69de29bb2d
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py b/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py
new file mode 100644
index 00000000000..5fc51d6bc73
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py
@@ -0,0 +1,122 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import json
+import os
+import pandas as pd
+
+from cluster_analyse.common_func.utils import double_hash
+from cluster_analyse.common_func.table_constant import TableConstant
+from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.logger import get_logger
+from prof_common.database_service import DatabaseService
+
+logger = get_logger()
+
+
+class CommGroupMap(BaseRecipeAnalysis):
+    COMMUNICATION_GROUP_MAPPING_TABLE = "CommunicationGroupMapping"
+
+    def __init__(self, params):
+        super().__init__(params)
+        logger.info("CommGroupMap init.")
+        self.group_df = None
+
+    @property
+    def base_dir(self):
+        return os.path.basename(os.path.dirname(__file__))
+
+    @staticmethod
+    def get_comm_type_from_op_name(op_name: str):
+        op_name_lower = op_name.lower()
+        return Constant.P2P if ("send" in op_name_lower or "receive" in op_name_lower or "recv" in op_name_lower) \
+               else Constant.COLLECTIVE
+
+    def run(self, context):
+        mapper_res = self.mapper_func(context)
+        self.reducer_func(mapper_res)
+        if self._export_type == Constant.DB:
+            self.save_db()
+        else:
+            logger.error(f"CommGroupMap: {self._export_type} is not supported for export type.")
+
+    def reducer_func(self, mapper_res):
+        # concat and process all comm group
+        comm_group_df_list = [df for df, _ in mapper_res]
+        comm_group_combined_df = pd.concat(comm_group_df_list).drop_duplicates()
+        comm_group_combined_df = (comm_group_combined_df.groupby([TableConstant.TYPE, TableConstant.GROUP_NAME])
+                                  [TableConstant.RANK_ID].apply(lambda x: sorted(set(x))).reset_index())
+        comm_group_combined_df[TableConstant.RANK_SET] = (comm_group_combined_df[TableConstant.RANK_ID].
+                                                          apply(lambda x: "(" + ",".join(str(i) for i in x) + ")"))
+
+        comm_group_combined_df = comm_group_combined_df.drop(columns=[TableConstant.RANK_ID])
+        # concat all parallel group info
+        parallel_info_df_list = [df for _, df in mapper_res]
+        parallel_info_combined_df = pd.concat(parallel_info_df_list).drop_duplicates()
+        # merge by group_name
+        group_df = pd.merge(comm_group_combined_df, parallel_info_combined_df, on=TableConstant.GROUP_NAME, how="left")
+        group_df.fillna("", inplace=True)
+        # column order
+        column_order = [TableConstant.TYPE, TableConstant.RANK_SET, TableConstant.GROUP_NAME,
+                        TableConstant.GROUP_ID, TableConstant.PG_NAME]
+        self.group_df = group_df[column_order]
+
+    def save_db(self):
+        self.dump_data(self.group_df, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER,
+                       self.COMMUNICATION_GROUP_MAPPING_TABLE, index=False)
+
+    def _mapper_func(self, data_map, analysis_class):
+        rank_id = data_map.get(Constant.RANK_ID)
+        # read CommAnalyzerTime table
+        analysis_db_path = data_map.get(Constant.ANALYSIS_DB_PATH)
+        analysis_data_service = DatabaseService(analysis_db_path, {})
+        analysis_data_service.add_table_for_query(Constant.TABLE_COMM_ANALYZER_TIME,
+                                                  [TableConstant.HCCL_OP_NAME, TableConstant.GROUP_NAME])
+        comm_time_res = analysis_data_service.query_data()
+        # process comm_time_df: group_name, type, rank_id
+        comm_time_df = comm_time_res.get(Constant.TABLE_COMM_ANALYZER_TIME)
+        comm_time_df[TableConstant.RANK_ID] = rank_id
+        comm_time_df[TableConstant.TYPE] = (comm_time_df[TableConstant.HCCL_OP_NAME].
+                                            apply(lambda x: self.get_comm_type_from_op_name(x)))
+        comm_time_df = comm_time_df.drop(columns=[TableConstant.HCCL_OP_NAME])
+        comm_time_df = comm_time_df.drop_duplicates()
+
+        # read META_DATA table
+        profiler_db_path = data_map.get(Constant.PROFILER_DB_PATH)
+        profiler_data_service = DatabaseService(profiler_db_path, {})
+        profiler_data_service.add_table_for_query(Constant.TABLE_META_DATA,
+                                                  [TableConstant.NAME, TableConstant.VALUE])
+        meta_data_res = profiler_data_service.query_data()
+        meta_data_df = meta_data_res.get(Constant.TABLE_META_DATA)
+        # process parallel_info_df
+        parallel_info_df = pd.DataFrame(columns=[TableConstant.GROUP_NAME,
+                                                 TableConstant.GROUP_ID, TableConstant.PG_NAME])
+        if Constant.PARALLEL_GROUP_INFO not in meta_data_df[TableConstant.NAME].values:
+            return comm_time_df, parallel_info_df
+        info_str = meta_data_df.loc[meta_data_df[TableConstant.NAME] == Constant.PARALLEL_GROUP_INFO,
+                                    TableConstant.VALUE].values[0]
+        info_dict = json.loads(info_str)
+        for group_id, parallel_info in info_dict.items():
+            group_name = str(double_hash(group_id))  # group_name is hashed group_id
+            pg_name = parallel_info.get(TableConstant.GROUP_NAME, "")
+            if not pg_name:
+                continue
+            parallel_info_df.loc[parallel_info_df.shape[0]] = [group_name, group_id, pg_name]
+
+        return comm_time_df, parallel_info_df
+
+
+
+
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/__init__.py b/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/__init__.py
new file mode 100644
index 00000000000..e69de29bb2d
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
new file mode 100644
index 00000000000..2c65fda98e0
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/freq_analysis/freq_analysis.py
@@ -0,0 +1,108 @@
+# Copyright (c) 2024, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+from collections import defaultdict
+import pandas as pd
+
+from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.prof_common.database_service import DatabaseService
+
+logger = get_logger()
+
+
+class FreqAnalysis(BaseRecipeAnalysis):
+    COMMON_FREQ = 1800
+    FREE_FREQ = 800
+
+    def __init__(self, params):
+        super().__init__(params)
+        self.free_freq_ranks = []
+        self.abnormal_freq_ranks = []
+        self.abnormal_freq_ranks_map = {}
+
+    @property
+    def base_dir(self):
+        return os.path.basename(os.path.dirname(__file__))
+
+    def reducer_func(self, mapper_res):
+        if self._is_msprof:
+            logger.warning("Freq analysis do not support msprof db now.")
+            return
+        mapper_res = list(filter(lambda res: res[0] is not None, mapper_res))
+        if not mapper_res:
+            logger.error("Mapper data is None, load profiling data failed.")
+            return
+        for freqs, rank_id in mapper_res:
+            if freqs == [self.COMMON_FREQ]:
+                continue
+            elif set(freqs) == {self.COMMON_FREQ, self.FREE_FREQ}:
+                self.free_freq_ranks.append(rank_id)
+            else:
+                self.abnormal_freq_ranks.append(rank_id)
+                self.abnormal_freq_ranks_map[rank_id] = str(freqs)
+        self.free_freq_ranks.sort()
+        self.abnormal_freq_ranks.sort()
+
+    def save_db(self):
+        if len(self.free_freq_ranks) > 0:
+            logger.info(f"Found {len(self.free_freq_ranks)} ranks with free time, "
+                        f"aicore frequency in {[self.FREE_FREQ, self.COMMON_FREQ]}.")
+            free_ranks_df = pd.DataFrame()
+            free_ranks_df["rankId"] = self.free_freq_ranks
+            free_ranks_df["aicoreFrequency"] = str([self.FREE_FREQ, self.COMMON_FREQ])
+            free_ranks_df.set_index(["rankId"], inplace=True)
+            self.dump_data(free_ranks_df, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER, "FreeFrequencyRanks")
+        else:
+            logger.info("No rank found with free time.")
+        if len(self.abnormal_freq_ranks) > 0:    
+            logger.info(f"Found {len(self.abnormal_freq_ranks)} ranks with abnormal aicore frequency.")
+
+            abnormal_ranks_df = pd.DataFrame.from_dict(self.abnormal_freq_ranks_map, 
+                                                       orient="index", columns=["aicoreFrequency"])
+            abnormal_ranks_df = abnormal_ranks_df.reset_index().rename(columns={"index": "rankId"})
+            abnormal_ranks_df.set_index(["rankId"], inplace=True)
+            self.dump_data(abnormal_ranks_df, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER, "AbnormalFrequencyRanks")
+        else:
+            logger.info("No rank found with abnormal aicore frequency.")
+        if len(self.free_freq_ranks) > 0 or len(self.abnormal_freq_ranks) > 0:
+            logger.info("Please verify result in output file.")
+
+    def run(self, context):
+        mapper_res = self.mapper_func(context)
+        self.reducer_func(mapper_res)
+        self.save_db()
+
+    def _mapper_func(self, data_map, analysis_class):
+        profiler_db_path = data_map.get(Constant.PROFILER_DB_PATH)
+        service = DatabaseService(profiler_db_path, None)
+        service.add_table_for_query("AICORE_FREQ", ["deviceId", "freq"])
+        service.add_table_for_query("RANK_DEVICE_MAP", ["rankId"])
+        service_res = service.query_data()
+        aic_freq = service_res.get("AICORE_FREQ", None)
+        rank_id = service_res.get("RANK_DEVICE_MAP", None)
+        if aic_freq is None or aic_freq.empty:
+            logger.error(f"No aic freq data found in {profiler_db_path}.")
+            return None, None
+        if rank_id is None or rank_id.empty:
+            logger.error(f"No rank_id data found in {profiler_db_path}.")
+            return None, None
+        rank_id = rank_id["rankId"].values[0]
+        freq_arr = aic_freq["freq"].values
+        freqs = list(set(freq_arr))
+        freqs.sort()
+        return freqs, rank_id
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/dixon_table.py b/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/dixon_table.py
new file mode 100644
index 00000000000..7bf7e2c8062
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/dixon_table.py
@@ -0,0 +1,117 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+# 单边狄克逊检验表，995置信度
+DIXON_TABLE_995 = {
+    3: 0.994,
+    4: 0.920,
+    5: 0.823,
+    6: 0.744,
+    7: 0.680,
+    8: 0.723,
+    9: 0.676,
+    10: 0.638,
+    11: 0.707,
+    12: 0.675,
+    13: 0.649,
+    14: 0.672,
+    15: 0.649,
+    16: 0.629,
+    17: 0.611,
+    18: 0.595,
+    19: 0.580,
+    20: 0.568,
+    21: 0.556,
+    22: 0.545,
+    23: 0.536,
+    24: 0.526,
+    25: 0.519,
+    26: 0.510,
+    27: 0.503,
+    28: 0.496,
+    29: 0.489,
+    30: 0.484,
+    31: 0.478,
+    32: 0.473,
+    33: 0.468,
+    34: 0.463,
+    35: 0.458,
+    36: 0.454,
+    37: 0.450,
+    38: 0.446,
+    39: 0.442,
+    40: 0.439,
+    41: 0.435,
+    42: 0.432,
+    43: 0.429,
+    44: 0.425,
+    45: 0.423,
+    46: 0.420,
+    47: 0.417,
+    48: 0.414,
+    49: 0.412,
+    50: 0.409,
+    51: 0.407,
+    52: 0.405,
+    53: 0.402,
+    54: 0.400,
+    55: 0.398,
+    56: 0.396,
+    57: 0.394,
+    58: 0.392,
+    59: 0.391,
+    60: 0.388,
+    61: 0.387,
+    62: 0.385,
+    63: 0.383,
+    64: 0.382,
+    65: 0.380,
+    66: 0.379,
+    67: 0.377,
+    68: 0.376,
+    69: 0.374,
+    70: 0.372,
+    71: 0.371,
+    72: 0.370,
+    73: 0.368,
+    74: 0.368,
+    75: 0.366,
+    76: 0.365,
+    77: 0.364,
+    78: 0.363,
+    79: 0.361,
+    80: 0.360,
+    81: 0.359,
+    82: 0.358,
+    83: 0.356,
+    84: 0.356,
+    85: 0.355,
+    86: 0.353,
+    87: 0.352,
+    88: 0.352,
+    89: 0.351,
+    90: 0.350,
+    91: 0.349,
+    92: 0.348,
+    93: 0.347,
+    94: 0.346,
+    95: 0.345,
+    96: 0.344,
+    97: 0.344,
+    98: 0.343,
+    99: 0.341,
+    100: 0.341,
+}
\ No newline at end of file
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/slow_rank.py b/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/slow_rank.py
new file mode 100644
index 00000000000..9d902b1598a
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/slow_rank.py
@@ -0,0 +1,175 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+from collections import defaultdict
+
+import pandas as pd
+import numpy as np
+
+from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.prof_exports.cluster_time_summary_export import CommunicationTimeExport
+from msprof_analyze.cluster_analyse.recipes.slow_rank.dixon_table import DIXON_TABLE_995
+
+logger = get_logger()
+
+
+def judge_norm(time_list, threshold=3):
+    t_max = max(time_list)
+    t_min = min(time_list)
+    t_mean = np.mean(time_list)
+    t_std = np.std(time_list)
+    threshold_high = t_mean + threshold * t_std
+    threshold_low = t_mean - threshold * t_std
+
+    # 耗时低于下阈值的卡认为是慢卡
+    outliers_idx = [i for i, time in enumerate(time_list) if time < threshold_low]
+
+    # 如果存在高于上阈值的卡，则将耗时最短的卡加到慢卡的list中
+    if t_max > threshold_high:
+        if time_list.index(t_min) not in outliers_idx:
+            outliers_idx.append(time_list.index(t_min))
+    return outliers_idx
+
+
+def judge_dixon(time_list):
+    n = len(time_list)
+    if n in [0, 1, 2]:
+        return []
+    sorted_list = sorted(time_list)
+
+    # 判断计算检验指标时分母是否可能为0
+    if len(set(sorted_list)) <= 3:
+        return []
+
+    # 计算狄克逊检验的检验指标，次小值和最小值差，比上最大值和最小值的差。根据数据数量改变次小值和最大值的选取
+    if n <= Constant.MAX_DIXON_NUM:
+        if n <= Constant.DIXON_THRESHOLD_1:
+            flag = (sorted_list[1] - sorted_list[0]) / (sorted_list[-1] - sorted_list[0])
+        elif n <= Constant.DIXON_THRESHOLD_2:
+            flag = (sorted_list[1] - sorted_list[0]) / (sorted_list[-2] - sorted_list[0])
+        elif n <= Constant.DIXON_THRESHOLD_3:
+            flag = (sorted_list[2] - sorted_list[0]) / (sorted_list[-2] - sorted_list[0])
+        else:
+            flag = (sorted_list[2] - sorted_list[0]) / (sorted_list[-3] - sorted_list[0])
+        
+        # 根据数据数量查表，若计算的检验指标较大，则认为有异常值，耗时最短的卡是慢卡
+        if flag > DIXON_TABLE_995[n]:
+            return [time_list.index(sorted_list[0])]
+    return []
+
+
+def judge_slow_rank(time_list):
+    """根据time list长度 选择狄克逊检验或三倍标准差"""
+    if len(time_list) <= Constant.MAX_DIXON_NUM:
+        return judge_dixon(time_list)
+    else:
+        return judge_norm(time_list)
+
+
+class SlowRankAnalysis(BaseRecipeAnalysis):
+    def __init__(self, params):
+        super().__init__(params)
+        logger.info("Slow Rank Analysis init.")
+
+    @property
+    def base_dir(self):
+        return os.path.basename(os.path.dirname(__file__))
+
+    def reducer_func(self, mapper_res):
+        mapper_res = list(filter(lambda df: df is not None, mapper_res))
+        if not mapper_res:
+            logger.error("Mapper data is None.")
+            return None
+        concated_df = pd.concat(mapper_res)
+        return concated_df
+
+    def run(self, context):
+        if self._is_msprof:
+            logger.warning("Slow rank analysis do not support msprof db now.")
+            return
+
+        mapper_res = self.mapper_func(context)
+        comm_ops_df = self.reducer_func(mapper_res)
+        if comm_ops_df is None:
+            return
+
+        analyzer = SlowRankVoteAnalysis(comm_ops_df)
+        perpector_df = analyzer.run()
+        self.save_db(perpector_df) 
+
+    def save_db(self, perpector_df):
+        self.dump_data(perpector_df, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER, "SlowRank")
+            
+    def _mapper_func(self, data_map, analysis_class):
+        profiler_db_path = data_map.get(Constant.PROFILER_DB_PATH)
+        step_range = data_map.get(Constant.STEP_RANGE)
+        df = CommunicationTimeExport(profiler_db_path, analysis_class, step_range).read_export_db()
+        return df
+
+
+class SlowRankVoteAnalysis:
+    def __init__(self, comm_ops):
+        self.comm_ops = comm_ops
+
+    def grouping_ops(self):
+        """按照通信域、算子名称对通信算子进行分组"""
+        grouped_ops_dict = defaultdict(lambda: defaultdict(list))
+        self.comm_ops = self.comm_ops[~self.comm_ops["opName"].str.contains("send")]
+        self.comm_ops = self.comm_ops[~self.comm_ops["opName"].str.contains("receive")]
+        grouped_df = self.comm_ops.groupby("groupName")
+        exclude_groups = []
+        for group_name in grouped_df.groups.keys():
+            ops_groupby_group_name = grouped_df.get_group(group_name)
+            ops_num = ops_groupby_group_name.groupby("opName").size().values
+            if len(set(ops_num)) > 1:
+                exclude_groups.append(group_name)
+        for exclude_group in exclude_groups:
+            self.comm_ops.drop(self.comm_ops[self.comm_ops["groupName"] == exclude_group].index, inplace=True)
+        self.comm_ops.reset_index(drop=True, inplace=True)
+        n = len(self.comm_ops)
+        group_name_arr = self.comm_ops["groupName"].values
+        op_name_arr = self.comm_ops["opName"].values
+        for idx in range(n):
+            group_name = group_name_arr[idx]
+            op_name = op_name_arr[idx]
+            grouped_ops_dict[group_name][op_name].append(idx)
+        return grouped_ops_dict
+
+    def run(self):
+        grouped_ops_dict = self.grouping_ops()
+        perpector_dict = self.analysis(grouped_ops_dict)
+        return perpector_dict
+
+    def analysis(self, grouped_ops_dict):
+        rank_id_arr = self.comm_ops["rankId"].values
+        comm_time_arr = self.comm_ops["communication_time"].values
+        perpector_dict = defaultdict(lambda: 0)
+        for _, ops_same_group in grouped_ops_dict.items():
+            for _, ops_list in ops_same_group.items():
+                time_list = [comm_time_arr[op_idx] for op_idx in ops_list]
+                perpector_rank_idx = judge_slow_rank(time_list)
+                if perpector_rank_idx:
+                    for rank_idx in perpector_rank_idx:
+                        slow_rank = rank_id_arr[ops_list[rank_idx]]
+                        perpector_dict[slow_rank] += 1
+
+        perpector_df = pd.DataFrame(columns=["rankId", "slowAffectCount"])
+        for rank, perpector_times in perpector_dict.items():
+            perpector_df.loc[len(perpector_df)] = [rank, perpector_times]
+        perpector_df.set_index(["rankId"], inplace=True)
+        return perpector_df
diff --git a/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/overall_metrics_bean.py b/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/overall_metrics_bean.py
index 059416ec15e..4c040612033 100644
--- a/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/overall_metrics_bean.py
+++ b/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/overall_metrics_bean.py
@@ -68,11 +68,39 @@ class OverallMetricsBean:
 
         base_group_data = self._base_data.get("group", {})
         comparison_group_data = self._comparison_data.get("group", {})
+        base_pg_name_dict = self._base_data.get("pg_name_dict", {})
+        comparison_pg_name_dict = self._comparison_data.get("pg_name_dict", {})
         default_value = [0, 0, "/"]
+        # deal base and comparsion data which can match with pg_name
+        for base_pg_name, base_group_name_list in base_pg_name_dict.items():
+            if len(base_group_name_list) != 1 or base_pg_name == Constant.UNKNOWN:
+                continue
+            comparison_group_name_list = comparison_pg_name_dict.get(base_pg_name, [])
+            if len(comparison_group_name_list) != 1:
+                continue
+
+            base_data = base_group_data.pop(base_group_name_list[0], {})
+            comparison_data = comparison_group_data.pop(comparison_group_name_list[0], {})
+            description = f"\t{base_pg_name}: Communication"
+            ExcelConfig.ROW_STYLE_MAP[description] = CellFormatType.LIGHT_BLUE_NORMAL
+            self._append_data(rows_data,
+                              self._get_row_data(description,
+                                                base_data.get(ExcelConfig.COMMUNICATION_TIME, default_value),
+                                                comparison_data.get(ExcelConfig.COMMUNICATION_TIME, default_value)))
+            self._append_data(rows_data,
+                              self._get_row_data(ExcelConfig.WAIT, base_data.get(ExcelConfig.WAIT, default_value),
+                                                 comparison_data.get(ExcelConfig.WAIT, default_value)))
+            self._append_data(rows_data,
+                              self._get_row_data(ExcelConfig.TRANSMIT,
+                                                 base_data.get(ExcelConfig.TRANSMIT, default_value),
+                                                 comparison_data.get(ExcelConfig.TRANSMIT, default_value)))
+
         for group_name, base_data in base_group_data.items():
             comparison_data = comparison_group_data.pop(group_name, {})
-            self._append_data(rows_data, self._get_row_data(group_name, base_data.get("group", default_value),
-                                                            comparison_data.get("group", default_value)))
+            self._append_data(rows_data,
+                              self._get_row_data(base_data.get("description", group_name),
+                                                 base_data.get(ExcelConfig.COMMUNICATION_TIME, default_value),
+                                                 comparison_data.get(ExcelConfig.COMMUNICATION_TIME, default_value)))
             self._append_data(rows_data,
                               self._get_row_data(ExcelConfig.WAIT, base_data.get(ExcelConfig.WAIT, default_value),
                                                  comparison_data.get(ExcelConfig.WAIT, default_value)))
@@ -81,8 +109,10 @@ class OverallMetricsBean:
                                                  base_data.get(ExcelConfig.TRANSMIT, default_value),
                                                  comparison_data.get(ExcelConfig.TRANSMIT, default_value)))
         for group_name, comparison_data in comparison_group_data.items():
-            self._append_data(rows_data, self._get_row_data(group_name, default_value,
-                                                            comparison_data.get("group", default_value)))
+            self._append_data(rows_data,
+                              self._get_row_data(comparison_data.get("description", group_name),
+                                                 default_value,
+                                                 comparison_data.get(ExcelConfig.COMMUNICATION_TIME, default_value)))
             self._append_data(rows_data, self._get_row_data(ExcelConfig.WAIT, default_value,
                                                             comparison_data.get(ExcelConfig.WAIT, default_value)))
             self._append_data(rows_data, self._get_row_data(ExcelConfig.TRANSMIT, default_value,
@@ -373,13 +403,17 @@ class OverallMetricsInfo:
         }
         if self._comm_group_list:
             for group_name in self._comm_group_list:
-                group_name_index = f"\t{group_name}"
-                ExcelConfig.ROW_STYLE_MAP[group_name_index] = CellFormatType.LIGHT_BLUE_NORMAL
-                overall_metrics_data.setdefault("group", {})[group_name_index] = {
-                    "group": self.communication_data_by_group(group_name),
+                pg_name = self._profiling_info.get_pg_name_by_group(group_name)
+                description = " ".join([pg_name + ":" if pg_name != Constant.UNKNOWN else "", group_name]).strip()
+                ExcelConfig.ROW_STYLE_MAP[f"\t{description}"] = CellFormatType.LIGHT_BLUE_NORMAL
+                overall_metrics_data.setdefault("group", {})[group_name] = {
+                    "description": f"\t{description}",
+                    ExcelConfig.COMMUNICATION_TIME: self.communication_data_by_group(group_name),
                     ExcelConfig.WAIT: self.wait_data_by_group(group_name),
                     ExcelConfig.TRANSMIT: self.transmit_data_by_group(group_name)
                 }
+                overall_metrics_data.setdefault("pg_name_dict", {}).setdefault(pg_name, []).append(group_name)
+
         for kernel_name in self._profiling_info.mc2_time_dict.keys():
             mc2_name_index = f"\t{kernel_name}"
             ExcelConfig.ROW_STYLE_MAP[mc2_name_index] = CellFormatType.LIGHT_BLUE_NORMAL
diff --git a/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/profiling_info.py b/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/profiling_info.py
index bcbce59c016..36f8a0c7186 100644
--- a/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/profiling_info.py
+++ b/profiler/msprof_analyze/compare_tools/compare_backend/compare_bean/profiling_info.py
@@ -27,7 +27,7 @@ class ProfilingInfo:
                  'page_attention_time', 'page_attention_num', 'vector_time_trans', 'vector_num_trans',
                  'vector_time_notrans', 'vector_num_notrans', 'sdma_time_tensor_move', 'sdma_num_tensor_move',
                  'sdma_time_stream', 'sdma_num_stream', 'other_cube_time', 'other_cube_num', 'rdma_bandwidth',
-                 'sdma_bandwidth', 'communication_group_time', 'mc2_time_dict']
+                 'sdma_bandwidth', 'communication_group_time', 'mc2_time_dict', 'pg_name_dict']
     TABLE_NAME = Constant.PERFORMANCE_TABLE
     HEADERS = []
     OVERHEAD = []
@@ -93,6 +93,9 @@ class ProfilingInfo:
 
         # 按group展示通信的卡间等待和传输耗时
         self.communication_group_time = {}
+        # communication_group与pg_name的对应关系
+        self.pg_name_dict = {}
+
 
     @property
     def e2e_time_ms(self):
@@ -334,6 +337,9 @@ class ProfilingInfo:
         for time in time_dict.values():
             self.wait_time += time.get(Constant.WAIT_TIME, 0)
 
+    def update_communication_group_pg_name(self, pg_name_dict: dict):
+        self.pg_name_dict = pg_name_dict
+
     def set_memory_used(self, memory: float):
         self.memory_used = memory
 
@@ -401,3 +407,6 @@ class ProfilingInfo:
 
     def get_mc2_number_by_name(self, kernel_name: str):
         return self.mc2_time_dict.get(kernel_name, {}).get(Constant.MC2_NUMBER, 0)
+
+    def get_pg_name_by_group(self, group: str):
+        return self.pg_name_dict.get(group, Constant.UNKNOWN)
\ No newline at end of file
diff --git a/profiler/msprof_analyze/compare_tools/compare_backend/profiling_parser/base_profiling_parser.py b/profiler/msprof_analyze/compare_tools/compare_backend/profiling_parser/base_profiling_parser.py
index b3d9a29944f..844528f3029 100644
--- a/profiler/msprof_analyze/compare_tools/compare_backend/profiling_parser/base_profiling_parser.py
+++ b/profiler/msprof_analyze/compare_tools/compare_backend/profiling_parser/base_profiling_parser.py
@@ -12,6 +12,7 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+import os
 from abc import abstractmethod, ABC
 from decimal import Decimal
 
@@ -156,6 +157,7 @@ class BaseProfilingParser(ABC):
             self._dispatch_events()
             self._update_kernel_dict()
             self._update_communication_dict()
+            self._update_pg_name_map()
         if self._enable_memory_compare:
             self._update_memory_list()
         if self._enable_profiling_compare:
@@ -369,3 +371,17 @@ class BaseProfilingParser(ABC):
         with open(self._json_path, 'r') as file:
             for event in ijson.items(file, item):
                 yield TraceEventBean(event)
+
+    def _update_pg_name_map(self):
+        meta_file = os.path.join(self._profiling_path, Constant.PROFILER_METADATA)
+        if not os.path.exists(meta_file):
+            return
+        meta_data = FileManager.read_json_file(meta_file)
+        if Constant.PARALLEL_GROUP_INFO not in meta_data:
+            return
+        pg_name_map = {}
+        for group_id, group_info in meta_data[Constant.PARALLEL_GROUP_INFO].items():
+            if group_id not in pg_name_map:
+                format_group_id = " ".join(["Group", group_id, "Communication"])
+                pg_name_map[format_group_id] = group_info.get('group_name', "")
+        self._result_data.overall_metrics.update_communication_group_pg_name(pg_name_map)
diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index c04e429321d..3c5983ca454 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -128,6 +128,7 @@ class Constant(object):
     TABLE_HOST_INFO = "HostInfo"
     TABLE_RANK_DEVICE_MAP = "RankDeviceMap"
     TABLE_CLUSTER_BASE_INFO = "ClusterBaseInfo"
+    TABLE_META_DATA = "META_DATA"
 
     # data config key
     CONFIG = "config"
@@ -136,6 +137,7 @@ class Constant(object):
 
     # metadata key
     DISTRIBUTED_ARGS = "distributed_args"
+    PARALLEL_GROUP_INFO = "parallel_group_info"
 
     # mode
     ALL = "all"
@@ -433,4 +435,13 @@ class Constant(object):
 
     # hccl_sum
     UINT32_BITS = 32
-    UINT32_MASK = 0xffffffff
\ No newline at end of file
+    UINT32_MASK = 0xffffffff
+
+    # slow rank
+    MAX_DIXON_NUM = 100
+    DIXON_THRESHOLD_1 = 7
+    DIXON_THRESHOLD_2 = 10
+    DIXON_THRESHOLD_3 = 13
+
+    UNKNOWN = "unknown"
+
diff --git a/profiler/msprof_analyze/prof_exports/cluster_time_summary_export.py b/profiler/msprof_analyze/prof_exports/cluster_time_summary_export.py
new file mode 100644
index 00000000000..f027635ab9c
--- /dev/null
+++ b/profiler/msprof_analyze/prof_exports/cluster_time_summary_export.py
@@ -0,0 +1,42 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from msprof_analyze.prof_exports.base_stats_export import BaseStatsExport
+from msprof_analyze.prof_common.constant import Constant
+
+
+class CommunicationTimeExport(BaseStatsExport):
+    QUERY = """
+        SELECT 
+            RANK_DEVICE_MAP.rankId,
+            si_group.value AS groupName,
+            si_op.value AS opName,
+            (COMMUNICATION_OP.endNs - COMMUNICATION_OP.startNs) / 1000.0 AS communication_time
+        FROM COMMUNICATION_OP
+        CROSS JOIN RANK_DEVICE_MAP
+        JOIN STRING_IDS si_group ON COMMUNICATION_OP.groupName = si_group.id
+        JOIN STRING_IDS si_op ON COMMUNICATION_OP.opName = si_op.id
+        JOIN CANN_API ON CANN_API.connectionId = COMMUNICATION_OP.connectionId
+        {}
+    """
+
+    def __init__(self, db_path, recipe_name, step_range):
+        super().__init__(db_path, recipe_name, step_range)
+        if step_range:
+            filter_statement = f"WHERE CANN_API.startNs >= {self._step_range.get(Constant.START_NS)} " \
+                               f"and CANN_API.startNs <= {self._step_range.get(Constant.END_NS)}"
+        else:
+            filter_statement = ""
+        self._query = self.QUERY.format(filter_statement)
diff --git a/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_freq_analysis.py b/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_freq_analysis.py
new file mode 100644
index 00000000000..0a559b79178
--- /dev/null
+++ b/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_freq_analysis.py
@@ -0,0 +1,83 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+import random
+import unittest
+
+import pandas as pd
+
+from msprof_analyze.cluster_analyse.recipes.freq_analysis.freq_analysis import FreqAnalysis
+
+
+class TestFreqAnalysis(unittest.TestCase):
+
+    freq = [1800]
+    free_freq = [800, 1800]
+    abnormal_freq = [1200, 1300, 1800]
+
+    def test_no_error_freq(self):
+        params = {}
+        recipe = FreqAnalysis(params)
+        mapper_res = [(self.freq, 0)] * 10
+        recipe.reducer_func(mapper_res)
+        self.assertEqual(recipe.free_freq_ranks, [])
+        self.assertEqual(recipe.abnormal_freq_ranks, [])
+        self.assertEqual(recipe.abnormal_freq_ranks_map, {})
+
+
+    def test_free_rank_map(self):
+        params = {}
+        recipe = FreqAnalysis(params)
+        mapper_res = [
+            (self.freq, 0),
+            (self.free_freq, 1),
+            (self.free_freq, 2),
+            (self.freq, 3)
+        ]
+        recipe.reducer_func(mapper_res)
+        self.assertEqual(recipe.free_freq_ranks, [1, 2])
+        self.assertEqual(recipe.abnormal_freq_ranks, [])
+        self.assertEqual(recipe.abnormal_freq_ranks_map, {})
+    
+    def test_abnormal_rank_map(self):
+        params = {}
+        recipe = FreqAnalysis(params)
+        mapper_res = [
+            (self.freq, 0),
+            (self.abnormal_freq, 1),
+            (self.abnormal_freq, 2),
+            (self.freq, 3)
+        ]
+
+        recipe.reducer_func(mapper_res)
+        self.assertEqual(recipe.free_freq_ranks, [])
+        self.assertEqual(recipe.abnormal_freq_ranks, [1, 2])
+
+    def test_mix_freq_case(self):
+        params = {}
+        recipe = FreqAnalysis(params)
+        mapper_res = []
+        rank_case = [[], [], []]
+        random_freq = {0: self.freq, 1: self.free_freq, 2: self.abnormal_freq}
+
+        for i in range(1000):
+            random_num = random.choice([0, 1, 2])
+            mapper_res.append((random_freq.get(random_num, self.freq), i))
+            rank_case[random_num].append(i)
+
+        recipe.reducer_func(mapper_res)
+        self.assertEqual(recipe.free_freq_ranks, rank_case[1])
+        self.assertEqual(recipe.abnormal_freq_ranks, rank_case[2])
diff --git a/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_slow_rank.py b/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_slow_rank.py
new file mode 100644
index 00000000000..cf91a8fb822
--- /dev/null
+++ b/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_slow_rank.py
@@ -0,0 +1,102 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+import random
+import unittest
+
+import pandas as pd
+
+from msprof_analyze.cluster_analyse.recipes.slow_rank.slow_rank import judge_norm, judge_dixon, SlowRankVoteAnalysis
+
+
+class TestJudgeNorm(unittest.TestCase):
+
+    def test_no_outlier(self):
+        data_list = [10] * 120
+        res = judge_norm(data_list)
+        self.assertEqual(res, [])
+    
+    def test_with_outlier(self):
+        data_with_outlier = [10] * 120
+        data_with_outlier.append(0)
+        res = judge_norm(data_with_outlier)
+        self.assertEqual(res, [120])
+
+class TestJudgeDixon(unittest.TestCase):
+
+    def test_no_outlier(self):
+        for i in [6, 8, 12, 30]:
+            data_list = [100 + j for j in range(i)]
+            res = judge_dixon(data_list)
+            self.assertEqual(res, [])
+    
+    def test_with_outlier(self):
+        for i in [6, 8, 12, 30]:
+            data_with_outlier = [100 + j for j in range(i)]
+            data_with_outlier.append(0)
+            res = judge_dixon(data_with_outlier)
+            self.assertEqual(res, [i])
+
+class TestVoteAnalysis(unittest.TestCase):
+
+    def test_grouping_ops(self):
+        group_0_op_0_num = 10
+        group_0_op_1_num = 10
+        group_1_op_0_num = 5
+        comm_ops_df = self.init_cmm_ops_df(group_0_op_0_num, group_0_op_1_num, group_1_op_0_num)
+        analyzer = SlowRankVoteAnalysis(comm_ops_df)
+        res = analyzer.grouping_ops()
+        res = dict(res)
+        for key in res.keys():
+            res[key] = dict(res[key])
+        golden_res = {
+            "group_0": {
+                "op_0": [i for i in range(group_0_op_0_num)],
+                "op_1": [i + group_0_op_0_num for i in range(group_0_op_1_num)]
+            },
+            "group_1": {
+                "op_0": [i + group_0_op_0_num + group_0_op_1_num for i in range(group_1_op_0_num)]
+            }
+            }
+        self.assertEqual(res, golden_res)
+
+    def test_grouping_ops_with_exclude(self):
+        group_0_op_0_num = 10
+        group_0_op_1_num = 12
+        group_1_op_0_num = 5
+        comm_ops_df = self.init_cmm_ops_df(group_0_op_0_num, group_0_op_1_num, group_1_op_0_num)
+        analyzer = SlowRankVoteAnalysis(comm_ops_df)
+        res = analyzer.grouping_ops()
+        res = dict(res)
+        for key in res.keys():
+            res[key] = dict(res[key])
+        golden_res = {
+            "group_1": {
+                "op_0": [i for i in range(group_1_op_0_num)]
+            }
+            }
+        self.assertEqual(res, golden_res)
+
+    @staticmethod
+    def init_cmm_ops_df(group_0_op_0_num, group_0_op_1_num, group_1_op_0_num):
+        comm_ops_df = pd.DataFrame(columns=["rankId", "groupName", "opName", "communication_times"])
+        for i in range(group_0_op_0_num):
+            comm_ops_df.loc[len(comm_ops_df)] = [i, "group_0", "op_0", 0]
+        for i in range(group_0_op_1_num):
+            comm_ops_df.loc[len(comm_ops_df)] = [i, "group_0", "op_1", 0]
+        for i in range(group_1_op_0_num):
+            comm_ops_df.loc[len(comm_ops_df)] = [i, "group_1", "op_0", 0]
+        return comm_ops_df
\ No newline at end of file
-- 
Gitee


From 96002bb6aa35a08914bb4559d4ae70b9ce361fba Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BD=95=E6=96=87=E6=B3=A2?= <1010589661@qq.com>
Date: Wed, 5 Mar 2025 16:11:38 +0800
Subject: [PATCH 079/145] =?UTF-8?q?=E3=80=90=E5=BC=80=E5=8F=91=E8=87=AA?=
 =?UTF-8?q?=E6=8F=90=E3=80=91=E3=80=90=E7=BD=91=E7=BB=9C=E5=B7=A5=E5=85=B7?=
 =?UTF-8?q?=E3=80=91st/ut=E6=A1=86=E6=9E=B6=E5=BC=80=E5=8F=91?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../analysis_flight.py                        |  0
 .../check_path.py                             |  0
 .../flight_recorder.md                        |  0
 flight_recorder/test/__init__.py              |  0
 flight_recorder/test/run_st.py                | 94 +++++++++++++++++++
 flight_recorder/test/run_ut.sh                | 53 +++++++++++
 flight_recorder/test/st/__init__.py           |  0
 flight_recorder/test/st/utils.py              | 63 +++++++++++++
 8 files changed, 210 insertions(+)
 rename flight_recorder/{ => flight_recorder_analyze}/analysis_flight.py (100%)
 rename flight_recorder/{ => flight_recorder_analyze}/check_path.py (100%)
 rename flight_recorder/{ => flight_recorder_analyze}/flight_recorder.md (100%)
 create mode 100644 flight_recorder/test/__init__.py
 create mode 100644 flight_recorder/test/run_st.py
 create mode 100644 flight_recorder/test/run_ut.sh
 create mode 100644 flight_recorder/test/st/__init__.py
 create mode 100644 flight_recorder/test/st/utils.py

diff --git a/flight_recorder/analysis_flight.py b/flight_recorder/flight_recorder_analyze/analysis_flight.py
similarity index 100%
rename from flight_recorder/analysis_flight.py
rename to flight_recorder/flight_recorder_analyze/analysis_flight.py
diff --git a/flight_recorder/check_path.py b/flight_recorder/flight_recorder_analyze/check_path.py
similarity index 100%
rename from flight_recorder/check_path.py
rename to flight_recorder/flight_recorder_analyze/check_path.py
diff --git a/flight_recorder/flight_recorder.md b/flight_recorder/flight_recorder_analyze/flight_recorder.md
similarity index 100%
rename from flight_recorder/flight_recorder.md
rename to flight_recorder/flight_recorder_analyze/flight_recorder.md
diff --git a/flight_recorder/test/__init__.py b/flight_recorder/test/__init__.py
new file mode 100644
index 00000000000..e69de29bb2d
diff --git a/flight_recorder/test/run_st.py b/flight_recorder/test/run_st.py
new file mode 100644
index 00000000000..b6345d7c9a5
--- /dev/null
+++ b/flight_recorder/test/run_st.py
@@ -0,0 +1,94 @@
+# Copyright (c) 2025-2025 Huawei Technologies Co., Ltd.
+
+import datetime
+import logging
+import os
+import subprocess
+import sys
+import threading
+
+stop_print_thread = False
+
+
+def print_stout(output):
+    while True:
+        line = output.readline().strip()
+        if line:
+            logging.info(line)
+        global stop_print_thread
+        if stop_print_thread:
+            break
+
+
+def stop_stout_threads(thread_list):
+    global stop_print_thread
+    stop_print_thread = True
+    for stout_thread in thread_list:
+        if stout_thread.is_alive():
+            stout_thread.join()
+
+
+def start_st_process(module_name):
+    st_path = os.path.join(os.path.abspath(os.path.dirname(__file__)), "st", module_name)
+    cmd = ["python3", "-m", "pytest", "-s", st_path]
+    process = subprocess.Popen(cmd, shell=False, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
+    stout_thread = threading.Thread(target=print_stout, args=(process.stdout,))
+    stout_thread.start()
+    return process, stout_thread
+
+
+def stop_st_process(process_list):
+    for process in process_list:
+        if process.poll() is None:
+            process.terminate()
+            process.wait()
+
+
+def run_st(module_choice):
+    timeout = 3600
+    modules = ["flight_recorder_analyze"]
+    if module_choice != "all":
+        modules = [module_choice]
+    process_list = []
+    thread_list = []
+    for module in modules:
+        process, stout_thread = start_st_process(module)
+        process_list.append(process)
+        thread_list.append(stout_thread)
+
+    success, failed = True, False
+    start_time = datetime.datetime.utcnow()
+    while process_list:
+        duration = datetime.datetime.utcnow() - start_time
+        if duration.total_seconds() >= timeout:
+            logging.error("run st use case timeout.")
+            stop_stout_threads(thread_list)
+            stop_st_process(process_list)
+            return failed
+        for process in process_list:
+            if process.poll() is None:
+                continue
+            if process.returncode == 0:
+                process_list.remove(process)
+                continue
+            stop_stout_threads(thread_list)
+            stop_st_process(process_list)
+            return failed
+    stop_stout_threads(thread_list)
+    return success
+
+
+if __name__ == "__main__":
+    logging.basicConfig(level=logging.INFO, format='%(levelname)s: %(message)s')
+    if '--module' in sys.argv:
+        module_index = sys.argv.index("--module") + 1
+        module = sys.argv[module_index]
+    else:
+        module = "all"
+    st_success = run_st(module)
+    if st_success:
+        logging.info("run st successfully.")
+        sys.exit(0)
+    else:
+        logging.error("run st failed.")
+        sys.exit(1)
\ No newline at end of file
diff --git a/flight_recorder/test/run_ut.sh b/flight_recorder/test/run_ut.sh
new file mode 100644
index 00000000000..4af24e2a952
--- /dev/null
+++ b/flight_recorder/test/run_ut.sh
@@ -0,0 +1,53 @@
+#!/bin/bash
+# This script is used to run ut and st testcase.
+# Copyright Huawei Technologies Co., Ltd. 2025-2025. All rights reserved.
+set -eo pipefail
+
+CUR_DIR=$(dirname $(readlink -f $0))
+TOP_DIR=$(readlink -f ${CUR_DIR}/..)
+TEST_DIR=${TOP_DIR}/"test"
+SRC_DIR=${TOP_DIR}/"src"
+ret=0
+
+clean() {
+  cd ${TEST_DIR}
+  if [ -e ${TEST_DIR}/coverage.xml ]; then
+    rm coverage.xml
+    echo "remove last coverage.xml success"
+  fi
+  cd -
+}
+
+run_test_cpp() {
+  echo "C++ tests are not implemented yet."
+  # 待实现：编译并运行C++测试
+  # build_cpp && run_cpp_tests
+}
+
+run_test_python() {
+  python3 --version
+  export PYTHONPATH="${TOP_DIR}:${PYTHONPATH}"
+  python3 -m coverage run --branch --source ${TOP_DIR}/'flight_recorder_analyze' -m pytest ${TEST_DIR}/ut
+
+  if [ $? -ne 0 ]; then
+    echo "UT Failure"
+    exit 1
+  fi
+
+  python3 -m coverage report -m
+  python3 -m coverage xml -o ${TEST_DIR}/coverage.xml
+}
+
+run_test() {
+  run_test_cpp
+  run_test_python
+}
+
+main() {
+  cd ${TEST_DIR}
+  clean
+  run_test
+  echo "UT Success"
+}
+
+main
\ No newline at end of file
diff --git a/flight_recorder/test/st/__init__.py b/flight_recorder/test/st/__init__.py
new file mode 100644
index 00000000000..e69de29bb2d
diff --git a/flight_recorder/test/st/utils.py b/flight_recorder/test/st/utils.py
new file mode 100644
index 00000000000..cccdaaf607d
--- /dev/null
+++ b/flight_recorder/test/st/utils.py
@@ -0,0 +1,63 @@
+# Copyright (c) 2025-2025 Huawei Technologies Co., Ltd.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import subprocess
+import logging
+
+COMMAND_SUCCESS = 0
+
+
+def execute_cmd(cmd):
+    logging.info('Execute command:%s' % " ".join(cmd))
+    completed_process = subprocess.run(cmd, shell=False, stderr=subprocess.PIPE)
+    if completed_process.returncode != COMMAND_SUCCESS:
+        logging.error(completed_process.stderr.decode())
+    return completed_process.returncode
+
+
+def check_column_actual(actual_columns, expected_columns, context):
+    """检查实际列名是否与预期列名一致"""
+    missing = set(expected_columns) - set(actual_columns)  # O(n + m)
+    for col in missing:
+        logging.error(f"在 {context} 中未找到预期列名: {col}")
+    return len(missing) == 0
+
+
+def check_row(df, expected_columns, numeric_columns):
+    """检查数据框中Metric列数据类型和指定列数据是否为数字"""
+    # 检查Metric列的数据类型是否为字符串
+    for row_index in df.index:
+        try:
+            value = df.at[row_index, 'Metric']
+            if not isinstance(value, str):
+                logging.error(f"在Metric列的第{row_index}行，值 '{value}' 不是字符串类型")
+                return False
+        except KeyError:
+            logging.error(f"数据框中不存在 'Metric' 列")
+            return False
+
+    # 检查其他列的数据是否为数字
+    for column in numeric_columns:
+        if column not in df.columns:
+            logging.error(f"数据框中不存在 {column} 列")
+            continue
+        for row_index in df.index:
+            try:
+                cell_value = df.at[row_index, column]
+                float(cell_value)
+            except (ValueError, KeyError):
+                logging.error(
+                    f"在 {column} 列的第 {row_index} 行，值 {cell_value} 不是有效的数字")
+                return False
+    return True
\ No newline at end of file
-- 
Gitee


From c4662941c07e5b9eae02f54461b907f46db703bb Mon Sep 17 00:00:00 2001
From: jiangchao_j <chaojiang_j@163.com>
Date: Wed, 5 Mar 2025 10:34:35 +0800
Subject: [PATCH 080/145] add MsprobeInitStep class

---
 .../msprobe/docs/06.data_dump_MindSpore.md    | 19 +++++----
 .../msprobe/mindspore/__init__.py             |  4 +-
 .../msprobe/mindspore/common/utils.py         | 40 ++++++++++++-------
 3 files changed, 39 insertions(+), 24 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
index 158c5e3011e..27eb496747e 100644
--- a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
@@ -148,9 +148,7 @@ save(variable, name, save_backward=True)
 | name           | 指定的名称         | str                 | 是  |
 | save_backward  | 是否保存反向数据   | boolean             | 否 |
 
-
-
-### 6.2 msprobe.mindspore.common.utils.MsprobeStep
+### 6.2 msprobe.mindspore.MsprobeStep
 
 **功能说明**：MindSpore Callback类，自动在每个step开始时调用start()接口，在每个step结束时调用stop()、step()接口。实现使用 Model 高阶 API 的动态图场景下 L0、L1、mix 级别的精度数据采集控制，控制粒度为单个 **Step** ，而 PrecisionDebugger.start, PrecisionDebugger.stop 接口的控制粒度任意训练代码段。
 
@@ -164,7 +162,17 @@ MsprobeStep(debugger)
 
 1. debugger：PrecisionDebugger对象。
 
-### 6.3 msprobe.mindspore.seed_all
+### 6.3 msprobe.mindspore.MsprobeInitStep
+
+**功能说明**：MindSpore Callback 类，自动获取并设置初始 step 值。仅适用于静态图 O0/O1 模式的断点续训场景。
+
+**原型**：
+
+```Python
+MsprobeInitStep()
+```
+
+### 6.4 msprobe.mindspore.seed_all
 
 **功能说明**：用于固定网络中的随机性和开启确定性计算。
 
@@ -181,9 +189,6 @@ seed_all(seed=1234, mode=False, rm_dropout=True)
 
 3. rm_dropout：控制dropout失效的开关。可配置 True 或 False，默认值：True，非必选。参数示例：rm_dropout=True。该参数设置为 True 后，将会使mindspore.ops.Dropout，mindspore.ops.Dropout2D，mindspore.ops.Dropout3D，mindspore.mint.nn.Dropout和mindspore.mint.nn.functional.dropout失效，以避免因随机dropout造成的网络随机性。建议在采集mindspore数据前开启。注意：通过rm_dropout控制dropout失效或生效需要在初始化Dropout实例前调用才能生效。
 
-
-
-
 ## 7. 示例代码
 
 ### 7.1 静态图场景
diff --git a/debug/accuracy_tools/msprobe/mindspore/__init__.py b/debug/accuracy_tools/msprobe/mindspore/__init__.py
index 089c29eb098..a519d861f57 100644
--- a/debug/accuracy_tools/msprobe/mindspore/__init__.py
+++ b/debug/accuracy_tools/msprobe/mindspore/__init__.py
@@ -24,5 +24,5 @@ except ImportError:
     logger.info("Module _msprobe_c has not been installed. L2-Dump may not work normally.")
 
 from msprobe.mindspore.debugger.precision_debugger import PrecisionDebugger
-from msprobe.mindspore.common.utils import seed_all
-from msprobe.mindspore.monitor.module_hook import TrainerMon
\ No newline at end of file
+from msprobe.mindspore.common.utils import seed_all, MsprobeStep, MsprobeInitStep
+from msprobe.mindspore.monitor.module_hook import TrainerMon
diff --git a/debug/accuracy_tools/msprobe/mindspore/common/utils.py b/debug/accuracy_tools/msprobe/mindspore/common/utils.py
index b205dabc6a3..6da6db0f830 100644
--- a/debug/accuracy_tools/msprobe/mindspore/common/utils.py
+++ b/debug/accuracy_tools/msprobe/mindspore/common/utils.py
@@ -28,6 +28,30 @@ from msprobe.core.common.const import Const
 from msprobe.core.common.utils import CompareException, check_seed_all
 
 
+class MsprobeStep(ms.train.Callback):
+    def __init__(self, debugger):
+        super(MsprobeStep, self).__init__()
+        self.debugger = debugger
+
+    def on_train_step_begin(self, run_context):
+        self.debugger.start()
+
+    def on_train_step_end(self, run_context):
+        self.debugger.stop()
+        self.debugger.step()
+
+
+class MsprobeInitStep(ms.train.Callback):
+    def on_train_begin(self, run_context):
+        try:
+            from ms._c_expression import _set_init_iter
+        except ImportError:
+            logger.warning('MsprobeInitStep does not work on this version of MindSpore.')
+            return
+        cb_params = run_context.original_args()
+        _set_init_iter(cb_params.cur_step_num)
+
+
 def get_rank_if_initialized():
     if ms.communication.GlobalComm.INITED:
         return ms.communication.get_rank()
@@ -93,20 +117,6 @@ def seed_all(seed=1234, mode=False, rm_dropout=True):
         remove_dropout()
 
 
-class MsprobeStep(ms.train.Callback):
-
-    def __init__(self, debugger):
-        super(MsprobeStep, self).__init__()
-        self.debugger = debugger
-
-    def on_train_step_begin(self, run_context):
-        self.debugger.start()
-
-    def on_train_step_end(self, run_context):
-        self.debugger.stop()
-        self.debugger.step()
-
-
 class Dropout(ops.Dropout):
     def __init__(self, keep_prob=0.5, seed0=0, seed1=1):
         super().__init__(1., seed0, seed1)
@@ -196,4 +206,4 @@ def check_save_param(variable, name, save_backward):
         logger.warning("PrecisionDebugger.save_backward name not valid, "
                        "should be bool. "
                        "Skip current save process.")
-        raise ValueError
\ No newline at end of file
+        raise ValueError
-- 
Gitee


From 29cea5aac2dcae2943b57a7491e4570554c84c57 Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Wed, 5 Mar 2025 15:17:16 +0800
Subject: [PATCH 081/145] cluster_support_recipe

---
 .../analysis/analysis_facade.py               |  22 +-
 .../cluster_analyse/analysis/base_analysis.py |   2 +-
 .../analysis/comm_matrix_analysis.py          |  21 --
 .../analysis/communication_analysis.py        | 144 -------------
 .../analysis/host_info_analysis.py            |   9 +-
 .../msprof_step_trace_time_adapter.py         |  10 +-
 .../analysis/step_trace_time_analysis.py      |  28 ++-
 .../cluster_analyse/cluster_analysis.py       |  48 ++---
 .../msprof_data_preprocessor.py               |  21 +-
 .../recipes/base_recipe_analysis.py           |  13 +-
 .../recipes/comm_group_map/comm_group_map.py  |   6 +-
 .../communication_matrix_sum/__init__.py      |   0
 .../communication_matrix_sum.py               | 201 ++++++++++++++++++
 .../test_cluster_analyse_pytorch_db.py        |   2 +-
 14 files changed, 294 insertions(+), 233 deletions(-)
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/__init__.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py

diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/analysis_facade.py b/profiler/msprof_analyze/cluster_analyse/analysis/analysis_facade.py
index aa9658f0c62..4f9b68efe67 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/analysis_facade.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/analysis_facade.py
@@ -16,17 +16,18 @@ from multiprocessing import Process, Value, Lock
 from tqdm import tqdm
 
 from msprof_analyze.cluster_analyse.analysis.communication_analysis import CommunicationAnalysis
-from msprof_analyze.cluster_analyse.analysis.communication_analysis import CommunicationAnalysisOptimized
 from msprof_analyze.cluster_analyse.analysis.comm_matrix_analysis import CommMatrixAnalysis
-from msprof_analyze.cluster_analyse.analysis.comm_matrix_analysis import CommMatrixAnalysisOptimized
 from msprof_analyze.cluster_analyse.analysis.step_trace_time_analysis import StepTraceTimeAnalysis
 from msprof_analyze.cluster_analyse.analysis.host_info_analysis import HostInfoAnalysis
 from msprof_analyze.cluster_analyse.analysis.cluster_base_info_analysis import ClusterBaseInfoAnalysis
 from msprof_analyze.cluster_analyse.common_func.context import Context
-
 from msprof_analyze.cluster_analyse.common_func.analysis_loader import get_class_from_name
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.cluster_analyse.recipes.comm_group_map.comm_group_map import CommGroupMap
+from msprof_analyze.cluster_analyse.recipes.communication_time_sum.communication_time_sum import \
+    CommunicationTimeSumRecipe
+from msprof_analyze.cluster_analyse.recipes.communication_matrix_sum.communication_matrix_sum import CommMatrixSum
 
 logger = get_logger()
 
@@ -34,10 +35,7 @@ logger = get_logger()
 class AnalysisFacade:
     default_module = {CommunicationAnalysis, StepTraceTimeAnalysis, CommMatrixAnalysis, HostInfoAnalysis,
                       ClusterBaseInfoAnalysis}
-    simplified_module = {
-        CommunicationAnalysisOptimized, StepTraceTimeAnalysis, CommMatrixAnalysisOptimized, HostInfoAnalysis,
-        ClusterBaseInfoAnalysis
-    }
+    simplified_module = {StepTraceTimeAnalysis, ClusterBaseInfoAnalysis, HostInfoAnalysis}
 
     def __init__(self, params: dict):
         self.params = params
@@ -47,6 +45,7 @@ class AnalysisFacade:
         process_list = []
         if self.params.get(Constant.DATA_SIMPLIFICATION) and self.params.get(Constant.DATA_TYPE) == Constant.DB:
             analysis_module = self.simplified_module
+            self.cluster_analyze_with_recipe()
         else:
             analysis_module = self.default_module
 
@@ -92,3 +91,12 @@ class AnalysisFacade:
         recipe_class = get_class_from_name(self.params.get(Constant.ANALYSIS_MODE))
         if recipe_class:
             self.do_recipe(recipe_class)
+
+    def cluster_analyze_with_recipe(self):
+        recipes = [["CommGroupMap", CommGroupMap]]
+        if self.params.get(Constant.ANALYSIS_MODE) in (Constant.ALL, Constant.COMMUNICATION_TIME):
+            recipes.append(["CommunicationTimeSumRecipe", CommunicationTimeSumRecipe])
+        if self.params.get(Constant.ANALYSIS_MODE) in (Constant.ALL, Constant.COMMUNICATION_MATRIX):
+            recipes.append(["CommMatrixSum", CommMatrixSum])
+        for recipe_class in recipes:
+            self.do_recipe(recipe_class)
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/base_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/base_analysis.py
index 59b824c1def..0d14af7693a 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/base_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/base_analysis.py
@@ -54,7 +54,7 @@ class BaseAnalysis:
             if stat_name in op_name:
                 if stat_name != total:
                     return False
-            return True
+        return True
 
     @abstractmethod
     def run(self):
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
index 3839fe66aac..d4df5466c38 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/comm_matrix_analysis.py
@@ -163,24 +163,3 @@ class CommMatrixAnalysis(BaseAnalysis):
                         global_ranks.sort()
                         parallel_group_info[double_hash(group_name)] = dict(enumerate(global_ranks))
         return parallel_group_info
-
-
-class CommMatrixAnalysisOptimized(CommMatrixAnalysis):
-    SAVED_JSON = "cluster_communication_matrix.json"
-    COMMUNICATION_MATRIX_TABLE = "ClusterCommunicationMatrix"
-
-    def __init__(self, param: dict):
-        super().__init__(param)
-
-    def dump_db(self):
-        res_comm_matrix = self.adapter.transfer_matrix_from_json_to_db(self.comm_ops_struct)
-        output_path = os.path.join(self.cluster_analysis_output_path, Constant.CLUSTER_ANALYSIS_OUTPUT)
-        result_db = os.path.join(output_path, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER)
-        DBManager.create_tables(result_db, self.COMMUNICATION_MATRIX_TABLE)
-        conn, cursor = DBManager.create_connect_db(result_db)
-        if res_comm_matrix:
-            res_matrix_value = [list(data.values())[1:] for data in res_comm_matrix]
-            sql = "insert into {} values ({value})".format(self.COMMUNICATION_MATRIX_TABLE,
-                                                           value="?," * (len(res_matrix_value[0]) - 1) + "?")
-            DBManager.executemany_sql(conn, sql, res_matrix_value)
-        DBManager.destroy_db_connect(conn, cursor)
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/communication_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/communication_analysis.py
index 61daa5b943d..e8ca793f525 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/communication_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/communication_analysis.py
@@ -137,147 +137,3 @@ class CommunicationBandwidthParams:
         self.step_id = step_id
         self.transport_type = transport_type
         self.package_size = package_size
-
-
-class CommunicationAnalysisOptimized(BaseAnalysis):
-    COMMUNICATION_BANDWIDTH_TABLE = "ClusterCommunicationBandwidth"
-    COMMUNICATION_TIME_TABLE = "ClusterCommunicationTime"
-
-    def __init__(self, param: dict):
-        super().__init__(param)
-        self._communication_ops = param.get(Constant.COMM_DATA_DICT, {}).get(Constant.COMMUNICATION_OPS)
-        self._communication_group = param.get(Constant.COMM_DATA_DICT, {}).get(Constant.COMMUNICATION_GROUP)
-        self._aggregate_time = {}
-        self._aggregate_bandwidth = {}
-        self._output_time = []
-        self._output_bandwidth = []
-
-    @staticmethod
-    def _execute(conn, res_data, table_name):
-        if res_data:
-            sql = "insert into {} values ({value})".format(table_name, value="?," * (len(res_data[0]) - 1) + "?")
-            DBManager.executemany_sql(conn, sql, res_data)
-
-    @staticmethod
-    def _format_time_data(communication_data):
-        data_dict = {}
-        for single_op in communication_data:
-            formatted_data = CommunicationTimeBean(single_op)
-            data_dict.setdefault(formatted_data.step_id, {}). \
-                setdefault(formatted_data.rank_id, {}). \
-                setdefault(formatted_data.group_name, []).extend([formatted_data])
-        return data_dict
-
-    def run(self, completed_processes, lock):
-        if not self._communication_ops[0] or not self._communication_ops[1]:
-            increase_shared_value(completed_processes, lock)
-            logger.info("CommunicationAnalysisOptimized completed")
-            return
-        self._aggregate_time = self._format_time_data(self._communication_ops[0])
-        self._aggregate_bandwidth = self._format_bandwidth_data(self._communication_ops[1])
-        self._compute_total_info()
-        self._dump_data()
-        increase_shared_value(completed_processes, lock)
-        logger.info("CommunicationAnalysisOptimized completed")
-
-    def _format_bandwidth_data(self, communication_data: dict):
-        data_dict = {}
-        for single_op in communication_data:
-            formatted_data = CommunicationBandwidthBean(single_op)
-            rank_set = str(self.collective_group_dict.get(formatted_data.group_name, formatted_data.group_name))
-            data_dict.setdefault(rank_set, {}).setdefault(formatted_data.step_id, {}). \
-                setdefault(formatted_data.rank_id, {}). \
-                setdefault(formatted_data.transport_type, {}). \
-                setdefault(formatted_data.package_size, []).extend([formatted_data])
-        return data_dict
-
-    def _dump_data(self):
-        output_path = os.path.join(self.cluster_analysis_output_path, Constant.CLUSTER_ANALYSIS_OUTPUT)
-        result_db = os.path.join(output_path, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER)
-        DBManager.create_tables(result_db, self.COMMUNICATION_TIME_TABLE)
-        DBManager.create_tables(result_db, self.COMMUNICATION_BANDWIDTH_TABLE)
-        conn, cursor = DBManager.create_connect_db(result_db)
-        self._execute(conn, self._output_time, self.COMMUNICATION_TIME_TABLE)
-        self._execute(conn, self._output_bandwidth, self.COMMUNICATION_BANDWIDTH_TABLE)
-        DBManager.destroy_db_connect(conn, cursor)
-
-    def _compute_time_info(self):
-        for step_id, rank_dict in self._aggregate_time.items():
-            for rank_id, communication_op_info in rank_dict.items():
-                rank_set_dict = {}
-                for group_name, single_group_op_info in communication_op_info.items():
-                    total_dict = {
-                        TableConstant.RANK_ID: rank_id,
-                        TableConstant.STEP: step_id,
-                        TableConstant.GROUP_NAME: group_name,
-                        TableConstant.HCCL_OP_NAME: Constant.TOTAL_OP_INFO
-                    }
-                    total_time_info = CommunicationTimeBean(total_dict)
-                    for com_info_dict in single_group_op_info:
-                        total_time_info += com_info_dict
-                        self._output_time.append(com_info_dict.convert_output())
-                    rank_set = str(self.collective_group_dict.get(group_name))
-                    if not rank_set:
-                        logger.warning("failed to find rank set with group name: %s.", str(group_name))
-                        continue
-                    if rank_set_dict.get(rank_set):
-                        rank_set_dict[rank_set] += total_time_info
-                    else:
-                        rank_set_dict[rank_set] = total_time_info
-                for _, total_time_info in rank_set_dict.items():
-                    total_time_info.compute_ratio()
-                    self._output_time.append(total_time_info.convert_output())
-
-    def _process_package_info(self, package_info, total_transit_size, total_transit_time, op_group_set,
-                             communication_bandwidth_params):
-        total_bw_info = CommunicationBandwidthBean({
-            TableConstant.RANK_ID: communication_bandwidth_params.rank_id,
-            TableConstant.STEP: communication_bandwidth_params.step_id,
-            TableConstant.GROUP_NAME: '',
-            TableConstant.HCCL_OP_NAME: Constant.TOTAL_OP_INFO,
-            TableConstant.TRANSPORT_TYPE: communication_bandwidth_params.transport_type,
-            TableConstant.TRANSIT_SIZE: 0.0,
-            TableConstant.TRANSIT_TIME: 0.0,
-            TableConstant.BANDWIDTH: 0.0,
-            TableConstant.PACKAGE_SIZE: communication_bandwidth_params.package_size
-        })
-        for bandwidth_package_info in package_info:
-            total_bw_info += bandwidth_package_info
-            if not total_bw_info.group_name:
-                total_bw_info.set_group_name(bandwidth_package_info.group_name)
-            self._output_bandwidth.append(bandwidth_package_info.convert_output())
-            op_group = bandwidth_package_info.hccl_op_name + "@" + bandwidth_package_info.group_name
-            if op_group not in op_group_set:
-                op_group_set.add(op_group)
-                total_transit_size += bandwidth_package_info.transit_size
-                total_transit_time += bandwidth_package_info.transit_time
-        return total_bw_info, total_transit_size, total_transit_time
-
-    def _compute_bandwidth_info(self):
-        for _, step_dict in self._aggregate_bandwidth.items():
-            for step_id, rank_dict in step_dict.items():
-                for rank_id, communication_op_info in rank_dict.items():
-                    for transport_type, bandwidth_info in communication_op_info.items():
-                        total_transit_size = 0.0
-                        total_transit_time = 0.0
-                        total_info = []
-                        op_group_set = set()
-                        for package_size, package_info in bandwidth_info.items():
-                            total_bandwidth_info, total_transit_size, total_transit_time = self._process_package_info(
-                                package_info, total_transit_size, total_transit_time, op_group_set,
-                                CommunicationBandwidthParams(rank_id, step_id, transport_type, package_size)
-                            )
-                            total_info.append(total_bandwidth_info)
-                        total_bandwidth = total_transit_size / total_transit_time if total_transit_time else 0.0
-                        for single_total_info in total_info:
-                            single_total_info.set_transit_size(total_transit_size)
-                            single_total_info.set_transit_time(total_transit_time)
-                            single_total_info.set_bandwidth(total_bandwidth)
-                            self._output_bandwidth.append(single_total_info.convert_output())
-
-    def _compute_total_info(self):
-        if not self._aggregate_time or not self._aggregate_bandwidth:
-            logger.error("communication data is null.")
-            return
-        self._compute_time_info()
-        self._compute_bandwidth_info()
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/host_info_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/host_info_analysis.py
index e8821b3c297..a46b8250ea4 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/host_info_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/host_info_analysis.py
@@ -21,6 +21,7 @@ from msprof_analyze.cluster_analyse.common_func.utils import increase_shared_val
 from msprof_analyze.prof_common.path_manager import PathManager
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.cluster_analyse.cluster_data_preprocess.msprof_data_preprocessor import MsprofDataPreprocessor
 
 logger = get_logger()
 
@@ -33,6 +34,7 @@ class HostInfoAnalysis(BaseAnalysis):
         super().__init__(param)
         self.all_rank_host_info = {}
         self.all_rank_device_info = []
+        self.is_msprof = param.get(Constant.IS_MSPROF)
 
     def run(self, completed_processes=None, lock=None):
         if self.data_type != Constant.DB:
@@ -83,7 +85,9 @@ class HostInfoAnalysis(BaseAnalysis):
         for rank_id, profiling_dir in self.data_map.items():
             host_info = []
             rank_device_info = []
-            db_path = os.path.join(profiling_dir, Constant.SINGLE_OUTPUT, f"ascend_pytorch_profiler_{rank_id}.db")
+            db_path = MsprofDataPreprocessor.get_msprof_profiler_db_path(
+                profiling_dir) if self.is_msprof else os.path.join(profiling_dir, Constant.SINGLE_OUTPUT,
+                                                                   f"ascend_pytorch_profiler_{rank_id}.db")
             if (os.path.exists(db_path) and DBManager.check_tables_in_db(db_path, self.TABLE_HOST_INFO)):
                 conn, curs = DBManager.create_connect_db(db_path)
                 sql = "select * from {0}".format(self.TABLE_HOST_INFO)
@@ -98,6 +102,9 @@ class HostInfoAnalysis(BaseAnalysis):
                 sql = "select * from {0}".format(self.TABLE_RANK_DEVICE_MAP)
                 rank_device_info = DBManager.fetch_all_data(curs, sql, is_dict=False)
                 DBManager.destroy_db_connect(conn, curs)
+            if self.is_msprof:
+                device_id = MsprofDataPreprocessor.get_device_id(profiling_dir)
+                rank_device_info = [[rank_id, device_id]]
             if not (rank_device_info and rank_device_info[0]):
                 if not print_empty_host_info:
                     print_empty_host_info = f"No {self.TABLE_RANK_DEVICE_MAP} data in {self.data_type} file."
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py b/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
index 5c34a0fb421..998b717a434 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
@@ -28,15 +28,19 @@ class MsprofStepTraceTimeAdapter:
     COMM_NOT_OVERLAP_EXCLUDE_RECEIVE = "Communication(Not Overlapped and Exclude Receive)"
     PREPARE = "Preparing"
 
-    def __init__(self, file_path_list):
-        self.file_path_list = file_path_list
+    def __init__(self, file_path):
+        self.file_path = file_path
         self._data = {self.COMPUTE: 0, self.COMM_NOT_OVERLAP: 0, self.OVERLAPPED: 0, self.COMMUNICATION: 0,
                       self.FREE: 0, self.STAGE: 0, self.BUBBLE: 0, self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE: 0,
                       self.PREPARE: 0}
 
+    @classmethod
+    def generate_step_trace_time_db_data(cls):
+        return []
+
     def generate_step_trace_time_data(self):
         json_str = []
-        for file_path in self.file_path_list:
+        for file_path in self.file_path:
             json_str.extend(FileManager.read_json_file(file_path))
         receive_comm = []
         analysis_data = {}
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
index 44675137922..ace80d3d06b 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
@@ -23,6 +23,7 @@ from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.file_manager import FileManager
 from msprof_analyze.prof_common.logger import get_logger
 from msprof_analyze.cluster_analyse.analysis.msprof_step_trace_time_adapter import MsprofStepTraceTimeAdapter
+from msprof_analyze.cluster_analyse.cluster_data_preprocess.msprof_data_preprocessor import MsprofDataPreprocessor
 
 logger = get_logger()
 
@@ -37,7 +38,7 @@ class StepTraceTimeAnalysis:
         self.collection_path = param.get(Constant.COLLECTION_PATH)
         self.cluster_analysis_output_path = param.get(Constant.CLUSTER_ANALYSIS_OUTPUT_PATH)
         self.data_map = param.get(Constant.DATA_MAP)
-        self.communication_group = param.get(Constant.COMM_DATA_DICT, {}).get(Constant.COMMUNICATION_GROUP)
+        self.communication_group = param.get(Constant.COMM_DATA_DICT, {}).get(Constant.COMMUNICATION_GROUP, {})
         self.step_time_dict = {}
         self.step_data_list = []
         self.data_type = param.get(Constant.DATA_TYPE)
@@ -164,15 +165,22 @@ class StepTraceTimeAnalysis:
                     if os.path.exists(step_time_file):
                         self.step_time_dict[rank_id] = FileManager.read_csv_file(step_time_file, StepTraceTimeBean)
             else:
-                step_time_file = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT,
-                                              Constant.DB_COMMUNICATION_ANALYZER)
-                if (os.path.exists(step_time_file) and
-                        DBManager.check_tables_in_db(step_time_file, Constant.TABLE_STEP_TRACE)):
-                    conn, cursor = DBManager.create_connect_db(step_time_file)
-                    sql = "select * from {0}".format(Constant.TABLE_STEP_TRACE)
-                    data = DBManager.fetch_all_data(cursor, sql, is_dict=False)
-                    self.step_time_dict[rank_id] = data
-                    DBManager.destroy_db_connect(conn, cursor)
+                if self.is_msprof:
+                    profiler_db = MsprofDataPreprocessor.get_msprof_profiler_db_path(profiling_dir_path)
+                    analysis_db = os.path.join(profiling_dir_path, "analyze", "communication_analyzer.db")
+                    self.step_time_dict[rank_id] = MsprofStepTraceTimeAdapter(
+                        {Constant.ANALYSIS_DB_PATH: analysis_db,
+                         Constant.PROFILER_DB_PATH: profiler_db}).generate_step_trace_time_db_data()
+                else:
+                    step_time_file = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT,
+                                                  Constant.DB_COMMUNICATION_ANALYZER)
+                    if (os.path.exists(step_time_file) and
+                            DBManager.check_tables_in_db(step_time_file, Constant.TABLE_STEP_TRACE)):
+                        conn, cursor = DBManager.create_connect_db(step_time_file)
+                        sql = "select * from {0}".format(Constant.TABLE_STEP_TRACE)
+                        data = DBManager.fetch_all_data(cursor, sql, is_dict=False)
+                        self.step_time_dict[rank_id] = data
+                        DBManager.destroy_db_connect(conn, cursor)
             if not self.step_time_dict.get(rank_id):
                 logger.warning("Rank %s does not have a valid step_trace_time data in %s file.",
                                str(rank_id), str(self.data_type))
diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py b/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
index 1e90d0cad11..ab4172a258c 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
@@ -13,6 +13,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 import argparse
+import copy
 import os
 import sys
 
@@ -60,7 +61,6 @@ class Interface:
         self.matrix_ops = []
         self.origin_params = params
         self.cluster_analysis_output_path = self.get_cluster_analysis_output_path(params)
-        self.force = params.get(Constant.FORCE, False)
         AdditionalArgsManager().init(params)
 
     def get_cluster_analysis_output_path(self, params):
@@ -111,45 +111,31 @@ class Interface:
             logger.error("The current folder contains both DB and other files. Please check.")
             return
 
-        params = {
+        params = copy.deepcopy(self.origin_params)
+        params.update({
             Constant.COLLECTION_PATH: self.collection_path,
             Constant.ANALYSIS_MODE: self.analysis_mode,
             Constant.DATA_MAP: data_map,
             Constant.DATA_TYPE: data_type,
             Constant.IS_MSPROF: data_dict.get(Constant.IS_MSPROF, False),
-            Constant.CLUSTER_ANALYSIS_OUTPUT_PATH: self.cluster_analysis_output_path,
-            Constant.DATA_SIMPLIFICATION: self.origin_params.get(Constant.DATA_SIMPLIFICATION, False),
-            Constant.FORCE: self.force
-        }
-
-        if data_type == Constant.TEXT:
-            if self.analysis_mode in COMM_FEATURE_LIST:
-                FileManager.create_output_dir(self.cluster_analysis_output_path)
-                PathManager.check_path_writeable(self.cluster_analysis_output_path)
-                logger.info("Begin generate communication data.")
+            Constant.CLUSTER_ANALYSIS_OUTPUT_PATH: self.cluster_analysis_output_path
+        })
+        if self.analysis_mode in COMM_FEATURE_LIST:
+            FileManager.create_output_dir(self.cluster_analysis_output_path)
+            PathManager.check_path_writeable(self.cluster_analysis_output_path)
+            logger.info("Begin generate communication data.")
+            if data_type == Constant.TEXT or not params.get(Constant.DATA_SIMPLIFICATION):
                 comm_data_dict = CommunicationGroupGenerator(params).generate()
                 logger.info("Communication data read completed.")
                 params[Constant.COMM_DATA_DICT] = comm_data_dict
-                AnalysisFacade(params).cluster_analyze()
-                logger.info("The cluster analysis result file has been generated: %s",
-                            self.cluster_analysis_output_path)
-            else:
-                logger.error("The current analysis node only supports DB as input data. Please check.")
+            AnalysisFacade(params).cluster_analyze()
+            logger.info("The cluster analysis result file has been generated: %s",
+                        self.cluster_analysis_output_path)
+        elif data_type == Constant.TEXT:
+            logger.error("The current analysis node only supports DB as input data. Please check.")
         else:
-            if self.analysis_mode in COMM_FEATURE_LIST:
-                FileManager.create_output_dir(self.cluster_analysis_output_path)
-                PathManager.check_path_writeable(self.cluster_analysis_output_path)
-                logger.info("Begin generate communication data.")
-                comm_data_dict = CommunicationGroupGenerator(params).generate()
-                logger.info("Communication data read completed.")
-                params[Constant.COMM_DATA_DICT] = comm_data_dict
-                AnalysisFacade(params).cluster_analyze()
-                logger.info("The cluster analysis result file has been generated: %s",
-                            self.cluster_analysis_output_path)
-            else:
-                FileManager.create_output_dir(self.cluster_analysis_output_path, is_overwrite=True)
-                self.origin_params.update(params)
-                AnalysisFacade(self.origin_params).recipe_analyze()
+            FileManager.create_output_dir(self.cluster_analysis_output_path, is_overwrite=True)
+            AnalysisFacade(params).recipe_analyze()
 
 
 def cluster_analysis_main():
diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
index 5c3e3f11fe1..1491468fde4 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
@@ -25,7 +25,7 @@ logger = get_logger()
 
 
 class MsprofDataPreprocessor(DataPreprocessor):
-    DEVICE_HEAD = "device_"
+    DEVICE_PATTERN = "device_\d{1,2}$"
     INFO_JSON_PATTERN = r"^info\.json\.\d{1,2}$"
     DB_PATTERN = r"^msprof_\d{1,20}\.db$"
 
@@ -33,6 +33,25 @@ class MsprofDataPreprocessor(DataPreprocessor):
         super().__init__(path_list)
         self.data_type = set()
 
+    @classmethod
+    def get_msprof_profiler_db_path(cls, data_path):
+        msprof_db_pattern = r"^msprof_\d{14}\.db$"
+        msprof_db_list = []
+        for file_name in os.listdir(data_path):
+            if re.match(msprof_db_pattern, file_name):
+                msprof_db_list.append(file_name)
+        if msprof_db_list:
+            msprof_db_list.sort(key=lambda x: x.split(".")[0].split("_")[-1])
+            return os.path.join(data_path, msprof_db_list[-1])
+        return ""
+
+    @classmethod
+    def get_device_id(cls, data_path):
+        for file_name in os.listdir(data_path):
+            if re.match(cls.DEVICE_PATTERN, file_name):
+                return int(file_name.split("_")[-1])
+        return None
+
     def get_data_map(self) -> dict:
         prof_data_uid = defaultdict(list)
         prof_data_rank = defaultdict(list)
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
index 4b966c69684..0d3fea0f401 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
@@ -14,7 +14,6 @@
 # limitations under the License.
 import argparse
 import os
-import re
 import shutil
 import sys
 import traceback
@@ -27,6 +26,7 @@ from msprof_analyze.cluster_analyse.common_func.utils import convert_unit
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
 from msprof_analyze.prof_common.path_manager import PathManager
+from msprof_analyze.cluster_analyse.cluster_data_preprocess.msprof_data_preprocessor import MsprofDataPreprocessor
 
 logger = get_logger()
 
@@ -183,15 +183,8 @@ class BaseRecipeAnalysis(ABC):
 
     def _get_profiler_db_path(self, rank_id, data_path):
         if self._is_msprof:
-            msprof_db_pattern = r"^msprof_\d{14}\.db$"
-            msprof_db_list = []
-            for file_name in os.listdir(data_path):
-                if re.match(msprof_db_pattern, file_name):
-                    msprof_db_list.append(file_name)
-            if msprof_db_list:
-                msprof_db_list.sort(key=lambda x: x.split(".")[0].split("_")[-1])
-                return os.path.join(data_path, msprof_db_list[-1])
-            return os.path.join(data_path, "msprof_xx.db")
+            db_path = MsprofDataPreprocessor.get_msprof_profiler_db_path(data_path)
+            return db_path if db_path else os.path.join(data_path, "msprof_xx.db")
         return os.path.join(data_path, Constant.SINGLE_OUTPUT, f"ascend_pytorch_profiler_{rank_id}.db")
 
     def _get_step_range(self, db_path):
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py b/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py
index 5fc51d6bc73..8a0b5d8fb20 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/comm_group_map/comm_group_map.py
@@ -16,12 +16,12 @@ import json
 import os
 import pandas as pd
 
-from cluster_analyse.common_func.utils import double_hash
-from cluster_analyse.common_func.table_constant import TableConstant
+from msprof_analyze.cluster_analyse.common_func.utils import double_hash
+from msprof_analyze.cluster_analyse.common_func.table_constant import TableConstant
 from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
-from prof_common.database_service import DatabaseService
+from msprof_analyze.prof_common.database_service import DatabaseService
 
 logger = get_logger()
 
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/__init__.py b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/__init__.py
new file mode 100644
index 00000000000..e69de29bb2d
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
new file mode 100644
index 00000000000..b77f0781eee
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
@@ -0,0 +1,201 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import ast
+import os
+
+import pandas as pd
+from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
+from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.database_service import DatabaseService
+from msprof_analyze.cluster_analyse.common_func.utils import double_hash
+
+logger = get_logger()
+
+
+class CommMatrixSum(BaseRecipeAnalysis):
+    TABLE_CLUSTER_COMM_MATRIX = "ClusterCommunicationMatrix"
+    RANK_MAP = "rank_map"
+    MATRIX_DATA = "matrix_data"
+    RANK_SET = "rank_set"
+    P2P_HCOM = ["hcom_send", "hcom_receive", "hcom_batchsendrecv"]
+
+    def __init__(self, params):
+        super().__init__(params)
+        self.cluster_matrix_df = None
+        logger.info("CommMatrixSum init.")
+
+    @property
+    def base_dir(self):
+        return os.path.basename(os.path.dirname(__file__))
+
+    @classmethod
+    def _get_parallel_group_info(cls, profiler_db_path):
+        rank_map = {}
+        data_service = DatabaseService(profiler_db_path, {})
+        data_service.add_table_for_query("MATA_DATA")
+        mata_df = data_service.query_data().get("MATA_DATA")
+        if not mata_df:
+            return rank_map
+        filtered_df = mata_df[mata_df['name'] == "parallel_group_info"]
+        if filtered_df.shape[0] == 1 and filtered_df.shape[1] == 2:
+            parallel_group_info = ast.literal_eval(filtered_df.loc[1, 'value'])
+            for group_name, group_info in parallel_group_info.items():
+                global_ranks = group_info.get("global_ranks")
+                if isinstance(global_ranks, list) and global_ranks:
+                    global_ranks.sort()
+                    rank_map[double_hash(group_name)] = dict(enumerate(global_ranks))
+        return rank_map
+
+    @classmethod
+    def _trans_msprof_matrix_data(cls, matrix_data):
+        matrix_data["step"] = "step"
+        matrix_data["type"] = Constant.COLLECTIVE
+        for index, row in matrix_data.iterrows():
+            lower_op_name = row["hccl_op_name"].lower()
+            if any(lower_op_name.startswith(start_str) for start_str in cls.P2P_HCOM):
+                matrix_data.at[index, "type"] = Constant.P2P
+        matrix_data = matrix_data.rename(columns={'hccl_op_name': 'op_name'})
+        matrix_data["hccl_op_name"] = matrix_data["op_name"].str.split("__").str[0]
+
+        # 按多字段分组
+        grouped_df = matrix_data.groupby(['type', 'step', 'group_name', 'hccl_op_name', 'src_rank', 'dst_rank'])
+
+        # 定义一个函数，用于提取特定的记录
+        def get_specific_rows(group):
+            # 按带宽排序
+            sorted_group = group.sort_values(by='bandwidth')
+            bottom1 = sorted_group.iloc[-1]
+            bottom2 = sorted_group.iloc[-2] if len(group) > 1 else pd.Series()
+            bottom3 = sorted_group.iloc[-3] if len(group) > 2 else pd.Series()
+            top1 = sorted_group.iloc[0]
+            mid_index = len(group) // 2
+            middle = sorted_group.iloc[mid_index]
+            return pd.DataFrame([top1, bottom1, bottom2, bottom3, middle],
+                                index=['top1', 'bottom1', 'bottom2', 'bottom3', 'middle']).reset_index()
+
+        example_df = grouped_df.apply(get_specific_rows).reset_index(drop=True)
+        example_df = example_df.dropna().reset_index(drop=True)
+        example_df["hccl_op_name"] = example_df["hccl_op_name"].astype(str) + "-" + example_df["index"].astype(str)
+        example_df = example_df.drop(columns="index")
+
+        # total
+        total_df = matrix_data.groupby(['type', 'step', 'group_name', 'hccl_op_name', 'src_rank', 'dst_rank']).agg(
+            {'transport_type': 'first', "transit_size": "sum", "transit_time": "sum"})
+        total_df = total_df.reset_index()
+        total_df["op_name"] = None
+        total_df["hccl_op_name"] = total_df["hccl_op_name"].astype(str) + "-total"
+        total_df['bandwidth'] = total_df['transit_size'] / total_df['transit_time'].where(total_df['transit_time'] != 0,
+                                                                                          other=0)
+        return pd.concat([example_df, total_df], ignore_index=True)
+
+    def run(self, context):
+        mapper_res = self.mapper_func(context)
+        self.reducer_func(mapper_res)
+
+        if self._export_type == "db":
+            self.save_db()
+        else:
+            logger.error("communication_matrix_sum is not supported for notebook export type.")
+
+    def reducer_func(self, mapper_res):
+        rank_map = self._generate_rank_map(mapper_res)
+        concat_df = pd.DataFrame()
+        for rank_data in mapper_res:
+            matrix_df = rank_data.get(self.MATRIX_DATA)
+            concat_df = pd.concat([concat_df, matrix_df], ignore_index=True)
+        concat_df[self.RANK_SET] = ""
+        for _, row in concat_df.iterrows():
+            if row["type"] == Constant.P2P:
+                row[self.RANK_SET] = Constant.P2P
+            rank_list = sorted(rank_map.get(row["group_name"], {}).values())
+            row[self.RANK_SET] = ",".join([str(rank) for rank in rank_list])
+        grouped_df = concat_df.groupby(
+            [self.RANK_SET, 'step', "hccl_op_name", "group_name", "src_rank", "dst_rank"]).agg(
+            {'transport_type': 'first', 'op_name': 'first', "transit_size": "sum", "transit_time": "sum"})
+        grouped_df = grouped_df.reset_index()
+        grouped_df["is_mapped"] = False
+        grouped_df["bandwidth"] = None
+        for index, row in grouped_df.iterrows():
+            src_rank = row["src_rank"]
+            dst_rank = row["dst_rank"]
+            group_name = row["group_name"]
+            group_rank_map = rank_map.get(group_name, {})
+            if src_rank not in group_rank_map:
+                logger.warning(f"The src local rank {src_rank} of the group_name {group_name} "
+                               f"cannot be mapped to the global rank.")
+                continue
+            if dst_rank not in group_rank_map:
+                logger.warning(f"The dst local rank {dst_rank} of the group_name {group_name} "
+                               f"cannot be mapped to the global rank.")
+                continue
+            grouped_df.at[index, 'src_rank'] = group_rank_map[src_rank]
+            grouped_df.at[index, 'dst_rank'] = group_rank_map[dst_rank]
+            grouped_df.at[index, 'is_mapped'] = True
+            grouped_df.at[index, 'bandwidth'] = row["transit_size"] / row["transit_time"] if row["transit_time"] else 0
+        filtered_df = grouped_df[grouped_df["is_mapped"]].drop(columns="is_mapped")
+        total_op_info = filtered_df[filtered_df['hccl_op_name'].str.contains('total', na=False)].groupby(
+            [self.RANK_SET, 'step', "src_rank", "dst_rank"]).agg(
+            {"group_name": "first", 'transport_type': 'first', 'op_name': 'first', "transit_size": "sum",
+             "transit_time": "sum"}
+        )
+        total_op_info = total_op_info.reset_index()
+        total_op_info["hccl_op_name"] = Constant.TOTAL_OP_INFO
+        total_op_info['bandwidth'] = total_op_info['transit_size'] / total_op_info['transit_time'].where(
+            total_op_info['transit_time'] != 0, other=0)
+        self.cluster_matrix_df = pd.concat([filtered_df, total_op_info], ignore_index=True).drop(columns=self.RANK_SET)
+
+    def save_db(self):
+        self.dump_data(self.cluster_matrix_df, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER,
+                       self.TABLE_CLUSTER_COMM_MATRIX, index=False)
+
+    def _generate_rank_map(self, mapper_res):
+        rank_map = {}
+        rank_map_df = pd.DataFrame({"group_name": [], "src_rank": [], Constant.RANK_ID: []})
+        for rank_data in mapper_res:
+            rank_map.update(rank_data.get(self.RANK_MAP))
+            matrix_df = rank_data.get(self.MATRIX_DATA)
+            filter_matrix_df = matrix_df[matrix_df["src_rank"] == matrix_df["dst_rank"]]
+            grouped_matrix_df = filter_matrix_df[['group_name', 'src_rank']].drop_duplicates()
+            grouped_matrix_df[Constant.RANK_ID] = rank_data.get(Constant.RANK_ID)
+            rank_map_df = pd.concat([grouped_matrix_df, rank_map_df], ignore_index=True)
+        rank_map_df = rank_map_df.drop_duplicates()
+        for _, row in rank_map_df.iterrows():
+            group_name = row["group_name"]
+            local_rank = row["src_rank"]
+            global_rank = row[Constant.RANK_ID]
+            if group_name not in rank_map:
+                rank_map[group_name] = {local_rank: global_rank}
+                continue
+            if local_rank not in rank_map[group_name]:
+                rank_map[group_name][local_rank] = global_rank
+                continue
+            if rank_map[group_name][local_rank] != global_rank:
+                logger.warning(f"In the same communication group {group_name}, global rank {global_rank} "
+                               f"and {rank_map[group_name][local_rank]} get the same local rank {local_rank}!")
+        return rank_map
+
+    def _mapper_func(self, data_map, analysis_class):
+        result_data = {Constant.RANK_ID: data_map.get(Constant.RANK_ID)}
+        profiler_db_path = data_map.get(Constant.PROFILER_DB_PATH)
+        result_data[self.RANK_MAP] = self._get_parallel_group_info(profiler_db_path)
+        analysis_db_path = data_map.get(Constant.ANALYSIS_DB_PATH)
+        data_service = DatabaseService(analysis_db_path, {})
+        data_service.add_table_for_query("CommAnalyzerMatrix")
+        matrix_data = data_service.query_data().get("CommAnalyzerMatrix")
+        if self._is_msprof:
+            matrix_data = self._trans_msprof_matrix_data(matrix_data)
+        result_data[self.MATRIX_DATA] = matrix_data
+        return result_data
diff --git a/profiler/msprof_analyze/test/st/cluster_analyse/test_cluster_analyse_pytorch_db.py b/profiler/msprof_analyze/test/st/cluster_analyse/test_cluster_analyse_pytorch_db.py
index bbc07adebfb..61557153494 100644
--- a/profiler/msprof_analyze/test/st/cluster_analyse/test_cluster_analyse_pytorch_db.py
+++ b/profiler/msprof_analyze/test/st/cluster_analyse/test_cluster_analyse_pytorch_db.py
@@ -73,7 +73,7 @@ class TestClusterAnalysePytorchDb(TestCase):
         text_cluster_step_trace_time = ClusterStepTraceTimeDb(*df.iloc[0])
         self.assertEqual(text_cluster_step_trace_time.type, db_cluster_step_trace_time.type,
                          "Cluster step trace time db vs text 'type' property wrong.")
-        self.assertEqual(text_cluster_step_trace_time.index, db_cluster_step_trace_time.index,
+        self.assertEqual(str(text_cluster_step_trace_time.index), str(db_cluster_step_trace_time.index),
                          "Cluster step trace time db vs text 'index' property wrong.")
         self.assertEqual(round(text_cluster_step_trace_time.computing), round(db_cluster_step_trace_time.computing),
                          "Cluster step trace time db vs text 'computing' property wrong.")
-- 
Gitee


From 74554aa9abdd89d7bf343d1db14e514f89e4b0fb Mon Sep 17 00:00:00 2001
From: l30036321 <lvkaimeng@huawei.com>
Date: Tue, 4 Mar 2025 11:28:20 +0800
Subject: [PATCH 082/145] add set_init_step

---
 debug/accuracy_tools/msprobe/core/common/utils.py |  9 +++++++++
 .../msprobe/docs/05.data_dump_PyTorch.md          | 15 +++++++++++++++
 .../msprobe/docs/06.data_dump_MindSpore.md        | 14 ++++++++++++++
 .../mindspore/debugger/precision_debugger.py      | 13 +++++++++++--
 debug/accuracy_tools/msprobe/mindspore/service.py |  7 +++++--
 .../pytorch/debugger/precision_debugger.py        | 10 +++++++++-
 debug/accuracy_tools/msprobe/pytorch/service.py   |  7 +++++--
 .../msprobe/test/mindspore_ut/test_ms_service.py  |  5 ++---
 .../test/mindspore_ut/test_primitive_dump.py      | 15 ++++++++-------
 .../msprobe/test/pytorch_ut/test_service.py       |  2 +-
 10 files changed, 79 insertions(+), 18 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/common/utils.py b/debug/accuracy_tools/msprobe/core/common/utils.py
index 7ec0490168f..38fcddfaead 100644
--- a/debug/accuracy_tools/msprobe/core/common/utils.py
+++ b/debug/accuracy_tools/msprobe/core/common/utils.py
@@ -428,6 +428,15 @@ def get_real_step_or_rank(step_or_rank_input, obj):
     return real_step_or_rank
 
 
+def check_init_step(step):
+    if not is_int(step):
+        raise MsprobeException(MsprobeException.INVALID_PARAM_ERROR,
+                        f"{step} must be an integer")
+    if not step >= 0:
+        raise MsprobeException(MsprobeException.INVALID_PARAM_ERROR,
+                f"{step} must be greater than or equal to 0")
+
+
 def check_seed_all(seed, mode, rm_dropout):
     if is_int(seed):
         if seed < 0 or seed > Const.MAX_SEED_VALUE:
diff --git a/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md b/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
index c2e33436e53..0ec8cf83a8e 100644
--- a/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
+++ b/debug/accuracy_tools/msprobe/docs/05.data_dump_PyTorch.md
@@ -187,6 +187,21 @@ save(variable, name, save_backward=True)
 | name           | 指定的名称         | str                 | 是  |
 | save_backward  | 是否保存反向数据   | boolean             | 否 |
 
+### 1.10 set_init_step
+
+**功能说明**：设置起始step数，step数默认从0开始计数，使用该接口后step从指定值开始计数。该函数需在 **start** 函数调用前使用，建议写在训练迭代的循环开始前。
+
+**原型**：
+
+```Python
+debugger.set_init_step(step)
+```
+
+**参数说明**:
+
+1.step: 指定的起始step数。
+
+
 ## 2 示例代码
 
 ### 2.1 快速上手
diff --git a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
index 96d37c170fa..7cf1d0673df 100644
--- a/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
+++ b/debug/accuracy_tools/msprobe/docs/06.data_dump_MindSpore.md
@@ -149,6 +149,20 @@ save(variable, name, save_backward=True)
 | save_backward  | 是否保存反向数据   | boolean             | 否 |
 
 
+#### 6.1.6 set_init_step
+
+**功能说明**：设置起始step数，step数默认从0开始计数，使用该接口后step从指定值开始计数。该函数需在 **start** 函数调用前使用，建议写在训练迭代的循环开始前。
+
+**原型**：
+
+```Python
+set_init_step(step)
+```
+
+**参数说明**:
+
+1.step: 指定的起始step数。
+
 
 ### 6.2 msprobe.mindspore.common.utils.MsprobeStep
 
diff --git a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
index 7694d71dd98..81e6eedab16 100644
--- a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
+++ b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
@@ -22,7 +22,7 @@ from mindspore._c_expression import MSContext
 from msprobe.core.common.const import Const, FileCheckConst, MsgConst
 from msprobe.core.common.exceptions import MsprobeException
 from msprobe.core.common.file_utils import FileChecker
-from msprobe.core.common.utils import get_real_step_or_rank
+from msprobe.core.common.utils import get_real_step_or_rank, check_init_step
 from msprobe.mindspore.cell_processor import CellProcessor
 from msprobe.mindspore.common.const import Const as MsConst
 from msprobe.mindspore.common.utils import set_register_backward_hook_functions, check_save_param
@@ -233,6 +233,14 @@ class PrecisionDebugger:
                 instance.service = Service(instance.config)
             instance.service.save(variable, name, save_backward)
 
+    @classmethod
+    def set_init_step(cls, step):
+        instance = cls._instance
+        if not instance:
+            raise Exception(MsgConst.NOT_CREATED_INSTANCE)
+        check_init_step(step)
+        instance.service.init_step = step
+
     @classmethod
     def _need_service(cls):
         instance = cls._instance
@@ -241,4 +249,5 @@ class PrecisionDebugger:
         if instance.config.execution_mode != MsConst.PYNATIVE_MODE:
             return False
         else:
-            return instance.config.task != Const.FREE_BENCHMARK and not instance._is_graph_dump(instance.config)
\ No newline at end of file
+            return instance.config.task != Const.FREE_BENCHMARK and not instance._is_graph_dump(instance.config)
+    
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/mindspore/service.py b/debug/accuracy_tools/msprobe/mindspore/service.py
index 5afbd046be4..7e0f8ed24e9 100644
--- a/debug/accuracy_tools/msprobe/mindspore/service.py
+++ b/debug/accuracy_tools/msprobe/mindspore/service.py
@@ -63,6 +63,8 @@ class Service:
         self.inner_switch = False
         self.primitive_switch = False
         self.current_iter = 0
+        self.loop = 0
+        self.init_step = 0
         self.first_start = True
         self.current_rank = None
         self.dump_iter_dir = None
@@ -276,11 +278,12 @@ class Service:
             if self.config.task == Const.TENSOR:
                 self.data_collector.data_processor.dump_async_data()
         self.data_collector.write_json()
-        self.current_iter += 1
-        self.data_collector.update_iter(self.current_iter)
+        self.loop += 1
         self.reset_status()
 
     def start(self, model=None):
+        self.current_iter = self.loop + self.init_step
+        self.data_collector.update_iter(self.current_iter)
         if self.config.level == Const.LEVEL_DEBUG:
             return
         self.start_call = True
diff --git a/debug/accuracy_tools/msprobe/pytorch/debugger/precision_debugger.py b/debug/accuracy_tools/msprobe/pytorch/debugger/precision_debugger.py
index 5bb1d3a14e8..e6b014e5284 100644
--- a/debug/accuracy_tools/msprobe/pytorch/debugger/precision_debugger.py
+++ b/debug/accuracy_tools/msprobe/pytorch/debugger/precision_debugger.py
@@ -19,7 +19,7 @@ import torch
 from msprobe.core.common.const import Const, FileCheckConst, MsgConst
 from msprobe.core.common.exceptions import MsprobeException
 from msprobe.core.common.file_utils import FileChecker
-from msprobe.core.common.utils import get_real_step_or_rank
+from msprobe.core.common.utils import get_real_step_or_rank, check_init_step
 from msprobe.pytorch.common.log import logger
 from msprobe.pytorch.common.utils import check_save_param
 from msprobe.pytorch.debugger.debugger_config import DebuggerConfig
@@ -172,6 +172,14 @@ class PrecisionDebugger:
             return
         instance.service.save(variable, name, save_backward)
 
+    @classmethod
+    def set_init_step(cls, step):
+        instance = cls._instance
+        if not instance:
+            raise Exception(MsgConst.NOT_CREATED_INSTANCE)
+        check_init_step(step)
+        instance.service.init_step = step
+
 
 def module_dump(module, dump_name):
     if not isinstance(module, torch.nn.Module):
diff --git a/debug/accuracy_tools/msprobe/pytorch/service.py b/debug/accuracy_tools/msprobe/pytorch/service.py
index fd81a7f1cf0..a8d191515c0 100644
--- a/debug/accuracy_tools/msprobe/pytorch/service.py
+++ b/debug/accuracy_tools/msprobe/pytorch/service.py
@@ -50,6 +50,8 @@ class Service:
         self.switch = False
         self.inner_switch = False
         self.current_iter = 0
+        self.loop = 0
+        self.init_step = 0
         self.first_start = True
         self.current_rank = None
         self.dump_iter_dir = None
@@ -246,6 +248,8 @@ class Service:
         return HookFn(pre_forward_hook_fn, forward_hook_fn, backward_hook_fn, forward_hook_torch_version_below_2_fn)
 
     def start(self, model):
+        self.current_iter = self.loop + self.init_step
+        self.data_collector.update_iter(self.current_iter)
         if self.config.level == Const.LEVEL_DEBUG:
             return
         if self.need_stop_service():
@@ -304,8 +308,7 @@ class Service:
             if self.config.task == Const.TENSOR:
                 self.data_collector.data_processor.dump_async_data()
         self.data_collector.write_json()
-        self.current_iter += 1
-        self.data_collector.update_iter(self.current_iter)
+        self.loop += 1
         self.reset_status()
 
     def need_stop_service(self):
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/test_ms_service.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/test_ms_service.py
index 912830ea1ab..e4bdca920c8 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/test_ms_service.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/test_ms_service.py
@@ -218,10 +218,9 @@ class TestService(unittest.TestCase):
         HOOKCell.cell_count = {"test_api": 1}
         JitDump.jit_count = {"test_api": 1}
         self.service.primitive_hook_service.primitive_counters = {"test_api": 1}
-        self.service.current_iter = 0
+        self.service.loop = 0
         self.service.step()
-        self.assertEqual(self.service.current_iter, 1)
-        self.service.data_collector.update_iter.assert_called_once_with(1)
+        self.assertEqual(self.service.loop, 1)
         self.service.data_collector.reset_status.assert_called_once()
         self.assertEqual(JitDump.jit_count, defaultdict(int))
         self.assertEqual((self.service.primitive_hook_service.primitive_counters), {})
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/test_primitive_dump.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/test_primitive_dump.py
index 3cafd49f2c1..79deeee08e1 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/test_primitive_dump.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/test_primitive_dump.py
@@ -84,9 +84,9 @@ class TestService(unittest.TestCase):
         self.assertEqual(self.service.primitive_hook_service.primitive_counters[primitive_name], 1)
 
     def test_step_updates_iteration(self):
-        initial_iter = self.service.current_iter
+        initial_iter = self.service.loop
         self.service.step()
-        self.assertEqual(self.service.current_iter, initial_iter + 1)
+        self.assertEqual(self.service.loop, initial_iter + 1)
 
     @patch.object(HOOKCell, 'cell_count', new_callable=lambda: defaultdict(int))
     def test_step_resets_counters(self, _):
@@ -96,12 +96,13 @@ class TestService(unittest.TestCase):
         self.assertEqual(self.service.primitive_hook_service.primitive_counters, {})
         self.assertEqual(HOOKCell.cell_count, defaultdict(int))
 
-    def test_step_calls_update_iter(self):
-        # 检查是否在调用 step 时调用了 update_iter
+    def test_start_calls_update_iter(self):
+        # 检查是否在调用 start 时调用了 update_iter
         with patch.object(self.service.data_collector, 'update_iter') as mock_update_iter:
-            initial_iter = self.service.current_iter
-            self.service.step()
-            mock_update_iter.assert_called_once_with(initial_iter + 1)
+            initial_iter = self.service.loop
+            init_step = self.service.init_step
+            self.service.start()
+            mock_update_iter.assert_called_once_with(initial_iter + init_step)
 
 
 class TestPrimitiveHookService(unittest.TestCase):
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/test_service.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/test_service.py
index 6687f311105..d443433dcc8 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/test_service.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/test_service.py
@@ -67,7 +67,7 @@ class TestService(unittest.TestCase):
 
     def test_step_success(self):
         self.service.step()
-        self.assertEqual(self.service.current_iter, 1)
+        self.assertEqual(self.service.loop, 1)
 
     def test_step_fail(self):
         self.service.should_stop_service = True
-- 
Gitee


From 57222bf8c68ecbae6d124deb744bc02fccbac166 Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Wed, 5 Mar 2025 18:17:16 +0800
Subject: [PATCH 083/145] adapt_msprof_step_trace_db

---
 .../msprof_step_trace_time_adapter.py         | 101 ++++++++++++++++--
 .../analysis/step_trace_time_analysis.py      |   5 +-
 .../common_func/table_constant.py             |   7 +-
 .../common_func/time_range_calculator.py      |  99 +++++++++++++++++
 4 files changed, 202 insertions(+), 10 deletions(-)
 create mode 100644 profiler/msprof_analyze/cluster_analyse/common_func/time_range_calculator.py

diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py b/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
index 998b717a434..68c039e0b4d 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
@@ -12,9 +12,18 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+
 from msprof_analyze.cluster_analyse.prof_bean.step_trace_time_bean import StepTraceTimeBean
 from msprof_analyze.prof_common.utils import convert_to_float
 from msprof_analyze.prof_common.file_manager import FileManager
+from msprof_analyze.cluster_analyse.common_func.time_range_calculator import RangeCaculator
+from msprof_analyze.prof_common.db_manager import DBManager
+from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.cluster_analyse.common_func.table_constant import TableConstant
+from msprof_analyze.cluster_analyse.common_func.time_range_calculator import CommunicationTimeRange
+from msprof_analyze.prof_common.constant import Constant
+
+logger = get_logger()
 
 
 class MsprofStepTraceTimeAdapter:
@@ -27,16 +36,13 @@ class MsprofStepTraceTimeAdapter:
     BUBBLE = "Bubble"
     COMM_NOT_OVERLAP_EXCLUDE_RECEIVE = "Communication(Not Overlapped and Exclude Receive)"
     PREPARE = "Preparing"
+    STEP = "Step"
 
     def __init__(self, file_path):
         self.file_path = file_path
-        self._data = {self.COMPUTE: 0, self.COMM_NOT_OVERLAP: 0, self.OVERLAPPED: 0, self.COMMUNICATION: 0,
-                      self.FREE: 0, self.STAGE: 0, self.BUBBLE: 0, self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE: 0,
-                      self.PREPARE: 0}
-
-    @classmethod
-    def generate_step_trace_time_db_data(cls):
-        return []
+        self._data = {self.STEP: None, self.COMPUTE: 0, self.COMM_NOT_OVERLAP: 0, self.OVERLAPPED: 0,
+                      self.COMMUNICATION: 0, self.FREE: 0, self.STAGE: 0, self.BUBBLE: 0,
+                      self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE: 0, self.PREPARE: 0}
 
     def generate_step_trace_time_data(self):
         json_str = []
@@ -58,3 +64,84 @@ class MsprofStepTraceTimeAdapter:
         e2e_time = self._data[self.FREE] + self._data[self.COMPUTE] + self._data[self.COMM_NOT_OVERLAP]
         self._data[self.STAGE] = e2e_time - self._data[self.BUBBLE]
         return [StepTraceTimeBean(self._data)]
+
+
+class MsprofStepTraceTimeDBAdapter(MsprofStepTraceTimeAdapter):
+    OP_NAME = 0
+    START_NS = 1
+    END_NS = 2
+
+    def __init__(self, file_path):
+        super().__init__(file_path)
+        self.task_db_con = None
+        self.task_db_curs = None
+        self.string_id_map = None
+        self.compute_task_info = None
+        self.communication_op_info = None
+
+    def generate_step_trace_time_data(self):
+        try:
+            self._init_task_info_from_db()
+        except Exception as err:
+            logger.error(err)
+            DBManager.destroy_db_connect(self.task_db_con, self.task_db_curs)
+            return []
+        origin_compute_data = self._get_compute_data()
+        origin_communication_data, bubble_data = self._get_communication_data()
+        compute_data = RangeCaculator.merge_continuous_intervals(origin_compute_data)
+        self._data[self.COMPUTE] = sum(data.end_ts - data.start_ts for data in compute_data)
+        communication_data = RangeCaculator.merge_continuous_intervals(origin_communication_data)
+        self._data[self.COMMUNICATION] = sum(data.end_ts - data.start_ts for data in communication_data)
+        pure_communication_data, free_data = RangeCaculator.compute_pipeline_overlap(communication_data, compute_data)
+        self._data[self.COMM_NOT_OVERLAP] = sum(data.end_ts - data.start_ts for data in pure_communication_data)
+        self._data[self.FREE] = sum(data.end_ts - data.start_ts for data in free_data)
+        self._data[self.BUBBLE] = sum(data.end_ts - data.start_ts for data in bubble_data)
+        self._data[self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE] = self._data[self.COMM_NOT_OVERLAP] - self._data[self.BUBBLE]
+        self._data[self.OVERLAPPED] = self._data[self.COMMUNICATION] - self._data[self.COMM_NOT_OVERLAP]
+        e2e_time = self._data[self.FREE] + self._data[self.COMPUTE] + self._data[self.COMM_NOT_OVERLAP]
+        self._data[self.STAGE] = e2e_time - self._data[self.BUBBLE]
+        return [[self._data[self.STEP], self._data[self.COMPUTE], self._data[self.COMM_NOT_OVERLAP],
+                 self._data[self.OVERLAPPED], self._data[self.COMMUNICATION], self._data[self.FREE],
+                 self._data[self.STAGE], self._data[self.BUBBLE], self._data[self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE],
+                 self._data[self.PREPARE]]]
+
+    def _init_task_info_from_db(self):
+        db_path = self.file_path.get(Constant.PROFILER_DB_PATH)
+        conn, curs = DBManager.create_connect_db(db_path)
+        if not (conn and curs):
+            logger.warning(f"Failed to connect to db file: {db_path}")
+            return
+        self.task_db_con = conn
+        self.task_db_curs = curs
+        if DBManager.judge_table_exists(curs, TableConstant.TABLE_STRING_IDS):
+            sql = "select id, value from {}".format(TableConstant.TABLE_STRING_IDS)
+            string_id_data = DBManager.fetch_all_data(curs, sql, is_dict=False)
+            self.string_id_map = {data[0]: data[1] for data in string_id_data}
+        if DBManager.judge_table_exists(curs, TableConstant.TABLE_COMPUTE_TASK_INFO):
+            sql = f"select TASK.startNs, TASK.endNs from {TableConstant.TABLE_COMPUTE_TASK_INFO} LEFT JOIN " \
+                  f"{TableConstant.TABLE_TASK} on {TableConstant.TABLE_TASK}.globalTaskId == " \
+                  f"{TableConstant.TABLE_COMPUTE_TASK_INFO}.globalTaskId"
+            self.compute_task_info = DBManager.fetch_all_data(curs, sql, is_dict=False)
+        if DBManager.judge_table_exists(curs, TableConstant.TABLE_COMMUNICATION_OP):
+            sql = "select opName, startNs, endNs from {}".format(TableConstant.TABLE_COMMUNICATION_OP)
+            self.communication_op_info = DBManager.fetch_all_data(curs, sql, is_dict=False)
+        DBManager.destroy_db_connect(conn, curs)
+
+    def _get_communication_data(self):
+        communication_data = []
+        bubble_data = []
+        for op_info in self.communication_op_info:
+            op_start_time = op_info[self.START_NS]
+            time_range = RangeCaculator.generate_time_range(
+                op_start_time, op_info[self.END_NS], class_range=CommunicationTimeRange)
+            communication_data.append(time_range)
+            op_name = self.string_id_map.get(op_info[self.OP_NAME], '')
+            if op_name.startswith('hcom_receive'):
+                bubble_data.append(time_range)
+        return communication_data, bubble_data
+
+    def _get_compute_data(self):
+        compute_data = []
+        for compute_task in self.compute_task_info:
+            compute_data.append(RangeCaculator.generate_time_range(compute_task[0], compute_task[1]))
+        return compute_data
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
index ace80d3d06b..cddf95d63be 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
@@ -24,6 +24,7 @@ from msprof_analyze.prof_common.file_manager import FileManager
 from msprof_analyze.prof_common.logger import get_logger
 from msprof_analyze.cluster_analyse.analysis.msprof_step_trace_time_adapter import MsprofStepTraceTimeAdapter
 from msprof_analyze.cluster_analyse.cluster_data_preprocess.msprof_data_preprocessor import MsprofDataPreprocessor
+from msprof_analyze.cluster_analyse.analysis.msprof_step_trace_time_adapter import MsprofStepTraceTimeDBAdapter
 
 logger = get_logger()
 
@@ -168,9 +169,9 @@ class StepTraceTimeAnalysis:
                 if self.is_msprof:
                     profiler_db = MsprofDataPreprocessor.get_msprof_profiler_db_path(profiling_dir_path)
                     analysis_db = os.path.join(profiling_dir_path, "analyze", "communication_analyzer.db")
-                    self.step_time_dict[rank_id] = MsprofStepTraceTimeAdapter(
+                    self.step_time_dict[rank_id] = MsprofStepTraceTimeDBAdapter(
                         {Constant.ANALYSIS_DB_PATH: analysis_db,
-                         Constant.PROFILER_DB_PATH: profiler_db}).generate_step_trace_time_db_data()
+                         Constant.PROFILER_DB_PATH: profiler_db}).generate_step_trace_time_data()
                 else:
                     step_time_file = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT,
                                                   Constant.DB_COMMUNICATION_ANALYZER)
diff --git a/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py b/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
index deec149e08c..7495ff56214 100644
--- a/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
+++ b/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
@@ -13,7 +13,6 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 class TableConstant:
-
     RANK_SET = "rank_set"
     STEP = "step"
     RANK_ID = "rank_id"
@@ -43,3 +42,9 @@ class TableConstant:
     PG_NAME = "pg_name"
     NAME = "name"
     VALUE = "value"
+
+    # table name
+    TABLE_STRING_IDS = "STRING_IDS"
+    TABLE_COMPUTE_TASK_INFO = "COMPUTE_TASK_INFO"
+    TABLE_COMMUNICATION_OP = "COMMUNICATION_OP"
+    TABLE_TASK = "TASK"
diff --git a/profiler/msprof_analyze/cluster_analyse/common_func/time_range_calculator.py b/profiler/msprof_analyze/cluster_analyse/common_func/time_range_calculator.py
new file mode 100644
index 00000000000..36ee94067ac
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/common_func/time_range_calculator.py
@@ -0,0 +1,99 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from dataclasses import dataclass
+
+DEFAULT_INT_VALUE = -1
+
+
+@dataclass
+class TimeRange:
+    start_ts: int = DEFAULT_INT_VALUE
+    end_ts: int = DEFAULT_INT_VALUE
+
+
+class CommunicationTimeRange(TimeRange):
+
+    def __init__(self):
+        super().__init__()
+
+
+class RangeCaculator:
+
+    @staticmethod
+    def generate_time_range(start, end, class_range=TimeRange):
+        time_range = class_range()
+        time_range.start_ts, time_range.end_ts = start, end
+        return time_range
+
+    @staticmethod
+    def merge_continuous_intervals(time_range_list: list):
+        result = []
+        if not time_range_list:
+            return result
+        time_range_list.sort(key=lambda x: x.start_ts)
+        current_range = time_range_list[0]
+        for time_range in time_range_list:
+            if time_range.start_ts <= current_range.end_ts:
+                current_range.end_ts = max(current_range.end_ts, time_range.end_ts)
+            else:
+                result.append(current_range)
+                current_range = time_range
+        result.append(current_range)
+        return result
+
+    @staticmethod
+    def compute_pipeline_overlap(communication_range, compute_range):
+        free_time_range = []
+        pure_communication_range = []
+        time_range_list = sorted(communication_range + compute_range, key=lambda x: x.start_ts)
+        if not time_range_list:
+            return pure_communication_range, free_time_range
+
+        min_range = time_range_list.pop(0)
+        for time_range in time_range_list:
+            if min_range.end_ts - time_range.start_ts < 0:
+                free_time_range.append(
+                    RangeCaculator.generate_time_range(min_range.end_ts, time_range.start_ts)
+                )
+                if isinstance(min_range, CommunicationTimeRange):
+                    pure_communication_range.append(
+                        RangeCaculator.generate_time_range(min_range.start_ts, min_range.end_ts)
+                    )
+                min_range = time_range
+                continue
+            if min_range.end_ts - time_range.end_ts < 0:
+                if isinstance(min_range, CommunicationTimeRange):
+                    pure_communication_range.append(
+                        RangeCaculator.generate_time_range(min_range.start_ts, time_range.start_ts)
+                    )
+                    min_range = RangeCaculator.generate_time_range(min_range.end_ts, time_range.end_ts)
+                if isinstance(time_range, CommunicationTimeRange):
+                    min_range = RangeCaculator.generate_time_range(
+                        min_range.end_ts, time_range.end_ts, class_range=CommunicationTimeRange
+                    )
+            else:
+                if isinstance(min_range, CommunicationTimeRange):
+                    pure_communication_range.append(
+                        RangeCaculator.generate_time_range(min_range.start_ts, time_range.start_ts)
+                    )
+                    min_range = RangeCaculator.generate_time_range(
+                        time_range.end_ts, min_range.end_ts, class_range=CommunicationTimeRange
+                    )
+                if isinstance(time_range, CommunicationTimeRange):
+                    min_range = RangeCaculator.generate_time_range(time_range.end_ts, min_range.end_ts)
+        if isinstance(min_range, CommunicationTimeRange):
+            pure_communication_range.append(min_range)
+        return pure_communication_range, free_time_range
-- 
Gitee


From da301379153a1f9942ef1f6ca1e45c46a0fc6fd6 Mon Sep 17 00:00:00 2001
From: fanglanyue <fanglanyue@huawei.com>
Date: Wed, 5 Mar 2025 15:37:46 +0800
Subject: [PATCH 084/145] communication group generate: p2p group

---
 .../base_communication_group.py               | 100 ++++------------
 .../communication_db_group.py                 |  17 +--
 .../msprof_analyze/prof_common/constant.py    |   1 +
 .../test_cluster_analyse_pytorch_text.py      |  16 ++-
 .../test_communication_group_generator.py     | 113 ------------------
 5 files changed, 42 insertions(+), 205 deletions(-)
 delete mode 100644 profiler/msprof_analyze/test/ut/cluster_analyse/communication_group/test_communication_group_generator.py

diff --git a/profiler/msprof_analyze/cluster_analyse/communication_group/base_communication_group.py b/profiler/msprof_analyze/cluster_analyse/communication_group/base_communication_group.py
index 0df5214eb49..bdb6371b1e5 100644
--- a/profiler/msprof_analyze/cluster_analyse/communication_group/base_communication_group.py
+++ b/profiler/msprof_analyze/cluster_analyse/communication_group/base_communication_group.py
@@ -41,9 +41,8 @@ class BaseCommunicationGroup:
         self.analysis_mode = params.get(Constant.ANALYSIS_MODE)
         self.is_msprof = params.get(Constant.IS_MSPROF)
         self.rank_comm_dir_dict = {}
-        self.p2p_link = []
         self.collective_group_dict = defaultdict(set)
-        self.p2p_comm_group = []
+        self.p2p_group_dict = defaultdict(set)
         self.communication_group = {}
         self.parallel_group_info = {}
         self.communication_ops = []
@@ -71,52 +70,11 @@ class BaseCommunicationGroup:
         with Pool(processes=max_processes) as p:
             self.rank_comm_dir_dict = p.map(self.read_communication_func, comm_op_dirs)
 
-    def set_p2p_groups(self):
-        self.p2p_link = sorted(self.p2p_link, key=lambda x: min(x))
-        while self.p2p_link:
-            union_set = deepcopy(self.p2p_link[0])
-            rm_list = [self.p2p_link[0]]
-            for _, link_rank_set_x in enumerate(self.p2p_link[1:]):
-                if UnionFind.is_connected(link_rank_set_x, union_set):
-                    union_set = union_set.union(link_rank_set_x)
-                    rm_list.append(link_rank_set_x)
-            self.p2p_comm_group.append(union_set)
-            self.p2p_link = [element for element in self.p2p_link if element not in rm_list]
-
-    def generate_collective_communication_group(self):
+    def generate_communication_group(self):
         self.communication_group[Constant.COLLECTIVE] = \
             [list(group) for _, group in self.collective_group_dict.items()]
-
-    def generate_p2p_communication_group(self):
-        stage_group = {}
-        for _, rank_set in self.collective_group_dict.items():
-            if not self.whether_valid_comm_group(rank_set):
-                continue
-            unioned_set = set()
-            remove_key = []
-            for first_rank, stage in stage_group.items():
-                if UnionFind.is_connected(rank_set, stage):
-                    unioned_set = UnionFind.union(rank_set, stage, unioned_set)
-                    remove_key.append(first_rank)
-            if unioned_set:
-                for key in remove_key:
-                    del stage_group[key]
-                stage_group[min(unioned_set)] = unioned_set
-            else:
-                stage_group[min(rank_set)] = rank_set
-        first_rank_sort_list = sorted([first_rank for first_rank in stage_group])
         self.communication_group[Constant.P2P] = \
-            [list(stage_group.get(first_rank, {})) for first_rank in first_rank_sort_list]
-
-    def whether_valid_comm_group(self, rank_set: set):
-        """
-        while distinguish which communication group should be used to infer stage info, these group should be ignored:
-            1. group can not include more than 1 rank in every single p2p group
-        """
-        for p2p_rank_set in self.p2p_comm_group:
-            if len(rank_set.intersection(p2p_rank_set)) > 1:
-                return False
-        return True
+            [list(group) for _, group in self.p2p_group_dict.items()]
 
     @abstractmethod
     def read_communication_func(self, params: tuple):
@@ -140,7 +98,8 @@ class BaseCommunicationGroup:
                 if not isinstance(step_id_dict, dict):
                     logger.warning("rank%s's communication.json has a wrong data struct.", rank_id)
                     continue
-                self.get_collective_ops_name(rank_id, step_id_dict.get(Constant.COLLECTIVE))
+                self.add_collective_group_rank_map(rank_id, step_id_dict.get(Constant.COLLECTIVE, {}))
+                self.add_p2p_group_rank_map(rank_id, step_id_dict.get(Constant.P2P, {}))
                 for comm_op_type, comm_op_dict in step_id_dict.items():
                     self.add_communication_ops(rank_id, step_id, comm_op_type, comm_op_dict)
 
@@ -148,8 +107,10 @@ class BaseCommunicationGroup:
                 if not isinstance(step_id_dict, dict):
                     logger.warning("rank%s's communication_matrix.json has a wrong data struct.", rank_id)
                     continue
-                self.set_p2p_link(rank_id, step_id, rank_id_matrix_dict)
-                self.get_collective_ops_name(rank_id, step_id_dict.get(Constant.COLLECTIVE))
+                self.add_matrix_ops(rank_id, step_id, step_id_dict)
+                self.add_collective_group_rank_map(rank_id, step_id_dict.get(Constant.COLLECTIVE, {}))
+                self.add_p2p_group_rank_map(rank_id, step_id_dict.get(Constant.P2P, {}))
+
 
     @abstractmethod
     def dump_data(self):
@@ -168,45 +129,25 @@ class BaseCommunicationGroup:
         self.load_communication_data()
         self.analyze_communication_data()
         self.read_parallel_group_info()
-        self.set_p2p_groups()
-        self.generate_collective_communication_group()
-        self.generate_p2p_communication_group()
+        self.generate_communication_group()
         self.analyze_parallel_group_info()
         self.dump_data()
         return self.collect_comm_data()
 
-    def set_p2p_link(self, rank_id: int, step_id: str, rank_id_matrix_dict: dict):
-        ops = rank_id_matrix_dict.get(step_id, {})
-        self.add_matrix_ops(rank_id, step_id, ops)
-        if not ops:
-            logger.warning(
-                "rank%s %s do not have communication matrix ops data.", rank_id, step_id
-            )
-            return
-        p2p_ops = ops.get(Constant.P2P, {})
-        for op_name, link_dict in p2p_ops.items():
-            self.append_p2p_link(op_name, link_dict)
-
-    def append_p2p_link(self, op_name, link_dict):
-        for link in link_dict:
-            if '-' not in link:
-                logger.warning("%s has an invalid link key %s!", op_name, link)
-                break
-            src_rank = int(link.split('-')[0])
-            dst_rank = int(link.split('-')[1])
-            if src_rank != dst_rank:
-                rank_set = {src_rank, dst_rank}
-                if rank_set in self.p2p_link:
-                    continue
-                self.p2p_link.append(rank_set)
-
-    def get_collective_ops_name(self, rank_id: int, comm_op_dict: dict):
+    def add_collective_group_rank_map(self, rank_id: int, comm_op_dict: dict):
         for comm_op in comm_op_dict:
             if comm_op.startswith('Total'):
                 continue
             group_name = comm_op.split('@')[-1]
             self.collective_group_dict[group_name].add(rank_id)
 
+    def add_p2p_group_rank_map(self, rank_id: int, comm_op_dict: dict):
+        for comm_op in comm_op_dict:
+            if comm_op.startswith('Total'):
+                continue
+            group_name = comm_op.split('@')[-1]
+            self.p2p_group_dict[group_name].add(rank_id)
+
     def add_communication_ops(self, rank_id: str, step_id: str, comm_op_type: str, comm_op_dict: dict):
         for comm_op in comm_op_dict:
             if comm_op.startswith('Total'):
@@ -245,6 +186,8 @@ class BaseCommunicationGroup:
         comm_group_df = pd.DataFrame(columns=comm_group_cols)
         for group_name, rank_set in self.collective_group_dict.items():
             comm_group_df.loc[comm_group_df.shape[0]] = [Constant.COLLECTIVE, list(rank_set), group_name]
+        for group_name, rank_set in self.p2p_group_dict.items():
+            comm_group_df.loc[comm_group_df.shape[0]] = [Constant.P2P, list(rank_set), group_name]
 
         # create parallel group dataframe
         parallel_group_cols = ["group_name", "group_id", "pg_name"]
@@ -258,9 +201,6 @@ class BaseCommunicationGroup:
 
         # merge by group_name
         df = pd.merge(comm_group_df, parallel_group_df, on='group_name', how='left')
-        # add p2p group
-        for rank_set in self.communication_group[Constant.P2P]:
-            df.loc[df.shape[0]] = [Constant.P2P, list(rank_set), None, None, None]
         df.fillna("", inplace=True)
 
         self.comm_group_parallel_info_df = df
diff --git a/profiler/msprof_analyze/cluster_analyse/communication_group/communication_db_group.py b/profiler/msprof_analyze/cluster_analyse/communication_group/communication_db_group.py
index 99b55fb9956..f570ce204d9 100644
--- a/profiler/msprof_analyze/cluster_analyse/communication_group/communication_db_group.py
+++ b/profiler/msprof_analyze/cluster_analyse/communication_group/communication_db_group.py
@@ -100,13 +100,16 @@ class CommunicationDBGroupOptimized(BaseCommunicationGroup):
         comm_time_data = (time_data, bandwidth_data)
         return rank_id, comm_time_data, comm_matrix_data
 
-    def set_collective_group(self, rank_id: int, time_data: list):
+    def set_group_rank_map(self, rank_id: int, time_data: list):
         for single_time_data in time_data:
-            if single_time_data.get('type') == Constant.P2P:
-                continue
+            group_type = single_time_data.get(Constant.TYPE)
             group_name = single_time_data.get(Constant.GROUP_NAME)
-            if group_name:
+            if not group_name:
+                return
+            if group_type == Constant.COLLECTIVE:
                 self.collective_group_dict[group_name].add(rank_id)
+            elif group_type == Constant.P2P:
+                self.p2p_group_dict[group_name].add(rank_id)
 
     def analyze_communication_data(self):
         for rank_id, comm_time_data, comm_matrix_data in self.rank_comm_dir_dict:
@@ -115,7 +118,7 @@ class CommunicationDBGroupOptimized(BaseCommunicationGroup):
                 if not time_data:
                     logger.warning("[WARNING] rank %s has error format in time data.", rank_id)
                     continue
-                self.set_collective_group(rank_id, time_data)
+                self.set_group_rank_map(rank_id, time_data)
                 self.communication_ops.extend(self._merge_data_with_rank(rank_id, time_data))
                 self.bandwidth_data.extend(self._merge_data_with_rank(rank_id, bandwidth_data))
             if self.analysis_mode in [Constant.ALL, Constant.COMMUNICATION_MATRIX]:
@@ -126,8 +129,8 @@ class CommunicationDBGroupOptimized(BaseCommunicationGroup):
                     if not isinstance(step_id_dict, dict):
                         logger.warning("[WARNING] rank %s has error format in matrix data.", rank_id)
                         continue
-                    self.set_p2p_link(rank_id, step_id, comm_matrix_data)
-                    self.get_collective_ops_name(rank_id, step_id_dict.get(Constant.COLLECTIVE))
+                    self.add_matrix_ops(rank_id, step_id, step_id_dict)
+                    self.set_group_rank_map(rank_id, time_data)
 
     def generate_collective_communication_group(self):
         collective_group = []
diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index af39ccc1051..6dbc20ba314 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -87,6 +87,7 @@ class Constant(object):
     ELAPSE_TIME_MS = "Elapse Time(ms)"
     IDLE_TIME_MS = "Idle Time(ms)"
     LARGE_PACKET_RATIO = "Large Packet Ratio"
+    TYPE = "type"
 
     # params
     DATA_MAP = "data_map"
diff --git a/profiler/msprof_analyze/test/st/cluster_analyse/test_cluster_analyse_pytorch_text.py b/profiler/msprof_analyze/test/st/cluster_analyse/test_cluster_analyse_pytorch_text.py
index d6f8d470109..be88b8f1e77 100644
--- a/profiler/msprof_analyze/test/st/cluster_analyse/test_cluster_analyse_pytorch_text.py
+++ b/profiler/msprof_analyze/test/st/cluster_analyse/test_cluster_analyse_pytorch_text.py
@@ -139,9 +139,13 @@ class TestClusterAnalyseCmdPytorchText(TestCase):
                    "Communication(Not Overlapped and Exclude Receive)", "Preparing"]
         self.assertEqual(headers, df.columns.tolist(), "PyTorch text result columns wrong.")
 
-        data_base = ["rank", "7", 14945901.573999925, 50289541.49199608, 14462809.01400388, 64752350.50599996,
+        data_base = ["rank", 7, 14945901.573999925, 50289541.49199608, 14462809.01400388, 64752350.50599996,
                      377397.078000026, 65612840.25, 0.0, 50289541.49199608, 1726054679554437.8]
-        self.assertEqual(data_base, df.iloc[0].loc["Type":"Preparing"].tolist(), "PyTorch text result data wrong.")
+
+        rank_7_df = df[df["Index"] == 7]
+        self.assertEqual(len(rank_7_df), 1, "PyTorch text result data wrong.")
+        data_compare = rank_7_df.iloc[0].loc["Type":"Preparing"].values.tolist()
+        self.assertEqual(data_base, data_compare, "PyTorch text result data wrong.")
 
     def communication_matrix_compare(self):
         """
@@ -153,10 +157,11 @@ class TestClusterAnalyseCmdPytorchText(TestCase):
         for header in headers:
             result_data = result_data.get(header, {})
         compare_data = []
-        for data in list(result_data.values())[:12]:
+        result_data = {k: result_data[k] for k in sorted(result_data.keys(), reverse=True)}
+        for data in list(result_data.values()):
             compare_data.append(data.get("Bandwidth(GB/s)", -1))
-        data_base = [25.0568, 641.8677, 23.4726, 23.2394, 626.9544, 24.9039,
-                     22.7738, 23.0614, 640.6486, 25.7812, 23.1025, 23.2896]
+        data_base = [641.8677, 23.4726, 23.2394, 25.0568, 22.7738, 626.9544, 23.0614, 24.9039,
+                     23.2896, 23.1025, 640.6486, 25.7812, 23.1077, 22.9017, 23.2811, 629.2938]
         self.assertEqual(data_base, compare_data, "PyTorch text result data wrong.")
 
     def communication_compare(self):
@@ -170,6 +175,7 @@ class TestClusterAnalyseCmdPytorchText(TestCase):
         for header in headers:
             result_data = result_data.get(header, {})
         board_datas = []
+        result_data = {k: result_data[k] for k in sorted(result_data.keys(), reverse=True)}
         for data in list(result_data.values())[:2]:
             board_datas.append(data.get("Communication Time Info", {}))
         compare_data = []
diff --git a/profiler/msprof_analyze/test/ut/cluster_analyse/communication_group/test_communication_group_generator.py b/profiler/msprof_analyze/test/ut/cluster_analyse/communication_group/test_communication_group_generator.py
deleted file mode 100644
index 517327b8111..00000000000
--- a/profiler/msprof_analyze/test/ut/cluster_analyse/communication_group/test_communication_group_generator.py
+++ /dev/null
@@ -1,113 +0,0 @@
-# Copyright (c) 2025, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import unittest
-from unittest import mock
-
-from msprof_analyze.cluster_analyse.communication_group.communication_group_generator import CommunicationGroupGenerator
-from msprof_analyze.prof_common.constant import Constant
-
-
-class TestCommunicationGroupGenerator(unittest.TestCase):
-    DIR_PATH = ''
-    PARAMS = {
-        Constant.DATA_SIMPLIFICATION: "ORIGINAL",
-        Constant.DATA_TYPE: Constant.TEXT
-    }
-
-    def test_generate_p2p_communication_when_given_group_1p_return_1p2p(self):
-        check = CommunicationGroupGenerator(self.PARAMS).processor
-        check.collective_group_dict = {
-            'group1': {0}
-        }
-        with mock.patch("msprof_analyze.prof_common.file_manager.FileManager.read_json_file",
-                        return_value=True):
-            check.generate_p2p_communication_group()
-            ret = {0}
-            self.assertEqual(ret, set(check.communication_group[Constant.P2P][0]))
-
-    def test_generate_p2p_communication_when_given_group_8p_return_correct_value(self):
-        check = CommunicationGroupGenerator(self.PARAMS).processor
-        check.collective_group_dict = {
-            'group1': {1, 2, 3, 4},
-            'group2': {5, 6, 7, 8},
-        }
-        with mock.patch("msprof_analyze.prof_common.file_manager.FileManager.read_json_file",
-                        return_value=True):
-            check.generate_p2p_communication_group()
-            ret_a = {1, 2, 3, 4}
-            ret_b = {5, 6, 7, 8}
-            self.assertEqual(ret_a, set(check.communication_group[Constant.P2P][0]))
-            self.assertEqual(ret_b, set(check.communication_group[Constant.P2P][1]))
-
-    def test_generate_p2p_communication_when_given_group_16p_expect_4_group(self):
-        check = CommunicationGroupGenerator(self.PARAMS).processor
-        check.collective_group_dict = {
-            'group1': {0, 1},
-            'group2': {0, 2},
-            'group3': {2, 3},
-            'group4': {3, 1},
-            'group5': {4, 5},
-            'group6': {4, 6},
-            'group7': {5, 7},
-            'group8': {6, 7},
-            'group9': {8, 9},
-            'group10': {8, 10},
-            'group11': {11, 10},
-            'group12': {11, 9},
-            'group13': {12, 13},
-            'group14': {12, 14},
-            'group15': {15, 13},
-            'group16': {15, 14}
-        }
-        with mock.patch("msprof_analyze.prof_common.file_manager.FileManager.read_json_file",
-                        return_value=True):
-            check.generate_p2p_communication_group()
-            ret_a = {0, 1, 2, 3}
-            ret_b = {4, 5, 6, 7}
-            ret_c = {8, 9, 10, 11}
-            ret_d = {12, 13, 14, 15}
-            self.assertEqual(ret_a, set(check.communication_group[Constant.P2P][0]))
-            self.assertEqual(ret_b, set(check.communication_group[Constant.P2P][1]))
-            self.assertEqual(ret_c, set(check.communication_group[Constant.P2P][2]))
-            self.assertEqual(ret_d, set(check.communication_group[Constant.P2P][3]))
-
-    def test_generate_p2p_communication_group_when_given_repeat_group_expect_2_group(self):
-        check = CommunicationGroupGenerator(self.PARAMS).processor
-        check.collective_group_dict = {
-            'group1': {0, 1, 2, 3},
-            'group2': {0, 1, 2, 3},
-            'group3': {0, 1, 2, 3},
-            'group4': {0, 1, 2, 3},
-            'group5': {3, 2, 4, 5},
-            'group6': {4, 5, 6, 7},
-            'group7': {4, 5, 6, 7},
-            'group8': {4, 5, 6, 7},
-            'group9': {8, 9, 11, 10},
-            'group10': {8, 9, 11, 10},
-            'group11': {11, 10, 12, 13},
-            'group12': {11, 10, 12, 13},
-            'group13': {11, 10, 12, 13},
-            'group14': {12, 13, 14, 15},
-            'group15': {12, 13, 14, 15},
-            'group16': {12, 13, 14, 15}
-        }
-        with mock.patch("msprof_analyze.prof_common.file_manager.FileManager.read_json_file",
-                        return_value=True):
-            check.generate_p2p_communication_group()
-            ret_a = {0, 1, 2, 3, 4, 5, 6, 7}
-            ret_b = {8, 9, 10, 11, 12, 13, 14, 15}
-            self.assertEqual(ret_a, set(check.communication_group[Constant.P2P][0]))
-            self.assertEqual(ret_b, set(check.communication_group[Constant.P2P][1]))
-- 
Gitee


From 706991c3e61bb5ce6d3f210abf7c4ecd5802766c Mon Sep 17 00:00:00 2001
From: eveyin <qianyin2022@hotmail.com>
Date: Wed, 5 Mar 2025 21:13:12 +0800
Subject: [PATCH 085/145] sum commit info

---
 .../msprof_analyze/cluster_analyse/README.md  |   1 +
 .../recipes/ep_load_balance/__init__.py       |  14 ++
 .../ep_load_balance/ep_load_balance.py        | 129 ++++++++++++++++++
 .../prof_exports/ep_load_balance_ecport.py    |  49 +++++++
 4 files changed, 193 insertions(+)
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/ep_load_balance/__init__.py
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/ep_load_balance/ep_load_balance.py
 create mode 100644 profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py

diff --git a/profiler/msprof_analyze/cluster_analyse/README.md b/profiler/msprof_analyze/cluster_analyse/README.md
index 6612d0f1989..b38f1bfb28d 100644
--- a/profiler/msprof_analyze/cluster_analyse/README.md
+++ b/profiler/msprof_analyze/cluster_analyse/README.md
@@ -80,6 +80,7 @@ experimental_config = torch_npu.profiler._ExperimentalConfig(
    | hccl_sum             | 集合通信算子耗时分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。--export_type为db时，输出交付件cluster_analysis.db；--export_type为notebook时，在cluster_analysis_output/HcclSum目录下输出交付件stats.ipynb。 | 否       |
    | mstx_sum             | 集群场景mstx打点信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。--export_type为db时，输出交付件cluster_analysis.db；--export_type为notebook时，在cluster_analysis_output/MstxSum目录下输出交付件stats.ipynb。 | 否       |
    | freq_analysis        | 集群场景aicore frequency信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。打屏输出是否存在aicore存在空闲（频率为800MHz）、异常（频率不为1800MHz或800MHz）的现象。如果有，则在输出交付件cluster_analysis.db增加对应的卡和频率信息。 | 否       |
+   | ep_load_balance       | 集群场景moe负载信息汇总分析，输入性能数据需要基于ascend_pytorch_profiler_{rank_id}.db文件。输出交付件cluster_analysis.db增加EPTokensSummary, TopEPTokensInfo分析表格。 | 否       |
    | 自定义分析参数       | 与cann_api_sum、compute_op_sum、hccl_sum等参数功能类似，用户可自定义一套性能数据的分析规则，需要详细了解性能分析的开发人员，具体开发指导请参见“[自定义分析规则开发指导](#自定义分析规则开发指导)”。 | 否       |
    
    --parallel_mode参数示例如下：
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/ep_load_balance/__init__.py b/profiler/msprof_analyze/cluster_analyse/recipes/ep_load_balance/__init__.py
new file mode 100644
index 00000000000..b14094e3f9a
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/ep_load_balance/__init__.py
@@ -0,0 +1,14 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
\ No newline at end of file
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/ep_load_balance/ep_load_balance.py b/profiler/msprof_analyze/cluster_analyse/recipes/ep_load_balance/ep_load_balance.py
new file mode 100644
index 00000000000..74caf90341c
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/ep_load_balance/ep_load_balance.py
@@ -0,0 +1,129 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+import json
+
+import pandas as pd
+
+from msprof_analyze.cluster_analyse.recipes.base_recipe_analysis import BaseRecipeAnalysis
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.prof_exports.ep_load_balance_ecport import InputShapeExport
+from msprof_analyze.prof_common.database_service import DatabaseService
+
+logger = get_logger()
+
+
+class EPLoadBalance(BaseRecipeAnalysis):
+
+    EPTOKENSSUMMARY = "EPTokensSummary"
+    TOPEPTOKENSINFO = "TopEPTokensInfo"
+    META_DATA = "META_DATA"
+    Top_Num = 20
+    GROUPEP = "exp"
+
+    def __init__(self, params):
+        super().__init__(params)
+        logger.info("EPLoadBalance init.")
+        self.ep_tokens_summary = None
+        self.top_ep_tokens_map = None
+
+    @property
+    def base_dir(self):
+        return os.path.basename(os.path.dirname(__file__))
+
+    def process_input_shapes(self, df):
+        def calculate_seqlength(shape_str):
+            shape_str = shape_str.strip('"')
+            parts = shape_str.split(";")
+            non_empty_parts = [part for part in parts if part]
+            # 取前 n-2 个有值的部分
+            if len(non_empty_parts) > 1:
+                non_empty_parts = non_empty_parts[: len(non_empty_parts) - 2]
+            else:
+                return None
+            seqlength = 0
+            for part in non_empty_parts:
+                part = part.strip()
+                try:
+                    first_dim = int(part.split(",")[0])
+                except (IndexError, ValueError) as e:
+                    return None
+                seqlength += first_dim
+            return seqlength
+
+        df["InputShapes"] = df["InputShapes"].apply(calculate_seqlength)
+        return df
+
+    def reducer_func(self, mapper_res):
+        mapper_res = list(filter(lambda df: df is not None, mapper_res))
+        if not mapper_res:
+            logger.error("Mapper data is None.")
+            return
+        for i, df in enumerate(mapper_res):
+            mapper_res[i] = self.process_input_shapes(df)
+        mapper_res = [df.dropna() for df in mapper_res]
+        for df in mapper_res:
+            df["epRanks"] = df["epRanks"].apply(lambda x: ",".join(map(str, x)))
+        combined_df = pd.concat(mapper_res)
+        self.ep_tokens_summary = combined_df.groupby(["Rank", "epRanks"]).agg({"InputShapes": "sum"}).reset_index()
+        self.ep_tokens_summary.columns = ["rank", "epRanks", "inputShapesSummary"]
+        self.top_ep_tokens_map = (
+            self.ep_tokens_summary.groupby("epRanks")["inputShapesSummary"]
+            .agg(tokensDiff=lambda x: x.max() - x.min())
+            .reset_index()
+        )
+        self.top_ep_tokens_map = self.top_ep_tokens_map.sort_values(by="tokensDiff", ascending=False).head(self.Top_Num)
+
+    def run(self, context):
+        mapper_res = self.mapper_func(context)
+        self.reducer_func(mapper_res)
+
+        if self._export_type == "db":
+            self.save_db()
+        else:
+            logger.error("ep_load_balance is only supported for db export type.")
+
+    def save_db(self):
+        self.dump_data(self.ep_tokens_summary, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER, self.EPTOKENSSUMMARY)
+        self.dump_data(self.top_ep_tokens_map, Constant.DB_CLUSTER_COMMUNICATION_ANALYZER, self.TOPEPTOKENSINFO)
+
+    def _mapper_func(self, data_map, analysis_class):
+        profiler_db_path = data_map.get(Constant.PROFILER_DB_PATH)
+        rank_id = data_map.get(Constant.RANK_ID)
+        step_range = data_map.get(Constant.STEP_RANGE)
+        analysis_data_service = DatabaseService(profiler_db_path, {})
+        analysis_data_service.add_table_for_query(self.META_DATA)
+        meta_map = analysis_data_service.query_data()[self.META_DATA]
+        parallel_group_info = meta_map.loc[meta_map['name'] == 'parallel_group_info', 'value'].iloc[0]
+        try:
+            data_dict = json.loads(parallel_group_info)
+        except json.JSONDecodeError as e:
+            logger.error(f"{profiler_db_path}'s parallel_group_info is illegal")
+            return None
+        if not isinstance(data_dict, dict):
+            raise TypeError('{} must be dict, not {}.'.format(data_dict, type(data_dict).__name__))     
+        for _, value in data_dict.items():
+            if value["group_name"] == self.GROUPEP:
+                global_ranks = value["global_ranks"]
+                break
+        df = InputShapeExport(profiler_db_path, analysis_class, step_range).read_export_db()
+        if df is None or df.empty:
+            logger.warning(f"There is no stats data in {profiler_db_path}.")
+            return None
+        df["Rank"] = rank_id
+        df["epRanks"] = [global_ranks] * len(df)
+        return df
\ No newline at end of file
diff --git a/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py b/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py
new file mode 100644
index 00000000000..9bc2067bddf
--- /dev/null
+++ b/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py
@@ -0,0 +1,49 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+from msprof_analyze.prof_exports.base_stats_export import BaseStatsExport
+from msprof_analyze.prof_common.constant import Constant
+grouped_matmul_query = """
+SELECT
+    InputShapes_IDS.value AS "InputShapes"
+FROM COMPUTE_TASK_INFO
+JOIN TASK 
+    ON COMPUTE_TASK_INFO.globalTaskId = TASK.globalTaskId
+LEFT JOIN STRING_IDS AS InputShapes_IDS 
+    ON InputShapes_IDS.id = COMPUTE_TASK_INFO.inputShapes
+WHERE COMPUTE_TASK_INFO.opType = (
+    SELECT id 
+    FROM STRING_IDS 
+    WHERE value = 'GroupedMatmul'
+)
+{}
+    """
+
+
+class InputShapeExport(BaseStatsExport):
+
+    def __init__(self, db_path, recipe_name, step_range):
+        super().__init__(db_path, recipe_name, step_range)
+        self._query = self.get_query_statement()
+
+    def get_query_statement(self):
+        if self._step_range:
+            filter_statement = (
+                f"And TASK.startNs >= {self._step_range.get(Constant.START_NS)} "
+                f"And TASK.endNs <= {self._step_range.get(Constant.END_NS)}"
+            )
+        else:
+            filter_statement = ""
+        return grouped_matmul_query.format(filter_statement)
\ No newline at end of file
-- 
Gitee


From fe1943f59b3ebde446ea19c962753444e2070830 Mon Sep 17 00:00:00 2001
From: eveyin <qianyin2022@hotmail.com>
Date: Wed, 5 Mar 2025 21:32:28 +0800
Subject: [PATCH 086/145] fix

---
 .../msprof_analyze/prof_exports/ep_load_balance_ecport.py     | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py b/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py
index 9bc2067bddf..6836edbd8a7 100644
--- a/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py
+++ b/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py
@@ -15,7 +15,7 @@
 
 from msprof_analyze.prof_exports.base_stats_export import BaseStatsExport
 from msprof_analyze.prof_common.constant import Constant
-grouped_matmul_query = """
+GROUPED_MATMUL_QUERY = """
 SELECT
     InputShapes_IDS.value AS "InputShapes"
 FROM COMPUTE_TASK_INFO
@@ -46,4 +46,4 @@ class InputShapeExport(BaseStatsExport):
             )
         else:
             filter_statement = ""
-        return grouped_matmul_query.format(filter_statement)
\ No newline at end of file
+        return GROUPED_MATMUL_QUERY.format(filter_statement)
\ No newline at end of file
-- 
Gitee


From d52a1d746c6edd11b5166f8158ae88d6b5f06e7e Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Thu, 6 Mar 2025 15:55:00 +0800
Subject: [PATCH 087/145] bug_fix_step_trace_time

---
 .../analysis/msprof_step_trace_time_adapter.py         | 10 ++++++----
 profiler/msprof_analyze/prof_common/constant.py        |  1 +
 2 files changed, 7 insertions(+), 4 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py b/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
index 68c039e0b4d..799fd86a477 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/msprof_step_trace_time_adapter.py
@@ -100,10 +100,12 @@ class MsprofStepTraceTimeDBAdapter(MsprofStepTraceTimeAdapter):
         self._data[self.OVERLAPPED] = self._data[self.COMMUNICATION] - self._data[self.COMM_NOT_OVERLAP]
         e2e_time = self._data[self.FREE] + self._data[self.COMPUTE] + self._data[self.COMM_NOT_OVERLAP]
         self._data[self.STAGE] = e2e_time - self._data[self.BUBBLE]
-        return [[self._data[self.STEP], self._data[self.COMPUTE], self._data[self.COMM_NOT_OVERLAP],
-                 self._data[self.OVERLAPPED], self._data[self.COMMUNICATION], self._data[self.FREE],
-                 self._data[self.STAGE], self._data[self.BUBBLE], self._data[self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE],
-                 self._data[self.PREPARE]]]
+        return [[self._data[self.STEP], self._data[self.COMPUTE] / Constant.NS_TO_US,
+                 self._data[self.COMM_NOT_OVERLAP] / Constant.NS_TO_US, self._data[self.OVERLAPPED] / Constant.NS_TO_US,
+                 self._data[self.COMMUNICATION] / Constant.NS_TO_US, self._data[self.FREE] / Constant.NS_TO_US,
+                 self._data[self.STAGE] / Constant.NS_TO_US, self._data[self.BUBBLE] / Constant.NS_TO_US,
+                 self._data[self.COMM_NOT_OVERLAP_EXCLUDE_RECEIVE] / Constant.NS_TO_US,
+                 self._data[self.PREPARE] / Constant.NS_TO_US]]
 
     def _init_task_info_from_db(self):
         db_path = self.file_path.get(Constant.PROFILER_DB_PATH)
diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index 31febbd7f42..41d2a7726f7 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -166,6 +166,7 @@ class Constant(object):
     BLUE_COLOR = "00BFFF"
     LIGHT_BLUE_COLOR = "87CEFA"
     US_TO_MS = 1000
+    NS_TO_US = 1000
     KB_TO_MB = 1024
     INVALID_VALUE = -1
     MILLISECONDS_TO_SECONDS = 10 ** 3
-- 
Gitee


From a90dc40be514243c25d42cdee621e39f819fe4fb Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=AD=94=E7=82=B3=E7=BF=94?= <1120200577@qq.com>
Date: Thu, 6 Mar 2025 16:02:08 +0800
Subject: [PATCH 088/145] add init to slow rank

---
 .../cluster_analyse/recipes/slow_rank/__init__.py  | 14 ++++++++++++++
 1 file changed, 14 insertions(+)
 create mode 100644 profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/__init__.py

diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/__init__.py b/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/__init__.py
new file mode 100644
index 00000000000..a355e5a7f08
--- /dev/null
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/slow_rank/__init__.py
@@ -0,0 +1,14 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
-- 
Gitee


From 5dbc231a48486367f790467b56fefd69b2eb26c4 Mon Sep 17 00:00:00 2001
From: cai-weiwei1989 <734267852@qq.com>
Date: Thu, 6 Mar 2025 16:09:37 +0800
Subject: [PATCH 089/145] =?UTF-8?q?[cluster=5Fanalyse]=E9=9B=86=E7=BE=A4?=
 =?UTF-8?q?=E5=88=86=E6=9E=90=E5=B7=A5=E5=85=B7=E8=B5=84=E6=96=99=E8=A1=A5?=
 =?UTF-8?q?=E5=85=85msprof=E6=96=B9=E5=BC=8F=E7=9A=84=E6=95=B0=E6=8D=AE?=
 =?UTF-8?q?=E5=88=86=E6=9E=90?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprof_analyze/cluster_analyse/README.md  | 31 ++++++++++++-------
 1 file changed, 19 insertions(+), 12 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/README.md b/profiler/msprof_analyze/cluster_analyse/README.md
index 526a7bc00c8..2911f6ef236 100644
--- a/profiler/msprof_analyze/cluster_analyse/README.md
+++ b/profiler/msprof_analyze/cluster_analyse/README.md
@@ -2,11 +2,11 @@
 cluster_analyse（集群分析工具）是在集群场景下，通过此工具来进行集群数据的分析，当前主要对基于通信域的迭代内耗时分析、通信时间分析以及通信矩阵分析为主， 从而定位慢卡、慢节点以及慢链路问题。
 
 ## 性能数据采集
-当前集群调优工具主要支持PyTorch场景的Ascend PyTorch Profiler采集方式和MindSpore场景的MindSpore Profiler采集方式下的集群数据。
+当前集群调优工具主要支持PyTorch场景的Ascend PyTorch Profiler采集方式和MindSpore场景的MindSpore Profiler采集方式以及msprof命令行工具采集方式下的集群数据。
 
 此工具只需要NPU的性能数据作为输入。
 
-Ascend PyTorch Profiler采集方法请参见《[NPU性能数据采集](https://gitee.com/ascend/mstt/tree/master/profiler/msprof_analyze)》，MindSpore Profiler采集方法请参见《[性能调试](https://www.mindspore.cn/mindinsight/docs/zh-CN/r2.3/performance_profiling_ascend.html)》。
+Ascend PyTorch Profiler采集方法请参见《[NPU性能数据采集](https://gitee.com/ascend/mstt/tree/master/profiler/msprof_analyze)》，MindSpore Profiler采集方法请参见《[性能调试](https://www.mindspore.cn/mindinsight/docs/zh-CN/r2.3/performance_profiling_ascend.html)》，msprof命令行采集方法请参见《[msprof命令行工具](https://www.hiascend.com/document/detail/zh/canncommercial/800/devaids/devtools/profiling/atlasprofiling_16_0010.html)》。
 
 我们要求至少是L1级别的数据。
 ```python
@@ -16,19 +16,26 @@ experimental_config = torch_npu.profiler._ExperimentalConfig(
 ```
 ### 确认数据是否可用
 
-打开采集到的某张卡数据(\*ascend_pt、\*ascend_ms结尾的文件夹)，可用的数据应该具备：
+通过上述三种方式获得性能数据，打开采集到的某张卡数据，可用的数据应该具备：
 
-- ./profiler_info_x.json,
-- ./ASCEND_PROFILER_OUTPUT/step_trace_time.csv,
-- ./ASCEND_PROFILER_OUTPUT/trace_view.json,
-- ./ASCEND_PROFILER_OUTPUT/kernel_details.csv, 
-- ./ASCEND_PROFILER_OUTPUT/communication.json,
-- ./ASCEND_PROFILER_OUTPUT/communication_matrix.json
+- Ascend PyTorch Profiler采集的\*ascend_pt目录或MindSpore Profiler采集的\*ascend_ms目录：
 
-或者具备：
+  - ./profiler_info_x.json,
+  - ./ASCEND_PROFILER_OUTPUT/step_trace_time.csv,
+  - ./ASCEND_PROFILER_OUTPUT/trace_view.json,
+  - ./ASCEND_PROFILER_OUTPUT/kernel_details.csv, 
+  - ./ASCEND_PROFILER_OUTPUT/communication.json,
+  - ./ASCEND_PROFILER_OUTPUT/communication_matrix.json
 
-- analysis.db
-- ascend_pytorch_profiler_{rank_id}.db
+  或者具备：
+
+  - analysis.db
+  - ascend_pytorch_profiler_{rank_id}.db
+
+- msprof命令行采集的PROF_XXX目录：
+
+  - --type=db、--export=on情况下解析的：msprof_{timestamp}.db
+  - --type=db、--analyze=on情况下解析的：analyze/communication_analyzer.db
 
 以上csv、json文件与db文件只能存在一类，否则集群分析工具解析异常。MindSpore场景暂不支持以上db文件。
 
-- 
Gitee


From bbdfa1b69c6baf24f0fbd542b376b1879ff3e03f Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Thu, 6 Mar 2025 17:25:27 +0800
Subject: [PATCH 090/145] visualization fuzzy match bugifx

---
 debug/accuracy_tools/msprobe/core/compare/utils.py | 7 +++----
 1 file changed, 3 insertions(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/utils.py b/debug/accuracy_tools/msprobe/core/compare/utils.py
index 8656daf7cae..e93ff775e78 100644
--- a/debug/accuracy_tools/msprobe/core/compare/utils.py
+++ b/debug/accuracy_tools/msprobe/core/compare/utils.py
@@ -354,7 +354,7 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
             result_item = stack_column_process(result_item, has_stack, index, key, npu_stack_info)
             if dump_mode == Const.ALL:
                 npu_data_name = safe_get_value(npu_data_name_list, n_start + index, "npu_data_name_list")
-                bench_data_name = safe_get_value(bench_data_name_list, n_start + index, "bench_data_name_list")
+                bench_data_name = safe_get_value(bench_data_name_list, b_start + index, "bench_data_name_list")
                 result_item.append([npu_data_name, bench_data_name])
 
             result.append(result_item)
@@ -373,7 +373,7 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
                         continue
                     result_item = [
                         n_name, CompareConst.NAN, n_struct[0], CompareConst.NAN, n_struct[1], CompareConst.NAN,
-                        " ", " ", " ", " ", " "
+                        " ", " ", " ", " ", " ", " "
                     ]
                     summary_data = n_dict.get(CompareConst.SUMMARY)[n_start + index]
                     result_item.extend(summary_data)
@@ -391,8 +391,7 @@ def get_accuracy(result, n_dict, b_dict, dump_mode):
                 result_item = stack_column_process(result_item, has_stack, index, key, npu_stack_info)
                 if dump_mode == Const.ALL:
                     npu_data_name = safe_get_value(npu_data_name_list, n_start + index, "npu_data_name_list")
-                    bench_data_name = safe_get_value(bench_data_name_list, n_start + index, "bench_data_name_list")
-                    result_item.append([npu_data_name, bench_data_name])
+                    result_item.append([npu_data_name, "-1"])
 
                 result.append(result_item)
 
-- 
Gitee


From d5a94f681035ec6e400693df236252fbab67276f Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Thu, 6 Mar 2025 16:34:31 +0800
Subject: [PATCH 091/145] adape_mindspore_db

---
 .../analysis/host_info_analysis.py            | 17 +++++++++--
 .../analysis/step_trace_time_analysis.py      | 11 ++++----
 .../cluster_analyse/cluster_analysis.py       |  8 ++++--
 .../mindspore_data_preprocessor.py            | 28 ++++++++++++++++++-
 .../msprof_data_preprocessor.py               |  2 +-
 .../recipes/base_recipe_analysis.py           | 13 +++++++--
 .../communication_matrix_sum.py               |  2 +-
 .../msprof_analyze/prof_common/constant.py    |  3 ++
 8 files changed, 69 insertions(+), 15 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/host_info_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/host_info_analysis.py
index a46b8250ea4..05cd3c9a2ab 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/host_info_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/host_info_analysis.py
@@ -22,6 +22,7 @@ from msprof_analyze.prof_common.path_manager import PathManager
 from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
 from msprof_analyze.cluster_analyse.cluster_data_preprocess.msprof_data_preprocessor import MsprofDataPreprocessor
+from msprof_analyze.cluster_analyse.cluster_data_preprocess.mindspore_data_preprocessor import MindsporeDataPreprocessor
 
 logger = get_logger()
 
@@ -35,6 +36,7 @@ class HostInfoAnalysis(BaseAnalysis):
         self.all_rank_host_info = {}
         self.all_rank_device_info = []
         self.is_msprof = param.get(Constant.IS_MSPROF)
+        self.is_mindspore = param.get(Constant.IS_MINDSPORE)
 
     def run(self, completed_processes=None, lock=None):
         if self.data_type != Constant.DB:
@@ -85,9 +87,7 @@ class HostInfoAnalysis(BaseAnalysis):
         for rank_id, profiling_dir in self.data_map.items():
             host_info = []
             rank_device_info = []
-            db_path = MsprofDataPreprocessor.get_msprof_profiler_db_path(
-                profiling_dir) if self.is_msprof else os.path.join(profiling_dir, Constant.SINGLE_OUTPUT,
-                                                                   f"ascend_pytorch_profiler_{rank_id}.db")
+            db_path = self._get_db_path(rank_id, profiling_dir)
             if (os.path.exists(db_path) and DBManager.check_tables_in_db(db_path, self.TABLE_HOST_INFO)):
                 conn, curs = DBManager.create_connect_db(db_path)
                 sql = "select * from {0}".format(self.TABLE_HOST_INFO)
@@ -105,6 +105,10 @@ class HostInfoAnalysis(BaseAnalysis):
             if self.is_msprof:
                 device_id = MsprofDataPreprocessor.get_device_id(profiling_dir)
                 rank_device_info = [[rank_id, device_id]]
+            if self.is_mindspore:
+                prof_dir = MindsporeDataPreprocessor.get_msprof_dir(profiling_dir)
+                device_id = MsprofDataPreprocessor.get_device_id(prof_dir)
+                rank_device_info = [[rank_id, device_id]]
             if not (rank_device_info and rank_device_info[0]):
                 if not print_empty_host_info:
                     print_empty_host_info = f"No {self.TABLE_RANK_DEVICE_MAP} data in {self.data_type} file."
@@ -116,3 +120,10 @@ class HostInfoAnalysis(BaseAnalysis):
             self.all_rank_device_info.extend(rank_device_info)
         if print_empty_host_info:
             logger.warning(print_empty_host_info)
+
+    def _get_db_path(self, rank_id, profiling_dir):
+        if self.is_msprof:
+            return MsprofDataPreprocessor.get_msprof_profiler_db_path(profiling_dir)
+        if self.is_mindspore:
+            return os.path.join(profiling_dir, Constant.SINGLE_OUTPUT, f"ascend_mindspore_profiler_{rank_id}.db")
+        return os.path.join(profiling_dir, Constant.SINGLE_OUTPUT, f"ascend_pytorch_profiler_{rank_id}.db")
diff --git a/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py b/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
index cddf95d63be..0ee79b0f2d0 100644
--- a/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/analysis/step_trace_time_analysis.py
@@ -45,6 +45,7 @@ class StepTraceTimeAnalysis:
         self.data_type = param.get(Constant.DATA_TYPE)
         self.distributed_args = None
         self.is_msprof = param.get(Constant.IS_MSPROF)
+        self.is_mindspore = param.get(Constant.IS_MINDSPORE)
 
     @staticmethod
     def get_max_data_row(data_group_list: list):
@@ -166,12 +167,12 @@ class StepTraceTimeAnalysis:
                     if os.path.exists(step_time_file):
                         self.step_time_dict[rank_id] = FileManager.read_csv_file(step_time_file, StepTraceTimeBean)
             else:
-                if self.is_msprof:
-                    profiler_db = MsprofDataPreprocessor.get_msprof_profiler_db_path(profiling_dir_path)
-                    analysis_db = os.path.join(profiling_dir_path, "analyze", "communication_analyzer.db")
+                if self.is_msprof or self.is_mindspore:
+                    profiler_db = MsprofDataPreprocessor.get_msprof_profiler_db_path(profiling_dir_path) if \
+                        self.is_msprof else os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT,
+                                                         f"ascend_mindspore_profiler_{rank_id}.db")
                     self.step_time_dict[rank_id] = MsprofStepTraceTimeDBAdapter(
-                        {Constant.ANALYSIS_DB_PATH: analysis_db,
-                         Constant.PROFILER_DB_PATH: profiler_db}).generate_step_trace_time_data()
+                        {Constant.PROFILER_DB_PATH: profiler_db}).generate_step_trace_time_data()
                 else:
                     step_time_file = os.path.join(profiling_dir_path, Constant.SINGLE_OUTPUT,
                                                   Constant.DB_COMMUNICATION_ANALYZER)
diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py b/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
index ab4172a258c..3f14f2894f5 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
@@ -84,14 +84,17 @@ class Interface:
         pytorch_processor = PytorchDataPreprocessor(ascend_pt_dirs)
         pt_data_map = pytorch_processor.get_data_map()
         pt_data_type = pytorch_processor.get_data_type()
-        ms_data_map = MindsporeDataPreprocessor(ascend_ms_dirs).get_data_map()
+        ms_processor = MindsporeDataPreprocessor(ascend_ms_dirs)
+        ms_data_map = ms_processor.get_data_map()
+        ms_data_type = ms_processor.get_data_type()
         if pt_data_map and ms_data_map:
             logger.error("Can not analyze pytorch and mindspore meantime.")
             return {}
         if pt_data_map:
             return {Constant.DATA_MAP: pt_data_map, Constant.DATA_TYPE: pt_data_type, Constant.IS_MSPROF: False}
         if ms_data_map:
-            return {Constant.DATA_MAP: ms_data_map, Constant.DATA_TYPE: Constant.TEXT, Constant.IS_MSPROF: False}
+            return {Constant.DATA_MAP: ms_data_map, Constant.DATA_TYPE: ms_data_type, Constant.IS_MSPROF: False,
+                    Constant.IS_MINDSPORE: True}
         msprof_processor = MsprofDataPreprocessor(prof_dirs)
         prof_data_map = msprof_processor.get_data_map()
         prof_data_type = msprof_processor.get_data_type()
@@ -118,6 +121,7 @@ class Interface:
             Constant.DATA_MAP: data_map,
             Constant.DATA_TYPE: data_type,
             Constant.IS_MSPROF: data_dict.get(Constant.IS_MSPROF, False),
+            Constant.IS_MINDSPORE: data_dict.get(Constant.IS_MINDSPORE, False),
             Constant.CLUSTER_ANALYSIS_OUTPUT_PATH: self.cluster_analysis_output_path
         })
         if self.analysis_mode in COMM_FEATURE_LIST:
diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/mindspore_data_preprocessor.py b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/mindspore_data_preprocessor.py
index eaa14fb71f9..c22ecb1ad90 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/mindspore_data_preprocessor.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/mindspore_data_preprocessor.py
@@ -12,11 +12,14 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+import os
+import re
 from collections import defaultdict
 
 from msprof_analyze.cluster_analyse.cluster_data_preprocess.data_preprocessor import DataPreprocessor
-
 from msprof_analyze.prof_common.logger import get_logger
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.prof_common.file_manager import FileManager
 
 logger = get_logger()
 
@@ -25,6 +28,15 @@ class MindsporeDataPreprocessor(DataPreprocessor):
 
     def __init__(self, path_list: list):
         super().__init__(path_list)
+        self.data_type = set()
+
+    @classmethod
+    def get_msprof_dir(cls, profiling_path):
+        prof_pattren = r"^PROF_\d+_\d+_[0-9a-zA-Z]+"
+        for file_name in os.listdir(profiling_path):
+            if re.match(prof_pattren, file_name):
+                return os.path.join(profiling_path, file_name)
+        return ""
 
     def get_data_map(self) -> dict:
         rank_id_map = defaultdict(list)
@@ -33,6 +45,15 @@ class MindsporeDataPreprocessor(DataPreprocessor):
             if rank_id < 0:
                 logger.error("fail to get rankid or rankid invalid.")
                 continue
+            for file_name in os.listdir(dir_name):
+                if file_name.startswith(self.PROFILER_INFO_HEAD) and file_name.endswith(self.PROFILER_INFO_EXTENSION):
+                    file_path = os.path.join(dir_name, file_name)
+                    config = FileManager.read_json_file(file_path)
+                    export_type = (config.get(Constant.PROFILER_PARAMETER, {}).get(Constant.EXPORT_TYPE, Constant.TEXT))
+                    if isinstance(export_type, list):
+                        self.data_type.add(Constant.DB if Constant.DB in export_type else Constant.TEXT)
+                    else:
+                        self.data_type.add(export_type)
             rank_id_map[rank_id].append(dir_name)
 
         try:
@@ -42,3 +63,8 @@ class MindsporeDataPreprocessor(DataPreprocessor):
         except Exception as e:
             raise RuntimeError("Found invalid directory name!") from e
         return self.data_map
+
+    def get_data_type(self):
+        if len(self.data_type) == 1:
+            return self.data_type.pop()
+        return Constant.INVALID
diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
index 1491468fde4..f751de56fe3 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_data_preprocess/msprof_data_preprocessor.py
@@ -25,7 +25,7 @@ logger = get_logger()
 
 
 class MsprofDataPreprocessor(DataPreprocessor):
-    DEVICE_PATTERN = "device_\d{1,2}$"
+    DEVICE_PATTERN = r"device_\d{1,2}$"
     INFO_JSON_PATTERN = r"^info\.json\.\d{1,2}$"
     DB_PATTERN = r"^msprof_\d{1,20}\.db$"
 
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
index 0d3fea0f401..701666578bf 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
@@ -44,6 +44,7 @@ class BaseRecipeAnalysis(ABC):
         self._parallel_mode = params.get(Constant.PARALLEL_MODE, "")
         self._export_type = params.get(Constant.EXPORT_TYPE, "")
         self._is_msprof = params.get(Constant.IS_MSPROF)
+        self._is_mindspore = params.get(Constant.IS_MINDSPORE)
         self._cluster_analysis_output_path = os.path.join(
             params.get(Constant.CLUSTER_ANALYSIS_OUTPUT_PATH, self._collection_dir), Constant.CLUSTER_ANALYSIS_OUTPUT)
         self._output_path = self._cluster_analysis_output_path if self._export_type == "db" else os.path.join(
@@ -163,8 +164,7 @@ class BaseRecipeAnalysis(ABC):
             db_path_dict = {Constant.RANK_ID: rank_id, Constant.PROFILER_DB_PATH: "", Constant.ANALYSIS_DB_PATH: "",
                             Constant.STEP_RANGE: {}}
             profiler_db_path = self._get_profiler_db_path(rank_id, rank_path)
-            analysis_db_path = os.path.join(rank_path, "analyze", "communication_analyzer.db") if self._is_msprof \
-                else os.path.join(rank_path, Constant.SINGLE_OUTPUT, f"analysis.db")
+            analysis_db_path = self._get_analysis_db_path(rank_path)
             if os.path.exists(profiler_db_path):
                 db_path_dict[Constant.PROFILER_DB_PATH] = profiler_db_path
                 db_path_dict[Constant.STEP_RANGE] = self._get_step_range(profiler_db_path)
@@ -185,8 +185,17 @@ class BaseRecipeAnalysis(ABC):
         if self._is_msprof:
             db_path = MsprofDataPreprocessor.get_msprof_profiler_db_path(data_path)
             return db_path if db_path else os.path.join(data_path, "msprof_xx.db")
+        if self._is_mindspore:
+            return os.path.join(data_path, Constant.SINGLE_OUTPUT, f"ascend_mindspore_profiler_{rank_id}.db")
         return os.path.join(data_path, Constant.SINGLE_OUTPUT, f"ascend_pytorch_profiler_{rank_id}.db")
 
+    def _get_analysis_db_path(self, data_path):
+        if self._is_msprof:
+            return os.path.join(data_path, Constant.ANALYZE_DIR, "communication_analyzer.db")
+        if self._is_mindspore:
+            return os.path.join(data_path, Constant.SINGLE_OUTPUT, "communication_analyzer.db")
+        return os.path.join(data_path, Constant.SINGLE_OUTPUT, "analysis.db")
+
     def _get_step_range(self, db_path):
         step_range = {}
         if self._step_id == Constant.VOID_STEP:
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
index b77f0781eee..13f462c7229 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
@@ -195,7 +195,7 @@ class CommMatrixSum(BaseRecipeAnalysis):
         data_service = DatabaseService(analysis_db_path, {})
         data_service.add_table_for_query("CommAnalyzerMatrix")
         matrix_data = data_service.query_data().get("CommAnalyzerMatrix")
-        if self._is_msprof:
+        if self._is_msprof or self._is_mindspore:
             matrix_data = self._trans_msprof_matrix_data(matrix_data)
         result_data[self.MATRIX_DATA] = matrix_data
         return result_data
diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index 31febbd7f42..7788194172b 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -43,6 +43,7 @@ class Constant(object):
     FRAMEWORK_DIR = "FRAMEWORK"
     CLUSTER_ANALYSIS_OUTPUT = "cluster_analysis_output"
     SINGLE_OUTPUT = "ASCEND_PROFILER_OUTPUT"
+    ANALYZE_DIR = "analyze"
     COMM_JSON = "communication.json"
     COMM_MATRIX_JSON = "communication_matrix.json"
     STEP_TIME_CSV = "step_trace_time.csv"
@@ -100,6 +101,7 @@ class Constant(object):
     COMM_DATA_DICT = "comm_data_dict"
     DATA_TYPE = "data_type"
     IS_MSPROF = "is_prof"
+    IS_MINDSPORE = "is_mindspore"
 
     # step time
     RANK = "rank"
@@ -135,6 +137,7 @@ class Constant(object):
     CONFIG = "config"
     EXPER_CONFIG = "experimental_config"
     EXPER_EXPORT_TYPE = "_export_type"
+    PROFILER_PARAMETER = "profiler_parameters"
 
     # metadata key
     DISTRIBUTED_ARGS = "distributed_args"
-- 
Gitee


From 25cc9f71cc4ae3dc72f4f83099053c6288ca9ea7 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Thu, 6 Mar 2025 19:08:51 +0800
Subject: [PATCH 092/145] visualization fuzzy match bugfix

---
 .../msprobe/test/core_ut/compare/test_acc_compare.py      | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
index 1b2f6bb2fde..94244be326e 100644
--- a/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
+++ b/debug/accuracy_tools/msprobe/test/core_ut/compare/test_acc_compare.py
@@ -159,16 +159,16 @@ aten_result = [
      -10.640625, -0.008758544921875, 5.397906303405762, -5.796811580657959, 2.5283952709287405e-10, 'Warning',
      'Need double check api accuracy.', 'None'],
     ['Aten__native_batch_norm_legit_functional.default_0_forward.output.1', 'Nan', 'torch.float32', 'Nan', [256], 'Nan',
-     ' ', ' ', ' ', ' ', ' ', 0.30550330877304077, -0.24485322833061218, -0.010361209511756897, 'Nan', 'Nan', 'Nan',
+     ' ', ' ', ' ', ' ', ' ', ' ', 0.30550330877304077, -0.24485322833061218, -0.010361209511756897, 'Nan', 'Nan', 'Nan',
      'Yes', '', 'None'],
     ['Aten__native_batch_norm_legit_functional.default_0_forward.output.2', 'Nan', 'torch.float32', 'Nan', [256], 'Nan',
-     ' ', ' ', ' ', ' ', ' ', 623.9192504882812, 432.96826171875, 520.2276611328125, 'Nan', 'Nan', 'Nan',
+     ' ', ' ', ' ', ' ', ' ', ' ', 623.9192504882812, 432.96826171875, 520.2276611328125, 'Nan', 'Nan', 'Nan',
      'Yes', '', 'None'],
     ['Aten__native_batch_norm_legit_functional.default_0_forward.output.3', 'Nan', 'torch.float32', 'Nan', [256], 'Nan',
-     ' ', ' ', ' ', ' ', ' ', 2.4797861576080322, -3.055997371673584, -0.04795549064874649, 'Nan', 'Nan', 'Nan',
+     ' ', ' ', ' ', ' ', ' ', ' ', 2.4797861576080322, -3.055997371673584, -0.04795549064874649, 'Nan', 'Nan', 'Nan',
      'Yes', '', 'None'],
     ['Aten__native_batch_norm_legit_functional.default_0_forward.output.4', 'Nan', 'torch.float32', 'Nan', [256], 'Nan',
-     ' ', ' ', ' ', ' ', ' ', 61.7945556640625, 42.59713363647461, 52.03831481933594, 'Nan', 'Nan', 'Nan',
+     ' ', ' ', ' ', ' ', ' ', ' ', 61.7945556640625, 42.59713363647461, 52.03831481933594, 'Nan', 'Nan', 'Nan',
      'Yes', '', 'None']]
 
 highlight_dict = {'red_rows': [], 'yellow_rows': []}
-- 
Gitee


From 255906590f39fbd976662b9ae096278f73927406 Mon Sep 17 00:00:00 2001
From: eveyin <qianyin2022@hotmail.com>
Date: Fri, 7 Mar 2025 16:33:48 +0800
Subject: [PATCH 093/145] ut

---
 .../test/ut/test_analysis_flight.py           | 164 ++++++++++++++++++
 flight_recorder/test/ut/test_check_path.py    | 133 ++++++++++++++
 2 files changed, 297 insertions(+)
 create mode 100644 flight_recorder/test/ut/test_analysis_flight.py
 create mode 100644 flight_recorder/test/ut/test_check_path.py

diff --git a/flight_recorder/test/ut/test_analysis_flight.py b/flight_recorder/test/ut/test_analysis_flight.py
new file mode 100644
index 00000000000..6759f9a6c2d
--- /dev/null
+++ b/flight_recorder/test/ut/test_analysis_flight.py
@@ -0,0 +1,164 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+import shutil
+from unittest.mock import patch
+
+import pytest
+import pickle
+
+from flight_recorder.flight_recorder_analyze.analysis_flight import (
+    load_recorder_data,
+    extract_hccl_info,
+    analyze_pg_groups,
+    main,
+    SafeUnpickler,
+)
+
+
+WORLD_SIZE = 2
+TEST_FLIGHT_RECORDER_PATH = "./test_fight_recorder_file"
+
+
+class UmaskWrapper:
+    """Write with preset umask
+    >>> with UmaskWrapper():
+    >>>     ...
+    """
+
+    def __init__(self, umask=0o027):
+        self.umask, self.ori_umask = umask, None
+
+    def __enter__(self):
+        self.ori_umask = os.umask(self.umask)
+
+    def __exit__(self, exc_type=None, exc_val=None, exc_tb=None):
+        os.umask(self.ori_umask)
+
+
+TEST_RECORDER_DATA = {
+    "entries": [
+        {
+            "state": "scheduled",
+            "record_id": 1,
+            "pg_id": "pg1",
+            "time_discovered_completed_ns": 1000,
+            "frames": [{"name": "op1"}],
+        },
+        {
+            "state": "completed",
+            "record_id": 2,
+            "pg_id": "pg1",
+            "time_discovered_completed_ns": 2000,
+            "frames": [{"name": "op2"}],
+        },
+    ]
+}
+
+
+@pytest.fixture
+def temp_dir():
+    """创建一个临时目录，并在其中生成模拟的 recorder 数据文件。"""
+    with UmaskWrapper():
+        os.mkdir(TEST_FLIGHT_RECORDER_PATH)
+    for rank in range(WORLD_SIZE):
+        file_path = os.path.join(TEST_FLIGHT_RECORDER_PATH, str(rank))
+        with UmaskWrapper():
+            with open(file_path, "wb") as f:
+                pickle.dump(TEST_RECORDER_DATA, f)
+    yield TEST_FLIGHT_RECORDER_PATH
+
+    if os.path.exists(TEST_FLIGHT_RECORDER_PATH):
+        shutil.rmtree(TEST_FLIGHT_RECORDER_PATH)
+
+
+def test_main(temp_dir):
+    with patch("sys.argv", ["analysis_flight.py", TEST_FLIGHT_RECORDER_PATH, "2"]):
+        main()
+
+
+def test_load_recorder_data(temp_dir):
+    """测试 load_recorder_data 函数是否正确加载 recorder 数据。"""
+    recorder_dict = load_recorder_data(TEST_FLIGHT_RECORDER_PATH, WORLD_SIZE)
+    assert len(recorder_dict) == WORLD_SIZE
+
+
+def test_extract_hccl_info():
+    """测试 extract_hccl_info 函数是否正确提取 HCCL 信息。"""
+    recorder_dict = {str(rank): TEST_RECORDER_DATA for rank in range(WORLD_SIZE)}
+    hccl_dict = extract_hccl_info(recorder_dict)
+    assert len(hccl_dict) == WORLD_SIZE
+    for rank, info in hccl_dict.items():
+        assert info["state"] == "completed"
+        assert info["record_id"] == 2
+        assert info["pg_id"] == "pg1"
+        assert info["time_discovered_completed_ns"] == 2000
+        assert info["name"] == "op2"
+
+
+def test_analyze_pg_groups():
+    hccl_dict_list = [
+        {
+            "0": {
+                "state": "scheduled",
+                "record_id": 1,
+                "pg_id": "pg1",
+                "time_discovered_completed_ns": 1000,
+                "name": "op1",
+            },
+            "1": {
+                "state": "scheduled",
+                "record_id": 1,
+                "pg_id": "pg1",
+                "time_discovered_completed_ns": 1000,
+                "name": "op1",
+            },
+        },
+        {
+            "0": {
+                "state": "completed",
+                "record_id": 1,
+                "pg_id": "pg1",
+                "time_discovered_completed_ns": 2000,
+                "name": "op2",
+            },
+            "1": {
+                "state": "completed",
+                "record_id": 1,
+                "pg_id": "pg1",
+                "time_discovered_completed_ns": 2000,
+                "name": "op2",
+            },
+        },
+        {
+            "0": {
+                "state": "scheduled",
+                "record_id": 1,
+                "pg_id": "pg1",
+                "time_discovered_completed_ns": 2000,
+                "name": "op2",
+            },
+            "1": {
+                "state": "completed",
+                "record_id": 1,
+                "pg_id": "pg1",
+                "time_discovered_completed_ns": 2000,
+                "name": "op2",
+            },
+        },
+    ]
+    for data in hccl_dict_list:
+        analyze_pg_groups(data)
diff --git a/flight_recorder/test/ut/test_check_path.py b/flight_recorder/test/ut/test_check_path.py
new file mode 100644
index 00000000000..e21909cc68f
--- /dev/null
+++ b/flight_recorder/test/ut/test_check_path.py
@@ -0,0 +1,133 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+import stat
+import json
+
+import yaml
+import pytest
+
+from flight_recorder.flight_recorder_analyze.check_path import (
+    get_valid_path,
+    get_valid_read_path,
+    check_type,
+    type_to_str,
+)
+
+TEST_DIR = "/tmp/a_test_path_for_testing_check_path_common/"
+TEST_READ_FILE_NAME = TEST_DIR + "testfile.testfile"
+USER_NOT_PERMITTED_READ_FILE = TEST_DIR + "testfile_not_readable.testfile"
+OTHERS_READABLE_READ_FILE = TEST_DIR + "testfile_others_readable.testfile"
+OTHERS_WRITABLE_READ_FILE = TEST_DIR + "testfile_others_writable.testfile"
+USER_NOT_PERMITTED_WRITE_FILE = TEST_DIR + "testfile_not_writable/foo"
+JSON_FILE = TEST_DIR + "testfile.json"
+YAML_FILE = TEST_DIR + "testfile.yaml"
+TEST_FILE = TEST_DIR + "testfile.test"
+ORI_DATA = {"a_long_key_name": 1, 12: "b", 3.14: "", "c": {"d": 3, "e": 4}, True: "true", False: "false", None: "null"}
+OVER_WRITE_DATA = {"hello": "world"}
+
+
+def setup_module():
+    os.makedirs(TEST_DIR, mode=int("700", 8), exist_ok=True)
+
+    default_mode = stat.S_IWUSR | stat.S_IRUSR  # 600
+    with os.fdopen(
+        os.open(TEST_READ_FILE_NAME, os.O_WRONLY | os.O_CREAT | os.O_TRUNC, mode=default_mode), "w"
+    ) as temp_file:
+        temp_file.write("a_test_file_name_for_testing_automl_common")
+
+    with os.fdopen(os.open(USER_NOT_PERMITTED_READ_FILE, os.O_CREAT, mode=000), "w"):
+        pass
+
+    with os.fdopen(os.open(OTHERS_READABLE_READ_FILE, os.O_CREAT, mode=default_mode), "w"):
+        pass
+    os.chmod(OTHERS_READABLE_READ_FILE, int("755", 8))
+
+    with os.fdopen(os.open(OTHERS_WRITABLE_READ_FILE, os.O_CREAT, mode=default_mode), "w"):
+        pass
+    os.chmod(OTHERS_WRITABLE_READ_FILE, int("666", 8))
+
+    dir_name = os.path.dirname(USER_NOT_PERMITTED_WRITE_FILE)
+    os.makedirs(dir_name, mode=int("500", 8), exist_ok=True)
+
+    with os.fdopen(os.open(JSON_FILE, os.O_WRONLY | os.O_CREAT | os.O_TRUNC, mode=default_mode), "w") as json_file:
+        json.dump(ORI_DATA, json_file)
+
+    with os.fdopen(os.open(YAML_FILE, os.O_WRONLY | os.O_CREAT | os.O_TRUNC, mode=default_mode), "w") as yaml_file:
+        yaml.dump(ORI_DATA, yaml_file)
+
+
+def teardown_module():
+    os.remove(TEST_READ_FILE_NAME)
+    os.chmod(USER_NOT_PERMITTED_READ_FILE, int("600", 8))
+    os.remove(USER_NOT_PERMITTED_READ_FILE)
+    os.remove(OTHERS_READABLE_READ_FILE)
+    os.remove(OTHERS_WRITABLE_READ_FILE)
+
+    dir_name = os.path.dirname(USER_NOT_PERMITTED_WRITE_FILE)
+    os.chmod(dir_name, int("700", 8))
+    os.removedirs(dir_name)
+
+    os.remove(JSON_FILE)
+    os.remove(YAML_FILE)
+    if os.path.exists(TEST_FILE):
+        os.remove(TEST_FILE)
+
+    os.removedirs(TEST_DIR)
+
+
+def test_check_type_given_valid_when_any_then_pass():
+    check_type(12, value_type=int)
+
+
+def test_check_type_given_int_when_str_then_error():
+    with pytest.raises(TypeError):
+        # TypeError: test must be str, not int.
+        check_type(12, value_type=str, param_name="test")
+
+
+def test_get_valid_path_given_valid_when_any_then_pass():
+    get_valid_path("../anypath")
+    get_valid_path("../anypath/a")
+
+
+def test_get_valid_path_given_invalid_when_any_then_value_error():
+    with pytest.raises(ValueError):
+        get_valid_path("../anypath*a")  # ValueError: ../anypath*a contains invalid characters.
+    with pytest.raises(ValueError):
+        get_valid_path("../anypath/\\a")  # ValueError: ../anypath/\a contains invalid characters.
+    with pytest.raises(ValueError):
+        get_valid_path("../anypath/!a")  # ValueError: ../anypath/!a contains invalid characters.
+
+
+def test_get_valid_read_path_given_valid_when_any_then_pass():
+    get_valid_read_path(TEST_READ_FILE_NAME)
+    get_valid_read_path(OTHERS_READABLE_READ_FILE)
+    get_valid_read_path(OTHERS_WRITABLE_READ_FILE, check_user_stat=False)
+
+
+def test_get_valid_read_path_given_invalid_when_any_then_value_error():
+    with pytest.raises(ValueError):
+        get_valid_read_path("./not_exist")  # ValueError: The file ... doesn't exist or not a file.
+    with pytest.raises(ValueError):
+        # ValueError: The file ... exceeds size limitation of 1.
+        get_valid_read_path(TEST_READ_FILE_NAME, size_max=1)
+    with pytest.raises(ValueError):
+        # ValueError: Current user doesn't have read permission to the file ....
+        get_valid_read_path(USER_NOT_PERMITTED_READ_FILE)
+    with pytest.raises(ValueError):
+        # ValueError: The file ... has others writable permission.
+        get_valid_read_path(OTHERS_WRITABLE_READ_FILE)
-- 
Gitee


From d36aa84b25398d8fc76505e50f8f66e7bc4c3be6 Mon Sep 17 00:00:00 2001
From: eveyin <qianyin2022@hotmail.com>
Date: Fri, 7 Mar 2025 16:49:38 +0800
Subject: [PATCH 094/145] ut

---
 flight_recorder/test/ut/test_analysis_flight.py | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/flight_recorder/test/ut/test_analysis_flight.py b/flight_recorder/test/ut/test_analysis_flight.py
index 6759f9a6c2d..5ab82f50158 100644
--- a/flight_recorder/test/ut/test_analysis_flight.py
+++ b/flight_recorder/test/ut/test_analysis_flight.py
@@ -15,10 +15,11 @@
 
 import os
 import shutil
+import pickle
+
 from unittest.mock import patch
 
 import pytest
-import pickle
 
 from flight_recorder.flight_recorder_analyze.analysis_flight import (
     load_recorder_data,
@@ -101,7 +102,7 @@ def test_extract_hccl_info():
     recorder_dict = {str(rank): TEST_RECORDER_DATA for rank in range(WORLD_SIZE)}
     hccl_dict = extract_hccl_info(recorder_dict)
     assert len(hccl_dict) == WORLD_SIZE
-    for rank, info in hccl_dict.items():
+    for _, info in hccl_dict.items():
         assert info["state"] == "completed"
         assert info["record_id"] == 2
         assert info["pg_id"] == "pg1"
-- 
Gitee


From 695114421cb078e158735ad9df00b8d86594a0c9 Mon Sep 17 00:00:00 2001
From: jiangchao_j <chaojiang_j@163.com>
Date: Sat, 22 Feb 2025 14:53:38 +0800
Subject: [PATCH 095/145] support batch_isend_irecv api

---
 .../msprobe/core/common/const.py              |  22 +--
 .../msprobe/core/data_dump/api_registry.py    |  14 +-
 .../mindspore/debugger/precision_debugger.py  |  29 +++-
 .../mindspore/dump/hook_cell/api_register.py  |  32 +++--
 .../mindspore/dump/hook_cell/hook_cell.py     |   7 +-
 .../run_ut/run_ut_utils.py                    |  31 +++--
 .../msprobe/pytorch/common/utils.py           |   4 +-
 .../pytorch/hook_module/api_register.py       |  34 ++---
 .../pytorch/hook_module/hook_module.py        |   7 +-
 .../msprobe/pytorch/hook_module/wrap_aten.py  | 111 +++++++++++++++
 .../core_ut/data_dump/test_api_registry.py    |  73 ++++++++++
 .../test_ms_api_pynative_self_check.py        |  28 ++--
 .../test/mindspore_ut/test_ms_service.py      |  11 +-
 .../run_ut/test_run_ut_utils.py               |  20 ++-
 .../test/pytorch_ut/common/test_pt_utils.py   |  19 ++-
 .../test/pytorch_ut/dump/test_module_dump.py  |  12 +-
 .../hook_module/test_api_registry.py          | 130 ------------------
 .../hook_module/test_wrap_distributed.py      |  41 ------
 .../hook_module/test_wrap_functional.py       |  73 ----------
 .../hook_module/test_wrap_npu_custom.py       |  43 ------
 .../hook_module/test_wrap_tensor.py           |  40 ------
 .../pytorch_ut/hook_module/test_wrap_torch.py |  48 -------
 .../pytorch_ut/hook_module/test_wrap_vf.py    |  11 --
 .../test/pytorch_ut/monitor/demo_model.py     |  18 +++
 .../test/pytorch_ut/monitor/test_csv2tb.py    |  18 +++
 .../pytorch_ut/monitor/test_module_hook.py    |  20 ++-
 .../msprobe/test/pytorch_ut/test_service.py   |  20 ++-
 27 files changed, 417 insertions(+), 499 deletions(-)
 create mode 100644 debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_aten.py
 create mode 100644 debug/accuracy_tools/msprobe/test/core_ut/data_dump/test_api_registry.py
 delete mode 100644 debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_api_registry.py
 delete mode 100644 debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_distributed.py
 delete mode 100644 debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_functional.py
 delete mode 100644 debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_npu_custom.py
 delete mode 100644 debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_tensor.py
 delete mode 100644 debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_torch.py
 delete mode 100644 debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_vf.py

diff --git a/debug/accuracy_tools/msprobe/core/common/const.py b/debug/accuracy_tools/msprobe/core/common/const.py
index fffab5e8d28..7df4bcf30f8 100644
--- a/debug/accuracy_tools/msprobe/core/common/const.py
+++ b/debug/accuracy_tools/msprobe/core/common/const.py
@@ -235,13 +235,11 @@ class Const:
     PT_API_TYPE_FUNCTIONAL = "functional"
     PT_API_TYPE_TENSOR = "tensor"
     PT_API_TYPE_TORCH = "torch"
-    PT_API_TYPE__VF = "_VF"
+    PT_API_TYPE_VF = "_VF"
     PT_API_TYPE_NPU = "torch_npu"
     PT_API_TYPE_ATEN = "aten"
     PT_API_TYPE_DIST = "distributed"
-    PT_API_TYPE_DIST_C10D = "distributed_c10d"
     PT_API_TYPE_NPU_DIST = "npu_distributed"
-    PT_API_TYPE_NPU_DIST_C10D = "npu_distributed_c10d"
 
     MS_API_TYPE_OPS = "ops"
     MS_API_TYPE_TENSOR = "tensor"
@@ -267,13 +265,11 @@ class Const:
             PT_API_TYPE_FUNCTIONAL: PT_API_TYPE_FUNCTIONAL,
             PT_API_TYPE_TENSOR: PT_API_TYPE_TENSOR,
             PT_API_TYPE_TORCH: PT_API_TYPE_TORCH,
-            PT_API_TYPE__VF: PT_API_TYPE__VF,
+            PT_API_TYPE_VF: PT_API_TYPE_VF,
             PT_API_TYPE_NPU: PT_API_TYPE_NPU,
             PT_API_TYPE_ATEN: PT_API_TYPE_ATEN,
             PT_API_TYPE_DIST: PT_API_TYPE_DIST,
-            PT_API_TYPE_DIST_C10D: PT_API_TYPE_DIST,
-            PT_API_TYPE_NPU_DIST: PT_API_TYPE_NPU_DIST,
-            PT_API_TYPE_NPU_DIST_C10D: PT_API_TYPE_NPU_DIST
+            PT_API_TYPE_NPU_DIST: PT_API_TYPE_NPU_DIST
         },
         MS_FRAMEWORK: {
             MS_API_TYPE_OPS: MS_API_TYPE_OPS,
@@ -288,8 +284,7 @@ class Const:
             PT_API_TYPE_TENSOR: PT_API_TYPE_TENSOR,
             PT_API_TYPE_TORCH: PT_API_TYPE_TORCH,
             PT_API_TYPE_NPU: PT_API_TYPE_NPU,
-            PT_API_TYPE_DIST: PT_API_TYPE_DIST,
-            PT_API_TYPE_DIST_C10D: PT_API_TYPE_DIST
+            PT_API_TYPE_DIST: PT_API_TYPE_DIST
         }
     }
 
@@ -298,13 +293,11 @@ class Const:
             PT_API_TYPE_FUNCTIONAL: FUNCTIONAL_API_TYPE_PREFIX,
             PT_API_TYPE_TENSOR: TENSOR_API_TYPE_PREFIX,
             PT_API_TYPE_TORCH: TORCH_API_TYPE_PREFIX,
-            PT_API_TYPE__VF: VF_API_TYPE_PREFIX,
+            PT_API_TYPE_VF: VF_API_TYPE_PREFIX,
             PT_API_TYPE_NPU: NPU_API_TYPE_PREFIX,
             PT_API_TYPE_ATEN: ATEN_API_TYPE_PREFIX,
             PT_API_TYPE_DIST: DIST_API_TYPE_PREFIX,
-            PT_API_TYPE_DIST_C10D: DIST_API_TYPE_PREFIX,
-            PT_API_TYPE_NPU_DIST: DIST_API_TYPE_PREFIX,
-            PT_API_TYPE_NPU_DIST_C10D: DIST_API_TYPE_PREFIX
+            PT_API_TYPE_NPU_DIST: DIST_API_TYPE_PREFIX
         },
         MS_FRAMEWORK: {
             MS_API_TYPE_OPS: FUNCTIONAL_API_TYPE_PREFIX,
@@ -319,8 +312,7 @@ class Const:
             PT_API_TYPE_TENSOR: TENSOR_API_TYPE_PREFIX,
             PT_API_TYPE_TORCH: TORCH_API_TYPE_PREFIX,
             PT_API_TYPE_NPU: NPU_API_TYPE_PREFIX,
-            PT_API_TYPE_DIST: DIST_API_TYPE_PREFIX,
-            PT_API_TYPE_DIST_C10D: DIST_API_TYPE_PREFIX,
+            PT_API_TYPE_DIST: DIST_API_TYPE_PREFIX
         }
     }
 
diff --git a/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py b/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
index 62e63769690..27106044e1e 100644
--- a/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
+++ b/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
@@ -50,12 +50,11 @@ class ApiWrapper:
         api_types_num = sum([len(v) for v in self.api_types.values()])
         if not isinstance(api_templates, (list, tuple)):
             api_templates = [api_templates] * api_types_num
-        elif len(api_templates) != len(api_types_num):
+        elif len(api_templates) != api_types_num:
             raise RuntimeError("The number of api_templates must be equal to the number of api_types, "
                                "when api_templates is a list or tuple.")
 
         self.wrapped_api_functions.clear()
-        # {"pytorch": {"torch": torch}, "mindspore": {"tensor": ms.Tensor}}
         index = 0
         for framework, api_types in self.api_types.items():
             wrapped_functions_in_framework = dict()
@@ -90,7 +89,7 @@ class ApiWrapper:
                     target_attr = api_name
                     target_module = api_modules[0]
                     if Const.SEP in api_name:
-                        sub_module_name, target_attr = api_name.rsplit('.', 1)
+                        sub_module_name, target_attr = api_name.rsplit(Const.SEP, 1)
                         target_module = getattr(api_modules[0], sub_module_name)
                     if target_attr in dir(target_module):
                         names.add(api_name)
@@ -118,8 +117,7 @@ class ApiRegistry:
     @staticmethod
     def store_ori_attr(ori_api_group, api_list, api_ori_attr):
         for api in api_list:
-            ori_api_func = _get_attr(ori_api_group, api)
-            api_ori_attr[api] = ori_api_func
+            api_ori_attr[api] = _get_attr(ori_api_group, api)
 
     @staticmethod
     def set_api_attr(api_group, attr_dict):
@@ -136,7 +134,8 @@ class ApiRegistry:
         for framework, api_types in self.api_types.items():
             for api_type, api_modules in api_types.items():
                 api_type_with_framework = framework + Const.SEP + api_type
-                self.set_api_attr(api_modules[1], self.wrapped_api_attr.get(api_type_with_framework, {}))
+                for module in api_modules[1]:
+                    self.set_api_attr(module, self.wrapped_api_attr.get(api_type_with_framework, {}))
 
     def register_inner_used_api(self):
         for api_type in self.inner_used_api.keys():
@@ -146,7 +145,8 @@ class ApiRegistry:
         for framework, api_types in self.api_types.items():
             for api_type, api_modules in api_types.items():
                 api_type_with_framework = framework + Const.SEP + api_type
-                self.set_api_attr(api_modules[1], self.ori_api_attr.get(api_type_with_framework, {}))
+                for module in api_modules[1]:
+                    self.set_api_attr(module, self.ori_api_attr.get(api_type_with_framework, {}))
 
     def restore_inner_used_api(self):
         for api_type in self.inner_used_api.keys():
diff --git a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
index 6fb7c587b37..61b360824b4 100644
--- a/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
+++ b/debug/accuracy_tools/msprobe/mindspore/debugger/precision_debugger.py
@@ -25,7 +25,7 @@ from msprobe.core.common.file_utils import FileChecker
 from msprobe.core.common.utils import get_real_step_or_rank
 from msprobe.mindspore.cell_processor import CellProcessor
 from msprobe.mindspore.common.const import Const as MsConst
-from msprobe.mindspore.common.utils import set_register_backward_hook_functions
+from msprobe.mindspore.common.utils import set_register_backward_hook_functions, check_save_param
 from msprobe.mindspore.debugger.debugger_config import DebuggerConfig
 from msprobe.mindspore.dump.hook_cell.api_register import get_api_register
 from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
@@ -89,6 +89,7 @@ class PrecisionDebugger:
 
         self.config.execution_mode = self._get_execution_mode()
         if self._need_service():
+            self.config.check_config_with_l2()
             self.service = Service(self.config)
 
         Runtime.step_count = 0
@@ -139,11 +140,11 @@ class PrecisionDebugger:
     def _is_graph_dump(config):
         if config.level != MsConst.KERNEL:
             return False
-        if not config.list or len(config.list) > 1:
+        if not config.list:
             return True
-        if '-' in config.list[0] or '/' in config.list[0]:
-            return True
-        return False
+        is_graph = any(item.startswith("name-regex") for item in config.list)
+        is_graph |= all("." not in item for item in config.list)
+        return is_graph
 
     @classmethod
     def start(cls, model=None):
@@ -214,6 +215,24 @@ class PrecisionDebugger:
             return
         instance.gm.monitor(opt)
 
+    @classmethod
+    def save(cls, variable, name, save_backward=True):
+        instance = cls._instance
+        if not instance:
+            raise Exception(MsgConst.NOT_CREATED_INSTANCE)
+        if instance.task not in [Const.TENSOR, Const.STATISTICS] or instance.config.level_ori != Const.LEVEL_DEBUG:
+            return
+        try:
+            check_save_param(variable, name, save_backward)
+        except ValueError:
+            return
+
+        instance.config.execution_mode = cls._get_execution_mode()
+        if cls._need_service():
+            if not instance.service:
+                instance.service = Service(instance.config)
+            instance.service.save(variable, name, save_backward)
+
     @classmethod
     def _need_service(cls):
         instance = cls._instance
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
index 207ccacb595..6563ed70086 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
+++ b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
@@ -20,6 +20,7 @@ from mindspore.mint.nn import functional
 from mindspore.common._stub_tensor import StubTensor
 from mindspore.communication import comm_func
 
+from msprobe.core.common.file_utils import load_yaml
 from msprobe.core.common.utils import Const
 from msprobe.core.data_dump.api_registry import ApiRegistry
 from msprobe.mindspore.common.const import Const as MsConst
@@ -29,12 +30,12 @@ from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
 if not is_mindtorch():
     _api_types = {
         Const.MS_FRAMEWORK: {
-            Const.MS_API_TYPE_OPS: (ops, ops),
-            Const.MS_API_TYPE_TENSOR: (Tensor, Tensor),
-            Const.MS_API_TYPE_STUB_TENSOR: (StubTensor, StubTensor),
-            Const.MS_API_TYPE_MINT: (mint, mint),
-            Const.MS_API_TYPE_MINT_FUNC: (functional, functional),
-            Const.MS_API_TYPE_COM: (comm_func, comm_func)
+            Const.MS_API_TYPE_OPS: (ops, (ops,)),
+            Const.MS_API_TYPE_TENSOR: (Tensor, (Tensor,)),
+            Const.MS_API_TYPE_STUB_TENSOR: (StubTensor, (StubTensor,)),
+            Const.MS_API_TYPE_MINT: (mint, (mint,)),
+            Const.MS_API_TYPE_MINT_FUNC: (functional, (functional,)),
+            Const.MS_API_TYPE_COM: (comm_func, (comm_func,))
         }
     }
 else:
@@ -42,12 +43,11 @@ else:
     import torch_npu
     _api_types = {
         Const.MT_FRAMEWORK: {
-            Const.PT_API_TYPE_FUNCTIONAL: (torch.nn.functional, torch.nn.functional),
-            Const.PT_API_TYPE_TENSOR: (torch.Tensor, torch.Tensor),
-            Const.PT_API_TYPE_TORCH: (torch, torch),
-            Const.PT_API_TYPE_NPU: (torch_npu, torch_npu),
-            Const.PT_API_TYPE_DIST: (torch.distributed, torch.distributed),
-            Const.PT_API_TYPE_DIST_C10D: (torch.distributed.distributed_c10d, torch.distributed.distributed_c10d)
+            Const.PT_API_TYPE_FUNCTIONAL: (torch.nn.functional, (torch.nn.functional,)),
+            Const.PT_API_TYPE_TENSOR: (torch.Tensor, (torch.Tensor,)),
+            Const.PT_API_TYPE_TORCH: (torch, (torch,)),
+            Const.PT_API_TYPE_NPU: (torch_npu, (torch_npu,)),
+            Const.PT_API_TYPE_DIST: (torch.distributed, (torch.distributed, torch.distributed.distributed_c10d))
         }
     }
 
@@ -116,8 +116,10 @@ def get_api_register():
 
     if api_register is None:
         if not is_mindtorch():
-            for attr in dir(StubTensor):
-                if callable(attr):
-                    setattr(StubTensor, attr, stub_method(attr))
+            for attr_name in dir(StubTensor):
+                attr = getattr(StubTensor, attr_name)
+                api_names = load_yaml(_supported_api_list_path[0]).get(Const.MS_API_TYPE_TENSOR, [])
+                if attr_name in api_names and callable(attr):
+                    setattr(StubTensor, attr_name, stub_method(attr))
         api_register = ApiRegistry(_api_types, _inner_used_api, _supported_api_list_path, ApiTemplate)
     return api_register
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/hook_cell.py b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/hook_cell.py
index 3386feca3b7..7007992ca45 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/hook_cell.py
+++ b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/hook_cell.py
@@ -32,17 +32,14 @@ def __init__(self, hook_build_func) -> None:
     super(HOOKCell, self).__init__()
     self.changed_status = False
     self.input_kwargs = {}
-    self.prefix = ""
     if not HOOKCell.g_stop_hook:
         HOOKCell.g_stop_hook = True
         self.changed_status = True
-        if hasattr(self, "prefix_api_name"):
-            self.prefix = self.prefix_api_name
-
         self.forward_data_collected = False
 
+        prefix = self.prefix_api_name if hasattr(self, "prefix_api_name") else ""
         if callable(hook_build_func):
-            forward_pre_hook, forward_hook, backward_hook, backward_pre_hook = hook_build_func(self.prefix)
+            forward_pre_hook, forward_hook, backward_hook, backward_pre_hook = hook_build_func(prefix)
             self.register_forward_pre_hook(forward_pre_hook)
             self.register_forward_hook(forward_hook)
             register_backward_hook_functions["full"](self, backward_hook)
diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut_utils.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut_utils.py
index 259dbb82077..e62315a1a16 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut_utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut_utils.py
@@ -1,9 +1,7 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
 # All rights reserved.
 #
-# Licensed under the Apache License, Version 2.0  (the "License");
+# Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
 # You may obtain a copy of the License at
 #
@@ -18,8 +16,8 @@
 import os
 from collections import namedtuple
 import re
-import torch
 
+import torch
 try:
     import torch_npu
 except ImportError:
@@ -34,6 +32,7 @@ from msprobe.core.common.file_utils import FileChecker
 from msprobe.core.common.log import logger
 from msprobe.core.common.utils import CompareException
 from msprobe.pytorch.hook_module.api_register import ApiTemplate, get_api_register
+from msprobe.pytorch.hook_module.wrap_aten import AtenOPTemplate
 
 
 hf_32_standard_api = ["conv1d", "conv2d"]
@@ -105,6 +104,7 @@ def exec_api(exec_params):
     kwargs = exec_params.kwargs
     is_autocast = exec_params.is_autocast
     autocast_dtype = exec_params.autocast_dtype
+    out = None
 
     prefix_map = Const.API_DATA_PREFIX.get(Const.PT_FRAMEWORK, {})
     if not prefix_map or api_type not in prefix_map.values() or \
@@ -115,16 +115,19 @@ def exec_api(exec_params):
             Const.ATEN_API_TYPE_PREFIX,
             Const.NPU_API_TYPE_PREFIX
     ):
-        return
+        return out
 
-    api_register = get_api_register()
-    api_register.initialize_hook(None)
-    api_func_type = list(prefix_map.keys())[list(prefix_map.values()).index(api_type)]
-    api_func = api_register.ori_api_attr.get(Const.PT_FRAMEWORK + Const.SEP + api_func_type, {}).get(api_name)
-    if api_func is None:
-        return
-
-    torch_api = ApiTemplate(api_name, api_func, api_type, None, need_hook=False, device=device)
+    if api_type == Const.ATEN_API_TYPE_PREFIX:
+        torch_api = AtenOPTemplate(api_name, None, False)
+    else:
+        api_register = get_api_register()
+        api_register.initialize_hook(None)
+        api_func_type = list(prefix_map.keys())[list(prefix_map.values()).index(api_type)]
+        api_func = api_register.ori_api_attr.get(Const.PT_FRAMEWORK + Const.SEP + api_func_type, {}).get(api_name)
+        if api_func is None:
+            return out
+
+        torch_api = ApiTemplate(api_name, api_func, api_type, None, need_hook=False, device=device)
     if is_autocast:
         with autocast(dtype=autocast_dtype):
             out = torch_api.forward(*args, **kwargs)
diff --git a/debug/accuracy_tools/msprobe/pytorch/common/utils.py b/debug/accuracy_tools/msprobe/pytorch/common/utils.py
index 4bc7771ac78..1a6fe8c07af 100644
--- a/debug/accuracy_tools/msprobe/pytorch/common/utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/common/utils.py
@@ -57,7 +57,7 @@ def parameter_adapter(func):
 
     @wraps(func)
     def inner(self, *args, **kwargs):
-        if self.op_name_ == "__getitem__" and len(args) > 1 and isinstance(args[1], torch.Tensor):
+        if self.api_name == "__getitem__" and len(args) > 1 and isinstance(args[1], torch.Tensor):
             input_tensor = args[0]
             indices = args[1]
             if indices.dtype == torch.uint8:
@@ -77,7 +77,7 @@ def parameter_adapter(func):
                 else:
                     res = [input_tensor[tensor_index] for tensor_index in indices]
                     return getattr(torch._C._VariableFunctionsClass, "stack")(res, 0)
-        if self.op_name_ == "__eq__" and len(args) > 1 and args[1] is None:
+        if self.api_name == "__eq__" and len(args) > 1 and args[1] is None:
             return False
         return func(self, *args, **kwargs)
 
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
index c12f94248cf..4154646c0f4 100644
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
@@ -32,29 +32,29 @@ torch_version_above_2 = torch.__version__.split('+')[0] > '2.0'
 
 _api_types = {
     Const.PT_FRAMEWORK: {
-        Const.PT_API_TYPE_FUNCTIONAL: (torch.nn.functional, torch.nn.functional),
-        Const.PT_API_TYPE_TENSOR: (torch.Tensor, torch.Tensor),
-        Const.PT_API_TYPE_TORCH: (torch, torch),
-        Const.PT_API_TYPE__VF: (torch._C._VariableFunctionsClass, torch._VF),
-        Const.PT_API_TYPE_DIST: (dist, dist),
-        Const.PT_API_TYPE_DIST_C10D: (dist.distributed_c10d, dist.distributed_c10d)
+        Const.PT_API_TYPE_FUNCTIONAL: (torch.nn.functional, (torch.nn.functional,)),
+        Const.PT_API_TYPE_TENSOR: (torch.Tensor, (torch.Tensor,)),
+        Const.PT_API_TYPE_TORCH: (torch, (torch,)),
+        Const.PT_API_TYPE_VF: (torch._C._VariableFunctionsClass, (torch._VF,)),
+        Const.PT_API_TYPE_DIST: (dist, (dist, dist.distributed_c10d))
     }
 }
 if not is_gpu:
     import torch_npu
     if torch_without_guard_version:
         _api_types.get(Const.PT_FRAMEWORK).update(
-            {Const.PT_API_TYPE_NPU: (torch.ops.npu, torch_npu)}
+            {
+                Const.PT_API_TYPE_NPU: (torch.ops.npu, (torch_npu, torch.ops.npu))
+            }
         )
     else:
         _api_types.get(Const.PT_FRAMEWORK).update(
-            {Const.PT_API_TYPE_NPU: (torch_npu._C._VariableFunctionsClass, torch_npu)}
+            {Const.PT_API_TYPE_NPU: (torch_npu._C._VariableFunctionsClass, (torch_npu,))}
         )
         _api_types.get(Const.PT_FRAMEWORK).update(
             {
-                Const.PT_API_TYPE_NPU_DIST: (torch_npu.distributed, torch_npu.distributed),
-                Const.PT_API_TYPE_NPU_DIST_C10D: (torch_npu.distributed.distributed_c10d,
-                                                  torch_npu.distributed.distributed_c10d)
+                Const.PT_API_TYPE_NPU_DIST: (torch_npu.distributed, (torch_npu.distributed,
+                                                                     torch_npu.distributed.distributed_c10d))
             }
         )
 
@@ -73,10 +73,10 @@ def dist_module_forward(module, *args, **kwargs):
     if kwargs.get("async_op") or module.api_name in ["isend", "irecv"]:
         if handle and hasattr(handle, 'wait'):
             handle.wait()
-        if module.api_name == "batch_isend_irecv":
-            if isinstance(handle, list):
-                for req in handle:
-                    req.wait()
+    if module.api_name == "batch_isend_irecv":
+        if isinstance(handle, list):
+            for req in handle:
+                req.wait()
     return handle
 
 
@@ -88,7 +88,7 @@ def npu_module_forward(module, *args, **kwargs):
             module.api_name = _cuda_func_mapping.get(module.api_name, module.api_name)
         if module.device in [Const.CUDA_LOWERCASE, Const.CPU_LOWERCASE]:
             return npu_custom_functions[module.api_name](*args, **kwargs)
-        return module.api_func(*args, **kwargs)
+    return module.api_func(*args, **kwargs)
 
 
 forward_methods = {
@@ -108,6 +108,8 @@ class ApiTemplate(HOOKModule):
         self.device = device
         if self.need_hook:
             super().__init__(hook_build_func)
+        if prefix == Const.DIST_API_TYPE_PREFIX:
+            self.op_is_distributed = True
 
     @torch_device_guard
     def forward(self, *args, **kwargs):
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
index 355b25d24a6..71dbfa8aeb1 100644
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
@@ -31,20 +31,17 @@ class HOOKModule(nn.Module):
     def __init__(self, hook_build_func) -> None:
         super(HOOKModule, self).__init__()
         self.has_overflow = False
-        self.prefix = ""
         self.current_thread = threading.current_thread().ident
         if self.current_thread not in HOOKModule.inner_stop_hook:
             HOOKModule.inner_stop_hook[self.current_thread] = False
         self.stop_hook = HOOKModule.inner_stop_hook.get(self.current_thread, False)
 
         if not self.stop_hook:
-            if hasattr(self, "prefix_api_name"):
-                self.prefix = self.prefix_api_name
-
             self.forward_data_collected = False
 
+            prefix = self.prefix_api_name if hasattr(self, "prefix_api_name") else ""
             if callable(hook_build_func):
-                forward_pre_hook, forward_hook, backward_hook, _ = hook_build_func(self.prefix)
+                forward_pre_hook, forward_hook, backward_hook, _ = hook_build_func(prefix)
                 if torch_version_above_or_equal_2:
                     self.register_forward_pre_hook(forward_pre_hook, with_kwargs=True)
                     self.register_forward_hook(forward_hook, with_kwargs=True)
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_aten.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_aten.py
new file mode 100644
index 00000000000..637bae33ad7
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/wrap_aten.py
@@ -0,0 +1,111 @@
+# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+import torch
+
+from msprobe.pytorch.hook_module.hook_module import HOOKModule
+from msprobe.pytorch.common.utils import torch_device_guard
+from msprobe.core.common.const import Const
+from msprobe.core.common.file_utils import load_yaml
+from msprobe.pytorch.function_factory import npu_custom_grad_functions
+
+
+cur_path = os.path.dirname(os.path.realpath(__file__))
+yaml_path = os.path.join(cur_path, "support_wrap_ops.yaml")
+ops = load_yaml(yaml_path)
+wrap_aten_ops = ops.get('aten')
+white_aten_ops = ops.get('white_aten_ops', [])
+
+
+aten_func = {}
+for f in dir(torch.ops.aten):
+    aten_func[f] = getattr(torch.ops.aten, f)
+
+
+def get_aten_ops():
+    global wrap_aten_ops
+    _all_aten_ops = dir(torch.ops.aten)
+    return set(wrap_aten_ops) & set(_all_aten_ops)
+
+
+class HOOKAtenOP(object):
+    pass
+
+
+class AtenOPTemplate(HOOKModule):
+    def __init__(self, op, hook, need_hook=True):
+        if isinstance(op, torch._ops.OpOverloadPacket):
+            op_name_ = op._qualified_op_name.split("::")[-1]
+        elif isinstance(op, str):
+            op_name_ = str(op)
+        else:
+            op_name_ = op.name().split("::")[-1]
+            overload_name = op._overloadname
+            if not '.' + overload_name in op_name_:
+                op_name_ = op_name_ + '.' + overload_name
+        self.op = op
+        self.prefix_op_name_ = "Aten" + Const.SEP + str(op_name_) + Const.SEP
+        self.need_hook = need_hook
+        if self.need_hook:
+            super().__init__(hook)
+
+    @torch_device_guard
+    def forward(self, *args, **kwargs):
+        if isinstance(self.op, str):
+            if self.op in npu_custom_grad_functions:
+                return npu_custom_grad_functions[self.op](*args, **kwargs)
+            if self.op in white_aten_ops:
+                return eval(f"torch.ops.aten.{self.op}")(*args, **kwargs)
+            if self.op not in aten_func:
+                raise Exception(f"Skip op[{self.op}] accuracy check, because the op is not "
+                                f"in dir(torch.ops.aten) and support yaml.")
+            return aten_func[self.op](*args, **kwargs)
+        return self.op(*args, **kwargs)
+
+
+class AtenOPPacketTemplate():
+    def __init__(self, op_packet, hook):
+        self.op_packet = op_packet
+        self.hook = hook
+
+    def __getattr__(self, key):
+        try:
+            attr = getattr(self.op_packet, key)
+        except AttributeError as e:
+            raise AttributeError(f"AtenOPPacketTemplate or OpOverloadPacket does not have attribute '{key}'.") from e
+        if isinstance(attr, torch._ops.OpOverload):
+            return AtenOPTemplate(attr, self.hook)
+        else:
+            return attr
+
+    @torch_device_guard
+    def __call__(self, *args, **kwargs):
+        return AtenOPTemplate(self.op_packet, self.hook)(*args, **kwargs)
+
+    def overloads(self):
+        return self.op_packet.overloads()
+
+
+def wrap_aten_op(op, hook):
+    return AtenOPPacketTemplate(op, hook)
+
+
+def wrap_aten_ops_and_bind(hook):
+    _aten_ops = get_aten_ops()
+    for op_name in _aten_ops:
+        if not isinstance(aten_func.get(op_name), torch._ops.OpOverloadPacket):
+            continue
+        setattr(HOOKAtenOP, "wrap_" + str(op_name), wrap_aten_op(aten_func.get(op_name), hook))
diff --git a/debug/accuracy_tools/msprobe/test/core_ut/data_dump/test_api_registry.py b/debug/accuracy_tools/msprobe/test/core_ut/data_dump/test_api_registry.py
new file mode 100644
index 00000000000..c67c5d8ee9e
--- /dev/null
+++ b/debug/accuracy_tools/msprobe/test/core_ut/data_dump/test_api_registry.py
@@ -0,0 +1,73 @@
+# Copyright (c) 2025-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import os
+from unittest import TestCase
+from unittest.mock import patch
+
+import torch
+
+from msprobe.core.common.const import Const
+from msprobe.core.data_dump.api_registry import _get_attr, ApiWrapper
+
+
+class TestFunctions(TestCase):
+    def test__get_attr(self):
+        module = torch
+
+        attr_name = 'linalg.norm'
+        target_value = torch.linalg.norm
+        actual_value = _get_attr(module, attr_name)
+        self.assertEqual(target_value, actual_value)
+
+        attr_name = 'norm'
+        target_value = torch.norm
+        actual_value = _get_attr(module, attr_name)
+        self.assertEqual(target_value, actual_value)
+
+
+class TestApiWrapper(TestCase):
+    api_types = {
+        Const.PT_FRAMEWORK: {
+            Const.PT_API_TYPE_TORCH: (torch, torch),
+        }
+    }
+    supported_api_list_path = (Const.SUPPORT_API_FILE_NAME,)
+    yaml_value = {'torch': ['linalg.norm', 'norm']}
+    api_names = {Const.PT_FRAMEWORK: {'torch': {'linalg.norm', 'norm'}}}
+
+    def test___init__(self):
+        with patch('msprobe.core.data_dump.api_registry.load_yaml', return_value=self.yaml_value):
+            api_wrapper = ApiWrapper(self.api_types, self.supported_api_list_path)
+            self.assertEqual(api_wrapper.api_types, self.api_types)
+            self.assertEqual(api_wrapper.api_list_paths, self.supported_api_list_path)
+            self.assertEqual(api_wrapper.api_names, self.api_names)
+            self.assertEqual(api_wrapper.wrapped_api_functions, {})
+
+            api_wrapper = ApiWrapper(self.api_types, Const.SUPPORT_API_FILE_NAME)
+            self.assertEqual(api_wrapper.api_list_paths, list(self.supported_api_list_path))
+
+            with self.assertRaises(Exception) as context:
+                api_wrapper = ApiWrapper(self.api_types, (Const.SUPPORT_API_FILE_NAME, Const.SUPPORT_API_FILE_NAME))
+            self.assertEqual(str(context.exception),
+                             "The number of api_list_paths must be equal to the number of frameworks in 'api_types', "
+                             "when api_list_paths is a list or tuple.")
+
+    def test__get_api_names(self):
+        target_value = self.api_names
+        with patch('msprobe.core.data_dump.api_registry.load_yaml', return_value=self.yaml_value):
+            api_wrapper = ApiWrapper(self.api_types, self.supported_api_list_path)
+            actual_value = api_wrapper._get_api_names()
+        self.assertEqual(target_value, actual_value)
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/free_benchmark/test_ms_api_pynative_self_check.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/free_benchmark/test_ms_api_pynative_self_check.py
index e589dd4d587..c4482a22f04 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/free_benchmark/test_ms_api_pynative_self_check.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/free_benchmark/test_ms_api_pynative_self_check.py
@@ -1,4 +1,4 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
 # All rights reserved.
 #
 # Licensed under the Apache License, Version 2.0 (the "License");
@@ -23,12 +23,18 @@ from mindspore import Tensor, mint, ops
 from msprobe.core.common.const import Const
 from msprobe.mindspore.common.const import FreeBenchmarkConst
 from msprobe.mindspore.common.log import logger
-from msprobe.mindspore.dump.hook_cell.api_registry import api_register
-from msprobe.mindspore.free_benchmark.api_pynative_self_check import (ApiPyNativeSelfCheck, check_all_tensor,
-                                                                      check_self, data_pre_deal,
-                                                                      deal_fuzzed_and_original_result,
-                                                                      get_module, get_supported_ops,
-                                                                      get_target_arg_index, need_wrapper_func)
+from msprobe.mindspore.free_benchmark.api_pynative_self_check import (
+    ApiPyNativeSelfCheck,
+    check_all_tensor,
+    check_self,
+    data_pre_deal,
+    deal_fuzzed_and_original_result,
+    get_module,
+    get_supported_ops,
+    get_target_arg_index,
+    need_wrapper_func,
+    _api_register
+)
 from msprobe.mindspore.free_benchmark.common.config import Config
 from msprobe.mindspore.free_benchmark.common.handler_params import HandlerParams
 from msprobe.mindspore.free_benchmark.common.utils import Tools
@@ -83,8 +89,8 @@ class TestApiPyNativeSelfCheck(TestCase):
         self.assertEqual(self_checker.ori_func, target_ori_func)
 
     def test_handle(self):
-        with patch.object(api_register, "initialize_hook") as mock_init_hook, \
-             patch.object(api_register, "api_set_hook_func") as mock_set_hook:
+        with patch.object(_api_register, "initialize_hook") as mock_init_hook, \
+             patch.object(_api_register, "register_all_api") as mock_set_hook:
             self.checker.handle()
         mock_init_hook.assert_called_with(self.checker.build_hook)
         mock_set_hook.assert_called_once()
@@ -156,8 +162,8 @@ class TestApiPyNativeSelfCheck(TestCase):
         mock_warning.reset_mock()
         Config.stage = Const.FORWARD
         with patch.object(logger, "info") as mock_info, \
-             patch.object(api_register, "api_set_ori_func") as mock_set_ori, \
-             patch.object(api_register, "api_set_hook_func") as mock_set_hook, \
+             patch.object(_api_register, "restore_all_api") as mock_set_ori, \
+             patch.object(_api_register, "register_all_api") as mock_set_hook, \
              patch("msprobe.mindspore.free_benchmark.api_pynative_self_check.deal_fuzzed_and_original_result",
                    return_value="ret"):
             args = (1.0, 1.0)
diff --git a/debug/accuracy_tools/msprobe/test/mindspore_ut/test_ms_service.py b/debug/accuracy_tools/msprobe/test/mindspore_ut/test_ms_service.py
index 912830ea1ab..c14635dc64e 100644
--- a/debug/accuracy_tools/msprobe/test/mindspore_ut/test_ms_service.py
+++ b/debug/accuracy_tools/msprobe/test/mindspore_ut/test_ms_service.py
@@ -21,12 +21,13 @@ from unittest.mock import MagicMock, patch
 from mindspore import nn, ops
 
 from msprobe.core.common.exceptions import MsprobeException
-from msprobe.core.common.utils import Const, DumpPathAggregation
+from msprobe.core.common.utils import Const
+from msprobe.core.data_dump.api_registry import ApiRegistry
 from msprobe.core.data_dump.scope import BaseScope
 from msprobe.mindspore.cell_processor import CellProcessor
 from msprobe.mindspore.common.log import logger
 from msprobe.mindspore.common.utils import register_backward_hook_functions
-from msprobe.mindspore.dump.hook_cell.api_registry import ApiRegistry, api_register
+from msprobe.mindspore.dump.hook_cell.api_register import get_api_register
 from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
 from msprobe.mindspore.dump.jit_dump import JitDump
 from msprobe.mindspore.service import Service
@@ -49,7 +50,7 @@ class TestService(unittest.TestCase):
         self.service.primitive_hook_service = MagicMock()
 
     def tearDown(self) -> None:
-        api_register.api_set_ori_func()
+        get_api_register().restore_all_api()
 
     def test_init(self):
         self.assertEqual(self.service.config.level, "L0")
@@ -197,7 +198,7 @@ class TestService(unittest.TestCase):
     @patch.object(Service, 'need_end_service', return_value=False)
     @patch.object(JitDump, 'set_config')
     @patch.object(JitDump, 'set_data_collector')
-    @patch.object(ApiRegistry, 'api_set_hook_func')
+    @patch.object(ApiRegistry, 'register_all_api')
     def test_start_with_jit_dump_enabled(self, mock_api_set_hook_func, mock_set_data_collector,
                                          mock_set_config, mock_need_end_service, mock_register_cell_hook,
                                          mock_register_primitive_hook):
@@ -269,7 +270,7 @@ class TestService(unittest.TestCase):
                          primitive_combined_name)
 
     @patch.object(ApiRegistry, 'initialize_hook')
-    @patch.object(ApiRegistry, 'api_set_hook_func')
+    @patch.object(ApiRegistry, 'register_all_api')
     @patch("msprobe.mindspore.service.logger.info")
     def test_register_hook_new_with_level_mix(self, mock_logger, mock_api_set_hook_func, mock_initialize_hook):
         self.service.config.level = Const.LEVEL_MIX
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/api_accuracy_checker/run_ut/test_run_ut_utils.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/api_accuracy_checker/run_ut/test_run_ut_utils.py
index 0cf30461aec..8cead7b0093 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/api_accuracy_checker/run_ut/test_run_ut_utils.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/api_accuracy_checker/run_ut/test_run_ut_utils.py
@@ -1,13 +1,27 @@
-# coding=utf-8
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
 import unittest
-from unittest.mock import patch, MagicMock
+
 import torch
+
 from msprobe.pytorch.api_accuracy_checker.run_ut.run_ut_utils import *
 from msprobe.core.common.file_utils import create_directory, write_csv
 
 
 class TestRunUtUtils(unittest.TestCase):
-    
     def setUp(self):
         save_path = "temp_save_path"
         create_directory(save_path)
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/common/test_pt_utils.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/common/test_pt_utils.py
index cdc922cc98d..42035932e56 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/common/test_pt_utils.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/common/test_pt_utils.py
@@ -1,3 +1,18 @@
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
 import os
 import io
 import unittest
@@ -19,7 +34,7 @@ class TestParameterAdapter(unittest.TestCase):
     def setUp(self):
         self.func_mock = MagicMock()
         self.decorated_func = parameter_adapter(self.func_mock)
-        self.op_name_ = "__getitem__"
+        self.api_name = "__getitem__"
 
     def test_handle_masked_select_bfloat16(self):
         input_tensor = torch.tensor([1.0, 2.0], dtype=torch.bfloat16)
@@ -45,7 +60,7 @@ class TestParameterAdapter(unittest.TestCase):
         self.assertTrue(torch.equal(result, torch.tensor([20.0, 30.0])))
 
     def test_op_name_eq_with_none(self):
-        self.op_name_ = "__eq__"
+        self.api_name = "__eq__"
         args = (torch.tensor([1]), None)
         result = self.decorated_func(self, *args)
         self.assertFalse(result)
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/dump/test_module_dump.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/dump/test_module_dump.py
index 63d6abc3a24..5aaf0820a78 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/dump/test_module_dump.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/dump/test_module_dump.py
@@ -18,8 +18,10 @@ from unittest.mock import patch, MagicMock
 
 import torch
 import torch.nn as nn
+
+from msprobe.core.data_dump.api_registry import ApiRegistry
 from msprobe.pytorch import PrecisionDebugger
-from msprobe.pytorch.hook_module.api_registry import api_register
+from msprobe.pytorch.hook_module.api_register import get_api_register
 from msprobe.pytorch.service import torch_version_above_or_equal_2
 
 
@@ -27,12 +29,12 @@ class TestModuleDumper(unittest.TestCase):
     @classmethod
     def setUpClass(cls):
         PrecisionDebugger._instance = None
-        api_register.api_originality()
+        get_api_register().restore_all_api()
 
     @classmethod
     def tearDownClass(cls):
         PrecisionDebugger._instance = None
-        api_register.api_originality()
+        get_api_register().restore_all_api()
 
     def setUp(self):
         self.module = nn.Linear(8, 4)
@@ -41,7 +43,7 @@ class TestModuleDumper(unittest.TestCase):
 
     def test_stop_module_dump(self):
         self.module_dumper.hook_handle_list.extend([1, 2, 3])
-        with patch('msprobe.pytorch.dump.module_dump.module_dump.api_register') as mock_api_register:
+        with patch.object(ApiRegistry, 'register_all_api') as mock_api_register:
             mock_handle1 = MagicMock(spec=torch.utils.hooks.RemovableHandle)
             mock_handle2 = MagicMock(spec=torch.utils.hooks.RemovableHandle)
             self.module_dumper.hook_handle_list.extend([mock_handle1, mock_handle2])
@@ -50,7 +52,7 @@ class TestModuleDumper(unittest.TestCase):
             mock_handle1.remove.assert_called_once()
             mock_handle2.remove.assert_called_once()
             self.assertEqual(self.module_dumper.hook_handle_list, [])
-            mock_api_register.api_modularity.assert_called_once()
+            mock_api_register.assert_called_once()
 
     def test_register_hook(self):
         self.module_dumper.register_hook(self.module, "TestModule")
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_api_registry.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_api_registry.py
deleted file mode 100644
index 837ad23df76..00000000000
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_api_registry.py
+++ /dev/null
@@ -1,130 +0,0 @@
-import unittest
-from msprobe.pytorch.hook_module.api_registry import ApiRegistry, torch_version_above_2, is_gpu
-
-
-class TestApiRegistry(unittest.TestCase):
-    
-    def test_store_ori_attr(self):
-        class A():
-            a1 = 1
-        class B():
-            a = A()
-            b1 = 1
-            b2 = 2
-        
-        api_list = ["a.a1", "b1", "b2"]
-        expect_output = {"a.a1":1, "b1":1, "b2":2}
-        actual_output = dict()
-        ApiRegistry.store_ori_attr(B, api_list, actual_output)
-        self.assertEqual(actual_output, expect_output)
-
-    
-    def test_set_api_attr(self):
-        class A():
-            a1 = 1
-        class B():
-            a = A().__class__
-            b1 = 1
-        
-        attr_dict = {"a.a2":2, "b2":2, "b3":3}
-        ApiRegistry.set_api_attr(B, attr_dict)
-
-        for k, v in attr_dict.items():
-            if '.' in k:
-                sub_module_name, sub_op = k.rsplit('.', 1)
-                sub_module = getattr(B, sub_module_name, None)
-                
-                self.assertEqual(getattr(sub_module, sub_op), v)
-            else:
-                self.assertEqual(getattr(B, k), v)
-    
-    def test_api_modularity(self):
-
-        import torch
-        import torch.distributed as dist
-        #import torch_npu   #门禁没有安装torch_npu
-        from msprobe.pytorch.hook_module.api_registry import torch_without_guard_version, npu_distributed_api, is_gpu, torch_version_above_2
-
-        
-
-        reg = ApiRegistry()
-        attr_dict = {"b2":2, "b3":3}
-        reg.tensor_hook_attr = attr_dict
-        reg.torch_hook_attr = attr_dict
-        reg.functional_hook_attr = attr_dict
-        reg.distributed_hook_attr = attr_dict
-        reg.npu_distributed_hook_attr = attr_dict
-        reg.aten_hook_attr = attr_dict
-        reg.vf_hook_attr = attr_dict
-        reg.torch_npu_hook_attr = attr_dict
-
-        reg.api_modularity()
-        self.assertEqual(torch.Tensor.b2, 2)
-
-        self.assertEqual(torch.b2, 2)
-        self.assertEqual(torch.nn.functional.b2, 2)
-        self.assertEqual(dist.b2, 2)
-        self.assertEqual(dist.distributed_c10d.b2, 2)
-        #if not is_gpu and not torch_without_guard_version:
-            #self.assertEqual(torch_npu.distributed.b2, 2)
-            #self.assertEqual(torch_npu.distributed.distributed_c10d.b2, 2)
-        if torch_version_above_2:
-            self.assertEqual(torch.ops.aten.b2, 2)
-        self.assertEqual(torch._VF.b2, 2)
-        #if not is_gpu:
-            #self.assertEqual(torch_npu.b2, 2)
-    
-
-    def test_api_originality(self):
-        import torch
-        import torch.distributed as dist
-        #import torch_npu      #门禁没有安装torch_npu
-        from msprobe.pytorch.hook_module.api_registry import torch_without_guard_version, npu_distributed_api, is_gpu, torch_version_above_2
-
-        
-
-        reg = ApiRegistry()
-        attr_dict = {"b2":2, "b3":3}
-        reg.tensor_hook_attr = attr_dict
-        reg.torch_hook_attr = attr_dict
-        reg.functional_hook_attr = attr_dict
-        reg.distributed_hook_attr = attr_dict
-        reg.npu_distributed_hook_attr = attr_dict
-        reg.aten_hook_attr = attr_dict
-        reg.vf_hook_attr = attr_dict
-        reg.torch_npu_hook_attr = attr_dict
-
-        reg.api_originality()
-        self.assertEqual(torch.Tensor.b2, 2)
-
-        self.assertEqual(torch.b2, 2)
-        self.assertEqual(torch.nn.functional.b2, 2)
-        self.assertEqual(dist.b2, 2)
-        self.assertEqual(dist.distributed_c10d.b2, 2)
-        #if not is_gpu and not torch_without_guard_version:
-            #self.assertEqual(torch_npu.distributed.b2, 2)
-            #self.assertEqual(torch_npu.distributed.distributed_c10d.b2, 2)
-        if torch_version_above_2:
-            self.assertEqual(torch.ops.aten.b2, 2)
-        self.assertEqual(torch._VF.b2, 2)
-        #if not is_gpu:
-            #self.assertEqual(torch_npu.b2, 2)
-
-    def test_initialize_hook(self):
-        def hook_test():
-            pass
-
-        reg = ApiRegistry()
-        reg.initialize_hook(hook_test)
-        empty_list = []
-        self.assertFalse(empty_list==reg.tensor_hook_attr)
-        self.assertFalse(empty_list==reg.torch_hook_attr)
-        self.assertFalse(empty_list==reg.functional_hook_attr)
-        self.assertFalse(empty_list==reg.distributed_hook_attr)
-        self.assertFalse(empty_list==reg.npu_distributed_hook_attr)
-        if torch_version_above_2:
-            #print(True)
-            self.assertFalse(empty_list==reg.aten_hook_attr)
-        if not is_gpu:
-            #print(True)
-            self.assertFalse(empty_list==reg.torch_npu_hook_attr)
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_distributed.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_distributed.py
deleted file mode 100644
index 246feb56bec..00000000000
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_distributed.py
+++ /dev/null
@@ -1,41 +0,0 @@
-import unittest
-import torch.distributed as dist
-from msprobe.pytorch.hook_module.wrap_distributed import *
-
-class TestWrapDistributed(unittest.TestCase):
-    def hook(name, prefix):
-        def forward_pre_hook(nope, input, kwargs):
-            return input, kwargs
-
-        def forward_hook(nope, input, kwargs, result):
-            return 2
-
-        def backward_hook():
-            pass
-
-        def forward_hook_torch_version_below_2():
-            pass
-
-        return forward_pre_hook, forward_hook, backward_hook, forward_hook_torch_version_below_2
-    
-    def test_get_distributed_ops(self):
-        ops = get_distributed_ops()
-        self.assertIsInstance(ops, set)
-
-    def test_DistributedOPTemplate(self):
-        self.setUp()
-        op_name = 'all_reduce'
-        if op_name in get_distributed_ops():
-            op = DistributedOPTemplate(op_name, self.hook)
-            self.assertEqual(op.op_name_, op_name)
-
-    def test_wrap_distributed_op(self):
-        op_name = 'all_reduce'
-        if op_name in get_distributed_ops():
-            wrapped_op = wrap_distributed_op(op_name, self.hook)
-            self.assertTrue(callable(wrapped_op))
-
-    def test_wrap_distributed_ops_and_bind(self):
-        wrap_distributed_ops_and_bind(self.hook)
-        for op_name in get_distributed_ops():
-            self.assertTrue(hasattr(HOOKDistributedOP, "wrap_" + str(op_name)))
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_functional.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_functional.py
deleted file mode 100644
index 282551e3cef..00000000000
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_functional.py
+++ /dev/null
@@ -1,73 +0,0 @@
-import unittest
-import torch
-import torch.nn.functional as F
-from msprobe.pytorch.hook_module.wrap_functional import get_functional_ops, \
-    wrap_functional_ops_and_bind, HOOKFunctionalOP
-from msprobe.pytorch.common.utils import remove_dropout
-
-
-class TestDropoutFunctions(unittest.TestCase):
-
-    def setUp(self):
-        self.input_tensor = torch.ones(10, 10)
-        remove_dropout()
-
-    def test_function_dropout_no_dropout(self):
-        output = F.dropout(self.input_tensor, p = 0., training = True)
-        self.assertTrue(torch.equal(self.input_tensor, output))
-
-    def test_function_dropout_train_vs_eval(self):
-        output_train = F.dropout(self.input_tensor, p = 0., training = True)
-        output_eval = F.dropout(self.input_tensor, p = 0., training = False)
-        self.assertTrue(torch.equal(output_train, output_eval))
-
-    def test_function_dropout_invalid_probability(self):
-        with self.assertRaises(ValueError):
-            F.dropout(self.input_tensor, p = -0.1)
-        with self.assertRaises(ValueError):
-            F.dropout(self.input_tensor, p = 1.1)
-
-    def test_function_dropout2d_no_dropout(self):
-        output = F.dropout2d(self.input_tensor, p = 0., training = True)
-        self.assertTrue(torch.equal(self.input_tensor, output))
-
-    def test_function_dropout2d_train_vs_eval(self):
-        output_train = F.dropout2d(self.input_tensor, p = 0., training = True)
-        output_eval = F.dropout2d(self.input_tensor, p = 0., training = False)
-        self.assertTrue(torch.equal(output_train, output_eval))
-
-    def test_function_dropout2d_invalid_probability(self):
-        with self.assertRaises(ValueError):
-            F.dropout2d(self.input_tensor, p = -0.1)
-        with self.assertRaises(ValueError):
-            F.dropout2d(self.input_tensor, p = 1.1)
-
-    def test_function_dropout3d_no_dropout(self):
-        input_tensor_3d = self.input_tensor.unsqueeze(0)
-        output = F.dropout3d(input_tensor_3d, p = 0., training = True)
-        self.assertTrue(torch.equal(input_tensor_3d, output))
-    
-    def test_function_dropout3d_train_vs_eval(self):
-        input_tensor_3d = self.input_tensor.unsqueeze(0)
-        output_train = F.dropout3d(input_tensor_3d, p = 0., training = True)
-        output_eval = F.dropout3d(input_tensor_3d, p = 0., training = False)
-        self.assertTrue(torch.equal(output_train, output_eval))
-    
-    def test_function_dropout3d_invalid_probability(self):
-        input_tensor_3d = self.input_tensor.unsqueeze(0)
-        with self.assertRaises(ValueError):
-            F.dropout3d(input_tensor_3d, p = -0.1)
-        with self.assertRaises(ValueError):
-            F.dropout3d(input_tensor_3d, p = 1.1)
-
-
-class TestWrapFunctional(unittest.TestCase):
-
-    def test_get_functional_ops(self):
-        expected_ops = {'relu', 'sigmoid', 'softmax'}
-        actual_ops = get_functional_ops()
-        self.assertTrue(expected_ops.issubset(actual_ops))
-
-    def test_wrap_functional_ops_and_bind(self):
-        wrap_functional_ops_and_bind(None)
-        self.assertTrue(hasattr(HOOKFunctionalOP, 'wrap_relu'))
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_npu_custom.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_npu_custom.py
deleted file mode 100644
index 573d6d000f3..00000000000
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_npu_custom.py
+++ /dev/null
@@ -1,43 +0,0 @@
-import unittest
-from unittest.mock import MagicMock, patch
-
-from msprobe.core.common.const import Const
-from msprobe.core.common.log import logger
-from msprobe.pytorch.function_factory import npu_custom_functions
-from msprobe.pytorch.hook_module.wrap_npu_custom import NpuOPTemplate
-
-try:
-    import torch_npu
-except ImportError:
-    logger.info("Failing to import torch_npu.")
-
-
-class TestNpuOPTemplate(unittest.TestCase):
-
-    def setUp(self):
-        self.mock_hook = MagicMock(return_value=(MagicMock(), MagicMock(), MagicMock(), None))
-        self.template = NpuOPTemplate("sum", self.mock_hook)
-
-    def test_init(self):
-        self.assertEqual(self.template.op_name_, "sum")
-        self.assertEqual(self.template.prefix_op_name_, f"NPU{Const.SEP}sum{Const.SEP}")
-        self.assertTrue(self.template.need_hook)
-        self.assertEqual(self.template.device, Const.CPU_LOWERCASE)
-
-    @patch('torch.ops.npu.sum')
-    def test_forward_without_hook(self, mock_npu_sum):
-        self.template.need_hook = False
-        npu_custom_functions["sum"] = MagicMock(return_value="output_from_custom")
-
-        result = self.template.forward(1, 2, key='value')
-        self.assertEqual(result, "output_from_custom")
-        mock_npu_sum.assert_not_called()
-
-    @patch('torch.ops.npu.sum')
-    def test_forward_with_hook(self, mock_npu_sum):
-        self.template.need_hook = True
-        mock_npu_sum.return_value = "output_from_npu"
-
-        result = self.template.forward(1, 2, key='value')
-        self.assertEqual(result, "output_from_npu")
-        mock_npu_sum.assert_called_once_with(1, 2, key='value')
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_tensor.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_tensor.py
deleted file mode 100644
index 6868c5bda7a..00000000000
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_tensor.py
+++ /dev/null
@@ -1,40 +0,0 @@
-import unittest
-import torch
-from msprobe.pytorch.hook_module.wrap_tensor import get_tensor_ops, HOOKTensor, TensorOPTemplate, wrap_tensor_op, wrap_tensor_ops_and_bind
-
-class TestWrapTensor(unittest.TestCase):
-
-    def hook(name, prefix):
-        def forward_pre_hook(nope, input, kwargs):
-            return input, kwargs
-
-        def forward_hook(nope, input, kwargs, result):
-            return 2
-
-        def backward_hook():
-            pass
-
-        def forward_hook_torch_version_below_2():
-            pass
-
-        return forward_pre_hook, forward_hook, backward_hook, forward_hook_torch_version_below_2
-    
-    def test_get_tensor_ops(self):
-        result = get_tensor_ops()
-        self.assertIsInstance(result, set)
-
-    def test_HOOKTensor(self):
-        hook_tensor = HOOKTensor()
-        self.assertIsInstance(hook_tensor, HOOKTensor)
-
-    def test_TensorOPTemplate(self):
-        tensor_op_template = TensorOPTemplate('add', self.hook)
-        self.assertTrue(tensor_op_template.op_name_, 'add')
-
-    def test_wrap_tensor_op(self):
-        wrapped_op = wrap_tensor_op('add', self.hook)
-        self.assertTrue(callable(wrapped_op))
-
-    def test_wrap_tensor_ops_and_bind(self):
-        wrap_tensor_ops_and_bind(self.hook)
-        self.assertTrue(hasattr(HOOKTensor, 'wrap_add'))
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_torch.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_torch.py
deleted file mode 100644
index e0e4d000c0b..00000000000
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_torch.py
+++ /dev/null
@@ -1,48 +0,0 @@
-import unittest
-import torch
-from msprobe.pytorch.hook_module.wrap_torch import *
-
-class TestWrapTorch(unittest.TestCase):
-
-    def hook(name, prefix):
-        def forward_pre_hook(nope, input, kwargs):
-            return input, kwargs
-
-        def forward_hook(nope, input, kwargs, result):
-            return 2
-
-        def backward_hook():
-            pass
-
-        def forward_hook_torch_version_below_2():
-            pass
-
-        return forward_pre_hook, forward_hook, backward_hook, forward_hook_torch_version_below_2
-    
-    def setUp(self):
-
-        self.op_name = 'add'
-        self.torch_op = wrap_torch_op(self.op_name, self.hook)
-
-    def test_get_torch_ops(self):
-        self.setUp()
-        ops = get_torch_ops()
-        self.assertIsInstance(ops, set)
-        self.assertIn(self.op_name, ops)
-
-    def test_TorchOPTemplate(self):
-        self.setUp()
-        template = TorchOPTemplate(self.op_name, self.hook)
-        self.assertEqual(template.op_name_, self.op_name)        
-        self.assertEqual(template.prefix_op_name_, "Torch." + str(self.op_name) + ".")
-
-    def test_forward(self):
-        self.setUp()
-        template = TorchOPTemplate(self.op_name, self.hook)
-        result = template.forward(torch.tensor([1, 2, 3]), torch.tensor([4, 5, 6]))
-        torch.testing.assert_close(result, torch.tensor([5, 7, 9]))
-
-    def test_wrap_torch_ops_and_bind(self):
-        self.setUp()
-        wrap_torch_ops_and_bind(self.hook)
-        self.assertTrue(hasattr(HOOKTorchOP, "wrap_" + self.op_name))
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_vf.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_vf.py
deleted file mode 100644
index 98efb4bc5b8..00000000000
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/hook_module/test_wrap_vf.py
+++ /dev/null
@@ -1,11 +0,0 @@
-import unittest
-import torch
-from msprobe.pytorch.hook_module import wrap_vf
-
-class TestWrapVF(unittest.TestCase):
-    def setUp(self):
-        self.hook = lambda x: x
-
-    def test_get_vf_ops(self):
-        ops = wrap_vf.get_vf_ops()
-        self.assertIsInstance(ops, list)
\ No newline at end of file
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/demo_model.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/demo_model.py
index f5de4194402..820b1f7476d 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/demo_model.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/demo_model.py
@@ -1,7 +1,25 @@
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
 import torch
 import torch.nn.functional as F
 from msprobe.pytorch import TrainerMon
 from msprobe.pytorch.common import seed_all
+from msprobe.pytorch.hook_module.api_register import get_api_register
+
+get_api_register().restore_all_api()
 
 device = torch.device('cpu')
 dtype_float32 = torch.float32
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/test_csv2tb.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/test_csv2tb.py
index f2bc82ffafc..4178e2ef8fb 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/test_csv2tb.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/test_csv2tb.py
@@ -1,3 +1,18 @@
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
 import os
 import shutil
 import random
@@ -11,6 +26,9 @@ from tensorboard.backend.event_processing.event_accumulator import EventAccumula
 from msprobe.pytorch import TrainerMon
 from msprobe.core.common.const import MonitorConst
 from msprobe.pytorch.monitor.csv2tb import parse_step_fn, csv2tensorboard_by_step
+from msprobe.pytorch.hook_module.api_register import get_api_register
+
+get_api_register().restore_all_api()
 
 
 base_dir = os.path.dirname(os.path.realpath(__file__))
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/test_module_hook.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/test_module_hook.py
index eefacb73c8e..66d016f9487 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/test_module_hook.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/monitor/test_module_hook.py
@@ -1,3 +1,18 @@
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
 import os.path
 import shutil
 import unittest
@@ -8,10 +23,13 @@ import torch
 from msprobe.core.common.const import MonitorConst, Const
 from torch import distributed as dist
 
+from msprobe.pytorch import TrainerMon
+from msprobe.pytorch.hook_module.api_register import get_api_register
 from msprobe.pytorch.monitor.module_hook import CommunicationContext, GradContext, ModuleHookContext, \
     param_is_not_tensor_parallel_duplicate, param_is_data_parallel_duplicate
 from msprobe.test.pytorch_ut.monitor.demo_model import monitor_demo
-from msprobe.pytorch import TrainerMon
+
+get_api_register().restore_all_api()
 
 base_dir = os.path.dirname(os.path.realpath(__file__))
 
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/test_service.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/test_service.py
index 6687f311105..a814ce6213e 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/test_service.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/test_service.py
@@ -1,7 +1,23 @@
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
 import unittest
 from unittest.mock import patch, mock_open, MagicMock
 
 from msprobe.core.common.utils import Const
+from msprobe.core.data_dump.api_registry import ApiRegistry
 from msprobe.pytorch.debugger.debugger_config import DebuggerConfig
 from msprobe.pytorch.pt_config import parse_json_config
 from msprobe.pytorch.service import Service
@@ -87,8 +103,8 @@ class TestService(unittest.TestCase):
         self.service.build_hook = MagicMock()
         self.config.level = "L1"
         with patch("msprobe.pytorch.service.logger.info_on_rank_0") as mock_logger, \
-                patch("msprobe.pytorch.service.api_register.initialize_hook") as mock_init_hook, \
-                patch("msprobe.pytorch.service.api_register.api_modularity") as mock_api_modularity:
+             patch.object(ApiRegistry, "initialize_hook") as mock_init_hook, \
+             patch.object(ApiRegistry, 'register_all_api') as mock_api_modularity:
             self.service.register_api_hook()
             self.assertEqual(mock_logger.call_count, 1)
             mock_init_hook.assert_called_once()
-- 
Gitee


From ff660697def8508cecad708c70641c07492a85df Mon Sep 17 00:00:00 2001
From: qianggee <qjchenb@163.com>
Date: Mon, 10 Mar 2025 03:22:12 +0000
Subject: [PATCH 096/145]  fix bug in deepspeed bf16 opt mv monitor

---
 .../pytorch/monitor/optimizer_collect.py      | 58 +++++++++++++++++--
 1 file changed, 54 insertions(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py b/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
index 602514836d2..88a0f328a07 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
@@ -185,7 +185,7 @@ class MegatronChainedDistributedOptimizerMon(MegatronDistributedOptimizerMon):
             for opt in torch_opt.chained_optimizers:
                 self.map_fp16_tp_fp32_param(opt)
 
-        if not isinstance(torch_opt, torch.optim.Optimizer):
+        if not isinstance(torch_opt, torch.optim.Optimizer) and not hasattr(torch_opt, 'state'):
             torch_opt.state = {}
             for opt in torch_opt.chained_optimizers:
                 torch_opt.state.update(opt.optimizer.state)
@@ -198,7 +198,7 @@ class MegatronChainedMixPrecisionOptimizerMon(MixPrecisionOptimizerMon):
             for opt in torch_opt.chained_optimizers:
                 self.map_fp16_tp_fp32_param(opt)
 
-        if not isinstance(torch_opt, torch.optim.Optimizer):
+        if not isinstance(torch_opt, torch.optim.Optimizer) and not hasattr(torch_opt, 'state'):
             torch_opt.state = {}
             for opt in torch_opt.chained_optimizers:
                 torch_opt.state.update(opt.optimizer.state)
@@ -206,9 +206,59 @@ class MegatronChainedMixPrecisionOptimizerMon(MixPrecisionOptimizerMon):
 
 
 class DeepSpeedZeroOptimizerStage0Mon(OptimizerMon):
-    def fetch_mv(self, monitor, torch_opt, params2name):
-        return self._fetch_mv_in_adam(monitor, torch_opt, params2name)
+    def get_group_index(self, params2name, torch_opt):
+        fp16_groups = torch_opt.bf16_groups
+        param2group = defaultdict()
+        for group_idx, fp16_group in enumerate(fp16_groups):
+            for param in fp16_group:
+                param2group[param] = group_idx
+        return param2group
+
+    def fetch_mv(self, monitor, torch_opt, params2name, name2indices=None):
+        param2group = self.get_group_index(params2name, torch_opt)
+        exp_avg_dict = defaultdict(float)
+        exp_avg_sq_dict = defaultdict(float)
+        update_dict = defaultdict()
+        ratio_dict = defaultdict()
+
+        for param, name in params2name.items():
+            if param._hp_mapping is None:
+                continue
+            group_idx = param2group[param]
+            state = torch_opt.state[torch_opt.fp32_groups_flat_partition[group_idx]]
+            if state.get('exp_avg', None) is None:
+                logger.warning(f"optimizer state is None. Something is wrong if this is not the first step")
+                break
+            
+            hp_address = param._hp_mapping.hp_fragment_address
+            start = hp_address.start
+            numel = hp_address.numel
 
+            if monitor.mv_distribution:
+                exp_avg_dict[name] = state['exp_avg'].narrow(0, start, numel)
+                exp_avg_sq_dict[name] = state['exp_avg_sq'].narrow(0, start, numel)
+            if monitor.mg_direction:
+                exp_avg_dict[name] = state['exp'].narrow(0, start, numel)
+            if monitor.ur_distribution:
+                if len(torch_opt.param_groups) > 1:
+                    logger.info(f"the length of torch_opt.param_groups is {len(torch_opt.param_groups)}.")
+                if 'step' in state:
+                    step = state['step']  # Optimizer from pytorch or FusedAdam from apex(used by megatron)
+                elif 'step' in torch_opt.param_groups[0]:
+                    step = torch_opt.param_groups[0]['step']  # AdamW from mindspeed
+                else:
+                    logger.warning(f"step of {name} is None, maybe something wrong happened.")
+                    continue
+                exp_avg = state['exp_avg'].narrow(0, start, numel)
+                exp_avg_sq = state['exp_avg_sq'].narrow(0, start, numel)
+                exp_avg_hat = exp_avg / (1 - torch_opt.defaults['betas'][0] ** step)
+                exp_avg_sq_hat = exp_avg_sq / (1 - torch_opt.defaults['betas'][1] ** step)
+                update_dict[name] = exp_avg_hat / (torch.sqrt(exp_avg_sq_hat) + torch_opt.defaults['eps'])
+                ratio_dict[name] = exp_avg_hat / torch.sqrt(exp_avg_sq_hat)
+                monitor.update_heatmap_visualizer[name].pre_cal(update_dict[name])
+                monitor.ratio_heatmap_visualizer[name].pre_cal(ratio_dict[name])
+        return MVResult(exp_avg=exp_avg_dict, exp_avg_sq=exp_avg_sq_dict, update=update_dict, ratio=ratio_dict)
+    
 
 class DeepSpeedZeroOptimizerStage3Mon(OptimizerMon):
     def get_param_index(self, params2name, name2index, torch_opt):
-- 
Gitee


From 37d197ca3d0ac2d485ee304ce948a62f267e13f6 Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Mon, 10 Mar 2025 15:42:49 +0800
Subject: [PATCH 097/145] fix params bug

---
 .../msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py      | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
index c7a48844ee8..51fe32de810 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/run_ut.py
@@ -319,7 +319,8 @@ def run_torch_api_online(api_full_name, api_data, backward_content):
     if kwargs.get("device"):
         del kwargs["device"]
 
-    device_out = exec_api(api_type, api_name, Const.CUDA_LOWERCASE, args, kwargs)
+    device_exec_params = ExecParams(api_type, api_name, current_device, args, kwargs, False, None)
+    device_out = exec_api(device_exec_params)
     device_out = move2device_exec(device_out, "cpu")
     return UtDataInfo(None, None, out, device_out, None, in_fwd_data_list, None, rank=api_data.rank)
 
-- 
Gitee


From ba84b2cb3e14596991e821491e9ebcd90c764521 Mon Sep 17 00:00:00 2001
From: qianggee <qjchenb@163.com>
Date: Mon, 10 Mar 2025 09:00:22 +0000
Subject: [PATCH 098/145] avoid protected attr

---
 .../msprobe/pytorch/monitor/optimizer_collect.py         | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py b/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
index 88a0f328a07..7e4a7273b3e 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
@@ -221,16 +221,17 @@ class DeepSpeedZeroOptimizerStage0Mon(OptimizerMon):
         update_dict = defaultdict()
         ratio_dict = defaultdict()
 
+        param_slice_mappings = torch_opt.state_dict()['param_slice_mappings']
         for param, name in params2name.items():
-            if param._hp_mapping is None:
-                continue
             group_idx = param2group[param]
             state = torch_opt.state[torch_opt.fp32_groups_flat_partition[group_idx]]
             if state.get('exp_avg', None) is None:
                 logger.warning(f"optimizer state is None. Something is wrong if this is not the first step")
                 break
-            
-            hp_address = param._hp_mapping.hp_fragment_address
+            param_slice_mapping = param_slice_mappings[group_idx]
+            hp_address = param_slice_mapping.get(torch_opt.param_names[param])
+            if hp_address is None:
+                continue
             start = hp_address.start
             numel = hp_address.numel
 
-- 
Gitee


From b381ca33bc3da526a651fef039639574897c8163 Mon Sep 17 00:00:00 2001
From: l30044004 <louyujing@huawei.com>
Date: Mon, 10 Mar 2025 17:28:43 +0800
Subject: [PATCH 099/145] =?UTF-8?q?=E5=88=86=E7=BA=A7=E5=8F=AF=E8=A7=86?=
 =?UTF-8?q?=E5=8C=96=E6=94=AF=E6=8C=81parameters=5Fgrad=E4=BF=A1=E6=81=AF?=
 =?UTF-8?q?=E5=B1=95=E7=A4=BA?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../builder/test_graph_builder.py             | 20 ++++++++++
 .../visualization/builder/graph_builder.py    | 39 +++++++++++++++++++
 2 files changed, 59 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/test/visualization_ut/builder/test_graph_builder.py b/debug/accuracy_tools/msprobe/test/visualization_ut/builder/test_graph_builder.py
index 706dc8bf82e..9b69e8bc2a7 100644
--- a/debug/accuracy_tools/msprobe/test/visualization_ut/builder/test_graph_builder.py
+++ b/debug/accuracy_tools/msprobe/test/visualization_ut/builder/test_graph_builder.py
@@ -111,3 +111,23 @@ class TestGraphBuilder(unittest.TestCase):
         self.assertEqual(graph.root.subnodes[2].op, NodeOp.module)
         self.assertEqual(len(graph.root.subnodes[0].subnodes), 0)
         self.assertEqual(graph.root.subnodes[0].id, 'Module.a.0')
+
+    def test_add_parameters_grad(self):
+        graph = Graph('TestNet')
+        graph.add_node(NodeOp.module, 'Module.a.backward.0', graph.root)
+        graph.add_node(NodeOp.module, 'Module.b.backward.0', graph.root)
+        graph.add_node(NodeOp.module, 'Module.a.backward.1', graph.root)
+        graph.add_node(NodeOp.module, 'Module.aa.backward.0', graph.get_node('Module.a.backward.0'))
+        graph.add_node(NodeOp.module, 'Module.aaa.backward.0', graph.get_node('Module.a.backward.0'))
+        graph.add_node(NodeOp.module, 'Module.aa.backward.1', graph.get_node('Module.a.backward.1'))
+        graph.add_node(NodeOp.module, 'Module.aaa.backward.1', graph.get_node('Module.a.backward.1'))
+
+        data_dict = {'Module.a.parameters_grad': {}, 'Module.aaa.parameters_grad': {}}
+        GraphBuilder._add_parameters_grad(graph, data_dict)
+        root_nodes_id = [node.id for node in graph.get_node('TestNet').subnodes]
+        sub_nodes_id0 = [node.id for node in graph.get_node('Module.a.backward.0').subnodes]
+        sub_nodes_id1 = [node.id for node in graph.get_node('Module.a.backward.1').subnodes]
+
+        self.assertEqual(root_nodes_id[-1], 'Module.a.backward.1')
+        self.assertEqual(sub_nodes_id0[-1], 'Module.aaa.backward.0')
+        self.assertEqual(sub_nodes_id1[-1], 'Module.a.parameters_grad')
diff --git a/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py b/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
index 814882e6b81..a5ace4001c8 100644
--- a/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
+++ b/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
@@ -51,6 +51,7 @@ class GraphBuilder:
         graph = Graph(model_name, data_path=dump_dict.get('dump_data_dir', ''), dump_data=data_dict)
         GraphBuilder._init_nodes(graph, construct_dict, data_dict, stack_dict)
         GraphBuilder._collect_apis_between_modules(graph)
+        GraphBuilder._add_parameters_grad(graph, data_dict)
         return graph
 
     @staticmethod
@@ -235,6 +236,44 @@ class GraphBuilder:
 
         graph.root.subnodes = output
 
+    @staticmethod
+    def _add_parameters_grad(graph, data_dict):
+        """
+        将parameters_grad信息添加到graph中，
+        对应模块的parameters_grad节点添加到对应模块的最后一次backward节点（backward计数最大）内作为子节点
+
+        例如，graph有节点Module.a.backward.0, Module.a.backward.1, Module.a.backward.2
+        则Module.a.parameters_grad添加在Module.a.backward.2内作为子节点
+        """
+        prefixes = []
+        suffix = Const.SEP + Const.PARAMS_GRAD
+        for node_id, data in data_dict.items():
+            if node_id not in graph.node_map and node_id.endswith(suffix):
+                prefixes.append(node_id.replace(suffix, ''))
+
+        max_info = {prefix: 0 for prefix in prefixes}
+
+        for key in graph.node_map.keys():
+            for prefix in prefixes:
+                # 构建正则表达式，匹配以 "backward.数字" 结尾的键
+                pattern = re.compile(r'^' + re.escape(prefix) + r'\.backward\.(\d+)$')
+                match = pattern.match(key)
+                if match:
+                    num = int(match.group(1))
+                    if num > max_info[prefix]:
+                        max_info[prefix] = num
+
+        for prefix, num in max_info.items():
+            node_id = prefix + Const.SEP + Const.BACKWARD + Const.SEP + str(num)
+            node = graph.get_node(node_id)
+            if node:
+                parameters_grad_node_id = graph.add_node(NodeOp.module, prefix + suffix, up_node=node)
+                # 添加输入输出数据
+                node_data = data_dict.get(parameters_grad_node_id, {})
+                input_data, output_data = get_input_output(node_data, parameters_grad_node_id)
+                # 更新数据
+                graph.get_node(parameters_grad_node_id).set_input_output(input_data, output_data)
+
 
 class GraphExportConfig:
     def __init__(self, graph_n, graph_b=None, tool_tip=None, node_colors=None, micro_steps=None, task='',
-- 
Gitee


From b43cf2a2c974e39255dcf0e2612a8e8ead68d00f Mon Sep 17 00:00:00 2001
From: l30044004 <louyujing@huawei.com>
Date: Mon, 10 Mar 2025 19:19:41 +0800
Subject: [PATCH 100/145] =?UTF-8?q?=E5=88=86=E7=BA=A7=E5=8F=AF=E8=A7=86?=
 =?UTF-8?q?=E5=8C=96=E6=94=AF=E6=8C=81parameters=5Fgrad=E4=BF=A1=E6=81=AF?=
 =?UTF-8?q?=E5=B1=95=E7=A4=BA?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/visualization/builder/graph_builder.py              | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py b/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
index a5ace4001c8..1f70fb7d8ae 100644
--- a/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
+++ b/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
@@ -247,7 +247,7 @@ class GraphBuilder:
         """
         prefixes = []
         suffix = Const.SEP + Const.PARAMS_GRAD
-        for node_id, data in data_dict.items():
+        for node_id in data_dict.keys():
             if node_id not in graph.node_map and node_id.endswith(suffix):
                 prefixes.append(node_id.replace(suffix, ''))
 
-- 
Gitee


From 513a58303d193824ffd59e34119ea58a12732da9 Mon Sep 17 00:00:00 2001
From: qianggee <qjchenb@163.com>
Date: Mon, 10 Mar 2025 11:53:05 +0000
Subject: [PATCH 101/145] rename bit16 group

---
 .../msprobe/pytorch/monitor/optimizer_collect.py       | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py b/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
index 7e4a7273b3e..131f3ecab47 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/optimizer_collect.py
@@ -206,16 +206,16 @@ class MegatronChainedMixPrecisionOptimizerMon(MixPrecisionOptimizerMon):
 
 
 class DeepSpeedZeroOptimizerStage0Mon(OptimizerMon):
-    def get_group_index(self, params2name, torch_opt):
-        fp16_groups = torch_opt.bf16_groups
+    def get_group_index(self, torch_opt):
+        bit16_groups = torch_opt.bf16_groups
         param2group = defaultdict()
-        for group_idx, fp16_group in enumerate(fp16_groups):
-            for param in fp16_group:
+        for group_idx, bit16_group in enumerate(bit16_groups):
+            for param in bit16_group:
                 param2group[param] = group_idx
         return param2group
 
     def fetch_mv(self, monitor, torch_opt, params2name, name2indices=None):
-        param2group = self.get_group_index(params2name, torch_opt)
+        param2group = self.get_group_index(torch_opt)
         exp_avg_dict = defaultdict(float)
         exp_avg_sq_dict = defaultdict(float)
         update_dict = defaultdict()
-- 
Gitee


From 6736ac542120b7040f7411a22fb86a55431eff07 Mon Sep 17 00:00:00 2001
From: TAJh <taojiaheng1@huawei.com>
Date: Tue, 11 Mar 2025 11:30:30 +0800
Subject: [PATCH 102/145] bugfix

---
 .../accuracy_tools/msprobe/mindspore/__init__.py |  5 ++++-
 .../mindspore/dym_loader/hook_dynamic_loader.cc  | 16 ++--------------
 .../mindspore/dym_loader/hook_dynamic_loader.h   |  1 +
 3 files changed, 7 insertions(+), 15 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/__init__.py b/debug/accuracy_tools/msprobe/mindspore/__init__.py
index a519d861f57..e7cbfcdb3c9 100644
--- a/debug/accuracy_tools/msprobe/mindspore/__init__.py
+++ b/debug/accuracy_tools/msprobe/mindspore/__init__.py
@@ -18,7 +18,10 @@ import os
 try:
     from msprobe.lib import _msprobe_c
     os.environ["MS_HOOK_ENABLE"] = "on"
-    os.environ["HOOK_TOOL_PATH"] = _msprobe_c.__file__
+    dir_path = os.path.dirname(os.path.abspath(_msprobe_c.__file__))
+    current_ld_path = os.environ.get("LD_LIBRARY_PATH", "")
+    # 更新环境变量
+    os.environ["LD_LIBRARY_PATH"] = f"{current_ld_path}:{dir_path}"
 except ImportError:
     from .common.log import logger
     logger.info("Module _msprobe_c has not been installed. L2-Dump may not work normally.")
diff --git a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
index b72d68741da..6975d04d3f0 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
+++ b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
@@ -78,25 +78,13 @@ bool HookDynamicLoader::validateLibraryPath(const std::string &libPath) {
 }
 
 bool HookDynamicLoader::LoadLibrary() {
-  const char *libPath = std::getenv("HOOK_TOOL_PATH");
-  if (!libPath) {
-    MS_LOG(WARNING) << "HOOK_TOOL_PATH is not set!";
-    return false;
-  }
-
-  std::string resolvedLibPath(libPath);
-  if (!validateLibraryPath(resolvedLibPath)) {
-    MS_LOG(WARNING) << "Library path validation failed.";
-    return false;
-  }
-
   std::lock_guard<std::mutex> lock(mutex_);
   if (handle_) {
     MS_LOG(WARNING) << "Hook library already loaded!";
     return false;
   }
 
-  handle_ = dlopen(resolvedLibPath.c_str(), RTLD_LAZY | RTLD_LOCAL);
+  handle_ = dlopen(kMsprobeExtName, RTLD_LAZY | RTLD_LOCAL);
   if (!handle_) {
     MS_LOG(WARNING) << "Failed to load Hook library: " << dlerror();
     return false;
@@ -104,7 +92,7 @@ bool HookDynamicLoader::LoadLibrary() {
 
   for (const auto &functionName : functionList_) {
     if (!loadFunction(handle_, functionName)) {
-      MS_LOG(WARNING) << "Failed to load function: " << functionName;
+      MS_LOG(WARNING) << "Failed to load adump function";
       dlclose(handle_);
       handle_ = nullptr;
       return false;
diff --git a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
index 6309e60b662..a7b708c5e29 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
+++ b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
@@ -25,6 +25,7 @@
 
 constexpr auto kHookBegin = "MS_DbgOnStepBegin";
 constexpr auto kHookEnd = "MS_DbgOnStepEnd";
+constexpr const char* kMsprobeExtName = "_msprobe_c.so";
 
 class HookDynamicLoader {
  public:
-- 
Gitee


From cbab39e4d4ff317a559663fa655230ddfc2490ad Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Tue, 11 Mar 2025 15:19:23 +0800
Subject: [PATCH 103/145] param_check

---
 .../msprof_analyze/cluster_analyse/cluster_analysis.py     | 7 ++++++-
 .../cluster_analyse/recipes/base_recipe_analysis.py        | 7 +++++--
 2 files changed, 11 insertions(+), 3 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py b/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
index 3f14f2894f5..ce085d015aa 100644
--- a/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/cluster_analysis.py
@@ -160,7 +160,12 @@ def cluster_analysis_main():
 
     args, extra_args = parser.parse_known_args()
     parameter = vars(args)
-    parameter[Constant.EXTRA_ARGS] = extra_args
+    if extra_args:
+        if parameter.get(Constant.MODE) in COMM_FEATURE_LIST:
+            unknown_args = " ".join(extra_args)
+            logger.warning(f"Invalid parameters: {unknown_args}. It will not have any effect.")
+        else:
+            parameter[Constant.EXTRA_ARGS] = extra_args
     Interface(parameter).run()
 
 
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
index 701666578bf..69f80eef8d0 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
@@ -53,7 +53,7 @@ class BaseRecipeAnalysis(ABC):
         self._rank_list = rank_list if rank_list == "all" else [int(rank) for rank in rank_list.split(",") if
                                                                 rank.isdigit()]
         self._step_id = params.get(Constant.STEP_ID, Constant.VOID_STEP)
-        self._extra_args = self.get_extra_argument(params.get(Constant.EXTRA_ARGS))
+        self._extra_args = self.get_extra_argument(params.get(Constant.EXTRA_ARGS, []))
         PathManager.make_dir_safety(self._output_path)
 
     def __enter__(self):
@@ -89,7 +89,10 @@ class BaseRecipeAnalysis(ABC):
     def get_extra_argument(cls, args_list) -> dict:
         parser = argparse.ArgumentParser()
         cls.add_parser_argument(parser)
-        args, _ = parser.parse_known_args(args_list)
+        args, unknown_args = parser.parse_known_args(args_list)
+        if unknown_args:
+            unknown_args = " ".join(unknown_args)
+            logger.warning(f"Invalid parameters: {unknown_args}. It will not have any effect.")
         return vars(args)
 
     @abstractmethod
-- 
Gitee


From 6cc4968eaf399e0f5805c807884c04b10b1cd2bd Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Tue, 11 Mar 2025 16:01:41 +0800
Subject: [PATCH 104/145] compare get_name_and_state indexerror protection

---
 debug/accuracy_tools/msprobe/core/common/utils.py  | 1 +
 debug/accuracy_tools/msprobe/core/compare/utils.py | 3 +++
 2 files changed, 4 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/core/common/utils.py b/debug/accuracy_tools/msprobe/core/common/utils.py
index 38fcddfaead..5e4aed0e87d 100644
--- a/debug/accuracy_tools/msprobe/core/common/utils.py
+++ b/debug/accuracy_tools/msprobe/core/common/utils.py
@@ -75,6 +75,7 @@ class MsprobeBaseException(Exception):
     MERGE_COMPARE_RESULT_ERROR = 33
     NAMES_STRUCTS_MATCH_ERROR = 34
     INVALID_STATE_ERROR = 35
+    INVALID_API_NAME_ERROR = 36
 
     def __init__(self, code, error_info: str = ""):
         super(MsprobeBaseException, self).__init__()
diff --git a/debug/accuracy_tools/msprobe/core/compare/utils.py b/debug/accuracy_tools/msprobe/core/compare/utils.py
index e93ff775e78..a2335857c71 100644
--- a/debug/accuracy_tools/msprobe/core/compare/utils.py
+++ b/debug/accuracy_tools/msprobe/core/compare/utils.py
@@ -549,6 +549,9 @@ def get_name_and_state(name):
         return name.split(Const.PARAMS_GRAD)[0], Const.PARAMS_GRAD
 
     split = re.split(Const.REGEX_FORWARD_BACKWARD, name)
+    if len(split) < 3:
+        logger.error(f'Invalid name string: {name}, can not be split by forward/backward, please check.')
+        raise CompareException(CompareException.INVALID_API_NAME_ERROR)
     api = f'{split[0]}.{split[1]}.'
     state_str = split[2]
     match = re.match(r'^(\d+\.)?(input|output|kwargs|parameters)\..+$', state_str)
-- 
Gitee


From 373f5edd6538336a2b056cb18db57950fbc61f62 Mon Sep 17 00:00:00 2001
From: jiangchao_j <chaojiang_j@163.com>
Date: Tue, 11 Mar 2025 20:41:27 +0800
Subject: [PATCH 105/145] adapt to dist api

---
 .../msprobe/core/data_dump/api_registry.py    |  4 +--
 .../msprobe/mindspore/common/utils.py         |  2 +-
 .../mindspore/dump/hook_cell/api_register.py  | 30 ++++++++++++-------
 .../pytorch/hook_module/api_register.py       |  5 +++-
 4 files changed, 26 insertions(+), 15 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py b/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
index 27106044e1e..5aeafd573d6 100644
--- a/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
+++ b/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
@@ -90,8 +90,8 @@ class ApiWrapper:
                     target_module = api_modules[0]
                     if Const.SEP in api_name:
                         sub_module_name, target_attr = api_name.rsplit(Const.SEP, 1)
-                        target_module = getattr(api_modules[0], sub_module_name)
-                    if target_attr in dir(target_module):
+                        target_module = getattr(api_modules[0], sub_module_name, None)
+                    if target_module and target_attr in dir(target_module):
                         names.add(api_name)
                 valid_names[api_type] = names
             api_names[framework] = valid_names
diff --git a/debug/accuracy_tools/msprobe/mindspore/common/utils.py b/debug/accuracy_tools/msprobe/mindspore/common/utils.py
index 6da6db0f830..625842da589 100644
--- a/debug/accuracy_tools/msprobe/mindspore/common/utils.py
+++ b/debug/accuracy_tools/msprobe/mindspore/common/utils.py
@@ -179,7 +179,7 @@ def set_register_backward_hook_functions():
         from msprobe.mindspore.mindtorch import (_call_impl,
                                                  register_full_backward_pre_hook,
                                                  register_full_backward_hook)
-        if not hasattr(torch, "register_full_backward_hook"):
+        if not hasattr(torch.nn.Module, "register_full_backward_hook"):
             setattr(torch.nn.Module, "_call_impl", _call_impl)
             setattr(torch.nn.Module, "register_full_backward_pre_hook", register_full_backward_pre_hook)
             setattr(torch.nn.Module, "register_full_backward_hook", register_full_backward_hook)
diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
index 6563ed70086..53271ff07be 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
+++ b/debug/accuracy_tools/msprobe/mindspore/dump/hook_cell/api_register.py
@@ -27,6 +27,8 @@ from msprobe.mindspore.common.const import Const as MsConst
 from msprobe.mindspore.common.utils import is_mindtorch
 from msprobe.mindspore.dump.hook_cell.hook_cell import HOOKCell
 
+
+cur_path = os.path.dirname(os.path.realpath(__file__))
 if not is_mindtorch():
     _api_types = {
         Const.MS_FRAMEWORK: {
@@ -38,6 +40,7 @@ if not is_mindtorch():
             Const.MS_API_TYPE_COM: (comm_func, (comm_func,))
         }
     }
+    _supported_api_list_path = (os.path.join(cur_path, MsConst.SUPPORTED_API_LIST_FILE),)
 else:
     import torch
     import torch_npu
@@ -50,7 +53,8 @@ else:
             Const.PT_API_TYPE_DIST: (torch.distributed, (torch.distributed, torch.distributed.distributed_c10d))
         }
     }
-
+    _supported_api_list_path = (os.path.join(cur_path, '../../../pytorch/hook_module',
+                                             MsConst.SUPPORTED_API_LIST_FILE),)
 
 _inner_used_api = {
     Const.MS_FRAMEWORK + Const.SEP + Const.MS_API_TYPE_OPS: (
@@ -64,8 +68,6 @@ _inner_used_api = {
     )
 }
 
-_supported_api_list_path = (os.path.join(os.path.dirname(os.path.realpath(__file__)), MsConst.SUPPORTED_API_LIST_FILE),)
-
 
 class ApiTemplate(HOOKCell):
     def __init__(self, api_name, api_func, prefix, hook_build_func):
@@ -104,22 +106,28 @@ class ApiTemplate(HOOKCell):
 
 
 api_register = None
+stub_tensor_set = False
 
 
-def get_api_register():
-    global api_register
+def get_api_register(return_new=False):
+    global stub_tensor_set
 
     def stub_method(method):
         def wrapped_method(*args, **kwargs):
             return method(*args, **kwargs)
         return wrapped_method
+    if not is_mindtorch() and not stub_tensor_set:
+        for attr_name in dir(StubTensor):
+            attr = getattr(StubTensor, attr_name)
+            api_names = load_yaml(_supported_api_list_path[0]).get(Const.MS_API_TYPE_TENSOR, [])
+            if attr_name in api_names and callable(attr):
+                setattr(StubTensor, attr_name, stub_method(attr))
+        stub_tensor_set = True
+
+    if return_new:
+        return ApiRegistry(_api_types, _inner_used_api, _supported_api_list_path, ApiTemplate)
 
+    global api_register
     if api_register is None:
-        if not is_mindtorch():
-            for attr_name in dir(StubTensor):
-                attr = getattr(StubTensor, attr_name)
-                api_names = load_yaml(_supported_api_list_path[0]).get(Const.MS_API_TYPE_TENSOR, [])
-                if attr_name in api_names and callable(attr):
-                    setattr(StubTensor, attr_name, stub_method(attr))
         api_register = ApiRegistry(_api_types, _inner_used_api, _supported_api_list_path, ApiTemplate)
     return api_register
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
index 4154646c0f4..30a45a84d87 100644
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/api_register.py
@@ -121,7 +121,10 @@ class ApiTemplate(HOOKModule):
 api_register = None
 
 
-def get_api_register():
+def get_api_register(return_new=False):
+    if return_new:
+        return ApiRegistry(_api_types, _inner_used_api, _supported_api_list_path, ApiTemplate)
+
     global api_register
     if api_register is None:
         api_register = ApiRegistry(_api_types, _inner_used_api, _supported_api_list_path, ApiTemplate)
-- 
Gitee


From 2fa074c167b5364b425fd9aaa645dde83c7ad09d Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Wed, 12 Mar 2025 10:37:09 +0800
Subject: [PATCH 106/145] fix safe problem

---
 .../api_accuracy_checker/run_ut/multi_run_ut.py   |  3 +++
 .../tensor_transport_layer/attl.py                | 14 ++++++++++----
 .../pytorch/online_dispatch/dump_compare.py       |  9 +++++++--
 .../msprobe/pytorch/online_dispatch/utils.py      | 15 ++++++++++-----
 4 files changed, 30 insertions(+), 11 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py
index 498102b475f..37cdea85f85 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py
@@ -50,6 +50,9 @@ def split_json_file(input_file, num_splits, filter_api):
         backward_data[f"{data_name}.backward"] = backward_data.pop(data_name)
 
     input_data = load_json(input_file)
+    if input_data.get("dump_data_dir") is None:
+        logger.error("Invalid input file, 'dump_data_dir' field is missing")
+        raise CompareException("Invalid input file, 'dump_data_dir' field is missing")
     if input_data.get("data") is None:
         logger.error("Invalid input file, 'data' field is missing")
         raise CompareException("Invalid input file, 'data' field is missing")
diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
index f31c29c6bb6..5fc314c15ee 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
@@ -27,6 +27,9 @@ from msprobe.pytorch.api_accuracy_checker.tensor_transport_layer.client import T
 from msprobe.pytorch.api_accuracy_checker.tensor_transport_layer.server import TCPServer
 from msprobe.core.common.file_utils import remove_path
 from msprobe.pytorch.common.utils import logger, save_api_data, load_api_data, save_pkl, load_pkl
+from msprobe.core.common.const import Const
+from msprobe.core.common.utils import CompareException
+
 
 BufferType = Union[ApiData, Dict[str, Any], str]  # Union[Tensor, Tuple[Optional[Tensor]]]
 
@@ -168,19 +171,22 @@ class ATTL:
         return buffer
 
 
-def move2device_exec(obj, device):
+def move2device_exec(obj, device, depth=0):
+    if depth > Const.MAX_DEPTH:
+        logger.error("Maximum recursion depth exceeded")
+        raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
     if isinstance(obj, (tuple, list)):
-        data_list = [move2device_exec(val, device) for val in obj]
+        data_list = [move2device_exec(val, device, depth=depth+1) for val in obj]
         return data_list if isinstance(obj, list) else tuple(data_list)
     if isinstance(obj, dict):
-        return {key: move2device_exec(val, device) for key, val in obj.items()}
+        return {key: move2device_exec(val, device, depth=depth+1) for key, val in obj.items()}
     elif isinstance(obj, torch.Tensor):
         obj = obj.detach()
         if obj.device.type != device:
             obj = obj.to(device)
         return obj
     elif "return_types" in str(type(obj)):
-        return move2device_exec(tuple(obj), device)
+        return move2device_exec(tuple(obj), device, depth=depth+1)
     elif isinstance(obj, torch._C.device):
         return torch.device(device)
     else:
diff --git a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
index b185bc1110d..aff8f92a759 100644
--- a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
+++ b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
@@ -19,6 +19,8 @@ import os
 from datetime import datetime, timezone
 
 import torch
+from msprobe.core.common.const import Const
+from msprobe.core.common.utils import CompareException
 from msprobe.core.common.file_utils import FileOpen, save_npy, save_json
 from msprobe.pytorch.common.log import logger
 
@@ -91,10 +93,13 @@ def support_basic_type(data):
     return False
 
 
-def dump_data(data, prefix, dump_path):
+def dump_data(data, prefix, dump_path, depth=0):
+    if depth > Const.MAX_DEPTH:
+        logger.error(f'dump data depth exceeds max depth:{Const.MAX_DEPTH}')
+        raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
     if isinstance(data, (tuple, list)) and data:
         for i, item in enumerate(data):
-            dump_data(item, "{}.{}".format(prefix, i), dump_path)
+            dump_data(item, "{}.{}".format(prefix, i), dump_path, depth=depth+1)
         return
     elif support_basic_type(data):
         if isinstance(data, torch.Tensor) and data.is_meta:
diff --git a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
index ae8b9435a34..5140cd6e8a0 100644
--- a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
@@ -26,9 +26,11 @@ except ImportError:
 else:
     pta_cpu_device = torch.device("cpu")
 
-from msprobe.core.common.const import CompareConst
+from msprobe.core.common.const import CompareConst, Const
+from msprobe.core.common.utils import CompareException
 from msprobe.pytorch.common.log import logger
 
+
 cpu_device = torch._C.device("cpu")
 COLOR_RED = '\033[31m'
 COLOR_GREEN = '\033[32m'
@@ -85,7 +87,10 @@ def get_callstack():
     return callstack
 
 
-def data_to_cpu(data, deep, data_cpu):
+def data_to_cpu(data, deep, data_cpu, depth=0):
+    if depth > Const.MAX_DEPTH:
+        logger.error("Failed to convert data to cpu, depth exceeds max depth:{}".format(Const.MAX_DEPTH))
+        raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
     global cpu_device
     list_cpu = []
     if isinstance(data, torch.Tensor):
@@ -101,13 +106,13 @@ def data_to_cpu(data, deep, data_cpu):
         return tensor_copy
     elif isinstance(data, list):
         for v in data:
-            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu))
+            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth=depth+1))
         if deep == 0:
             data_cpu.append(list_cpu)
         return list_cpu
     elif isinstance(data, tuple):
         for v in data:
-            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu))
+            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth=depth+1))
         tuple_cpu = tuple(list_cpu)
         if deep == 0:
             data_cpu.append(tuple_cpu)
@@ -115,7 +120,7 @@ def data_to_cpu(data, deep, data_cpu):
     elif isinstance(data, dict):
         dict_cpu = {}
         for k, v in data.items():
-            dict_cpu[k] = data_to_cpu(v, deep + 1, data_cpu)
+            dict_cpu[k] = data_to_cpu(v, deep + 1, data_cpu, depth=depth+1)
         if deep == 0:
             data_cpu.append(dict_cpu)
         return dict_cpu
-- 
Gitee


From 93f55e27314fedc453e94998b31de2646e15d8c1 Mon Sep 17 00:00:00 2001
From: kiritorl <ruxinglong@huawei.com>
Date: Sun, 9 Mar 2025 19:23:12 +0800
Subject: [PATCH 107/145] =?UTF-8?q?=E8=B0=83=E6=95=B4html=E5=B1=95?=
 =?UTF-8?q?=E7=A4=BA=E6=96=B9=E5=BC=8F?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../html/templates/ai_core_performance.html   | 111 ++++++++++++------
 1 file changed, 78 insertions(+), 33 deletions(-)

diff --git a/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html b/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
index 743953ff351..9ee1ae9cb30 100644
--- a/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
+++ b/profiler/msprof_analyze/advisor/display/html/templates/ai_core_performance.html
@@ -1,155 +1,200 @@
 {% if format_result|length > 0 %}
+<style>
+    .typecol {
+        width: 30%;
+    }
+</style>
 <div class="collapsible">
     <h2 class="collapsible-header" style="background-color: {{ priority_background_color }};">AI CORE Performance Analysis</h2>
     <div class="collapsible-content">
         {% if language == "cn" %}
         {% set title_ns = namespace(type='类别', desc='描述及建议', opti_set='性能优化算子集合', bound_set='bound算子集合', affinity_set='不亲和算子集合',
-        opti_refer=' 参考性能优化空间: ', bound_refer=' bound类型为: ', affinity_refer=' 不亲和类型为: ', title_desc='算子相关分析，参考如下: ') %}
+        opti_refer=' 参考性能优化空间', bound_refer=' bound类型为', affinity_refer=' 不亲和类型为', title_desc='算子相关分析，参考如下: ') %}
         {% else %}
         {% set title_ns = namespace(type='Type', desc='Description and Suggestion', opti_set='set of performance optimization operators', 
-        bound_set='set of bound operators', affinity_set='set of unaffine operators', opti_refer=' refer to Performance Optimization Space: ',
-         bound_refer=' bound type: ', affinity_refer=' type of disaffinity: ', title_desc=' Operator related analysis, referenced below: ') %}
+        bound_set='set of bound operators', affinity_set='set of unaffine operators', opti_refer=' refer to Performance Optimization Space',
+         bound_refer=' bound type', affinity_refer=' type of disaffinity', title_desc=' Operator related analysis, referenced below: ') %}
         {% endif %}
         {% if format_result.cube[0]|length + format_result.cube[1]|length + format_result.cube[2]|length > 0 %}
-        <a style="font-weight: bold" id="timeline_api_instruction">Cube{{ title_ns.title_desc }}</a>
+        <a style="font-weight: bold" id="cube_analyze">Cube{{ title_ns.title_desc }}</a>
         <br>
         <table>
             <tr>
-                <th>{{ title_ns.type }}</th>
+                <th class="typecol">{{ title_ns.type }}</th>
                 <th>{{ title_ns.desc }}</th>
             </tr>
             {% set opti_ns = namespace(total_opti='') %}
             {% for opti in format_result.cube[0] %}
             {% if not loop.first %}
-            {% set opti_ns.total_opti = opti_ns.total_opti ~ "<br>" ~ opti.op_name ~ " operator shape: " ~ opti.shape ~ " dtype: " ~ opti.dtype ~ title_ns.opti_refer ~ opti.optimization ~ "%" %}
+            {% set opti_ns.total_opti = opti_ns.total_opti ~ "<tr><td>" ~ opti.op_name ~ "</td><td>" ~ opti.shape ~ "</td><td>" ~ opti.dtype ~ "</td><td>" ~ opti.optimization ~ "%</td></tr>" %}
             {% else %}
-            {% set opti_ns.total_opti = opti.op_name ~ " operator shape: " ~ opti.shape ~ " dtype: " ~ opti.dtype ~ title_ns.opti_refer ~ opti.optimization ~ "%" %}
+            {% set opti_ns.total_opti = "<tr><td>" ~ opti.op_name ~ "</td><td>" ~ opti.shape ~ "</td><td>" ~ opti.dtype ~ "</td><td>" ~ opti.optimization ~ "%</td></tr>" %}
             {% endif %}
             {% endfor %}
             {% if opti_ns.total_opti|length > 0 %}
             <tr>
                 <td>{{ title_ns.opti_set }}</td>
-                <td>{{ opti_ns.total_opti | safe }}</td>
+                <td>
+                <table>
+                <tr><th>name</th><th>shape</th><th>dtype</th><th>{{ title_ns.opti_refer }}</th></tr>
+                    <tr>{{ opti_ns.total_opti | safe }}</tr>
+                </table>
+                </td>
             </tr>
             {% endif %}
             {% set bound_ns = namespace(total_bound='') %}
             {% for bound in format_result.cube[1] %}
             {% if not loop.first %}
-            {% set bound_ns.total_bound = bound_ns.total_bound ~ "<br>" ~ bound.op_name ~ " operator shape: " ~ bound.shape ~ " dtype: " ~ bound.dtype ~ title_ns.bound_refer ~ bound.bound %}
+            {% set bound_ns.total_bound = bound_ns.total_bound ~ "<tr><td>" ~ bound.op_name ~ "</td><td>" ~ bound.shape ~ "</td><td>" ~ bound.dtype ~ "</td><td>" ~ bound.bound ~ "</td></tr>" %}
             {% else %}
-            {% set bound_ns.total_bound = bound.op_name ~ " operator shape: " ~ bound.shape ~ " dtype: " ~ bound.dtype ~ title_ns.bound_refer ~ bound.bound %}
+            {% set bound_ns.total_bound = "<tr><td>" ~ bound.op_name ~ "</td><td>" ~ bound.shape ~ "</td><td>" ~ bound.dtype ~ "</td><td>" ~ bound.bound ~ "</td></tr>" %}
             {% endif %}
             {% endfor %}
             {% if bound_ns.total_bound|length > 0 %}
             <tr>
                 <td>{{ title_ns.bound_set }}</td>
-                <td>{{ bound_ns.total_bound | safe }}</td>
+                <td>
+                <table>
+                <tr><th>name</th><th>shape</th><th>dtype</th><th>{{ title_ns.bound_refer }}</th></tr>
+                    <tr>{{ bound_ns.total_bound | safe }}</tr>
+                </table>
+                </td>
             </tr>
             {% endif %}
             {% set affinity_ns = namespace(total_affinity='') %}
             {% for affinity in format_result.cube[2] %}
             {% if not loop.first %}
-            {% set affinity_ns.total_affinity = affinity_ns.total_affinity ~ "<br>" ~ affinity.op_name ~ " operator shape: " ~ affinity.shape ~ " dtype: " ~ affinity.dtype ~ title_ns.affinity_refer ~ affinity.suggestion %}
+            {% set affinity_ns.total_affinity = affinity_ns.total_affinity ~ "<tr><td>" ~ affinity.op_name ~ "</td><td>" ~ affinity.shape ~ "</td><td>" ~ affinity.dtype ~ "</td><td>" ~ affinity.suggestion ~ "</td></tr>" %}
             {% else %}
-            {% set affinity_ns.total_affinity = affinity.op_name ~ " operator shape: " ~ affinity.shape ~ " dtype: " ~ affinity.dtype ~ title_ns.affinity_refer ~ affinity.suggestion %}
+            {% set affinity_ns.total_affinity = "<tr><td>" ~ affinity.op_name ~ "</td><td>" ~ affinity.shape ~ "</td><td>" ~ affinity.dtype ~ "</td><td>" ~ affinity.suggestion ~ "</td></tr>" %}
             {% endif %}
             {% endfor %}
             {% if affinity_ns.total_affinity|length > 0 %}
             <tr>
                 <td>{{ title_ns.affinity_set }}</td>
-                <td>{{ affinity_ns.total_affinity | safe }}</td>
+                <td>
+                <table>
+                <tr><th>name</th><th>shape</th><th>dtype</th><th>{{ title_ns.affinity_refer }}</th></tr>
+                    <tr>{{ affinity_ns.total_affinity | safe }}</tr>
+                </table>
+                </td>
             </tr>
             {% endif %}
         </table>
         {% endif %}
 
         {% if format_result.fa[0]|length + format_result.fa[1]|length + format_result.fa[2]|length > 0 %}
-        <a style="font-weight: bold" id="timeline_api_instruction">FA{{ title_ns.title_desc }}</a>
+        <a style="font-weight: bold" id="fa_analyze">FA{{ title_ns.title_desc }}</a>
         <br>
         <table>
             <tr>
-                <th>{{ title_ns.type }}</th>
+                <th class="typecol">{{ title_ns.type }}</th>
                 <th>{{ title_ns.desc }}</th>
             </tr>
             {% set opti_ns = namespace(total_opti='') %}
             {% for opti in format_result.fa[0] %}
             {% if not loop.first %}
-            {% set opti_ns.total_opti = opti_ns.total_opti ~ "<br>" ~ opti.op_name ~ " operator shape: " ~ opti.shape ~ " dtype: " ~ opti.dtype ~ title_ns.opti_refer ~ opti.optimization ~ "%" %}
+            {% set opti_ns.total_opti = opti_ns.total_opti ~ "<tr><td>" ~ opti.op_name ~ "</td><td>" ~ opti.shape ~ "</td><td>" ~ opti.dtype ~ "</td><td>" ~ opti.optimization ~ "%</td></tr>" %}
             {% else %}
-            {% set opti_ns.total_opti = opti.op_name ~ " operator shape: " ~ opti.shape ~ " dtype: " ~ opti.dtype ~ title_ns.opti_refer ~ opti.optimization ~ "%" %}
+            {% set opti_ns.total_opti = "<tr><td>" ~ opti.op_name ~ "</td><td>" ~ opti.shape ~ "</td><td>" ~ opti.dtype ~ "</td><td>" ~ opti.optimization ~ "%</td></tr>" %}
             {% endif %}
             {% endfor %}
             {% if opti_ns.total_opti|length > 0 %}
             <tr>
                 <td>{{ title_ns.opti_set }}</td>
-                <td>{{ opti_ns.total_opti | safe }}</td>
+                <td>
+                <table>
+                <tr><th>name</th><th>shape</th><th>dtype</th><th>{{ title_ns.opti_refer }}</th></tr>
+                    <tr>{{ opti_ns.total_opti | safe }}</tr>
+                </table>
+                </td>
             </tr>
             {% endif %}
             {% set bound_ns = namespace(total_bound='') %}
             {% for bound in format_result.fa[1] %}
             {% if not loop.first %}
-            {% set bound_ns.total_bound = bound_ns.total_bound ~ "<br>" ~ bound.op_name ~ " operator shape: " ~ bound.shape ~ " dtype: " ~ bound.dtype ~ title_ns.bound_refer ~ bound.bound %}
+            {% set bound_ns.total_bound = bound_ns.total_bound ~ "<tr><td>" ~ bound.op_name ~ "</td><td>" ~ bound.shape ~ "</td><td>" ~ bound.dtype ~ "</td><td>" ~ bound.bound ~ "</td></tr>" %}
             {% else %}
-            {% set bound_ns.total_bound = bound.op_name ~ " operator shape: " ~ bound.shape ~ " dtype: " ~ bound.dtype ~ title_ns.bound_refer ~ bound.bound %}
+            {% set bound_ns.total_bound = "<tr><td>" ~ bound.op_name ~ "</td><td>" ~ bound.shape ~ "</td><td>" ~ bound.dtype ~ "</td><td>" ~ bound.bound ~ "</td></tr>" %}
             {% endif %}
             {% endfor %}
             {% if bound_ns.total_bound|length > 0 %}
             <tr>
                 <td>{{ title_ns.bound_set }}</td>
-                <td>{{ bound_ns.total_bound | safe }}</td>
+                <td>
+                <table>
+                <tr><th>name</th><th>shape</th><th>dtype</th><th>{{ title_ns.bound_refer }}</th></tr>
+                    <tr>{{ bound_ns.total_bound | safe }}</tr>
+                </table>
+                </td>
             </tr>
             {% endif %}
             {% set affinity_ns = namespace(total_affinity='') %}
             {% for affinity in format_result.fa[2] %}
             {% if not loop.first %}
-            {% set affinity_ns.total_affinity = affinity_ns.total_affinity ~ "<br>" ~ affinity.op_name ~ " operator shape: " ~ affinity.shape ~ " dtype: " ~ affinity.dtype ~ title_ns.affinity_refer ~ affinity.suggestion %}
+            {% set affinity_ns.total_affinity = affinity_ns.total_affinity ~ "<tr><td>" ~ affinity.op_name ~ "</td><td>" ~ affinity.shape ~ "</td><td>" ~ affinity.dtype ~ "</td><td>" ~ affinity.suggestion ~ "</td></tr>" %}
             {% else %}
-            {% set affinity_ns.total_affinity = affinity.op_name ~ " operator shape: " ~ affinity.shape ~ " dtype: " ~ affinity.dtype ~ title_ns.affinity_refer ~ affinity.suggestion %}
+            {% set affinity_ns.total_affinity = "<tr><td>" ~ affinity.op_name ~ "</td><td>" ~ affinity.shape ~ "</td><td>" ~ affinity.dtype ~ "</td><td>" ~ affinity.suggestion ~ "</td></tr>" %}
             {% endif %}
             {% endfor %}
             {% if affinity_ns.total_affinity|length > 0 %}
             <tr>
                 <td>{{ title_ns.affinity_set }}</td>
-                <td>{{ affinity_ns.total_affinity | safe }}</td>
+                <td>
+                <table>
+                <tr><th>name</th><th>shape</th><th>dtype</th><th>{{ title_ns.affinity_refer }}</th></tr>
+                    <tr>{{ affinity_ns.total_affinity | safe }}</tr>
+                </table>
+                </td>
             </tr>
             {% endif %}
         </table>
         {% endif %}
 
         {% if format_result.vector[0]|length + format_result.vector[1]|length > 0 %}
-        <a style="font-weight: bold" id="timeline_api_instruction">Vector{{ title_ns.title_desc }}</a>
+        <a style="font-weight: bold" id="vector_analyze">Vector{{ title_ns.title_desc }}</a>
         <br>
         <table>
             <tr>
-                <th>{{ title_ns.type }}</th>
+                <th class="typecol">{{ title_ns.type }}</th>
                 <th>{{ title_ns.desc }}</th>
             </tr>
             {% set opti_ns = namespace(total_opti='') %}
             {% for opti in format_result.vector[0] %}
             {% if not loop.first %}
-            {% set opti_ns.total_opti = opti_ns.total_opti ~ "<br>" ~ opti.op_name ~ " operator shape: " ~ opti.shape ~ " dtype: " ~ opti.dtype ~ title_ns.opti_refer ~ opti.optimization ~ "%" %}
+            {% set opti_ns.total_opti = opti_ns.total_opti ~ "<tr><td>" ~ opti.op_name ~ "</td><td>" ~ opti.shape ~ "</td><td>" ~ opti.dtype ~ "</td><td>" ~ opti.optimization ~ "%</td></tr>" %}
             {% else %}
-            {% set opti_ns.total_opti = opti.op_name ~ " operator shape: " ~ opti.shape ~ " dtype: " ~ opti.dtype ~ title_ns.opti_refer ~ opti.optimization ~ "%" %}
+            {% set opti_ns.total_opti = "<tr><td>" ~ opti.op_name ~ "</td><td>" ~ opti.shape ~ "</td><td>" ~ opti.dtype ~ "</td><td>" ~ opti.optimization ~ "%</td></tr>" %}
             {% endif %}
             {% endfor %}
             {% if opti_ns.total_opti|length > 0 %}
             <tr>
                 <td>{{ title_ns.opti_set }}</td>
-                <td>{{ opti_ns.total_opti | safe }}</td>
+                <td>
+                <table>
+                <tr><th>name</th><th>shape</th><th>dtype</th><th>{{ title_ns.opti_refer }}</th></tr>
+                    <tr>{{ opti_ns.total_opti | safe }}</tr>
+                </table>
+                </td>
             </tr>
             {% endif %}
             {% set bound_ns = namespace(total_bound='') %}
             {% for bound in format_result.vector[1] %}
             {% if not loop.first %}
-            {% set bound_ns.total_bound = bound_ns.total_bound ~ "<br>" ~ bound.op_name ~ " operator shape: " ~ bound.shape ~ " dtype: " ~ bound.dtype ~ title_ns.bound_refer ~ bound.bound %}
+            {% set bound_ns.total_bound = bound_ns.total_bound ~ "<tr><td>" ~ bound.op_name ~ "</td><td>" ~ bound.shape ~ "</td><td>" ~ bound.dtype ~ "</td><td>" ~ bound.bound ~ "</td></tr>" %}
             {% else %}
-            {% set bound_ns.total_bound = bound.op_name ~ " operator shape: " ~ bound.shape ~ " dtype: " ~ bound.dtype ~ title_ns.bound_refer ~ bound.bound %}
+            {% set bound_ns.total_bound = "<tr><td>" ~ bound.op_name ~ "</td><td>" ~ bound.shape ~ "</td><td>" ~ bound.dtype ~ "</td><td>" ~ bound.bound ~ "</td></tr>" %}
             {% endif %}
             {% endfor %}
             {% if bound_ns.total_bound|length > 0 %}
             <tr>
                 <td>{{ title_ns.bound_set }}</td>
-                <td>{{ bound_ns.total_bound | safe }}</td>
+                <td>
+                <table>
+                <tr><th>name</th><th>shape</th><th>dtype</th><th>{{ title_ns.bound_refer }}</th></tr>
+                    <tr>{{ bound_ns.total_bound | safe }}</tr>
+                </table>
+                </td>
             </tr>
             {% endif %}
         </table>
-- 
Gitee


From 11b2d5f47deedf1757698d89c391bbb619517a92 Mon Sep 17 00:00:00 2001
From: eveyin <qianyin2022@hotmail.com>
Date: Wed, 12 Mar 2025 10:48:01 +0800
Subject: [PATCH 108/145] ut

---
 .../recipes/test_ep_load_balance.py           | 90 +++++++++++++++++++
 1 file changed, 90 insertions(+)
 create mode 100644 profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_ep_load_balance.py

diff --git a/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_ep_load_balance.py b/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_ep_load_balance.py
new file mode 100644
index 00000000000..577df7bb841
--- /dev/null
+++ b/profiler/msprof_analyze/test/ut/cluster_analyse/recipes/test_ep_load_balance.py
@@ -0,0 +1,90 @@
+# Copyright (c) 2025, Huawei Technologies Co., Ltd.
+# All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0  (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+import unittest
+from unittest.mock import patch, MagicMock
+import pandas as pd
+
+from msprof_analyze.prof_common.constant import Constant
+from msprof_analyze.cluster_analyse.recipes.ep_load_balance.ep_load_balance import EPLoadBalance
+
+
+class TestEPLoadBalance(unittest.TestCase):
+
+    def setUp(self):
+        self.params = {}
+        self.ep_load_balance = EPLoadBalance(self.params)
+        self.mock_db_path = "mock_db_path"
+        self.mock_rank_id = 0
+        self.mock_step_range = {Constant.START_NS: 0, Constant.END_NS: 1000}
+        self.mock_global_ranks = [0, 1]
+
+    @patch("msprof_analyze.cluster_analyse.recipes.ep_load_balance.ep_load_balance.DatabaseService")
+    def test_mapper_func_given_valid_data_map_when_called_then_pass(self, mock_db_service):
+        """
+        Test _mapper_func method to ensure it returns a DataFrame with correct Rank and epRanks columns
+        when provided with a valid data map.
+        """
+        # Mock the DatabaseService and its methods
+        mock_db_instance = mock_db_service.return_value
+        mock_db_instance.query_data.return_value = {
+            "META_DATA": pd.DataFrame(
+                {
+                    "name": ["parallel_group_info"],
+                    "value": ['{"group1": {"group_name": "exp", "global_ranks": [0, 1]}}'],
+                }
+            )
+        }
+
+        # Mock the InputShapeExport
+
+        mock_input_shape_export = MagicMock()
+        mock_input_shape_export.read_export_db.return_value = pd.DataFrame(
+            {"InputShapes": ["1,3;4,6;;;;;4", "1,3;4,6;;;;;4"]}
+        )
+
+        with patch(
+            "msprof_analyze.cluster_analyse.recipes.ep_load_balance.ep_load_balance.InputShapeExport",
+            return_value=mock_input_shape_export,
+        ):
+            data_map = {
+                Constant.PROFILER_DB_PATH: self.mock_db_path,
+                Constant.RANK_ID: self.mock_rank_id,
+                Constant.STEP_RANGE: self.mock_step_range,
+            }
+            result = self.ep_load_balance._mapper_func(data_map, "mock_analysis_class")
+
+            self.assertIsNotNone(result)
+            self.assertEqual(result["Rank"].tolist(), [self.mock_rank_id] * 2)
+            self.assertEqual(result["epRanks"].tolist(), [self.mock_global_ranks] * 2)
+
+    def test_reducer_func_given_dataframes_when_called_then_pass(self):
+        """
+        Test reducer_func method to ensure it processes multiple DataFrames and generates
+        ep_tokens_summary and top_ep_tokens_map correctly.
+        """
+        mock_mapper_res = [
+            pd.DataFrame(
+                {"Rank": [0, 1], "epRanks": [[0, 1], [0, 1]], "InputShapes": ["1,3;4,6;;;;;4", "7,8;10,12;;;;4"]}
+            ),
+            pd.DataFrame(
+                {"Rank": [2, 3], "epRanks": [[0, 1], [0, 1]], "InputShapes": ["1,3;4,6;;;;;4", "1,3;4,6;;;;;4"]}
+            ),
+        ]
+
+        self.ep_load_balance.reducer_func(mock_mapper_res)
+
+        self.assertIsNotNone(self.ep_load_balance.ep_tokens_summary)
+        self.assertIsNotNone(self.ep_load_balance.top_ep_tokens_map)
\ No newline at end of file
-- 
Gitee


From cdc7c4e3fff5b19cbe65533204d3abb3a6ddb1fb Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 12 Mar 2025 11:00:34 +0800
Subject: [PATCH 109/145] compare get_name_and_state indexerror protection

---
 debug/accuracy_tools/msprobe/core/compare/utils.py | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/core/compare/utils.py b/debug/accuracy_tools/msprobe/core/compare/utils.py
index a2335857c71..93db9ff4251 100644
--- a/debug/accuracy_tools/msprobe/core/compare/utils.py
+++ b/debug/accuracy_tools/msprobe/core/compare/utils.py
@@ -545,6 +545,10 @@ def get_name_and_state(name):
 
     state type: input, output, kwargs, parameters, parameters_grad
     """
+    if not isinstance(name, str):
+        logger.error(f'Invalid name string: {name}, type should be string, please check.')
+        raise CompareException(CompareException.INVALID_API_NAME_ERROR)
+
     if Const.PARAMS_GRAD in name.split(Const.SEP):
         return name.split(Const.PARAMS_GRAD)[0], Const.PARAMS_GRAD
 
-- 
Gitee


From 47f61687fbc771b8b5d32494821b95b7615436d5 Mon Sep 17 00:00:00 2001
From: Linwei-Ying <lwying007@126.com>
Date: Wed, 12 Mar 2025 11:03:03 +0800
Subject: [PATCH 110/145] compare get_name_and_state indexerror protection

---
 debug/accuracy_tools/msprobe/core/compare/utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/core/compare/utils.py b/debug/accuracy_tools/msprobe/core/compare/utils.py
index 93db9ff4251..66dc9ba94ee 100644
--- a/debug/accuracy_tools/msprobe/core/compare/utils.py
+++ b/debug/accuracy_tools/msprobe/core/compare/utils.py
@@ -546,7 +546,7 @@ def get_name_and_state(name):
     state type: input, output, kwargs, parameters, parameters_grad
     """
     if not isinstance(name, str):
-        logger.error(f'Invalid name string: {name}, type should be string, please check.')
+        logger.error(f'Invalid name: {name}, type should be string, please check.')
         raise CompareException(CompareException.INVALID_API_NAME_ERROR)
 
     if Const.PARAMS_GRAD in name.split(Const.SEP):
-- 
Gitee


From 0f71163ff6390a15c6576d1384dfeee122b4eafd Mon Sep 17 00:00:00 2001
From: pxp1 <958876660@qq.com>
Date: Wed, 12 Mar 2025 10:57:53 +0800
Subject: [PATCH 111/145] =?UTF-8?q?=E4=B8=8D=E9=87=87=E9=9B=86fsdp?=
 =?UTF-8?q?=E5=B1=82?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/pytorch/dump/module_dump/module_processer.py        | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_processer.py b/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_processer.py
index b5ca1da461f..e2239316492 100644
--- a/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_processer.py
+++ b/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_processer.py
@@ -109,6 +109,8 @@ class ModuleProcesser:
             for name, module in modules_and_names:
                 if module == model:
                     continue
+                if module.__class__.__name__ == "FullyShardedDataParallel":
+                    continue
                 module_index = (index + Const.SEP) if index != "-1" else ""
                 prefix_name = (BaseScope.Module_Type_Module + Const.SEP + module_index +
                                name + Const.SEP + module.__class__.__name__ + Const.SEP)
-- 
Gitee


From 127d6c6a19c61a6ced34f2e16a77b090b05741aa Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Wed, 12 Mar 2025 11:11:15 +0800
Subject: [PATCH 112/145] fix cleancode

---
 .../api_accuracy_checker/tensor_transport_layer/attl.py   | 8 ++++----
 .../msprobe/pytorch/online_dispatch/dump_compare.py       | 2 +-
 .../msprobe/pytorch/online_dispatch/utils.py              | 6 +++---
 3 files changed, 8 insertions(+), 8 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
index 5fc314c15ee..64a44699a89 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
@@ -176,17 +176,17 @@ def move2device_exec(obj, device, depth=0):
         logger.error("Maximum recursion depth exceeded")
         raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
     if isinstance(obj, (tuple, list)):
-        data_list = [move2device_exec(val, device, depth=depth+1) for val in obj]
+        data_list = [move2device_exec(val, device, depth = depth + 1) for val in obj]
         return data_list if isinstance(obj, list) else tuple(data_list)
-    if isinstance(obj, dict):
-        return {key: move2device_exec(val, device, depth=depth+1) for key, val in obj.items()}
+    if isinstance(obj, dict): 
+        return {key: move2device_exec(val, device, depth = depth + 1) for key, val in obj.items()}
     elif isinstance(obj, torch.Tensor):
         obj = obj.detach()
         if obj.device.type != device:
             obj = obj.to(device)
         return obj
     elif "return_types" in str(type(obj)):
-        return move2device_exec(tuple(obj), device, depth=depth+1)
+        return move2device_exec(tuple(obj), device, depth = depth + 1)
     elif isinstance(obj, torch._C.device):
         return torch.device(device)
     else:
diff --git a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
index aff8f92a759..76737b8cb05 100644
--- a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
+++ b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
@@ -99,7 +99,7 @@ def dump_data(data, prefix, dump_path, depth=0):
         raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
     if isinstance(data, (tuple, list)) and data:
         for i, item in enumerate(data):
-            dump_data(item, "{}.{}".format(prefix, i), dump_path, depth=depth+1)
+            dump_data(item, "{}.{}".format(prefix, i), dump_path, depth = depth + 1)
         return
     elif support_basic_type(data):
         if isinstance(data, torch.Tensor) and data.is_meta:
diff --git a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
index 5140cd6e8a0..72037287de0 100644
--- a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
@@ -106,13 +106,13 @@ def data_to_cpu(data, deep, data_cpu, depth=0):
         return tensor_copy
     elif isinstance(data, list):
         for v in data:
-            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth=depth+1))
+            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth = depth + 1))
         if deep == 0:
             data_cpu.append(list_cpu)
         return list_cpu
     elif isinstance(data, tuple):
         for v in data:
-            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth=depth+1))
+            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth = depth + 1))
         tuple_cpu = tuple(list_cpu)
         if deep == 0:
             data_cpu.append(tuple_cpu)
@@ -120,7 +120,7 @@ def data_to_cpu(data, deep, data_cpu, depth=0):
     elif isinstance(data, dict):
         dict_cpu = {}
         for k, v in data.items():
-            dict_cpu[k] = data_to_cpu(v, deep + 1, data_cpu, depth=depth+1)
+            dict_cpu[k] = data_to_cpu(v, deep + 1, data_cpu, depth = depth + 1)
         if deep == 0:
             data_cpu.append(dict_cpu)
         return dict_cpu
-- 
Gitee


From 96a05db0bd174ee6754903eefcf6ffc8589c86c6 Mon Sep 17 00:00:00 2001
From: fanglanyue <fanglanyue@huawei.com>
Date: Wed, 12 Mar 2025 10:42:23 +0800
Subject: [PATCH 113/145] bugfix: change convert_to_decimal/float logger level

---
 .../compare_tools/compare_backend/utils/common_func.py      | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/profiler/msprof_analyze/compare_tools/compare_backend/utils/common_func.py b/profiler/msprof_analyze/compare_tools/compare_backend/utils/common_func.py
index ac9b4726ead..b26bdb82625 100644
--- a/profiler/msprof_analyze/compare_tools/compare_backend/utils/common_func.py
+++ b/profiler/msprof_analyze/compare_tools/compare_backend/utils/common_func.py
@@ -39,7 +39,7 @@ def convert_to_float(data: any) -> float:
     try:
         float_value = float(data)
     except Exception:
-        logger.error('Invalid profiling data which failed to convert data to float.')
+        logger.warning('Invalid profiling data which failed to convert data to float.')
         return 0.0
     return float_value
 
@@ -48,8 +48,8 @@ def convert_to_decimal(data: any) -> Decimal:
     try:
         decimal_value = Decimal(data)
     except Exception:
-        logger.error('Invalid profiling data which failed to convert data to decimal.')
-        return 0.0
+        logger.warning('Invalid profiling data which failed to convert data to decimal.')
+        return Decimal(0)
     return decimal_value
 
 
-- 
Gitee


From a479637d8f6fc277e7503f0a3cb017942adc27d0 Mon Sep 17 00:00:00 2001
From: l30044004 <louyujing@huawei.com>
Date: Wed, 12 Mar 2025 11:40:12 +0800
Subject: [PATCH 114/145] =?UTF-8?q?=E5=88=86=E7=BA=A7=E5=8F=AF=E8=A7=86?=
 =?UTF-8?q?=E5=8C=96=E9=80=92=E5=BD=92=E9=99=90=E5=88=B6=E6=B7=B1=E5=BA=A6?=
 =?UTF-8?q?=EF=BC=8C=E6=A3=80=E6=B5=8B=E6=88=90=E7=8E=AF?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 debug/accuracy_tools/msprobe/core/common/utils.py     |  4 ++--
 .../msprobe/test/visualization_ut/graph/test_graph.py | 11 -----------
 .../msprobe/visualization/compare/graph_comparator.py |  4 +++-
 .../msprobe/visualization/graph/base_node.py          |  9 ++++++++-
 .../msprobe/visualization/graph/graph.py              |  9 ---------
 5 files changed, 13 insertions(+), 24 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/core/common/utils.py b/debug/accuracy_tools/msprobe/core/common/utils.py
index 38fcddfaead..b4c567bcfa9 100644
--- a/debug/accuracy_tools/msprobe/core/common/utils.py
+++ b/debug/accuracy_tools/msprobe/core/common/utils.py
@@ -485,13 +485,13 @@ recursion_depth = defaultdict(int)
 
 
 # 装饰一个函数，当函数递归调用超过限制时，抛出异常并打印函数信息。
-def recursion_depth_decorator(func_info):
+def recursion_depth_decorator(func_info, max_depth=Const.MAX_DEPTH):
     def decorator(func):
         @wraps(func)
         def wrapper(*args, **kwargs):
             func_id = id(func)
             recursion_depth[func_id] += 1
-            if recursion_depth[func_id] > Const.MAX_DEPTH:
+            if recursion_depth[func_id] > max_depth:
                 msg = f"call {func_info} exceeds the recursion limit."
                 logger.error_log_with_exp(
                     msg,
diff --git a/debug/accuracy_tools/msprobe/test/visualization_ut/graph/test_graph.py b/debug/accuracy_tools/msprobe/test/visualization_ut/graph/test_graph.py
index 81f9fdca527..f1c4ee95567 100644
--- a/debug/accuracy_tools/msprobe/test/visualization_ut/graph/test_graph.py
+++ b/debug/accuracy_tools/msprobe/test/visualization_ut/graph/test_graph.py
@@ -54,17 +54,6 @@ class TestGraph(unittest.TestCase):
         matched_node, ancestors = Graph.match(graph_a, graph_a.get_node("node_id_a_1"), graph_b)
         self.assertIsNotNone(matched_node)
         self.assertEqual(ancestors, ['node_id_a'])
-
-    def test_dfs(self):
-        graph = Graph("model_name")
-        graph.add_node(NodeOp.module, "node_a")
-        graph.add_node(NodeOp.module, "node_b")
-        node_a = BaseNode(self.node_op, self.node_id)
-        result = {}
-        graph.dfs(node_a, result)
-        self.assertEqual(result, {'node_id': {'id': 'node_id', 'node_type': 0, 'data': {},
-                                              'output_data': {}, 'input_data': {}, 'upnode': 'None', 'subnodes': [],
-                                              'matched_node_link': [], 'suggestions': {}, 'stack_info': []}})
         
     def test_split_nodes_by_micro_step(self):
         nodes = [BaseNode(NodeOp.module, 'a.forward.0'), BaseNode(NodeOp.module, 'a.backward.0'),
diff --git a/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py b/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
index 902d721a8d1..6882bef85e7 100644
--- a/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
+++ b/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
@@ -17,9 +17,9 @@ import re
 from msprobe.visualization.builder.msprobe_adapter import compare_node, get_compare_mode, run_real_data
 from msprobe.visualization.utils import GraphConst, load_json_file, load_data_json_file, get_csv_df
 from msprobe.visualization.graph.graph import Graph, NodeOp
-from msprobe.visualization.graph.node_colors import NodeColors
 from msprobe.visualization.compare.mode_adapter import ModeAdapter
 from msprobe.core.common.const import Const
+from msprobe.core.common.utils import recursion_depth_decorator
 
 
 class GraphComparator:
@@ -103,6 +103,7 @@ class GraphComparator:
                         else max(precision_index, api.data.get(GraphConst.JSON_INDEX_KEY, GraphConst.MIN_INDEX_KEY))
                 node.data[GraphConst.JSON_INDEX_KEY] = precision_index
 
+    @recursion_depth_decorator('GraphComparator._compare_nodes', max_depth=1000)
     def _compare_nodes(self, node_n):
         """
         递归遍历NPU树中的节点，如果在Bench中找到具有相同名称的节点，检查他们的祖先和参数信息，检查一致则及逆行精度数据对比
@@ -126,6 +127,7 @@ class GraphComparator:
         for subnode in node_n.subnodes:
             self._compare_nodes(subnode)
 
+    @recursion_depth_decorator('GraphComparator._compare_nodes_fuzzy', max_depth=1000)
     def _compare_nodes_fuzzy(self, node_n):
         if node_n.op != NodeOp.function_api:
             # 模块经过模糊匹配
diff --git a/debug/accuracy_tools/msprobe/visualization/graph/base_node.py b/debug/accuracy_tools/msprobe/visualization/graph/base_node.py
index 2642ff1e97e..fd1541b87bf 100644
--- a/debug/accuracy_tools/msprobe/visualization/graph/base_node.py
+++ b/debug/accuracy_tools/msprobe/visualization/graph/base_node.py
@@ -12,10 +12,11 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+
 from msprobe.core.overflow_check.level import OverflowLevel
-from msprobe.visualization.graph.node_op import NodeOp
 from msprobe.visualization.utils import GraphConst
 from msprobe.visualization.builder.msprobe_adapter import format_node_data, compare_data, compare_data_fuzzy
+from msprobe.core.common.log import logger
 
 
 class BaseNode:
@@ -114,7 +115,13 @@ class BaseNode:
         """
         ancestors = []
         current_node = self.upnode
+        seen_nodes = set()
         while current_node:
+            if current_node.id in seen_nodes:
+                logger.warning(f'Detected a cycle in the node structure and cannot get node ancestors, '
+                               f'current node is {current_node.id}.')
+                return []
+            seen_nodes.add(current_node.id)
             ancestors.append(current_node.id)
             current_node = current_node.upnode
         return list(reversed(ancestors))
diff --git a/debug/accuracy_tools/msprobe/visualization/graph/graph.py b/debug/accuracy_tools/msprobe/visualization/graph/graph.py
index 5ce12d1cadb..569d8ea21b5 100644
--- a/debug/accuracy_tools/msprobe/visualization/graph/graph.py
+++ b/debug/accuracy_tools/msprobe/visualization/graph/graph.py
@@ -19,7 +19,6 @@ from msprobe.visualization.utils import GraphConst
 from msprobe.core.common.log import logger
 from msprobe.core.common.const import Const
 
-
 MAX_RECUR_LEVEL = 100
 
 
@@ -67,7 +66,6 @@ class Graph:
         ancestors_b = node_b.get_ancestors()
         return node_b, ancestors_n, ancestors_b
 
-
     @staticmethod
     def fuzzy_match(node_n, node_b):
         if not node_n or not node_b or not node_n.fuzzy_eq(node_b):
@@ -76,13 +74,6 @@ class Graph:
         ancestors_b = node_b.get_ancestors()
         return node_b, ancestors_n, ancestors_b
 
-    @staticmethod
-    def dfs(node, result):
-        info = node.to_dict()
-        result[node.id] = info
-        for subnode in node.subnodes:
-            Graph.dfs(subnode, result)
-
     @staticmethod
     def split_nodes_by_micro_step(nodes):
         """
-- 
Gitee


From 48bd451e27826dacebf4817139e23ea390e98b8d Mon Sep 17 00:00:00 2001
From: curry3 <485078529@qq.com>
Date: Wed, 12 Mar 2025 11:43:12 +0800
Subject: [PATCH 115/145] =?UTF-8?q?=E3=80=90=E5=AE=89=E5=85=A8=E3=80=91?=
 =?UTF-8?q?=E5=A2=9E=E5=8A=A0=E5=87=BD=E6=95=B0=E9=80=92=E5=BD=92=E6=B7=B1?=
 =?UTF-8?q?=E5=BA=A6=E5=88=A4=E6=96=AD=E5=92=8C=E5=8F=8D=E5=90=91hook?=
 =?UTF-8?q?=E6=A2=AF=E5=BA=A6=E5=88=A4=E6=96=AD?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/pytorch/dump/module_dump/module_processer.py    | 2 ++
 .../msprobe/pytorch/hook_module/hook_module.py              | 6 +++++-
 2 files changed, 7 insertions(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_processer.py b/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_processer.py
index b5ca1da461f..0cfb86629ba 100644
--- a/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_processer.py
+++ b/debug/accuracy_tools/msprobe/pytorch/dump/module_dump/module_processer.py
@@ -17,6 +17,7 @@ from functools import wraps
 
 import torch
 from msprobe.core.common.const import Const
+from msprobe.core.common.utils import recursion_depth_decorator
 from msprobe.core.data_dump.scope import BaseScope, ModuleRangeScope, MixRangeScope
 from msprobe.pytorch.common.log import logger
 from msprobe.pytorch.common.utils import replace_last_occurrence
@@ -58,6 +59,7 @@ class ModuleProcesser:
         return clone_return_value_func
 
     @staticmethod
+    @recursion_depth_decorator("ModuleDump: ModuleProcesser.clone_if_tensor")
     def clone_if_tensor(result):
         if isinstance(result, torch.Tensor):
             return result.clone()
diff --git a/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py b/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
index 71dbfa8aeb1..1eba9897b08 100644
--- a/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
+++ b/debug/accuracy_tools/msprobe/pytorch/hook_module/hook_module.py
@@ -1,4 +1,4 @@
-# Copyright (c) 2024-2024, Huawei Technologies Co., Ltd.
+# Copyright (c) 2024-2025, Huawei Technologies Co., Ltd.
 # All rights reserved.
 #
 # Licensed under the Apache License, Version 2.0  (the "License");
@@ -110,6 +110,10 @@ class HOOKModule(nn.Module):
                         return result
                 else:
                     return result
+
+            if not (var.requires_grad and torch.is_grad_enabled()):
+                return result
+
             grad_fn = var.grad_fn
             if grad_fn is not None:
                 for hook in non_full_backward_hooks:
-- 
Gitee


From 9ef7de08d8b55b829a4d9a8be69fe610c4d849da Mon Sep 17 00:00:00 2001
From: fanglanyue <fanglanyue@huawei.com>
Date: Wed, 12 Mar 2025 11:55:22 +0800
Subject: [PATCH 116/145] add new reviewers

---
 OWNERS | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/OWNERS b/OWNERS
index 415d737ed90..775490f4b70 100644
--- a/OWNERS
+++ b/OWNERS
@@ -20,4 +20,6 @@ reviewers:
 - TAJh
 - czr9775
 - kali20gakki
-- wjchuee
\ No newline at end of file
+- wjchuee
+- chenhao_1209
+- feng123www
\ No newline at end of file
-- 
Gitee


From 64584b13cf818bf28b136dfd3f842aa71a831716 Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Wed, 12 Mar 2025 14:09:11 +0800
Subject: [PATCH 117/145] fix cleancode

---
 .../api_accuracy_checker/tensor_transport_layer/attl.py     | 6 +++---
 .../msprobe/pytorch/online_dispatch/dump_compare.py         | 2 +-
 .../accuracy_tools/msprobe/pytorch/online_dispatch/utils.py | 6 +++---
 3 files changed, 7 insertions(+), 7 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
index 64a44699a89..236c87b1105 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
@@ -176,17 +176,17 @@ def move2device_exec(obj, device, depth=0):
         logger.error("Maximum recursion depth exceeded")
         raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
     if isinstance(obj, (tuple, list)):
-        data_list = [move2device_exec(val, device, depth = depth + 1) for val in obj]
+        data_list = [move2device_exec(val, device, depth=depth + 1) for val in obj]
         return data_list if isinstance(obj, list) else tuple(data_list)
     if isinstance(obj, dict): 
-        return {key: move2device_exec(val, device, depth = depth + 1) for key, val in obj.items()}
+        return {key: move2device_exec(val, device, depth=depth + 1) for key, val in obj.items()}
     elif isinstance(obj, torch.Tensor):
         obj = obj.detach()
         if obj.device.type != device:
             obj = obj.to(device)
         return obj
     elif "return_types" in str(type(obj)):
-        return move2device_exec(tuple(obj), device, depth = depth + 1)
+        return move2device_exec(tuple(obj), device, depth=depth + 1)
     elif isinstance(obj, torch._C.device):
         return torch.device(device)
     else:
diff --git a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
index 76737b8cb05..810f1ea2756 100644
--- a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
+++ b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
@@ -99,7 +99,7 @@ def dump_data(data, prefix, dump_path, depth=0):
         raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
     if isinstance(data, (tuple, list)) and data:
         for i, item in enumerate(data):
-            dump_data(item, "{}.{}".format(prefix, i), dump_path, depth = depth + 1)
+            dump_data(item, "{}.{}".format(prefix, i), dump_path, depth=depth + 1)
         return
     elif support_basic_type(data):
         if isinstance(data, torch.Tensor) and data.is_meta:
diff --git a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
index 72037287de0..e25f15e587f 100644
--- a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
@@ -106,13 +106,13 @@ def data_to_cpu(data, deep, data_cpu, depth=0):
         return tensor_copy
     elif isinstance(data, list):
         for v in data:
-            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth = depth + 1))
+            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth=depth + 1))
         if deep == 0:
             data_cpu.append(list_cpu)
         return list_cpu
     elif isinstance(data, tuple):
         for v in data:
-            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth = depth + 1))
+            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth=depth + 1))
         tuple_cpu = tuple(list_cpu)
         if deep == 0:
             data_cpu.append(tuple_cpu)
@@ -120,7 +120,7 @@ def data_to_cpu(data, deep, data_cpu, depth=0):
     elif isinstance(data, dict):
         dict_cpu = {}
         for k, v in data.items():
-            dict_cpu[k] = data_to_cpu(v, deep + 1, data_cpu, depth = depth + 1)
+            dict_cpu[k] = data_to_cpu(v, deep + 1, data_cpu, depth=depth + 1)
         if deep == 0:
             data_cpu.append(dict_cpu)
         return dict_cpu
-- 
Gitee


From 2956b2225b483b4076277afcb6eff44332b50ddb Mon Sep 17 00:00:00 2001
From: l30044004 <louyujing@huawei.com>
Date: Wed, 12 Mar 2025 14:32:06 +0800
Subject: [PATCH 118/145] =?UTF-8?q?=E5=88=86=E7=BA=A7=E5=8F=AF=E8=A7=86?=
 =?UTF-8?q?=E5=8C=96=E9=80=92=E5=BD=92=E9=99=90=E5=88=B6=E6=B7=B1=E5=BA=A6?=
 =?UTF-8?q?=EF=BC=8C=E6=A3=80=E6=B5=8B=E6=88=90=E7=8E=AF?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../visualization/compare/graph_comparator.py | 74 +++++++++----------
 1 file changed, 37 insertions(+), 37 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py b/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
index 6882bef85e7..2ac508e548f 100644
--- a/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
+++ b/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
@@ -41,7 +41,7 @@ class GraphComparator:
         else:
             self._compare_nodes(self.graph_n.root)
         self._postcompare()
-    
+
     def add_compare_result_to_node(self, node, compare_result_list):
         """
         将比对结果添加到节点的输入输出数据中
@@ -66,42 +66,6 @@ class GraphComparator:
             self.ma.parse_result(node, [compare_in_dict, compare_out_dict]))
         node.data[GraphConst.JSON_INDEX_KEY] = precision_index
         node.data.update(other_dict)
-    
-    def _parse_param(self, dump_path_param, output_path):
-        self.dump_path_param = dump_path_param
-        self.output_path = output_path
-        compare_mode = get_compare_mode(self.dump_path_param)
-        self.ma = ModeAdapter(compare_mode)
-        self.data_n_dict = load_data_json_file(dump_path_param.get('npu_json_path'))
-        self.data_b_dict = load_data_json_file(dump_path_param.get('bench_json_path'))
-        self.stack_json_data = load_json_file(dump_path_param.get('stack_json_path'))
-
-    def _postcompare(self):
-        self._handle_api_collection_index()
-        if not self.ma.compare_mode == GraphConst.REAL_DATA_COMPARE:
-            return
-        df = get_csv_df(True, self.ma.csv_data, self.ma.compare_mode)
-        df = run_real_data(self.dump_path_param, df, self.framework, True if self.mapping_dict else False)
-        compare_data_dict = {row[0]: row.tolist() for _, row in df.iterrows()}
-        for node in self.ma.compare_nodes:
-            precision_index, _ = self.ma.parse_result(node, [compare_data_dict])
-            node.data[GraphConst.JSON_INDEX_KEY] = precision_index
-
-    def _handle_api_collection_index(self):
-        """
-        api集合的指标, md5模式使用集合中所有api最小的指标，statistics和tensor模式使用集合中所有api最大的指标
-        md5模式下指标为0代表最差，statistics和tensor模式下指标为1代表最差
-        """
-        for node in self.graph_n.root.subnodes:
-            if node.op == NodeOp.api_collection:
-                precision_index = GraphConst.MAX_INDEX_KEY if self.ma.compare_mode == GraphConst.MD5_COMPARE \
-                    else GraphConst.MIN_INDEX_KEY
-                for api in node.subnodes:
-                    precision_index = min(precision_index,
-                                          api.data.get(GraphConst.JSON_INDEX_KEY, GraphConst.MAX_INDEX_KEY)) \
-                        if self.ma.compare_mode == GraphConst.MD5_COMPARE \
-                        else max(precision_index, api.data.get(GraphConst.JSON_INDEX_KEY, GraphConst.MIN_INDEX_KEY))
-                node.data[GraphConst.JSON_INDEX_KEY] = precision_index
 
     @recursion_depth_decorator('GraphComparator._compare_nodes', max_depth=1000)
     def _compare_nodes(self, node_n):
@@ -148,6 +112,42 @@ class GraphComparator:
         for sub_node in node_n.subnodes:
             self._compare_nodes_fuzzy(sub_node)
 
+    def _parse_param(self, dump_path_param, output_path):
+        self.dump_path_param = dump_path_param
+        self.output_path = output_path
+        compare_mode = get_compare_mode(self.dump_path_param)
+        self.ma = ModeAdapter(compare_mode)
+        self.data_n_dict = load_data_json_file(dump_path_param.get('npu_json_path'))
+        self.data_b_dict = load_data_json_file(dump_path_param.get('bench_json_path'))
+        self.stack_json_data = load_json_file(dump_path_param.get('stack_json_path'))
+
+    def _postcompare(self):
+        self._handle_api_collection_index()
+        if not self.ma.compare_mode == GraphConst.REAL_DATA_COMPARE:
+            return
+        df = get_csv_df(True, self.ma.csv_data, self.ma.compare_mode)
+        df = run_real_data(self.dump_path_param, df, self.framework, True if self.mapping_dict else False)
+        compare_data_dict = {row[0]: row.tolist() for _, row in df.iterrows()}
+        for node in self.ma.compare_nodes:
+            precision_index, _ = self.ma.parse_result(node, [compare_data_dict])
+            node.data[GraphConst.JSON_INDEX_KEY] = precision_index
+
+    def _handle_api_collection_index(self):
+        """
+        api集合的指标, md5模式使用集合中所有api最小的指标，statistics和tensor模式使用集合中所有api最大的指标
+        md5模式下指标为0代表最差，statistics和tensor模式下指标为1代表最差
+        """
+        for node in self.graph_n.root.subnodes:
+            if node.op == NodeOp.api_collection:
+                precision_index = GraphConst.MAX_INDEX_KEY if self.ma.compare_mode == GraphConst.MD5_COMPARE \
+                    else GraphConst.MIN_INDEX_KEY
+                for api in node.subnodes:
+                    precision_index = min(precision_index,
+                                          api.data.get(GraphConst.JSON_INDEX_KEY, GraphConst.MAX_INDEX_KEY)) \
+                        if self.ma.compare_mode == GraphConst.MD5_COMPARE \
+                        else max(precision_index, api.data.get(GraphConst.JSON_INDEX_KEY, GraphConst.MIN_INDEX_KEY))
+                node.data[GraphConst.JSON_INDEX_KEY] = precision_index
+
     def _get_and_add_result(self, node_n, node_b):
         compare_result_list = compare_node([node_n.id, node_b.id],
                                            [self.data_n_dict, self.data_b_dict],
-- 
Gitee


From 5307bc245f7e77b22aeb0c33181a109932c68389 Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Wed, 12 Mar 2025 15:14:46 +0800
Subject: [PATCH 119/145] fix ut

---
 .../pytorch_ut/api_accuracy_checker/run_ut/test_multi_run_ut.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/api_accuracy_checker/run_ut/test_multi_run_ut.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/api_accuracy_checker/run_ut/test_multi_run_ut.py
index 1ad191a0d4e..8eb8fde4fdc 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/api_accuracy_checker/run_ut/test_multi_run_ut.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/api_accuracy_checker/run_ut/test_multi_run_ut.py
@@ -136,7 +136,7 @@ class TestMultiRunUT(unittest.TestCase):
 
     def setUp(self):
         self.test_json_file = os.path.join(os.path.dirname(os.path.realpath(__file__)), "dump.json")
-        self.test_data = {'data': {'key1': 'TRUE', 'key2': 'TRUE', 'key3': 'TRUE'}}
+        self.test_data = {'dump_data_dir': '/test', 'data': {'key1': 'TRUE', 'key2': 'TRUE', 'key3': 'TRUE'}}
         self.test_json_content = json.dumps(self.test_data)
         self.forward_split_files_content = [
             {'key1': 'TRUE', 'key2': 'TRUE'},
-- 
Gitee


From 14674e714cb5c8d446c74cc27f4f574544e2d932 Mon Sep 17 00:00:00 2001
From: eveyin <qianyin2022@hotmail.com>
Date: Wed, 12 Mar 2025 15:23:54 +0800
Subject: [PATCH 120/145] move flight recorder

---
 .../analysis_flight.py                        | 164 -----------------
 .../flight_recorder_analyze/check_path.py     |  81 ---------
 .../flight_recorder.md                        |  49 ------
 flight_recorder/test/__init__.py              |   0
 flight_recorder/test/run_st.py                |  94 ----------
 flight_recorder/test/run_ut.sh                |  53 ------
 flight_recorder/test/st/__init__.py           |   0
 flight_recorder/test/st/utils.py              |  63 -------
 .../test/ut/test_analysis_flight.py           | 165 ------------------
 flight_recorder/test/ut/test_check_path.py    | 133 --------------
 10 files changed, 802 deletions(-)
 delete mode 100644 flight_recorder/flight_recorder_analyze/analysis_flight.py
 delete mode 100644 flight_recorder/flight_recorder_analyze/check_path.py
 delete mode 100644 flight_recorder/flight_recorder_analyze/flight_recorder.md
 delete mode 100644 flight_recorder/test/__init__.py
 delete mode 100644 flight_recorder/test/run_st.py
 delete mode 100644 flight_recorder/test/run_ut.sh
 delete mode 100644 flight_recorder/test/st/__init__.py
 delete mode 100644 flight_recorder/test/st/utils.py
 delete mode 100644 flight_recorder/test/ut/test_analysis_flight.py
 delete mode 100644 flight_recorder/test/ut/test_check_path.py

diff --git a/flight_recorder/flight_recorder_analyze/analysis_flight.py b/flight_recorder/flight_recorder_analyze/analysis_flight.py
deleted file mode 100644
index f81f771ab1c..00000000000
--- a/flight_recorder/flight_recorder_analyze/analysis_flight.py
+++ /dev/null
@@ -1,164 +0,0 @@
-# Copyright (c) 2025, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-# Copyright Huawei Technologies Co., Ltd. 2024-2025. All rights reserved.
-
-import os
-import pickle
-import sys
-import logging
-from collections import defaultdict
-
-from check_path import get_valid_read_path
-
-
-logging.basicConfig(
-    level=logging.INFO,  # 设置日志级别为 INFO
-    format="%(asctime)s - %(levelname)s - %(message)s",  # 设置日志格式
-    handlers=[logging.StreamHandler()],  # 输出到控制台
-)
-
-
-SAFE_CLASSES = {
-    # 内置安全类型
-    "builtins": {"str", "int", "float", "list", "dict", "tuple"},
-}
-
-
-class SafeUnpickler(pickle.Unpickler):
-    def find_class(self, module, name):
-        # 检查模块和类是否在白名单中
-        if module in SAFE_CLASSES and name in SAFE_CLASSES[module]:
-            return super().find_class(module, name)
-        raise pickle.UnpicklingError(f"Forbidden class: {module}.{name}")
-
-
-def load_recorder_data(path, world_size):
-    """加载所有 rank 的 recorder 数据"""
-    recorder_dict = {}
-    for rank in range(world_size):
-        file_path = os.path.join(path, str(rank)) if not path.endswith("/") else path + str(rank)
-        file_path = get_valid_read_path(file_path)
-        try:
-            with open(file_path, "rb") as f:
-                res = SafeUnpickler(f).load()
-                recorder_dict[str(rank)] = res
-        except Exception as e:
-            logging.error(f"Failed to load data from {file_path}: {e}")
-    return recorder_dict
-
-
-def extract_hccl_info(recorder_dict):
-    """从 recorder 数据中提取 HCCL 相关信息"""
-    hccl_dict = {}
-    for rank, recorder in recorder_dict.items():
-        entries = recorder.get("entries", [])
-        if not entries:
-            continue
-        last_entry = entries[-1]
-        hccl_dict[rank] = {
-            "state": last_entry.get("state", None),
-            "record_id": last_entry.get("record_id", None),
-            "pg_id": last_entry.get("pg_id", None),
-            "time_discovered_completed_ns": last_entry.get("time_discovered_completed_ns", None),
-            "name": last_entry.get("frames", [{}])[0].get("name", None),
-        }
-    return hccl_dict
-
-
-def analyze_pg_groups(hccl_dict):
-    """分析 HCCL 数据，按 pg_id 分组并检查问题"""
-    pg_groups = defaultdict(list)
-    for _, op in hccl_dict.items():
-        pg_groups[op["pg_id"]].append(op)
-
-    for pg_id, group in pg_groups.items():
-        scheduled_ops = [op for op in group if op["state"] == "scheduled"]
-        completed_ops = [op for op in group if op["state"] == "completed"]
-
-        # 情况 1: 所有卡都是 scheduled，且 record_id 和 name 相同
-        if len(scheduled_ops) == len(group):
-            record_id = scheduled_ops[0]["record_id"]
-            name = scheduled_ops[0]["name"]
-            all_same = all(op["record_id"] == record_id and op["name"] == name for op in scheduled_ops)
-            if all_same:
-                logging.info(
-                    f"The pg_id {pg_id}'s Communication Operator {name}"
-                    " executed too slowly, causing the HCCL to time out."
-                )
-
-        # 情况 2: 存在 completed 算子且 该算子的record_id 比其他 scheduled 算子少 1
-        elif completed_ops and scheduled_ops:
-            completed_op = completed_ops[0]
-            scheduled_record_id = scheduled_ops[0]["record_id"]
-            if completed_op["record_id"] == scheduled_record_id - 1:
-                logging.info(
-                    f"The pg_id {pg_id}'s rank {completed_op['pg_id']}'s "
-                    "Computational task took too long, causing the other ranks' "
-                    "HCCL task to time out."
-                )
-
-        # 情况 3: 所有算子均为 completed
-        elif not scheduled_ops and completed_ops:
-            latest_op = max(completed_ops, key=lambda x: x["time_discovered_completed_ns"] or 0)
-            logging.info(
-                f"The computational task of the pg_id {pg_id} "
-                f"after the communication operator {latest_op['name']} " 
-                "took too long."
-            )
-
-        else:
-            logging.info(f"The situation cannot be recognized!")
-
-
-def get_int_arg(args, idx, default):
-    if len(args) > idx:
-        try:
-            return int(args[idx])
-        except ValueError:
-            logging.warning(f"Invalid input {args[idx]}, using default: {default}")
-    return default
-
-
-def main():
-    # 设置默认值
-    default_path = os.getenv("TORCH_HCCL_DEBUG_INFO_TEMP_FILE")
-    default_world_size = 8
-
-    # 获取命令行参数，如果未提供则使用默认值
-    path = sys.argv[1] if len(sys.argv) > 1 else default_path
-    world_size = get_int_arg(sys.argv, 2, default_world_size)
-
-    if not path:
-        raise ValueError("Path is required and cannot be empty.")
-
-    logging.info(f"Path: {path}")
-    logging.info(f"World Size: {world_size}")
-
-    # 加载数据
-    recorder_dict = load_recorder_data(path, world_size)
-    if not recorder_dict:
-        logging.error("No valid recorder data found.")
-        return
-
-    # 提取 HCCL 信息
-    hccl_dict = extract_hccl_info(recorder_dict)
-
-    # 分析 HCCL 数据
-    analyze_pg_groups(hccl_dict)
-
-
-if __name__ == "__main__":
-    main()
\ No newline at end of file
diff --git a/flight_recorder/flight_recorder_analyze/check_path.py b/flight_recorder/flight_recorder_analyze/check_path.py
deleted file mode 100644
index b34e4dcdb68..00000000000
--- a/flight_recorder/flight_recorder_analyze/check_path.py
+++ /dev/null
@@ -1,81 +0,0 @@
-# Copyright (c) 2025, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import re
-import os
-import sys
-import stat
-
-
-PATH_WHITE_LIST_REGEX = re.compile(r"[^_A-Za-z0-9/.-]")
-MAX_READ_FILE_SIZE_4G = 4294967296  # 4G, 4 * 1024 * 1024 * 1024
-MAX_READ_FILE_SIZE_32G = 34359738368  # 32G, 32 * 1024 * 1024 * 1024
-MAX_READ_FILE_SIZE_512G = 549755813888  # 512G, 512 * 1024 * 1024 * 1024
-
-# group not writable, others no permission, max stat is 750
-WRITE_FILE_NOT_PERMITTED_STAT = stat.S_IWGRP | stat.S_IWOTH | stat.S_IROTH | stat.S_IXOTH
-# group not writable, others not writable, max stat is 755
-READ_FILE_NOT_PERMITTED_STAT = stat.S_IWGRP | stat.S_IWOTH
-
-
-def type_to_str(value_type):
-    return ' or '.join([ii.__name__ for ii in value_type]) if isinstance(value_type, tuple) else value_type.__name__
-
-
-def check_type(value, value_type, param_name="value"):
-    if not isinstance(value, value_type):
-        raise TypeError('{} must be {}, not {}.'.format(param_name, type_to_str(value_type), type(value).__name__))
-    
-
-def get_valid_path(path):
-    check_type(path, str, "path")
-    if not path or len(path) == 0:
-        raise ValueError("The value of the path cannot be empty.")
-    if PATH_WHITE_LIST_REGEX.search(path):  # Check special char
-        raise ValueError("Input path contains invalid characters.")  # Not printing out the path value for invalid char
-    path = os.path.expanduser(path) # Consider paths starting with "~"
-    if os.path.islink(os.path.abspath(path)):  # when checking link, get rid of the "/" at the path tail if any
-        raise ValueError("The value of the path cannot be soft link: {}.".format(path))
-
-    real_path = os.path.realpath(path)
-
-    if len(real_path) > 4096:
-        raise ValueError("The length of file path should be less than 4096.")
-
-    if real_path != path and PATH_WHITE_LIST_REGEX.search(real_path):  # Check special char again
-        raise ValueError("Input path contains invalid characters.")  # Not printing out the path value for invalid char
-
-    return real_path
-
-
-def is_belong_to_user_or_group(file_stat):
-    return file_stat.st_uid == os.getuid() or file_stat.st_gid in os.getgroups()
-
-
-def get_valid_read_path(path, size_max=MAX_READ_FILE_SIZE_4G, check_user_stat=True, is_dir=False):
-    real_path = get_valid_path(path)
-    if not os.path.isfile(real_path):
-        raise ValueError("The path {} doesn't exists or not a file.".format(path))
-
-    file_stat = os.stat(real_path)
-    if check_user_stat and not sys.platform.startswith("win") and not is_belong_to_user_or_group(file_stat):
-        raise ValueError("The file {} doesn't belong to the current user or group.".format(path))
-    if check_user_stat and os.stat(path).st_mode & READ_FILE_NOT_PERMITTED_STAT > 0:
-        raise ValueError("The file {} is group writable, or is others writable.".format(path))
-    if not os.access(real_path, os.R_OK) or file_stat.st_mode & stat.S_IRUSR == 0:  # At least been 400
-        raise ValueError("Current user doesn't have read permission to the file {}.".format(path))
-    if not is_dir and size_max > 0 and file_stat.st_size > size_max:
-        raise ValueError("The file {} exceeds size limitation of {}.".format(path, size_max))
-    return real_path
\ No newline at end of file
diff --git a/flight_recorder/flight_recorder_analyze/flight_recorder.md b/flight_recorder/flight_recorder_analyze/flight_recorder.md
deleted file mode 100644
index 8b398a6730b..00000000000
--- a/flight_recorder/flight_recorder_analyze/flight_recorder.md
+++ /dev/null
@@ -1,49 +0,0 @@
-# 飞行记录器超时类问题分析
-
-训练任务卡住是阻塞AI大规模分布式集群训练任务的主要和关键问题，当前需要等待集合通信超时才能感知，影响集群可用性。框架需要支持检测训练任务卡住问题，做到提前识别并保存必要的诊断信息，提高问题定位效率和集群设备可用性。当HeartbeatMonitor长时间未检测到心跳时，即可认为训练任务已经卡住，需要触发诊断信息保存。
-
-本工具提供torch npu上飞行记录器flight recorder记录日志的读取解析能力，并根据解析后的日志提供超时类问题的初步分析能力，主要支持以下三种情况的超时类问题的识别和分析
-
-|问题| 具体内容 | 
-| --- | --- |
-|类型一  | 同通信域内的某张卡计算超时，导致其他卡等待触发飞行记录器和hccl time out | 
-|类型二  | 同通信域内的通信算子之后的非通信任务耗时过长|
-|类型三  | 同通信域内的某个通信算子进行通信时执行超时 |
-
-## 使用方法
-
-### 1 飞行记录器开启方法
-
-按照如下方法设置环境变量开启飞行记录器
-
-```
-export TORCH_HCCL_ENABLE_MONITORING=1 #用于检测是否开启卡住问题检测
-export TORCH_HCCL_DUMP_ON_TIMEOUT=1 # 用于控制是否保存诊断信息
-export TORCH_HCCL_TRACE_BUFFER_SIZE=1 # 用于控制保存的集合通信状态数量
-export TORCH_HCCL_HEARTBEAT_TIMEOUT_SEC=20 # 用于控制心跳超时时间，即训练业务多久未下发集合通信算子时需要判定为卡住，默认10分钟，单位s。（需要小于HCCL_EXEC_TIMEOUT，避免集合通信先报超时错误）
-export TORCH_HCCL_DEBUG_INFO_TEMP_FILE=/tmp/  #保存诊断信息的文件路径
-```
-
-### 2 工具使用方法
-
-```
-python analysis_flight.py path world_size
-```
-
-脚本从命令行参数获取 `path` 和 `world_size` 的值，并记录日志。如果未提供命令行参数，则使用默认值。
-
-* `path`：从命令行第一个参数获取，如果未提供则使用 `default_path`, default_path从TORCH_HCCL_DEBUG_INFO_TEMP_FILE获取。
-* `world_size`：从命令行第二个参数获取，如果未提供则使用 `default_world_size`，默认为8。
-
-| 参数名| 含义 | 使用限制 |
-| --- | --- | --- | 
-| path | 飞行记录器的日志 | 可选。数据类型：string 默认为环境变量中的TORCH_HCCL_DEBUG_INFO_TEMP_FILE,若设置日志格式指定有前缀，则需要在路径中加入前缀 | 
-| world_size | 同一个通信域中的卡数 | 可选。数据类型：int 默认为8 |
-
-### 3 输出示例
-
-```
-2025-02-19 08:10:07,160 - INFO - Path: /tmp/
-2025-02-19 08:10:07,160 - INFO - World Size: 8
-2025-02-19 08:10:07,162 - INFO - The pg_id 0's rank 0's Computational task took too long, causing the other ranks' HCCL task to time out.
-```
diff --git a/flight_recorder/test/__init__.py b/flight_recorder/test/__init__.py
deleted file mode 100644
index e69de29bb2d..00000000000
diff --git a/flight_recorder/test/run_st.py b/flight_recorder/test/run_st.py
deleted file mode 100644
index b6345d7c9a5..00000000000
--- a/flight_recorder/test/run_st.py
+++ /dev/null
@@ -1,94 +0,0 @@
-# Copyright (c) 2025-2025 Huawei Technologies Co., Ltd.
-
-import datetime
-import logging
-import os
-import subprocess
-import sys
-import threading
-
-stop_print_thread = False
-
-
-def print_stout(output):
-    while True:
-        line = output.readline().strip()
-        if line:
-            logging.info(line)
-        global stop_print_thread
-        if stop_print_thread:
-            break
-
-
-def stop_stout_threads(thread_list):
-    global stop_print_thread
-    stop_print_thread = True
-    for stout_thread in thread_list:
-        if stout_thread.is_alive():
-            stout_thread.join()
-
-
-def start_st_process(module_name):
-    st_path = os.path.join(os.path.abspath(os.path.dirname(__file__)), "st", module_name)
-    cmd = ["python3", "-m", "pytest", "-s", st_path]
-    process = subprocess.Popen(cmd, shell=False, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
-    stout_thread = threading.Thread(target=print_stout, args=(process.stdout,))
-    stout_thread.start()
-    return process, stout_thread
-
-
-def stop_st_process(process_list):
-    for process in process_list:
-        if process.poll() is None:
-            process.terminate()
-            process.wait()
-
-
-def run_st(module_choice):
-    timeout = 3600
-    modules = ["flight_recorder_analyze"]
-    if module_choice != "all":
-        modules = [module_choice]
-    process_list = []
-    thread_list = []
-    for module in modules:
-        process, stout_thread = start_st_process(module)
-        process_list.append(process)
-        thread_list.append(stout_thread)
-
-    success, failed = True, False
-    start_time = datetime.datetime.utcnow()
-    while process_list:
-        duration = datetime.datetime.utcnow() - start_time
-        if duration.total_seconds() >= timeout:
-            logging.error("run st use case timeout.")
-            stop_stout_threads(thread_list)
-            stop_st_process(process_list)
-            return failed
-        for process in process_list:
-            if process.poll() is None:
-                continue
-            if process.returncode == 0:
-                process_list.remove(process)
-                continue
-            stop_stout_threads(thread_list)
-            stop_st_process(process_list)
-            return failed
-    stop_stout_threads(thread_list)
-    return success
-
-
-if __name__ == "__main__":
-    logging.basicConfig(level=logging.INFO, format='%(levelname)s: %(message)s')
-    if '--module' in sys.argv:
-        module_index = sys.argv.index("--module") + 1
-        module = sys.argv[module_index]
-    else:
-        module = "all"
-    st_success = run_st(module)
-    if st_success:
-        logging.info("run st successfully.")
-        sys.exit(0)
-    else:
-        logging.error("run st failed.")
-        sys.exit(1)
\ No newline at end of file
diff --git a/flight_recorder/test/run_ut.sh b/flight_recorder/test/run_ut.sh
deleted file mode 100644
index 4af24e2a952..00000000000
--- a/flight_recorder/test/run_ut.sh
+++ /dev/null
@@ -1,53 +0,0 @@
-#!/bin/bash
-# This script is used to run ut and st testcase.
-# Copyright Huawei Technologies Co., Ltd. 2025-2025. All rights reserved.
-set -eo pipefail
-
-CUR_DIR=$(dirname $(readlink -f $0))
-TOP_DIR=$(readlink -f ${CUR_DIR}/..)
-TEST_DIR=${TOP_DIR}/"test"
-SRC_DIR=${TOP_DIR}/"src"
-ret=0
-
-clean() {
-  cd ${TEST_DIR}
-  if [ -e ${TEST_DIR}/coverage.xml ]; then
-    rm coverage.xml
-    echo "remove last coverage.xml success"
-  fi
-  cd -
-}
-
-run_test_cpp() {
-  echo "C++ tests are not implemented yet."
-  # 待实现：编译并运行C++测试
-  # build_cpp && run_cpp_tests
-}
-
-run_test_python() {
-  python3 --version
-  export PYTHONPATH="${TOP_DIR}:${PYTHONPATH}"
-  python3 -m coverage run --branch --source ${TOP_DIR}/'flight_recorder_analyze' -m pytest ${TEST_DIR}/ut
-
-  if [ $? -ne 0 ]; then
-    echo "UT Failure"
-    exit 1
-  fi
-
-  python3 -m coverage report -m
-  python3 -m coverage xml -o ${TEST_DIR}/coverage.xml
-}
-
-run_test() {
-  run_test_cpp
-  run_test_python
-}
-
-main() {
-  cd ${TEST_DIR}
-  clean
-  run_test
-  echo "UT Success"
-}
-
-main
\ No newline at end of file
diff --git a/flight_recorder/test/st/__init__.py b/flight_recorder/test/st/__init__.py
deleted file mode 100644
index e69de29bb2d..00000000000
diff --git a/flight_recorder/test/st/utils.py b/flight_recorder/test/st/utils.py
deleted file mode 100644
index cccdaaf607d..00000000000
--- a/flight_recorder/test/st/utils.py
+++ /dev/null
@@ -1,63 +0,0 @@
-# Copyright (c) 2025-2025 Huawei Technologies Co., Ltd.
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import subprocess
-import logging
-
-COMMAND_SUCCESS = 0
-
-
-def execute_cmd(cmd):
-    logging.info('Execute command:%s' % " ".join(cmd))
-    completed_process = subprocess.run(cmd, shell=False, stderr=subprocess.PIPE)
-    if completed_process.returncode != COMMAND_SUCCESS:
-        logging.error(completed_process.stderr.decode())
-    return completed_process.returncode
-
-
-def check_column_actual(actual_columns, expected_columns, context):
-    """检查实际列名是否与预期列名一致"""
-    missing = set(expected_columns) - set(actual_columns)  # O(n + m)
-    for col in missing:
-        logging.error(f"在 {context} 中未找到预期列名: {col}")
-    return len(missing) == 0
-
-
-def check_row(df, expected_columns, numeric_columns):
-    """检查数据框中Metric列数据类型和指定列数据是否为数字"""
-    # 检查Metric列的数据类型是否为字符串
-    for row_index in df.index:
-        try:
-            value = df.at[row_index, 'Metric']
-            if not isinstance(value, str):
-                logging.error(f"在Metric列的第{row_index}行，值 '{value}' 不是字符串类型")
-                return False
-        except KeyError:
-            logging.error(f"数据框中不存在 'Metric' 列")
-            return False
-
-    # 检查其他列的数据是否为数字
-    for column in numeric_columns:
-        if column not in df.columns:
-            logging.error(f"数据框中不存在 {column} 列")
-            continue
-        for row_index in df.index:
-            try:
-                cell_value = df.at[row_index, column]
-                float(cell_value)
-            except (ValueError, KeyError):
-                logging.error(
-                    f"在 {column} 列的第 {row_index} 行，值 {cell_value} 不是有效的数字")
-                return False
-    return True
\ No newline at end of file
diff --git a/flight_recorder/test/ut/test_analysis_flight.py b/flight_recorder/test/ut/test_analysis_flight.py
deleted file mode 100644
index 5ab82f50158..00000000000
--- a/flight_recorder/test/ut/test_analysis_flight.py
+++ /dev/null
@@ -1,165 +0,0 @@
-# Copyright (c) 2025, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-import shutil
-import pickle
-
-from unittest.mock import patch
-
-import pytest
-
-from flight_recorder.flight_recorder_analyze.analysis_flight import (
-    load_recorder_data,
-    extract_hccl_info,
-    analyze_pg_groups,
-    main,
-    SafeUnpickler,
-)
-
-
-WORLD_SIZE = 2
-TEST_FLIGHT_RECORDER_PATH = "./test_fight_recorder_file"
-
-
-class UmaskWrapper:
-    """Write with preset umask
-    >>> with UmaskWrapper():
-    >>>     ...
-    """
-
-    def __init__(self, umask=0o027):
-        self.umask, self.ori_umask = umask, None
-
-    def __enter__(self):
-        self.ori_umask = os.umask(self.umask)
-
-    def __exit__(self, exc_type=None, exc_val=None, exc_tb=None):
-        os.umask(self.ori_umask)
-
-
-TEST_RECORDER_DATA = {
-    "entries": [
-        {
-            "state": "scheduled",
-            "record_id": 1,
-            "pg_id": "pg1",
-            "time_discovered_completed_ns": 1000,
-            "frames": [{"name": "op1"}],
-        },
-        {
-            "state": "completed",
-            "record_id": 2,
-            "pg_id": "pg1",
-            "time_discovered_completed_ns": 2000,
-            "frames": [{"name": "op2"}],
-        },
-    ]
-}
-
-
-@pytest.fixture
-def temp_dir():
-    """创建一个临时目录，并在其中生成模拟的 recorder 数据文件。"""
-    with UmaskWrapper():
-        os.mkdir(TEST_FLIGHT_RECORDER_PATH)
-    for rank in range(WORLD_SIZE):
-        file_path = os.path.join(TEST_FLIGHT_RECORDER_PATH, str(rank))
-        with UmaskWrapper():
-            with open(file_path, "wb") as f:
-                pickle.dump(TEST_RECORDER_DATA, f)
-    yield TEST_FLIGHT_RECORDER_PATH
-
-    if os.path.exists(TEST_FLIGHT_RECORDER_PATH):
-        shutil.rmtree(TEST_FLIGHT_RECORDER_PATH)
-
-
-def test_main(temp_dir):
-    with patch("sys.argv", ["analysis_flight.py", TEST_FLIGHT_RECORDER_PATH, "2"]):
-        main()
-
-
-def test_load_recorder_data(temp_dir):
-    """测试 load_recorder_data 函数是否正确加载 recorder 数据。"""
-    recorder_dict = load_recorder_data(TEST_FLIGHT_RECORDER_PATH, WORLD_SIZE)
-    assert len(recorder_dict) == WORLD_SIZE
-
-
-def test_extract_hccl_info():
-    """测试 extract_hccl_info 函数是否正确提取 HCCL 信息。"""
-    recorder_dict = {str(rank): TEST_RECORDER_DATA for rank in range(WORLD_SIZE)}
-    hccl_dict = extract_hccl_info(recorder_dict)
-    assert len(hccl_dict) == WORLD_SIZE
-    for _, info in hccl_dict.items():
-        assert info["state"] == "completed"
-        assert info["record_id"] == 2
-        assert info["pg_id"] == "pg1"
-        assert info["time_discovered_completed_ns"] == 2000
-        assert info["name"] == "op2"
-
-
-def test_analyze_pg_groups():
-    hccl_dict_list = [
-        {
-            "0": {
-                "state": "scheduled",
-                "record_id": 1,
-                "pg_id": "pg1",
-                "time_discovered_completed_ns": 1000,
-                "name": "op1",
-            },
-            "1": {
-                "state": "scheduled",
-                "record_id": 1,
-                "pg_id": "pg1",
-                "time_discovered_completed_ns": 1000,
-                "name": "op1",
-            },
-        },
-        {
-            "0": {
-                "state": "completed",
-                "record_id": 1,
-                "pg_id": "pg1",
-                "time_discovered_completed_ns": 2000,
-                "name": "op2",
-            },
-            "1": {
-                "state": "completed",
-                "record_id": 1,
-                "pg_id": "pg1",
-                "time_discovered_completed_ns": 2000,
-                "name": "op2",
-            },
-        },
-        {
-            "0": {
-                "state": "scheduled",
-                "record_id": 1,
-                "pg_id": "pg1",
-                "time_discovered_completed_ns": 2000,
-                "name": "op2",
-            },
-            "1": {
-                "state": "completed",
-                "record_id": 1,
-                "pg_id": "pg1",
-                "time_discovered_completed_ns": 2000,
-                "name": "op2",
-            },
-        },
-    ]
-    for data in hccl_dict_list:
-        analyze_pg_groups(data)
diff --git a/flight_recorder/test/ut/test_check_path.py b/flight_recorder/test/ut/test_check_path.py
deleted file mode 100644
index e21909cc68f..00000000000
--- a/flight_recorder/test/ut/test_check_path.py
+++ /dev/null
@@ -1,133 +0,0 @@
-# Copyright (c) 2025, Huawei Technologies Co., Ltd.
-# All rights reserved.
-#
-# Licensed under the Apache License, Version 2.0  (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-
-import os
-import stat
-import json
-
-import yaml
-import pytest
-
-from flight_recorder.flight_recorder_analyze.check_path import (
-    get_valid_path,
-    get_valid_read_path,
-    check_type,
-    type_to_str,
-)
-
-TEST_DIR = "/tmp/a_test_path_for_testing_check_path_common/"
-TEST_READ_FILE_NAME = TEST_DIR + "testfile.testfile"
-USER_NOT_PERMITTED_READ_FILE = TEST_DIR + "testfile_not_readable.testfile"
-OTHERS_READABLE_READ_FILE = TEST_DIR + "testfile_others_readable.testfile"
-OTHERS_WRITABLE_READ_FILE = TEST_DIR + "testfile_others_writable.testfile"
-USER_NOT_PERMITTED_WRITE_FILE = TEST_DIR + "testfile_not_writable/foo"
-JSON_FILE = TEST_DIR + "testfile.json"
-YAML_FILE = TEST_DIR + "testfile.yaml"
-TEST_FILE = TEST_DIR + "testfile.test"
-ORI_DATA = {"a_long_key_name": 1, 12: "b", 3.14: "", "c": {"d": 3, "e": 4}, True: "true", False: "false", None: "null"}
-OVER_WRITE_DATA = {"hello": "world"}
-
-
-def setup_module():
-    os.makedirs(TEST_DIR, mode=int("700", 8), exist_ok=True)
-
-    default_mode = stat.S_IWUSR | stat.S_IRUSR  # 600
-    with os.fdopen(
-        os.open(TEST_READ_FILE_NAME, os.O_WRONLY | os.O_CREAT | os.O_TRUNC, mode=default_mode), "w"
-    ) as temp_file:
-        temp_file.write("a_test_file_name_for_testing_automl_common")
-
-    with os.fdopen(os.open(USER_NOT_PERMITTED_READ_FILE, os.O_CREAT, mode=000), "w"):
-        pass
-
-    with os.fdopen(os.open(OTHERS_READABLE_READ_FILE, os.O_CREAT, mode=default_mode), "w"):
-        pass
-    os.chmod(OTHERS_READABLE_READ_FILE, int("755", 8))
-
-    with os.fdopen(os.open(OTHERS_WRITABLE_READ_FILE, os.O_CREAT, mode=default_mode), "w"):
-        pass
-    os.chmod(OTHERS_WRITABLE_READ_FILE, int("666", 8))
-
-    dir_name = os.path.dirname(USER_NOT_PERMITTED_WRITE_FILE)
-    os.makedirs(dir_name, mode=int("500", 8), exist_ok=True)
-
-    with os.fdopen(os.open(JSON_FILE, os.O_WRONLY | os.O_CREAT | os.O_TRUNC, mode=default_mode), "w") as json_file:
-        json.dump(ORI_DATA, json_file)
-
-    with os.fdopen(os.open(YAML_FILE, os.O_WRONLY | os.O_CREAT | os.O_TRUNC, mode=default_mode), "w") as yaml_file:
-        yaml.dump(ORI_DATA, yaml_file)
-
-
-def teardown_module():
-    os.remove(TEST_READ_FILE_NAME)
-    os.chmod(USER_NOT_PERMITTED_READ_FILE, int("600", 8))
-    os.remove(USER_NOT_PERMITTED_READ_FILE)
-    os.remove(OTHERS_READABLE_READ_FILE)
-    os.remove(OTHERS_WRITABLE_READ_FILE)
-
-    dir_name = os.path.dirname(USER_NOT_PERMITTED_WRITE_FILE)
-    os.chmod(dir_name, int("700", 8))
-    os.removedirs(dir_name)
-
-    os.remove(JSON_FILE)
-    os.remove(YAML_FILE)
-    if os.path.exists(TEST_FILE):
-        os.remove(TEST_FILE)
-
-    os.removedirs(TEST_DIR)
-
-
-def test_check_type_given_valid_when_any_then_pass():
-    check_type(12, value_type=int)
-
-
-def test_check_type_given_int_when_str_then_error():
-    with pytest.raises(TypeError):
-        # TypeError: test must be str, not int.
-        check_type(12, value_type=str, param_name="test")
-
-
-def test_get_valid_path_given_valid_when_any_then_pass():
-    get_valid_path("../anypath")
-    get_valid_path("../anypath/a")
-
-
-def test_get_valid_path_given_invalid_when_any_then_value_error():
-    with pytest.raises(ValueError):
-        get_valid_path("../anypath*a")  # ValueError: ../anypath*a contains invalid characters.
-    with pytest.raises(ValueError):
-        get_valid_path("../anypath/\\a")  # ValueError: ../anypath/\a contains invalid characters.
-    with pytest.raises(ValueError):
-        get_valid_path("../anypath/!a")  # ValueError: ../anypath/!a contains invalid characters.
-
-
-def test_get_valid_read_path_given_valid_when_any_then_pass():
-    get_valid_read_path(TEST_READ_FILE_NAME)
-    get_valid_read_path(OTHERS_READABLE_READ_FILE)
-    get_valid_read_path(OTHERS_WRITABLE_READ_FILE, check_user_stat=False)
-
-
-def test_get_valid_read_path_given_invalid_when_any_then_value_error():
-    with pytest.raises(ValueError):
-        get_valid_read_path("./not_exist")  # ValueError: The file ... doesn't exist or not a file.
-    with pytest.raises(ValueError):
-        # ValueError: The file ... exceeds size limitation of 1.
-        get_valid_read_path(TEST_READ_FILE_NAME, size_max=1)
-    with pytest.raises(ValueError):
-        # ValueError: Current user doesn't have read permission to the file ....
-        get_valid_read_path(USER_NOT_PERMITTED_READ_FILE)
-    with pytest.raises(ValueError):
-        # ValueError: The file ... has others writable permission.
-        get_valid_read_path(OTHERS_WRITABLE_READ_FILE)
-- 
Gitee


From 9d1cd03e3128b613c510c6c9919909cde31eed87 Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Wed, 12 Mar 2025 15:40:47 +0800
Subject: [PATCH 121/145] fix bug

---
 .../msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py
index 37cdea85f85..3eb7fc0df96 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/run_ut/multi_run_ut.py
@@ -50,7 +50,7 @@ def split_json_file(input_file, num_splits, filter_api):
         backward_data[f"{data_name}.backward"] = backward_data.pop(data_name)
 
     input_data = load_json(input_file)
-    if input_data.get("dump_data_dir") is None:
+    if "dump_data_dir" not in input_data.keys():
         logger.error("Invalid input file, 'dump_data_dir' field is missing")
         raise CompareException("Invalid input file, 'dump_data_dir' field is missing")
     if input_data.get("data") is None:
-- 
Gitee


From 3b402c9de4f1c02e132d1d24e206392483120dd3 Mon Sep 17 00:00:00 2001
From: l30044004 <louyujing@huawei.com>
Date: Wed, 12 Mar 2025 16:05:03 +0800
Subject: [PATCH 122/145] =?UTF-8?q?=E5=88=86=E7=BA=A7=E5=8F=AF=E8=A7=86?=
 =?UTF-8?q?=E5=8C=96=E9=80=92=E5=BD=92=E9=99=90=E5=88=B6=E6=B7=B1=E5=BA=A6?=
 =?UTF-8?q?=EF=BC=8C=E6=A3=80=E6=B5=8B=E6=88=90=E7=8E=AF?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../test/visualization_ut/compare/test_mode_adapter.py        | 3 ++-
 .../msprobe/test/visualization_ut/graph/test_base_node.py     | 4 ++--
 2 files changed, 4 insertions(+), 3 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/test/visualization_ut/compare/test_mode_adapter.py b/debug/accuracy_tools/msprobe/test/visualization_ut/compare/test_mode_adapter.py
index 87d1f9ee5f0..4c38e4e6200 100644
--- a/debug/accuracy_tools/msprobe/test/visualization_ut/compare/test_mode_adapter.py
+++ b/debug/accuracy_tools/msprobe/test/visualization_ut/compare/test_mode_adapter.py
@@ -2,7 +2,8 @@ import json
 import unittest
 from unittest.mock import patch, MagicMock
 from msprobe.visualization.compare.mode_adapter import ModeAdapter
-from msprobe.visualization.graph.base_node import BaseNode, NodeOp
+from msprobe.visualization.graph.base_node import BaseNode
+from msprobe.visualization.graph.node_op import NodeOp
 from msprobe.visualization.utils import GraphConst, ToolTip
 from msprobe.core.common.const import CompareConst
 
diff --git a/debug/accuracy_tools/msprobe/test/visualization_ut/graph/test_base_node.py b/debug/accuracy_tools/msprobe/test/visualization_ut/graph/test_base_node.py
index 480b95620e6..64b7101c6b0 100644
--- a/debug/accuracy_tools/msprobe/test/visualization_ut/graph/test_base_node.py
+++ b/debug/accuracy_tools/msprobe/test/visualization_ut/graph/test_base_node.py
@@ -1,6 +1,6 @@
 import unittest
-from msprobe.visualization.graph.base_node import BaseNode, NodeOp
-from msprobe.visualization.utils import GraphConst
+from msprobe.visualization.graph.base_node import BaseNode
+from msprobe.visualization.graph.node_op import NodeOp
 
 
 class TestBaseNode(unittest.TestCase):
-- 
Gitee


From d74a4ceb05e78cf1a48e9c7e61a610bbaca16dd9 Mon Sep 17 00:00:00 2001
From: l30044004 <louyujing@huawei.com>
Date: Thu, 13 Mar 2025 09:11:49 +0800
Subject: [PATCH 123/145] =?UTF-8?q?=E5=88=86=E7=BA=A7=E5=8F=AF=E8=A7=86?=
 =?UTF-8?q?=E5=8C=96=E9=80=92=E5=BD=92=E9=99=90=E5=88=B6=E6=B7=B1=E5=BA=A6?=
 =?UTF-8?q?=EF=BC=8C=E6=A3=80=E6=B5=8B=E6=88=90=E7=8E=AF?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/visualization/compare/graph_comparator.py       | 6 ++++--
 1 file changed, 4 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py b/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
index 2ac508e548f..3f695d23483 100644
--- a/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
+++ b/debug/accuracy_tools/msprobe/visualization/compare/graph_comparator.py
@@ -23,6 +23,8 @@ from msprobe.core.common.utils import recursion_depth_decorator
 
 
 class GraphComparator:
+    MAX_DEPTH = 1000
+
     def __init__(self, graphs, dump_path_param, args, mapping_dict=None):
         self.graph_n = graphs[0]
         self.graph_b = graphs[1]
@@ -67,7 +69,7 @@ class GraphComparator:
         node.data[GraphConst.JSON_INDEX_KEY] = precision_index
         node.data.update(other_dict)
 
-    @recursion_depth_decorator('GraphComparator._compare_nodes', max_depth=1000)
+    @recursion_depth_decorator('GraphComparator._compare_nodes', max_depth=MAX_DEPTH)
     def _compare_nodes(self, node_n):
         """
         递归遍历NPU树中的节点，如果在Bench中找到具有相同名称的节点，检查他们的祖先和参数信息，检查一致则及逆行精度数据对比
@@ -91,7 +93,7 @@ class GraphComparator:
         for subnode in node_n.subnodes:
             self._compare_nodes(subnode)
 
-    @recursion_depth_decorator('GraphComparator._compare_nodes_fuzzy', max_depth=1000)
+    @recursion_depth_decorator('GraphComparator._compare_nodes_fuzzy', max_depth=MAX_DEPTH)
     def _compare_nodes_fuzzy(self, node_n):
         if node_n.op != NodeOp.function_api:
             # 模块经过模糊匹配
-- 
Gitee


From 73c05515ae8380126c4c812f70b024433167134a Mon Sep 17 00:00:00 2001
From: gitee <jiangchangting@huawei.com>
Date: Thu, 13 Mar 2025 09:43:29 +0800
Subject: [PATCH 124/145] fix review

---
 .../tensor_transport_layer/attl.py               | 15 ++++++---------
 .../pytorch/online_dispatch/dump_compare.py      | 10 ++++------
 .../msprobe/pytorch/online_dispatch/utils.py     | 16 +++++++---------
 3 files changed, 17 insertions(+), 24 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
index 236c87b1105..f858067b661 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/tensor_transport_layer/attl.py
@@ -27,8 +27,7 @@ from msprobe.pytorch.api_accuracy_checker.tensor_transport_layer.client import T
 from msprobe.pytorch.api_accuracy_checker.tensor_transport_layer.server import TCPServer
 from msprobe.core.common.file_utils import remove_path
 from msprobe.pytorch.common.utils import logger, save_api_data, load_api_data, save_pkl, load_pkl
-from msprobe.core.common.const import Const
-from msprobe.core.common.utils import CompareException
+from msprobe.core.common.utils import recursion_depth_decorator
 
 
 BufferType = Union[ApiData, Dict[str, Any], str]  # Union[Tensor, Tuple[Optional[Tensor]]]
@@ -171,22 +170,20 @@ class ATTL:
         return buffer
 
 
-def move2device_exec(obj, device, depth=0):
-    if depth > Const.MAX_DEPTH:
-        logger.error("Maximum recursion depth exceeded")
-        raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
+@recursion_depth_decorator("move2device_exec")
+def move2device_exec(obj, device):
     if isinstance(obj, (tuple, list)):
-        data_list = [move2device_exec(val, device, depth=depth + 1) for val in obj]
+        data_list = [move2device_exec(val, device) for val in obj]
         return data_list if isinstance(obj, list) else tuple(data_list)
     if isinstance(obj, dict): 
-        return {key: move2device_exec(val, device, depth=depth + 1) for key, val in obj.items()}
+        return {key: move2device_exec(val, device) for key, val in obj.items()}
     elif isinstance(obj, torch.Tensor):
         obj = obj.detach()
         if obj.device.type != device:
             obj = obj.to(device)
         return obj
     elif "return_types" in str(type(obj)):
-        return move2device_exec(tuple(obj), device, depth=depth + 1)
+        return move2device_exec(tuple(obj), device)
     elif isinstance(obj, torch._C.device):
         return torch.device(device)
     else:
diff --git a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
index 810f1ea2756..a154064755e 100644
--- a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
+++ b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/dump_compare.py
@@ -20,7 +20,7 @@ from datetime import datetime, timezone
 
 import torch
 from msprobe.core.common.const import Const
-from msprobe.core.common.utils import CompareException
+from msprobe.core.common.utils import recursion_depth_decorator
 from msprobe.core.common.file_utils import FileOpen, save_npy, save_json
 from msprobe.pytorch.common.log import logger
 
@@ -93,13 +93,11 @@ def support_basic_type(data):
     return False
 
 
-def dump_data(data, prefix, dump_path, depth=0):
-    if depth > Const.MAX_DEPTH:
-        logger.error(f'dump data depth exceeds max depth:{Const.MAX_DEPTH}')
-        raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
+@recursion_depth_decorator("dump_data")
+def dump_data(data, prefix, dump_path):
     if isinstance(data, (tuple, list)) and data:
         for i, item in enumerate(data):
-            dump_data(item, "{}.{}".format(prefix, i), dump_path, depth=depth + 1)
+            dump_data(item, "{}.{}".format(prefix, i), dump_path)
         return
     elif support_basic_type(data):
         if isinstance(data, torch.Tensor) and data.is_meta:
diff --git a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
index e25f15e587f..2116186cc04 100644
--- a/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/online_dispatch/utils.py
@@ -26,8 +26,8 @@ except ImportError:
 else:
     pta_cpu_device = torch.device("cpu")
 
-from msprobe.core.common.const import CompareConst, Const
-from msprobe.core.common.utils import CompareException
+from msprobe.core.common.const import CompareConst
+from msprobe.core.common.utils import recursion_depth_decorator
 from msprobe.pytorch.common.log import logger
 
 
@@ -87,10 +87,8 @@ def get_callstack():
     return callstack
 
 
-def data_to_cpu(data, deep, data_cpu, depth=0):
-    if depth > Const.MAX_DEPTH:
-        logger.error("Failed to convert data to cpu, depth exceeds max depth:{}".format(Const.MAX_DEPTH))
-        raise CompareException(CompareException.RECURSION_LIMIT_ERROR)
+@recursion_depth_decorator("data_to_cpu")
+def data_to_cpu(data, deep, data_cpu):
     global cpu_device
     list_cpu = []
     if isinstance(data, torch.Tensor):
@@ -106,13 +104,13 @@ def data_to_cpu(data, deep, data_cpu, depth=0):
         return tensor_copy
     elif isinstance(data, list):
         for v in data:
-            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth=depth + 1))
+            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu))
         if deep == 0:
             data_cpu.append(list_cpu)
         return list_cpu
     elif isinstance(data, tuple):
         for v in data:
-            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu, depth=depth + 1))
+            list_cpu.append(data_to_cpu(v, deep + 1, data_cpu))
         tuple_cpu = tuple(list_cpu)
         if deep == 0:
             data_cpu.append(tuple_cpu)
@@ -120,7 +118,7 @@ def data_to_cpu(data, deep, data_cpu, depth=0):
     elif isinstance(data, dict):
         dict_cpu = {}
         for k, v in data.items():
-            dict_cpu[k] = data_to_cpu(v, deep + 1, data_cpu, depth=depth + 1)
+            dict_cpu[k] = data_to_cpu(v, deep + 1, data_cpu)
         if deep == 0:
             data_cpu.append(dict_cpu)
         return dict_cpu
-- 
Gitee


From f19bba589c879c3421c54c97503c286f97973eb6 Mon Sep 17 00:00:00 2001
From: qianggee <qjchenb@163.com>
Date: Thu, 13 Mar 2025 01:53:32 +0000
Subject: [PATCH 125/145] limit recursion depth

---
 debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py b/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
index 3032bdcb3fa..2db2a971256 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/module_hook.py
@@ -26,6 +26,7 @@ from torch.utils.hooks import BackwardHook
 
 from msprobe.core.common.const import MonitorConst, Const
 from msprobe.core.common.file_utils import load_json, save_json
+from msprobe.core.common.utils import recursion_depth_decorator
 from msprobe.pytorch.common.log import logger
 from msprobe.pytorch.common.utils import is_recomputation
 from msprobe.pytorch.monitor.anomaly_analyse import AnomalyDataWriter
@@ -735,6 +736,7 @@ class TrainerMon:
 
         logger.info_on_rank_0(f"> {hooked_count} modules are monitored.")
 
+        @recursion_depth_decorator('msprobe.pytorch.monitor.clone_if_tensor')
         def clone_if_tensor(args):
             if isinstance(args, tuple):
                 return tuple([clone_if_tensor(arg) for arg in args])
-- 
Gitee


From 8a21404a2cce8d1fc170f6eb6dd5f9da3229282e Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Thu, 13 Mar 2025 10:11:03 +0800
Subject: [PATCH 126/145] fix_comm_matrix_sum

---
 .../cluster_analyse/common_func/table_constant.py      |  2 ++
 .../communication_matrix_sum.py                        | 10 ++++++----
 2 files changed, 8 insertions(+), 4 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py b/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
index 7495ff56214..eae250b0f7a 100644
--- a/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
+++ b/profiler/msprof_analyze/cluster_analyse/common_func/table_constant.py
@@ -48,3 +48,5 @@ class TableConstant:
     TABLE_COMPUTE_TASK_INFO = "COMPUTE_TASK_INFO"
     TABLE_COMMUNICATION_OP = "COMMUNICATION_OP"
     TABLE_TASK = "TASK"
+    TABLE_META_DATA = "META_DATA"
+    TABLE_COMM_ANALYZER_MATRIX = "CommAnalyzerMatrix"
diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
index 13f462c7229..b64a8167b02 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
@@ -22,6 +22,8 @@ from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.database_service import DatabaseService
 from msprof_analyze.cluster_analyse.common_func.utils import double_hash
 
+from msprof_analyze.cluster_analyse.common_func.table_constant import TableConstant
+
 logger = get_logger()
 
 
@@ -45,8 +47,8 @@ class CommMatrixSum(BaseRecipeAnalysis):
     def _get_parallel_group_info(cls, profiler_db_path):
         rank_map = {}
         data_service = DatabaseService(profiler_db_path, {})
-        data_service.add_table_for_query("MATA_DATA")
-        mata_df = data_service.query_data().get("MATA_DATA")
+        data_service.add_table_for_query(TableConstant.TABLE_META_DATA)
+        mata_df = data_service.query_data().get(TableConstant.TABLE_META_DATA)
         if not mata_df:
             return rank_map
         filtered_df = mata_df[mata_df['name'] == "parallel_group_info"]
@@ -193,8 +195,8 @@ class CommMatrixSum(BaseRecipeAnalysis):
         result_data[self.RANK_MAP] = self._get_parallel_group_info(profiler_db_path)
         analysis_db_path = data_map.get(Constant.ANALYSIS_DB_PATH)
         data_service = DatabaseService(analysis_db_path, {})
-        data_service.add_table_for_query("CommAnalyzerMatrix")
-        matrix_data = data_service.query_data().get("CommAnalyzerMatrix")
+        data_service.add_table_for_query(TableConstant.TABLE_COMM_ANALYZER_MATRIX)
+        matrix_data = data_service.query_data().get(TableConstant.TABLE_COMM_ANALYZER_MATRIX)
         if self._is_msprof or self._is_mindspore:
             matrix_data = self._trans_msprof_matrix_data(matrix_data)
         result_data[self.MATRIX_DATA] = matrix_data
-- 
Gitee


From 07df068675b65748453bcbe29c9b2e5cd3681a09 Mon Sep 17 00:00:00 2001
From: l30044004 <louyujing@huawei.com>
Date: Thu, 13 Mar 2025 11:35:35 +0800
Subject: [PATCH 127/145] =?UTF-8?q?=E5=88=86=E7=BA=A7=E5=8F=AF=E8=A7=86?=
 =?UTF-8?q?=E5=8C=96=E7=B2=BE=E7=AE=80=E5=A0=86=E6=A0=88=E5=A4=B1=E6=95=88?=
 =?UTF-8?q?=E9=97=AE=E9=A2=98=E5=A4=84=E7=90=86?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../msprobe/visualization/builder/graph_builder.py            | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py b/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
index 1f70fb7d8ae..0b3305e8c6a 100644
--- a/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
+++ b/debug/accuracy_tools/msprobe/visualization/builder/graph_builder.py
@@ -27,8 +27,8 @@ from msprobe.visualization.utils import save_json_file, GraphConst
 class GraphBuilder:
     backward_pattern = re.compile(r"(\.backward\.)(\d+)$")
     forward_pattern = re.compile(r"(\.forward\.)(\d+)$")
-    # 匹配以大写字母开头，后接任意字母，并以Template(结尾
-    template_pattern = re.compile(r'\b[A-Z][a-zA-Z]*Template\(')
+    # 匹配以大写字母开头，后接任意字母，并以Template(结尾，或包含api_template(的字符串
+    template_pattern = re.compile(r'\b([A-Z][a-zA-Z]*Template|api_template)\(')
 
     @staticmethod
     def build(construct_path, data_path, stack_path, model_name='DefaultModel', complete_stack=False):
-- 
Gitee


From 8def8cbccfb5fb24bd08dec8218d1d6220614847 Mon Sep 17 00:00:00 2001
From: Henry Shi <xinyuhenryshi@163.com>
Date: Fri, 7 Mar 2025 18:06:33 +0800
Subject: [PATCH 128/145] fix jit grad

---
 debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py b/debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py
index a9a543a8fac..634b1576752 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py
+++ b/debug/accuracy_tools/msprobe/mindspore/dump/jit_dump.py
@@ -16,6 +16,7 @@
 import os
 from collections import defaultdict
 
+import mindspore
 from mindspore._c_expression import PyNativeExecutor_
 try:
     from mindspore.common.api import _MindsporeFunctionExecutor
@@ -105,7 +106,10 @@ class JitDump(_MindsporeFunctionExecutor):
     def grad(self, obj, grad, weights, grad_position, *args, **kwargs):
         if JitDump.jit_dump_switch and JitDump.jit_enable:
             _api_register.restore_all_api()
-        output = self._executor.grad(grad, obj, weights, grad_position, *args, *(kwargs.values()))
+        if mindspore.__version__ >= "2.5":
+            output = self._executor.grad(grad, obj, weights, grad_position, False, *args, *(kwargs.values()))
+        else:
+            output = self._executor.grad(grad, obj, weights, grad_position, *args, *(kwargs.values()))
         if JitDump.jit_dump_switch and JitDump.jit_enable:
             dump_jit(obj, args, None, False)
             _api_register.register_all_api()
-- 
Gitee


From c8e63c4234f11e0ffff4f955e366086c4bfddcf5 Mon Sep 17 00:00:00 2001
From: qianggee <qjchenb@163.com>
Date: Thu, 13 Mar 2025 03:36:07 +0000
Subject: [PATCH 129/145] limit match string length

---
 .../pytorch/monitor/distributed/wrap_distributed.py    | 10 ++++++++--
 1 file changed, 8 insertions(+), 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py b/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
index b2fa26a58e7..c8af3cc6068 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
@@ -24,6 +24,7 @@ import torch.nn as nn
 from msprobe.core.common.const import MonitorConst
 from msprobe.core.common.file_utils import load_yaml
 from msprobe.pytorch.monitor.module_metric import get_metrics, get_summary_writer_tag_name
+from msprobe.pytorch.common.log import logger
 
 try:
     import torch_npu
@@ -37,6 +38,7 @@ WrapDistributedOps = load_yaml(OpsPath).get("distributed", [])
 
 StackBlackListPath = os.path.join(os.path.dirname(__file__), "stack_blacklist.yaml")
 StackBlackList = load_yaml(StackBlackListPath).get("stack", [])
+MaxStringLength = 10000
 
 distributed_func = {}
 for f in dir(dist):
@@ -139,6 +141,8 @@ def get_process_group(process_group):
 
 
 def stack_filter(stack):
+    if len(stack) > MaxStringLength:
+        logger.warning(f'The character strin contains more than {MaxStringLength}. re match is skipped.')
     for pattern in StackBlackList:
         if re.search(pattern, stack):
             return False
@@ -188,10 +192,12 @@ def update_data(old, new):
 
 
 def is_target_line(codeline):
-    stack = get_callstack()
-    whole_stack = ';'.join(stack)
     if codeline == []:
         return True
+    stack = get_callstack()
+    whole_stack = ';'.join(stack)
+    if len(whole_stack) > MaxStringLength:
+        logger.warning(f'The character strin contains more than {MaxStringLength}. re match is skipped.')
     for pattern in codeline:
         if re.search(pattern, whole_stack):
             return True
-- 
Gitee


From 87271442de6943dee8b54adb3c505f2652239cc2 Mon Sep 17 00:00:00 2001
From: qianggee <qjchenb@163.com>
Date: Thu, 13 Mar 2025 08:00:53 +0000
Subject: [PATCH 130/145] update max string length

---
 .../msprobe/pytorch/monitor/distributed/wrap_distributed.py     | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py b/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
index c8af3cc6068..88244cd85d6 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
@@ -38,7 +38,7 @@ WrapDistributedOps = load_yaml(OpsPath).get("distributed", [])
 
 StackBlackListPath = os.path.join(os.path.dirname(__file__), "stack_blacklist.yaml")
 StackBlackList = load_yaml(StackBlackListPath).get("stack", [])
-MaxStringLength = 10000
+MaxStringLength = 1000
 
 distributed_func = {}
 for f in dir(dist):
-- 
Gitee


From 48fa5a72e70208c16941792236bfccebaf1382eb Mon Sep 17 00:00:00 2001
From: qianggee <qjchenb@163.com>
Date: Thu, 13 Mar 2025 08:11:35 +0000
Subject: [PATCH 131/145] rename const

---
 .../pytorch/monitor/distributed/wrap_distributed.py    | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py b/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
index 88244cd85d6..20ef3757d4a 100644
--- a/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
+++ b/debug/accuracy_tools/msprobe/pytorch/monitor/distributed/wrap_distributed.py
@@ -38,7 +38,7 @@ WrapDistributedOps = load_yaml(OpsPath).get("distributed", [])
 
 StackBlackListPath = os.path.join(os.path.dirname(__file__), "stack_blacklist.yaml")
 StackBlackList = load_yaml(StackBlackListPath).get("stack", [])
-MaxStringLength = 1000
+MAX_STRING_LENGTH = 1000
 
 distributed_func = {}
 for f in dir(dist):
@@ -141,8 +141,8 @@ def get_process_group(process_group):
 
 
 def stack_filter(stack):
-    if len(stack) > MaxStringLength:
-        logger.warning(f'The character strin contains more than {MaxStringLength}. re match is skipped.')
+    if len(stack) > MAX_STRING_LENGTH:
+        logger.warning(f'The character strin contains more than {MAX_STRING_LENGTH}. re match is skipped.')
     for pattern in StackBlackList:
         if re.search(pattern, stack):
             return False
@@ -196,8 +196,8 @@ def is_target_line(codeline):
         return True
     stack = get_callstack()
     whole_stack = ';'.join(stack)
-    if len(whole_stack) > MaxStringLength:
-        logger.warning(f'The character strin contains more than {MaxStringLength}. re match is skipped.')
+    if len(whole_stack) > MAX_STRING_LENGTH:
+        logger.warning(f'The character strin contains more than {MAX_STRING_LENGTH}. re match is skipped.')
     for pattern in codeline:
         if re.search(pattern, whole_stack):
             return True
-- 
Gitee


From c6d48b336f63de4faef38f533c1a3adfeadb05c3 Mon Sep 17 00:00:00 2001
From: pxp1 <958876660@qq.com>
Date: Thu, 13 Mar 2025 17:13:35 +0800
Subject: [PATCH 132/145] =?UTF-8?q?=E9=80=92=E5=BD=92=E6=B7=B1=E5=BA=A6?=
 =?UTF-8?q?=E9=99=90=E5=88=B6?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../api_accuracy_checker/generate_op_script/op_generator.py      | 1 +
 1 file changed, 1 insertion(+)

diff --git a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/generate_op_script/op_generator.py b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/generate_op_script/op_generator.py
index 797210f09c3..641eada0303 100644
--- a/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/generate_op_script/op_generator.py
+++ b/debug/accuracy_tools/msprobe/pytorch/api_accuracy_checker/generate_op_script/op_generator.py
@@ -183,6 +183,7 @@ class APIExtractor:
                     self.update_data_name(v, dump_data_dir)
         return value
 
+    @recursion_depth_decorator("OpGenerator: APIExtractor.update_data_name")
     def update_data_name(self, data, dump_data_dir):
         if isinstance(data, list):
             for item in data:
-- 
Gitee


From 9df59617c2ae087e5cb3a20554f139033f3f7131 Mon Sep 17 00:00:00 2001
From: jiangchao_j <chaojiang_j@163.com>
Date: Thu, 13 Mar 2025 22:38:11 +0800
Subject: [PATCH 133/145] set wrapped api names to ori names

---
 debug/accuracy_tools/msprobe/core/data_dump/api_registry.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py b/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
index 5aeafd573d6..1bef962232e 100644
--- a/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
+++ b/debug/accuracy_tools/msprobe/core/data_dump/api_registry.py
@@ -69,6 +69,7 @@ class ApiWrapper:
                         def wrap_api_func(api_name, api_func, prefix, hook_build_func, api_template):
                             def api_function(*args, **kwargs):
                                 return api_template(api_name, api_func, prefix, hook_build_func)(*args, **kwargs)
+                            api_function.__name__ = api_name
                             return api_function
                         wrapped_functions[api_name] = wrap_api_func(api_name, ori_api, name_prefix,
                                                                     hook_build_func, api_template)
-- 
Gitee


From 7ed234925ad4cbbd6c5122f3795997dd32602bd3 Mon Sep 17 00:00:00 2001
From: TAJh <taojiaheng1@huawei.com>
Date: Fri, 14 Mar 2025 11:38:50 +0800
Subject: [PATCH 134/145] bugfix1

---
 .../dym_loader/hook_dynamic_loader.cc         | 61 ++++++-------------
 .../dym_loader/hook_dynamic_loader.h          |  1 -
 2 files changed, 18 insertions(+), 44 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
index 6975d04d3f0..2da1ee00a2f 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
+++ b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
@@ -18,37 +18,10 @@
 #include <sys/stat.h>
 #include <cstdlib>
 #include <cstring>
+#include <pybind11/embed.h>
 #include "utils/log_adapter.h"
 
-namespace {
-
-// Utility function to check if a file path is valid
-bool IsValidPath(const std::string &path) {
-  struct stat fileStat;
-  if (stat(path.c_str(), &fileStat) != 0) {
-    MS_LOG(ERROR) << "File does not exist or cannot be accessed: " << path;
-    return false;
-  }
-
-  if (S_ISLNK(fileStat.st_mode)) {
-    MS_LOG(ERROR) << "File is a symbolic link, which is not allowed: " << path;
-    return false;
-  }
-
-  if (!S_ISREG(fileStat.st_mode)) {
-    MS_LOG(ERROR) << "File is not a regular file: " << path;
-    return false;
-  }
-
-  if (path.substr(path.find_last_of(".")) != ".so") {
-    MS_LOG(ERROR) << "File is not a .so file: " << path;
-    return false;
-  }
-
-  return true;
-}
-
-}  // namespace
+namespace py = pybind11;
 
 HookDynamicLoader &HookDynamicLoader::GetInstance() {
   static HookDynamicLoader instance;
@@ -65,26 +38,28 @@ bool HookDynamicLoader::loadFunction(void *handle, const std::string &functionNa
   return true;
 }
 
-bool HookDynamicLoader::validateLibraryPath(const std::string &libPath) {
-  char *realPath = realpath(libPath.c_str(), nullptr);
-  if (!realPath) {
-    MS_LOG(WARNING) << "Failed to resolve realpath for the library: " << libPath;
-    return false;
-  }
-
-  bool isValid = IsValidPath(realPath);
-  free(realPath);  // Free memory allocated by realpath
-  return isValid;
-}
-
 bool HookDynamicLoader::LoadLibrary() {
+  std::string msprobePath = "";
+  // 获取gil锁
+  py::gil_scoped_acquire acquire;
+  try {
+    py::module msprobeMod = py::module::import("msprobe.lib._msprobe_c");
+		if (!py::hasattr(msprobeMod, "__file__")) {
+			MS_LOG(ERROR) << "Adump mod get file failed";
+			return false;
+		}
+		msprobePath = msprobeMod.attr("__file__").cast<std::string>();
+  } catch (const std::exception& e) {
+		MS_LOG(ERROR) << "Get Adump mod path failed";
+		return false;
+	}
   std::lock_guard<std::mutex> lock(mutex_);
   if (handle_) {
-    MS_LOG(WARNING) << "Hook library already loaded!";
+    MS_LOG(WARNING) << "Hook library already loaded!" << e.what();
     return false;
   }
 
-  handle_ = dlopen(kMsprobeExtName, RTLD_LAZY | RTLD_LOCAL);
+  handle_ = dlopen(msprobePath.c_str(), RTLD_LAZY | RTLD_LOCAL);
   if (!handle_) {
     MS_LOG(WARNING) << "Failed to load Hook library: " << dlerror();
     return false;
diff --git a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
index a7b708c5e29..a3e54c3fcf1 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
+++ b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
@@ -41,7 +41,6 @@ class HookDynamicLoader {
  private:
   // Helper functions
   bool loadFunction(void *handle, const std::string &functionName);
-  bool validateLibraryPath(const std::string &libPath);
 
   HookDynamicLoader() = default;
 
-- 
Gitee


From ec4aac1d9e40588dc4b3307d7636707155f3c0fd Mon Sep 17 00:00:00 2001
From: TAJh <taojiaheng1@huawei.com>
Date: Fri, 14 Mar 2025 11:40:11 +0800
Subject: [PATCH 135/145] bugfix2

---
 debug/accuracy_tools/msprobe/mindspore/__init__.py            | 4 ----
 .../msprobe/mindspore/dym_loader/hook_dynamic_loader.h        | 1 -
 2 files changed, 5 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/__init__.py b/debug/accuracy_tools/msprobe/mindspore/__init__.py
index e7cbfcdb3c9..db8079128aa 100644
--- a/debug/accuracy_tools/msprobe/mindspore/__init__.py
+++ b/debug/accuracy_tools/msprobe/mindspore/__init__.py
@@ -18,10 +18,6 @@ import os
 try:
     from msprobe.lib import _msprobe_c
     os.environ["MS_HOOK_ENABLE"] = "on"
-    dir_path = os.path.dirname(os.path.abspath(_msprobe_c.__file__))
-    current_ld_path = os.environ.get("LD_LIBRARY_PATH", "")
-    # 更新环境变量
-    os.environ["LD_LIBRARY_PATH"] = f"{current_ld_path}:{dir_path}"
 except ImportError:
     from .common.log import logger
     logger.info("Module _msprobe_c has not been installed. L2-Dump may not work normally.")
diff --git a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
index a3e54c3fcf1..3e604558aee 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
+++ b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.h
@@ -25,7 +25,6 @@
 
 constexpr auto kHookBegin = "MS_DbgOnStepBegin";
 constexpr auto kHookEnd = "MS_DbgOnStepEnd";
-constexpr const char* kMsprobeExtName = "_msprobe_c.so";
 
 class HookDynamicLoader {
  public:
-- 
Gitee


From cb9e29abdb71fc92d54a63113401373c77e7099a Mon Sep 17 00:00:00 2001
From: TAJh <taojiaheng1@huawei.com>
Date: Fri, 14 Mar 2025 14:12:47 +0800
Subject: [PATCH 136/145] bugfix3

---
 .../mindspore/dym_loader/hook_dynamic_loader.cc       | 11 +++++++----
 1 file changed, 7 insertions(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
index 2da1ee00a2f..aeea0e959eb 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
+++ b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
@@ -45,20 +45,23 @@ bool HookDynamicLoader::LoadLibrary() {
   try {
     py::module msprobeMod = py::module::import("msprobe.lib._msprobe_c");
 		if (!py::hasattr(msprobeMod, "__file__")) {
-			MS_LOG(ERROR) << "Adump mod get file failed";
+			MS_LOG(INFO) << "Adump mod not found";
 			return false;
 		}
 		msprobePath = msprobeMod.attr("__file__").cast<std::string>();
   } catch (const std::exception& e) {
-		MS_LOG(ERROR) << "Get Adump mod path failed";
+		MS_LOG(INFO) << "Adump mod path unable to get" << e.what();
 		return false;
 	}
   std::lock_guard<std::mutex> lock(mutex_);
   if (handle_) {
-    MS_LOG(WARNING) << "Hook library already loaded!" << e.what();
+    MS_LOG(WARNING) << "Hook library already loaded!";
     return false;
   }
-
+	if (msprobePath == "") {
+		MS_LOG(INFO) << "Adump path not loaded";
+		return false;
+	}
   handle_ = dlopen(msprobePath.c_str(), RTLD_LAZY | RTLD_LOCAL);
   if (!handle_) {
     MS_LOG(WARNING) << "Failed to load Hook library: " << dlerror();
-- 
Gitee


From c4c2eb2ae7ff4c035f18d73a3fd0c7050dcd82cf Mon Sep 17 00:00:00 2001
From: TAJh <taojiaheng1@huawei.com>
Date: Fri, 14 Mar 2025 14:34:53 +0800
Subject: [PATCH 137/145] change message level

---
 debug/accuracy_tools/msprobe/mindspore/__init__.py          | 3 ++-
 .../msprobe/mindspore/dym_loader/hook_dynamic_loader.cc     | 6 +++---
 2 files changed, 5 insertions(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/__init__.py b/debug/accuracy_tools/msprobe/mindspore/__init__.py
index db8079128aa..8471e29a0d0 100644
--- a/debug/accuracy_tools/msprobe/mindspore/__init__.py
+++ b/debug/accuracy_tools/msprobe/mindspore/__init__.py
@@ -17,7 +17,6 @@ import os
 
 try:
     from msprobe.lib import _msprobe_c
-    os.environ["MS_HOOK_ENABLE"] = "on"
 except ImportError:
     from .common.log import logger
     logger.info("Module _msprobe_c has not been installed. L2-Dump may not work normally.")
@@ -25,3 +24,5 @@ except ImportError:
 from msprobe.mindspore.debugger.precision_debugger import PrecisionDebugger
 from msprobe.mindspore.common.utils import seed_all, MsprobeStep, MsprobeInitStep
 from msprobe.mindspore.monitor.module_hook import TrainerMon
+
+os.environ["MS_HOOK_ENABLE"] = "on"
diff --git a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
index aeea0e959eb..9ef4eec3ad4 100644
--- a/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
+++ b/debug/accuracy_tools/msprobe/mindspore/dym_loader/hook_dynamic_loader.cc
@@ -45,12 +45,12 @@ bool HookDynamicLoader::LoadLibrary() {
   try {
     py::module msprobeMod = py::module::import("msprobe.lib._msprobe_c");
 		if (!py::hasattr(msprobeMod, "__file__")) {
-			MS_LOG(INFO) << "Adump mod not found";
+			MS_LOG(WARNING) << "Adump mod not found";
 			return false;
 		}
 		msprobePath = msprobeMod.attr("__file__").cast<std::string>();
   } catch (const std::exception& e) {
-		MS_LOG(INFO) << "Adump mod path unable to get" << e.what();
+		MS_LOG(WARNING) << "Adump mod path unable to get: " << e.what();
 		return false;
 	}
   std::lock_guard<std::mutex> lock(mutex_);
@@ -59,7 +59,7 @@ bool HookDynamicLoader::LoadLibrary() {
     return false;
   }
 	if (msprobePath == "") {
-		MS_LOG(INFO) << "Adump path not loaded";
+		MS_LOG(WARNING) << "Adump path not loaded";
 		return false;
 	}
   handle_ = dlopen(msprobePath.c_str(), RTLD_LAZY | RTLD_LOCAL);
-- 
Gitee


From 63a16237d58662571207277f20dc8416d53a453a Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Fri, 14 Mar 2025 18:23:46 +0800
Subject: [PATCH 138/145] bug_fix_for_comm_matrix

---
 .../communication_matrix_sum.py                     | 13 +++++++------
 1 file changed, 7 insertions(+), 6 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
index b64a8167b02..3c5779c968e 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
@@ -48,10 +48,10 @@ class CommMatrixSum(BaseRecipeAnalysis):
         rank_map = {}
         data_service = DatabaseService(profiler_db_path, {})
         data_service.add_table_for_query(TableConstant.TABLE_META_DATA)
-        mata_df = data_service.query_data().get(TableConstant.TABLE_META_DATA)
-        if not mata_df:
+        meta_df = data_service.query_data().get(TableConstant.TABLE_META_DATA, None)
+        if meta_df is None or meta_df.empty:
             return rank_map
-        filtered_df = mata_df[mata_df['name'] == "parallel_group_info"]
+        filtered_df = meta_df[meta_df['name'] == "parallel_group_info"]
         if filtered_df.shape[0] == 1 and filtered_df.shape[1] == 2:
             parallel_group_info = ast.literal_eval(filtered_df.loc[1, 'value'])
             for group_name, group_info in parallel_group_info.items():
@@ -119,11 +119,12 @@ class CommMatrixSum(BaseRecipeAnalysis):
             matrix_df = rank_data.get(self.MATRIX_DATA)
             concat_df = pd.concat([concat_df, matrix_df], ignore_index=True)
         concat_df[self.RANK_SET] = ""
-        for _, row in concat_df.iterrows():
+        for index, row in concat_df.iterrows():
             if row["type"] == Constant.P2P:
-                row[self.RANK_SET] = Constant.P2P
+                row.at[index, self.RANK_SET] = Constant.P2P
+                continue
             rank_list = sorted(rank_map.get(row["group_name"], {}).values())
-            row[self.RANK_SET] = ",".join([str(rank) for rank in rank_list])
+            row.at[index, self.RANK_SET] = ",".join([str(rank) for rank in rank_list])
         grouped_df = concat_df.groupby(
             [self.RANK_SET, 'step', "hccl_op_name", "group_name", "src_rank", "dst_rank"]).agg(
             {'transport_type': 'first', 'op_name': 'first', "transit_size": "sum", "transit_time": "sum"})
-- 
Gitee


From e12425aa98e12bc1fc4c3bd75d4dab5b52afdc80 Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Mon, 17 Mar 2025 15:18:19 +0800
Subject: [PATCH 139/145] bug_fix_for_comm_matrix

---
 .../communication_matrix_sum/communication_matrix_sum.py | 9 ++++++---
 1 file changed, 6 insertions(+), 3 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
index 3c5779c968e..8b91626fe50 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/communication_matrix_sum/communication_matrix_sum.py
@@ -53,7 +53,7 @@ class CommMatrixSum(BaseRecipeAnalysis):
             return rank_map
         filtered_df = meta_df[meta_df['name'] == "parallel_group_info"]
         if filtered_df.shape[0] == 1 and filtered_df.shape[1] == 2:
-            parallel_group_info = ast.literal_eval(filtered_df.loc[1, 'value'])
+            parallel_group_info = ast.literal_eval(filtered_df['value'].tolist()[0])
             for group_name, group_info in parallel_group_info.items():
                 global_ranks = group_info.get("global_ranks")
                 if isinstance(global_ranks, list) and global_ranks:
@@ -118,13 +118,16 @@ class CommMatrixSum(BaseRecipeAnalysis):
         for rank_data in mapper_res:
             matrix_df = rank_data.get(self.MATRIX_DATA)
             concat_df = pd.concat([concat_df, matrix_df], ignore_index=True)
+        if concat_df.empty:
+            logger.error("Communication matrix data is None.")
+            return
         concat_df[self.RANK_SET] = ""
         for index, row in concat_df.iterrows():
             if row["type"] == Constant.P2P:
-                row.at[index, self.RANK_SET] = Constant.P2P
+                concat_df.at[index, self.RANK_SET] = Constant.P2P
                 continue
             rank_list = sorted(rank_map.get(row["group_name"], {}).values())
-            row.at[index, self.RANK_SET] = ",".join([str(rank) for rank in rank_list])
+            concat_df.at[index, self.RANK_SET] = ",".join([str(rank) for rank in rank_list])
         grouped_df = concat_df.groupby(
             [self.RANK_SET, 'step', "hccl_op_name", "group_name", "src_rank", "dst_rank"]).agg(
             {'transport_type': 'first', 'op_name': 'first', "transit_size": "sum", "transit_time": "sum"})
-- 
Gitee


From 53dd65fd6599ad8c217bb0f08a1dafb02e6c50ca Mon Sep 17 00:00:00 2001
From: lcw <lichangwei4@huawei.com>
Date: Fri, 14 Mar 2025 17:35:04 +0800
Subject: [PATCH 140/145] =?UTF-8?q?=E3=80=90bugfix=E3=80=91=E8=A7=A3?=
 =?UTF-8?q?=E5=86=B3=E5=A4=96=E9=83=A8=E8=BE=93=E5=85=A5=E4=BD=9C=E4=B8=BA?=
 =?UTF-8?q?=E6=AD=A3=E5=88=99=E8=A1=A8=E8=BE=BE=E5=BC=8F=E7=9A=84=E5=AE=89?=
 =?UTF-8?q?=E5=85=A8=E9=97=AE=E9=A2=98?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 debug/accuracy_tools/msprobe/pytorch/parse_tool/lib/utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/parse_tool/lib/utils.py b/debug/accuracy_tools/msprobe/pytorch/parse_tool/lib/utils.py
index 66229d36b8d..db731b33824 100644
--- a/debug/accuracy_tools/msprobe/pytorch/parse_tool/lib/utils.py
+++ b/debug/accuracy_tools/msprobe/pytorch/parse_tool/lib/utils.py
@@ -264,7 +264,7 @@ class Util:
             match = re_pattern.match(name)
             if not match:
                 continue
-            if extern_pattern != '' and re_pattern.match(extern_pattern) and not re.match(extern_pattern, name):
+            if extern_pattern != '' and re_pattern.match(extern_pattern) and not name.startswith(extern_pattern):
                 continue
             file_list[name] = gen_info_func(name, match, file["root"])
         return file_list
-- 
Gitee


From 04f25fab4e70d000e6b18d177f7c18859fc7bc94 Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Mon, 17 Mar 2025 16:58:16 +0800
Subject: [PATCH 141/145] file_open_fix_for_security

---
 .../cluster_analyse/recipes/base_recipe_analysis.py  | 11 +++++------
 profiler/msprof_analyze/prof_common/file_manager.py  | 12 ++++++++++++
 2 files changed, 17 insertions(+), 6 deletions(-)

diff --git a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
index 69f80eef8d0..4b6ddaf9855 100644
--- a/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
+++ b/profiler/msprof_analyze/cluster_analyse/recipes/base_recipe_analysis.py
@@ -27,6 +27,7 @@ from msprof_analyze.prof_common.constant import Constant
 from msprof_analyze.prof_common.logger import get_logger
 from msprof_analyze.prof_common.path_manager import PathManager
 from msprof_analyze.cluster_analyse.cluster_data_preprocess.msprof_data_preprocessor import MsprofDataPreprocessor
+from msprof_analyze.prof_common.file_manager import FileManager
 
 logger = get_logger()
 
@@ -135,12 +136,10 @@ class BaseRecipeAnalysis(ABC):
         if replace_dict is None:
             shutil.copy(template_file, output_file_path)
         else:
-            with open(template_file, 'r') as f:
-                template_content = f.read()
-                for key, value in replace_dict.items():
-                    template_content = template_content.replace(str(key), str(value))
-            with open(output_file_path, 'w') as f:
-                f.write(template_content)
+            template_content = FileManager.read_common_file(template_file)
+            for key, value in replace_dict.items():
+                template_content = template_content.replace(str(key), str(value))
+            FileManager.create_common_file(output_file_path, template_content)
         logger.info(f"Notebook export path is: {output_file_path}")
 
     def add_helper_file(self, helper_file):
diff --git a/profiler/msprof_analyze/prof_common/file_manager.py b/profiler/msprof_analyze/prof_common/file_manager.py
index 7329d1d9f3c..c8d3f0827a2 100644
--- a/profiler/msprof_analyze/prof_common/file_manager.py
+++ b/profiler/msprof_analyze/prof_common/file_manager.py
@@ -114,6 +114,18 @@ class FileManager:
             raise RuntimeError(f"Failed to read the file: {base_name}, reason is {str(e)}") from e
         return content
 
+    @classmethod
+    def create_common_file(cls, file_path: str, content: str) -> None:
+        base_name = os.path.basename(file_path)
+        PathManager.check_path_writeable(os.path.dirname(file_path))
+        try:
+            with os.fdopen(
+                    os.open(file_path, os.O_WRONLY | os.O_CREAT, Constant.FILE_AUTHORITY),
+                    'w') as file:
+                file.write(content)
+        except Exception as e:
+            raise RuntimeError(f"Can't create file: {base_name}") from e
+
     @classmethod
     def create_csv_file(cls, profiler_path: str, data: list, file_name: str, headers: list = None) -> None:
         if not data:
-- 
Gitee


From 71c248ce28eb2ee43a0017347d5d0d6a2fc027fc Mon Sep 17 00:00:00 2001
From: zhouxianqi <13165993773@163.com>
Date: Mon, 10 Mar 2025 16:37:34 +0800
Subject: [PATCH 142/145] fix SQL Injection

---
 .../msprof_analyze/prof_common/constant.py    |  1 +
 .../prof_common/database_service.py           | 23 +++++++++++++++----
 .../msprof_analyze/prof_common/db_manager.py  | 11 +++++++++
 .../prof_exports/base_stats_export.py         |  8 ++++++-
 .../prof_exports/cann_api_sum_export.py       | 11 ++-------
 .../cluster_time_summary_export.py            |  6 +----
 .../prof_exports/compute_op_sum_export.py     | 22 ++++--------------
 .../prof_exports/ep_load_balance_ecport.py    | 14 +++--------
 .../prof_exports/hccl_sum_export.py           | 11 ++-------
 .../prof_exports/mstx_event_export.py         | 17 ++++++--------
 10 files changed, 57 insertions(+), 67 deletions(-)

diff --git a/profiler/msprof_analyze/prof_common/constant.py b/profiler/msprof_analyze/prof_common/constant.py
index a26de9f8f55..1e514b7c346 100644
--- a/profiler/msprof_analyze/prof_common/constant.py
+++ b/profiler/msprof_analyze/prof_common/constant.py
@@ -450,3 +450,4 @@ class Constant(object):
 
     UNKNOWN = "unknown"
 
+    SQL_PLACEHOLDER_PATTERN = r"\?|\%s"
diff --git a/profiler/msprof_analyze/prof_common/database_service.py b/profiler/msprof_analyze/prof_common/database_service.py
index 6b776d4d957..8cd4cdd2a1f 100644
--- a/profiler/msprof_analyze/prof_common/database_service.py
+++ b/profiler/msprof_analyze/prof_common/database_service.py
@@ -12,6 +12,8 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+import re
+
 import pandas as pd
 
 from msprof_analyze.prof_common.db_manager import DBManager
@@ -48,6 +50,8 @@ class DatabaseService:
         self._db_path = db_path
         self._step_range = step_range
         self._table_info = {}
+        self._param = (self._step_range.get(Constant.START_NS),
+                       self._step_range.get(Constant.END_NS)) if self._step_range else None
 
     def add_table_for_query(self, table_name: str, columns=None):
         if not isinstance(table_name, str):
@@ -71,15 +75,26 @@ class DatabaseService:
             if not DBManager.judge_table_exists(cursor, table_name):
                 logger.warning(f"This table {table_name} does not exist in this database {self._db_path}.")
                 continue
-            columns_str = "*" if not columns else ",".join(columns)
+            table_columns = DBManager.get_table_columns_name(cursor, table_name)
+            if not columns:
+                columns_str = ",".join(table_columns)
+            else:
+                columns = [column for column in columns if column in table_columns]
+                columns_str = ",".join(columns)
+            if not columns_str:
+                logger.error(f"The fields to be queried in Table {table_name} are invalid.")
+                return result_data
             if table_name in self.TABLE_TS_DICT and self._step_range:
-                where_str = f"where {self.TABLE_TS_DICT.get(table_name)} >= {self._step_range.get(Constant.START_NS)}" \
-                            f" and {self.TABLE_TS_DICT.get(table_name)} <= {self._step_range.get(Constant.END_NS)}"
+                where_str = f"where {self.TABLE_TS_DICT.get(table_name)} >= ? " \
+                            f"and {self.TABLE_TS_DICT.get(table_name)} <= ?"
             else:
                 where_str = ""
             query_sql = f"select {columns_str} from {table_name} {where_str}"
             try:
-                data = pd.read_sql(query_sql, conn)
+                if self._param is not None and re.search(Constant.SQL_PLACEHOLDER_PATTERN, query_sql):
+                    data = pd.read_sql(query_sql, conn, params=self._param)
+                else:
+                    data = pd.read_sql(query_sql, conn)
                 result_data[table_name] = data
             except Exception as err:
                 logger.error(err)
diff --git a/profiler/msprof_analyze/prof_common/db_manager.py b/profiler/msprof_analyze/prof_common/db_manager.py
index ac24ec8144f..151cb19ea53 100644
--- a/profiler/msprof_analyze/prof_common/db_manager.py
+++ b/profiler/msprof_analyze/prof_common/db_manager.py
@@ -189,6 +189,17 @@ class DBManager:
             cls.destroy_db_connect(conn, curs)
         return res
 
+    @classmethod
+    def get_table_columns_name(cls, curs: any, table: any) -> int:
+        sql = f"PRAGMA table_info({table})"
+        try:
+            curs.execute(sql)
+            columns = curs.fetchall()
+        except sqlite3.Error as err:
+            logger.error(err)
+            return []
+        return [column[1] for column in columns]
+
     @classmethod
     def fetch_all_data(cls: any, curs: any, sql: str, param: tuple = None, is_dict: bool = True) -> list:
         """
diff --git a/profiler/msprof_analyze/prof_exports/base_stats_export.py b/profiler/msprof_analyze/prof_exports/base_stats_export.py
index 6e0ff5e211e..2d17c41cb51 100644
--- a/profiler/msprof_analyze/prof_exports/base_stats_export.py
+++ b/profiler/msprof_analyze/prof_exports/base_stats_export.py
@@ -12,6 +12,7 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+import re
 
 import pandas as pd
 
@@ -29,6 +30,8 @@ class BaseStatsExport:
         self._analysis_class = analysis_class
         self._step_range = step_range
         self._query = None
+        self._param = (self._step_range.get(Constant.START_NS),
+                       self._step_range.get(Constant.END_NS)) if self._step_range else None
 
     def get_query(self):
         return self._query
@@ -43,7 +46,10 @@ class BaseStatsExport:
                 logger.error("query is None.")
                 return None
             conn, cursor = DBManager.create_connect_db(self._db_path, Constant.ANALYSIS)
-            data = pd.read_sql(query, conn)
+            if self._param is not None and re.search(Constant.SQL_PLACEHOLDER_PATTERN, query):
+                data = pd.read_sql(query, conn, params=self._param)
+            else:
+                data = pd.read_sql(query, conn)
             DBManager.destroy_db_connect(conn, cursor)
             return data
         except Exception as e:
diff --git a/profiler/msprof_analyze/prof_exports/cann_api_sum_export.py b/profiler/msprof_analyze/prof_exports/cann_api_sum_export.py
index 0d3da94a001..456aac95f07 100644
--- a/profiler/msprof_analyze/prof_exports/cann_api_sum_export.py
+++ b/profiler/msprof_analyze/prof_exports/cann_api_sum_export.py
@@ -64,12 +64,5 @@ class CannApiSumExport(BaseStatsExport):
 
     def __init__(self, db_path, recipe_name, step_range):
         super().__init__(db_path, recipe_name, step_range)
-        self._query = self.get_query_statement()
-
-    def get_query_statement(self):
-        if self._step_range:
-            filter_statement = f"WHERE CANN_API.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                               f"and CANN_API.startNs <= {self._step_range.get(Constant.END_NS)}"
-        else:
-            filter_statement = ""
-        return QUERY.format(filter_statement)
+        filter_statement = "WHERE CANN_API.startNs >= ? and CANN_API.startNs <= ?" if step_range else ""
+        self._query = QUERY.format(filter_statement)
diff --git a/profiler/msprof_analyze/prof_exports/cluster_time_summary_export.py b/profiler/msprof_analyze/prof_exports/cluster_time_summary_export.py
index f027635ab9c..36b86301dc7 100644
--- a/profiler/msprof_analyze/prof_exports/cluster_time_summary_export.py
+++ b/profiler/msprof_analyze/prof_exports/cluster_time_summary_export.py
@@ -34,9 +34,5 @@ class CommunicationTimeExport(BaseStatsExport):
 
     def __init__(self, db_path, recipe_name, step_range):
         super().__init__(db_path, recipe_name, step_range)
-        if step_range:
-            filter_statement = f"WHERE CANN_API.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                               f"and CANN_API.startNs <= {self._step_range.get(Constant.END_NS)}"
-        else:
-            filter_statement = ""
+        filter_statement = "WHERE CANN_API.startNs >= ? and CANN_API.startNs <= ?" if step_range else ""
         self._query = self.QUERY.format(filter_statement)
diff --git a/profiler/msprof_analyze/prof_exports/compute_op_sum_export.py b/profiler/msprof_analyze/prof_exports/compute_op_sum_export.py
index f337925dc36..24a2cc2d990 100644
--- a/profiler/msprof_analyze/prof_exports/compute_op_sum_export.py
+++ b/profiler/msprof_analyze/prof_exports/compute_op_sum_export.py
@@ -69,27 +69,13 @@ class ComputeOpSumExport(BaseStatsExport):
 
     def __init__(self, db_path, recipe_name, step_range):
         super().__init__(db_path, recipe_name, step_range)
-        self._query = self.get_query_statement()
-
-    def get_query_statement(self):
-        if self._step_range:
-            filter_statement = f"WHERE TASK.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                               f"and TASK.startNs <= {self._step_range.get(Constant.END_NS)}"
-        else:
-            filter_statement = ""
-        return QUERY.format(filter_statement)
+        filter_statement = "WHERE TASK.startNs >= ? and TASK.startNs <= ?" if step_range else ""
+        self._query = QUERY.format(filter_statement)
 
 
 class ComputeOpSumExportExcludeOpName(BaseStatsExport):
 
     def __init__(self, db_path, recipe_name, step_range):
         super().__init__(db_path, recipe_name, step_range)
-        self._query = self.get_query_statement()
-
-    def get_query_statement(self):
-        if self._step_range:
-            filter_statement = f"WHERE TASK.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                               f"and TASK.startNs <= {self._step_range.get(Constant.END_NS)}"
-        else:
-            filter_statement = ""
-        return QUERY_EXCLUDE_OPNAME.format(filter_statement)
+        filter_statement = "WHERE TASK.startNs >= ? and TASK.startNs <= ?" if step_range else ""
+        self._query = QUERY_EXCLUDE_OPNAME.format(filter_statement)
diff --git a/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py b/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py
index 6836edbd8a7..59acd6bdde7 100644
--- a/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py
+++ b/profiler/msprof_analyze/prof_exports/ep_load_balance_ecport.py
@@ -15,6 +15,7 @@
 
 from msprof_analyze.prof_exports.base_stats_export import BaseStatsExport
 from msprof_analyze.prof_common.constant import Constant
+
 GROUPED_MATMUL_QUERY = """
 SELECT
     InputShapes_IDS.value AS "InputShapes"
@@ -36,14 +37,5 @@ class InputShapeExport(BaseStatsExport):
 
     def __init__(self, db_path, recipe_name, step_range):
         super().__init__(db_path, recipe_name, step_range)
-        self._query = self.get_query_statement()
-
-    def get_query_statement(self):
-        if self._step_range:
-            filter_statement = (
-                f"And TASK.startNs >= {self._step_range.get(Constant.START_NS)} "
-                f"And TASK.endNs <= {self._step_range.get(Constant.END_NS)}"
-            )
-        else:
-            filter_statement = ""
-        return GROUPED_MATMUL_QUERY.format(filter_statement)
\ No newline at end of file
+        filter_statement = "And TASK.startNs >= ? And TASK.endNs <= ?" if step_range else ""
+        self._query = GROUPED_MATMUL_QUERY.format(filter_statement)
diff --git a/profiler/msprof_analyze/prof_exports/hccl_sum_export.py b/profiler/msprof_analyze/prof_exports/hccl_sum_export.py
index c577d40c0f5..80750ef88dd 100644
--- a/profiler/msprof_analyze/prof_exports/hccl_sum_export.py
+++ b/profiler/msprof_analyze/prof_exports/hccl_sum_export.py
@@ -41,12 +41,5 @@ class HcclSumExport(BaseStatsExport):
 
     def __init__(self, db_path, recipe_name, step_range):
         super().__init__(db_path, recipe_name, step_range)
-        self._query = self.get_query_statement()
-
-    def get_query_statement(self):
-        if self._step_range:
-            filter_statement = f"WHERE COMMUNICATION_OP.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                               f"and COMMUNICATION_OP.startNs <= {self._step_range.get(Constant.END_NS)}"
-        else:
-            filter_statement = ""
-        return QUERY.format(filter_statement)
+        filter_stat = "WHERE COMMUNICATION_OP.startNs >= ? and COMMUNICATION_OP.startNs <= ?" if step_range else ""
+        self._query = QUERY.format(filter_stat)
diff --git a/profiler/msprof_analyze/prof_exports/mstx_event_export.py b/profiler/msprof_analyze/prof_exports/mstx_event_export.py
index 97c3813b7eb..76bf4672b61 100644
--- a/profiler/msprof_analyze/prof_exports/mstx_event_export.py
+++ b/profiler/msprof_analyze/prof_exports/mstx_event_export.py
@@ -58,13 +58,14 @@ class MstxMarkExport(BaseStatsExport):
     def __init__(self, db_path, recipe_name, step_range):
         super().__init__(db_path, recipe_name, step_range)
         self._query = self.get_query_statement()
+        self._param = (step_range.get(Constant.START_NS), step_range.get(Constant.END_NS),
+                       step_range.get(Constant.START_NS),
+                       step_range.get(Constant.END_NS)) if step_range else None
 
     def get_query_statement(self):
         if self._step_range:
-            filter_statement_1 = f"WHERE PYTORCH_API.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                                 f"AND PYTORCH_API.startNs <= {self._step_range.get(Constant.END_NS)}"
-            filter_statement_2 = f"AND MSTX_EVENTS.startNs >= {self._step_range.get(Constant.START_NS)} " \
-                                 f"AND MSTX_EVENTS.startNs <= {self._step_range.get(Constant.END_NS)}"
+            filter_statement_1 = "WHERE PYTORCH_API.startNs >= ? AND PYTORCH_API.startNs <= ?"
+            filter_statement_2 = "AND MSTX_EVENTS.startNs >= ? AND MSTX_EVENTS.startNs <= ?"
         else:
             filter_statement_1, filter_statement_2 = "", ""
         return MARK_QUERY.format(filter_statement_1, filter_statement_2)
@@ -99,9 +100,5 @@ class MstxRangeExport(BaseStatsExport):
 
     def __init__(self, db_path, recipe_name, step_range):
         super().__init__(db_path, recipe_name, step_range)
-        self._query = self.get_query_statement()
-
-    def get_query_statement(self):
-        filter_statement = f"AND MSTX_EVENTS.startNs >= {self._step_range.get(Constant.START_NS)} AND " \
-                           f"MSTX_EVENTS.startNs <= {self._step_range.get(Constant.END_NS)}" if self._step_range else ""
-        return RANGE_QUERY.format(filter_statement)
+        filter_statement = "AND MSTX_EVENTS.startNs >= ? AND MSTX_EVENTS.startNs <= ?" if step_range else ""
+        self._query = RANGE_QUERY.format(filter_statement)
-- 
Gitee


From 528db8dbbd24b19f8d6691a8ff85177495d328b2 Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Tue, 18 Mar 2025 10:51:30 +0800
Subject: [PATCH 143/145] =?UTF-8?q?=E5=88=A0=E9=99=A4=E5=86=97=E4=BD=99?=
 =?UTF-8?q?=E4=BB=A3=E7=A0=81?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../bench_functions/flash_attention_score.py  | 61 -------------------
 .../mindspore/code_mapping/graph_parser.py    | 18 ------
 2 files changed, 79 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
index cb268efeae9..c5adc984241 100644
--- a/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
+++ b/debug/accuracy_tools/msprobe/mindspore/api_accuracy_checker/bench_functions/flash_attention_score.py
@@ -230,67 +230,6 @@ def convert_to_bnsd(_input, n, input_layout):
     return out.to(GTYPE)
 
 
-def convert_from_bsnd(_input, input_layout):
-    """
-    transform qkv from bsnd to input_layout.
-    B: batch_size
-    S: sequence_length
-    N: num_heads
-    D: head_dim
-    Args:
-       _input (torch.Tensor): tensor of shape (B,S,N,D)
-        input_layout (str): "BSH" or "SBH" or "BSND" or "BNSD" or "TND"
-    Returns:
-        tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
-    """
-    if input_layout == "BSH":
-        # (B,S,N,D)=>(B,S,N*D)
-        out = rearrange(_input, 'b s n d -> b s (n d)').contiguous()
-    elif input_layout == "SBH":
-        # (B,S,N,D)=>(S,B,N*D)
-        out = rearrange(_input, 'b s n d -> s b (n d)').contiguous()
-    elif input_layout == "BNSD":
-        # (B,S,N,D)=>(B,N,S,D)
-        out = rearrange(_input, 'b s n d -> b n s d').contiguous()
-    elif input_layout == "TND":
-        raise ValueError(f"input_layout {input_layout} does not supported for now.")
-    else:
-        out = _input
-    return out
-
-
-def convert_to_bsnd(_input, n, input_layout):
-    """
-    transform qkv from input_layout to bsnd.
-    B: batch_size
-    S: sequence_length
-    N: num_heads
-    D: head_dim
-    Args:
-        _input (torch.Tensor): tensor of shape (B,N,S,D) or (B,S,N,D) or (S,B,H) or (B,S,H)
-        n (int): num_heads
-        input_layout (str):"BSH" or "SBH" or "BSND" or "BNSD" or "TND"
-    Returns:
-        tensor of shape (B,S,N,D)
-    """
-    if input_layout == "BSH":
-        # (B,S,N*D)=>(B,S,N,D)
-        out = rearrange(_input, 'b s (n d) -> b s n d', n=n)
-    elif input_layout == "SBH":
-        # (S,B,N*D)=>(B,S,N,D)
-        out = rearrange(_input, 's b (n d) -> b s n d', n=n)
-    elif input_layout == "BNSD":
-        # (B,N,S,D)=>(B,S,N,D)
-        out = rearrange(_input, 'b n s d -> b s n d', n=n)
-    elif input_layout == "TND":
-        raise ValueError(f"input_layout {input_layout} does not supported for now.")
-    else:
-        out = _input
-    if out.dim() != 4:
-        raise ValueError(f"convert qkv format failed with input_layout {input_layout}.")
-    return out
-
-
 def generate_attn_mask(*args):
     """
     # 当sparse_mode=2、3、4时小算子到融合算子会走这个优化，反过来看就要拆解回原来的基本实现
diff --git a/debug/accuracy_tools/msprobe/mindspore/code_mapping/graph_parser.py b/debug/accuracy_tools/msprobe/mindspore/code_mapping/graph_parser.py
index ee35750fb35..262e3b6fe07 100644
--- a/debug/accuracy_tools/msprobe/mindspore/code_mapping/graph_parser.py
+++ b/debug/accuracy_tools/msprobe/mindspore/code_mapping/graph_parser.py
@@ -34,19 +34,6 @@ class Parser:
             if isinstance(subgraph_node.attrs, list):
                 subgraph_node.attrs.extend(attrs)
 
-    @staticmethod
-    def parse_graph_attributes(text: str, graph_node: GraphNode) -> None:
-        attr_pattern = re.compile(r'# Attrs:\s*(.*)', re.DOTALL)
-        match = attr_pattern.search(text, graph_node.pos)
-        if match:
-            attrs = match.group(1).strip().split('\n')
-            for attr in attrs:
-                if not attr:
-                    break
-                key, value = attr.split(':')
-                if isinstance(graph_node.attrs, dict):
-                    graph_node.attrs[key.strip()] = value.strip()
-
     @staticmethod
     def parse_code_info(text: str, start_pos: int, end_pos: int) -> List[str]:
         code_info = []
@@ -203,11 +190,6 @@ class Parser:
             subgraph_info.end = end_pos
             logging.info('Parsed subgraph: %s', subgraph_name)
 
-    def count_nodes(self) -> Tuple[int, int]:
-        total_nodes = len(self.nodes)
-        total_cnodes = sum(1 for node in self.nodes.values() if node.name.startswith('CNode'))
-        return total_nodes, total_cnodes
-
     def create_backward_map(self):
         for node in self.nodes.values():
             if node.scope and node.scope.startswith("Gradients"):
-- 
Gitee


From 5bfa21a49c3de7ba3577bed7c19dbbb9184d1b9f Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Mon, 24 Mar 2025 16:12:32 +0800
Subject: [PATCH 144/145] =?UTF-8?q?=E4=BF=AE=E6=94=B9=E5=AE=89=E5=85=A8?=
 =?UTF-8?q?=E9=97=AE=E9=A2=98?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 debug/accuracy_tools/msprobe/pytorch/function_factory.py      | 2 +-
 debug/accuracy_tools/msprobe/pytorch/pt_config.py             | 4 +++-
 debug/accuracy_tools/msprobe/pytorch/service.py               | 2 +-
 .../accuracy_tools/msprobe/test/pytorch_ut/test_pt_config.py  | 2 +-
 4 files changed, 6 insertions(+), 4 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/function_factory.py b/debug/accuracy_tools/msprobe/pytorch/function_factory.py
index 247e2cd0ed5..f515b5d4783 100644
--- a/debug/accuracy_tools/msprobe/pytorch/function_factory.py
+++ b/debug/accuracy_tools/msprobe/pytorch/function_factory.py
@@ -70,7 +70,7 @@ class Register(dict):
 
         def add_register_item(key, value):
             if key in self._dict:
-                logger.warning(f"{value.__name__} has been registered before, so we will overriden it.")
+                logger.warning(f"{value.__name__} has been registered before, so we will override it.")
             self[key] = value
             return value
 
diff --git a/debug/accuracy_tools/msprobe/pytorch/pt_config.py b/debug/accuracy_tools/msprobe/pytorch/pt_config.py
index 8293ac96949..64a11a0925d 100644
--- a/debug/accuracy_tools/msprobe/pytorch/pt_config.py
+++ b/debug/accuracy_tools/msprobe/pytorch/pt_config.py
@@ -95,6 +95,8 @@ class OverflowCheckConfig(BaseConfig):
     def check_overflow_config(self):
         if self.overflow_nums is not None and not is_int(self.overflow_nums):
             raise Exception("overflow_num is invalid")
+        if self.overflow_nums is not None and self.overflow_nums != -1 and self.overflow_nums <= 0:
+            raise Exception("overflow_nums should be -1 or positive integer")
         if self.check_mode is not None and self.check_mode not in ["all", "aicore", "atomic"]:
             raise Exception("check_mode is invalid")
 
@@ -148,7 +150,7 @@ class FreeBenchmarkCheckConfig(BaseConfig):
                 self.pert_mode in PytorchFreeBenchmarkConst.CPU_MODE_LIST
         ):
             msg = (
-                f"You neet to and can only set fuzz_device as {DeviceType.CPU} "
+                f"You need to and can only set fuzz_device as {DeviceType.CPU} "
                 f"when pert_mode in {PytorchFreeBenchmarkConst.CPU_MODE_LIST}"
             )
             logger.error_log_with_exp(
diff --git a/debug/accuracy_tools/msprobe/pytorch/service.py b/debug/accuracy_tools/msprobe/pytorch/service.py
index b0b2780328d..27235292e1e 100644
--- a/debug/accuracy_tools/msprobe/pytorch/service.py
+++ b/debug/accuracy_tools/msprobe/pytorch/service.py
@@ -412,7 +412,7 @@ class Service:
         if self.config.nfs_path:
             self.attl.upload("end")
         elif self.attl.socket_manager is not None:
-            logger.info(f"pid: {os.getpid()} finished, start send STOP signal.")
+            logger.info(f"pid: {os.getpid()} finished, start sends STOP signal.")
             self.attl.socket_manager.send_stop_signal()
 
     def reset_status(self):
diff --git a/debug/accuracy_tools/msprobe/test/pytorch_ut/test_pt_config.py b/debug/accuracy_tools/msprobe/test/pytorch_ut/test_pt_config.py
index c1b8bac47fd..d5c7fdea28a 100644
--- a/debug/accuracy_tools/msprobe/test/pytorch_ut/test_pt_config.py
+++ b/debug/accuracy_tools/msprobe/test/pytorch_ut/test_pt_config.py
@@ -268,7 +268,7 @@ class TestFreeBenchmarkCheckConfig(unittest.TestCase):
         invalid_config["fuzz_device"] = "cpu"
         invalid_config["pert_mode"] = "INVALID_CPU_MODE"
         config = FreeBenchmarkCheckConfig(invalid_config)
-        self.assertIn("You neet to and can only set fuzz_device as ", str(mock_error.call_args))
+        self.assertIn("You need to and can only set fuzz_device as ", str(mock_error.call_args))
 
     @patch('msprobe.core.common.log.logger.error_log_with_exp')
     def test_check_handler_type_invalid(self, mock_error):
-- 
Gitee


From 60a7c97634051618e9b158b6dbf5fdd052c53a1e Mon Sep 17 00:00:00 2001
From: yangxinxian <947098055@qq.com>
Date: Thu, 27 Mar 2025 15:01:21 +0800
Subject: [PATCH 145/145] Update pt_config.py

---
 debug/accuracy_tools/msprobe/pytorch/pt_config.py | 2 --
 1 file changed, 2 deletions(-)

diff --git a/debug/accuracy_tools/msprobe/pytorch/pt_config.py b/debug/accuracy_tools/msprobe/pytorch/pt_config.py
index 64a11a0925d..fedc62a32d6 100644
--- a/debug/accuracy_tools/msprobe/pytorch/pt_config.py
+++ b/debug/accuracy_tools/msprobe/pytorch/pt_config.py
@@ -95,8 +95,6 @@ class OverflowCheckConfig(BaseConfig):
     def check_overflow_config(self):
         if self.overflow_nums is not None and not is_int(self.overflow_nums):
             raise Exception("overflow_num is invalid")
-        if self.overflow_nums is not None and self.overflow_nums != -1 and self.overflow_nums <= 0:
-            raise Exception("overflow_nums should be -1 or positive integer")
         if self.check_mode is not None and self.check_mode not in ["all", "aicore", "atomic"]:
             raise Exception("check_mode is invalid")
 
-- 
Gitee