diff --git "a/docs/zh/PyTorch API\346\224\257\346\214\201\346\270\205\345\215\225.md" "b/docs/zh/PyTorch API\346\224\257\346\214\201\346\270\205\345\215\225.md" index a84477bb96533c9356d69bae9540e5586f7f2983..fa467161ff5ef26d2b2d76ebc2b65732bf37fdbc 100644 --- "a/docs/zh/PyTorch API\346\224\257\346\214\201\346\270\205\345\215\225.md" +++ "b/docs/zh/PyTorch API\346\224\257\346\214\201\346\270\205\345\215\225.md" @@ -924,7 +924,7 @@ | 146 | torch.nn.LSTM | 是 | | 147 | torch.nn.GRU | 是,DynamicGRUV2场景暂不支持 | | 148 | torch.nn.RNNCell | 是 | -| 149 | torch.nn.LSTMCell | 是 | +| 149 | torch.nn.LSTMCell | 是,非16对齐场景暂不支持 | | 150 | torch.nn.GRUCell | 是 | | 151 | torch.nn.Transformer | 是 | | 152 | torch.nn.Transformer.forward | 是 | diff --git "a/docs/zh/PyTorch\347\275\221\347\273\234\346\250\241\345\236\213\347\247\273\346\244\215&\350\256\255\347\273\203\346\214\207\345\215\227/PyTorch\347\275\221\347\273\234\346\250\241\345\236\213\347\247\273\346\244\215&\350\256\255\347\273\203\346\214\207\345\215\227.md" "b/docs/zh/PyTorch\347\275\221\347\273\234\346\250\241\345\236\213\347\247\273\346\244\215&\350\256\255\347\273\203\346\214\207\345\215\227/PyTorch\347\275\221\347\273\234\346\250\241\345\236\213\347\247\273\346\244\215&\350\256\255\347\273\203\346\214\207\345\215\227.md" index 206e94502793a515cf48e5f4d3b3ef56b25d5b84..63a8e559b69f90c665a890406e3cb938a1b0af82 100644 --- "a/docs/zh/PyTorch\347\275\221\347\273\234\346\250\241\345\236\213\347\247\273\346\244\215&\350\256\255\347\273\203\346\214\207\345\215\227/PyTorch\347\275\221\347\273\234\346\250\241\345\236\213\347\247\273\346\244\215&\350\256\255\347\273\203\346\214\207\345\215\227.md" +++ "b/docs/zh/PyTorch\347\275\221\347\273\234\346\250\241\345\236\213\347\247\273\346\244\215&\350\256\255\347\273\203\346\214\207\345\215\227/PyTorch\347\275\221\347\273\234\346\250\241\345\236\213\347\247\273\346\244\215&\350\256\255\347\273\203\346\214\207\345\215\227.md" @@ -2024,13 +2024,14 @@ with torch.npu.profile(profiler_result_path="./results", use_e2e_profiler=True, - 调优结果: - 调优完成后,结果会保存在TUNE_BANK_PATH环境变量中指定的//目录,若不设置则默认保存在/{HOME}/ascend/latest/data/aoe/custom/op/目录下;root用户则保存在/root/ascend/latest/data/aoe/custom/op/。soc_version表示芯片类型,如Ascend910A。 + 调优完成后,结果会保存在TUNE_BANK_PATH环境变量中指定的//目录,若不设置则默认保存在/{HOME}/Ascend/latest/data/aoe/custom/op/目录下;root用户则保存在/root/Ascend/latest/data/aoe/custom/op/。soc_version表示芯片类型,如Ascend910A。 #### 注意事项 1. 目前仅支持静态算子,动态算子暂不支持。 2. dump算子信息时,目前无法对算子信息去重,且仅需执行一个step,否则会导致调优时间过长。 3. 建议使用1P脚本进行dump图,多P会存在dump覆盖的问题。 +4. 使用前需关闭profiling工具,否则会影响模型性能。 #### 性能验证