diff --git "a/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" "b/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" index fa48133759510dd6a9ae7e0e715e35ddfb05b7f4..b607ca83900a055218b6991483ad953a0778470e 100644 --- "a/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" +++ "b/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" @@ -815,7 +815,7 @@ Python版本不对,执行位置也不对 所以这里想用外面的环境直接conda deactivate 为了一直有效直接添加到环境变量中。 -### FAQ30、Alexnet dropout 精度不达标规避方法。 +### FAQ40、Alexnet dropout 精度不达标规避方法。 * 现象描述 Alexnet dropout npu精度不达标 * 处理方法 @@ -858,6 +858,20 @@ Python版本不对,执行位置也不对 ) ``` +### FAQ41、mmdet在做hook定位时反向过程报错 +- 现象描述 +![](https://gitee.com/zwx5317131/ascend-pytorch-crowdintelligence-doc/raw/master/figures/model_faq41_0625_fig1.PNG) + +- 原因分析 + +这个是torch的原始BUG,如果是空dict就会死循环;因为mmdet自己会包装dict,所以这里一定要读到tensor,才会正常执行 +- 处理方法 +代码参考路径为:/usr/local/python3.7.5/lib/python3.7/site-packages/torch/nn/modules/module.py +适配代码参考如下: +![](https://gitee.com/zwx5317131/ascend-pytorch-crowdintelligence-doc/raw/master/figures/model_faq41_0625_fig2.PNG) + + + ## [2.2 NPU模型分布式运行常见问题FAQ](#22-NPU模型分布式运行常见问题FAQ) diff --git a/figures/model_faq41_0625_fig1.PNG b/figures/model_faq41_0625_fig1.PNG new file mode 100644 index 0000000000000000000000000000000000000000..01436e7faf02ea0be9d41d641e496daedb6503b8 Binary files /dev/null and b/figures/model_faq41_0625_fig1.PNG differ diff --git a/figures/model_faq41_0625_fig2.PNG b/figures/model_faq41_0625_fig2.PNG new file mode 100644 index 0000000000000000000000000000000000000000..dfa82c0d5dbcd3ce36978f43f52b4c54c447c0b0 Binary files /dev/null and b/figures/model_faq41_0625_fig2.PNG differ