diff --git "a/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" "b/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" index 41c096996235e52cf3357d26e76bf2098806c8a1..33b595e64bcc71442337f68e98c265353777c0c1 100644 --- "a/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" +++ "b/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" @@ -532,6 +532,36 @@ StopIteration 3)对于前两种办法都无法安装的包,那只能使用源码安装了,目前像 kaldi,xtcocotools 这类包需要使用gitee或者github上共享的源码,根据他的readme来编译安装。 +### FAQ27、模型训练时出现argmax算子计算问题。 + +* 现象描述 + +![](https://gitee.com/zhangjie11ee/ascend-pytorch-crowdintelligence-doc/raw/master/figures/model_faq27_0618.png) + +* 原因分析 + + 1.因为传进去的输入的NCHW会发生变化,需要提前固定,不然会出现形状问题 + +* 处理方法 + + 1)需要对输入进行处理,参考如下: + output.data = output.data.npu_format_cast(0) + predict = torch.argmax(output, 1).to(torch.int32) + 1 + +### FAQ28、模型推理时加载pth出现问题。 + +* 现象描述 + +![](https://gitee.com/zhangjie11ee/ascend-pytorch-crowdintelligence-doc/raw/master/figures/model_faq28_0618.png) + +* 原因分析 + + 1.pth在npu上时加载会出现加载失败的现象 + +* 处理方法 + + 1)需要添加:pretrained_net = torch.load(cfg["test"]["ckpt_path"], map_location='cpu') + ## [2.2 NPU模型分布式运行常见问题FAQ](#22-NPU模型分布式运行常见问题FAQ) diff --git a/figures/model_faq27_0618.png b/figures/model_faq27_0618.png new file mode 100644 index 0000000000000000000000000000000000000000..89277d60786e0c3dc3513086471b749126830c6b Binary files /dev/null and b/figures/model_faq27_0618.png differ diff --git a/figures/model_faq28_0618.png b/figures/model_faq28_0618.png new file mode 100644 index 0000000000000000000000000000000000000000..4d02f95c6d2dd751844fe990ce15b480f9ab5959 Binary files /dev/null and b/figures/model_faq28_0618.png differ