diff --git "a/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" "b/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" index 10d3ec407998cd21b724628f14e78a5764524222..9486d0d61adc1930bb8cae398f399bd303dec6d0 100644 --- "a/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" +++ "b/AscendPytorch\346\250\241\345\236\213\344\274\227\346\231\272FAQ.md" @@ -403,6 +403,23 @@ StopIteration 找不到数据集,检查数据集路径和数据集是否有效。 + +### FAQ20、模型训练时报libtorch_npu.so: undefined symbol: aclopSetCompileFlag错误。 + +* 现象描述 + +![](https://gitee.com/wangjiangben_hw/ascend-pytorch-crowdintelligence-doc/raw/master/figures/model_faq20_0528.png) + +* 原因分析 + + 环境中的pytorch版本与toolkit版本不匹配,或存在多个tookit版本,环境变量未正确指定。 + +* 处理方法 + + 1)重新安装版本匹配的torch或者toolkit。 + 2)重新设置环境变量,指定正确的toolkit路径。 + + ## [2.2 NPU模型分布式运行常见问题FAQ](#22-NPU模型分布式运行常见问题FAQ) ### FAQ1、在模型分布式训练时,遇到报错 host not found. diff --git a/figures/model_faq20_0528.png b/figures/model_faq20_0528.png new file mode 100644 index 0000000000000000000000000000000000000000..739a7308a39a345ef4ced30de765e4344adedcb1 Binary files /dev/null and b/figures/model_faq20_0528.png differ