diff --git "a/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/PyTorch\347\246\273\347\272\277\346\216\250\347\220\206-FAQ.md" "b/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/PyTorch\347\246\273\347\272\277\346\216\250\347\220\206-FAQ.md" index 47f247c0b3253d1d83493fba047397aea9b5a018..4732dd0b6136c6749ab81fc109793a563ff6cf88 100644 --- "a/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/PyTorch\347\246\273\347\272\277\346\216\250\347\220\206-FAQ.md" +++ "b/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/PyTorch\347\246\273\347\272\277\346\216\250\347\220\206-FAQ.md" @@ -10,6 +10,7 @@ - [FAQ6、onnx转om模型报错atc命令ERROR问题解决](#faq15onnx转om模型报错atc命令error问题解决) - [FAQ7、离线推理后处理脚本适配](#faq16离线推理后处理脚本适配) - [FAQ8、执行数据集预处理报错](#faq17执行数据集预处理报错) + - [FAQ9、模型推理工具常见的错误&&解决方案](#faq18模型推理工具常见的错误&&解决方案) - [2.2 PyTorch离线推理精度调试常见问题FAQ](#22-PyTorch离线推理精度调试常见问题faq) - [2.3 PyTorch离线推理性能优化常见问题FAQ](#23-PyTorch离线推理性能优化常见问题faq) # [1 介绍](#1-介绍) @@ -252,6 +253,42 @@ PIL.UnidentifeldImageError: cannot identify image file '/opt/npu/imagenet/val/xx 解决方法:更换未损坏的val数据集。 +### FAQ9、模型推理工具常见的错误&&解决方案 +当前默认的模型推理是benchmark工具,以下为常见错误和一些解决方案: + +1. 输入文件不存在 + +错误日志: +``` +[ERROR] Get absolute xxx path failed! +[ERROR] Get flags path failed! +``` +解决思路:通常是因为输入的input_image_path/input_text_path文件名写错或者不存在 + +2. 模型输入数据存在问题 + +错误日志: +``` +[ERROR][Inference] Input data size don't match the model input size! len is xx, singleSize is xx +[ERROR][Inference] Call create model dataset size failed! +``` +解决思路:通常是dump出来的bin文件有问题,如size等 + +3. 输入数据的info文件存在问题 + +错误日志: +``` +# 常见于nlp等模型 +[ERROR][DataManager] Get language text path failed, please check language text list file! +``` +解决思路:通常是输入的input_image_path/input_text_path格式问题,如常见的nlp模型通常会有多输入的场合会有输入顺序/输入名的问题 + +4. 模型不支持的输入 +解决思路:当前benchmark工具支持的模型类型有:图像/自然语音/YOLO检测/搜索/语义理解/翻译,但存在不支持的输入类型如:3D的输入(如视频理解/点云等),可以采用[msame工具](https://gitee.com/ascend/tools/tree/master/msame)进行推理。 + +5. 其他问题待补充 + + ## [2.2 PyTorch离线推理精度调试常见问题FAQ](#22-PyTorch离线推理精度调试常见问题FAQ) 1.根据推理流程逐步排查引起精度下降的问题点,先粗调确认是哪个流程的问题再微调