From 98d4c6eb9590fd4375326828cc27069c46e7ed81 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E5=BD=AD=E4=B8=9A=E5=BA=86?= Date: Sun, 10 Oct 2021 14:01:38 +0000 Subject: [PATCH] =?UTF-8?q?update=20Ascend-PyTorch=E7=A6=BB=E7=BA=BF?= =?UTF-8?q?=E6=8E=A8=E7=90=86=E6=8C=87=E5=AF=BC/=E4=B8=93=E9=A2=98?= =?UTF-8?q?=E6=A1=88=E4=BE=8B/=E5=8A=9F=E8=83=BD=E6=89=93=E9=80=9A/?= =?UTF-8?q?=E7=9B=AE=E6=A0=87=E8=B7=9F=E8=B8=AASiamMask-=E7=BD=91=E7=BB=9C?= =?UTF-8?q?=E5=88=86=E6=AE=B5.md.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...mMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git "a/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" "b/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" index 8c5a64f..ea21417 100644 --- "a/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" +++ "b/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" @@ -2,5 +2,5 @@ 1.由于pytorch与onnx框架实现引起的bn算子属性epsilon,momentum在两种框架下略微不同,onnx精度与pth精度差了一点,但是om与onnx精度一致。 2.因为SiamMask是前后帧连续处理,即上一帧的输入作为下一帧的输出,在Refine模块中进行动态pad,因此模型需要拆分为两段。因为SiamMask部分卷积存在使用自定义kernel来对输入进行卷积操作,导致卷积存在kernel和input的双输入的情况,[issue](http://github.com/onnx/onnx-tensorrt/issues/645),故在线推理测试性能。计算的是拆分的两部分模型合在一起完整推理的性能。 3.因为SiamMask在corr部分固定了reshape之后的形状,并且针对前后帧连续处理,所以模型不支持多batch。 -4.推理速度较慢的问题目前出在io部分。如果`msame`支持将数据从内存中读写而不必须从`.bin`文件中读写,速度将会进一步加快。 -5.msame保存为bin格式并以float32加载比TXT格式精度高一些,性能也更好。 \ No newline at end of file +4.msame保存为bin格式并以float32加载比TXT格式精度高一些,性能也更好。 +5.推理速度较慢的问题目前出在io部分。如果`msame`支持将数据从内存中读写而不必须从`.bin`文件中读写,速度将会进一步加快。 \ No newline at end of file -- Gitee