From 98d4c6eb9590fd4375326828cc27069c46e7ed81 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=BD=AD=E4=B8=9A=E5=BA=86?= <pengyeqing@huawei.com>
Date: Sun, 10 Oct 2021 14:01:38 +0000
Subject: [PATCH] =?UTF-8?q?update=20Ascend-PyTorch=E7=A6=BB=E7=BA=BF?=
 =?UTF-8?q?=E6=8E=A8=E7=90=86=E6=8C=87=E5=AF=BC/=E4=B8=93=E9=A2=98?=
 =?UTF-8?q?=E6=A1=88=E4=BE=8B/=E5=8A=9F=E8=83=BD=E6=89=93=E9=80=9A/?=
 =?UTF-8?q?=E7=9B=AE=E6=A0=87=E8=B7=9F=E8=B8=AASiamMask-=E7=BD=91=E7=BB=9C?=
 =?UTF-8?q?=E5=88=86=E6=AE=B5.md.?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...mMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git "a/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" "b/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md"
index 8c5a64f..ea21417 100644
--- "a/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md"
+++ "b/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md"
@@ -2,5 +2,5 @@
 1.由于pytorch与onnx框架实现引起的bn算子属性epsilon，momentum在两种框架下略微不同，onnx精度与pth精度差了一点，但是om与onnx精度一致。  
 2.因为SiamMask是前后帧连续处理，即上一帧的输入作为下一帧的输出，在Refine模块中进行动态pad，因此模型需要拆分为两段。因为SiamMask部分卷积存在使用自定义kernel来对输入进行卷积操作，导致卷积存在kernel和input的双输入的情况，[issue](http://github.com/onnx/onnx-tensorrt/issues/645)，故在线推理测试性能。计算的是拆分的两部分模型合在一起完整推理的性能。  
 3.因为SiamMask在corr部分固定了reshape之后的形状，并且针对前后帧连续处理，所以模型不支持多batch。  
-4.推理速度较慢的问题目前出在io部分。如果`msame`支持将数据从内存中读写而不必须从`.bin`文件中读写，速度将会进一步加快。  
-5.msame保存为bin格式并以float32加载比TXT格式精度高一些，性能也更好。  
\ No newline at end of file
+4.msame保存为bin格式并以float32加载比TXT格式精度高一些，性能也更好。  
+5.推理速度较慢的问题目前出在io部分。如果`msame`支持将数据从内存中读写而不必须从`.bin`文件中读写，速度将会进一步加快。  
\ No newline at end of file
-- 
Gitee