From cdd97db85074ebf4107666e13b68c7b15bf7a17a Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Wed, 23 Nov 2022 11:12:14 +0800
Subject: [PATCH 01/17] =?UTF-8?q?Create=20=E5=85=AD=E7=BB=B4=E5=BA=A6?=
 =?UTF-8?q?=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95.md?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...04\346\265\213\346\226\271\346\263\225.md" | 66 +++++++++++++++++++
 1 file changed, 66 insertions(+)
 create mode 100644 "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
new file mode 100644
index 0000000..2dda0cf
--- /dev/null
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -0,0 +1,66 @@
+# BI-V100评测方法
+
+## 前置条件
+
+1. 获取天数智芯BI-V100算力
+2. 安装天数智芯软件栈
+
+## 使用工具
+
+- ixSMI工具：包含在天数智芯软件栈中，当您安装好天数智芯软件栈后即可通过ixsmi进行调用
+- DeepSpark模型训练脚本：脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据
+
+## 六维度数据计算方法
+
+### 速度
+
+定义：单机模型稳定训练时每秒处理的单位样本的算力。
+
+数据来源：脚本会打印训练过程中每个iteration，每个epoch的每秒处理的单位样本数量。
+
+计算方法：即指定迭代轮次5次去掉最高最低，取中间3次的mean中值。如第一个iteration的第6到第10个epoch中，最高是第6个、最低是第10个epoch，则取第7个、第8个和第9个epoch的值相加除以3。
+
+### 准确性
+
+定义：模型收敛的精度值。
+
+数据来源：脚本会打印训练过程中每个iteration，每个epoch的训练准确度。
+
+计算方法：随着训练迭代而模型的loss变化不再显著时，模型是否达到判定为收敛所要求的准确度，记录此时的精度值。
+
+### 线性度
+
+定义：模型集群规模化训练的scalability，算力线性扩展性能。
+
+数据来源：脚本会打印训练过程中每个iteration，每个epoch的每秒处理的单位样本数量。
+
+计算方法：线性度具体还可以分为如下两种：
+
+- 多卡对单卡的线性度：在一台服务器上使用多张BI-V100训练时每秒处理的单位样本数量（即速度）对比使用1张BI-V100训练时的速度，再除以多卡的卡数。例如，使用8张BI-V100时的训练速度除以使用1张BI-V100时的训练速度，再除以卡的倍数（即8），得到8卡对单卡的线性度。
+
+- 多节点对单节点的线性度：在每台服务器（即节点）安装相同数量的BI-V100卡前提下，使用多台服务器训练的每秒处理的单位样本数量（即速度）对比使用1台服务器训练时的速度，再除以多台服务器的台数。例如，使用2台服务器（都安装了8张BI-V100）时的训练速度除以使用1台服务器时的训练速度，再除以服务器的倍数（即2），得到2节点对单节点的线性度。
+
+### 功耗
+
+定义：模型训练稳定训练时候实际消耗的GPU平均功耗。
+
+数据来源：ixSMI工具。
+
+计算方法：模型训练稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入**ixsmi -l** *value* 命令，ixsmi工具会间隔value秒，循环显示GPU摘要信息，缺省值为5，摘要信息中包括此时BI-V100的功耗，单位为W。取多次的数据取平均值作为模型训练的功耗。
+
+### 显存
+
+定义：模型训练稳定训练时候实际消耗的GPU平均显存用量。
+
+数据来源：ixSMI工具。
+
+计算方法：模型训练稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入**ixsmi -l** *value* 命令，ixsmi工具会间隔value秒，循环显示GPU摘要信息，缺省值为5，摘要信息中包括此时BI-V100使用的显存，单位为MiB。取多次的数据取平均值作为模型训练的显存用量。
+
+
+### 稳定度
+
+定义：取多次模型完整训练，即训练达到收敛，此时loss值的稳定程度。
+
+数据来源：脚本会打印训练过程中每个iteration，每个epoch的loss值。
+
+计算方法：模型采用5次完整训练，当达到收敛时，loss值应分布在（-0.01，+0.01）的合理区间，此时达到满分1。当5个数据有1次不在该范围内，稳定度则递减20%。
\ No newline at end of file
-- 
Gitee


From 5cad07e0e3c00215cdb5c76deb13929eabdd56be Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Wed, 23 Nov 2022 11:15:01 +0800
Subject: [PATCH 02/17] =?UTF-8?q?Jeff's=20comments=20via=20=E9=A3=9E?=
 =?UTF-8?q?=E4=B9=A6?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...257\204\346\265\213\346\226\271\346\263\225.md" | 14 +++++++-------
 1 file changed, 7 insertions(+), 7 deletions(-)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index 2dda0cf..fe4f85b 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -8,7 +8,7 @@
 ## 使用工具
 
 - ixSMI工具：包含在天数智芯软件栈中，当您安装好天数智芯软件栈后即可通过ixsmi进行调用
-- DeepSpark模型训练脚本：脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据
+- DeepSpark模型训练脚本：脚本会打印训练时每秒处理的单位样本数量、模型accuracy值等数据
 
 ## 六维度数据计算方法
 
@@ -22,11 +22,11 @@
 
 ### 准确性
 
-定义：模型收敛的精度值。
+定义：模型收敛的accuracy值。
 
-数据来源：脚本会打印训练过程中每个iteration，每个epoch的训练准确度。
+数据来源：脚本会打印训练过程中每个iteration，每个epoch的训练accuracy值。
 
-计算方法：随着训练迭代而模型的loss变化不再显著时，模型是否达到判定为收敛所要求的准确度，记录此时的精度值。
+计算方法：随着训练迭代而模型的loss变化不再显著时，模型是否达到判定为收敛所要求的accuracy值，记录此时的accuracy值。
 
 ### 线性度
 
@@ -59,8 +59,8 @@
 
 ### 稳定度
 
-定义：取多次模型完整训练，即训练达到收敛，此时loss值的稳定程度。
+定义：取多次模型完整训练，即训练达到收敛，此时accuracy值的稳定程度。
 
-数据来源：脚本会打印训练过程中每个iteration，每个epoch的loss值。
+数据来源：脚本会打印训练过程中每个epoch的accuracy值。
 
-计算方法：模型采用5次完整训练，当达到收敛时，loss值应分布在（-0.01，+0.01）的合理区间，此时达到满分1。当5个数据有1次不在该范围内，稳定度则递减20%。
\ No newline at end of file
+计算方法：模型采用5次完整训练，当达到收敛时，取5次的accuracy值的中值做为基准值，然后其他的4次的对比该基准值的差值应分布在（-0.01，+0.01）的合理区间，此时达到满分1。当5个数据有1次不在该范围内，稳定度则递减20%。
\ No newline at end of file
-- 
Gitee


From 7d209a2b8ad8a68843f16843380704c6437b09e2 Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Wed, 23 Nov 2022 11:18:05 +0800
Subject: [PATCH 03/17] Jeff's version

---
 ...04\346\265\213\346\226\271\346\263\225.md" | 45 ++++++++++---------
 1 file changed, 24 insertions(+), 21 deletions(-)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index fe4f85b..78274d5 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -7,60 +7,63 @@
 
 ## 使用工具
 
-- ixSMI工具：包含在天数智芯软件栈中，当您安装好天数智芯软件栈后即可通过ixsmi进行调用
-- DeepSpark模型训练脚本：脚本会打印训练时每秒处理的单位样本数量、模型accuracy值等数据
+- ixSMI：GPU实时状态检测工具，包含在天数智芯软件栈中，当您安装好天数智芯软件栈后即可通过ixsmi进行调用
+- DeepSpark模型训练脚本：脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据
 
 ## 六维度数据计算方法
 
 ### 速度
 
-定义：单机模型稳定训练时每秒处理的单位样本的算力。
+定义：模型稳定训练时每秒处理的单位样本的算力。
 
-数据来源：脚本会打印训练过程中每个iteration，每个epoch的每秒处理的单位样本数量。
+数据来源：DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的每秒处理的单位样本数量。
 
-计算方法：即指定迭代轮次5次去掉最高最低，取中间3次的mean中值。如第一个iteration的第6到第10个epoch中，最高是第6个、最低是第10个epoch，则取第7个、第8个和第9个epoch的值相加除以3。
+计算方法：即指定迭代轮次为总共5次，去掉5次中的速度的最高最低值，取中间3次速度值的平均值（或mean中值）。如取稳定训练的第6到第10个epoch共5给epochs，最高是第6个、最低是第10个epoch，则取第7个、第8个和第9个epoch的值相加除以3。
 
 ### 准确性
 
-定义：模型收敛的accuracy值。
+定义：模型收敛的精度值。
 
-数据来源：脚本会打印训练过程中每个iteration，每个epoch的训练accuracy值。
+数据来源：DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的训练准确度。
 
-计算方法：随着训练迭代而模型的loss变化不再显著时，模型是否达到判定为收敛所要求的accuracy值，记录此时的accuracy值。
+计算方法：随着训练迭代而模型的loss变化不再显著时，评估模型是否达到判定为收敛所要求的准确度指标，记录此时的精度值。
 
 ### 线性度
 
-定义：模型集群规模化训练的scalability，算力线性扩展性能。
+定义：模型集群规模化训练的scalability，即算力的线性扩展性能。
 
-数据来源：脚本会打印训练过程中每个iteration，每个epoch的每秒处理的单位样本数量。
+数据来源：DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的每秒处理的单位样本数量。
 
 计算方法：线性度具体还可以分为如下两种：
 
-- 多卡对单卡的线性度：在一台服务器上使用多张BI-V100训练时每秒处理的单位样本数量（即速度）对比使用1张BI-V100训练时的速度，再除以多卡的卡数。例如，使用8张BI-V100时的训练速度除以使用1张BI-V100时的训练速度，再除以卡的倍数（即8），得到8卡对单卡的线性度。
+- 卡线性度：在一台服务器上使用多张BI-V100训练时每秒处理的单位样本数量（即速度）除以多卡的卡数，再对比使用1张BI-V100训练时的速度。例如，使用8张BI-V100时的训练速度除以卡的倍数（即8），再除以使用1张BI-V100时的训练速度，得到8卡对单卡的线性度。
 
-- 多节点对单节点的线性度：在每台服务器（即节点）安装相同数量的BI-V100卡前提下，使用多台服务器训练的每秒处理的单位样本数量（即速度）对比使用1台服务器训练时的速度，再除以多台服务器的台数。例如，使用2台服务器（都安装了8张BI-V100）时的训练速度除以使用1台服务器时的训练速度，再除以服务器的倍数（即2），得到2节点对单节点的线性度。
+- 节点线性度：在每台服务器（即节点）安装相同数量的BI-V100卡前提下，使用多台服务器训练的每秒处理的单位样本数量（即速度）除以多台服务器的台数，再对比使用1台服务器训练时的速度。例如，使用4台服务器（每台都分别安装了8张BI-V100）时的训练速度，除以服务器的总台数（即节点数4），再除以使用1台服务器时的训练速度，得到4节点对单节点的线性度。
 
 ### 功耗
 
-定义：模型训练稳定训练时候实际消耗的GPU平均功耗。
+定义：模型稳定训练时候实际消耗的GPU平均功耗。
 
-数据来源：ixSMI工具。
+数据来源：GPU实时状态检测工具ixSMI。
 
-计算方法：模型训练稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入**ixsmi -l** *value* 命令，ixsmi工具会间隔value秒，循环显示GPU摘要信息，缺省值为5，摘要信息中包括此时BI-V100的功耗，单位为W。取多次的数据取平均值作为模型训练的功耗。
+计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入**ixsmi -l** *value* 命令，ixsmi工具会间隔value秒，循环显示GPU摘要信息，缺省值为5，摘要信息中包括此时BI-V100的功耗，单位为W。取多次的数据取平均值作为模型训练的功耗。
+
+@shikun -- 建议加这个进阶指令说明 -- ixsmi -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw'
 
 ### 显存
 
-定义：模型训练稳定训练时候实际消耗的GPU平均显存用量。
+定义：模型稳定训练时实际消耗的GPU平均显存用量。
 
-数据来源：ixSMI工具。
+数据来源：GPU实时状态检测工具ixSMI。
 
-计算方法：模型训练稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入**ixsmi -l** *value* 命令，ixsmi工具会间隔value秒，循环显示GPU摘要信息，缺省值为5，摘要信息中包括此时BI-V100使用的显存，单位为MiB。取多次的数据取平均值作为模型训练的显存用量。
+计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入**ixsmi -l** *value* 命令，ixsmi工具会间隔value秒，循环显示GPU摘要信息，缺省值为5，摘要信息中包括此时BI-V100使用的显存，单位为MiB。取多次的数据取平均值作为模型训练的显存用量。
 
+@shikun -- 建议加这个进阶指令说明 -- ixsmi -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw'
 
 ### 稳定度
 
-定义：取多次模型完整训练，即训练达到收敛，此时accuracy值的稳定程度。
+定义：取模型多次完整训练最终所达到的收敛值，比较多次收敛值的稳定程度。
 
-数据来源：脚本会打印训练过程中每个epoch的accuracy值。
+数据来源：DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的结束时达到的准确度。
 
-计算方法：模型采用5次完整训练，当达到收敛时，取5次的accuracy值的中值做为基准值，然后其他的4次的对比该基准值的差值应分布在（-0.01，+0.01）的合理区间，此时达到满分1。当5个数据有1次不在该范围内，稳定度则递减20%。
\ No newline at end of file
+计算方法：模型采用5次完整训练，每次都最终达到标准收敛值，取5次的收敛值的中值做为base,然后其他的4次收敛值对比base的delta百分比应分布在（-0.01，+0.01）的合理区间，此时达到满分1。当5个数据有1次不在该范围内，稳定度则递减20%。
\ No newline at end of file
-- 
Gitee


From 92bac75c7d3199a25f7d14a85fd8f8c75af6b70c Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Wed, 23 Nov 2022 11:20:25 +0800
Subject: [PATCH 04/17] editorial updates

---
 ...04\346\265\213\346\226\271\346\263\225.md" | 20 +++++++++++--------
 1 file changed, 12 insertions(+), 8 deletions(-)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index 78274d5..c522344 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -7,8 +7,8 @@
 
 ## 使用工具
 
-- ixSMI：GPU实时状态检测工具，包含在天数智芯软件栈中，当您安装好天数智芯软件栈后即可通过ixsmi进行调用
-- DeepSpark模型训练脚本：脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据
+- ixSMI：GPU实时状态检测工具，包含在天数智芯软件栈中，当您安装好天数智芯软件栈后即可通过**ixsmi**命令进行调用。
+- DeepSpark模型训练脚本：脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据。
 
 ## 六维度数据计算方法
 
@@ -18,7 +18,7 @@
 
 数据来源：DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的每秒处理的单位样本数量。
 
-计算方法：即指定迭代轮次为总共5次，去掉5次中的速度的最高最低值，取中间3次速度值的平均值（或mean中值）。如取稳定训练的第6到第10个epoch共5给epochs，最高是第6个、最低是第10个epoch，则取第7个、第8个和第9个epoch的值相加除以3。
+计算方法：即指定迭代轮次为总共5次，去掉5次中的速度的最高最低值，取中间3次速度值的平均值（或mean中值）。如取稳定训练的第6到第10个epoch共5个epoch，最高是第6个、最低是第10个epoch，则取第7个、第8个和第9个epoch的值相加除以3。
 
 ### 准确性
 
@@ -46,9 +46,11 @@
 
 数据来源：GPU实时状态检测工具ixSMI。
 
-计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入**ixsmi -l** *value* 命令，ixsmi工具会间隔value秒，循环显示GPU摘要信息，缺省值为5，摘要信息中包括此时BI-V100的功耗，单位为W。取多次的数据取平均值作为模型训练的功耗。
+计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入以下命令，ixSMI工具会显示此时BI-V100的功耗，单位为W。取多次的数据取平均值作为模型训练的功耗。
 
-@shikun -- 建议加这个进阶指令说明 -- ixsmi -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw'
+```
+$ ixSMI -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw'
+```
 
 ### 显存
 
@@ -56,9 +58,11 @@
 
 数据来源：GPU实时状态检测工具ixSMI。
 
-计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入**ixsmi -l** *value* 命令，ixsmi工具会间隔value秒，循环显示GPU摘要信息，缺省值为5，摘要信息中包括此时BI-V100使用的显存，单位为MiB。取多次的数据取平均值作为模型训练的显存用量。
+计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入以下命令，ixsmi工具会显示此时BI-V100使用的显存，单位为MiB。取多次的数据取平均值作为模型训练的显存用量。
 
-@shikun -- 建议加这个进阶指令说明 -- ixsmi -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw'
+```
+$ ixSMI -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw'
+```
 
 ### 稳定度
 
@@ -66,4 +70,4 @@
 
 数据来源：DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的结束时达到的准确度。
 
-计算方法：模型采用5次完整训练，每次都最终达到标准收敛值，取5次的收敛值的中值做为base,然后其他的4次收敛值对比base的delta百分比应分布在（-0.01，+0.01）的合理区间，此时达到满分1。当5个数据有1次不在该范围内，稳定度则递减20%。
\ No newline at end of file
+计算方法：模型采用5次完整训练，每次都最终达到标准收敛值，取5次的收敛值的中值做为基准值，然后其他的4次收敛值对比基准值的差值百分比应分布在（-0.01，+0.01）的合理区间，此时达到满分1。当5个数据有1次不在该范围内，稳定度则递减20%。
-- 
Gitee


From d19d0083783798f6553acdcfb991d7e67b18287d Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Fri, 25 Nov 2022 16:13:17 +0800
Subject: [PATCH 05/17] =?UTF-8?q?=E6=9B=B4=E6=96=B0ixsmi=E5=91=BD=E4=BB=A4?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...04\346\265\213\346\226\271\346\263\225.md" | 38 +++++++++++++++++--
 1 file changed, 34 insertions(+), 4 deletions(-)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index c522344..406186c 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -46,24 +46,54 @@
 
 数据来源：GPU实时状态检测工具ixSMI。
 
-计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入以下命令，ixSMI工具会显示此时BI-V100的功耗，单位为W。取多次的数据取平均值作为模型训练的功耗。
+计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入以下命令，ixSMI工具会每间隔5秒显示此时BI-V100的功耗，单位为W。取多次的数据取平均值作为模型训练的功耗。
+
+- 如您环境中仅安装了1张BI-V100，输入以下命令：
+
+```
+$ ixsmi -q -l | grep -E 'Power Draw'
+```
+
+- 如您环境中安装了多张BI-V100（可使用**ixsmi**命令获取多张卡的概要信息，包括index信息），输入以下命令，使用${gpu_index}指定具体读取哪张BI-V100的信息，注意index从0开始：
 
 ```
-$ ixSMI -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw'
+$ ixsmi -q -i ${gpu_index} -l | grep -E 'Power Draw'
 ```
 
+例如，以下命令可以得到index为0的BI-V100的功耗信息：
+
+```
+$ ixsmi -q -i 0 -l | grep -E 'Power Draw'
+```
+
+
 ### 显存
 
 定义：模型稳定训练时实际消耗的GPU平均显存用量。
 
 数据来源：GPU实时状态检测工具ixSMI。
 
-计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入以下命令，ixsmi工具会显示此时BI-V100使用的显存，单位为MiB。取多次的数据取平均值作为模型训练的显存用量。
+计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入以下命令，ixSMI工具会每间隔5秒显示此时BI-V100使用的显存，单位为MiB。取多次的数据取平均值作为模型训练的显存用量。
+
+- 如您环境中仅安装了1张BI-V100，输入以下命令：
+
+```
+$ ixsmi -q -l | grep -E 'Used'
+```
+
+- 如您环境中安装了多张BI-V100（可使用**ixsmi**命令获取多张卡的概要信息，包括index信息），输入以下命令，使用${gpu_index}指定具体读取哪张BI-V100的信息，注意index从0开始：
 
 ```
-$ ixSMI -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw'
+$ ixsmi -q -i ${gpu_index} -l | grep -E 'Used'
 ```
 
+例如，以下命令可以得到index为0的BI-V100的显存用量：
+
+```
+$ ixsmi -q -i 0 -l | grep -E 'Used'
+```
+
+
 ### 稳定度
 
 定义：取模型多次完整训练最终所达到的收敛值，比较多次收敛值的稳定程度。
-- 
Gitee


From 1109322f989470e67eddc5f9ed24aa8c0a364a7e Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Fri, 25 Nov 2022 17:02:12 +0800
Subject: [PATCH 06/17] update main README

---
 README.md                                     | 26 ++++++++++++-------
 ...04\346\265\213\346\226\271\346\263\225.md" |  4 +--
 2 files changed, 18 insertions(+), 12 deletions(-)

diff --git a/README.md b/README.md
index 2370f3c..bd69146 100644
--- a/README.md
+++ b/README.md
@@ -44,14 +44,14 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发
 
 - 提供 :six: 维度
 
-| 维度 | 说明 |
-| --- | --- |
-| 速度<br/>:rocket:  | 单机模型稳定训练时每秒处理的单位样本的算力，<br/>即指定迭代轮次5次去掉最高最低，取中间3次的mean中值。 |
-| 准确性<br/>:dart: | 模型收敛的精度值。
-| 线性度<br/>:chart_with_upwards_trend: | 模型集群规模化训练的scalability，算力线性扩展性能。<br/>多节点对单节点的线性度，多节点对单卡的线性度。
-| 功耗<br/>:electric_plug: | 模型训练稳定训练时候实际消耗的GPU平均功耗。
-| 显存<br/>:bar_chart: | 模型训练稳定训练时候实际消耗的GPU平均显存用量。
-| 稳定度<br/>:wrench: | 模型采用5次完整训练，收敛的波动性和稳定度在（-0.01，+0.01）合理区间，<br/>5个数据有一次不在范围内就递减20%。
+| 维度 | 说明 | 数据来源 | 计算方法
+| --- | --- | --- | --- |
+| 速度<br/>:rocket:  | 模型稳定训练时每秒处理的单位样本的算力 | DeepSpark模型训练脚本输出 | 指定迭代轮次5次去掉最高最低，取中间3次的mean中值
+| 准确性<br/>:dart: | 模型收敛的精度值 | DeepSpark模型训练脚本输出 | 记录模型收敛时的精度值
+| 线性度<br/>:chart_with_upwards_trend: | 模型集群规模化训练算力的线性扩展性能 <br/>包括卡线性度和节点线性度 | DeepSpark模型训练脚本输出 | 用多卡/多节点的训练速度除以卡数/节点数，再对比使用单张/单节点的训练速度
+| 功耗<br/>:electric_plug: | 模型稳定训练时候实际消耗的GPU平均功耗 | GPU实时状态检测工具 | 取多次的功耗数据的平均值
+| 显存<br/>:bar_chart: | 模型稳定训练时实际消耗的GPU平均显存用量 | GPU实时状态检测工具 | 取多次的显存用量的平均值
+| 稳定度<br/>:wrench: | 多次完整训练（均达到收敛值）的收敛值的稳定程度 | DeepSpark模型训练脚本输出 | 采用5次达到标准收敛值的完整训练，取收敛值的中值做为基准值，其它值对比基准值的差值百分比有1次不在（-0.01，+0.01）范围内，稳定度则递减20%
 
    参考信息：[硬件评测结果](#硬件评测结果)
 
@@ -65,10 +65,14 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发
    
 --------
 
-## 硬件评测结果
+## 硬件评测方法和结果
 
 ### 天垓100通用GPU
 
+评测方法详见 [天垓100六维度评测方法](evaluation/Iluvatar/六维度评测方法.md)。
+
+评测结果如下：
+
 | 任务         | 模型       | 收敛指标         | 配置(x-\>gpus)        | 速度   | 准确度 | 功耗（W） | 线性度 | 显存（G） | 稳定度 |
 |--------------|------------|------------------|-----------------------|--------|--------|-----------|--------|-----------|--------|
 | 自然语言处理 | BERT-large | 0.72             | sdk2.2,bs:32,8x,amp   | 214    | 0.72   | 152\*8    | 0.96   | 20.3\*8   | 1      |
@@ -85,7 +89,9 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发
 | 新兴模型     | Wave-MLP   | 80.1             | sdk2.2,bs:256,8x,fp32 | 1026   | 83.1   | 198\*8    | 0.98   | 29.4\*8   | 1      |
 
 
-各维度说明，请见[评测体系](#评测体系).
+各维度说明，请见[评测体系](#评测体系)。
+
+
 
 -------
 
diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index 406186c..d30c1bf 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -1,8 +1,8 @@
-# BI-V100评测方法
+# 天垓100（BI-V100）评测方法
 
 ## 前置条件
 
-1. 获取天数智芯BI-V100算力
+1. 获取天数智芯天垓100（BI-V100）算力
 2. 安装天数智芯软件栈
 
 ## 使用工具
-- 
Gitee


From 2916b406faffa4c1dd08aa6cd20cf4823168846b Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Tue, 29 Nov 2022 15:50:42 +0800
Subject: [PATCH 07/17] =?UTF-8?q?=E6=98=BE=E5=AD=98=E5=8D=A0=E7=94=A8?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 README.md                                              |  4 ++--
 ...350\257\204\346\265\213\346\226\271\346\263\225.md" | 10 +++++-----
 2 files changed, 7 insertions(+), 7 deletions(-)

diff --git a/README.md b/README.md
index bd69146..1d017ca 100644
--- a/README.md
+++ b/README.md
@@ -50,7 +50,7 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发
 | 准确性<br/>:dart: | 模型收敛的精度值 | DeepSpark模型训练脚本输出 | 记录模型收敛时的精度值
 | 线性度<br/>:chart_with_upwards_trend: | 模型集群规模化训练算力的线性扩展性能 <br/>包括卡线性度和节点线性度 | DeepSpark模型训练脚本输出 | 用多卡/多节点的训练速度除以卡数/节点数，再对比使用单张/单节点的训练速度
 | 功耗<br/>:electric_plug: | 模型稳定训练时候实际消耗的GPU平均功耗 | GPU实时状态检测工具 | 取多次的功耗数据的平均值
-| 显存<br/>:bar_chart: | 模型稳定训练时实际消耗的GPU平均显存用量 | GPU实时状态检测工具 | 取多次的显存用量的平均值
+| 显存占用<br/>:bar_chart: | 模型稳定训练时实际消耗的GPU平均显存占用量 | GPU实时状态检测工具 | 取多次的显存占用量的平均值
 | 稳定度<br/>:wrench: | 多次完整训练（均达到收敛值）的收敛值的稳定程度 | DeepSpark模型训练脚本输出 | 采用5次达到标准收敛值的完整训练，取收敛值的中值做为基准值，其它值对比基准值的差值百分比有1次不在（-0.01，+0.01）范围内，稳定度则递减20%
 
    参考信息：[硬件评测结果](#硬件评测结果)
@@ -73,7 +73,7 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发
 
 评测结果如下：
 
-| 任务         | 模型       | 收敛指标         | 配置(x-\>gpus)        | 速度   | 准确度 | 功耗（W） | 线性度 | 显存（G） | 稳定度 |
+| 任务         | 模型       | 收敛指标         | 配置(x-\>gpus)        | 速度   | 准确度 | 功耗（W） | 线性度 | 显存占用（G） | 稳定度 |
 |--------------|------------|------------------|-----------------------|--------|--------|-----------|--------|-----------|--------|
 | 自然语言处理 | BERT-large | 0.72             | sdk2.2,bs:32,8x,amp   | 214    | 0.72   | 152\*8    | 0.96   | 20.3\*8   | 1      |
 | 推荐系统     | DLRM       | AUC:0.75         | sdk2.2,bs:2048,8x,amp | 793486 | 0.75   | 60\*8     | 0.97   | 3.7\*8    | 1      |
diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index d30c1bf..edf35e1 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -1,4 +1,4 @@
-# 天垓100（BI-V100）评测方法
+# 天垓100（BI-V100）六维度评测方法
 
 ## 前置条件
 
@@ -67,13 +67,13 @@ $ ixsmi -q -i 0 -l | grep -E 'Power Draw'
 ```
 
 
-### 显存
+### 显存占用
 
-定义：模型稳定训练时实际消耗的GPU平均显存用量。
+定义：模型稳定训练时实际消耗的GPU平均显存占用量。
 
 数据来源：GPU实时状态检测工具ixSMI。
 
-计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入以下命令，ixSMI工具会每间隔5秒显示此时BI-V100使用的显存，单位为MiB。取多次的数据取平均值作为模型训练的显存用量。
+计算方法：模型稳定训练时（通常是排除训练刚开始的数据处理和预热阶段），在终端输入以下命令，ixSMI工具会每间隔5秒显示此时BI-V100显存的使用量，单位为MiB。取多次的数据取平均值作为模型训练的显存占用量。
 
 - 如您环境中仅安装了1张BI-V100，输入以下命令：
 
@@ -87,7 +87,7 @@ $ ixsmi -q -l | grep -E 'Used'
 $ ixsmi -q -i ${gpu_index} -l | grep -E 'Used'
 ```
 
-例如，以下命令可以得到index为0的BI-V100的显存用量：
+例如，以下命令可以得到index为0的BI-V100的显存占用量：
 
 ```
 $ ixsmi -q -i 0 -l | grep -E 'Used'
-- 
Gitee


From 3b0f2c8b7dd0316bc4167cec38719e75bd1cc50c Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Tue, 6 Dec 2022 15:33:15 +0800
Subject: [PATCH 08/17] =?UTF-8?q?Update=20=E5=85=AD=E7=BB=B4=E5=BA=A6?=
 =?UTF-8?q?=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95.md?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...\246\350\257\204\346\265\213\346\226\271\346\263\225.md" | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index edf35e1..218dee9 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -78,19 +78,19 @@ $ ixsmi -q -i 0 -l | grep -E 'Power Draw'
 - 如您环境中仅安装了1张BI-V100，输入以下命令：
 
 ```
-$ ixsmi -q -l | grep -E 'Used'
+$ ixsmi -q -l | grep Used.[^G]
 ```
 
 - 如您环境中安装了多张BI-V100（可使用**ixsmi**命令获取多张卡的概要信息，包括index信息），输入以下命令，使用${gpu_index}指定具体读取哪张BI-V100的信息，注意index从0开始：
 
 ```
-$ ixsmi -q -i ${gpu_index} -l | grep -E 'Used'
+$ ixsmi -q -i ${gpu_index} -l | grep Used.[^G]
 ```
 
 例如，以下命令可以得到index为0的BI-V100的显存占用量：
 
 ```
-$ ixsmi -q -i 0 -l | grep -E 'Used'
+$ ixsmi -q -i 0 -l | grep Used.[^G]
 ```
 
 
-- 
Gitee


From c1573ad134f02b40f7bff0fc1d750376c6c088a4 Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Tue, 6 Dec 2022 15:40:35 +0800
Subject: [PATCH 09/17] =?UTF-8?q?=E6=B7=BB=E5=8A=A0=20=E5=85=AD=E7=BB=B4?=
 =?UTF-8?q?=E5=BA=A6=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95=5F=E7=A4=BA?=
 =?UTF-8?q?=E4=BE=8B.md=E9=93=BE=E6=8E=A5?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...72\246\350\257\204\346\265\213\346\226\271\346\263\225.md" | 4 ++++
 1 file changed, 4 insertions(+)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index 218dee9..26e0230 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -101,3 +101,7 @@ $ ixsmi -q -i 0 -l | grep Used.[^G]
 数据来源：DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的结束时达到的准确度。
 
 计算方法：模型采用5次完整训练，每次都最终达到标准收敛值，取5次的收敛值的中值做为基准值，然后其他的4次收敛值对比基准值的差值百分比应分布在（-0.01，+0.01）的合理区间，此时达到满分1。当5个数据有1次不在该范围内，稳定度则递减20%。
+
+## 六维度数据计算示例
+
+[天垓100六维度评测方法示例：ResNet50](六维度评测方法_示例.md)
-- 
Gitee


From 223e72ebe94979b18c01a5f3d5f1b49c5c53cd0f Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Fri, 9 Dec 2022 13:39:09 +0800
Subject: [PATCH 10/17] =?UTF-8?q?Create=20=E5=85=AD=E7=BB=B4=E5=BA=A6?=
 =?UTF-8?q?=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95=5F=E7=A4=BA=E4=BE=8B.md?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...1\346\263\225_\347\244\272\344\276\213.md" | 267 ++++++++++++++++++
 1 file changed, 267 insertions(+)
 create mode 100644 "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md"

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md"
new file mode 100644
index 0000000..eee05ea
--- /dev/null
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md"
@@ -0,0 +1,267 @@
+# 天垓100六维度评测方法示例：ResNet50
+
+使用天数智芯天垓100（BI-V100）通用GPU硬件并安装天数智芯软件栈和深度学习框架后，您可运行DeepSpark模型训练脚本，并借助于天数智芯GPU实时状态检测工具ixSMI得到天垓100硬件的六维度数据。DeepSpark六维度指标的定义请参照[评测体系](../../README.md#评测体系)。天垓100六维度具体计算方法请参照[天垓100（BI-V100）六维度评测方法](六维度评测方法.md)。
+
+本示例以[ResNet50模型](https://gitee.com/deep-spark/deepsparkhub/tree/master/cv/classification/resnet50/pytorch)为例，用8张天垓100（BI-V100）卡执行`amp_8card.sh`脚本进行混合精度训练。在本示例环境中，数据集所在路径为`/home/datasets/imagenet`。
+
+具体运行和六维度的计算过程如下：
+
+## 速度
+
+执行DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的每秒处理的单位样本数量，例如：
+
+```
+$ bash amp_8card.sh --data-path /home/datasets/imagenet
+...
+Creating data loaders
+read 1281167 files from 1000 directories
+...
+Creating model resnet50
+Start training
+Epoch: [0]  [  0/334]  eta: 0:38:25  lr: 0.128  img/s: 590.7051616388846  loss: 7.1621 (7.1621)  acc1: 0.0000 (0.0000)  acc5: 0.0000 (0.0000)  time: 6.9017  data: 0.0000
+Epoch: [0]  [ 10/334]  eta: 0:06:47  lr: 0.128  img/s: 5625.496142412713  loss: 7.2926 (7.2497)  acc1: 0.0000 (0.1326)  acc5: 0.6250 (0.8144)  time: 1.2591  data: 0.0019
+Epoch: [0]  [ 20/334]  eta: 0:05:09  lr: 0.128  img/s: 5597.293247401811  loss: 7.4071 (7.4806)  acc1: 0.0000 (0.0794)  acc5: 0.6250 (0.7639)  time: 0.6908  data: 0.0020
+Epoch: [0]  [ 30/334]  eta: 0:04:30  lr: 0.128  img/s: 5445.774084325316  loss: 7.3483 (7.4083)  acc1: 0.0000 (0.1075)  acc5: 0.6250 (0.7258)  time: 0.6889  data: 0.0018
+...
+Epoch: [0]  [320/334]  eta: 0:00:11  lr: 0.128  img/s: 5411.016050829418  loss: 6.8285 (6.9574)  acc1: 0.2083 (0.1694)  acc5: 1.2500 (0.7976)  time: 0.8184  data: 0.0023
+Epoch: [0]  [330/334]  eta: 0:00:03  lr: 0.128  img/s: 5601.840934156804  loss: 6.8106 (6.9527)  acc1: 0.4167 (0.1788)  acc5: 1.6667 (0.8283)  time: 0.7644  data: 0.0023
+Epoch: [0] Total time: 0:04:38
+Data loading of epoch 0: 0:00:00.759193
+Epoch: [0] Avg img/s: 5060.21643823427
+Test:  [ 0/14]  eta: 0:00:03  loss: 6.9883 (6.9883)  acc1: 0.0000 (0.0000)  acc5: 0.0000 (0.0000)  time: 0.2724  data: 0.0000
+Test: Total time: 0:00:04
+ * Acc@1 0.112 Acc@5 1.040
+Epoch time 0:04:43
+...
+Epoch: [6] Total time: 0:04:38
+Data loading of epoch 6: 0:00:00.797741
+Epoch: [6] Avg img/s: 4910.795658460139
+Test:  [ 0/14]  eta: 0:00:04  loss: 5.5391 (5.5391)  acc1: 8.1250 (8.1250)  acc5: 24.1667 (24.1667)  time: 0.2859  data: 0.0019
+Test: Total time: 0:00:03
+ * Acc@1 13.360 Acc@5 30.960
+Epoch time 0:04:43
+...
+Epoch: [7] Total time: 0:04:36
+Data loading of epoch 7: 0:00:00.770986
+Epoch: [7] Avg img/s: 4980.222383258538
+Test:  [ 0/14]  eta: 0:00:03  loss: 5.4844 (5.4844)  acc1: 8.1250 (8.1250)  acc5: 23.9583 (23.9583)  time: 0.2801  data: 0.0017
+Test: Total time: 0:00:03
+ * Acc@1 24.928 Acc@5 49.712
+Epoch time 0:04:41
+...
+Epoch: [8] Total time: 0:04:31
+Data loading of epoch 8: 0:00:00.756521
+Epoch: [8] Avg img/s: 5032.905842259754
+Test:  [ 0/14]  eta: 0:00:04  loss: 4.1641 (4.1641)  acc1: 29.1667 (29.1667)  acc5: 54.5833 (54.5833)  time: 0.2861  data: 0.0019
+Test: Total time: 0:00:03
+ * Acc@1 23.536 Acc@5 47.024
+Epoch time 0:04:35
+...
+Epoch: [9] Total time: 0:04:39
+Data loading of epoch 9: 0:00:00.761111
+Epoch: [9] Avg img/s: 4925.753353494863
+Test:  [ 0/14]  eta: 0:00:04  loss: 3.3516 (3.3516)  acc1: 45.4167 (45.4167)  acc5: 70.4167 (70.4167)  time: 0.3107  data: 0.0022
+Test: Total time: 0:00:03
+ * Acc@1 28.480 Acc@5 59.568
+Epoch time 0:04:44
+...
+Epoch: [10] Total time: 0:04:42
+Data loading of epoch 10: 0:00:00.776602
+Epoch: [10] Avg img/s: 4845.4628560647725
+Test:  [ 0/14]  eta: 0:00:04  loss: 3.7891 (3.7891)  acc1: 27.0833 (27.0833)  acc5: 56.4583 (56.4583)  time: 0.3491  data: 0.0028
+Test: Total time: 0:00:03
+ * Acc@1 33.520 Acc@5 61.264
+Epoch time 0:04:47
+...
+Epoch: [63] Total time: 0:04:36
+Data loading of epoch 63: 0:00:00.688607
+Epoch: [63] Avg img/s: 4928.513448918747
+Test:  [ 0/14]  eta: 0:00:03  loss: 2.3945 (2.3945)  acc1: 63.5417 (63.5417)  acc5: 85.6250 (85.6250)  time: 0.2850  data: 0.0017
+Test: Total time: 0:00:03
+ * Acc@1 69.104 Acc@5 89.088
+Epoch time 0:04:40
+...
+Epoch: [64] Total time: 0:04:47
+Data loading of epoch 64: 0:00:00.674387
+Epoch: [64] Avg img/s: 4812.667878767461
+Test:  [ 0/14]  eta: 0:00:04  loss: 1.7793 (1.7793)  acc1: 81.8750 (81.8750)  acc5: 94.7917 (94.7917)  time: 0.3257  data: 0.0019
+Test: Total time: 0:00:03
+ * Acc@1 77.360 Acc@5 93.120
+ ...
+Epoch time 0:04:52
+The accuracy has been exceeded 75.9,and the training is terminated at epoch 64
+Training time 5:06:03
+...
+```
+
+取稳定训练的第6到第10个epoch共5个epoch：
+
+Epoch: [6] Avg img/s: 4910.795658460139
+Epoch: [7] Avg img/s: 4980.222383258538
+Epoch: [8] Avg img/s: 5032.905842259754
+Epoch: [9] Avg img/s: 4925.753353494863
+Epoch: [10] Avg img/s: 4845.4628560647725
+
+最高是第8个、最低是第10个epoch，计算速度则取第6个、第7个和第9个epoch的值相加除以3，即为：
+
+(4910+4980+4925)/3=4938.33 img/s
+
+注：在该模型用例中，通过以上方法获取的速度，主要评估的是训练集上training的速度，而端到端(end-to-end)训练速度则包含了训练集和验证集在整个training和evaluation的全部过程中的总体速度。
+
+训练端到端的速度计算方式如下：
+
+（每个epoch的处理的样本数量*完整训练的epoch数量）/ 总的训练时长
+
+通过“read 1281167 files from 1000 directories”的提示得到每个epoch的处理的样本数量为1281167个。
+
+通过“Training time 5:06:03”的提示得到总的训练时长为5:06:03小时，换算成18363秒。
+
+本次`amp_8card.sh`完整训练的端到端速度为：
+
+(1281167*64)/18363=4465.2 img/s
+
+
+### 准确性
+
+执行DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的训练准确度，例如：
+
+```
+$ bash amp_8card.sh --data-path /home/datasets/imagenet
+...
+Epoch: [0] Total time: 0:04:38
+Data loading of epoch 0: 0:00:00.759193
+Epoch: [0] Avg img/s: 5060.21643823427
+Test:  [ 0/14]  eta: 0:00:03  loss: 6.9883 (6.9883)  acc1: 0.0000 (0.0000)  acc5: 0.0000 (0.0000)  time: 0.2724  data: 0.0000
+Test: Total time: 0:00:04
+ * Acc@1 0.112 Acc@5 1.040
+...
+Epoch: [64] Avg img/s: 4812.667878767461
+Test:  [ 0/14]  eta: 0:00:04  loss: 1.7793 (1.7793)  acc1: 81.8750 (81.8750)  acc5: 94.7917 (94.7917)  time: 0.3257  data: 0.0019
+Test: Total time: 0:00:03
+ * Acc@1 77.360 Acc@5 93.120
+...
+The accuracy has been exceeded 75.9,and the training is terminated at epoch 64
+...
+```
+
+ResNet50模型收敛的标准是top1 75.9%，在第64个epoch时达到了Acc@1 77.360，超过了75.9的阈值（均为百分比）。所以训练的精度值为77.36%。
+
+
+### 线性度
+
+执行DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的速度，训练可以使用单卡和多卡进行，或使用单节点和多节点进行，分别可以计算出卡线性度和节点线性度。
+
+以计算卡线性度为例：
+
+例如，在一台服务器上使用8张天垓100加速卡训练的速度是2575 img/s：
+
+```
+$ bash fp32_8card.sh --data-path /home/datasets/imagenet
+...
+Epoch: [0] Total time: 0:08:37
+Data loading of epoch 0: 0:00:00.745164
+Epoch: [0] Avg img/s: 2575.527288024902
+Test:  [ 0/21]  eta: 0:00:06  loss: 6.1528 (6.1528)  acc1: 4.3333 (4.3333)  acc5: 24.0000 (24.0000)  time: 0.3201  data: 0.0000
+Test: Total time: 0:00:07
+ * Acc@1 0.704 Acc@5 3.968
+Epoch time 0:08:45
+...
+```
+
+将2575 img/s除以多卡的卡数（即8），得到：
+
+2575/8=321.9 img/s
+
+再对比使用1张天垓100加速卡训练时的速度，如下所示，速度为335 img/s。
+
+```
+$ bash fp32_1card.sh --data-path /home/datasets/imagenet
+...
+Epoch: [0] Avg img/s: 335.40682470945455
+Test:  [  0/179]  eta: 0:00:53  loss: 3.6599 (3.6599)  acc1: 36.4286 (36.4286)  acc5: 70.3571 (70.3571)  time: 0.2962  data: 0.0000
+Test:  [100/179]  eta: 0:00:23  loss: 5.3622 (5.0095)  acc1: 6.4286 (12.0226)  acc5: 22.1429 (31.2907)  time: 0.2973  data: 0.0011
+Test: Total time: 0:00:53
+ * Acc@1 11.786 Acc@5 30.074
+Epoch time 1:04:59
+...
+```
+
+得到卡线性度 321.9/335=96%
+
+### 功耗
+
+在模型稳定训练时，使用GPU实时状态检测工具ixSMI查询实际消耗的GPU功耗并取平均值。
+
+以运行`fp32_8card.sh`脚本使用8张天垓100加速卡训练为例，输入以下命令查询index为0的GPU的状态：
+
+```
+$ ixsmi -q -i 0 -l | grep -E 'Power Draw'
+        Power Draw                              : 161 W
+        Power Draw                              : 169 W
+        Power Draw                              : 161 W
+        Power Draw                              : 174 W
+        Power Draw                              : 163 W
+...
+```
+
+取多次的数据取平均值作为模型训练的功耗，例如：
+
+平均功耗 (161+169+161+174+163)/5=165.6 W
+
+### 显存占用
+
+在模型稳定训练时，使用GPU实时状态检测工具ixSMI查询GPU显存占用量并取平均值。
+
+以运行`amp_8card.sh`脚本使用8张天垓100加速卡训练为例，输入以下命令查询index为0的GPU的状态：
+
+```
+$ ixsmi -q -i 0 -l | grep Used.[^G]
+   Used                                    : 30671  MiB
+   Used                                    : 30670  MiB
+   Used                                    : 30671  MiB
+   Used                                    : 30671  MiB
+   Used                                    : 30670  MiB
+```
+
+去平均值得到平均显存占用量为 (30671+30670+30671+30671+30670)/5=30670.6 MiB
+
+### 稳定度
+
+执行DeepSpark模型训练脚本，脚本会打印完整训练最终所达到的收敛值，例如：
+
+```
+$ bash amp_8card.sh --data-path /home/datasets/imagenet
+...
+Epoch: [0] Total time: 0:04:38
+Data loading of epoch 0: 0:00:00.759193
+Epoch: [0] Avg img/s: 5060.21643823427
+Test:  [ 0/14]  eta: 0:00:03  loss: 6.9883 (6.9883)  acc1: 0.0000 (0.0000)  acc5: 0.0000 (0.0000)  time: 0.2724  data: 0.0000
+Test: Total time: 0:00:04
+ * Acc@1 0.112 Acc@5 1.040
+...
+Epoch: [64] Avg img/s: 4812.667878767461
+Test:  [ 0/14]  eta: 0:00:04  loss: 1.7793 (1.7793)  acc1: 81.8750 (81.8750)  acc5: 94.7917 (94.7917)  time: 0.3257  data: 0.0019
+Test: Total time: 0:00:03
+ * Acc@1 77.360 Acc@5 93.120
+...
+The accuracy has been exceeded 75.9,and the training is terminated at epoch 64
+...
+```
+
+可以得到本次的收敛精度为Acc@1 77.360，记为第1次。
+
+再进行4次模型完整训练，每次都最终达到标准收敛值，即达到`The accuracy has been exceeded 75.9`，，Acc@1分别得到如下结果：
+
+第2次：76.816
+第3次：77.116
+第4次：76.960
+第5次：77.010
+
+取5次的收敛值的中值做为基准值，即以第5次的收敛精度77.010作为基准，然后其它的4次收敛值对比基准值的差值百分比计算如下：
+
+第1次：(77.360-77.010)/77.010=0.0045
+第2次：(76.816-77.010)/77.010=-0.0025
+第3次：(77.116-77.010)/77.010=0.0013
+第4次：(76.960-77.010)/77.010=-0.0006
+
+可以得到差值百分比都分布在（-0.01，+0.01）的合理区间，此时达到满分1。（当5个数据有1次不在该范围内，稳定度则递减20%。）
-- 
Gitee


From 4de92c83cbb446b038c1a77e85c5f6f9891844be Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Fri, 9 Dec 2022 13:53:48 +0800
Subject: [PATCH 11/17] =?UTF-8?q?Add=20https://order.iluvatar.com/?=
 =?UTF-8?q?=E8=A1=A8=E5=8D=95?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" | 3 +++
 1 file changed, 3 insertions(+)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index 26e0230..e68f88a 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -3,6 +3,9 @@
 ## 前置条件
 
 1. 获取天数智芯天垓100（BI-V100）算力
+
+   DeepSpark社区客户想要使用天垓100加速卡，可以通过填写https://order.iluvatar.com/表单进行申请。
+
 2. 安装天数智芯软件栈
 
 ## 使用工具
-- 
Gitee


From b443b592ad6be05a2c7360d111dec09f18303d3e Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Fri, 9 Dec 2022 13:56:09 +0800
Subject: [PATCH 12/17] =?UTF-8?q?Update=20=E5=85=AD=E7=BB=B4=E5=BA=A6?=
 =?UTF-8?q?=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95.md?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...\246\350\257\204\346\265\213\346\226\271\346\263\225.md" | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
index e68f88a..09a6c1e 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
@@ -2,11 +2,11 @@
 
 ## 前置条件
 
-1. 获取天数智芯天垓100（BI-V100）算力
+1. 获取天数智芯天垓100（BI-V100）算力。
 
-   DeepSpark社区客户想要使用天垓100加速卡，可以通过填写https://order.iluvatar.com/表单进行申请。
+   DeepSpark社区客户想要使用天垓100加速卡，可以通过填写[表单](https://order.iluvatar.com/)进行申请。
 
-2. 安装天数智芯软件栈
+2. 安装天数智芯软件栈。
 
 ## 使用工具
 
-- 
Gitee


From 32c846d1ad48d7d74ff8de4b5785277d4d581d6d Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Fri, 9 Dec 2022 14:01:50 +0800
Subject: [PATCH 13/17] =?UTF-8?q?=E8=B0=83=E6=95=B4=E6=A0=BC=E5=BC=8F?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ...1\346\263\225_\347\244\272\344\276\213.md" | 40 +++++++++----------
 1 file changed, 18 insertions(+), 22 deletions(-)

diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md"
index eee05ea..0e5cfe5 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md"
+++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md"
@@ -96,11 +96,11 @@ Training time 5:06:03
 
 取稳定训练的第6到第10个epoch共5个epoch：
 
-Epoch: [6] Avg img/s: 4910.795658460139
-Epoch: [7] Avg img/s: 4980.222383258538
-Epoch: [8] Avg img/s: 5032.905842259754
-Epoch: [9] Avg img/s: 4925.753353494863
-Epoch: [10] Avg img/s: 4845.4628560647725
+- Epoch: [6] Avg img/s: 4910.795658460139
+- Epoch: [7] Avg img/s: 4980.222383258538
+- Epoch: [8] Avg img/s: 5032.905842259754
+- Epoch: [9] Avg img/s: 4925.753353494863
+- Epoch: [10] Avg img/s: 4845.4628560647725
 
 最高是第8个、最低是第10个epoch，计算速度则取第6个、第7个和第9个epoch的值相加除以3，即为：
 
@@ -108,17 +108,13 @@ Epoch: [10] Avg img/s: 4845.4628560647725
 
 注：在该模型用例中，通过以上方法获取的速度，主要评估的是训练集上training的速度，而端到端(end-to-end)训练速度则包含了训练集和验证集在整个training和evaluation的全部过程中的总体速度。
 
-训练端到端的速度计算方式如下：
-
-（每个epoch的处理的样本数量*完整训练的epoch数量）/ 总的训练时长
-
-通过“read 1281167 files from 1000 directories”的提示得到每个epoch的处理的样本数量为1281167个。
+训练端到端的速度计算方式为：（每个epoch的处理的样本数量*完整训练的epoch数量）/总的训练时长
 
-通过“Training time 5:06:03”的提示得到总的训练时长为5:06:03小时，换算成18363秒。
+1. 通过“read 1281167 files from 1000 directories”的提示得到每个epoch的处理的样本数量为1281167个。
 
-本次`amp_8card.sh`完整训练的端到端速度为：
+2. 通过“Training time 5:06:03”的提示得到总的训练时长为5:06:03小时，换算成18363秒。
 
-(1281167*64)/18363=4465.2 img/s
+3. 本次`amp_8card.sh`完整训练的端到端速度为：(1281167*64)/18363=4465.2 img/s
 
 
 ### 准确性
@@ -144,7 +140,7 @@ The accuracy has been exceeded 75.9,and the training is terminated at epoch 64
 ...
 ```
 
-ResNet50模型收敛的标准是top1 75.9%，在第64个epoch时达到了Acc@1 77.360，超过了75.9的阈值（均为百分比）。所以训练的精度值为77.36%。
+ResNet50模型收敛的标准是top1 75.9%，在第64个epoch时达到了Acc@1 77.360（百分比），超过了75.9（百分比）的阈值。所以训练的精度值为77.36%。
 
 
 ### 线性度
@@ -252,16 +248,16 @@ The accuracy has been exceeded 75.9,and the training is terminated at epoch 64
 
 再进行4次模型完整训练，每次都最终达到标准收敛值，即达到`The accuracy has been exceeded 75.9`，，Acc@1分别得到如下结果：
 
-第2次：76.816
-第3次：77.116
-第4次：76.960
-第5次：77.010
+- 第2次：76.816
+- 第3次：77.116
+- 第4次：76.960
+- 第5次：77.010
 
 取5次的收敛值的中值做为基准值，即以第5次的收敛精度77.010作为基准，然后其它的4次收敛值对比基准值的差值百分比计算如下：
 
-第1次：(77.360-77.010)/77.010=0.0045
-第2次：(76.816-77.010)/77.010=-0.0025
-第3次：(77.116-77.010)/77.010=0.0013
-第4次：(76.960-77.010)/77.010=-0.0006
+- 第1次：(77.360-77.010)/77.010=0.0045
+- 第2次：(76.816-77.010)/77.010=-0.0025
+- 第3次：(77.116-77.010)/77.010=0.0013
+- 第4次：(76.960-77.010)/77.010=-0.0006
 
 可以得到差值百分比都分布在（-0.01，+0.01）的合理区间，此时达到满分1。（当5个数据有1次不在该范围内，稳定度则递减20%。）
-- 
Gitee


From f8572a43070bb77c55697185706f5ba0bbc311f2 Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Fri, 9 Dec 2022 15:15:40 +0800
Subject: [PATCH 14/17] fix filename

---
 README.md                                                       | 2 +-
 .../Iluvatar/six_dimension_howto.md                             | 2 +-
 .../Iluvatar/six_dimension_howto_example.md                     | 2 +-
 3 files changed, 3 insertions(+), 3 deletions(-)
 rename "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" => evaluation/Iluvatar/six_dimension_howto.md (98%)
 rename "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" => evaluation/Iluvatar/six_dimension_howto_example.md (99%)

diff --git a/README.md b/README.md
index 08f4d3e..39ff12a 100644
--- a/README.md
+++ b/README.md
@@ -69,7 +69,7 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发
 
 ### 天垓100通用GPU
 
-评测方法详见 [天垓100六维度评测方法](evaluation/Iluvatar/六维度评测方法.md)。
+评测方法详见 [天垓100六维度评测方法](evaluation/Iluvatar/six_dimension_howto.md)。
 
 评测结果如下：
 
diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" b/evaluation/Iluvatar/six_dimension_howto.md
similarity index 98%
rename from "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
rename to evaluation/Iluvatar/six_dimension_howto.md
index 09a6c1e..a75da18 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md"
+++ b/evaluation/Iluvatar/six_dimension_howto.md
@@ -107,4 +107,4 @@ $ ixsmi -q -i 0 -l | grep Used.[^G]
 
 ## 六维度数据计算示例
 
-[天垓100六维度评测方法示例：ResNet50](六维度评测方法_示例.md)
+[天垓100六维度评测方法示例：ResNet50](six_dimension_howto_example.md)
diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" b/evaluation/Iluvatar/six_dimension_howto_example.md
similarity index 99%
rename from "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md"
rename to evaluation/Iluvatar/six_dimension_howto_example.md
index 0e5cfe5..7296d8a 100644
--- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md"
+++ b/evaluation/Iluvatar/six_dimension_howto_example.md
@@ -1,6 +1,6 @@
 # 天垓100六维度评测方法示例：ResNet50
 
-使用天数智芯天垓100（BI-V100）通用GPU硬件并安装天数智芯软件栈和深度学习框架后，您可运行DeepSpark模型训练脚本，并借助于天数智芯GPU实时状态检测工具ixSMI得到天垓100硬件的六维度数据。DeepSpark六维度指标的定义请参照[评测体系](../../README.md#评测体系)。天垓100六维度具体计算方法请参照[天垓100（BI-V100）六维度评测方法](六维度评测方法.md)。
+使用天数智芯天垓100（BI-V100）通用GPU硬件并安装天数智芯软件栈和深度学习框架后，您可运行DeepSpark模型训练脚本，并借助于天数智芯GPU实时状态检测工具ixSMI得到天垓100硬件的六维度数据。DeepSpark六维度指标的定义请参照[评测体系](../../README.md#评测体系)。天垓100六维度具体计算方法请参照[天垓100（BI-V100）六维度评测方法](six_dimension_howto.md)。
 
 本示例以[ResNet50模型](https://gitee.com/deep-spark/deepsparkhub/tree/master/cv/classification/resnet50/pytorch)为例，用8张天垓100（BI-V100）卡执行`amp_8card.sh`脚本进行混合精度训练。在本示例环境中，数据集所在路径为`/home/datasets/imagenet`。
 
-- 
Gitee


From f64df71fb79f7bc6e4e0de63f41f8dc9df6e3b51 Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Fri, 9 Dec 2022 16:53:21 +0800
Subject: [PATCH 15/17] fix title layer

---
 evaluation/Iluvatar/six_dimension_howto_example.md | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/evaluation/Iluvatar/six_dimension_howto_example.md b/evaluation/Iluvatar/six_dimension_howto_example.md
index 7296d8a..d1d3d2b 100644
--- a/evaluation/Iluvatar/six_dimension_howto_example.md
+++ b/evaluation/Iluvatar/six_dimension_howto_example.md
@@ -117,7 +117,7 @@ Training time 5:06:03
 3. 本次`amp_8card.sh`完整训练的端到端速度为：(1281167*64)/18363=4465.2 img/s
 
 
-### 准确性
+## 准确性
 
 执行DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的训练准确度，例如：
 
@@ -143,7 +143,7 @@ The accuracy has been exceeded 75.9,and the training is terminated at epoch 64
 ResNet50模型收敛的标准是top1 75.9%，在第64个epoch时达到了Acc@1 77.360（百分比），超过了75.9（百分比）的阈值。所以训练的精度值为77.36%。
 
 
-### 线性度
+## 线性度
 
 执行DeepSpark模型训练脚本，脚本会打印训练过程中每个epoch的速度，训练可以使用单卡和多卡进行，或使用单节点和多节点进行，分别可以计算出卡线性度和节点线性度。
 
@@ -184,7 +184,7 @@ Epoch time 1:04:59
 
 得到卡线性度 321.9/335=96%
 
-### 功耗
+## 功耗
 
 在模型稳定训练时，使用GPU实时状态检测工具ixSMI查询实际消耗的GPU功耗并取平均值。
 
@@ -204,7 +204,7 @@ $ ixsmi -q -i 0 -l | grep -E 'Power Draw'
 
 平均功耗 (161+169+161+174+163)/5=165.6 W
 
-### 显存占用
+## 显存占用
 
 在模型稳定训练时，使用GPU实时状态检测工具ixSMI查询GPU显存占用量并取平均值。
 
@@ -221,7 +221,7 @@ $ ixsmi -q -i 0 -l | grep Used.[^G]
 
 去平均值得到平均显存占用量为 (30671+30670+30671+30671+30670)/5=30670.6 MiB
 
-### 稳定度
+## 稳定度
 
 执行DeepSpark模型训练脚本，脚本会打印完整训练最终所达到的收敛值，例如：
 
-- 
Gitee


From 261923613eb05d9d92042bd49fcd9bc95e772baa Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Mon, 12 Dec 2022 14:13:23 +0800
Subject: [PATCH 16/17] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E6=8F=8F=E8=BF=B0?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 README.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/README.md b/README.md
index 39ff12a..a42bdee 100644
--- a/README.md
+++ b/README.md
@@ -1,6 +1,6 @@
 # DeepSpark百大应用开放平台
 
-DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发及评测平台，基于天数智芯及其行业伙伴的应用落地经验，分享与落地应用深度耦合的百大应用算法和模型，覆盖各应用领域，并针对行业需求构建多维度测评体系，广泛支持各类落地场景。
+DeepSpark百大应用开放平台作为国内领先AI和通用计算应用开发及评测平台，基于天数智芯及其行业伙伴的应用落地经验，分享与落地应用深度耦合的百大应用算法和模型，覆盖各应用领域，并针对行业需求构建多维度测评体系，广泛支持各类落地场景。
 
 ## 组成部分
 
@@ -99,7 +99,7 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发
 
 ### 项目背景
 
-万物皆算的时代，各领域应用层出不穷，算力必须支撑实际应用，通用性和未来可扩展性是评估算力的重要指标。天数智芯作为中国首家自研通用GPU算力提供商，截止2022年8月，已成功支持200+ AI模型训练，和300+家客户和伙伴建立合作，共同促进国内通用算力的发展，产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。
+万物皆算的时代，各领域应用层出不穷，算力必须支撑实际应用，通用性和未来可扩展性是评估算力的重要指标。天数智芯作为中国头部自研通用GPU算力提供商，截止2022年8月，已成功支持200+ AI模型训练，和300+家客户和伙伴建立合作，共同促进国内通用算力的发展，产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。
 
 天数智芯本着“平台共建、生态共享、产业共赢”的原则，通过与行业伙伴一起打造[DeepSpark开源社区](https://www.deepspark.org.cn/)，汇聚社区力量，从而让产业生态收获算力赋能，助力客户更快更好应用落地，为产业生态提供更多可能性。欢迎广大社区用户和开发者积极参与和贡献DeepSpark百大应用开放平台。
 
-- 
Gitee


From 393d4c0b3d23a295fe87e64935fb151d757813db Mon Sep 17 00:00:00 2001
From: Shikun Li <shikun.li@iluvatar.ai>
Date: Mon, 12 Dec 2022 14:20:34 +0800
Subject: [PATCH 17/17] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E6=8F=8F=E8=BF=B0?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 README.md | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/README.md b/README.md
index a42bdee..ff3f97c 100644
--- a/README.md
+++ b/README.md
@@ -1,6 +1,6 @@
 # DeepSpark百大应用开放平台
 
-DeepSpark百大应用开放平台作为国内领先AI和通用计算应用开发及评测平台，基于天数智芯及其行业伙伴的应用落地经验，分享与落地应用深度耦合的百大应用算法和模型，覆盖各应用领域，并针对行业需求构建多维度测评体系，广泛支持各类落地场景。
+DeepSpark百大应用开放平台作为国内领先的AI和通用计算应用开发及评测平台，基于天数智芯及其行业伙伴的应用落地经验，分享与落地应用深度耦合的百大应用算法和模型，覆盖各应用领域，并针对行业需求构建多维度测评体系，广泛支持各类落地场景。
 
 ## 组成部分
 
@@ -99,7 +99,7 @@ DeepSpark百大应用开放平台作为国内领先AI和通用计算应用开发
 
 ### 项目背景
 
-万物皆算的时代，各领域应用层出不穷，算力必须支撑实际应用，通用性和未来可扩展性是评估算力的重要指标。天数智芯作为中国头部自研通用GPU算力提供商，截止2022年8月，已成功支持200+ AI模型训练，和300+家客户和伙伴建立合作，共同促进国内通用算力的发展，产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。
+万物皆算的时代，各领域应用层出不穷，算力必须支撑实际应用，通用性和未来可扩展性是评估算力的重要指标。天数智芯作为国内头部自研通用GPU算力提供商，截止2022年8月，已成功支持200+ AI模型训练，和300+家客户和伙伴建立合作，共同促进国内通用算力的发展，产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。
 
 天数智芯本着“平台共建、生态共享、产业共赢”的原则，通过与行业伙伴一起打造[DeepSpark开源社区](https://www.deepspark.org.cn/)，汇聚社区力量，从而让产业生态收获算力赋能，助力客户更快更好应用落地，为产业生态提供更多可能性。欢迎广大社区用户和开发者积极参与和贡献DeepSpark百大应用开放平台。
 
-- 
Gitee