From cdd97db85074ebf4107666e13b68c7b15bf7a17a Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Wed, 23 Nov 2022 11:12:14 +0800 Subject: [PATCH 01/17] =?UTF-8?q?Create=20=E5=85=AD=E7=BB=B4=E5=BA=A6?= =?UTF-8?q?=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...04\346\265\213\346\226\271\346\263\225.md" | 66 +++++++++++++++++++ 1 file changed, 66 insertions(+) create mode 100644 "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" new file mode 100644 index 0000000..2dda0cf --- /dev/null +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -0,0 +1,66 @@ +# BI-V100评测方法 + +## 前置条件 + +1. 获取天数智芯BI-V100算力 +2. 安装天数智芯软件栈 + +## 使用工具 + +- ixSMI工具:包含在天数智芯软件栈中,当您安装好天数智芯软件栈后即可通过ixsmi进行调用 +- DeepSpark模型训练脚本:脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据 + +## 六维度数据计算方法 + +### 速度 + +定义:单机模型稳定训练时每秒处理的单位样本的算力。 + +数据来源:脚本会打印训练过程中每个iteration,每个epoch的每秒处理的单位样本数量。 + +计算方法:即指定迭代轮次5次去掉最高最低,取中间3次的mean中值。如第一个iteration的第6到第10个epoch中,最高是第6个、最低是第10个epoch,则取第7个、第8个和第9个epoch的值相加除以3。 + +### 准确性 + +定义:模型收敛的精度值。 + +数据来源:脚本会打印训练过程中每个iteration,每个epoch的训练准确度。 + +计算方法:随着训练迭代而模型的loss变化不再显著时,模型是否达到判定为收敛所要求的准确度,记录此时的精度值。 + +### 线性度 + +定义:模型集群规模化训练的scalability,算力线性扩展性能。 + +数据来源:脚本会打印训练过程中每个iteration,每个epoch的每秒处理的单位样本数量。 + +计算方法:线性度具体还可以分为如下两种: + +- 多卡对单卡的线性度:在一台服务器上使用多张BI-V100训练时每秒处理的单位样本数量(即速度)对比使用1张BI-V100训练时的速度,再除以多卡的卡数。例如,使用8张BI-V100时的训练速度除以使用1张BI-V100时的训练速度,再除以卡的倍数(即8),得到8卡对单卡的线性度。 + +- 多节点对单节点的线性度:在每台服务器(即节点)安装相同数量的BI-V100卡前提下,使用多台服务器训练的每秒处理的单位样本数量(即速度)对比使用1台服务器训练时的速度,再除以多台服务器的台数。例如,使用2台服务器(都安装了8张BI-V100)时的训练速度除以使用1台服务器时的训练速度,再除以服务器的倍数(即2),得到2节点对单节点的线性度。 + +### 功耗 + +定义:模型训练稳定训练时候实际消耗的GPU平均功耗。 + +数据来源:ixSMI工具。 + +计算方法:模型训练稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入**ixsmi -l** *value* 命令,ixsmi工具会间隔value秒,循环显示GPU摘要信息,缺省值为5,摘要信息中包括此时BI-V100的功耗,单位为W。取多次的数据取平均值作为模型训练的功耗。 + +### 显存 + +定义:模型训练稳定训练时候实际消耗的GPU平均显存用量。 + +数据来源:ixSMI工具。 + +计算方法:模型训练稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入**ixsmi -l** *value* 命令,ixsmi工具会间隔value秒,循环显示GPU摘要信息,缺省值为5,摘要信息中包括此时BI-V100使用的显存,单位为MiB。取多次的数据取平均值作为模型训练的显存用量。 + + +### 稳定度 + +定义:取多次模型完整训练,即训练达到收敛,此时loss值的稳定程度。 + +数据来源:脚本会打印训练过程中每个iteration,每个epoch的loss值。 + +计算方法:模型采用5次完整训练,当达到收敛时,loss值应分布在(-0.01,+0.01)的合理区间,此时达到满分1。当5个数据有1次不在该范围内,稳定度则递减20%。 \ No newline at end of file -- Gitee From 5cad07e0e3c00215cdb5c76deb13929eabdd56be Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Wed, 23 Nov 2022 11:15:01 +0800 Subject: [PATCH 02/17] =?UTF-8?q?Jeff's=20comments=20via=20=E9=A3=9E?= =?UTF-8?q?=E4=B9=A6?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...257\204\346\265\213\346\226\271\346\263\225.md" | 14 +++++++------- 1 file changed, 7 insertions(+), 7 deletions(-) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index 2dda0cf..fe4f85b 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -8,7 +8,7 @@ ## 使用工具 - ixSMI工具:包含在天数智芯软件栈中,当您安装好天数智芯软件栈后即可通过ixsmi进行调用 -- DeepSpark模型训练脚本:脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据 +- DeepSpark模型训练脚本:脚本会打印训练时每秒处理的单位样本数量、模型accuracy值等数据 ## 六维度数据计算方法 @@ -22,11 +22,11 @@ ### 准确性 -定义:模型收敛的精度值。 +定义:模型收敛的accuracy值。 -数据来源:脚本会打印训练过程中每个iteration,每个epoch的训练准确度。 +数据来源:脚本会打印训练过程中每个iteration,每个epoch的训练accuracy值。 -计算方法:随着训练迭代而模型的loss变化不再显著时,模型是否达到判定为收敛所要求的准确度,记录此时的精度值。 +计算方法:随着训练迭代而模型的loss变化不再显著时,模型是否达到判定为收敛所要求的accuracy值,记录此时的accuracy值。 ### 线性度 @@ -59,8 +59,8 @@ ### 稳定度 -定义:取多次模型完整训练,即训练达到收敛,此时loss值的稳定程度。 +定义:取多次模型完整训练,即训练达到收敛,此时accuracy值的稳定程度。 -数据来源:脚本会打印训练过程中每个iteration,每个epoch的loss值。 +数据来源:脚本会打印训练过程中每个epoch的accuracy值。 -计算方法:模型采用5次完整训练,当达到收敛时,loss值应分布在(-0.01,+0.01)的合理区间,此时达到满分1。当5个数据有1次不在该范围内,稳定度则递减20%。 \ No newline at end of file +计算方法:模型采用5次完整训练,当达到收敛时,取5次的accuracy值的中值做为基准值,然后其他的4次的对比该基准值的差值应分布在(-0.01,+0.01)的合理区间,此时达到满分1。当5个数据有1次不在该范围内,稳定度则递减20%。 \ No newline at end of file -- Gitee From 7d209a2b8ad8a68843f16843380704c6437b09e2 Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Wed, 23 Nov 2022 11:18:05 +0800 Subject: [PATCH 03/17] Jeff's version --- ...04\346\265\213\346\226\271\346\263\225.md" | 45 ++++++++++--------- 1 file changed, 24 insertions(+), 21 deletions(-) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index fe4f85b..78274d5 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -7,60 +7,63 @@ ## 使用工具 -- ixSMI工具:包含在天数智芯软件栈中,当您安装好天数智芯软件栈后即可通过ixsmi进行调用 -- DeepSpark模型训练脚本:脚本会打印训练时每秒处理的单位样本数量、模型accuracy值等数据 +- ixSMI:GPU实时状态检测工具,包含在天数智芯软件栈中,当您安装好天数智芯软件栈后即可通过ixsmi进行调用 +- DeepSpark模型训练脚本:脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据 ## 六维度数据计算方法 ### 速度 -定义:单机模型稳定训练时每秒处理的单位样本的算力。 +定义:模型稳定训练时每秒处理的单位样本的算力。 -数据来源:脚本会打印训练过程中每个iteration,每个epoch的每秒处理的单位样本数量。 +数据来源:DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的每秒处理的单位样本数量。 -计算方法:即指定迭代轮次5次去掉最高最低,取中间3次的mean中值。如第一个iteration的第6到第10个epoch中,最高是第6个、最低是第10个epoch,则取第7个、第8个和第9个epoch的值相加除以3。 +计算方法:即指定迭代轮次为总共5次,去掉5次中的速度的最高最低值,取中间3次速度值的平均值(或mean中值)。如取稳定训练的第6到第10个epoch共5给epochs,最高是第6个、最低是第10个epoch,则取第7个、第8个和第9个epoch的值相加除以3。 ### 准确性 -定义:模型收敛的accuracy值。 +定义:模型收敛的精度值。 -数据来源:脚本会打印训练过程中每个iteration,每个epoch的训练accuracy值。 +数据来源:DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的训练准确度。 -计算方法:随着训练迭代而模型的loss变化不再显著时,模型是否达到判定为收敛所要求的accuracy值,记录此时的accuracy值。 +计算方法:随着训练迭代而模型的loss变化不再显著时,评估模型是否达到判定为收敛所要求的准确度指标,记录此时的精度值。 ### 线性度 -定义:模型集群规模化训练的scalability,算力线性扩展性能。 +定义:模型集群规模化训练的scalability,即算力的线性扩展性能。 -数据来源:脚本会打印训练过程中每个iteration,每个epoch的每秒处理的单位样本数量。 +数据来源:DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的每秒处理的单位样本数量。 计算方法:线性度具体还可以分为如下两种: -- 多卡对单卡的线性度:在一台服务器上使用多张BI-V100训练时每秒处理的单位样本数量(即速度)对比使用1张BI-V100训练时的速度,再除以多卡的卡数。例如,使用8张BI-V100时的训练速度除以使用1张BI-V100时的训练速度,再除以卡的倍数(即8),得到8卡对单卡的线性度。 +- 卡线性度:在一台服务器上使用多张BI-V100训练时每秒处理的单位样本数量(即速度)除以多卡的卡数,再对比使用1张BI-V100训练时的速度。例如,使用8张BI-V100时的训练速度除以卡的倍数(即8),再除以使用1张BI-V100时的训练速度,得到8卡对单卡的线性度。 -- 多节点对单节点的线性度:在每台服务器(即节点)安装相同数量的BI-V100卡前提下,使用多台服务器训练的每秒处理的单位样本数量(即速度)对比使用1台服务器训练时的速度,再除以多台服务器的台数。例如,使用2台服务器(都安装了8张BI-V100)时的训练速度除以使用1台服务器时的训练速度,再除以服务器的倍数(即2),得到2节点对单节点的线性度。 +- 节点线性度:在每台服务器(即节点)安装相同数量的BI-V100卡前提下,使用多台服务器训练的每秒处理的单位样本数量(即速度)除以多台服务器的台数,再对比使用1台服务器训练时的速度。例如,使用4台服务器(每台都分别安装了8张BI-V100)时的训练速度,除以服务器的总台数(即节点数4),再除以使用1台服务器时的训练速度,得到4节点对单节点的线性度。 ### 功耗 -定义:模型训练稳定训练时候实际消耗的GPU平均功耗。 +定义:模型稳定训练时候实际消耗的GPU平均功耗。 -数据来源:ixSMI工具。 +数据来源:GPU实时状态检测工具ixSMI。 -计算方法:模型训练稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入**ixsmi -l** *value* 命令,ixsmi工具会间隔value秒,循环显示GPU摘要信息,缺省值为5,摘要信息中包括此时BI-V100的功耗,单位为W。取多次的数据取平均值作为模型训练的功耗。 +计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入**ixsmi -l** *value* 命令,ixsmi工具会间隔value秒,循环显示GPU摘要信息,缺省值为5,摘要信息中包括此时BI-V100的功耗,单位为W。取多次的数据取平均值作为模型训练的功耗。 + +@shikun -- 建议加这个进阶指令说明 -- ixsmi -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw' ### 显存 -定义:模型训练稳定训练时候实际消耗的GPU平均显存用量。 +定义:模型稳定训练时实际消耗的GPU平均显存用量。 -数据来源:ixSMI工具。 +数据来源:GPU实时状态检测工具ixSMI。 -计算方法:模型训练稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入**ixsmi -l** *value* 命令,ixsmi工具会间隔value秒,循环显示GPU摘要信息,缺省值为5,摘要信息中包括此时BI-V100使用的显存,单位为MiB。取多次的数据取平均值作为模型训练的显存用量。 +计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入**ixsmi -l** *value* 命令,ixsmi工具会间隔value秒,循环显示GPU摘要信息,缺省值为5,摘要信息中包括此时BI-V100使用的显存,单位为MiB。取多次的数据取平均值作为模型训练的显存用量。 +@shikun -- 建议加这个进阶指令说明 -- ixsmi -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw' ### 稳定度 -定义:取多次模型完整训练,即训练达到收敛,此时accuracy值的稳定程度。 +定义:取模型多次完整训练最终所达到的收敛值,比较多次收敛值的稳定程度。 -数据来源:脚本会打印训练过程中每个epoch的accuracy值。 +数据来源:DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的结束时达到的准确度。 -计算方法:模型采用5次完整训练,当达到收敛时,取5次的accuracy值的中值做为基准值,然后其他的4次的对比该基准值的差值应分布在(-0.01,+0.01)的合理区间,此时达到满分1。当5个数据有1次不在该范围内,稳定度则递减20%。 \ No newline at end of file +计算方法:模型采用5次完整训练,每次都最终达到标准收敛值,取5次的收敛值的中值做为base,然后其他的4次收敛值对比base的delta百分比应分布在(-0.01,+0.01)的合理区间,此时达到满分1。当5个数据有1次不在该范围内,稳定度则递减20%。 \ No newline at end of file -- Gitee From 92bac75c7d3199a25f7d14a85fd8f8c75af6b70c Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Wed, 23 Nov 2022 11:20:25 +0800 Subject: [PATCH 04/17] editorial updates --- ...04\346\265\213\346\226\271\346\263\225.md" | 20 +++++++++++-------- 1 file changed, 12 insertions(+), 8 deletions(-) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index 78274d5..c522344 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -7,8 +7,8 @@ ## 使用工具 -- ixSMI:GPU实时状态检测工具,包含在天数智芯软件栈中,当您安装好天数智芯软件栈后即可通过ixsmi进行调用 -- DeepSpark模型训练脚本:脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据 +- ixSMI:GPU实时状态检测工具,包含在天数智芯软件栈中,当您安装好天数智芯软件栈后即可通过**ixsmi**命令进行调用。 +- DeepSpark模型训练脚本:脚本会打印训练时每秒处理的单位样本数量、模型精度值等数据。 ## 六维度数据计算方法 @@ -18,7 +18,7 @@ 数据来源:DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的每秒处理的单位样本数量。 -计算方法:即指定迭代轮次为总共5次,去掉5次中的速度的最高最低值,取中间3次速度值的平均值(或mean中值)。如取稳定训练的第6到第10个epoch共5给epochs,最高是第6个、最低是第10个epoch,则取第7个、第8个和第9个epoch的值相加除以3。 +计算方法:即指定迭代轮次为总共5次,去掉5次中的速度的最高最低值,取中间3次速度值的平均值(或mean中值)。如取稳定训练的第6到第10个epoch共5个epoch,最高是第6个、最低是第10个epoch,则取第7个、第8个和第9个epoch的值相加除以3。 ### 准确性 @@ -46,9 +46,11 @@ 数据来源:GPU实时状态检测工具ixSMI。 -计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入**ixsmi -l** *value* 命令,ixsmi工具会间隔value秒,循环显示GPU摘要信息,缺省值为5,摘要信息中包括此时BI-V100的功耗,单位为W。取多次的数据取平均值作为模型训练的功耗。 +计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入以下命令,ixSMI工具会显示此时BI-V100的功耗,单位为W。取多次的数据取平均值作为模型训练的功耗。 -@shikun -- 建议加这个进阶指令说明 -- ixsmi -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw' +``` +$ ixSMI -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw' +``` ### 显存 @@ -56,9 +58,11 @@ 数据来源:GPU实时状态检测工具ixSMI。 -计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入**ixsmi -l** *value* 命令,ixsmi工具会间隔value秒,循环显示GPU摘要信息,缺省值为5,摘要信息中包括此时BI-V100使用的显存,单位为MiB。取多次的数据取平均值作为模型训练的显存用量。 +计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入以下命令,ixsmi工具会显示此时BI-V100使用的显存,单位为MiB。取多次的数据取平均值作为模型训练的显存用量。 -@shikun -- 建议加这个进阶指令说明 -- ixsmi -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw' +``` +$ ixSMI -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw' +``` ### 稳定度 @@ -66,4 +70,4 @@ 数据来源:DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的结束时达到的准确度。 -计算方法:模型采用5次完整训练,每次都最终达到标准收敛值,取5次的收敛值的中值做为base,然后其他的4次收敛值对比base的delta百分比应分布在(-0.01,+0.01)的合理区间,此时达到满分1。当5个数据有1次不在该范围内,稳定度则递减20%。 \ No newline at end of file +计算方法:模型采用5次完整训练,每次都最终达到标准收敛值,取5次的收敛值的中值做为基准值,然后其他的4次收敛值对比基准值的差值百分比应分布在(-0.01,+0.01)的合理区间,此时达到满分1。当5个数据有1次不在该范围内,稳定度则递减20%。 -- Gitee From d19d0083783798f6553acdcfb991d7e67b18287d Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Fri, 25 Nov 2022 16:13:17 +0800 Subject: [PATCH 05/17] =?UTF-8?q?=E6=9B=B4=E6=96=B0ixsmi=E5=91=BD=E4=BB=A4?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...04\346\265\213\346\226\271\346\263\225.md" | 38 +++++++++++++++++-- 1 file changed, 34 insertions(+), 4 deletions(-) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index c522344..406186c 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -46,24 +46,54 @@ 数据来源:GPU实时状态检测工具ixSMI。 -计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入以下命令,ixSMI工具会显示此时BI-V100的功耗,单位为W。取多次的数据取平均值作为模型训练的功耗。 +计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入以下命令,ixSMI工具会每间隔5秒显示此时BI-V100的功耗,单位为W。取多次的数据取平均值作为模型训练的功耗。 + +- 如您环境中仅安装了1张BI-V100,输入以下命令: + +``` +$ ixsmi -q -l | grep -E 'Power Draw' +``` + +- 如您环境中安装了多张BI-V100(可使用**ixsmi**命令获取多张卡的概要信息,包括index信息),输入以下命令,使用${gpu_index}指定具体读取哪张BI-V100的信息,注意index从0开始: ``` -$ ixSMI -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw' +$ ixsmi -q -i ${gpu_index} -l | grep -E 'Power Draw' ``` +例如,以下命令可以得到index为0的BI-V100的功耗信息: + +``` +$ ixsmi -q -i 0 -l | grep -E 'Power Draw' +``` + + ### 显存 定义:模型稳定训练时实际消耗的GPU平均显存用量。 数据来源:GPU实时状态检测工具ixSMI。 -计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入以下命令,ixsmi工具会显示此时BI-V100使用的显存,单位为MiB。取多次的数据取平均值作为模型训练的显存用量。 +计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入以下命令,ixSMI工具会每间隔5秒显示此时BI-V100使用的显存,单位为MiB。取多次的数据取平均值作为模型训练的显存用量。 + +- 如您环境中仅安装了1张BI-V100,输入以下命令: + +``` +$ ixsmi -q -l | grep -E 'Used' +``` + +- 如您环境中安装了多张BI-V100(可使用**ixsmi**命令获取多张卡的概要信息,包括index信息),输入以下命令,使用${gpu_index}指定具体读取哪张BI-V100的信息,注意index从0开始: ``` -$ ixSMI -q | grep -A 100 "0C:00.0" | grep -E 'GPU Current Temp|Used|SM|Name|Power Draw' +$ ixsmi -q -i ${gpu_index} -l | grep -E 'Used' ``` +例如,以下命令可以得到index为0的BI-V100的显存用量: + +``` +$ ixsmi -q -i 0 -l | grep -E 'Used' +``` + + ### 稳定度 定义:取模型多次完整训练最终所达到的收敛值,比较多次收敛值的稳定程度。 -- Gitee From 1109322f989470e67eddc5f9ed24aa8c0a364a7e Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Fri, 25 Nov 2022 17:02:12 +0800 Subject: [PATCH 06/17] update main README --- README.md | 26 ++++++++++++------- ...04\346\265\213\346\226\271\346\263\225.md" | 4 +-- 2 files changed, 18 insertions(+), 12 deletions(-) diff --git a/README.md b/README.md index 2370f3c..bd69146 100644 --- a/README.md +++ b/README.md @@ -44,14 +44,14 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发 - 提供 :six: 维度 -| 维度 | 说明 | -| --- | --- | -| 速度
:rocket: | 单机模型稳定训练时每秒处理的单位样本的算力,
即指定迭代轮次5次去掉最高最低,取中间3次的mean中值。 | -| 准确性
:dart: | 模型收敛的精度值。 -| 线性度
:chart_with_upwards_trend: | 模型集群规模化训练的scalability,算力线性扩展性能。
多节点对单节点的线性度,多节点对单卡的线性度。 -| 功耗
:electric_plug: | 模型训练稳定训练时候实际消耗的GPU平均功耗。 -| 显存
:bar_chart: | 模型训练稳定训练时候实际消耗的GPU平均显存用量。 -| 稳定度
:wrench: | 模型采用5次完整训练,收敛的波动性和稳定度在(-0.01,+0.01)合理区间,
5个数据有一次不在范围内就递减20%。 +| 维度 | 说明 | 数据来源 | 计算方法 +| --- | --- | --- | --- | +| 速度
:rocket: | 模型稳定训练时每秒处理的单位样本的算力 | DeepSpark模型训练脚本输出 | 指定迭代轮次5次去掉最高最低,取中间3次的mean中值 +| 准确性
:dart: | 模型收敛的精度值 | DeepSpark模型训练脚本输出 | 记录模型收敛时的精度值 +| 线性度
:chart_with_upwards_trend: | 模型集群规模化训练算力的线性扩展性能
包括卡线性度和节点线性度 | DeepSpark模型训练脚本输出 | 用多卡/多节点的训练速度除以卡数/节点数,再对比使用单张/单节点的训练速度 +| 功耗
:electric_plug: | 模型稳定训练时候实际消耗的GPU平均功耗 | GPU实时状态检测工具 | 取多次的功耗数据的平均值 +| 显存
:bar_chart: | 模型稳定训练时实际消耗的GPU平均显存用量 | GPU实时状态检测工具 | 取多次的显存用量的平均值 +| 稳定度
:wrench: | 多次完整训练(均达到收敛值)的收敛值的稳定程度 | DeepSpark模型训练脚本输出 | 采用5次达到标准收敛值的完整训练,取收敛值的中值做为基准值,其它值对比基准值的差值百分比有1次不在(-0.01,+0.01)范围内,稳定度则递减20% 参考信息:[硬件评测结果](#硬件评测结果) @@ -65,10 +65,14 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发 -------- -## 硬件评测结果 +## 硬件评测方法和结果 ### 天垓100通用GPU +评测方法详见 [天垓100六维度评测方法](evaluation/Iluvatar/六维度评测方法.md)。 + +评测结果如下: + | 任务 | 模型 | 收敛指标 | 配置(x-\>gpus) | 速度 | 准确度 | 功耗(W) | 线性度 | 显存(G) | 稳定度 | |--------------|------------|------------------|-----------------------|--------|--------|-----------|--------|-----------|--------| | 自然语言处理 | BERT-large | 0.72 | sdk2.2,bs:32,8x,amp | 214 | 0.72 | 152\*8 | 0.96 | 20.3\*8 | 1 | @@ -85,7 +89,9 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发 | 新兴模型 | Wave-MLP | 80.1 | sdk2.2,bs:256,8x,fp32 | 1026 | 83.1 | 198\*8 | 0.98 | 29.4\*8 | 1 | -各维度说明,请见[评测体系](#评测体系). +各维度说明,请见[评测体系](#评测体系)。 + + ------- diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index 406186c..d30c1bf 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -1,8 +1,8 @@ -# BI-V100评测方法 +# 天垓100(BI-V100)评测方法 ## 前置条件 -1. 获取天数智芯BI-V100算力 +1. 获取天数智芯天垓100(BI-V100)算力 2. 安装天数智芯软件栈 ## 使用工具 -- Gitee From 2916b406faffa4c1dd08aa6cd20cf4823168846b Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Tue, 29 Nov 2022 15:50:42 +0800 Subject: [PATCH 07/17] =?UTF-8?q?=E6=98=BE=E5=AD=98=E5=8D=A0=E7=94=A8?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 4 ++-- ...350\257\204\346\265\213\346\226\271\346\263\225.md" | 10 +++++----- 2 files changed, 7 insertions(+), 7 deletions(-) diff --git a/README.md b/README.md index bd69146..1d017ca 100644 --- a/README.md +++ b/README.md @@ -50,7 +50,7 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发 | 准确性
:dart: | 模型收敛的精度值 | DeepSpark模型训练脚本输出 | 记录模型收敛时的精度值 | 线性度
:chart_with_upwards_trend: | 模型集群规模化训练算力的线性扩展性能
包括卡线性度和节点线性度 | DeepSpark模型训练脚本输出 | 用多卡/多节点的训练速度除以卡数/节点数,再对比使用单张/单节点的训练速度 | 功耗
:electric_plug: | 模型稳定训练时候实际消耗的GPU平均功耗 | GPU实时状态检测工具 | 取多次的功耗数据的平均值 -| 显存
:bar_chart: | 模型稳定训练时实际消耗的GPU平均显存用量 | GPU实时状态检测工具 | 取多次的显存用量的平均值 +| 显存占用
:bar_chart: | 模型稳定训练时实际消耗的GPU平均显存占用量 | GPU实时状态检测工具 | 取多次的显存占用量的平均值 | 稳定度
:wrench: | 多次完整训练(均达到收敛值)的收敛值的稳定程度 | DeepSpark模型训练脚本输出 | 采用5次达到标准收敛值的完整训练,取收敛值的中值做为基准值,其它值对比基准值的差值百分比有1次不在(-0.01,+0.01)范围内,稳定度则递减20% 参考信息:[硬件评测结果](#硬件评测结果) @@ -73,7 +73,7 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发 评测结果如下: -| 任务 | 模型 | 收敛指标 | 配置(x-\>gpus) | 速度 | 准确度 | 功耗(W) | 线性度 | 显存(G) | 稳定度 | +| 任务 | 模型 | 收敛指标 | 配置(x-\>gpus) | 速度 | 准确度 | 功耗(W) | 线性度 | 显存占用(G) | 稳定度 | |--------------|------------|------------------|-----------------------|--------|--------|-----------|--------|-----------|--------| | 自然语言处理 | BERT-large | 0.72 | sdk2.2,bs:32,8x,amp | 214 | 0.72 | 152\*8 | 0.96 | 20.3\*8 | 1 | | 推荐系统 | DLRM | AUC:0.75 | sdk2.2,bs:2048,8x,amp | 793486 | 0.75 | 60\*8 | 0.97 | 3.7\*8 | 1 | diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index d30c1bf..edf35e1 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -1,4 +1,4 @@ -# 天垓100(BI-V100)评测方法 +# 天垓100(BI-V100)六维度评测方法 ## 前置条件 @@ -67,13 +67,13 @@ $ ixsmi -q -i 0 -l | grep -E 'Power Draw' ``` -### 显存 +### 显存占用 -定义:模型稳定训练时实际消耗的GPU平均显存用量。 +定义:模型稳定训练时实际消耗的GPU平均显存占用量。 数据来源:GPU实时状态检测工具ixSMI。 -计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入以下命令,ixSMI工具会每间隔5秒显示此时BI-V100使用的显存,单位为MiB。取多次的数据取平均值作为模型训练的显存用量。 +计算方法:模型稳定训练时(通常是排除训练刚开始的数据处理和预热阶段),在终端输入以下命令,ixSMI工具会每间隔5秒显示此时BI-V100显存的使用量,单位为MiB。取多次的数据取平均值作为模型训练的显存占用量。 - 如您环境中仅安装了1张BI-V100,输入以下命令: @@ -87,7 +87,7 @@ $ ixsmi -q -l | grep -E 'Used' $ ixsmi -q -i ${gpu_index} -l | grep -E 'Used' ``` -例如,以下命令可以得到index为0的BI-V100的显存用量: +例如,以下命令可以得到index为0的BI-V100的显存占用量: ``` $ ixsmi -q -i 0 -l | grep -E 'Used' -- Gitee From 3b0f2c8b7dd0316bc4167cec38719e75bd1cc50c Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Tue, 6 Dec 2022 15:33:15 +0800 Subject: [PATCH 08/17] =?UTF-8?q?Update=20=E5=85=AD=E7=BB=B4=E5=BA=A6?= =?UTF-8?q?=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...\246\350\257\204\346\265\213\346\226\271\346\263\225.md" | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index edf35e1..218dee9 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -78,19 +78,19 @@ $ ixsmi -q -i 0 -l | grep -E 'Power Draw' - 如您环境中仅安装了1张BI-V100,输入以下命令: ``` -$ ixsmi -q -l | grep -E 'Used' +$ ixsmi -q -l | grep Used.[^G] ``` - 如您环境中安装了多张BI-V100(可使用**ixsmi**命令获取多张卡的概要信息,包括index信息),输入以下命令,使用${gpu_index}指定具体读取哪张BI-V100的信息,注意index从0开始: ``` -$ ixsmi -q -i ${gpu_index} -l | grep -E 'Used' +$ ixsmi -q -i ${gpu_index} -l | grep Used.[^G] ``` 例如,以下命令可以得到index为0的BI-V100的显存占用量: ``` -$ ixsmi -q -i 0 -l | grep -E 'Used' +$ ixsmi -q -i 0 -l | grep Used.[^G] ``` -- Gitee From c1573ad134f02b40f7bff0fc1d750376c6c088a4 Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Tue, 6 Dec 2022 15:40:35 +0800 Subject: [PATCH 09/17] =?UTF-8?q?=E6=B7=BB=E5=8A=A0=20=E5=85=AD=E7=BB=B4?= =?UTF-8?q?=E5=BA=A6=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95=5F=E7=A4=BA?= =?UTF-8?q?=E4=BE=8B.md=E9=93=BE=E6=8E=A5?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...72\246\350\257\204\346\265\213\346\226\271\346\263\225.md" | 4 ++++ 1 file changed, 4 insertions(+) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index 218dee9..26e0230 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -101,3 +101,7 @@ $ ixsmi -q -i 0 -l | grep Used.[^G] 数据来源:DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的结束时达到的准确度。 计算方法:模型采用5次完整训练,每次都最终达到标准收敛值,取5次的收敛值的中值做为基准值,然后其他的4次收敛值对比基准值的差值百分比应分布在(-0.01,+0.01)的合理区间,此时达到满分1。当5个数据有1次不在该范围内,稳定度则递减20%。 + +## 六维度数据计算示例 + +[天垓100六维度评测方法示例:ResNet50](六维度评测方法_示例.md) -- Gitee From 223e72ebe94979b18c01a5f3d5f1b49c5c53cd0f Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Fri, 9 Dec 2022 13:39:09 +0800 Subject: [PATCH 10/17] =?UTF-8?q?Create=20=E5=85=AD=E7=BB=B4=E5=BA=A6?= =?UTF-8?q?=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95=5F=E7=A4=BA=E4=BE=8B.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...1\346\263\225_\347\244\272\344\276\213.md" | 267 ++++++++++++++++++ 1 file changed, 267 insertions(+) create mode 100644 "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" new file mode 100644 index 0000000..eee05ea --- /dev/null +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" @@ -0,0 +1,267 @@ +# 天垓100六维度评测方法示例:ResNet50 + +使用天数智芯天垓100(BI-V100)通用GPU硬件并安装天数智芯软件栈和深度学习框架后,您可运行DeepSpark模型训练脚本,并借助于天数智芯GPU实时状态检测工具ixSMI得到天垓100硬件的六维度数据。DeepSpark六维度指标的定义请参照[评测体系](../../README.md#评测体系)。天垓100六维度具体计算方法请参照[天垓100(BI-V100)六维度评测方法](六维度评测方法.md)。 + +本示例以[ResNet50模型](https://gitee.com/deep-spark/deepsparkhub/tree/master/cv/classification/resnet50/pytorch)为例,用8张天垓100(BI-V100)卡执行`amp_8card.sh`脚本进行混合精度训练。在本示例环境中,数据集所在路径为`/home/datasets/imagenet`。 + +具体运行和六维度的计算过程如下: + +## 速度 + +执行DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的每秒处理的单位样本数量,例如: + +``` +$ bash amp_8card.sh --data-path /home/datasets/imagenet +... +Creating data loaders +read 1281167 files from 1000 directories +... +Creating model resnet50 +Start training +Epoch: [0] [ 0/334] eta: 0:38:25 lr: 0.128 img/s: 590.7051616388846 loss: 7.1621 (7.1621) acc1: 0.0000 (0.0000) acc5: 0.0000 (0.0000) time: 6.9017 data: 0.0000 +Epoch: [0] [ 10/334] eta: 0:06:47 lr: 0.128 img/s: 5625.496142412713 loss: 7.2926 (7.2497) acc1: 0.0000 (0.1326) acc5: 0.6250 (0.8144) time: 1.2591 data: 0.0019 +Epoch: [0] [ 20/334] eta: 0:05:09 lr: 0.128 img/s: 5597.293247401811 loss: 7.4071 (7.4806) acc1: 0.0000 (0.0794) acc5: 0.6250 (0.7639) time: 0.6908 data: 0.0020 +Epoch: [0] [ 30/334] eta: 0:04:30 lr: 0.128 img/s: 5445.774084325316 loss: 7.3483 (7.4083) acc1: 0.0000 (0.1075) acc5: 0.6250 (0.7258) time: 0.6889 data: 0.0018 +... +Epoch: [0] [320/334] eta: 0:00:11 lr: 0.128 img/s: 5411.016050829418 loss: 6.8285 (6.9574) acc1: 0.2083 (0.1694) acc5: 1.2500 (0.7976) time: 0.8184 data: 0.0023 +Epoch: [0] [330/334] eta: 0:00:03 lr: 0.128 img/s: 5601.840934156804 loss: 6.8106 (6.9527) acc1: 0.4167 (0.1788) acc5: 1.6667 (0.8283) time: 0.7644 data: 0.0023 +Epoch: [0] Total time: 0:04:38 +Data loading of epoch 0: 0:00:00.759193 +Epoch: [0] Avg img/s: 5060.21643823427 +Test: [ 0/14] eta: 0:00:03 loss: 6.9883 (6.9883) acc1: 0.0000 (0.0000) acc5: 0.0000 (0.0000) time: 0.2724 data: 0.0000 +Test: Total time: 0:00:04 + * Acc@1 0.112 Acc@5 1.040 +Epoch time 0:04:43 +... +Epoch: [6] Total time: 0:04:38 +Data loading of epoch 6: 0:00:00.797741 +Epoch: [6] Avg img/s: 4910.795658460139 +Test: [ 0/14] eta: 0:00:04 loss: 5.5391 (5.5391) acc1: 8.1250 (8.1250) acc5: 24.1667 (24.1667) time: 0.2859 data: 0.0019 +Test: Total time: 0:00:03 + * Acc@1 13.360 Acc@5 30.960 +Epoch time 0:04:43 +... +Epoch: [7] Total time: 0:04:36 +Data loading of epoch 7: 0:00:00.770986 +Epoch: [7] Avg img/s: 4980.222383258538 +Test: [ 0/14] eta: 0:00:03 loss: 5.4844 (5.4844) acc1: 8.1250 (8.1250) acc5: 23.9583 (23.9583) time: 0.2801 data: 0.0017 +Test: Total time: 0:00:03 + * Acc@1 24.928 Acc@5 49.712 +Epoch time 0:04:41 +... +Epoch: [8] Total time: 0:04:31 +Data loading of epoch 8: 0:00:00.756521 +Epoch: [8] Avg img/s: 5032.905842259754 +Test: [ 0/14] eta: 0:00:04 loss: 4.1641 (4.1641) acc1: 29.1667 (29.1667) acc5: 54.5833 (54.5833) time: 0.2861 data: 0.0019 +Test: Total time: 0:00:03 + * Acc@1 23.536 Acc@5 47.024 +Epoch time 0:04:35 +... +Epoch: [9] Total time: 0:04:39 +Data loading of epoch 9: 0:00:00.761111 +Epoch: [9] Avg img/s: 4925.753353494863 +Test: [ 0/14] eta: 0:00:04 loss: 3.3516 (3.3516) acc1: 45.4167 (45.4167) acc5: 70.4167 (70.4167) time: 0.3107 data: 0.0022 +Test: Total time: 0:00:03 + * Acc@1 28.480 Acc@5 59.568 +Epoch time 0:04:44 +... +Epoch: [10] Total time: 0:04:42 +Data loading of epoch 10: 0:00:00.776602 +Epoch: [10] Avg img/s: 4845.4628560647725 +Test: [ 0/14] eta: 0:00:04 loss: 3.7891 (3.7891) acc1: 27.0833 (27.0833) acc5: 56.4583 (56.4583) time: 0.3491 data: 0.0028 +Test: Total time: 0:00:03 + * Acc@1 33.520 Acc@5 61.264 +Epoch time 0:04:47 +... +Epoch: [63] Total time: 0:04:36 +Data loading of epoch 63: 0:00:00.688607 +Epoch: [63] Avg img/s: 4928.513448918747 +Test: [ 0/14] eta: 0:00:03 loss: 2.3945 (2.3945) acc1: 63.5417 (63.5417) acc5: 85.6250 (85.6250) time: 0.2850 data: 0.0017 +Test: Total time: 0:00:03 + * Acc@1 69.104 Acc@5 89.088 +Epoch time 0:04:40 +... +Epoch: [64] Total time: 0:04:47 +Data loading of epoch 64: 0:00:00.674387 +Epoch: [64] Avg img/s: 4812.667878767461 +Test: [ 0/14] eta: 0:00:04 loss: 1.7793 (1.7793) acc1: 81.8750 (81.8750) acc5: 94.7917 (94.7917) time: 0.3257 data: 0.0019 +Test: Total time: 0:00:03 + * Acc@1 77.360 Acc@5 93.120 + ... +Epoch time 0:04:52 +The accuracy has been exceeded 75.9,and the training is terminated at epoch 64 +Training time 5:06:03 +... +``` + +取稳定训练的第6到第10个epoch共5个epoch: + +Epoch: [6] Avg img/s: 4910.795658460139 +Epoch: [7] Avg img/s: 4980.222383258538 +Epoch: [8] Avg img/s: 5032.905842259754 +Epoch: [9] Avg img/s: 4925.753353494863 +Epoch: [10] Avg img/s: 4845.4628560647725 + +最高是第8个、最低是第10个epoch,计算速度则取第6个、第7个和第9个epoch的值相加除以3,即为: + +(4910+4980+4925)/3=4938.33 img/s + +注:在该模型用例中,通过以上方法获取的速度,主要评估的是训练集上training的速度,而端到端(end-to-end)训练速度则包含了训练集和验证集在整个training和evaluation的全部过程中的总体速度。 + +训练端到端的速度计算方式如下: + +(每个epoch的处理的样本数量*完整训练的epoch数量)/ 总的训练时长 + +通过“read 1281167 files from 1000 directories”的提示得到每个epoch的处理的样本数量为1281167个。 + +通过“Training time 5:06:03”的提示得到总的训练时长为5:06:03小时,换算成18363秒。 + +本次`amp_8card.sh`完整训练的端到端速度为: + +(1281167*64)/18363=4465.2 img/s + + +### 准确性 + +执行DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的训练准确度,例如: + +``` +$ bash amp_8card.sh --data-path /home/datasets/imagenet +... +Epoch: [0] Total time: 0:04:38 +Data loading of epoch 0: 0:00:00.759193 +Epoch: [0] Avg img/s: 5060.21643823427 +Test: [ 0/14] eta: 0:00:03 loss: 6.9883 (6.9883) acc1: 0.0000 (0.0000) acc5: 0.0000 (0.0000) time: 0.2724 data: 0.0000 +Test: Total time: 0:00:04 + * Acc@1 0.112 Acc@5 1.040 +... +Epoch: [64] Avg img/s: 4812.667878767461 +Test: [ 0/14] eta: 0:00:04 loss: 1.7793 (1.7793) acc1: 81.8750 (81.8750) acc5: 94.7917 (94.7917) time: 0.3257 data: 0.0019 +Test: Total time: 0:00:03 + * Acc@1 77.360 Acc@5 93.120 +... +The accuracy has been exceeded 75.9,and the training is terminated at epoch 64 +... +``` + +ResNet50模型收敛的标准是top1 75.9%,在第64个epoch时达到了Acc@1 77.360,超过了75.9的阈值(均为百分比)。所以训练的精度值为77.36%。 + + +### 线性度 + +执行DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的速度,训练可以使用单卡和多卡进行,或使用单节点和多节点进行,分别可以计算出卡线性度和节点线性度。 + +以计算卡线性度为例: + +例如,在一台服务器上使用8张天垓100加速卡训练的速度是2575 img/s: + +``` +$ bash fp32_8card.sh --data-path /home/datasets/imagenet +... +Epoch: [0] Total time: 0:08:37 +Data loading of epoch 0: 0:00:00.745164 +Epoch: [0] Avg img/s: 2575.527288024902 +Test: [ 0/21] eta: 0:00:06 loss: 6.1528 (6.1528) acc1: 4.3333 (4.3333) acc5: 24.0000 (24.0000) time: 0.3201 data: 0.0000 +Test: Total time: 0:00:07 + * Acc@1 0.704 Acc@5 3.968 +Epoch time 0:08:45 +... +``` + +将2575 img/s除以多卡的卡数(即8),得到: + +2575/8=321.9 img/s + +再对比使用1张天垓100加速卡训练时的速度,如下所示,速度为335 img/s。 + +``` +$ bash fp32_1card.sh --data-path /home/datasets/imagenet +... +Epoch: [0] Avg img/s: 335.40682470945455 +Test: [ 0/179] eta: 0:00:53 loss: 3.6599 (3.6599) acc1: 36.4286 (36.4286) acc5: 70.3571 (70.3571) time: 0.2962 data: 0.0000 +Test: [100/179] eta: 0:00:23 loss: 5.3622 (5.0095) acc1: 6.4286 (12.0226) acc5: 22.1429 (31.2907) time: 0.2973 data: 0.0011 +Test: Total time: 0:00:53 + * Acc@1 11.786 Acc@5 30.074 +Epoch time 1:04:59 +... +``` + +得到卡线性度 321.9/335=96% + +### 功耗 + +在模型稳定训练时,使用GPU实时状态检测工具ixSMI查询实际消耗的GPU功耗并取平均值。 + +以运行`fp32_8card.sh`脚本使用8张天垓100加速卡训练为例,输入以下命令查询index为0的GPU的状态: + +``` +$ ixsmi -q -i 0 -l | grep -E 'Power Draw' + Power Draw : 161 W + Power Draw : 169 W + Power Draw : 161 W + Power Draw : 174 W + Power Draw : 163 W +... +``` + +取多次的数据取平均值作为模型训练的功耗,例如: + +平均功耗 (161+169+161+174+163)/5=165.6 W + +### 显存占用 + +在模型稳定训练时,使用GPU实时状态检测工具ixSMI查询GPU显存占用量并取平均值。 + +以运行`amp_8card.sh`脚本使用8张天垓100加速卡训练为例,输入以下命令查询index为0的GPU的状态: + +``` +$ ixsmi -q -i 0 -l | grep Used.[^G] + Used : 30671 MiB + Used : 30670 MiB + Used : 30671 MiB + Used : 30671 MiB + Used : 30670 MiB +``` + +去平均值得到平均显存占用量为 (30671+30670+30671+30671+30670)/5=30670.6 MiB + +### 稳定度 + +执行DeepSpark模型训练脚本,脚本会打印完整训练最终所达到的收敛值,例如: + +``` +$ bash amp_8card.sh --data-path /home/datasets/imagenet +... +Epoch: [0] Total time: 0:04:38 +Data loading of epoch 0: 0:00:00.759193 +Epoch: [0] Avg img/s: 5060.21643823427 +Test: [ 0/14] eta: 0:00:03 loss: 6.9883 (6.9883) acc1: 0.0000 (0.0000) acc5: 0.0000 (0.0000) time: 0.2724 data: 0.0000 +Test: Total time: 0:00:04 + * Acc@1 0.112 Acc@5 1.040 +... +Epoch: [64] Avg img/s: 4812.667878767461 +Test: [ 0/14] eta: 0:00:04 loss: 1.7793 (1.7793) acc1: 81.8750 (81.8750) acc5: 94.7917 (94.7917) time: 0.3257 data: 0.0019 +Test: Total time: 0:00:03 + * Acc@1 77.360 Acc@5 93.120 +... +The accuracy has been exceeded 75.9,and the training is terminated at epoch 64 +... +``` + +可以得到本次的收敛精度为Acc@1 77.360,记为第1次。 + +再进行4次模型完整训练,每次都最终达到标准收敛值,即达到`The accuracy has been exceeded 75.9`,,Acc@1分别得到如下结果: + +第2次:76.816 +第3次:77.116 +第4次:76.960 +第5次:77.010 + +取5次的收敛值的中值做为基准值,即以第5次的收敛精度77.010作为基准,然后其它的4次收敛值对比基准值的差值百分比计算如下: + +第1次:(77.360-77.010)/77.010=0.0045 +第2次:(76.816-77.010)/77.010=-0.0025 +第3次:(77.116-77.010)/77.010=0.0013 +第4次:(76.960-77.010)/77.010=-0.0006 + +可以得到差值百分比都分布在(-0.01,+0.01)的合理区间,此时达到满分1。(当5个数据有1次不在该范围内,稳定度则递减20%。) -- Gitee From 4de92c83cbb446b038c1a77e85c5f6f9891844be Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Fri, 9 Dec 2022 13:53:48 +0800 Subject: [PATCH 11/17] =?UTF-8?q?Add=20https://order.iluvatar.com/?= =?UTF-8?q?=E8=A1=A8=E5=8D=95?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" | 3 +++ 1 file changed, 3 insertions(+) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index 26e0230..e68f88a 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -3,6 +3,9 @@ ## 前置条件 1. 获取天数智芯天垓100(BI-V100)算力 + + DeepSpark社区客户想要使用天垓100加速卡,可以通过填写https://order.iluvatar.com/表单进行申请。 + 2. 安装天数智芯软件栈 ## 使用工具 -- Gitee From b443b592ad6be05a2c7360d111dec09f18303d3e Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Fri, 9 Dec 2022 13:56:09 +0800 Subject: [PATCH 12/17] =?UTF-8?q?Update=20=E5=85=AD=E7=BB=B4=E5=BA=A6?= =?UTF-8?q?=E8=AF=84=E6=B5=8B=E6=96=B9=E6=B3=95.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...\246\350\257\204\346\265\213\346\226\271\346\263\225.md" | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" index e68f88a..09a6c1e 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" @@ -2,11 +2,11 @@ ## 前置条件 -1. 获取天数智芯天垓100(BI-V100)算力 +1. 获取天数智芯天垓100(BI-V100)算力。 - DeepSpark社区客户想要使用天垓100加速卡,可以通过填写https://order.iluvatar.com/表单进行申请。 + DeepSpark社区客户想要使用天垓100加速卡,可以通过填写[表单](https://order.iluvatar.com/)进行申请。 -2. 安装天数智芯软件栈 +2. 安装天数智芯软件栈。 ## 使用工具 -- Gitee From 32c846d1ad48d7d74ff8de4b5785277d4d581d6d Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Fri, 9 Dec 2022 14:01:50 +0800 Subject: [PATCH 13/17] =?UTF-8?q?=E8=B0=83=E6=95=B4=E6=A0=BC=E5=BC=8F?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...1\346\263\225_\347\244\272\344\276\213.md" | 40 +++++++++---------- 1 file changed, 18 insertions(+), 22 deletions(-) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" index eee05ea..0e5cfe5 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" +++ "b/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" @@ -96,11 +96,11 @@ Training time 5:06:03 取稳定训练的第6到第10个epoch共5个epoch: -Epoch: [6] Avg img/s: 4910.795658460139 -Epoch: [7] Avg img/s: 4980.222383258538 -Epoch: [8] Avg img/s: 5032.905842259754 -Epoch: [9] Avg img/s: 4925.753353494863 -Epoch: [10] Avg img/s: 4845.4628560647725 +- Epoch: [6] Avg img/s: 4910.795658460139 +- Epoch: [7] Avg img/s: 4980.222383258538 +- Epoch: [8] Avg img/s: 5032.905842259754 +- Epoch: [9] Avg img/s: 4925.753353494863 +- Epoch: [10] Avg img/s: 4845.4628560647725 最高是第8个、最低是第10个epoch,计算速度则取第6个、第7个和第9个epoch的值相加除以3,即为: @@ -108,17 +108,13 @@ Epoch: [10] Avg img/s: 4845.4628560647725 注:在该模型用例中,通过以上方法获取的速度,主要评估的是训练集上training的速度,而端到端(end-to-end)训练速度则包含了训练集和验证集在整个training和evaluation的全部过程中的总体速度。 -训练端到端的速度计算方式如下: - -(每个epoch的处理的样本数量*完整训练的epoch数量)/ 总的训练时长 - -通过“read 1281167 files from 1000 directories”的提示得到每个epoch的处理的样本数量为1281167个。 +训练端到端的速度计算方式为:(每个epoch的处理的样本数量*完整训练的epoch数量)/总的训练时长 -通过“Training time 5:06:03”的提示得到总的训练时长为5:06:03小时,换算成18363秒。 +1. 通过“read 1281167 files from 1000 directories”的提示得到每个epoch的处理的样本数量为1281167个。 -本次`amp_8card.sh`完整训练的端到端速度为: +2. 通过“Training time 5:06:03”的提示得到总的训练时长为5:06:03小时,换算成18363秒。 -(1281167*64)/18363=4465.2 img/s +3. 本次`amp_8card.sh`完整训练的端到端速度为:(1281167*64)/18363=4465.2 img/s ### 准确性 @@ -144,7 +140,7 @@ The accuracy has been exceeded 75.9,and the training is terminated at epoch 64 ... ``` -ResNet50模型收敛的标准是top1 75.9%,在第64个epoch时达到了Acc@1 77.360,超过了75.9的阈值(均为百分比)。所以训练的精度值为77.36%。 +ResNet50模型收敛的标准是top1 75.9%,在第64个epoch时达到了Acc@1 77.360(百分比),超过了75.9(百分比)的阈值。所以训练的精度值为77.36%。 ### 线性度 @@ -252,16 +248,16 @@ The accuracy has been exceeded 75.9,and the training is terminated at epoch 64 再进行4次模型完整训练,每次都最终达到标准收敛值,即达到`The accuracy has been exceeded 75.9`,,Acc@1分别得到如下结果: -第2次:76.816 -第3次:77.116 -第4次:76.960 -第5次:77.010 +- 第2次:76.816 +- 第3次:77.116 +- 第4次:76.960 +- 第5次:77.010 取5次的收敛值的中值做为基准值,即以第5次的收敛精度77.010作为基准,然后其它的4次收敛值对比基准值的差值百分比计算如下: -第1次:(77.360-77.010)/77.010=0.0045 -第2次:(76.816-77.010)/77.010=-0.0025 -第3次:(77.116-77.010)/77.010=0.0013 -第4次:(76.960-77.010)/77.010=-0.0006 +- 第1次:(77.360-77.010)/77.010=0.0045 +- 第2次:(76.816-77.010)/77.010=-0.0025 +- 第3次:(77.116-77.010)/77.010=0.0013 +- 第4次:(76.960-77.010)/77.010=-0.0006 可以得到差值百分比都分布在(-0.01,+0.01)的合理区间,此时达到满分1。(当5个数据有1次不在该范围内,稳定度则递减20%。) -- Gitee From f8572a43070bb77c55697185706f5ba0bbc311f2 Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Fri, 9 Dec 2022 15:15:40 +0800 Subject: [PATCH 14/17] fix filename --- README.md | 2 +- .../Iluvatar/six_dimension_howto.md | 2 +- .../Iluvatar/six_dimension_howto_example.md | 2 +- 3 files changed, 3 insertions(+), 3 deletions(-) rename "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" => evaluation/Iluvatar/six_dimension_howto.md (98%) rename "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" => evaluation/Iluvatar/six_dimension_howto_example.md (99%) diff --git a/README.md b/README.md index 08f4d3e..39ff12a 100644 --- a/README.md +++ b/README.md @@ -69,7 +69,7 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发 ### 天垓100通用GPU -评测方法详见 [天垓100六维度评测方法](evaluation/Iluvatar/六维度评测方法.md)。 +评测方法详见 [天垓100六维度评测方法](evaluation/Iluvatar/six_dimension_howto.md)。 评测结果如下: diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" b/evaluation/Iluvatar/six_dimension_howto.md similarity index 98% rename from "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" rename to evaluation/Iluvatar/six_dimension_howto.md index 09a6c1e..a75da18 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225.md" +++ b/evaluation/Iluvatar/six_dimension_howto.md @@ -107,4 +107,4 @@ $ ixsmi -q -i 0 -l | grep Used.[^G] ## 六维度数据计算示例 -[天垓100六维度评测方法示例:ResNet50](六维度评测方法_示例.md) +[天垓100六维度评测方法示例:ResNet50](six_dimension_howto_example.md) diff --git "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" b/evaluation/Iluvatar/six_dimension_howto_example.md similarity index 99% rename from "evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" rename to evaluation/Iluvatar/six_dimension_howto_example.md index 0e5cfe5..7296d8a 100644 --- "a/evaluation/Iluvatar/\345\205\255\347\273\264\345\272\246\350\257\204\346\265\213\346\226\271\346\263\225_\347\244\272\344\276\213.md" +++ b/evaluation/Iluvatar/six_dimension_howto_example.md @@ -1,6 +1,6 @@ # 天垓100六维度评测方法示例:ResNet50 -使用天数智芯天垓100(BI-V100)通用GPU硬件并安装天数智芯软件栈和深度学习框架后,您可运行DeepSpark模型训练脚本,并借助于天数智芯GPU实时状态检测工具ixSMI得到天垓100硬件的六维度数据。DeepSpark六维度指标的定义请参照[评测体系](../../README.md#评测体系)。天垓100六维度具体计算方法请参照[天垓100(BI-V100)六维度评测方法](六维度评测方法.md)。 +使用天数智芯天垓100(BI-V100)通用GPU硬件并安装天数智芯软件栈和深度学习框架后,您可运行DeepSpark模型训练脚本,并借助于天数智芯GPU实时状态检测工具ixSMI得到天垓100硬件的六维度数据。DeepSpark六维度指标的定义请参照[评测体系](../../README.md#评测体系)。天垓100六维度具体计算方法请参照[天垓100(BI-V100)六维度评测方法](six_dimension_howto.md)。 本示例以[ResNet50模型](https://gitee.com/deep-spark/deepsparkhub/tree/master/cv/classification/resnet50/pytorch)为例,用8张天垓100(BI-V100)卡执行`amp_8card.sh`脚本进行混合精度训练。在本示例环境中,数据集所在路径为`/home/datasets/imagenet`。 -- Gitee From f64df71fb79f7bc6e4e0de63f41f8dc9df6e3b51 Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Fri, 9 Dec 2022 16:53:21 +0800 Subject: [PATCH 15/17] fix title layer --- evaluation/Iluvatar/six_dimension_howto_example.md | 10 +++++----- 1 file changed, 5 insertions(+), 5 deletions(-) diff --git a/evaluation/Iluvatar/six_dimension_howto_example.md b/evaluation/Iluvatar/six_dimension_howto_example.md index 7296d8a..d1d3d2b 100644 --- a/evaluation/Iluvatar/six_dimension_howto_example.md +++ b/evaluation/Iluvatar/six_dimension_howto_example.md @@ -117,7 +117,7 @@ Training time 5:06:03 3. 本次`amp_8card.sh`完整训练的端到端速度为:(1281167*64)/18363=4465.2 img/s -### 准确性 +## 准确性 执行DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的训练准确度,例如: @@ -143,7 +143,7 @@ The accuracy has been exceeded 75.9,and the training is terminated at epoch 64 ResNet50模型收敛的标准是top1 75.9%,在第64个epoch时达到了Acc@1 77.360(百分比),超过了75.9(百分比)的阈值。所以训练的精度值为77.36%。 -### 线性度 +## 线性度 执行DeepSpark模型训练脚本,脚本会打印训练过程中每个epoch的速度,训练可以使用单卡和多卡进行,或使用单节点和多节点进行,分别可以计算出卡线性度和节点线性度。 @@ -184,7 +184,7 @@ Epoch time 1:04:59 得到卡线性度 321.9/335=96% -### 功耗 +## 功耗 在模型稳定训练时,使用GPU实时状态检测工具ixSMI查询实际消耗的GPU功耗并取平均值。 @@ -204,7 +204,7 @@ $ ixsmi -q -i 0 -l | grep -E 'Power Draw' 平均功耗 (161+169+161+174+163)/5=165.6 W -### 显存占用 +## 显存占用 在模型稳定训练时,使用GPU实时状态检测工具ixSMI查询GPU显存占用量并取平均值。 @@ -221,7 +221,7 @@ $ ixsmi -q -i 0 -l | grep Used.[^G] 去平均值得到平均显存占用量为 (30671+30670+30671+30671+30670)/5=30670.6 MiB -### 稳定度 +## 稳定度 执行DeepSpark模型训练脚本,脚本会打印完整训练最终所达到的收敛值,例如: -- Gitee From 261923613eb05d9d92042bd49fcd9bc95e772baa Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Mon, 12 Dec 2022 14:13:23 +0800 Subject: [PATCH 16/17] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E6=8F=8F=E8=BF=B0?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/README.md b/README.md index 39ff12a..a42bdee 100644 --- a/README.md +++ b/README.md @@ -1,6 +1,6 @@ # DeepSpark百大应用开放平台 -DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发及评测平台,基于天数智芯及其行业伙伴的应用落地经验,分享与落地应用深度耦合的百大应用算法和模型,覆盖各应用领域,并针对行业需求构建多维度测评体系,广泛支持各类落地场景。 +DeepSpark百大应用开放平台作为国内领先AI和通用计算应用开发及评测平台,基于天数智芯及其行业伙伴的应用落地经验,分享与落地应用深度耦合的百大应用算法和模型,覆盖各应用领域,并针对行业需求构建多维度测评体系,广泛支持各类落地场景。 ## 组成部分 @@ -99,7 +99,7 @@ DeepSpark百大应用开放平台作为国内首个AI和通用计算应用开发 ### 项目背景 -万物皆算的时代,各领域应用层出不穷,算力必须支撑实际应用,通用性和未来可扩展性是评估算力的重要指标。天数智芯作为中国首家自研通用GPU算力提供商,截止2022年8月,已成功支持200+ AI模型训练,和300+家客户和伙伴建立合作,共同促进国内通用算力的发展,产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。 +万物皆算的时代,各领域应用层出不穷,算力必须支撑实际应用,通用性和未来可扩展性是评估算力的重要指标。天数智芯作为中国头部自研通用GPU算力提供商,截止2022年8月,已成功支持200+ AI模型训练,和300+家客户和伙伴建立合作,共同促进国内通用算力的发展,产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。 天数智芯本着“平台共建、生态共享、产业共赢”的原则,通过与行业伙伴一起打造[DeepSpark开源社区](https://www.deepspark.org.cn/),汇聚社区力量,从而让产业生态收获算力赋能,助力客户更快更好应用落地,为产业生态提供更多可能性。欢迎广大社区用户和开发者积极参与和贡献DeepSpark百大应用开放平台。 -- Gitee From 393d4c0b3d23a295fe87e64935fb151d757813db Mon Sep 17 00:00:00 2001 From: Shikun Li Date: Mon, 12 Dec 2022 14:20:34 +0800 Subject: [PATCH 17/17] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E6=8F=8F=E8=BF=B0?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/README.md b/README.md index a42bdee..ff3f97c 100644 --- a/README.md +++ b/README.md @@ -1,6 +1,6 @@ # DeepSpark百大应用开放平台 -DeepSpark百大应用开放平台作为国内领先AI和通用计算应用开发及评测平台,基于天数智芯及其行业伙伴的应用落地经验,分享与落地应用深度耦合的百大应用算法和模型,覆盖各应用领域,并针对行业需求构建多维度测评体系,广泛支持各类落地场景。 +DeepSpark百大应用开放平台作为国内领先的AI和通用计算应用开发及评测平台,基于天数智芯及其行业伙伴的应用落地经验,分享与落地应用深度耦合的百大应用算法和模型,覆盖各应用领域,并针对行业需求构建多维度测评体系,广泛支持各类落地场景。 ## 组成部分 @@ -99,7 +99,7 @@ DeepSpark百大应用开放平台作为国内领先AI和通用计算应用开发 ### 项目背景 -万物皆算的时代,各领域应用层出不穷,算力必须支撑实际应用,通用性和未来可扩展性是评估算力的重要指标。天数智芯作为中国头部自研通用GPU算力提供商,截止2022年8月,已成功支持200+ AI模型训练,和300+家客户和伙伴建立合作,共同促进国内通用算力的发展,产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。 +万物皆算的时代,各领域应用层出不穷,算力必须支撑实际应用,通用性和未来可扩展性是评估算力的重要指标。天数智芯作为国内头部自研通用GPU算力提供商,截止2022年8月,已成功支持200+ AI模型训练,和300+家客户和伙伴建立合作,共同促进国内通用算力的发展,产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。 天数智芯本着“平台共建、生态共享、产业共赢”的原则,通过与行业伙伴一起打造[DeepSpark开源社区](https://www.deepspark.org.cn/),汇聚社区力量,从而让产业生态收获算力赋能,助力客户更快更好应用落地,为产业生态提供更多可能性。欢迎广大社区用户和开发者积极参与和贡献DeepSpark百大应用开放平台。 -- Gitee