diff --git a/docs/mindspore/source_zh_cn/mindformers/appendix/env_variables.md b/docs/mindspore/source_zh_cn/mindformers/appendix/env_variables.md index 5116f6efbec6db84a83923e1412a2e8534dcb436..7232721ec1cd6e876f569ed1859775c8957a5154 100644 --- a/docs/mindspore/source_zh_cn/mindformers/appendix/env_variables.md +++ b/docs/mindspore/source_zh_cn/mindformers/appendix/env_variables.md @@ -1,3 +1,32 @@ # 环境变量说明 -[![查看源文件](https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/website-images/master/resource/_static/logo_source.svg)](https://gitee.com/mindspore/docs/blob/master/docs/mindspore/source_zh_cn/mindformers/appendix/env_variables.md) \ No newline at end of file +[![查看源文件](https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/website-images/master/resource/_static/logo_source.svg)](https://gitee.com/mindspore/docs/blob/master/docs/mindspore/source_zh_cn/mindformers/appendix/env_variables.md) + +## 以下为需要设置的环境变量的及其默认值 + +- **HCCL_DETERMINISTIC=true**:设置为true以确保华为云容器服务中的通信库(HCCL)在分布式训练中的行为是确定性的,有助于确保每次运行得到相同的结果。 + +- **ASCEND_LAUNCH_BLOCKING=1**:这个环境变量设置为1表示在使用华为Ascend AI处理器进行分布式训练时,启动进程将等待所有进程就绪后再开始执行,以避免训练过程中的不一致性。 + +- **TE_PARALLEL_COMPILER=1**:启用华为MindSpore框架的并行编译器,以提高编译效率。 + +-** CUSTOM_MATMUL_SHUFFLE=on**:开启自定义矩阵乘法的洗牌操作,这可能与优化特定硬件上的矩阵乘法性能有关。 + +- **LCCL_DETERMINISTIC=0**:设置为0表示关闭了某个通信库(可能是LCCL)的确定性行为,这可能是为了提高性能或处理某些特定的并发情况。 + +- **CPU_AFFINITY=1**:设置CPU亲和性,确保每个进程或线程绑定到一个CPU核心上,以减少上下文切换和提高性能。 + +- **MS_ENABLE_INTERNAL_BOOST=off**:关闭MindSpore框架的内部加速功能,这可能是为了避免在某些情况下的过度优化或是为了调试目的。 + +- **RUN_MODE=predict**:设置运行模式为预测模式,这通常意味着系统将执行模型的推理而不是训练。 + +- **USE_ROPE_SELF_DEFINE**=true:启用自定义的ROPE(可能是一个特定的优化或功能)。 + + + +## 以下两个环境变量可以根据用户需要自行定义 +```shell +export REMOTE_SAVE_URL +export SPECIAL_ID + +``` \ No newline at end of file