From dc23fe9828da7106e9058e1b4e1db47fa990b8f4 Mon Sep 17 00:00:00 2001 From: gitee-bot Date: Wed, 25 Jun 2025 03:39:51 +0000 Subject: [PATCH] Update README.md --- component/noded/README.md | 60 +++++++++++++++++++++++++-------------- 1 file changed, 38 insertions(+), 22 deletions(-) diff --git a/component/noded/README.md b/component/noded/README.md index c3e5e1aa3..d91e682ef 100644 --- a/component/noded/README.md +++ b/component/noded/README.md @@ -1,36 +1,52 @@ -# NodeD -# 组件介绍 - NodeD是一个检测节点状态异常的组件,负责从ipmi获取到计算节点的CPU、内存、硬盘的故障信息,上报给ClusterD。 +# MindCluster -# 编译NodeD +## 介绍 -1. 通过git拉取源码,获得noded。 +MindCluster(AI集群系统软件)是支持NPU(昇腾AI处理器)训练和推理硬件的深度学习组件,用于构建集群全流程运行环境,提供NPU集群作业调度、运维监测、故障恢复等功能。深度学习平台开发厂商可以减少底层资源调度相关软件开发工作量,快速使能合作伙伴基于MindCluster开发深度学习平台。 - 示例:源码放在/home/mind-cluster/component/noded目录下 +## 支持的产品形态 -2. 执行以下命令,进入NodeD构建目录,执行构建脚本,在“output“目录下生成二进制noded、yaml文件和Dockerfile文件等。 +- 支持以下产品使用资源监测 + - Atlas 训练系列产品 + - Atlas A2 训练系列产品 + - Atlas A3 训练系列产品 + - 推理服务器(插Atlas 300I 推理卡) + - Atlas 推理系列产品 + - Atlas 800I A2 推理服务器 - **cd** _/home/mind-cluster/component/_**noded/build/** +## 编译 - **chmod +x build.sh** +1. 通过git拉取mind-cluster整体源码,例如放在`/home`目录下。 +2. 修改组件版本配置文件`service_config.ini`中的`mind-cluster-version`字段值为所需编译版本,默认值如下: - **./build.sh** + ``` + mind-cluster-version=6.0.0 + ``` +3. 执行以下命令,进入`/home/mind-cluster/build`目录,选择构建脚本执行: + ``` + cd /home/mind-cluster/build + dos2unix *.sh && chmod +x *.sh + ./build_all.sh $GOPATH + ``` +4. 构建完成后进入`/home/mind-cluster`目录,各组件“output”目录下生成编译完成的文件。 +5. 此处使用的Go版本为1.21。 -3. 执行以下命令,查看**output**生成的软件列表。 +## 组件安装 - **ll** _/home/mind-cluster/component/_**noded/output** +有关各个组件的安装,请参考对应组件的README文档。 - ``` - -r-------- 1 root root 480 Nov 14 07:10 Dockerfile - -r-x------ 1 root root 36550304 Nov 14 07:10 noded - -r-------- 1 root root 434 Nov 14 07:10 NodeDConfiguration.json - -r-------- 1 root root 2883 Nov 14 07:10 noded-v6.0.0.yaml - -r-------- 1 root root 273 Nov 14 07:10 pingmesh-config.yaml - ``` +## 更新日志 + +有关版本更新的详细信息,请参考仓库的release版本页面: + +## 版本配套说明 + +- MindCluster 6.0.0版本配套Ascend 310P、Ascend 910A2、Ascend 910C等产品使用。 -# 说明 +## 免责说明 -1. 当前容器方式部署本组件,本组件的认证鉴权方式为ServiceAccount, 该认证鉴权方式为ServiceAccount的token明文显示,建议用户自行进行安全加强。 -2. 当前特权容器方式部署,该容器权限具有一定风险,建议用户自行进行安全加强。 \ No newline at end of file +- 本仓库代码中包含多个开发分支,这些分支可能包含未完成、实验性或未测试的功能。在正式发布前,请勿在生产环境或者依赖关键业务的项目中使用这些分支的代码。 +- 使用开发分支所导致的任何问题、损失或数据损坏,本项目及其贡献者概不负责。 +- 正式版本请参考release版本页面: \ No newline at end of file -- Gitee