当前仓库属于暂停状态,部分功能使用受限,详情请查阅 仓库状态说明
65 Star 126 Fork 123

Ascend/mind-cluster
暂停

[npu-exporter]fix:异常情况下hbm信息为空导致的panic 可合并
ci-pipeline-passed
ascend-cla/yes
SC-SUCC
!1311 dongpeng30 8
审查: +25
测试:
2025-08-22 18:03
【修改说明】提交clusterd公共代码支持通过grpc与manager交互代码 可合并
ci-pipeline-passed
ascend-cla/yes
SC-FAIL
stat/needs-squash
!1310 李鸣沼 28
审查: +25
测试:
2025-08-22 17:38
!1309 Atlas_zxp 8
审查: +25
测试:
2025-08-22 16:18
【taskd】pytorch单进程恢复代码迁移 可合并
ci-pipeline-failed
ascend-cla/yes
SC-FAIL
!1306 lijinghan 15
审查: +25
测试:
2025-08-22 09:37
【clusterD】【修改说明】订阅接口支持推送所有任务故障 可合并
ci-pipeline-passed
ascend-cla/yes
SC-FAIL
stat/needs-squash
!1304 zhoupan39 28
审查: +25
测试:
2025-08-21 13:14
【DevicePlugin】【修改说明】A3推理设备适配hotreset=0场景 可合并
ci-pipeline-passed
ascend-cla/yes
SC-SUCC
stat/needs-squash
!1299 zhoupan39 37
审查: +24
测试:
2025-08-19 15:25
UT覆盖率改为严格模式 可合并
ci-pipeline-passed
ascend-cla/yes
SC-SUCC
stat/needs-squash
!1290 wuweilin 53
审查: +24
测试:
2025-08-18 09:40
【clusterd】【修改说明】支持L2级别故障上报和后处理 可合并
ci-pipeline-failed
ascend-cla/yes
SC-SUCC
stat/needs-squash
!1287 wangjun 11
审查: +24
测试:
2025-08-17 10:44
[WIP]test 可合并
ci-pipeline-failed
ascend-cla/yes
stat/needs-squash
!1286 lijinghan 5
审查: +24
测试:
2025-08-16 11:02
【taskd】agent测试适配 可合并
ci-pipeline-failed
ascend-cla/yes
SC-FAIL
stat/needs-squash
!1282 lijinghan 28
审查: +24
测试:
2025-08-15 10:43
Go
1
https://gitee.com/ascend/mind-cluster.git
git@gitee.com:ascend/mind-cluster.git
ascend
mind-cluster
mind-cluster

搜索帮助