diff --git a/docs/compute/clusters_gpu/ef_gpu.md b/docs/compute/clusters_gpu/ef_gpu.md index 9f6fa5185c6fda3bea204459ddead8afcc3306a6..a1ac66559afe06a0c3ec0b9fab2b7ba1b2be7980 100644 --- a/docs/compute/clusters_gpu/ef_gpu.md +++ b/docs/compute/clusters_gpu/ef_gpu.md @@ -237,9 +237,19 @@ xinference 1.7.0.post1+gcu... --- -## 7. 官方资源导航 +## 7. 平台与官方资源导航 -获取最新的驱动、SDK 下载及详细技术白皮书,请访问: +### 模力方舟实战教程 +基于 **燧原 S60** 算力环境,平台提供了深度适配的“开箱即用”部署指南: -* **燧原技术文档中心**: [https://support.enflame-tech.com/](https://support.enflame-tech.com/) -* **燧原软件栈白皮书**: [点击跳转](https://support.enflame-tech.com/onlinedoc_dev_3.5/1-introduce/sw_intro/content/source/) \ No newline at end of file +* **模型部署实战** + * [**部署文本模型**](/docs/compute/practices/text_model#enflame-deploy): 涵盖使用 Transformers、vLLM 等框架部署 Qwen 等主流大语言模型。 + * [**部署生图模型**](/docs/compute/practices/img_model#enflame-deploy): 基于 Diffusers 框架部署 FLUX.1、Longcat 等前沿视觉生成模型。 + +### 燧原官方技术资料 +如需获取最底层的驱动更新、SDK 开发手册及硬件参数细节,请参考厂商官方文档: + +* **文档支持**: [燧原文档中心](https://support.enflame-tech.com/documents/) + * *提供开发者所需的驱动下载、故障排查、全栈开发及硬件指南。* +* **技术白皮书**: [燧原软件栈白皮书](https://support.enflame-tech.com/onlinedoc_dev_3.5/1-introduce/sw_intro/content/source/) + * *深入了解 TopsRider 软件栈架构与编程模型。* \ No newline at end of file diff --git a/docs/compute/clusters_gpu/mx_gpu.md b/docs/compute/clusters_gpu/mx_gpu.md index 3865b815c1ee96fd0dd38ba104bf8237a8608220..7a2d0097d936eab82b11c0c05a747f0fc0f27d0d 100644 --- a/docs/compute/clusters_gpu/mx_gpu.md +++ b/docs/compute/clusters_gpu/mx_gpu.md @@ -196,8 +196,19 @@ vllm 0.8.5+maca... # 大模型推理框架 --- -## 7. 官方资源导航 - -获取最新的驱动、开发库白名单、SDK 下载及详细技术文档,请访问: - -* **沐曦软件中心与官方教程**: [https://sw-download.metax-tech.com/index](https://sw-download.metax-tech.com/index) \ No newline at end of file +## 7. 平台与官方资源导航 + +### 模力方舟实战教程 +基于 **曦云 C500** 算力环境,平台提供了深度适配的“开箱即用”部署指南: + +* **模型部署实战** + * [**部署文本模型**](/docs/compute/practices/text_model#metax-deploy):涵盖使用 Transformers、vLLM 等框架部署 Qwen等主流大语言模型。 + * [**部署生图模型**](/docs/compute/practices/img_model#metax-deploy):基于 Diffusers 框架部署 Qwen-Image 等前沿视觉生成模型。 +* **进阶工作流** + * [**ComfyUI 实操指南**](/docs/compute/practices/comfyui): 学习节点式工作流搭建,以及如何使用 Moark 自定义节点调用云端算力。 + * [**n8n 自动化编排**](/docs/compute/practices/n8n): 基于 n8n 编排的全链路 AIGC 工作流,实现了从“一个创意”到“一篇完整图文笔记”的端到端自动化。 +### 沐曦官方技术资料 +如需获取最新的 MACA 驱动、开发库白名单、SDK 下载及详细技术文档,请参考厂商官方文档: + +* **开发者与文档支持**: [沐曦文档中心](https://developer.metax-tech.com/doc) + * *提供 MACA 驱动下载、安装指南、故障排查手册及全栈开发文档。* diff --git a/docs/compute/intro.md b/docs/compute/intro.md index 6db5999df0e23c709a94c14bb55ed382aba4a3aa..5b6923f3e8553f06620dd8fe8790375de2949846 100644 --- a/docs/compute/intro.md +++ b/docs/compute/intro.md @@ -6,18 +6,18 @@ sidebar_position: 0 ## 平台概述 -本平台专注于提供集成**多样化国产 GPU** 及 NVIDIA 主流算力的的高性能算力服务,致力于构建稳定、高效、多元的计算生态。通过深度整合品类丰富的 GPU 硬件与全栈适配的软件环境,平台为开发者、科研机构及企业用户提供灵活适配的异构算力解决方案,满足科学研究、大模型训练及应用开发等复杂场景的计算需求。 +本平台专注于提供集成**多样化国产 GPU** 及 NVIDIA 主流算力的的高性能算力服务,致力于构建稳定、高效、多元的计算生态。通过深度整合品类丰富的 GPU 硬件与全栈适配的软件环境,平台为开发者、科研机构及企业用户提供灵活适配的算力解决方案,满足科学研究、大模型训练及应用开发等复杂场景的计算需求。 ## 核心功能与服务 -### 1. 多元化异构算力资源 -平台构建了广泛的异构 GPU 资源池,实现对国产头部厂商硬件及 NVIDIA 主流算力的全面覆盖,支持按需匹配最优硬件方案。 +### 1. 多元化算力资源 +平台构建了广泛的 GPU 资源池,实现对国产头部厂商硬件及 NVIDIA 主流算力的全面覆盖,支持按需匹配最优硬件方案。 * **国产 GPU 解决方案**:深度集成 **沐曦 (MetaX)**、**燧原 (Enflame)** 等国内主流厂商的多型号产品,提供自主可控的算力选择。 * **主流通用算力**:提供 NVIDIA 系列标准 GPU 资源,保障存量业务的平滑迁移与兼容。 ### 2. 深度优化的软件生态 -针对异构硬件(特别是国产 GPU)进行底层驱动适配与上层应用优化,实现软硬件协同加速。 +针对硬件(特别是国产 GPU)进行底层驱动适配与上层应用优化,实现软硬件协同加速。 * **开箱即用的算法镜像**: * **训练场景**:预置并优化 **PyTorch**、**PaddlePaddle** 等主流深度学习框架,大幅缩短环境部署时间。 @@ -31,7 +31,7 @@ sidebar_position: 0 * **统一控制台**:通过 Web 界面实现实例创建、镜像管理、资源监控及版本控制的全生命周期管理。 * **灵活计费**:支持按需付费与长期租赁模式,适配由于实验验证到规模化部署的不同周期需求。 -* **专业技术支持**:提供详尽的技术文档库及专家级技术支持,快速响应异构硬件使用中的技术难题。 +* **专业技术支持**:提供详尽的技术文档库及专家级技术支持,快速响应硬件使用中的技术难题。 ## 适用场景 diff --git a/docs/compute/practices/img_model.md b/docs/compute/practices/img_model.md index 2f83d8b7d55f7faafe9b5eabad5068dbad45f511..e18d02e4f2111f3067f3ee758326055eab6e7893 100644 --- a/docs/compute/practices/img_model.md +++ b/docs/compute/practices/img_model.md @@ -6,7 +6,11 @@ toc_max_heading_level: 4 # 部署图像生成模型 (Diffusers) +<<<<<<< HEAD +本指南提供了一套基于 Hugging Face Diffusers 的通用部署方案,旨在解决国产算力的适配难题,助您在不同硬件架构上高效运行各类文生图模型。 +======= 本指南提供了一套基于 Hugging Face Diffusers 的通用部署方案,旨在解决国产自主算力的适配难题,助您在不同硬件架构上高效运行各类文生图模型。 +>>>>>>> a3cc0efff255ccbbe2aa627ac5da679fd03958a3 ## 推理框架概览 @@ -21,7 +25,7 @@ toc_max_heading_level: 4 --- -## 一、 沐曦 (MetaX) 部署指南 +## 一、 沐曦 (MetaX) 部署指南 {#metax-deploy} 本章节适用于 **曦云 C500** 等沐曦系列算力卡。 @@ -119,7 +123,7 @@ print("图片生成完成,已保存为 qwen-image.png") --- -## 二、 燧原 (Enflame) 部署指南 +## 二、 燧原 (Enflame) 部署指南 {#enflame-deploy} 本章节适用于 **S60** 等燧原系列算力卡。由于底层架构差异,需引入适配库:`import torch_gcu ` 与`from torch_gcu import transfer_to_gcu ` diff --git a/docs/compute/practices/text_model.md b/docs/compute/practices/text_model.md index 6d86cf93837a2a67b49d86f5b820dff02ad518c5..2da6e1894b2dd98c3d69419808aa3fee34f3f7bf 100644 --- a/docs/compute/practices/text_model.md +++ b/docs/compute/practices/text_model.md @@ -14,7 +14,7 @@ sidebar_position: 1 --- -## 一、沐曦 (MetaX) 部署指南 +## 一、沐曦 (MetaX) 部署指南 {#metax-deploy} 本章节适用于 **曦云 C500** 等沐曦系列算力卡。 @@ -134,7 +134,7 @@ sidebar_position: 1 --- -## 二、燧原 (Enflame) 部署指南 +## 二、燧原 (Enflame) 部署指南 {#enflame-deploy} 本章节适用于 **S60** 等燧原系列算力卡。由于架构差异,部分操作需引入适配库。