From f2853d9f63f5f977a4d05704b45cda4142ecf2f0 Mon Sep 17 00:00:00 2001 From: zhengzuohe Date: Thu, 12 Sep 2024 11:20:51 +0800 Subject: [PATCH] ms_infer custom_operator --- .../source_zh_cn/model_infer/ms_infer/custom_operator.md | 6 ++++++ 1 file changed, 6 insertions(+) diff --git a/docs/mindspore/source_zh_cn/model_infer/ms_infer/custom_operator.md b/docs/mindspore/source_zh_cn/model_infer/ms_infer/custom_operator.md index f846a02da1..f51e4089fb 100644 --- a/docs/mindspore/source_zh_cn/model_infer/ms_infer/custom_operator.md +++ b/docs/mindspore/source_zh_cn/model_infer/ms_infer/custom_operator.md @@ -1,3 +1,9 @@ # 自定义算子 [![查看源文件](https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/website-images/master/resource/_static/logo_source.svg)](https://gitee.com/mindspore/docs/blob/master/docs/mindspore/source_zh_cn/model_infer/ms_infer/custom_operator.md) + +大语言模型推理通常会采用多种优化技术,包括但不限于量化和KV缓存,旨在提高模型的运行效率,同时减少所需的计算资源。除了这些通用优化技术,用户还可以根据具体的应用场景和需求,对模型结构进行定制化的改造。这种改造可能涉及到模型层的增减、连接方式的调整,甚至是算子级别的优化,以实现更高效的数据处理和更快速的推理响应。这样的定制化改造使得模型能够更好地适应特定的任务和运行环境,但相应地也会提高模型的复杂性。 + +因此我们提供相应接口使用户可以开发自定义算子,并将其接入到MindSpore框架中。自定义算子可以实现针对性的性能优化,比如通过算子融合技术,将多个操作合并为一个更高效的操作,减少I/O及下发耗时,并提升算子执行性能,实现对大语言模型推理性能的深度优化。 + +用户可以参考[自定义算子教程](https://www.mindspore.cn/tutorials/experts/zh-CN/r2.3.1/operation/op_custom_ascendc.html),了解如何开发自定义算子,以及如何将它们有效地集成到MindSpore框架中。 -- Gitee