diff --git a/RELEASE.md b/RELEASE.md index 575f60d4334790433c5fbea89edab72efeee9545..1eb4db58afa83498c10595e85a93d41ff252aef1 100644 --- a/RELEASE.md +++ b/RELEASE.md @@ -1,5 +1,109 @@ # DeepSparkInference Release Notes +## 25.03 Release Notes + +### 模型与算法 +● 新增了30个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的15个。 +● 新增了DeepSeek R1 Distill模型的推理示例。 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
IGIE
ConvNeXt_SEfficientNet_b4MNASNet0_75
ResNeXt101_32x8dSqueezeNet1_0VGG11
SABLYOLOv11CSPResNet50
Mixer_BRegnet_x_16gfShuffleNetv2_x2_0
SVT_baseWide_ResNet101HRNetPose
IxRT
LLaVA-Next-Video-7BChameleon-7BFuyu-8B
CSPDarkNet53DensNet161DensNet169
InternVL2-4BLLaVAConvNeXt-Base
DeiT-tinyDenseNet201EfficientNet-B3
EfficientNetv2_rw_tEfficientNetv2_sFoveaBox
FSAFHRNetRetinaFace
大模型推理
deepseek-r1-distill-llama-8bdeepseek-r1-distill-llama-70bdeepseek-r1-distill-qwen-1.5b
deepseek-r1-distill-qwen-7bdeepseek-r1-distill-qwen-14bdeepseek-r1-distill-qwen-32b
+ +### 问题修复 +● 更新了SVTR、clip、resnetv1d50等模型的分类及名称。 +● 更新了相关模型README说明,增加了模型所支持的IXUCA SDK版本。 +● 调整了llm、multimodal等模型路径,与训练模型一致 +● 同步了vllm、igie、ixrt模型代码 +● 新增了IXRT、NLP推理模型自动化测试的运行脚本。 +● 优化了IGIE推理模型自动化测试的运行脚本。 +● 修复了onnxruntime 1.17.1导致的quantize fail问题。 +● 修复了bert-large-squad在int8下的问题。 +● 修复了YOLOv6 IGIE模型运行推理脚本报错的问题。 +● 修复了mmpretraino 0.24.0与mmcv 2.1.0不兼容问题。 +● 修复了chatglm3-6b-32k模型中中文乱码问题。 +● 修复了vllm模型中SamplingParams初始化问题。 + +### 版本关联 +DeepSparkInference 25.03对应天数软件栈4.2.0版本。 + +### 感谢以下社区贡献者 + +YoungPeng,majorli6,xinchi.tian,xiaomei.wang,honglyua,qiang.zhang。 + ## 24.12 Release Notes ### 模型与算法