登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
AI 队友
登录
注册
3 月 25 日(本周三)20:00 开始,Gitee CodePecker 安全核心引擎发布会直播,预约观看,直播间可下载「图智 GraphAgent」最新产品白皮书!
代码拉取完成,页面将自动刷新
开源项目
>
人工智能
>
AI-人工智能
&&
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
17
Star
140
Fork
41
DeepSpark
/
DeepSparkInference
代码
Issues
11
Pull Requests
0
Wiki
统计
流水线
服务
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
发行版
最新版
25.12
6b8ebab
2025-12-25 10:53
对比
DeepSparkInference 25.12 Release
majorli6
### DeepSparkInference 25.12 #### 模型与算法 * 新增了 15 个推理小模型示例,其中支持 IGIE 推理引擎的 9 个,支持 ixRT 推理引擎的 6 个。 * 新增了 8 个大语言模型推理示例,其中 7 个使用 [vLLM](https://github.com/vllm-project/vllm),1 个使用 Diffusers。 <table> <th colspan=3>ixRT</th> <tr> <td>DeepSort</td> <td>FastReID</td> <td>Transformer</td> </tr> <tr> <td>YOLOF </td> <td>YOLOv12</td> <td>YOLOv13</td> </tr> <th colspan=3>IGIE</th> <tr> <td>EfficientNet-B7</td> <td>FreeAnchor</td> <td>RegNet_X_800MF </td> </tr> <tr> <td>RegNet_X_8GF</td> <td>PISA</td> <td>YOLOv8-N </td> </tr> <tr> <td>YOLOv9</td> <td>YOLOv10</td> <td>YOLOv11</td> </tr> <th colspan=3>LLM</th> <tr> <td>NVLM-D (vLLM)</td> <td>PaliGemma (vLLM)</td> <td>Phi-3 Vision (vLLM)</td> </tr> <tr> <td>Pixtral (vLLM)</td> <td>Qwen3Moe (vLLM)</td> <td>Stable Diffusion 3 (Diffusers)</td> </tr> <tr> <td>Step3-VL (vLLM)</td> <td>XLM-RoBERTa (vLLM)</td> <td></td> </table> #### 修复更新 * 新增了对模型推理的 batchsize 参数配置的支持,并在 CI 中添加相应测试 (#ID8SDF, #IDBGCP) * 新增了 vLLM 推理模型的 benchmark 脚本支持 (#ID8TTL) * 优化了 21 个推理小模型的 README 指导文档说明 (#IDBBZV) * 更新了 Conformer IGIE 和 BERT Large SQuAD ixRT 模型失效的链接 (#ID8KFK, #ID9RDW) * 修复了 CosyVoice2-0.5B 模型推理报错的问题 (#ID5Y84) * 修复了 Fuyu-8B 模型推理报错的问题 (#ID5Y8O) * 修复了 YOLOv8 ixRT 模型推理日志中的警告打印问题 (#IDC1OI) * 修复了 Conformer 模型解读异常问题 (#ID9RDQ) * 修复了 EfficientNet-B1 和 YOLOv4 模型 int8 推理精度异常的问题 (#ID912Z) * 修复了 ResNetV1d-50 和 RetinaFace ixRT 模型推理报错的问题 (#ID931D, #ID94XO) * 修复了 YOLO 系列模型在在 PyTorch 2.7 环境导出 ONNX 时的兼容报错问题 (#ID95LK) * 修复了 8 个推理小模型在 CI 上运行报错的问题 (#ID9DH4) * 修复了 YOLOv4 ixRT 模型量化 ONNX 报错的问题 (#IDA3BX) * 修复了 YOLOv10 ixRT 模型 dynamic shape 的问题(#IDAOW0) #### 版本关联 DeepSparkInference 25.12 对应天数软件栈 4.3.0 版本。 #### 感谢以下社区贡献者 YoungPeng,anders,fhfang,郭寒冰,qiang.zhang,majorli6,honglyua。
最后提交信息为:
update RELEASE.md.
25.09
cbf1326
2025-09-25 11:23
对比
DeepSparkInference 25.09 Release
honglyua
## 25.09 Release Notes ### 模型与算法 * 新增了19个推理小模型示例,其中支持IGIE推理引擎的12个,支持ixRT推理引擎的7个。 * 新增了11个大语言模型推理示例,涉及[FastDeploy](https://github.com/PaddlePaddle/FastDeploy)、[LMDeploy](https://github.com/InternLM/lmdeploy)和[vLLM](https://github.com/vllm-project/vllm)等框架。 <table> <th colspan=3>ixRT</th> <tr> <td>ATSS</td> <td>CLIP</td> <td>CSPResNeXt50</td> </tr> <tr> <td>EfficientNet-B4</td> <td>EfficientNet-B5</td> <td>PAA</td> </tr> <tr> <td>RetinaNet</td> <td></td> <td></td> </tr> <th colspan=3>IGIE</th> <tr> <td>EfficientNet-B6</td> <td>MNASNet1_3</td> <td>Regnet_x_32gf</td> </tr> <tr> <td>Regnet_x_400mf</td> <td>Regnet_y_3_2gf</td> <td>Regnet_y_32gf</td> </tr> <tr> <td>RegNet_y_400mf</td> <td>SSD</td> <td>VGG13</td> </tr> <tr> <td>VGG13_BN</td> <td>YOLOF</td> <td>YOLOv13</td> </tr> <th colspan=3>大模型</th> <tr> <td>CosyVoice2-0.5B</td> <td>E5-V (vLLM)</td> <td>ERNIE-4.5-21B-A3B (FastDeploy)</td> </tr> <tr> <td>ERNIE-4.5-300B-A47B (FastDeploy)</td> <td>GLM-4V (vLLM)</td> <td>InternLM3 (LMDeploy)</td> </tr> <tr> <td>MiniCPM-o-2_6 (vLLM)</td> <td>Qwen-VL (vLLM)</td> <td>Qwen2-VL (vLLM)</td> </tr> <tr> <td>Qwen2.5-VL (vLLM)</td> <td>Whisper (vLLM)</td> <td></td> </tr> </table> ### 修复更新 * 修复了BERT Large SQuAD模型链接404问题 (#ICSF66) * 修复了4.3.0容器环境下部分模型的依赖缺失问题 * 修复了MViTv2-base模型推理异常的问题 * 更新了CLIP模型的最新代码 * 更新了ByteMLPerf工具箱中optimizer的代码出处 (#ICKHTC) * 更新了4.3.0适用大/小模型推理的Docker使用说明 (#ICLDBK) ### 版本关联 DeepSparkInference 25.09对应天数软件栈4.3.0版本。 ### 感谢以下社区贡献者 YoungPeng,fhfang,郭寒冰,qiang.zhang,majorli6,honglyua。
最后提交信息为:
!196
update 25.09 release notes
25.06
6f43565
2025-06-19 09:35
对比
DeepSparkInference 25.06 Release
honglyua
## 25.06 Release Notes ### 模型与算法 * 新增了24个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的9个。 * 新增了6个基于vLLM的大语言模型推理示例,其中3个为多模态模型。 <table> <tr colspan=4> <th colspan=3>IGIE</th> </tr> <tr> <td>ConvNext_Tiny</td> <td>CSPResNeXt50</td> <td>EfficientNet_B5</td> </tr> <tr> <td>GFL</td> <td>MNASNet1_0</td> <td>Regnet_x_3_2gf</td> </tr> <tr> <td>Regnet_y_16gf</td> <td>SqueezeNet1_1</td> <td>Twins_PCPVT</td> </tr> <tr> <td>UNet</td> <td>VAN_B0</td> <td>VGG19</td> </tr> <tr> <td>ViT</td> <td>VGG19_BN</td> <td>YOLOv12</td> </tr> <th colspan=4>IxRT</th> </tr> <tr> <td>ResNeXt101_32x8d</td> <td>ResNeXt101_64x4d</td> <td>ShuffleNetV2_x0_5</td> </tr> <tr> <td>ShuffleNetV2_x1_0</td> <td>ShuffleNetV2_x1_5</td> <td>ShuffleNetV2_x2_0</td> </tr> <tr> <td>YOLOv9</td> <td>YOLOv10</td> <td>YOLOv11</td> </tr> <th colspan=4>大模型</th> </tr> <tr> <td>Aria (vLLM)</td> <td>H2OVLChatModel (vLLM)</td> <td>Idefics3-8B-Llama3 (vLLM)</td> </tr> <tr> <td>Llama-3.2 (vLLM)</td> <td>MiniCPM-V2 (vLLM)</td> <td>Pixtral-12B-2409 (vLLM)</td> </tr> </table> ### 修复更新 ● 修复了模型代码中的绝对路径的问题。 ● 修复了EfficientNetV2模型依赖timm版本的问题。 ● 修复了GoogleNet和InceptionV3模型(IGIE)的编译报错问题。 ● 更新了stable-diffusion-v1-5模型在huggingface上的链接。 ● 更新了MiniCPM-V2推理模型代码示例。 ● 优化了IxRT和IGIE中视觉分类模型的公共代码避免重复。 ● 增加了DeepSparkInference全部模型的json配置文件。 ● 增加了模型库首页的英文版README文档。 ### 版本关联 DeepSparkInference 25.06对应天数软件栈4.2.0版本。 ### 感谢以下社区贡献者 YoungPeng,majorli6,honglyua,qiang.zhang。
最后提交信息为:
sync and move e2e print log
25.03
fdf68dc
2025-03-26 13:49
对比
DeepSparkInference 25.03 Release
majorli6
## 25.03 Release Notes ### 模型与算法 * 新增了25个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的10个。 * 新增了11个大模型推理示例,其中6个为DeepSeek-R1蒸馏模型。 <table> <tr colspan=4> <th colspan=3>IGIE</th> </tr> <tr> <td>CSPResNet50</td> <td>ConvNeXt_S</td> <td>EfficientNet_b4</td> </tr> <tr> <td>HRNetPose</td> <td>MNASNet0_75</td> <td>Mixer_B</td> </tr> <tr> <td>Regnet_x_16gf</td> <td>ResNeXt101_32x8d</td> <td>SABL</td> </tr> <tr> <td>ShuffleNetv2_x2_0</td> <td>SqueezeNet1_0</td> <td>SVT_base</td> </tr> <tr> <td>VGG11</td> <td>Wide_ResNet101</td> <td>YOLOv11</td> </tr> <th colspan=4>IxRT</th> </tr> <tr> <td>ConvNeXt-Base</td> <td>DeiT-tiny</td> <td>DenseNet201</td> </tr> <tr> <td>EfficientNet-B3</td> <td>EfficientNetv2_rw_t</td> <td>EfficientNetv2_s</td> </tr> <tr> <td>FoveaBox</td> <td>FSAF</td> <td>HRNet</td> </tr> <tr> <td>RetinaFace</td> <td></td> <td></td> </tr> <th colspan=4>大模型</th> </tr> <tr> <td>DeepSeek-R1-Distill-Llama-8B</td> <td>DeepSeek-R1-Distill-Llama-70B</td> <td>DeepSeek-R1-Distill-Qwen-1.5B</td> </tr> <tr> <td>DeepSeek-R1-Distill-Qwen-7B</td> <td>DeepSeek-R1-Distill-Qwen-14B</td> <td>DeepSeek-R1-Distill-Qwen-32B</td> </tr> <tr> <td>Chameleon-7B</td> <td>Fuyu-8B</td> <td>InternVL2-4B</td> </tr> <tr> <td>LLaVA</td> <td>LLaVA-Next-Video-7B</td> <td></td> </tr> </table> ### 问题修复 * 新增了IxRT的NLP推理模型的自动化测试运行脚本。 * 优化了IGIE推理模型自动化测试的运行脚本。 * 修复了onnxruntime 1.17.1导致的quantize fail问题。 * 修复了BERT模型在INT8精度下的问题。 * 修复了YOLOv6 IGIE模型运行推理脚本报错的问题。 * 修复了mmpretraino 0.24.0与mmcv 2.1.0版本不兼容问题。 * 修复了ChatGLM3-6B-32k模型中的中文乱码问题。 * 修复了vLLM模型中SamplingParams的初始化问题。 * 更新了所有模型README文档格式,补充了模型所支持的IXUCA SDK版本。 ### 版本关联 DeepSparkInference 25.03对应天数软件栈4.2.0版本。 ### 感谢以下社区贡献者 YoungPeng,majorli6,xinchi.tian,xiaomei.wang,honglyua,qiang.zhang。
最后提交信息为:
!146
add release version in supported env
24.12
04705c9
2024-12-23 10:46
对比
DeepSparkInference 24.12 Release
honglyua
## 24.12 Release Notes ### 模型与算法 ● 新增了24个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的9个。 ● 新增了9个大语言模型的推理示例,其中支持vLLM的8个,支持IxFormer的1个。 <table> <tr colspan=4> <th colspan=3>IGIE</th> </tr> <tr> <td>ConvNeXt-Base</td> <td>DenseNet201</td> <td>EfficientNet-B3</td> </tr> <tr> <td>EfficientNetV2-S</td> <td>MNASNet0_5</td> <td>MViTv2_base</td> </tr> <tr> <td>Regnet_y_1_6gf</td> <td>ResNetV1_D50</td> <td>ResNeXt101_64x4d</td> </tr> <tr> <td>ShuffleNetV2_x1_5</td> <td>Kie_layoutXLM</td> <td>Rec_SVTR</td> </tr> <tr> <td>YOLOv9</td> <td>YOLOv10</td> <td>PAA</td> </tr> <th colspan=4>IxRT</th> </tr> <tr> <td>CenterNet</td> <td>OpenPose</td> <td>RTMPose</td> </tr> <tr> <td>CSPDarkNet53</td> <td>DensNet161</td> <td>DensNet169</td> </tr> <tr> <td>EfficientNetB2</td> <td>ResNeXt50_32x4d</td> <td>ConvNeXt-Small</td> </tr> </tr> <th colspan=4>大模型推理</th> </tr> <tr> <td>CLIP (IxFormer)</td> <td>ChatGLM3-6B-32K (vLLM)</td> <td>Llama2-7B (vLLM)</td> </tr> <tr> <td>MiniCPM-V-2 (vLLM)</td> <td>Qwen-7B (vLLM)</td> <td>Qwen1.5-32B-Chat (vLLM)</td> </tr> <tr> <td>Qwen2-72B-Instruct (vLLM)</td> <td>Qwen2-7B-Instruct (vLLM)</td> <td>StableLM2-1.6B (vLLM)</td> </tr> </table> ### 问题修复 ● 新增了IGIE推理模型自动化测试的运行脚本。 ● 修复了YOLOv8 IxRT模型运行推理脚本报错的问题。 ● 更新了YOLOv9和YOLOv10的IGIE模型的配置文件。 ● 完善了IxRT模型BERT,Mask RCNN,MobileNetV2和YOLOX的end2end推理时间打印。 ### 版本关联 DeepSparkInference 24.12对应天数软件栈4.1.2版本。 ### 感谢以下社区贡献者 YoungPeng,majorli6,xinchi.tian,xiaomei.wang,honglyua,qiang.zhang。
最后提交信息为:
update cspdarknet53 name
24.09
5604aa6
2024-09-23 10:37
对比
DeepSparkInference 24.09 Release
majorli6
## 24.09 Release Notes ### 模型与算法 * 新增了29个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的14个。 <table> <tr align="left"> <th colspan=6>IGIE</th> </tr> <tr> <td>ATSS</td> <td>ConvNeXt-Small</td> <td>CSPDarkNet50</td> <td>DeiT-tiny</td> </tr> <tr> <td>DenseNet169</td> <td>EfficientNet-B2</td> <td>EfficientNetV2-M</td> <td>FCOS</td> </tr> <tr> <td>FSAF</td> <td>RepVGG</td> <td>RetinaFace</td> <td>RTMDet</td> </tr> <tr> <td>RTMPose</td> <td>SEResNet50</td> <td>ShuffleNet_V2_X1_0</td> <td></td> </tr> <tr align="left"> <th colspan=6>IxRT</th> </tr> <tr> <td>ALBERT</td> <td>Conformer</td> <td>DeBERTa</td> <td>FaceNet</td> </tr> <tr> <td>RoBERTa</td> <td>RoFormer</td> <td>Swin Transformer Large</td> <td>Transformer ASR</td> </tr> <tr> <td>VideoBERT</td> <td>Wide_ResNet50</td> <td>Wide&Deep</td> <td>YOLOv4</td> </tr> <tr> <td>YOLOv6</td> <td>YOLOv8</td> <td></td> <td></td> </tr> </table> * 新增了5个大语言模型的推理示例。 * Llama3-70B (TensorRT-LLM) * Qwen1.5-7B (Text Generation Inference) * Qwen1.5-7B (vLLM) * Qwen1.5-14B (vLLM) * Qwen1.5-72B (vLLM) ### 问题修复 * 修复了BERT Base SQUAD模型在NV环境上int8精度异常的问题。 * 修复了Mask RCNN模型在NV 24.04环境上运行编译报错的问题。 * 修复了CLIP IGIE模型对transformers版本有依赖的问题。 * 完善了IxRT部分模型的end2end推理时间打印。 ### 版本关联 DeepSparkInference 24.09对应天数软件栈4.1.2版本。 ### 感谢以下社区贡献者 YoungPeng,majorli,xinchi.tian,xiaomei.wang,wenfeng.zhang,haoyanlong,qiang.zhang。
最后提交信息为:
update models/cv/classification/swin_transformer/igie/README.md.
24.06
7ae262a
2024-06-28 11:51
对比
DeepSparkInference 24.06 Release
majorli6
## 24.06 Release Notes ### 模型与算法 * 新增了31个推理小模型示例,其中支持IGIE推理引擎的16个,支持IxRT推理引擎的15个。 <table> <tr align="left"> <th colspan=6>IGIE</th> </tr> <tr> <td>CenterNet</td> <td>DenseNet161</td> <td>EfficientNet_b1</td> <td>EfficientNet_rw_t</td> </tr> <tr> <td>FoveaBox</td> <td>HRNet</td> <td>MobileNetv3_Large</td> <td>MobileNetv3_Small</td> </tr> <tr> <td>Regnet_x_1_6gf</td> <td>RepNet</td> <td>Res2Net50</td> <td>ResNeSt50</td> </tr> <tr> <td>ResNet101</td> <td>ResNet152</td> <td>ShuffleNetv2_x0_5</td> <td>Wide_ResNet50</td> </tr> <tr align="left"> <th colspan=6>IxRT</th> </tr> <tr> <td>BERT Base SQuAD</td> <td>DenseNet</td> <td>DETR</td> <td>EfficientNet_V2_t</td> </tr> <tr> <td>FCOS</td> <td>HRNet</td> <td>Inception_ResNet_V2</td> <td>InceptionV3</td> </tr> <tr> <td>ResNet_V1_D50</td> <td>SoloV1</td> <td>SqueezeNet_v1.1</td> <td>YOLOv3</td> </tr> <tr> <td>YOLOv5m</td> <td>YOLOv5s</td> <td>YOLOv7</td> <td></td> </tr> </table> * 新增了4个大语言模型的推理示例。 * Baichuan2-7B (vLLM) * ChatGLM-3-6B (vLLM) * Llama2-7B (TensorRT-LLM) * Qwen-7B (Text Generation Inference) ### 问题修复 * 修复了YOLOX IxRT 插件编译会报错的问题。 * 完善了libGL依赖在Ubuntu上安装的帮助说明。 ### 版本关联 DeepSparkInference 24.06对应天数软件栈4.0.0版本。 ### 感谢以下社区贡献者 YoungPeng,majorli,xinchi.tian,tianxi-yi,may,xiaomei.wang,cheneychen2023,qiang.zhang。
最后提交信息为:
update RELEASE.md.
24.03
58c976a
2024-03-26 11:11
对比
DeepSparkInference 24.03 Release
majorli6
## 24.03 Release Notes ### 模型与算法 * 新增了48个推理模型示例,其中支持IGIE推理引擎的28个,支持IxRT推理引擎的20个。 <table> <tr align="left"> <th colspan=6>IGIE</th> </tr> <tr> <td>AlexNet</td> <td>BERT Base NER</td> <td>BERT Base SQuAD</td> <td>BERT Large SQuAD</td> </tr> <tr> <td>CLIP</td> <td>Conformer</td> <td>Conformer-B</td> <td>DeepSort</td> </tr> <tr> <td>DenseNet121</td> <td>EfficientNet-B0</td> <td>FastReID</td> <td>GoogLeNet</td> </tr> <tr> <td>HRNet-W18</td> <td>InceptionV3</td> <td>MobileNetV2</td> <td>ResNet18</td> </tr> <tr> <td>ResNet50</td> <td>ResNeXt50_32x4d</td> <td>RetinaNet</td> <td>Swin Transformer</td> </tr> <tr> <td>VGG16</td> <td>YOLOv3</td> <td>YOLOv4</td> <td>YOLOv5</td> </tr> <tr> <td>YOLOv6</td> <td>YOLOv7</td> <td>YOLOv8</td> <td>YOLOX</td> </tr> <tr align="left"> <th colspan=6>IxRT</th> </tr> <tr> <td>AlexNet</td> <td>BERT Base SQuAD</td> <td>BERTLarge SQuAD</td> <td>CSPResNet50</td> </tr> <tr> <td>EfficientNet-B0</td> <td>EfficientNet-B1</td> <td>GoogLeNet</td> <td>Mask R-CNN</td> </tr> <tr> <td>MobileNetV2</td> <td>MobileNetV3</td> <td>RepVGG</td> <td>Res2Net50</td> </tr> <tr> <td>ResNet101</td> <td>ResNet18</td> <td>ResNet34</td> <td>ResNet50</td> </tr> <tr> <td>ShufflenetV1</td> <td>SqueezeNet 1.0</td> <td>VGG16</td> <td>YOLOX</td> </table> ### 版本关联 DeepSparkInference 24.03对应天数软件栈4.0.0版本。
最后提交信息为:
initial commit for deepsparkinferce first release
下载
请输入验证码,防止盗链导致资源被占用
取消
下载
Python
1
https://gitee.com/deep-spark/deepsparkinference.git
git@gitee.com:deep-spark/deepsparkinference.git
deep-spark
deepsparkinference
DeepSparkInference
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册