12 mirrors 1578989292
33
Tinn 是一个用 C99 编写的仅有 200 行代码微型神经网络库,无依赖,轻量级
12 mirrors 1578989292
5
FlashMLA 是针对 Hopper GPU 优化的高效 MLA 解码内核,由 DeepSeek 开源,专为处理可变长度序列而设计,目前已投入生产环境
C/C++
7天前
12 mirrors 1578989292
3
DeepEP 是专为 Mixture-of-Experts (MoE) 和 expert parallelism (EP) 定制的通信库
C/C++
7天前
12 mirrors 1578989292
0
TIM-VX 是 VeriSilicon 提供的一个软件集成模块,用于简化在 VeriSilicon ML 加速器上部署神经网络

搜索帮助