ovi
Python

Ovi 是一种类似 veo-3 的视频+音频生成模型,可同时从文本或文本+图像输入生成视频和音频内容

最近更新: 1天前

cuq
Python

Cuq 是一个针对 PTX 的 MIR-to-Coq 框架,用于 Rust GPU 内核的形式语义和验证翻译

最近更新: 1天前

qwen3-vl
Python

Qwen3-VL——迄今为止 Qwen 系列中最强大的视觉语言模型

最近更新: 1天前

katakate
Python

Katakate 旨在简化轻量级安全虚拟机沙箱的创建、管理和编排,以便大规模执行不受信任的代码

最近更新: 1天前

skyvern
Python

Skyvern 使用 LLM 和计算机视觉实现基于浏览器的工作流程自动化

最近更新: 1天前

micrograd
Python

一个微型 Autograd 引擎

最近更新: 1天前

livecc
Python

首个能够进行实时评论的视频语言模型,采用新颖的视频-自动语音识别(ASR)流处理方法,在流式和离线基准测试中均达到最先进水平

最近更新: 1天前

DeepSeek-OCR
Python

DeepSeek-OCR 是利用视觉模态压缩长文本上下文的新方法

最近更新: 1天前

openagents
Python

OpenAgents 是一个开源项目,用于创建 AI Agent 网络,并将 agent 连接到网络以实现开放式协作

最近更新: 1天前

rf-detr
Python

RF-DETR 是由 Roboflow 开发并根据 Apache 2.0 许可发布的实时、基于 Transformer 的对象检测和实例分割模型架构

最近更新: 1天前

memu
Python

MemU 是一个面向 AI 应用的开源智能体记忆框架,具有高精度、快速检索和低成本等特点

最近更新: 1天前

cell2sentence
Python

Cell2Sentence (C2S-Scale) 框架的最新版本,旨在将大型语言模型(LLMs)应用于单细胞转录组学分析

最近更新: 1天前

minecontext
Python

MineContext 是一个具有上下文感知能力的主动式AI伙伴

最近更新: 1天前

dinfer
Python

dInfer 是一个高效且可扩展的 dLLM 推理框架

最近更新: 1天前

NewtonBench
Python

来自香港科技大学和英伟达的研究者提出了 NewtonBench—— 一个具备强泛化能力、旨在模拟真实实验探索环境的科学定律发现基准(Scientific Law Discovery

最近更新: 1天前

diamoe-tts
Python

DiaMoE-TTS,这是一个基于国际音标 (IPA) 的统一框架,能够标准化语音表示并解决字素到音素的歧义问题

最近更新: 1天前

openpoke
Python

OpenPoke 是 Interaction Company Poke 助手的简化版开源版本,旨在展示多代理编排堆栈如何真正发挥作用

最近更新: 1天前

everywhere
C#

Everywhere 是一款具备情境感知能力的交互式 AI 助手,拥有简洁现代的用户界面和强大的集成功能

最近更新: 1天前

youtu-embedding
Python

Youtu-Embedding 是一款由腾讯优图实验室研发的业界领先的通用文本表示模型

最近更新: 1天前

xllm
C/C++

xLLM 是一个高效的开源大模型推理框架,专为国产芯片优化设计,提供企业级的服务部署,使得性能更高、成本更低

最近更新: 1天前

搜索帮助