各家开源的AI 大模型,及大模型相关仓库(如部署、整合等)。
LangGraph 是一个低级编排框架,用于构建、管理和部署长时间运行的有状态代理,受到塑造代理未来的公司(包括 Klarna、Replit、Elastic 等)的信赖。
Qwen3 的亮点包括: 各种尺寸的密集和混合专家 (MoE) 型号,思维模式(用于复杂的逻辑推理、数学和编码)和非思维模式(用于高效的通用聊天)无缝切换,推理能力显著增强,卓越的人类偏好对齐,在智能体能力方面拥有丰富的专业知识。 支持 100+ 种语言和方言,具有强大的多语言教学遵循和翻译能力。
DeepSeek-V3 是一个强大的专家混合 (MoE) 语言模型。新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。 https://api-docs.deepseek.com/zh-cn/news/news250325
DeepSeek-R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
大模型相关仓库合集。