ubuntu下调用双卡Radeon VII 使用张量并行运行大语言模型(基于vllm)
GLM大模型客户端,一个独立的桌面应用程序,用于 glm,使用 Tauri 构建。 ## 功能 * **原生体验**:直接从桌面与 glm 交互,无需浏览器。 * **快速且轻量**:使用 Tauri 构建,应用程序资源占用少,启动迅速。 * **跨平台**:支持 Windows、macOS 和 Linux。
java-maxkb 是一个基于 Java 开发的智能知识库系统,利用先进的自然语言处理和向量检索技术,为用户提供高效、准确的问答服务。通过集成文档管理、片段向量化、语义搜索和大语言模型(如 GPT-4)等功能,系统能够理解用户的问题,并从知识库中检索最相关的内容生成回答。
本项目提供一个 HTTP API 服务,用于使用 Jina-embeddings-v3 模型生成文本嵌入,基于 ONNX Runtime 和 Robyn 框架。兼容openai embedding数据格式.支持在Cpu上运行.