# DB-GPT **Repository Path**: dingqs/DB-GPT ## Basic Information - **Project Name**: DB-GPT - **Description**: No description available - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-12-15 - **Last Updated**: 2023-12-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # DB-GPT: 用私有化LLM技术定义数据库下一代交互方式

stars forks License: MIT Release Notes Open Issues Discord Open in GitHub Codespaces

[**English**](README.md)|[**Discord**](https://discord.gg/7uQnPuveTY)|[**文档**](https://www.yuque.com/eosphoros/dbgpt-docs/bex30nsv60ru0fmx)|[**微信**](https://github.com/csunny/DB-GPT/blob/main/README.zh.md#%E8%81%94%E7%B3%BB%E6%88%91%E4%BB%AC)|[**社区**](https://github.com/eosphoros-ai/community)
## DB-GPT 是什么? DB-GPT是一个开源的数据库领域大模型框架。目的是构建大模型领域的基础设施,通过开发多模型管理、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作等多种技术能力,让围绕数据库构建大模型应用更简单,更方便。 数据3.0 时代,基于模型、数据库,企业/开发者可以用更少的代码搭建自己的专属应用。 ## 目录 - [安装](#安装) - [效果演示](#效果演示) - [架构方案](#架构方案) - [特性简介](#特性一览) - [贡献](#贡献) - [路线图](#路线图) - [联系我们](#联系我们) [DB-GPT视频介绍](https://www.bilibili.com/video/BV1au41157bj/?spm_id_from=333.337.search-card.all.click&vd_source=7792e22c03b7da3c556a450eb42c8a0f) ## 效果演示 ##### Chat Data ![chatdata](https://github.com/eosphoros-ai/DB-GPT/assets/13723926/1f77079e-d018-4eee-982b-9b6a66bf1063) ##### Chat Excel ![excel](https://github.com/eosphoros-ai/DB-GPT/assets/13723926/3044e83b-a71e-41fe-a1e2-98e479e0ab59) #### 根据自然语言对话生成分析图表

## 安装 ![Docker](https://img.shields.io/badge/docker-%230db7ed.svg?style=for-the-badge&logo=docker&logoColor=white) ![Linux](https://img.shields.io/badge/Linux-FCC624?style=for-the-badge&logo=linux&logoColor=black) ![macOS](https://img.shields.io/badge/mac%20os-000000?style=for-the-badge&logo=macos&logoColor=F0F0F0) ![Windows](https://img.shields.io/badge/Windows-0078D6?style=for-the-badge&logo=windows&logoColor=white) [**教程**](https://www.yuque.com/eosphoros/dbgpt-docs/bex30nsv60ru0fmx) - [**快速开始**](https://www.yuque.com/eosphoros/dbgpt-docs/ew0kf1plm0bru2ga) - [**源码安装**](https://www.yuque.com/eosphoros/dbgpt-docs/urh3fcx8tu0s9xmb) - [**Docker安装**](https://www.yuque.com/eosphoros/dbgpt-docs/glf87qg4xxcyrp89) - [**Docker Compose安装**](https://www.yuque.com/eosphoros/dbgpt-docs/wwdu11e0v5nkfzin) - [**使用手册**](https://www.yuque.com/eosphoros/dbgpt-docs/tkspdd0tcy2vlnu4) - [**知识库**](https://www.yuque.com/eosphoros/dbgpt-docs/ycyz3d9b62fccqxh) - [**数据对话**](https://www.yuque.com/eosphoros/dbgpt-docs/gd9hbhi1dextqgbz) - [**Excel对话**](https://www.yuque.com/eosphoros/dbgpt-docs/prugoype0xd2g4bb) - [**数据库对话**](https://www.yuque.com/eosphoros/dbgpt-docs/wswpv3zcm2c9snmg) - [**报表分析**](https://www.yuque.com/eosphoros/dbgpt-docs/vsv49p33eg4p5xc1) - [**插件**](https://www.yuque.com/eosphoros/dbgpt-docs/pom41m7oqtdd57hm) - [**模型服务部署**](https://www.yuque.com/eosphoros/dbgpt-docs/vubxiv9cqed5mc6o) - [**单机部署**](https://www.yuque.com/eosphoros/dbgpt-docs/kwg1ed88lu5fgawb) - [**集群部署**](https://www.yuque.com/eosphoros/dbgpt-docs/gmbp9619ytyn2v1s) - [**vLLM**](https://www.yuque.com/eosphoros/dbgpt-docs/bhy9igdvanx1uluf) - [**如何Debug**](https://www.yuque.com/eosphoros/dbgpt-docs/eyg0ocbc2ce3q95r) - [**FAQ**](https://www.yuque.com/eosphoros/dbgpt-docs/gomtc46qonmyt44l) ## 特性一览 - **私域问答&数据处理&RAG** 支持内置、多文件格式上传、插件自抓取等方式自定义构建知识库,对海量结构化,非结构化数据做统一向量存储与检索 - **多数据源&GBI** 支持自然语言与Excel、数据库、数仓等多种数据源交互,并支持分析报告。 - **自动化微调** 围绕大语言模型、Text2SQL数据集、LoRA/QLoRA/Pturning等微调方法构建的自动化微调轻量框架, 让TextSQL微调像流水线一样方便。详见: [DB-GPT-Hub](https://github.com/eosphoros-ai/DB-GPT-Hub) - **数据驱动的Agents插件** 支持自定义插件执行任务,原生支持Auto-GPT插件模型,Agents协议采用Agent Protocol标准 - **多模型支持与管理** 海量模型支持,包括开源、API代理等几十种大语言模型。如LLaMA/LLaMA2、Baichuan、ChatGLM、文心、通义、智谱等。当前已支持如下模型: - 新增支持模型 - 🔥🔥🔥 [qwen-72b-chat](https://huggingface.co/Qwen/Qwen-72B-Chat) - 🔥🔥🔥 [Yi-34B-Chat](https://huggingface.co/01-ai/Yi-34B-Chat) - [更多开源模型](https://www.yuque.com/eosphoros/dbgpt-docs/iqaaqwriwhp6zslc#qQktR) - 支持在线代理模型 - [x] [OpenAI·ChatGPT](https://api.openai.com/) - [x] [阿里·通义](https://www.aliyun.com/product/dashscope) - [x] [百度·文心](https://cloud.baidu.com/product/wenxinworkshop?track=dingbutonglan) - [x] [智谱·ChatGLM](http://open.bigmodel.cn/) - [x] [讯飞·星火](https://xinghuo.xfyun.cn/) - [x] [Google·Bard](https://bard.google.com/) - **隐私安全** 通过私有化大模型、代理脱敏等多种技术保障数据的隐私安全。 - [支持数据源](https://www.yuque.com/eosphoros/dbgpt-docs/rc4r27ybmdwg9472) ## 架构方案 整个DB-GPT的架构,如下图所示

核心能力主要有以下几个部分: - **RAG(Retrieval Augmented Generation)**,RAG是当下落地实践最多,也是最迫切的领域,DB-GPT目前已经实现了一套基于RAG的框架,用户可以基于DB-GPT的RAG能力构建知识类应用。 - **GBI**:生成式BI是DB-GPT项目的核心能力之一,为构建企业报表分析、业务洞察提供基础的数智化技术保障。 - **微调框架**: 模型微调是任何一个企业在垂直、细分领域落地不可或缺的能力,DB-GPT提供了完整的微调框架,实现与DB-GPT项目的无缝打通,在最近的微调中,基于spider的准确率已经做到了82.5% - **数据驱动的Multi-Agents框架**: DB-GPT提供了数据驱动的自进化微调框架,目标是可以持续基于数据做决策与执行。 - **数据工厂**: 数据工厂主要是在大模型时代,做可信知识、数据的清洗加工。 - **数据源**: 对接各类数据源,实现生产业务数据无缝对接到DB-GPT核心能力。 ### RAG生产落地实践架构

### 子模块 - [DB-GPT-Hub](https://github.com/csunny/DB-GPT-Hub) 通过微调来持续提升Text2SQL效果 - [DB-GPT-Plugins](https://github.com/csunny/DB-GPT-Plugins) DB-GPT 插件仓库, 兼容Auto-GPT - [DB-GPT-Web](https://github.com/csunny/DB-GPT-Web) 多端交互前端界面 ## Image 🌐 [AutoDL镜像](https://www.codewithgpu.com/i/eosphoros-ai/DB-GPT/dbgpt) 🌐 [小程序云部署](https://www.yuque.com/eosphoros/dbgpt-docs/ek12ly8k661tbyn8) ### 多语言切换 在.env 配置文件当中,修改LANGUAGE参数来切换使用不同的语言,默认是英文(中文zh, 英文en, 其他语言待补充) ## 使用说明 ### 多模型使用 [使用指南](https://www.yuque.com/eosphoros/dbgpt-docs/huzgcf2abzvqy8uv) # 贡献 > 提交代码前请先执行 `black .` 这是一个用于数据库的复杂且创新的工具, 我们的项目也在紧急的开发当中, 会陆续发布一些新的feature。如在使用当中有任何具体问题, 优先在项目下提issue, 如有需要, 请联系如下微信,我会尽力提供帮助,同时也非常欢迎大家参与到项目建设中。 ## Licence The MIT License (MIT) # 路线图

### 知识库RAG检索优化 - [x] Multi Documents - [x] PDF - [x] Excel, csv - [x] Word - [x] Text - [x] MarkDown - [ ] Code - [ ] Images - [x] RAG - [ ] Graph Database - [ ] Neo4j Graph - [ ] Nebula Graph - [x] Multi Vector Database - [x] Chroma - [x] Milvus - [x] Weaviate - [x] PGVector - [ ] Elasticsearch - [ ] ClickHouse - [ ] Faiss ### 多数据源支持 - 支持数据源 - [x] MySQL - [x] PostgresSQL - [x] Spark - [x] DuckDB - [x] Sqlite - [x] MSSQL - [x] ClickHouse - [x] StarRocks - [ ] Oracle - [ ] Redis - [ ] MongoDB - [ ] HBase - [x] Doris - [ ] DB2 - [ ] Couchbase - [ ] Elasticsearch - [ ] OceanBase - [ ] TiDB ### 多模型管理与推理优化 - [x] [集群部署](https://www.yuque.com/eosphoros/dbgpt-docs/gmbp9619ytyn2v1s) - [x] [fastchat支持](https://github.com/lm-sys/FastChat) - [x] [vLLM 支持](https://www.yuque.com/eosphoros/dbgpt-docs/bhy9igdvanx1uluf) - [x] 上层接口兼容Openai - [ ] 云原生环境与Ray环境支持 - [ ] 注册中心引入nacos - [ ] Embedding模型扩充,优化 ### Agents与插件市场 - [x] 多Agents框架 - [x] 自定义Agents - [x] 插件市场 - [ ] CoT集成 - [ ] 丰富插件样本库 - [ ] 支持AutoGPT协议 - [ ] Multi-agents & 可视化能力打通,定义LLM+Vis新标准 ### 测试评估能力建设 - [ ] 知识库的数据文本集 - [ ] 问题集合 [easy、medium、hard] - [ ] 评分机制 - [ ] Excel + DB库表的测试评估 ### 成本与可观测性 - [x] [debugging](https://db-gpt.readthedocs.io/en/latest/getting_started/observability.html) - [ ] 可观测性 - [ ] 推理预算 ### Text2SQL微调 - support llms - [x] LLaMA - [x] LLaMA-2 - [x] BLOOM - [x] BLOOMZ - [x] Falcon - [x] Baichuan - [x] Baichuan2 - [x] InternLM - [x] Qwen - [x] XVERSE - [x] ChatGLM2 - SFT模型准确率 截止20231010,我们利用本项目基于开源的13B大小的模型微调后,在Spider的评估集上的执行准确率,已经超越GPT-4! [More Information about Text2SQL finetune](https://github.com/eosphoros-ai/DB-GPT-Hub) ## 引用 如果您觉得我们的项目有用,请考虑引用我们的项目: ```bibtex @software{db-gpt, author = {DB-GPT Team}, title = {{DB-GPT}}, url = {https://github.com/eosphoros-ai/DB-GPT}, year = {2023} } ``` ## 联系我们

[![Star History Chart](https://api.star-history.com/svg?repos=csunny/DB-GPT&type=Date)](https://star-history.com/#csunny/DB-GPT)