# smart-local-knowledge-doc **Repository Path**: e4glet/smart-local-knowledge-doc ## Basic Information - **Project Name**: smart-local-knowledge-doc - **Description**: 一个基于KaLM-Embedding-V2.5和ChromaDB的学习资料语义搜索系统 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-12-28 - **Last Updated**: 2026-03-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 智能本地知识库系统 一个基于KaLM-Embedding-V2.5和ChromaDB的学习资料语义搜索系统,专为师生本地部署设计。 ## 系统结构 ``` smart-local-knowledge-doc/ # 项目根目录 ├── src/ # 核心源代码(保持不变) │ ├── main.py # FastAPI主应用 │ ├── database.py # 数据库操作管理器 │ ├── vectorizer.py # 文本向量化处理器 │ ├── file_processor.py # 多格式文档处理器 │ ├── models.py # 数据模型定义 │ └── config.py # 【修改后的配置文件】替换原文件 ├── vue3-knowledge-doc/ │ └── dist/ # 前端页面 ├── BAAI/ │ └── bge-small-zh-v1.5/ # 向量模型目录 ├── data/ # chromaDB文件 ├── uploads/ # 文件上传存储目录 ├── miniconda3/ # 项目专属Python环境 ├── app_main.py # 【新增】放在项目根目录 ├── build.bat # 【可选】打包脚本,放在项目根目录 ├── 一键启动.bat # 一键启动文件 └── requirements.txt # 依赖包清单 ``` ## ✨ 特性 - 🤖 **先进的向量模型**: 使用KaLM-Embedding-V2.5,针对中英文优化,CPU友好 - 🗄️ **本地向量数据库**: 基于ChromaDB,无需外部数据库服务 - 📚 **多格式支持**: 支持PDF、Word、Excel、PPT、TXT、Markdown、图片等 - 🔍 **智能语义搜索**: 基于向量相似度的语义搜索,支持中文自然语言查询 - 🏠 **完全本地化**: 所有数据本地存储,保护隐私,支持离线使用 - ⚡ **轻量高效**: 针对个人电脑优化,资源占用低 - 🎯 **学习资料优化**: 针对教材、课件、论文等学习资料的特殊优化 ## 📦 系统要求 - Windows 10/11 或 macOS 10.15+ 或 Linux - 8GB+ 内存(推荐16GB) - 10GB+ 可用磁盘空间 - Python 3.8+ ## 🚀 快速开始 ### 1. 下载项目 ```bash git clone <项目地址> cd smart-local-knowledge-doc ``` ### 调试 ``` bash miniconda3\Scripts\pyinstaller.exe --debug=imports app_main.py ```