# FileReaderAssistant **Repository Path**: linjhs/file-reader-assistant ## Basic Information - **Project Name**: FileReaderAssistant - **Description**: No description available - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 26 - **Created**: 2024-12-22 - **Last Updated**: 2024-12-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 文档智能分析系统 ## 简介 欢迎来到 **文档智能分析系统**!本系统允许用户上传 `.docx` 格式的文档,并通过自然语言处理(NLP)技术对文档内容进行智能分析。用户可以通过提出问题的方式与系统交互,系统将根据文档内容返回最相关的答案及对应的段落。 ## 功能亮点 - **文档上传**:支持用户上传 `.docx` 格式的文档。 - **智能问答**:基于上传的文档,用户可以提出各种问题,系统会根据文档内容给出准确的答案。 - **段落定位**:不仅提供答案,还会指出答案所在的文档段落,便于用户快速查阅。 - **多语言支持**:系统能够处理多种语言的文档,并提供相应的问答服务。(如果适用) ## 使用指南 ### 1. 准备工作 常见一个新的conda环境,可以通过以下命令安装所有需要的 Python 包: ```bash conda create -n py39 python=3.9 pip install -r requirements.txt 启动服务 uvicorn main:app --reload --host 0.0.0.0 --port 8000 ``` ### 2. 使用说明 直接访问本地127.0.0.1:port即可以web形式操作,如图: ![image](./app/assert/341734529002_.pic.jpg) 上传文档后,可以根据文档内容进行问答,模型会返回**答案**以及原文中的**特定段落** ![image](./app/assert/351734529431_.pic.jpg) ## 3. 未来计划 1. [ ] 实现对PDF、doc、ppt文件的支持 2. [ ] 增加ocr功能 3. [ ] 优化chunk划分策略 4. [ ] 优化系统性能,减少响应时间