# DeepSeek-OCR-Web **Repository Path**: bobosanguo/DeepSeek-OCR-Web ## Basic Information - **Project Name**: DeepSeek-OCR-Web - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-14 - **Last Updated**: 2026-01-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

DeepSeek-OCR 可视化系统

中文 | English
## ⚡ 项目简介 本项目是基于 DeepSeek-OCR 的多模态文档解析工具。采用 FastAPI 后端 + React 前端 ![项目图片](assets/项目图片.png) 该工具能够高效地处理 PDF 文档和图片,提供强大的光学字符识别(OCR)功能,支持多语种文字识别、表格解析、图表分析等多种功能。 ### 主要功能 - **多格式文档解析**:支持 PDF、图片等多种格式的文档上传和解析 - **智能 OCR 识别**:基于 DeepSeek-OCR 模型,提供高精度的文字识别 - **版面分析**:智能识别文档版面结构,准确提取内容布局 - **多语种支持**:支持中文、英文等多种语言的文字识别 - **表格&图表解析**:专业的表格识别和图表数据提取功能 - **专业领域图纸识别**:支持各类专业领域图纸的语义识别 - **数据可视化**:支持数据分析可视化图的逆向解析 - **Markdown 转换**:将 PDF 内容转换为结构化的 Markdown 格式 ## 👀 项目演示
**PDF文档解析 - 支持图片、表格等复杂内容** 文档解析
| 多语种文字解析 | 图表&表格解析 | |:---:|:---:| | 多语种文字解析 | 图表&表格解析 |
| 专业领域图纸语义识别(支持CAD、流程图、装饰图等) | 数据分析可视化图逆向解析 | |:---:|:---:| | CAD图纸语义识别 | 数据可视化图逆向解析 |
## 🚀 使用指南 ### 系统要求 ⚠️ **重要提示**: - **操作系统**:需要在 Linux 系统下运行 - **显卡要求**:GPU ≥ 7 GB 显存(大图/多页 PDF 建议 16–24 GB) - **兼容性说明**:50 系显卡目前不兼容,请使用其他型号显卡 - **Python 版本**:3.10–3.12(推荐 3.10/3.11) - **CUDA 版本**:11.8 或 12.1/12.2(需与显卡驱动匹配) - **PyTorch**:需安装与 CUDA 匹配的预编译版本 ### 快速开始 #### 方法一、脚本一键启动(推荐) 执行以下脚本即可一键启动 ```bash #安装模型权重及环境依赖 bash install.sh #启动服务 bash start.sh ``` #### 方法二、手动安装并运行 ##### 步骤 1:模型权重下载 首先需要下载 DeepSeek-OCR 模型权重,可从 **Hugging Face** 或 **魔搭社区(ModelScope)** 获取。以下以 **ModelScope** 为例: ```bash pip install modelscope mkdir ./deepseek-ocr modelscope download --model deepseek-ai/DeepSeek-OCR --local_dir ./deepseek-ocr ``` ##### 步骤 2:运行环境搭建 下载官方项目包 ```bash git clone https://github.com/deepseek-ai/DeepSeek-OCR.git ``` 创建虚拟环境来安装模型运行的相关依赖 ```bash conda create -n deepseek-ocr python=3.12.9 -y conda activate deepseek-ocr ``` 安装Jupyter及响应的kernel ```bash conda install jupyterlab conda install ipykernel python -m ipykernel install --user --name dsocr --display-name "Python (dsocr)" ``` 安装pytorch相关组件 ```bash pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118 ``` ​安装DeepSeek-OCR官方推荐使用的vLLM版本([v0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl](https://github.com/vllm-project/vllm/releases/download/v0.8.5/vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl)) ```Bash pip install ./packages/vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl ``` 安装项目基础依赖 ```Bash cd ./DeepSeek-OCR/ pip install -r requirements.txt ``` 安装过程如果出现了如图所示的依赖冲突,无视即可,不会影响实际运行。 安装flash-attn加速库。 ```Bash pip install flash-attn==2.7.3 --no-build-isolation ``` 在项目根目录下创建`.env`文件,并输入模型运行地址,例如 ``` MODEL_PATH=/root/autodl-tmp/deepseek-ocr ``` ##### 步骤 3:启动后端服务 开启后端 ```bash uvicorn main:app --host 0.0.0.0 --port 8002 --reload ``` ##### 步骤 4:启动前端服务 安装前端依赖 ```bash npm install ``` 开启前端 ```bash npm run dev ``` 启动成功后,在浏览器中访问前端地址即可使用。 ## 🙈 贡献 欢迎通过GitHub提交 PR 或者issues来对项目进行贡献。我们非常欢迎任何形式的贡献,包括功能改进、bug修复或是文档优化。 ## 😎 技术交流 扫描添加小可爱,回复“DeepSeekOCR”加入技术交流群,与其他小伙伴一起交流学习。
技术交流群二维码