# DeepSeek-OCR-Web **Repository Path**: bobosanguo/DeepSeek-OCR-Web ## Basic Information - **Project Name**: DeepSeek-OCR-Web - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-14 - **Last Updated**: 2026-01-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

DeepSeek-OCR 可视化系统

中文 | English

## ⚡ 项目简介本项目是基于 DeepSeek-OCR 的多模态文档解析工具。采用 FastAPI 后端 + React 前端 ![项目图片](assets/项目图片.png) 该工具能够高效地处理 PDF 文档和图片，提供强大的光学字符识别（OCR）功能，支持多语种文字识别、表格解析、图表分析等多种功能。 ### 主要功能 - **多格式文档解析**：支持 PDF、图片等多种格式的文档上传和解析 - **智能 OCR 识别**：基于 DeepSeek-OCR 模型，提供高精度的文字识别 - **版面分析**：智能识别文档版面结构，准确提取内容布局 - **多语种支持**：支持中文、英文等多种语言的文字识别 - **表格&图表解析**：专业的表格识别和图表数据提取功能 - **专业领域图纸识别**：支持各类专业领域图纸的语义识别 - **数据可视化**：支持数据分析可视化图的逆向解析 - **Markdown 转换**：将 PDF 内容转换为结构化的 Markdown 格式 ## 👀 项目演示

**PDF文档解析 - 支持图片、表格等复杂内容**

| 多语种文字解析 | 图表&表格解析 | |:---:|:---:| |

## 🚀 使用指南 ### 系统要求 ⚠️ **重要提示**： - **操作系统**：需要在 Linux 系统下运行 - **显卡要求**：GPU ≥ 7 GB 显存（大图/多页 PDF 建议 16–24 GB） - **兼容性说明**：50 系显卡目前不兼容，请使用其他型号显卡 - **Python 版本**：3.10–3.12（推荐 3.10/3.11） - **CUDA 版本**：11.8 或 12.1/12.2（需与显卡驱动匹配） - **PyTorch**：需安装与 CUDA 匹配的预编译版本 ### 快速开始 #### 方法一、脚本一键启动（推荐）执行以下脚本即可一键启动 ```bash #安装模型权重及环境依赖 bash install.sh #启动服务 bash start.sh ``` #### 方法二、手动安装并运行 ##### 步骤 1：模型权重下载首先需要下载 DeepSeek-OCR 模型权重，可从 **Hugging Face** 或 **魔搭社区（ModelScope）** 获取。以下以 **ModelScope** 为例： ```bash pip install modelscope mkdir ./deepseek-ocr modelscope download --model deepseek-ai/DeepSeek-OCR --local_dir ./deepseek-ocr ``` ##### 步骤 2：运行环境搭建下载官方项目包 ```bash git clone https://github.com/deepseek-ai/DeepSeek-OCR.git ``` 创建虚拟环境来安装模型运行的相关依赖 ```bash conda create -n deepseek-ocr python=3.12.9 -y conda activate deepseek-ocr ``` 安装Jupyter及响应的kernel ```bash conda install jupyterlab conda install ipykernel python -m ipykernel install --user --name dsocr --display-name "Python (dsocr)" ``` 安装pytorch相关组件 ```bash pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118 ``` 安装DeepSeek-OCR官方推荐使用的vLLM版本([v0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl](https://github.com/vllm-project/vllm/releases/download/v0.8.5/vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl)) ```Bash pip install ./packages/vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl ``` 安装项目基础依赖 ```Bash cd ./DeepSeek-OCR/ pip install -r requirements.txt ``` 安装过程如果出现了如图所示的依赖冲突，无视即可，不会影响实际运行。

安装flash-attn加速库。 ```Bash pip install flash-attn==2.7.3 --no-build-isolation ``` 在项目根目录下创建`.env`文件，并输入模型运行地址，例如 ``` MODEL_PATH=/root/autodl-tmp/deepseek-ocr ``` ##### 步骤 3：启动后端服务开启后端 ```bash uvicorn main:app --host 0.0.0.0 --port 8002 --reload ``` ##### 步骤 4：启动前端服务安装前端依赖 ```bash npm install ``` 开启前端 ```bash npm run dev ``` 启动成功后，在浏览器中访问前端地址即可使用。 ## 🙈 贡献欢迎通过GitHub提交 PR 或者issues来对项目进行贡献。我们非常欢迎任何形式的贡献，包括功能改进、bug修复或是文档优化。 ## 😎 技术交流扫描添加小可爱，回复“DeepSeekOCR”加入技术交流群，与其他小伙伴一起交流学习。