# Pic2Text **Repository Path**: cui-rongpei/pic2text ## Basic Information - **Project Name**: Pic2Text - **Description**: 基于pyQt5、tesseract的图片文字提取软件 - **Primary Language**: Unknown - **License**: AGPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2024-11-27 - **Last Updated**: 2024-11-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # OCR 软件 这是一个简单的 OCR 软件,可以提取图片中的文本。 ## 构建和运行 1. **克隆项目**: ```bash git clone https://gitee.com/cui-rongpei/pic2text.git cd pic2text ``` 2. **安装依赖**: ```bash pip install -r requirements.txt ``` 3. **安装 Tesseract OCR**: 下载并安装 [Tesseract OCR:Tesseract GitHub](https://github.com/tesseract-ocr/tesseract/releases/tag/5.5.0),假设安装后的目录为Tesseract-OCR 下载中文语言包 [chi_sim.traineddata](https://github.com/tesseract-ocr/tessdata/tree/main)并放置在Tesseract-OCR\tessdata 将Tesseract-OCR目录拷贝至项目根目录下并重命名为tesseract 4. **构建 EXE**: 你可以使用 PyInstaller 将该项目打包成 EXE 文件。在项目根目录下运行以下命令: ```bash pyinstaller --onefile --add-data "resource;resource" --add-data "tesseract;tesseract" main.py ``` 这样会在 dist/ 文件夹中生成可执行文件。