# image-reader **Repository Path**: qingfeng0512/image-reader ## Basic Information - **Project Name**: image-reader - **Description**: 使用 Tesseract.js 进行图片 OCR 识别,并调用 AI 大模型(MiniMax)整理输出结果 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-17 - **Last Updated**: 2026-04-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: ocr, tesseract ## README # Tesseract OCR 图片识别脚本 使用 Tesseract.js 进行图片 OCR 识别,并调用 AI 大模型(MiniMax)整理输出结果。 ## 功能特点 - 🔍 Tesseract.js OCR 识别(中英文) - 🧠 AI 大模型智能整理结果 - 📝 自动修正 OCR 识别错误 - 💾 结果保存至 output 目录 ## 快速开始 ### 1. 安装依赖 ```bash npm install ``` ### 2. 配置环境变量 复制配置模板: ```bash cp .env.example .env ``` 编辑 `.env` 文件,填入你的 MiniMax API Key: ```bash # MiniMax API 配置 # API Key MINIMAX_API_KEY=your_api_key_here # 模型名称 MINIMAX_MODEL=MiniMax-M2.7 # API 端点 MINIMAX_BASE_URL=https://api.minimaxi.com/anthropic/v1 ``` ### 3. 运行脚本 ```bash node ocr-verify.js <图片路径> ``` **示例:** ```bash # 识别本地图片 node ocr-verify.js ./test.png # 识别绝对路径图片 node ocr-verify.js /Users/xx/Pictures/护照1.png ``` ## 输出结果 识别结果会自动保存到 `output/` 目录: ``` output/ ├── 护照1_result.txt └── test_result.txt ``` ## 项目结构 ``` tesseract-verify/ ├── .env # 环境配置(已加入 .gitignore) ├── .env.example # 配置模板 ├── .gitignore # Git 忽略文件 ├── ocr-verify.js # 主脚本 ├── output/ # 识别结果输出目录 ├── chi_sim.traineddata # 中文 OCR 识别数据 ├── eng.traineddata # 英文 OCR 识别数据 └── package.json ``` ## 依赖 - [tesseract.js](https://github.com/naptha/tesseract.js) - OCR 识别 - [dotenv](https://github.com/motdotla/dotenv) - 环境变量管理 ## License MIT