# image-reader

**Repository Path**: qingfeng0512/image-reader

## Basic Information

- **Project Name**: image-reader
- **Description**: 使用 Tesseract.js 进行图片 OCR 识别，并调用 AI 大模型（MiniMax）整理输出结果
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-04-17
- **Last Updated**: 2026-04-17

## Categories & Tags

**Categories**: Uncategorized

**Tags**: ocr, tesseract

## README

# Tesseract OCR 图片识别脚本

使用 Tesseract.js 进行图片 OCR 识别，并调用 AI 大模型（MiniMax）整理输出结果。

## 功能特点

- 🔍 Tesseract.js OCR 识别（中英文）
- 🧠 AI 大模型智能整理结果
- 📝 自动修正 OCR 识别错误
- 💾 结果保存至 output 目录

## 快速开始

### 1. 安装依赖

```bash
npm install
```

### 2. 配置环境变量

复制配置模板：

```bash
cp .env.example .env
```

编辑 `.env` 文件，填入你的 MiniMax API Key：

```bash
# MiniMax API 配置
# API Key  
MINIMAX_API_KEY=your_api_key_here

# 模型名称
MINIMAX_MODEL=MiniMax-M2.7

# API 端点
MINIMAX_BASE_URL=https://api.minimaxi.com/anthropic/v1
```

### 3. 运行脚本

```bash
node ocr-verify.js <图片路径>
```

**示例：**

```bash
# 识别本地图片
node ocr-verify.js ./test.png

# 识别绝对路径图片
node ocr-verify.js /Users/xx/Pictures/护照1.png
```

## 输出结果

识别结果会自动保存到 `output/` 目录：

```
output/
├── 护照1_result.txt
└── test_result.txt
```

## 项目结构

```
tesseract-verify/
├── .env                  # 环境配置（已加入 .gitignore）
├── .env.example          # 配置模板
├── .gitignore            # Git 忽略文件
├── ocr-verify.js         # 主脚本
├── output/               # 识别结果输出目录
├── chi_sim.traineddata   # 中文 OCR 识别数据
├── eng.traineddata       # 英文 OCR 识别数据
└── package.json
```

## 依赖

- [tesseract.js](https://github.com/naptha/tesseract.js) - OCR 识别
- [dotenv](https://github.com/motdotla/dotenv) - 环境变量管理

## License

MIT