# CommonOcrExtractor

**Repository Path**: yun_shangluo/CommonOcrExtractor

## Basic Information

- **Project Name**: CommonOcrExtractor
- **Description**: 可视化自定义ocr模板、结构化数据抽取、通用票据ocr后处理、mask矫正
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 0
- **Created**: 2021-05-26
- **Last Updated**: 2021-10-27

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# ocr_extractor

# [票据识别主工程](https://github.com/verarong/invoice_ocr) 

# 处理流程

![](http://www.weikunt.cn:7788/selif/qfazrl0x.png)

# 实现功能

ocr通用后处理，可视化结构化数据提取器

1.支持labelme进行需要提取字段的可视化标注

2.支持定义各字段的合法范围，并自动生成mask，对ocr结果点乘遮罩

3.实现原理为编辑距离的相似度和各字段相对位置投票，使用状态机控制

4.自动文本框切分，有效解决相近字段文本框在文本定位时框在一起的情况

5.支持配置转行等特殊处理

6.支持配置输出字段的特定样式化


# 使用方式

作为子项目导入ocr主项目：from app.extractor.information_extraction import DataHandle

将ocr的所有文本框及识别结果传入DataHandle一键食用：

state, predict = DataHandle(ocr_score, box, score_, invoice_type, invoice_direction_filter,
                                                True).extract()