# huaweicloud-solution-ocr **Repository Path**: HuaweiCloudDeveloper/huaweicloud-solution-ocr ## Basic Information - **Project Name**: huaweicloud-solution-ocr - **Description**: 此解决方案提供了一个开箱即用的自动文字识别解决方案,用户只需要将图片上传至华为云OBS桶里,即可自动进行文字识别,并将识别结果存放回OBS桶里,用户可直接从桶里获取对应文件识别内容。 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master-dev - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 1 - **Created**: 2022-03-21 - **Last Updated**: 2025-06-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README [TOC] **解决方案介绍** =============== 该解决方案基于华为云文字识别服务增值税发票识别与发票验真技术构建,可以应用于企业税务核算及内部报销、供应链发票核验、财税代理记账等场景,自动识别和录入增值税普票或专票等各字段信息,减少人工核算工作量,实现财税报销的自动化流程。同时,自动接入国家税务机关发票查验平台进行发票真伪核验,降低企业人力查验成本,防止税务合规风险。 解决方案实践详情页面:https://www.huaweicloud.com/solution/implementations/ocr.html **架构图** --------------- ![方案架构](./document/ocr-invoice-recognition-and-verification.png) **架构描述** --------------- 该解决方案会部署如下资源: 1. 创建用于上传和存储发票文件的OBS桶,企业业务系统将员工报销的发票图片或者电子发票PDF文件上传到该桶; 2. 创建用于存储发票识别与验真结果的OBS桶,企业业务系统定时从该桶中获取结果并处理; 3. 函数工作流:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通知函数服务调用文字识别服务,并将结果存放到指定的OBS桶; 4. 文字识别服务:提供发票识别与验真服务,识别用户上传的发票内容以及对接国税局系统进行真伪验证。 **组织结构** --------------- ``` lua huaweicloud-solution-ocr ├── ocr-invoice-recognition-and-verification.tf.json -- 资源编排模板 ├── functiongrap ├── ocr_app.py -- 函数文件 ``` **开始使用** --------------- 1、登录华为云[对象存储服务控制台](https://console.huaweicloud.com/console/?region=cn-north-4&locale=zh-cn#/obs/manager/buckets),查看自动创建的OBS桶列表: 图1 对象存储服务控制台 ![对象存储服务控制台](./document/readme-image-001.png) 2、选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件: 图2 上传待识别发票 ![上传待识别发票](./document/readme-image-002.png) 3、选择用于存放结果的“ocr-invoice-result-bucket”桶,即可自动获取该发票的识别与验真结果,以发票文件名称为前缀的JSON文件存储: 图3 获取识别结果文件 ![获取识别结果文件](./document/readme-image-003.png)