# PaddleOCRSharp
**Repository Path**: aslyr/paddle-ocrsharp
## Basic Information
- **Project Name**: PaddleOCRSharp
- **Description**: 本项目是一个基于PaddleOCR的C++代码修改并封装的.NET的工具类库。包含文本识别、文本检测、基于文本检测结果的统计分析的表格识别功能,同时针对小图识别不准的情况下,做了优化,提高识别准确率。包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测。
- **Primary Language**: C#
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 39
- **Created**: 2022-02-07
- **Last Updated**: 2022-02-07
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# PaddleOCRSharp [版本更新记录](https://gitee.com/raoyutian/paddle-ocrsharp/blob/master/README_update.md)
# 介绍
本项目是一个基于PaddleOCR的C++代码修改并封装的.NET的工具类库。包含文本识别、文本检测、基于文本检测结果的统计分析的表格识别功能,同时针对小图识别不准的情况下,做了优化,提高识别准确率。包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测。
项目封装极其简化,实际调用仅几行代码,极大的方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别,同时提供不同的.NET框架使用,方便各个行业应用开发与部署。Nuget包即装即用,可以离线部署,不需要网络就可以识别的高精度中英文OCR。
本项目中PaddleOCR.dll文件是基于开源项目PaddleOCR的C++代码修改而成的C++动态库,基于opencv的x64编译而成的。
[百度飞桨PaddleOCR项目地址(码云)](https://gitee.com/paddlepaddle/PaddleOCR)
[百度飞桨PaddleOCR项目地址(GitHub)](https://github.com/paddlepaddle/PaddleOCR)
模型库支持轻量版(本项目)、服务器版模型库(更准确),可以自行更改模型库适用实际需求。
[百度飞桨PaddleOCR模型下载地址](https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.4/doc/doc_ch/models_list.md)
[百度飞桨windows下C++预测库下载地址](https://paddleinference.paddlepaddle.org.cn/user_guides/download_lib.html#windows)
**关于源码编译,建议采用vs2019及以上版本编译,如果遇到无法编译,请切换成release后再切换回debug即可。**
全部调用参数 [官方PaddleOCR参数](https://gitee.com/paddlepaddle/PaddleOCR/tree/release/2.4/deploy/cpp_infer)
```
#region 通用参数
///
/// 是否使用GPU,默认关闭
///
public byte use_gpu { get; set; } = 0;
///
/// GPU id,使用GPU时有效
///
public int gpu_id { get; set; } = 0;
///
/// 申请的GPU内存,使用GPU时有效
///
public int gpu_mem { get; set; } = 4000;
///
/// 使用线程数,默认2
///
public int numThread { get; set; } = 2;
///
/// 启用mkldnn加速,默认开启
///
public byte Enable_mkldnn { get; set; } = 1;
#endregion
#region 检测模型相关
///
/// 补白边,默认50,暂时没有用
///
public int Padding { get; set; } = 50;
///
/// 输入图像长宽大于960时,等比例缩放图像,使得图像最长边为960
///
public int MaxSideLen { get; set; } = 960;
///
/// DB后处理过滤box的阈值,如果检测存在漏框情况,可酌情减小
///
public float BoxScoreThresh { get; set; } = 0.5f;
///
/// 用于过滤DB预测的二值化图像,设置为0.-0.3对结果影响不明显
///
public float BoxThresh { get; set; } = 0.3f;
///
/// 表示文本框的紧致程度,越小则文本框更靠近文本
///
public float UnClipRatio { get; set; } = 1.6f;
///
/// DoAngle 默认1启用
///
public byte DoAngle { get; set; } = 1;
///
/// MostAngle 默认1启用
///
public byte MostAngle { get; set; } = 1;
///
/// 是否使用多边形框计算bbox score,false表示使用矩形框计算。矩形框计算速度更快,多边形框对弯曲文本区域计算更准确。
///
public byte use_polygon_score { get; set; } = 0;
///
/// 是否对结果进行可视化,为1时,会在当前文件夹下保存文件名为ocr_vis.png的预测结果。
///
public byte visualize { get; set; } = 0;
#endregion
#region 方向分类器相关
///
/// 启用方向选择器,默认关闭
///
public byte use_angle_cls { get; set; } = 0;
///
/// 方向分类器的得分阈值
///
public float cls_thresh { get; set; } = 0.9f;
#endregion
```
# 文件夹结构
```
Cpp //PaddleOCR.dll的头文件和库文件,方便C++调用PaddleOCR.dll
PaddleOCRLib //OCR运行需要的文件
|--inference //OCR的模型库文件夹
|--libiomp5md.dll //第三方引用库
|--mkldnn.dll //第三方引用库
|--mklml.dll //第三方引用库
|--opencv_world411.dll //第三方引用库
|--paddle_inference.dll //飞桨库
|--PaddleOCR.dll //基于开源项目PaddleOCR修改的C++动态库
PaddleOCRSharp //.NET封装库项目
PaddleOCRCppDemo //C++调用示例项目
PaddleOCRSharpDemo //.NET调用示例项目
```
[C++示例代码](https://gitee.com/raoyutian/paddle-ocrsharp/blob/master/PaddleOCRCppDemo/PaddleOCRCppDemo.cpp)
```
#include
#include
#include
#include "string"
#include
#include
using namespace std;
#pragma comment (lib,"PaddleOCR.lib")
extern "C" {
///
/// PaddleOCREngine引擎初始化
///
///
///
///
///
///
///
__declspec(dllimport) int* Initialize(char* det_infer, char* cls_infer, char* rec_infer, char* keys, OCRParameter parameter);
///
/// 文本检测
///
///
///
/// 返回结果
///
__declspec(dllimport) int Detect(int* engine, char* imagefile, LpOCRResult* pOCRResult);
///
/// 释放引擎对象
///
///
__declspec(dllimport) void FreeEngine(int* engine);
///
/// 释放文本识别结果对象
///
///
__declspec(dllimport) void FreeDetectResult(LpOCRResult pOCRResult);
};
std::wstring string2wstring(const std::string& s)
{
int len;
int slength = (int)s.length() + 1;
len = MultiByteToWideChar(CP_ACP, 0, s.c_str(), slength, 0, 0);
wchar_t* buf = new wchar_t[len];
MultiByteToWideChar(CP_ACP, 0, s.c_str(), slength, buf, len);
std::wstring r(buf);
delete[] buf;
return r;
}
int main()
{
LpOCRResult lpocrreult;
OCRParameter parameter;
/*parameter.enable_mkldnn = false;*/
char path[MAX_PATH];
GetCurrentDirectoryA(MAX_PATH, path);
string cls_infer(path);
cls_infer += "\\inference\\ch_ppocr_mobile_v2.0_cls_infer";
string rec_infer(path);
rec_infer += "\\inference\\ch_PP-OCRv2_rec_infer";
string det_infer(path);
det_infer += "\\inference\\ch_PP-OCRv2_det_infer";
string ocrkeys(path);
ocrkeys += "\\inference\\ppocr_keys.txt";
string imagefile(path);
imagefile += "\\test.jpg";
int* pEngine = Initialize(const_cast(det_infer.c_str()),
const_cast(cls_infer.c_str()),
const_cast(rec_infer.c_str()),
const_cast(ocrkeys.c_str()),
parameter);
int cout = Detect(pEngine, const_cast(imagefile.c_str()), &lpocrreult);
std::wcout.imbue(std::locale("chs"));
for (size_t i = 0; i < cout; i++)
{
wstring ss = (WCHAR*)(lpocrreult->pOCRText[i].ptext);
std::wcout << ss;
}
FreeDetectResult(lpocrreult);
FreeEngine(pEngine);
std::cin.get();
}
```
#.net使用示例
```
OpenFileDialog ofd = new OpenFileDialog();
ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
if (ofd.ShowDialog() != DialogResult.OK) return;
var imagebyte = File.ReadAllBytes(ofd.FileName);
Bitmap bitmap = new Bitmap(new MemoryStream(imagebyte));
OCRModelConfig config = null;
OCRParameter oCRParameter = new OCRParameter ();
//oCRParameter.use_gpu=1;当使用GPU版本的预测库时,该参数打开才有效果
OCRResult ocrResult = new OCRResult();
using (PaddleOCREngine engine = new PaddleOCREngine(config, oCRParameter))
{
ocrResult = engine.DetectText(bitmap );
}
if (ocrResult != null)
{
MessageBox.Show(ocrResult.Text,"识别结果");
}
```
# 喜欢的给个星,谢谢
# QQ交流群:318860399