# TextGenerator **Repository Path**: dlml2/TextGenerator ## Basic Information - **Project Name**: TextGenerator - **Description**: No description available - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-05-14 - **Last Updated**: 2024-07-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # TextGenerator - This is a tool for ocr dataset, text detection, fonts classification dataset generate. - 这是一个用来生成ocr数据,文字检测数据,字体识别的很方便的工具 ## 实现的功能: - 生成基于不同语料的,不同字体、字号、颜色、旋转角度的文字贴图 - 支持多进程快速生成 - 文字贴图按照指定的布局模式填充到布局块中 - 在图像中寻找平滑区域当作布局块 - 支持文字区域的图块抠取导出(导出json文件,txt文件和图片文件,可生成voc数据,ICDAR_LSVT数据集格式!) - 支持每个文字级别的标注(存入了lsvt的json文件中) - 支持用户自己配置各项生成配(图像读取,生成路径,各种概率) ## 效果预览 ### 生成图片示例: ![](img/pic_7f6cb78368edaf8347a8f0ce7e5a46c2df4f3ddd.jpg) ### 文字贴图示例: ![](img/fragment_6fc1b6ac180755dea3dfe711550251708b5e2ce519.jpg) ![](img/fragment_178b7da018e0d84c80b1455be4cc099bc68a07271.jpg) ![](img/fragment_ca71322eec0332fb3f6bb2a213c22f4a183c69da7.jpg) ![](img/fragment_f712bd7187d446b5fd5daf0ee0c6cb33ad26f98710.jpg) ### 旋转矩形示例 ![](img/rotate_rect.png) ### 单个文字包围框示例 ![](img/char_box.png) ### 使用方式 - 环境安装(Python3.6+,建议使用conda环境) ``` # step 1 pip install requirements.txt # step 2 sh make.sh ``` - 编辑配置文件`config.yml`(可选) - 执行生成脚本 ``` python3 run.py ``` - 生成的数据 生成的数据存放在`config.yml`中的`provider> layout> out_put_dir`指定的目录下。