TextGenerator
This is a tools for ocr dataset, text detection, fonts classification dataset generate.
这是一个用来生成ocr数据,文字检测数据,字体识别的最方便的工具
实现的功能:
生成基于不同语料的,不同字体、字号、颜色、旋转角度的文字贴图
支持多进程快速生成
文字贴图按照指定的布局模式填充到布局块中
在图像中寻找平滑区域当作布局块
支持文字区域的图块抠取导出(导出json文件,txt文件和图片文件,可生成voc数据,ICDAR_LSVT数据集格式!)
支持每个文字级别的标注(存入了lsvt的json文件中)
支持用户自己配置各项生成配(图像读取,生成路径,各种概率)