发布信息

基于chineseocr的中文OCR开源项目(2.github开源)

作者:软荐小编      2023-09-14 09:11:16     138

1.cnocr

cnocr 是一个用于英文 OCR 的 Python3 包。 cnocr自带经过训练的识别模型ocr软件识别,安装后可以直接使用。

cnocr主要针对排版简单的彩色打印文本图片,如截图、扫描等。cnocr目前的外部文本检查和分支模块无法处理复杂的文本布局和定位。 如果要用于场景文本图像的识别,需要与其他场景文本检测引擎配合使用。

cnocr是Python3下的中英文OCR包。 通过pip命令安装后可以直接使用。

pip install cnocr==1.1.0

V1.1.0对代码进行了重大修改ocr软件识别,重新绘制了大部分训练代码,并生成了越来越难的训练和测试数据。 与之前版本的模型相比,训练后的模型的准确率有了显着的提高,尤其是对于英语短语的识别。

主要变化如下:

例子

识别软件图标_识别软件有哪些_ocr软件识别

配备即用型型号

cnocr的OCR模型可以分为两个阶段:第一阶段是获取OCR图像的局部编码向量,第二阶段是对局部编码向量进行序列学习,得到序列编码向量。 当前两个阶段包括以下模型:

本地编码模型(embmodel)

2. 序列编码模型(seqmodel)

cnocr目前包含以下可以直接使用的模型。 训练好的模型放在cnocr-models项目中,可以免费下载使用:

识别软件有哪些_ocr软件识别_识别软件图标

github:

2.英文OCR开源项目是chineseocr_lite

目前最常用的英文OCR开源项目是chineseocr,它基于YOLOV3和CRNN实现英文自然场景文本检查和识别。 ​​目前该项目拥有2500颗星。 本文介绍另一个新的开源英文OCR项目,该项目是在chineseocr的基础上改进的,是一个超轻量级的英文字符识别项目。

项目地址:

chineseocr_lite项目表示,与chineseocr相比,它使用了轻量级骨干网络PSENet、轻量级CRNN模型和行文本方向分类网络AngleNet。 支持横向文本识别和ncnn推理。 psenet(8.5M)+crnn(6.3M)+anglenet(1.5M)的总模型只有17M。

目前chineseocr_lite支持任意方向的文本检查,识别时会手动确定行文本的方向。 我们可以先看一下项目作者给出的功效示例:

识别软件有哪些_ocr软件识别_识别软件图标

ocr软件识别_识别软件有哪些_识别软件图标

可以看到,chineseocr_lite无论是竖排还是横排文字的识别都有不错的效果,但是它提供的交互式网页可以直接在页面上插入图片并调用识别模型。

相关内容 查看全部