OCR识别主要有以下步骤:
1、图文输入:是指通过输入设备将文档输入到计算机中,也就是实现原稿的数字化。现在用得比较普遍的设备是扫描仪。文档图像的扫描质量是OCR软件正确识别的前提条件。恰当地选择扫描分辨率及相关参数,是保证文字清楚、特征不丢失的关键。此外,文档尽可能地放置端正,以保证预处理检测的倾斜角小,在进行倾斜校正后,文字图像的变形就小。这些简单的操作,会使系统的识别正确率有所提高。反之,由于扫描设置不当,文字的断笔过多可能会分检出半个文字的图像。文字断笔和笔画粘连会造成有些特征丢失,在将其特征与特征库比较时,会使其特征距离加大,识别错误率上升。
可以通过以下方法实现初级OCR识别。
OpenCV示例:链接 用到了Neumann L., Matas J.: Real-Time Scene Text Localization and Recognition, CVPR 2012论文提到的算法以及tesseract工具。
tesseract是一个开源的OCR开发工具,之前由google发布,现在放在Github上, http://link.zhihu.com/?target=https%3A//github.com/tesseract-ocr/tesseract。
在Linux上安装,可以参考:ubuntu安装教程链接http://link.zhihu.com/?target=http%3A//miphol.com/muse/2013/05/install-tesseract-ocr-on-ubunt.html,CentOS安装教程链接http://link.zhihu.com/?target=http%3A//my.oschina.net/iceman/blog/40771。
在window系统上,使用Visual Studio进行编译安装,可以参考:使用VS2013安装教程链接http://link.zhihu.com/?target=http%3A//m.blog.csdn.net/article/details%3Fid%3D50616889,
基于VS2012和VS2013的tesseract工程文件放在:使用VS2012安装教程链接http://link.zhihu.com/?target=https%3A//github.com/jakesays/tesseract-vs2012, 使用VS2013安装教程链接http://link.zhihu.com/?target=https%3A//github.com/tesseract4java/tesseract-vs2013。
在上述文件安装完成后,就可以得到最终的文字检测和识别结果了:
哪款好仁者见仁,一般的OCR可以满足证件识别需求,但是对于大量OCR识别则需要专业的研发团队。
联系客服