ocr文字识别 有用过tesseractOCR字符识别的吗?怎么识别率那么低?
浏览量:2847
时间:2021-03-13 12:37:59
作者:admin
有用过tesseractOCR字符识别的吗?怎么识别率那么低?
属于模式识别。OCR技术是指文本识别技术,简而言之,就是从一幅图片中分解出一个文本文件的过程,以及所使用的各种算法。例如,验证码识别就是一个很好的简单例子。许多网页都有验证码图像,可以通过OCR识别技术读出。支持BMP、TIF、JPG、PDF等灰度、彩色、黑白图像文件;能识别简体、繁体、英文;具有简单易用的表格识别功能;具有TXT、RTF、HTM、XLS等多种输出格式,并具有“查看并获取”页面恢复功能。增加了打开和识别PDF文件的功能。它支持文本PDF的直接转换和图像PDF的OCR识别。它可以通过OCR将PDF文件转换成编辑文档,也可以通过格式转换将文本PDF文件转换成RTF文件或文本文件。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。