2016 - 2024

感恩一路有你

Win10 Python 3 使用OCR

浏览量:2703 时间:2024-02-04 12:08:18 作者:采采

在本篇经验中,我们将介绍如何在Win10上使用Python 3编程环境进行OCR操作。同时,我们也会介绍如何安装Google Tesseract-OCR及其对应的Python包。

安装Google Tesseract-OCR和Python包

要在Python中使用OCR功能,通常可以使用Google的Tesseract。首先,在命令行中输入以下命令`pip search tesseract`,可以查看与Tesseract相关的所有包。其中,pytesseract是一个Google Tesseract的Python封装。我们可以通过`pip install`命令来安装它。

然而,如果我们直接运行PyPI上的示例代码,可能会遇到TesseractNotFoundError错误。这是因为仅仅安装了封装器是不够的,还需要安装Tesseract本身。幸运的是,Tesseract的安装非常简单。我们可以参考Tesseract-OCR的GitHub页面或其Wiki中的说明进行安装。

安装完成后,我们进入Tesseract-OCR的主目录,即tesseract可执行文件所在的路径。接下来,我们需要在Python代码中添加设置Tesseract路径的代码,并重新运行程序。这样,我们就可以看到图片中的文字被成功识别并输出了。

将Tesseract路径添加到环境变量

为了方便起见,我们可以将Tesseract的路径添加到系统的环境变量中,这样就不用每次都手动指定路径了。在系统属性的环境变量设置中,我们可以将Tesseract的路径添加到Path变量中。

完成以上步骤后,需要重新启动终端(如果是使用VSCode,则重启VSCode),以使新的环境变量生效。然后,我们就可以运行Python代码,顺利地使用Tesseract进行OCR操作了。

此外,由于Tesseract已经被添加到Path变量中,我们还可以直接在命令行中使用Tesseract。只需输入`tesseract`即可查看帮助信息。

通过以上步骤,我们成功地在Win10上搭建了Python 3环境,并学会了如何使用Tesseract-OCR进行OCR操作。希望这篇文章对你有所帮助!

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。