温馨提示×

python怎么提取图片中的文字

小亿
169
2023-08-12 03:26:25
栏目: 编程语言

要提取图片中的文字,可以使用Python的第三方库tesseract-ocr。Tesseract是一个开源的OCR引擎,可以识别多种语言的文字。

首先,安装tesseract-ocr库和pytesseract库:

pip install tesseract-ocr
pip install pytesseract

然后,使用以下代码提取图片中的文字:

import pytesseract
from PIL import Image
# 打开图片
image = Image.open('image.jpg')
# 使用tesseract识别图片中的文字
text = pytesseract.image_to_string(image)
# 打印识别结果
print(text)

以上代码将会打开名为image.jpg的图片,使用tesseract-ocr识别图片中的文字,并将识别结果打印出来。

请注意,要使代码正常运行,需要确保tesseract-ocr已经正确安装,并且指定的图片文件存在,并且包含清晰可见的文字。有时候,对于复杂的图片或低质量的图片,识别结果可能不准确。

0