温馨提示×

python如何捕捉屏幕上的文字

小亿
197
2023-10-17 02:32:41
栏目: 编程语言

要捕捉屏幕上的文字,你可以使用Python中的pytesseract库。pytesseract是一个OCR(光学字符识别)库,可以用于提取图像中的文字。

首先,确保你已经安装了pytesseract库。你可以使用以下命令在命令提示符或终端中安装它:

pip install pytesseract

然后,你需要安装并配置tesseract OCR引擎。你可以在https://github.com/tesseract-ocr/tesseract下载并安装它。

以下是一个示例代码,演示如何使用pytesseract捕捉屏幕上的文字:

import pyautogui
import pytesseract
# 设置tesseract OCR引擎的路径,如果你的安装路径不同,请相应修改
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files/Tesseract-OCR/tesseract.exe'
# 使用pyautogui模块截取屏幕上的一部分图像
image = pyautogui.screenshot(region=(100, 100, 300, 300))
# 将截取的图像保存为临时文件
image_path = 'temp.png'
image.save(image_path)
# 使用pytesseract识别图像中的文字
text = pytesseract.image_to_string(image_path)
# 输出识别到的文字
print(text)
# 删除临时文件
os.remove(image_path)

此代码将在屏幕上的(100, 100)位置开始,截取300x300像素大小的图像。然后,它将图像保存为临时文件,并使用pytesseract进行OCR处理,提取其中的文字。最后,它会输出识别到的文字。

请注意,这个示例代码假设你已经安装了pytesseract和tesseract OCR,并且指定了正确的tesseract_cmd路径。如果你的安装路径不同,请相应修改该路径。

0