温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

CentOS 7中怎么部署 tesseract-ocr

发布时间:2021-06-21 15:30:47 来源:亿速云 阅读:500 作者:Leah 栏目:大数据

CentOS 7中怎么部署 tesseract-ocr,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

官方地址 github

yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/

若提示 yum-config-manager: command not found 执行以下语句

yum -y install yum-utils

之后继续执行

sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key
yum update
yum install tesseract
yum install tesseract-langpack-deu

语言包新增

官方有专门的语言包目录 语言包

cd /usr/share/tesseract/4/tessdata
# 若没有wget 就 yum install wget
wget https://raw.githubusercontent.com/tesseract-ocr/tessdata/master/chi_sim.traineddata

执行命令

# tesseract {图片路径} {输出文件,默认后缀.txt} -l {指定语言包,chi_sim为简体中文}
tesseract 1.jpg txt -l chi_sim

控制台打印

Tesseract Open Source OCR Engine v4.1.0 with Leptonica
Warning: Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 534

输出文件

[root@localhost ~]# ls
1.jpg  anaconda-ks.cfg  txt.txt
# 上面 txt.txt 就是输出的文件

输出文件内容

注:带花括号的为我认为替换掉内容,实际是有内容输出

《 账 单 详 情

露 A(esot 〉
-1,500.00
交 易 成 功
付 款 方 式 余 额 >
转 账 备 注 转 账
对 方 账 户 {户名} {手机号}
创 建 时 间 2019-10-10 16:08

订 单 号 _{单号第一行}

889701
账 单 分 类 转 账 充 值 >
标 签 和 备 注 添 加 >
查 看 往 来 记 录 >

申 请 电 子 回 单 >

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注亿速云行业资讯频道,感谢您对亿速云的支持。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI