Tesseract是一個流行的OCR(Optical Character Recognition,光學字符識別)庫,通俗來說就是文本識別。Tesseract最初由HP(就是惠普啦)在1985年開始研發,后面貌似就沒啥太重大的進展了;直到2005年HP將Tesseract開源,2006年開始交給Google維護。
Tesseract在進入3.0版本后各方面功能都有了長足的發展,尤其是3.02.02版本開始提供C-API,使得通過動態鏈接庫與其他編程語言混合開發成為了可能。
安裝Tesseract
首先安裝Tesseract,參考官方wiki。Linux下直接通過包管理器安裝(如apt-get install tesseract);Windows下3.02之后版本不提供安裝包,但有一個3.05版的非官方安裝包,點擊直接下載,安裝記得配置環境變量,C:\Program Files (x86)\Tesseract-OCR,這個是默認安裝地址,環境變量里添加這個即可。
安裝完成后在shell中輸入
Bash
tesseract -v
即可看到版本信息
image.png
參考地址:
https://www.polarxiong.com/archives/python-pytesser-tesseract.html
tesseract下載地址:https://github.com/UB-Mannheim/tesseract/wiki