99国产精品久久久久久久成人热,飘雪日本高清免费观看电视剧,韩国三级《吸奶头》电影

1.使用tesseract-ocr

最早由HP公司研發的一個開源文字識別項目，項目地址為：https://github.com/tesseract-ocr/tesseract/wiki
①本次在win7_64位系統上安裝，可使用以下鏈接：
主程序:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.0.0-alpha.20180109.exe
語言包:https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata

若更新，可參照下列圖片找到鏈接：

image.png

②下載完主程序和語言包后，直接點擊安裝，全程默認下一步即可。安裝完成后，將安裝地址加入系統路徑，默認安裝地址為：C:\Program Files (x86)\Tesseract-OCR;

③打開CMD命令，然后輸入tesseract -v,如果顯示版本號，則主程序安裝完成。

image.png

④將語言包放在以下文件夾中：
C:\Program Files (x86)\Tesseract-OCR\tessdata

⑤新建系統變量：
變量名是TESSDATA_PREFIX，變量值是C:\Program Files (x86)\Tesseract-OCR\tessdata;

image.png

變量生效可能需要重啟，想快速搞定，可以直接輸入SET TESSDATA_PREFIX=C:\Program Files (x86)\Tesseract-OCR\tessdata

⑥設置完成，可以找個范例試試，這里講需要識別的內容設置為123.jpg，放在C:\Program Files (x86)\Tesseract-OCR處，并打開cmd命令，輸入：
tesseract.exe 123.jpg 1 -l chi_sim

image.png

若出現上述截圖，運行成功，可以看到文件夾下生成了一個1.txt文件，記載著識別效果。

image.png

總的來說，數字和英文識別率較高，但是中文的識別率較低。

⑦接下來安裝pytesseract，依賴于PIL或Pillow。

image.png

code2.png

安裝好后就可以試驗一下了：

from PIL import Image
import pytesseract
img = Image.open('code2.png')                   #打開圖片，目前圖片放在與tesseract同樣的目錄下
img = img.convert('L')                          #使用convert方法轉換成灰度圖像，識別率更高。也可以省略
print(pytesseract.image_to_string(img))         #轉換成字符串輸出
img.show()                                      #可以把處理后的圖片顯示出來

image.png

⑧結果嘛，最后一個5被識別成“S”，其他都還是正確的。
那是否沒有辦法了呢？或許我們可以試試二值化處理。

from PIL import Image
import pytesseract
img = Image.open(r'C:\Program Files (x86)\Tesseract-OCR\code2.png')
img = img.convert('L')
#img.show()
print(pytesseract.image_to_string(img))


#二值化處理
threshold = 150            #定義臨界值
table = []
for i in range(256):
    if i < threshold:
        table.append(0)    #小于臨界值的，都定義為0
    else:
        table.append(1)    #大于臨界值的，都定義為1
out = img.point(table,"1")  #圖像模式為"L"時，point方法對應的第二個參數設為”1“。第一個參數table被規定為一個擁有256個值的列表。
out.show()
print(pytesseract.image_to_string(out))

結果竟然成功了。

不過，Tesseract僅對容易區分、沒有干擾的取現或字符有較好效果，復雜情況下的識別率還有待提高。

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

八. OCR識別的方法：tesseract-ocr

八. OCR識別的方法：tesseract-ocr

1.使用tesseract-ocr

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

八. OCR識別的方法：tesseract-ocr

1.使用tesseract-ocr

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频