相信很多戰(zhàn)友在收集素材的過程中,會(huì)積累到一些含有文字的圖片資料。這張圖片也許是制作很精美的一首詩,也許是手機(jī)拍的一段重要文字……在我們寫作的時(shí)候,想要用這些圖片中的文字,通常就會(huì)照著圖片手打一遍。這樣做會(huì)花很多時(shí)間,而且也容易出錯(cuò)。
如何很快地將圖片中的文字復(fù)制出來,以文本形式導(dǎo)出呢?
OCR軟件很好地解決了這個(gè)問題。
OCR的英文全稱是Optical character recognition,直譯過來就是光學(xué)字符識(shí)別。更加詳細(xì)的介紹在百度和谷歌上有很多,作為處理素材的我們,最好的方式還是先用起來。這里粽子君會(huì)介紹3款OCR軟件,希望戰(zhàn)友在處理圖片素材的時(shí)候能提高效率。
一、 微軟的Onenote
在遇到Onenote之前,粽子君應(yīng)對(duì)圖片里面文字的辦法,就是照著圖片打一遍。當(dāng)時(shí)會(huì)安慰自己,這樣還可以加深一些印象呢。當(dāng)我第一次用Onenote把圖片中那么長的文字幾秒鐘導(dǎo)出來,對(duì)于微軟頓時(shí)充滿敬意。后來再遇到圖片,主要就是用Onenote來處理了
具體的操作方法非常簡單:
1.導(dǎo)入圖片
操作方法和在word中一樣,只要將圖片復(fù)制后直接在里面粘貼就好了。
這里注意的是,最好將圖片預(yù)先剪切一下,去除掉無用的信息,否則會(huì)影響識(shí)別的效果。
2.復(fù)制圖片到文本
將光標(biāo)移動(dòng)到圖片位置,右擊鼠標(biāo),在出現(xiàn)的菜單中選擇“復(fù)制圖片到文本(E)”
3.導(dǎo)出文本
新建一個(gè)文本文件(比如這里用了印象筆記文件),粘貼上去即可
從圖片③可以看到,此次導(dǎo)出的文本沒有錯(cuò)別字。唯一的問題是格式多了許多原先沒有的換行符,看起來就是分了很多段,只要把這些換行符刪掉就好了。
那么處理紙質(zhì)書拍照的結(jié)果如何呢?
下面是手機(jī)拍的吳軍老師《智能時(shí)代》的一頁,上面還加了標(biāo)記和下劃線。
從導(dǎo)出結(jié)果看:
(1) 圓框圈中的一段沒有出現(xiàn)錯(cuò)別字
(2)手寫的五角星和下劃線沒有產(chǎn)生任何影響
(3)每兩行文字之間有一個(gè)空行,需去除
之所一個(gè)將Onenote放在第一來寫,因?yàn)樗腥缦聨讉€(gè)好處:
a.操作簡單(包含在Office套餐里,無需另外安裝)
b.導(dǎo)入圖片方便而且很快
c.識(shí)別速度極快
d.文本導(dǎo)出方便
當(dāng)然它也存在如下缺點(diǎn):
a.對(duì)于復(fù)雜圖片識(shí)別率較低(比如思維導(dǎo)圖)
b.沒有段落劃分的問題
如果使用的目的僅僅是寫作素材的收集和處理的話,Onenote基本是夠用了。所以,這是粽子最常用的,也是這里最推薦的一款軟件。
最后要說到版本問題,這里粽子用的是Office 2016版的,不過看網(wǎng)上的介紹從Office 2007就可以實(shí)現(xiàn)這個(gè)功能了。當(dāng)然,有些戰(zhàn)友出于各種原因沒有使用Onenote的,有沒有其他方法呢?當(dāng)然是有的,下面就介紹2款。
二、萬能掃描王
萬能掃描王就是CamScanner,它的強(qiáng)大在于它的掃描功能,通過拍照可以很好地將任何文字或者圖形保存為PDF格式的文件。
也許有些戰(zhàn)友還不知道它也有很好用的OCR功能。
這里粽子還是用之前的兩張圖片來進(jìn)行演示,具體步驟如下:
1.圖片導(dǎo)入
從手機(jī)客戶端上傳這個(gè)圖片,保存后就會(huì)上傳到云端,這樣就可以在網(wǎng)頁版中打開。
2.文字識(shí)別
由于這個(gè)軟件沒有PC版,在電腦上處理需要打開網(wǎng)絡(luò)版的掃描王。在里面找到上傳的文件并打開,點(diǎn)擊右下方的OCR選項(xiàng),會(huì)即刻得到識(shí)別的結(jié)果:
3.導(dǎo)出文本
從識(shí)別結(jié)果可以看出,里面有很多原先沒有的“< br >”字符,這個(gè)在手機(jī)客戶端里面就是換行符。需要做的就是直接將整個(gè)文本復(fù)制到word里,將“< br >”字符整體刪除掉。結(jié)果如下:
用同樣的方法對(duì)手機(jī)拍照的照片進(jìn)行處理,結(jié)果如下:
從最終結(jié)果可以看到,會(huì)出現(xiàn)幾個(gè)明顯的錯(cuò)誤(還出現(xiàn)了日文),但準(zhǔn)確率還可以接受的。對(duì)照?qǐng)D片將錯(cuò)誤的地方改正,會(huì)比直接手抄快很多。
這里要注明的是,萬能掃描王的OCR功能是要付費(fèi)的,一個(gè)月30元左右。不過好消息是,第一次用手機(jī)安裝注冊(cè)后,會(huì)自動(dòng)擁有三個(gè)月的免費(fèi)使用權(quán)限。所以,可以有三個(gè)月的時(shí)間決定是否需要這個(gè)軟件。下面貼上下載鏈接:
三、Abbyy Finereader
最后介紹的這一款,可以說是OCR里面最好的軟件,官網(wǎng)上介紹的識(shí)別準(zhǔn)確率為99.8%,關(guān)于它的褒獎(jiǎng),可以瀏覽知乎上OCR相關(guān)問題排名第一的回答:
OCR 中文識(shí)別用哪種軟件識(shí)別率比較高?
相對(duì)于前兩款軟件,這款軟件更加專業(yè)化,可以直接根據(jù)圖片文件導(dǎo)出Excel表格,這是Onenote和萬能掃描王不能比的。
也正因?yàn)槿绱耍@款軟件也不便宜。目前官網(wǎng)上最普通的版本,也要¥508。好在這款軟件可以直接在官網(wǎng)下載試用,第一個(gè)月是免費(fèi)試用的,粽子君就處在試用階段~
如上是軟件下載的網(wǎng)站,軟件的安裝很方便,只要按照指引一步步裝就好了。下面主要談?wù)勈褂眯Ч?/p>
1.導(dǎo)入圖片
這里先點(diǎn)擊文件后,點(diǎn)擊在OCR編輯器中打開:
2.圖片識(shí)別
選擇好圖片,確認(rèn)后,就會(huì)自動(dòng)開始識(shí)別:
很多次掃描完后,都會(huì)出現(xiàn)以下這個(gè)提示,根據(jù)這個(gè)提示調(diào)整分辨率后可以提高識(shí)別的準(zhǔn)確率:
這里還要注意一點(diǎn)的是,一定要根據(jù)目標(biāo)內(nèi)容選定好語言,這一點(diǎn)對(duì)于識(shí)別的準(zhǔn)確性有很大的影響。
3.識(shí)別文本處理
大概十幾秒鐘會(huì)得到識(shí)別的結(jié)果,在“查看”里面選擇“僅顯示文字面板”,可以看到此次識(shí)別得出的完整文本:
中間用紅框標(biāo)注的部分就是識(shí)別完成后的文本,可以看出,不僅沒有出現(xiàn)錯(cuò)誤,而且很好地保持了原有的分段。
用同樣的方法,對(duì)手機(jī)照片的處理結(jié)果如下:
由于該內(nèi)容較長,通過右上方的“發(fā)送到Word”選項(xiàng),在word中進(jìn)行處理,結(jié)果如下:
可以看出,Abbyy可以很好的保持照片的原貌,甚至粽子當(dāng)時(shí)畫的五角星都保存了下來。不過同時(shí),自己畫的下劃線對(duì)識(shí)別結(jié)果產(chǎn)生了一定的影響,造成了一些多余的點(diǎn)和線條。除去劃線部分產(chǎn)生的影響,Abbyy掃描結(jié)果沒有出現(xiàn)錯(cuò)別字。
這里也可以看出,Abbyy識(shí)別的敏感性更強(qiáng),對(duì)許多細(xì)微的信息都能很好地捕捉到。如果對(duì)于識(shí)別能力有較高要求的話,這個(gè)軟件是必須推薦的。
這里就是粽子介紹的三款OCR軟件,希望對(duì)大家有用!