前面幾篇文章在以iOS客戶端為例的情況下,大致說了kaldi部署在服務(wù)端的在線識別,以及kaldi在iOS項(xiàng)目中的本地識別。因?yàn)樗芯康臇|西最終都是要在實(shí)際的項(xiàng)目中或者產(chǎn)品中去使用,所以為了更好的看到自己所研究的東西的結(jié)果,我才做了前面的一些demo來實(shí)際的看到效果和使用情況。當(dāng)然后面還有好玩的,我都會發(fā)出實(shí)際應(yīng)用的demo出來。文章我還會繼續(xù)更新,因?yàn)楹竺婧猛娴倪€有聲紋識別,命令詞喚醒。
在線識別
在線識別簡單的理解就是將解碼器放在服務(wù)端,以kaldi為環(huán)境來識別。解碼這一塊kaldi也提供了文件解碼的例子,可以稍加改造用于實(shí)時流識別,當(dāng)然我也將改造后的解碼代碼放在前面的文章中,有需要的可以參考。
參考demo:https://github.com/andyweiqiu/SpeechRecognition
本地識別
這里的本地識別是將kaldi源代碼編譯成庫放到iOS或者Android項(xiàng)目中,以提供解碼的環(huán)境。當(dāng)然難點(diǎn)就是kaldi的編譯。解碼這一套都是通用的,不管是在線識別還是本地識別。我這里也提供了demo,有需要驗(yàn)證自己模型的,可以下載demo,在工程中直接替換模型文件,運(yùn)行,不用管其他實(shí)現(xiàn)。在運(yùn)行demo的過程中有任何問題可以直接聯(lián)系我。