前面幾篇文章在以iOS客戶端為例的情況下,大致說了kaldi部署在服務端的在線識別,以及kaldi在iOS項目中的本地識別。因為所研究的東西最終都是要在實際的項目中或者產品中去使用,所以為了更好的看到自己所研究的東西的結果,我才做了前面的一些demo來實際的看到效果和使用情況。當然后面還有好玩的,我都會發出實際應用的demo出來。文章我還會繼續更新,因為后面好玩的還有聲紋識別,命令詞喚醒。
在線識別
在線識別簡單的理解就是將解碼器放在服務端,以kaldi為環境來識別。解碼這一塊kaldi也提供了文件解碼的例子,可以稍加改造用于實時流識別,當然我也將改造后的解碼代碼放在前面的文章中,有需要的可以參考。
參考demo:https://github.com/andyweiqiu/SpeechRecognition
本地識別
這里的本地識別是將kaldi源代碼編譯成庫放到iOS或者Android項目中,以提供解碼的環境。當然難點就是kaldi的編譯。解碼這一套都是通用的,不管是在線識別還是本地識別。我這里也提供了demo,有需要驗證自己模型的,可以下載demo,在工程中直接替換模型文件,運行,不用管其他實現。在運行demo的過程中有任何問題可以直接聯系我。