為了更直觀的理解語音識別的輸入和輸出,做了timit在線識別的實驗,根據(jù)@bbzz2博主的分享http://m.blog.csdn.net/lijin6249/article/details/51838936,對timit數(shù)據(jù)集進行了實驗,步驟相同,其中要感謝kaldi群中魏同學無私的幫助。
首先要安裝portaudio;
$cd?~/kaldi-trunk/tools/
$./install_portaudio.sh
然后編譯onlinebin
$cd?~/kaldi-trunk/src/onlinebin/
$make
運行./run.sh腳本發(fā)現(xiàn)出現(xiàn)3個錯誤:
1:找不到audio/trans.txt:沒有那個文件或目錄
解決辦法,在audio文件夾下創(chuàng)建一個空的trans.txt ?touch trans.txt
2.
WaveData:?expected?RIFF?or?RIFX,?got?NIST
這個錯誤是wav格式問題
kaldi/tools/sph2pipe_v2.5$?vim?0readme.1st
在這個目錄下打開0readme.1st
里面有編譯步驟
如果你已經(jīng)有
有sph2pipe這個文件,就不用編譯了,就是綠色這個
./sph2pipe?-f?rif?test_audio.wav?test_out.wav
test_audio.wav這個文件就是你的測試文件
要指定目錄