語音界面設計后臺技術隨手記(一)

剛參加完關于aiui的一個技術培訓,對于什么是aiui有了進一步的認知,之前的一些問題也獲得了解答,很好,需要記錄下來。

首先AIUI是一個語音系統,主要分為AIUI Client和Server兩部分。主工作流程是:客戶端拿到用戶語音輸入后就發送到服務端進行語音識別,語義斷句,包括場景拒識;之后將處理后的信息傳送到Agent端進行語義理解,對話管理,最終給出回復結果再傳送回客戶端。其中代號為雅典娜服務系統是核心。

中間有介紹一些專業術語,例如文法,貼弧模塊,文法貼弧等,不懂。大概意思是通過這種技術能夠更好的理解語意。

解答了之前疑惑的問題是:是不是在撰寫語料的時候,都需要把每一條寫全?例如,在家庭看電視的場景中,通過語音技術找到一部想看的影視劇,我們需要撰寫很多類似這樣的語料:“我想看電影”“看部電影”“搜一部好看的電影”。。。 那么問題來了,(1)是不是需要我們交互設計師或者產品經理絞盡腦汁在語料庫里寫出接近所有能夠表達這個意思的語言?(2)是不是“搜一部好看的電影”和“搜索一部好看的電影”這種一個字差別的語料都需要給出?

其實問題的本質還是指向系統的NLU能力。技術leader給出的答案是,在開放平臺上,現有的技術還是需要給出盡可能多的比較全乎的語料,一般在100條以內,特殊情況可以申請擴容。開放平臺也支持模糊語料理解,但是功能沒有想象的那么強大,保險起見,還是要多寫。而在內部前端技術研發上,正在只用多種語料模型進行優化,能夠有效解決相似語料的問題。

一個問題的解決,可以走技術,我認為也可以走設計。

如果從體驗設計的角度來分析,可以從兩點優化。(1)引導用戶說固定句式。比如在某功能的介紹之后引導用戶說固定句式?!澳?,我是醫生小伊。如果您哪里不舒服,可以說小伊小伊,我不舒服?!庇脩粼诙虝r記憶中,可以有效記住最后一句話,一般而言會照著說。(2)通過用戶研究,找出關鍵用戶,設計好場景和問題,搜集用戶最常表達的語料。這樣能夠確保90%以上的語料庫正確率即可。后期可以根據后臺數據不斷擴容。

最后,技術負責人說在撰寫語料的時候有一套規則:比如()表示該語料插槽是必須,[]{}表示非必須。通過這種約定的句式表達,可以提升語料撰寫的效率。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容