原文地址:http://blog.csdn.net/dfman1978/article/details/71544473
前言
在目前的軟件應(yīng)用中,輸入方式還是以文字輸入方式為主,但是語音輸入的方式目前應(yīng)用的越來越廣泛。這是一個(gè)利用 Olami SDK 編寫的一個(gè)24點(diǎn)iOS程序,是通過語音進(jìn)行輸入。
Olami SDK的介紹在下面這個(gè)網(wǎng)址
https://cn.olami.ai/wiki/?mp=sdk&content=sdk/ios/reference.html
在這個(gè)網(wǎng)址中詳細(xì)的介紹了Olami SDK包含了那些函數(shù)和定義的委托。
下面就通過24點(diǎn)這個(gè)程序來介紹一下如何使用這個(gè)SDK。
這個(gè)APP可在https://github.com/lym-ay/OlamiRecognizerMath24下載
去上面的網(wǎng)址下載Olami SDK.包括兩個(gè)文件,其中的一個(gè)是Olami的靜態(tài)函數(shù)庫,一個(gè)是其頭文件
第一步是初始化Olami的語音識(shí)別對象,并設(shè)置代理
olamiRecognizer= [[OlamiRecognizer alloc] init];olamiRecognizer.delegate=self;
2.調(diào)用setAuthorization函數(shù)進(jìn)行授權(quán)
[olamiRecognizersetAuthorization:@"d13bbcbef2a4460dbf19ced850eb5d83"api:@"asr"appSecret:@"3b08b349c0924a79869153bea334dd86"cusid:OLACUSID];
這個(gè)函數(shù)的參數(shù)的說明在OlamiRecognizer中有說明,也可以去在線API說明去查看
https://cn.olami.ai/wiki/?mp=sdk&content=sdk/ios/reference.html
有些參數(shù)必須去Olami的開發(fā)平臺(tái)上注冊才可以獲的,網(wǎng)址是https://olami.ai,注冊登陸以后創(chuàng)建應(yīng)用才可以看到了
3.設(shè)置語系
[olamiRecognizer setLocalization:LANGUAGE_SIMPLIFIED_CHINESE];
在進(jìn)行錄音之前必須要先進(jìn)行設(shè)置,否則會(huì)得不到結(jié)果。目前只支持簡體中文(LANGUAGE_SIMPLIFIED_CHINESE)
4.開始錄音
調(diào)用 start()接口開始進(jìn)行錄音
[olamiRecognizerstart];
5.得到錄音的文字和語義,并對其進(jìn)行處理
通過調(diào)用stop()函數(shù)或者自動(dòng)停止,都會(huì)獲得錄音的文字和對其進(jìn)行的語義分析的結(jié)果
實(shí)現(xiàn)OlamiRecognizerDelegate onResult函數(shù)可以獲得結(jié)果,其結(jié)果以一個(gè)json字符串的形式回調(diào)過來,對這個(gè)字符串進(jìn)行解析,就可以獲得想要的數(shù)字。例如對著話筒說”2345算24點(diǎn)”,得到的結(jié)果如下
這個(gè)是根據(jù)OSL語法描述語言定義的一套規(guī)則,返回的結(jié)果。這個(gè)結(jié)果的說明在https://cn.olami.ai/wiki/?mp=api_nlu&content=api_nlu3.html這個(gè)網(wǎng)址上有說明。
看到這里大家可能會(huì)有疑惑,APP怎么知道我說的是什么意思呢?這就涉及到了OSL語法描述語言,OLAMI 語法描述語言(OLAMI Syntax Language,簡稱:OSL)是 OLAMI 平臺(tái)針對自然語言處理所發(fā)展出的獨(dú)特語法標(biāo)記語言,自然語言語義互動(dòng)(Natural Language Interaction, 簡稱:NLI)管理系統(tǒng)采用 OSL 取代復(fù)雜的編碼編程,使用簡單、容易學(xué)習(xí)而且靈活有彈性。可以在這個(gè)網(wǎng)址查看詳細(xì)的說明
https://cn.olami.ai/wiki/?mp=osl&content=osl1.html
在編寫這個(gè)APP之前,會(huì)按照OSL的要求編寫好一套語法,這套語法可以被Olami的服務(wù)器所理解,并進(jìn)行語義分析然后給出結(jié)果,就是上面的json字符串。在Olami官網(wǎng)上有寫好的一些領(lǐng)域的模塊,可以直接使用。在https://cn.olami.ai/wiki/?mp=nli&content=nli1.html網(wǎng)址可以看到介紹如何使用以后的模塊。這個(gè)24點(diǎn)就是利用已有的模塊來編寫代碼的。
6.創(chuàng)建應(yīng)用,設(shè)置和導(dǎo)入grammar
首先去olami的主頁去登陸和注冊。登陸以后轉(zhuǎn)到這頁面
在這個(gè)頁面可以看到我的應(yīng)用 math24,還可以查看key
當(dāng)然這個(gè)頁面必須創(chuàng)建應(yīng)用以后才有,點(diǎn)擊“創(chuàng)建新應(yīng)用”,轉(zhuǎn)到下面這個(gè)頁面
填寫 應(yīng)用名稱,應(yīng)用描述,應(yīng)用介紹以后,就可以創(chuàng)建了。回到上一個(gè)頁面,就可以看到創(chuàng)建的應(yīng)用了。
點(diǎn)擊”進(jìn)入NLI系統(tǒng)”就可以進(jìn)入模塊頁面
在官網(wǎng)已經(jīng)內(nèi)置了很多領(lǐng)域的grammar.在模塊頁面大家點(diǎn)擊“導(dǎo)入”按鈕,查看已有領(lǐng)域的模塊
選擇一個(gè)要使用的,例如我要導(dǎo)入”math24”這個(gè)模塊,先選擇它,點(diǎn)擊“導(dǎo)入” 按鈕
然后進(jìn)入 math24模塊,就可以看到例句
但是這個(gè)時(shí)候還是不能使用,需要先進(jìn)行發(fā)布。點(diǎn)擊頁面上方的”發(fā)布”按鈕,進(jìn)入發(fā)布頁面
點(diǎn)擊“發(fā)布”按鈕
發(fā)布成功,現(xiàn)在就可以使用24模塊了。
Olami還提供了測試grammar的功能,點(diǎn)擊“測試”按鈕,可以在頁面進(jìn)行測試,而不必要先開發(fā)APP
最后還要回到“我的應(yīng)用”界面,點(diǎn)擊”配置NLI模塊”按鈕,讓自己創(chuàng)建的應(yīng)用和模塊關(guān)聯(lián)起來
7.onResult 函數(shù)的說明
在整個(gè)程序中,最主要的一個(gè)函數(shù)就是onResult函數(shù)
這個(gè)函數(shù)就是對傳過來的結(jié)果進(jìn)行處理
在這個(gè)函數(shù)中,調(diào)用了三個(gè)函數(shù),分別來處理josn格式中的三個(gè)比較重要的節(jié)點(diǎn)
這個(gè)用來處理ASR節(jié)點(diǎn),獲得語音識(shí)別的結(jié)果,如果沒有結(jié)果,則彈出一個(gè)對話框進(jìn)行提示。ASR識(shí)別的文字顯示在第一個(gè)TextView中
?這個(gè)用來處理Semantic節(jié)點(diǎn),這個(gè)節(jié)點(diǎn)中包含了slot的值和modifier的值。OSL 語法描述語言中的 slot 可理解為語義中的變量,用于傳遞、提取信息,是代碼處理的數(shù)據(jù)的來源。對于24點(diǎn)這個(gè)程序來說,就是進(jìn)行計(jì)算的4的數(shù)的來源。關(guān)于slot的值可以參考https://cn.olami.ai/wiki/?mp=osl&content=osl_slot.html,這里有詳細(xì)說明。在24點(diǎn)程序中我們的要計(jì)算的數(shù)字就是從這里獲得的。
?這個(gè)用來處理語音和語義的結(jié)果。這個(gè)函數(shù)主要是處理json字符串中的modifier節(jié)點(diǎn)。modifier 語法描述規(guī)則是 OSL 語法描述語言中,除了 slot 以外的另一種內(nèi)置的信息傳遞機(jī)制,一般用來表示語義目的,也可以理解為對于語義的一種注釋方式,以便讓應(yīng)用程序的開發(fā)者得知 grammar 所代表的相應(yīng)意圖。詳細(xì)說明參考
https://cn.olami.ai/wiki/?mp=osl&content=osl_regex.html#11,通過modifier,我們才能知道程序的意圖是什么?例如是想發(fā)問,還是計(jì)算結(jié)果。
如上代碼所示,在24點(diǎn)鐘我們定義了7個(gè)modifier,根據(jù)字面意思大家也可以猜出來。這些都可以在OSL語法中自定義,然后通過Josn字符串獲得,在程序中進(jìn)行處理。這個(gè)是我們程序進(jìn)行處理的一個(gè)判斷機(jī)制。
可以在csdn下載頻道下載
http://download.csdn.net/detail/dfman1978/9840447
github
https://github.com/lym-ay/OlamiRecognizerMath24
另外這里還有兩篇anroid上使用Olami SDK開發(fā)程序的文章
這個(gè)是一個(gè)聽書的程序
http://blog.csdn.net/ls0609/article/details/71519203
這個(gè)是一個(gè)關(guān)于天氣的程序