意圖識別預處理一

在上一章里面,我講的是一個意圖識別的思路或者說流程,但是并沒有給出具體實現方案。

在本章,我們給出一些細節信息。

考慮一種情況:

1.數學輔導班主要講什么?

2.語文輔導班主要講什么?

3.英語輔導班主要講什么?

通過人為分析,我們可以把它界定為一類,也就是問答類。我們可以把它歸結為

C主要講的什么?C可以理解為課程。


來看另外一類問題:

1.語文課上一個月多少錢?

2.語文課上半年多少錢?

3.語文課上一年多少錢?

對于這類類問題,我們可以把它歸為:語文課上T多少錢? T代表時間。

同時我們根據一開始的分析,可以把語文課替換為C。

也就是說,我們可以把它理解為:C上T多少錢?


如此,我們就可以歸類用戶輸入的一些問題。

于是我們可以用,C主要講的什么?C上T多少錢?

來代替一系列同類問題,它的優點就是可以更加抽象用戶輸入。降低認為構造訓練集的時間。

具體實現,源碼地址如下:https://drive.google.com/folderview?id=0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0&usp=drive_web#list

CRF++安裝還是比較簡單的

1../configure

2. make

3. su

4. make install

同時如果有需要,還可以安裝py包。在源碼目錄的python文件夾中。

CRF的具體使用方式,后面將會詳細介紹。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容