如果你剛接觸自然語言處理并對她感興趣,最好讀幾本這方面的書籍,除了能讓你知道自然語言處理各個領域是干什么的外,還能培養一下NLP的感覺。以下四本書是我讀研期間閱讀和接觸過的,如果您還有好書推薦,歡迎補充。
1、**《自然語言處理綜論》 **(Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition)
這本書的權威自不用說,譯者是馮志偉老師和孫樂老師,當年讀這本書的時候,還不知道馮老師是誰,但是讀起來感覺非常好,想想如果沒有在這個領域積攢多年的實力,是不可能翻譯的這么順暢的。這本書在國內外的評價都比較好,對自然語言處理的兩個學派(語言學派和統計學派)所關注的內容都有所包含,但因此也失去一些側重點。從我的角度來說更偏向于統計部分,所以需要了解統計自然語言處理的讀者下面兩本書更適合做基礎閱讀。不過這本書的N-gram語言模型部分寫得非常不錯,是SRILM的推薦閱讀參考。
2、《統計自然語言處理基礎》(Foundations of Statistical Natural Language Processing)
我比較喜歡這本書,這兩年的學習過程中也經常拿這本書作為參考,可能與我做統計機器翻譯有關吧。看china pub上的評論說這本書的翻譯比較差,自己的感覺是還行。當然,這是國內翻譯圖書的一個通病:除了很難有翻譯的非常好的書外,另外一個原因就是滯后性。如果e文足夠好的壞,就及時看英文版吧。這本書在統計基本部分的介紹很不錯,另外n元語法部分講得也比較好,也是SRILM的推薦閱讀。
3、《統計自然語言處理》
這是北京自動化所宗成慶老師今年5月出版的一本專著,我有幸較早的閱讀了這本書的很多章節。一個很強的感覺是:如果你想了解相關領域的國內外最新進展,這本書非常值得一讀。上面兩本書在由于出版稍早的緣故,很多領域最新的方法都沒有介紹。而這本書剛剛出版,宗老師對國內外現狀把握的也比較好,因此書中充分體現了這方面的信息。另外統計機器翻譯這一部分寫得很詳細很不錯,這可能與宗老師亦是這個領域的研究者有關吧。
4、《計算機自然語言處理》
這是我最早看的一部自然語言處理方面的書籍,和上面幾部大部頭的書籍相比,這本書很薄,可以很快的看完。書的內容我都有點忘了,但是印象中可以在每個章節看到國內這個領域的研究歷史和相關單位。這時才發現母校HIT在這個領域的超強實力,只是可惜這時候已經離開冰城了。
這些書籍怎么讀都行,泛覽也罷,精讀也行,只要有時間,多讀書是沒壞處的。我自己的經驗是,先泛泛的瀏覽或閱讀一篇,對于比較晦澀的部分可以先跳過去,然后對自己感興趣的領域或者將要從事的領域的相關章節進行精讀,當然,書籍一般在開始的幾個章節講些基礎性的知識,這部分最好也仔細揣摩一下。真正要對自己研究的領域深刻了解,還得好好讀一下本領域的相關論文。
轉載:“我愛自然語言處理”: