《《數學之美》》讀書筆記
這是我的第一篇讀書筆記,不知道為什么我覺得讀書筆記的用處變得很大,記得小時候老師讓自己寫讀書筆記自己不懂老師的意圖,都是快到交作業的時候隨便湊,4大名著,就這樣4大名著在我的小學讀書筆記本上出現的10次之9.現在準備每天都寫一些新學的東西的讀“書”筆記,這樣方便我日后復習以及學習。
《數學之美》--吳軍
這本書主要講了數學在計算機科學中的靈巧應用,以及在解決計算機科學技術中使用數學模型,“自然語言”,在我沒有閱讀這本書之前感覺這是一個“高大上”的計算機分類,弱校的我估計不可能接觸這些東西,而讀了這本書之后雖然只是一遍但我感覺我有可能可以接觸這方面的東西,首先提出“用數學方法處理自然語言是香農(Claude Shannon)提出來的”,但是首先解決了當時自然語言語言處理的是賈里尼克,當時他正在IBM做學術休假,統計語言模型就是那個時候提出來的,設計自然語言處理的領域有機械翻譯,語音識別,印刷體,手寫識別,拼寫糾錯,漢字輸入和文獻的查詢,看到這些高大上的詞匯我一面懵逼,我尼瑪就會c語言和c#編程簡單的網頁你給我扯這些我哪聽的懂。。。
這塊首先回憶了一下計算機科學,說真的學計算機,計算機的基礎決定你未來能走多遠這句話真沒錯,要不是我在mooc看了清華的課算法,理解起來真有些難度,蝸居的要想學好程序首先不能用人的思維,沒錯就是不能用人的思維,應該活在虛擬世界這樣才能很好的解決計算機問題,最關鍵的一點就是在現實社會中窮舉的難度極其大,而計算機做這件事情就比較簡單,比如在小學的時候解決,雞兔同籠問題,這個問題最笨的方法就是用窮舉一只雞幾只兔,2只雞幾只兔‘’‘’‘’‘’‘N只雞幾只兔,這種方法人估計很難有耐性做下去,但對于計算機來說卻是秒秒中的事情知道這一點我再說下面的事情
這個統計語言模型,據書中所說就是查找一句話在這篇文章所出現的次數,例如統計“我愛你”在一篇情書中出現的次數,首先“我愛你”這句話“我”在“愛”的前面,“愛”在你的前面,這樣的順序可以看成一個字符串S,要想知道S在這文章中出現的次數書中給出了個公式“P(S)=P(W1)P(W2|W1)P(W3| W1 W2)...P(Wn|W1..Wn-1)”其中P(W1)表示第一個詞W1出現的概率;P(W2|W1)是在已知第一個詞的前提下第二個詞出現的概率;以此類推。不難看出到了Wn個次他出現的概率取決于他前面出現的所有的詞,這樣無疑計算量比較大,但是我們從“我愛你”這三個詞中取中間的“愛”和前面的“我”做比較(這個書中說叫做馬爾科夫假設)于是問題變得比較簡單了下面給出公式“P(S)=P(w1)P(w2|w1)P(w3|w2)...P(Wi|wIi-1)...”說實話我第一次看這些公式一臉懵逼,但是我第二遍讀書的時候才明白點,這就和我們c語言中的邏輯與運算一樣他們直接只要有一個不成立就是0,’我‘后面如果是“愛”,”愛“后面如果是“你”那么系統可以記錄一次否則不記錄,(大家都知道計算機做Bool類型數據最為快速,也就是我們常說的0和1的運算)這篇就說到這例子是我自己想到如果有不正確的地方大家多多批評,這是我自己的一點讀書筆記,大神就不要嘲諷我這條咸魚了--.