當下最火的概念無非就是人工智能了,現在,人工智能已經滲透,到了各行各業,也滲透到了我們生活的每一個角落,和別人聊天的時候,如果說你沒有聽過人工智能,那估計就會成為被人鄙視的對象了。
然而,作為一個門外漢,我一直對人工智能,大數據等概念知其然卻不知其所以然。好像對它們很熟悉,可是細細一想,卻又發現對它們其實所知甚少,基本停留在人云亦云的階段。
巧合之下,看了吳軍老師寫的《數學之美》這本書,總算對人工智能,特別是電腦對自然語言的處理有了一點了解。今天寫出來分享一下,以一個外行加菜鳥的身份談談個人的理解。
在最一開始,科學家們覺得要想讓電腦理解人類的語言,那就需要像培養一個嬰兒學習語言那樣去培養它,概括起來就是兩件事:分析語句和獲取語義。可是,對我們人類來說很簡單的問題到了電腦這邊就變得無比艱難,因為電腦沒有辦法理解一個句子或一個單詞和上下文的關系,再加上有那么多的多音字,多意字等,對于電腦來說,運算量實在太過巨大,即使今天計算機的運算能力有了突飛猛進的發展,就拿現在的英特爾i7處理器來說,分析一個二三十個單詞的句子也要花一兩分鐘,可想而知,這條路是完全行不通的。
后來,科學家們發現利用數學上的概率算法可以解決這個問題,創建了統計語言模型,人工智能的春天才算來臨,簡單來說,看一個句子是否正確合理,只要看它的可能性大小如何就行了,而可能性的大小可以用概率來表示,假設組成一個句子的單詞有n種排列方法,只要看哪種排列方法的概率最大,那這個句子的準確性就最高。打個比方“小明在吃飯”這個句子,里面的每個字有多種組合方式,像“飯吃明小在”等,而對比各個排列順序在一個大的數據庫里面出現的概率,就能篩選出“小明在吃飯”這個正確的句子。
我覺得最偉大的不在于這個方法翻譯了多少句子,而是為人類打開了一扇新的大門,原來用數學的方法也能解決語言的問題。在這種思維方式的引領下,人工智能的浪潮才能來到我們身邊。
另外,我也總算了解了一點人工智能和大數據的關系,給電腦設計出一套算法后,它一定需要大量的數據來支撐這套算法,而這套算法會自動進化,不斷尋找最優的解決方案。看過一個例子,研究人員給電腦設計了一套自我學習的算法,然后就讓電腦自己去玩游戲,前面幾次,電腦都會有大量的失誤,可是短短半個小時后,電腦的失誤比率就降到了百萬分之一,兩個小時后,電腦發現了一個bug,可以直接打碎一堵墻獲得勝利,而這個漏洞人類玩家花了很長時間也沒有發現過。
以后我會陸陸續續把自己的一些學習心得寫下來和大家分享,這也能夠幫助自己個更好的了解閱讀到的東西,一個知識,只有當你能夠用自己的理解說給別人聽,才算真正的了解。