我所說的一切都可能是錯的!
即使你贊同我的觀點,你的生活也不會因此有任何改變!
除非——你采取了相應的行動。
(這是書先生在簡書的第9篇文章。本文約1700字,請花4分鐘來閱讀。)
一開始我想說“像百度一樣學英語”,畢竟google這個網站是否存在還是個謎。但轉念想到,百度似乎英語不太好,那就還是姑且使用這個主頁一般顯示“404 not found”的網站吧。
搜索引擎的空間換時間
Google的老本行是搜索引擎,和我們學英語有什么關系?這就得從搜索引擎的原理說起了。別被這句話給嚇著了,以為下面我會拋出長篇的理論。絕對不會——因為我其實也不懂。不過,我可以很有把握的說,Google只可能采用下面兩種方法:
當用戶輸入搜索的關鍵字時,Google立馬開動自己的算法程序,全網搜索,然后把結果呈現給用戶。這種方法需要極先進的算法和服務器極快的處理速度。
Google平時放出自己的網頁蜘蛛,全網到處爬,把爬到的網頁全都建好索引,存儲起來。一有用戶搜索,就把已經存好的東西直接呈現給用戶。這種方法需要超大的存儲空間,但對速度要求就會低一些。
大家覺得Google會用哪一種呢?很顯然,是第二種。因為無論多么牛逼的算法、無論多么逆天的處理器,也無法實現實時全網搜索。而第二種方法把計算和搜索實際上放在了用戶搜索之前,而當需求產生時,調用的是已經存儲好的結果。
這是典型的“空間換時間”,時空可以轉換在Google身上得到了完美的體現,相信愛因斯坦老人家可以含笑九泉了。
語言使用中的空間換時間
如果把Google平時的爬取看做輸入,把響應用戶的搜索看做輸出,那么Google的工作原理和語言的輸入輸出有異曲同工之妙。
當我們在實際生活中使用一門語言時,我們有兩種輸出方式:
根據語法,用已經掌握的詞匯來臨時計算出一個合乎要求的句子。
把平時背過的可以滿足要求的句子直接調出來。
很顯然,第二種方法效率要高得多。可是,很多英語學習者實際上采用的是第一種方法。因此,他們總覺得用英語去交流是一件很困難的事情,因為臨時計算很耗時間,而且經常算錯。
比如我一個學生就用過international tissue這種短語。他想說“國際組織”,他記得國際是international,組織是tissue,所以他“計算出”一個international tissue。可惜,tissue是肌肉組織,神經組織的那個組織。如果他平時直接存儲過international organization這樣的短語,直接調用,就不會鬧這樣的笑話了。
以第一種方式去使用語言,不但自己痛苦,對方也痛苦。你每說一句話都要算半天,考慮過對方的感受嗎?就好像,你在Google的搜索框里鍵入一個關鍵詞,Google告訴你請等候一小時,我正在搜索,你還不得把電腦砸了?
所以,我們得用第二種方式。
向Google學習,在平時多儲存數據,最好是單位更大、能直接響應需求的數據。比如,不能只背單詞,更應多背詞組,最好多背文章。
假設可能的需求場景,模擬在這些場景中你可能的反應。比如就一個話題自言自語或者每天寫點東西。
Google、人腦和語言
實際上,以空間換時間的做法更符合人腦的特點。和機器相比,人腦在計算速度上其實不占優勢。但人腦幾乎有無限的存儲空間,至少現在還沒有發現它有上限。
就語言本身而言,“有限規則無限應用”這種說法,也不全然正確。符合語法的東西不見得符合語用。近年來越來越多的語言學家認為,語言使用更偏向于概率,而不是規則。比如,晚安我們用good night。單從語法上來說,似乎nice night, pleasant night也說得過去,但我們卻不會這么說。
簡單的說,你每天說的的每一句話,都很難說是全新的,可能前面已經有幾萬人在相同情境下說過一模一樣的話。
既然是這樣,我們多記一些前人用過的句子,在相同情況下,直接調用不就行了。這不但符合人腦的特點,也符合語言的特點。
就算那些規則比語言還“有限”的棋類游戲,比如象棋、圍棋,學習者也是通過記憶大量已經用過的定式來提高自己的水平,只有極少數人能夠在戰法上有所創新,就像只有極少數語言使用者能夠創造出讓人耳目一新的句子。
當有人問你根號2等于多少時,最快的方法不是掌握開平發的算法,而是提前背下來,然后直接說出答案。據說,李開復就干過類似的事情,給老師留下了深刻的印象(詳見李開復《世界因你而不同》)。可能就是對空間換時間有深刻的認識,他才當上Google大中華區的總裁的吧。