今天,我想繼續跟你分享一下近期學習德語的心得。
從30歲開始學習一門外語,這在生理上的確是很大的劣勢,畢竟在幼年時期,人的大腦對于語言的學習能力更強。然而,到了而立之年才去學習,卻也給了我一種不同的角度去審視母語與外語。
我將從以下幾點來進行闡述:
1.中文真的更難學;
2.中文的效率更高;
3.抓關鍵詞;
4.冗余度和可預測性。
1.中文真的更難學
如果你來到德國,你會發現,這里的汽車車牌號基本上是你想要什么號,就可以申請到什么號。
比如,這樣的:
在中國,這種車牌號肯定是配豪車的,但是在德國隨便一輛大眾車,都可以配到這種超級靚號。
你可能會說,中國多少人,德國多少人,能比嗎?但是,靚號是稀缺的,如果有這種追捧靚號的文化,那么即便只有中國人口1/17的德國,甚至其他小國家,靚號都絕不可能隨隨便便就能申請到。
所以,根本原因是,德國人并沒有賦予數字多少意義,頂多表示個紀念日或者覺得連串的數字有點意思。
而在中國,帶“4”的數字不吉利,帶“8”的數字就特別吉利,因為“4”與“死”同音,“8”與“發財”的“發”相近。不只是是數字,中國人在同音字或者發音相近的字上做足了文章:年夜飯一定要有魚,因為“魚”和“余”同音,代表“年年有余”;送禮可以送蘋果,因為蘋果的“蘋”和平安的“平”是一個讀音,但千萬不能送梨,因為“梨”和分離的“離”同音。
這一套系統對我們生活產生了非常真實的影響,甚至影響到了經濟生活,因此帶有吉利數字的電話號碼和車牌號,就有權要一個高價。
在英語世界、德語世界,很少拿諧音做文章,最多用諧音講個笑話,幾乎沒有把諧音上升到是否吉利、乃至出現經濟價值的程度。中國人是不是太過分重視諧音,太迷信了呢?
2017年1月5號的《鸚鵡螺》雜志上有篇文章提到了這個現象,標題是《中文是迷信機器嗎?》(Is the Chinese Language a Superstition Machine?),作者Julie Sepy是一個語言心理學家。這篇文章說,中國人對同音字如此敏感,是因為中文里的同音字太多了。
文中列舉了一項研究。研究者找了一份180萬字的中文文本,發現在180萬字中,一共有4500個不同的字,而這些字只有420個不同的讀音。也就是說,中文的平均每個字有11個同音字。
和英文一對比就會發現巨大差異。首先英文里面有很多是多音節的字,多音節同音的可能性非常小。如果你只考察單音節的英文單詞,它們每個詞的同音詞,也找不到一個。
中文有如此多的同音字,這是缺點嗎?
恰恰相反。在語言學家看來,同音字多其實是個長處。同音字多,說明中文對語音的利用效率高,只用了幾百個語音,就構建出一個非常復雜和龐大的語言!重復利用一些容易發的音,可以讓人省很多力。英文中的同音詞很少,其實是效率低,你不得不去學各種各樣的發音。事實上,英文的輔音和元音都比中文多,聽、說,都有難度。
更妙的是,中文雖然有這么多同音字,但是一點都不影響說話和理解。你聽別人用中文說一段話,幾乎不會有什么歧義——當然你別拿《施氏食獅史》這種故意用同音字構建的文章舉例子。中文是一門相當高效的語言,同音字帶來一些表面上的模糊性,但在真實使用過程中其實是非常準確的。
只要你認識4500個字,你就基本上能看懂任何文章;而且你只需要學習420個讀音!對英文來說,想要看懂《經濟學人》水平的文章,你的詞匯量不能低于兩萬!
那么,為什么中文有那么多同音字?
這是因為,中文跟英文、德文有一個本質的區別:中文是象形文字,而英文、德文是表音文字。
古時候,教書先生才不會用漢語拼音教孩子讀書呢!大家都是先會說中國話,然后先生再教你具體這個字是怎么寫的。最早能把中文的音用字母表示出來的拼音系統是19世紀中期英國人威妥瑪(Thomas Francis Wade,1818年8月25日-1895年7月31日)建立的威妥瑪拼音,直到1958年新中國的時候,才正式批準使用《現代漢語》拼音方案。
所以,用“形”來表意的象形文字,自然就不能有那么多的字音。
想象一下,在沒有拼音的年代,一個外國人想要學習中文得多難啊,而且一定會大吃一驚——這門語言,沒有教發音的系統!
而在有漢語拼音的現代,一個外國人想要學中文的話,得學習兩套系統:發音系統和字形系統,而這兩套系統還并不是一一對應的……。
想到這里,我突然有了一種心理優勢——那么難學的語言正是我的母語!我從來沒有那么為我的母語是“中文”感到如此慶幸!
2018年2月5日,英國首相Theresa May與丈夫Philip May參觀上海豫園,倒著展示剪好的“?!弊帧=Y果對中文一知半解的英國《倫敦晚報》諷刺首相居然把中國字展示倒了,給大英帝國丟人丟大發了。
”可憐“他們不知道中文里,“福倒“了的”倒“,跟”來到”的“到”是同音字。
2.中文的效率更高
你可能已經發現了,在看有中英文對照字幕電影的時候,盡管居于上方的中文字體要比英文的大,但是句子長度卻差不多;而英文書、德文書如果譯成中文版的話,會更薄。
雖然從小我們都要去學習外語,但你是否覺得咱們中文才是更高效率的語言呢?
你猜得沒錯,正是如此,今天我要用一個天才的理論——“信息論”,來向你闡述,為什么咱們中文是更高效率的一門語言。
1948年香農(Claude Elwood Shannon,1916年4月30日-2001年2月26日)發布了一篇論文《通訊的數學原理》,當時的香農只有32歲。就是這套理論,奠定了香農成為現代信息論祖師爺的地位。
在這篇論文里面,有不少數學公式,但其核心內容總結成可以理解的文字就是:一個東西的信息量的大小,在于它克服了多少*不確定性“,可供選擇的范圍越廣,選擇的信息量越大。
克服的不確定性越高,信息量越大。
我先舉一個生活中的例子。比如現在有一個人,生活非常規律,平時就出現在四個地方:家里、公司、餐館、健身房。如果我雇你做特工,幫我觀察這個人,隨時向我匯報他的位置,那你每次給我的信息無非就是“家里/公司/餐館/健身房“四選一——即使你不告訴我,我也有四分之一的把握猜對。所以你給我的信息價值不算太大。
可是如果這個人全世界到處跑,今天在土耳其明天在沙特阿拉伯我完全猜不到他在哪,那你給我的信息可就非常值錢了。
你的信息出來之前,這個人的位置對我來說是一種不確定性。你的信息,克服了這個不確定性。原來的不確定性越大,你的信息就越有價值。
香農還從統計物理學中借鑒了一個概念,這就是“信息熵”,所謂信息熵,就是一段消息的平均信息量。
我們略去其中的數學部分,直接來看中文跟英文的對比:
如果一段消息只能從0和1兩個數字中選,它的信息熵最大也只有1比特。如果你能從26個字母中選,信息熵最大可以達到4.7比特。如果是從2500個漢字中選,信息熵則可以達到11.3比特。
更直白地說,26個字母,你預測一段英文中下一個字母至少有1/26的概率可以猜得對,如果假定從2500個漢字中選,你預測一段中文里下一個字的概率就得從1/2500起了。
預測下一個中文,比預測下一個英文字母的*不確定性*要困難得多,這就是為什么中文是一種更高效的語言。
香農舉了個英文的例子:
Most people have little difficulty in reading this sentence.
(讀這句話對大部分人來說沒有什么困難。)
非常簡單的一句話。而香農說,這句話中有很多冗余的字符!比如我就算把其中所有的元音字母都去掉,如果你英文比較熟練,你也能猜出來這句話是什么——
Mst ppl hv lttl dffclty n rdng ths sntnc.
對吧?這第二句話能夠表達同樣的意思,而顯然比第一句提供了更多的信息密集度。據我所知,有些古代文明的文字,就根本沒有元音字母,讓你自己猜。
這個去除一句話中的冗余字符的過程,就是“壓縮”。其實這句話還可以進一步壓縮,比如其中的介詞(in)和定冠詞(this),就算沒有你也知道是什么意思。咱們中國的文言文,大約就是一種高度壓縮的問題,言簡意賅,特別省竹簡。
香農認為英語是冗余度非常高的一種語言,一般英文文本中75%的字符都是多余的。德文文本中的比例可能更高。
3.抓關鍵詞
17年年底,我通過了德語的B1水平考試,這是政府要求一個外國人在德國長期生活所需要的一個最低標準。由于附近的城市近期沒有B2的課程,于是我在網上繼續學習在線課程,白天我就在方黎她姨夫的公司打工,補貼家用。
在公司上班,就需要跟更多的陌生人用德語進行交流,你要充分理解別人的意思,然后做出正確的回應,畢竟,這可不是閑聊。
工作了幾周下來,有幾位同事跟姨夫說,Yingchen的德語很不錯呢!一來,是感覺口音還比較地道,二來,是在工作的溝通中,基本上不需要別人幫忙。
而事實上,同事跟我溝通的時候,我并不能聽懂他們說的每一句話、每一個字。但這幾乎不影響我理解他們的意思。
比如說,我跟同事在請教到底什么樣的零件是次品,必須要剔除,而哪些只是不太好看,但是卻不影響使用。
這是個有點復雜的話題,同事拿了一個次品,然后給了我一個放大鏡讓我看,并且給我解釋里面的緣由,有好多詞我都沒聽懂,他好像是說有的金屬傷痕是OK的,有的金屬傷痕是絕對不行的,但具體區別在哪,我實在沒聽懂。
原來,我沒能理解兩個關鍵詞——“Rost(鐵銹)“、“beschichten(鍍層)“,同事說,這兩個詞很重要,你查一下字典。
于是,有了“Rost(鐵銹)”、“beschichten(鍍層)”這兩個關鍵詞,同事所說的那一整段話,我就明白了——“如果這個傷痕是在鍍層之前出現的,就沒關系,因為這個傷痕的表面也有鍍層;但是如果這個傷痕是在鍍層之后出現的,就絕對要丟掉了,鍍層被破壞掉了,零件就會生銹了。不過,保險起見,只要看到有傷痕的,就都丟掉吧?!?/p>
所以,通常你只要聽懂別人話里面的關鍵詞,你大概就能猜出他的意思,因為我們的大腦有很強的“腦補”功能。
這也是為什么,當你跟外國人對話時,一個一個蹦關鍵詞,他們能理解你的想法,反而你整句整句的表達的時候,有時候人家會覺得不知所云。
所以,我們平常的對話,信息量是很小的,小到其中一兩個關鍵詞就可以替代整句話。
4.冗余度和可預測性
從傳遞信息的效率上來說,中文比起英文、德文確實要高不少,但是一門語言,有那么高的冗余度,一定有其內在原因。
而這個原因就是——提高信息的可預測性和傳遞信息的準確度。
我們舉一個趙本山的小品中的例子,你就明白了:
趙本山:“樹上騎個猴,地下一個猴,一共幾個猴?”
范偉:“八個啊!”
趙本山:“錯誤!”
高秀敏:“倆猴?!?/i>
因為“騎馬”的“騎”跟“七”的發音只有音調的區別,而在東北方言里,音調更相近,所以,范偉會理解錯,但是如果是兩個人用德語對話,幾乎可以肯定,不會出現上面的錯誤。
原因是,不只是德語中的同音詞少,而是德語的名詞有單數、復數之分,前面的冠詞有陰、陽、中性以及復數形式。
Der Affe ? ?猴子(單數)
Die Affen ? 猴子(復數)
因此,德語不光在冗余度上非常高,還有很多針對句子結構的語法,比如,名詞的首字母一定是大寫的,即便是動名詞,也一定會首字母大寫;名詞在做主語、賓語、所有格的時候,冠詞、形容詞也會隨之改變;再加上過去、現在、將來,虛擬、完成式等等時態,這讓一句話變得挺復雜,但也減少了誤解的可能性。
這樣,即便你沒有聽的很清楚,也基本能準確理解對方的意思。
咱們想想這個道理。我們日常說中文也都有很大的冗余度,有時候啰哩啰嗦一個意思說好幾遍,但是這樣能確保你即便有幾個字沒聽清楚,也能知道我說的是什么意思。
總結:
中文跟德語各有千秋:中文傳遞效率更高,德語傳遞準確率更高。
而每個人不僅追求“不確定性”的樂趣,也追求“確定性”的安穩。
當然,滿嘴空話、套話的人——他說前半句你就能猜到后半句,不管說的是哪種語言,都不會有多大的信息量。
最后用香農的一個同事,瓦倫.韋弗(Warren Weaver)向公眾解釋信息論的一句話共勉:
“最重要的不是你*說了*什么,而是你*能說*什么。“
“it relates not so much to what you do say, as to what you could say.”
參考文獻:
維基百科
《得到》訂閱專欄《精英日課(第一季)》107期;
《得到》訂閱專欄《精英日課(第二季)》32期;
《得到》訂閱專欄《精英日課(第二季)》33期;