讀書筆記之《信號與噪聲》

引言

在發明印刷機之前,書籍已經存在,但知識的積累很困難。主要的問題是成本高、抄寫錯誤多、受眾少。出現印刷機之后,知識進入快速積累期,同時伴隨著新的、更嚴峻的問題。印刷內容良莠不齊,觀點五花八門。在長期接受外界信息的過程中,越來越多的人出于個人喜好篩選信息。從根源上分析,其實是因為人類處理信息的能力增長幅度遠不如信息增長的幅度。

作者用信號和噪聲進一步區分信息。一切信息處理的目的都是保留信號、去除噪聲,但不可避免的主觀因素導致數據處理過程無法總是遂愿。幸運的是,這些大數據終將推動人類社會進步。

人類的處理信息的核心機制是堅持以自己的看法讓世界更加簡單,避免信息超負荷。在充滿不確定的世界,人類隨時都需要預測未來并制訂相應的策略,以維持正常的發展。預測之所以重要,是因為它連接了主觀世界和客觀現實,人類的目標就是從海量的信息中篩選出真正的信號,做出接近真相的預測。

預測失敗的災難性后果

失敗的預測的共同點是預測者只關注符合預測者期望的信息,而不在乎真實性。如果僅是失敗了一次,或許可以歸結為運氣等外部原因,但多次失敗或者犯下嚴重的錯誤,則說明預測者的預測方法有問題,因為失敗的預測和客觀世界無關。 但存在另一種情況,預測者成功預測未來,卻視而不見。原因很多,可能是僥幸心理,可能是盲目自大,認為風險在可控范圍,或者不愿因小修小補而改變現狀,盡管問題酒出現在細節處。 可能會出錯的事情和不可能出錯的事情的區別在于,一旦不可能出錯的事情出了錯,那么這個錯誤往往無法挽回。

以2008年金融危機為例。首先,房地產泡沫破裂,房價下跌,接著嚴重影響普通民眾資產。盡管房地產市場只占金融體系中不大的部分,普通民眾的消費型支出趨于保守,但金融大亨仍舊大力投資房地產,導致相當一部分公司和銀行高負債經營。一般上,投資者會謹慎的避開此類公司,但3A評級機構提供擔保,雖然事實證明評估漏洞百出,但結果是投資者選擇冒險。雷曼兄弟成為第一個受害者,他的破產直接波及相關債務公司,最后沖擊整個金融市場。 金融危機發生后,人們沒能預測到長久的經濟衰退的可能性,政府、企業的后續手段加劇危機。為什么預測會失敗?作者認為,失敗的預測都是非樣本預測,錯誤的用之前并不貼近當前的數據解釋當前情況或預測未來。

政治選舉預測:狐貍和刺猬,誰更聰明?

狐貍型專家原則一,用概率的方法思考問題,結果可能會有幾個。二,當實際情況與之前不同時,不應受限于過去的結論,而應該時刻更新預測,最大程度的利用有限的信息。預測出現波動要么因為設計的模型很差勁,要么因為預測對象不具備可預測性。三,尋求共識,群體預測一般比個人準確。但狐貍型專家可以通過獨立思考,反復自己發問而效仿集體預測。預測時,定性定量的信息同等重要,兩者不能獨立分析。

棒球比賽預測:球探和數據怪才,誰更勝一籌?

一個好的棒球預測系統可以完成三個任務。一,考慮影響球員表現的外在因素。本任務相對簡單,主要通過“球場因素”來解釋球員面對的困難的程度。二,區別對待技術和運氣因素。短期內,運氣常常會主導棒球比賽,但長期內技術才是主要因素。某些數據比較善變,容易受運氣影響,而某些數據穩定,則體現個人技術。主要體現三,熟知老化曲線,不同工作的巔峰年齡不同。

天氣預測:蝴蝶扇動翅膀,有可能引起龍卷風

氣象系統符合混沌理論,動態而且非線性。這意味著之前某個時間點發生的動作會影響未來,并且以指數形式增長。 初始數值哪怕發生微小的變化,結果也會造成巨大的差距。可惜,精確程度很有限。經分析可知,這種預測方式屬于決定論,結果完全由初始值確定。在現代氣象預測中,人們通過大量輸入只有微小區別的初始數據,使多個結果以概率形式對比出現,結果成為或然。 人類的視覺相對計算機具有天然優勢,人類可以瞬間發現數據中的異常值并且給出解釋或預測。計算機缺乏想象力,無法識別圖案(比如驗證碼)。

地震預測:一個困惑了人類1000年的難題

地震學家熱衷于含時預測,地震發生的概率在一段時間內總會出現波動。余震可以證明地震存在一定的模式。一般而言,地震伴隨著余震,余震的威力小于地震。但歷史上曾多次出現無法判斷余震的情況,因為連續出現的地震等級驚人的接近。對于地震,還有個誤區是認為地震活動高發期是大地震的預警。如果預測某地每35年發生一次大地震,并不意味著地震但間隔時間相等,更保險的說法是每年發生大地震的可能性是35分之1,無論前一次地震何時發生,下一次但概率也不會改變。地震預測之所以陷入困境,很大程度因為人們無法直接測量地殼的壓力,只能獲得純統計數據,而沒有具有可分析性的數據。在預測中,最常見的是過度擬合,將噪聲誤認為信號。

經濟預測:經濟學家為什么沒有預測到2008年經濟危機

經濟學家并非都是理性的,相當一部分人過度自信。除了預測者本身因素,外界因素也足夠復雜,難以預測。首先,相關性并非等于因果關系。政府每年公布與經濟指標相關的數據上萬個,一些經濟學家把大量并沒有因果關系的數據混在一起。某些數據存在滯后性,經濟預測和經濟政策之間的反饋也難以正常進行,模型中的自變量和因變量在經濟領域混亂使用。

第二個原因是經濟變換莫測,某一時期的經濟運行狀況無法解釋未來經濟的發展。經濟周期并不穩定,沒有知道下一個轉變何時出現。雖然建立在穩定運行狀況的經濟模型毫無價值,但預測轉折點絕非易事。

第三,預測者的原始數據質量不高。 經濟學家面臨兩個困難,一是經濟是動態系統,處于永久的運動中。二是受到某些不確定的初始條件的約束,并不精確的初始數據會導致完全相反的結果。經濟學家對經濟運行中的因果關系認識的迷糊不清,既是給出一系列變量和方程式,也容易把噪聲當成信號。這種情況在大數據時代很常見,沒有理論支撐,沒有深入研究根源,僅僅是純統計學。此外,偏見不可避免。名氣越小,預測越不怕冒險,相反亦成立。解決辦法有兩個,一是為準確的經濟預測創造市場,更多的人對預測感興趣。二是我們應該成為更好的預測用戶,關注真正的專家,知道什么是噪聲,什么是信息。

傳染性疾病預測:禽流感為何會突然爆發,又突然消失?

外推法認為,未來是現在趨勢持續發展的結果。預測者把已有數據畫成圖,并據此推斷未來的發展模式。這種方法顯然不適用于現實。 之所以禽流感會突然爆發,主要因為預測本身會改變人的行為。要么讓結果無效,要么更準確。自我實現預測就是指預測自動實現,人們越擔心某種情況這種情況就越容易成為討論的話題,相關報道越接近真相。與之相反的是自我否定預測,預測會自我破壞。對于流感預測而言,最好的預測無法達到結果,因為這樣的預測會促使人們做出更有利于健康的選擇。 為什么我們無法預測出禽流感? ? 傳統流感模型過于簡單,而且依賴于大量假設,其中很多難以實現。對于復雜的現實,傳統模型顯然落后時代。但復雜的模型同樣不能提高預測的準確性。現在,越來越多的人采用“基于Agent建模方法”,本質上是對研究區域的模擬,預測者需要大量的數據,以及對認知心理學等學科深入的了解。就目前而言,這種模型難以投入應用。

貝葉斯公式:只有正確的預測才能讓我們更接近真相

成功的賭客,從來不會以穩賺不賠的心態、無懈可擊的理論和極其準確的尺度去看待未來。 通常,我們會把焦點集中到最新最塊的信息上,而忽略全局。有時候,新證據的力量十分強大,會壓到其他的證據。合理的做法是不斷的增加新證據,不斷的更新預測結果。在大數據時代,擁有的信息指數增長,需要驗證的假設以同樣速度增長。預測因此更容易失敗。 頻率主義認為,僅從人口樣本中收集數據是統計學問題中出現不確定性的原因。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,702評論 6 534
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,615評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,606評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,044評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,826評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,227評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,307評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,447評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,992評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,807評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,001評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,550評論 5 361
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,243評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,667評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,930評論 1 287
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,709評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,996評論 2 374

推薦閱讀更多精彩內容