讀書筆記之《信號與噪聲》

引言

在發明印刷機之前，書籍已經存在，但知識的積累很困難。主要的問題是成本高、抄寫錯誤多、受眾少。出現印刷機之后，知識進入快速積累期，同時伴隨著新的、更嚴峻的問題。印刷內容良莠不齊，觀點五花八門。在長期接受外界信息的過程中，越來越多的人出于個人喜好篩選信息。從根源上分析，其實是因為人類處理信息的能力增長幅度遠不如信息增長的幅度。

作者用信號和噪聲進一步區分信息。一切信息處理的目的都是保留信號、去除噪聲，但不可避免的主觀因素導致數據處理過程無法總是遂愿。幸運的是，這些大數據終將推動人類社會進步。

人類的處理信息的核心機制是堅持以自己的看法讓世界更加簡單，避免信息超負荷。在充滿不確定的世界，人類隨時都需要預測未來并制訂相應的策略，以維持正常的發展。預測之所以重要，是因為它連接了主觀世界和客觀現實，人類的目標就是從海量的信息中篩選出真正的信號，做出接近真相的預測。

預測失敗的災難性后果

失敗的預測的共同點是預測者只關注符合預測者期望的信息，而不在乎真實性。如果僅是失敗了一次，或許可以歸結為運氣等外部原因，但多次失敗或者犯下嚴重的錯誤，則說明預測者的預測方法有問題，因為失敗的預測和客觀世界無關。但存在另一種情況，預測者成功預測未來，卻視而不見。原因很多，可能是僥幸心理，可能是盲目自大，認為風險在可控范圍，或者不愿因小修小補而改變現狀，盡管問題酒出現在細節處。可能會出錯的事情和不可能出錯的事情的區別在于，一旦不可能出錯的事情出了錯，那么這個錯誤往往無法挽回。

以2008年金融危機為例。首先，房地產泡沫破裂，房價下跌，接著嚴重影響普通民眾資產。盡管房地產市場只占金融體系中不大的部分，普通民眾的消費型支出趨于保守，但金融大亨仍舊大力投資房地產，導致相當一部分公司和銀行高負債經營。一般上，投資者會謹慎的避開此類公司，但3A評級機構提供擔保，雖然事實證明評估漏洞百出，但結果是投資者選擇冒險。雷曼兄弟成為第一個受害者，他的破產直接波及相關債務公司，最后沖擊整個金融市場。金融危機發生后，人們沒能預測到長久的經濟衰退的可能性，政府、企業的后續手段加劇危機。為什么預測會失敗？作者認為，失敗的預測都是非樣本預測，錯誤的用之前并不貼近當前的數據解釋當前情況或預測未來。

政治選舉預測：狐貍和刺猬，誰更聰明？

狐貍型專家原則一，用概率的方法思考問題，結果可能會有幾個。二，當實際情況與之前不同時，不應受限于過去的結論，而應該時刻更新預測，最大程度的利用有限的信息。預測出現波動要么因為設計的模型很差勁，要么因為預測對象不具備可預測性。三，尋求共識，群體預測一般比個人準確。但狐貍型專家可以通過獨立思考，反復自己發問而效仿集體預測。預測時，定性定量的信息同等重要，兩者不能獨立分析。

棒球比賽預測：球探和數據怪才，誰更勝一籌？

一個好的棒球預測系統可以完成三個任務。一，考慮影響球員表現的外在因素。本任務相對簡單，主要通過“球場因素”來解釋球員面對的困難的程度。二，區別對待技術和運氣因素。短期內，運氣常常會主導棒球比賽，但長期內技術才是主要因素。某些數據比較善變，容易受運氣影響，而某些數據穩定，則體現個人技術。主要體現三，熟知老化曲線，不同工作的巔峰年齡不同。

天氣預測：蝴蝶扇動翅膀，有可能引起龍卷風

氣象系統符合混沌理論，動態而且非線性。這意味著之前某個時間點發生的動作會影響未來，并且以指數形式增長。初始數值哪怕發生微小的變化，結果也會造成巨大的差距。可惜，精確程度很有限。經分析可知，這種預測方式屬于決定論，結果完全由初始值確定。在現代氣象預測中，人們通過大量輸入只有微小區別的初始數據，使多個結果以概率形式對比出現，結果成為或然。人類的視覺相對計算機具有天然優勢，人類可以瞬間發現數據中的異常值并且給出解釋或預測。計算機缺乏想象力，無法識別圖案（比如驗證碼）。

地震預測：一個困惑了人類1000年的難題

地震學家熱衷于含時預測，地震發生的概率在一段時間內總會出現波動。余震可以證明地震存在一定的模式。一般而言，地震伴隨著余震，余震的威力小于地震。但歷史上曾多次出現無法判斷余震的情況，因為連續出現的地震等級驚人的接近。對于地震，還有個誤區是認為地震活動高發期是大地震的預警。如果預測某地每35年發生一次大地震，并不意味著地震但間隔時間相等，更保險的說法是每年發生大地震的可能性是35分之1，無論前一次地震何時發生，下一次但概率也不會改變。地震預測之所以陷入困境，很大程度因為人們無法直接測量地殼的壓力，只能獲得純統計數據，而沒有具有可分析性的數據。在預測中，最常見的是過度擬合，將噪聲誤認為信號。

經濟預測：經濟學家為什么沒有預測到2008年經濟危機

經濟學家并非都是理性的，相當一部分人過度自信。除了預測者本身因素，外界因素也足夠復雜，難以預測。首先，相關性并非等于因果關系。政府每年公布與經濟指標相關的數據上萬個，一些經濟學家把大量并沒有因果關系的數據混在一起。某些數據存在滯后性，經濟預測和經濟政策之間的反饋也難以正常進行，模型中的自變量和因變量在經濟領域混亂使用。

第二個原因是經濟變換莫測，某一時期的經濟運行狀況無法解釋未來經濟的發展。經濟周期并不穩定，沒有知道下一個轉變何時出現。雖然建立在穩定運行狀況的經濟模型毫無價值，但預測轉折點絕非易事。

第三，預測者的原始數據質量不高。經濟學家面臨兩個困難，一是經濟是動態系統，處于永久的運動中。二是受到某些不確定的初始條件的約束，并不精確的初始數據會導致完全相反的結果。經濟學家對經濟運行中的因果關系認識的迷糊不清，既是給出一系列變量和方程式，也容易把噪聲當成信號。這種情況在大數據時代很常見，沒有理論支撐，沒有深入研究根源，僅僅是純統計學。此外，偏見不可避免。名氣越小，預測越不怕冒險，相反亦成立。解決辦法有兩個，一是為準確的經濟預測創造市場，更多的人對預測感興趣。二是我們應該成為更好的預測用戶，關注真正的專家，知道什么是噪聲，什么是信息。

傳染性疾病預測：禽流感為何會突然爆發，又突然消失？

外推法認為，未來是現在趨勢持續發展的結果。預測者把已有數據畫成圖，并據此推斷未來的發展模式。這種方法顯然不適用于現實。之所以禽流感會突然爆發，主要因為預測本身會改變人的行為。要么讓結果無效，要么更準確。自我實現預測就是指預測自動實現，人們越擔心某種情況這種情況就越容易成為討論的話題，相關報道越接近真相。與之相反的是自我否定預測，預測會自我破壞。對于流感預測而言，最好的預測無法達到結果，因為這樣的預測會促使人們做出更有利于健康的選擇。為什么我們無法預測出禽流感？ ? 傳統流感模型過于簡單，而且依賴于大量假設，其中很多難以實現。對于復雜的現實，傳統模型顯然落后時代。但復雜的模型同樣不能提高預測的準確性。現在，越來越多的人采用“基于Agent建模方法”，本質上是對研究區域的模擬，預測者需要大量的數據，以及對認知心理學等學科深入的了解。就目前而言，這種模型難以投入應用。

貝葉斯公式：只有正確的預測才能讓我們更接近真相

成功的賭客，從來不會以穩賺不賠的心態、無懈可擊的理論和極其準確的尺度去看待未來。通常，我們會把焦點集中到最新最塊的信息上，而忽略全局。有時候，新證據的力量十分強大，會壓到其他的證據。合理的做法是不斷的增加新證據，不斷的更新預測結果。在大數據時代，擁有的信息指數增長，需要驗證的假設以同樣速度增長。預測因此更容易失敗。頻率主義認為，僅從人口樣本中收集數據是統計學問題中出現不確定性的原因。

最后編輯于：2017.12.04 06:21:28

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,702評論 6贊 534
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,615評論 3贊 419
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,606評論 0贊 376
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,044評論 1贊 314
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,826評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,227評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,307評論 3贊 442
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,447評論 0贊 289
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,992評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,807評論 3贊 355
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,001評論 1贊 370
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,550評論 5贊 361
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,243評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,667評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,930評論 1贊 287
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,709評論 3贊 393
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,996評論 2贊 374

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

讀書筆記之《信號與噪聲》

讀書筆記之《信號與噪聲》

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

讀書筆記之《信號與噪聲》

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频