2016年總結的時候,說新的一年要寫十篇讀書筆記,真的寫起來才發現好大個坑..讀一本書的時間是1的話,做筆記至少要多花1-2,再思考總結寫成文又要2-3...不過自己挖的坑跪著也要填完的。
那就來吧,第一篇,《經驗的疆界》。
作者背景
首先來看看作者,詹姆斯·G·馬奇,以下是抄豆瓣的:
詹姆斯·馬奇James G.March,2003年,兩位管理學者制作了一張200人的管理大師排行榜。然后他們問了上榜的大師們一個問題:誰是你心目中的大師?排在第一的是20世紀最偉大的管理思想家德魯克,排在第三的是諾貝爾經濟學獎獲得者赫伯特·西蒙,而在德魯克之后,西蒙之前的則是幾乎沒有公眾知名度的詹姆斯·馬奇。
馬奇出生于1916年,1953年獲得耶魯大學博士學位。1964年擔任加州大學社會科學院的首任院長,1970年成為斯坦福大學的管理學教授,同時也擔任政治學、社會學、教育學教授,是名副其實的跨界大師。馬奇被公認為是過去50年來,在組織決策研究領域中最有貢獻的學者之一,他在組織、決策和領導力等領域都頗有建樹。
說實話在這本書之前,管理學方面的書也就是在許多年前走馬觀花囫圇吞棗地看過幾本書。打算以這本書為契機,再回頭系統地讀一下。這本書是在雪球上看到有人提起,翻了一下簡介,覺得很有意思,于是找來PDF讀了。讀完有幾點感想:
- 書不厚但是知識密度很大,正文92頁,后面參考文獻列了3、40頁。(所以這種書要真精讀起來閱讀量會是書的幾倍...我是讀不了這么細致..筆記也就掛一漏萬了)
- 這本書談的主要是“是什么”而不是“怎么辦”,或者說在作者看來有些問題是“無解的”。讀完可以自省,對一些問題引以為戒,但是不適合想學方法論的童鞋。
- 中文版的翻譯讀起來...總感覺透出濃濃的金山詞霸的味道,于是難讀程度又上了一個臺階..也許是這類書確實難翻譯,信達已經不易了。
說了這么多看來都是缺點,其實瑕不掩瑜,這的確是一本值得一讀的好書,讓我們看看這本書到底在說什么。
這本書講了啥
組織要生存,就要不斷提高與環境的匹配度。實現的方式有適應環境和改變環境兩種。強者與領頭者往往會試圖改變環境,但長期來這樣做有副作用——適應能力會衰退——特別當霸主地位消失時,很容易一蹶不振(想到了NOKIA)。
那么組織是如何實踐另一條路,也就是適應環境的?
通過經驗學習,是組織和個人適應環境過程中常常使用的方法,人們也渴望從經驗中獲得智慧。然而作者發現,在這個過程中存在許多的問題,更糟糕的是,有一些問題是與學習者無關的——這是一種經驗本身的缺陷,所以當我們使用這個方法的時候,一定要意識到它的局限性。在某些情況下,經驗是一個好老師,但是大多數時候,我們需要超越經驗的學習能力(具體怎么做沒有說)。
作者把學習分為兩類:低智學習與高智學習。
- 低智學習:通過試誤、模仿、天擇三種機制來復制成功。
- 高智學習:通過講故事、建立模型、發明理論來闡述事物的因果。
這兩種方法都是對經驗的利用,而人類有進行高智解釋的傾向,然而作者對高智學習的效果是存疑的,許多看似高智學習的行為,只是人們一廂情愿的詮釋,其中就包括了各種管理學理論(總感覺這是在端自己飯碗),它們的效果往往和低智學習也差不多,或者說解釋性很好但預測性很差。
在“高智學習”中,作者主要談了組織對于“故事”和“模型”的使用,對于這類學習的效果作者依然是不樂觀的。作者認為對于組織來說,“故事”和“模型”具有三種價值:真理價值、正義價值和美學價值。與其說組織使用他們實現尋求真理的目標,不如說他們是在尋求“正義”——也就是一種“共識”。這一點和《人類簡史》中提到的概念很類似——人類之所以牛逼就是因為靠著“神話”和“想象”形成了“國家”和“民族”的概念,從而突破了動物群體組織個體數的極限。從這一點上來說,能夠“講好故事”似乎是比“掌握真理”從根源上更適應人類社會的需要。
最后作者還談了新事物的生成機制。簡單來說,基于經驗學習提升組織適應能力對新事物是有抑制作用的,然而組織又在追求著創新,在這種矛盾中,新事物是如何出現和成長的就是一個有意思的問題了。
寫完發現這樣介紹損失的細節太多,只能說原書已經十分精煉。但愿這個介紹說清了大概內容,并且讓你有一點點想要讀它_。后面是把書里提到的比較有意思的概念和閱讀中的一些想法記錄一下,算作這本書的擴展閱讀內容吧,這些東西沒有什么邏輯順序和內在聯系,寫到哪里算哪里~
經驗學習與機器學習
2016年,Alpha Go橫掃人類圍棋頂尖高手,曾經被視為“天塹”的海量計算最終敗給了“深度學習”。AI似乎已經注定成為未來科技的主要方向之一,而說到AI就必然要講“機器學習”。
最近正好也在看coursera上machine learning的課程,第一課開篇講到機器學習的定義。
Tom Mitchell provides a more modern definition: "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."
這段定義有點繞,簡單翻譯,如果一段程序對于一組任務T的性能度量P通過經驗E獲得了提升,那么就可以說這段代碼學習了經驗E。
還是有點繞,讓我們舉個栗子:
E = 下很多盤圍棋的經驗
T = 下圍棋比賽的任務
P = 程序贏得下一盤棋的可能性
當程序通過下很多盤棋得到的經驗,幫助它提升了下一場棋的勝率,那它就是從這許多盤棋中進行了學習。
據說Alpha Go運用了“機器學習”中“深度學習”的方式,通過對千萬盤棋的學習,掌握了——據柯潔的說法——與人類千百年來總結的棋理非常不同的棋道,而且就目前看來已經穩穩的技高一籌。
看到這段機器學習的定義的時候,我就想到了書里講到的經驗學習。其實這種通過訓練集來學習掌握成功之道的方式,不正是經驗學習的特征么。只是不知道這種情況下,是否也會存在經驗學習中的各類問題?目前的想法是,圍棋這種學習對象,還是屬于較為封閉的系統,并且目標與規則都很明確,再配合海量的訓練資源,本身就屬于適合進行經驗學習的場景。即通過大量重復訓練和總結,能夠掌握獲勝的方法,于是掌握了學習方法并且“性能”上更出色的電腦打敗人類也就不足為奇了。
進一步想的話,機器具備了“學習”的能力后,是不是所有適合進行“經驗學習”的場景,人類終將都敗給電腦?那現在說的絕大部分人的工作將被替代還真不是危言聳聽。如果真有那么一天,人類最后的堡壘會在哪里?直覺?藝術?靈感?情緒?咳咳..一不留神好像又扯上了哲學問題,就此打住。
老虎機問題與T型迷宮強化學習
大數定律與小樣本偏見
大數定律,簡單來說就是對于一個概率一定的隨機事件,只要重復的次數足夠多,那事件發生的頻率就會趨近于它的概率。在數學上還分為了強弱大數定律兩個版本,不過那只是收斂程度的差別,對于理解這個原理并沒有什么影響。
從這個定律里,我想能總結出這些結論:
-
當樣本足夠大,可能性再小的事情也會發生。
這一點和前些年熱起來的“黑天鵝”概念也許可以相互聯系起來看:一些看似絕不會發生的事情發生了,也許并不是因為什么神秘力量在作祟,而是因為這些事情雖然概率很小,卻并不等于0,在足夠多的重復次數下,它是必然會發生的,只不過我們無法預測它會在何時何地發生。
而且按照這本書里提到的說法,習慣根據經驗學習的我們,對于極其稀有的事件,無論是正面還是負面事件,我們都會低估其發生的可能性。對于負面事件,這種低估導致我們無意識地擁抱風險,復制增加這類事件發生可能性的行動,從而提高了負面事件發生的可能性。
進一步引申的話,從“大數定律”中似乎又可以證實“墨菲定律”的結論是有道理的——當我們知道一個壞事有可能發生,它就必然會發生。于是我們能做的也許不是想方設法去避免它(從成本上或是預測難度上不可行),而是是對于一些看似不可能發生但是后果嚴重的事情也要做好應對的準備。投資上有一句話叫“重要的不是預測,而是對策。”說的就是這個意思。其實這個思路在各個領域都是適用的,比如對備份的數據一定要做恢復演練(Gitlab躺槍O)而不是寄希望于不會遇到需要恢復數據的情況。對于個人來說,也許是時候考慮去買一份靠譜的保險了。(如何買一份靠譜的保險也是個大坑,題外話就不說了.._) -
反過來,當樣本太小的時候,總結的所謂“規律”都是不靠譜的
這也是所謂的“小樣本偏見”,似乎在學術上還有個高大上的名字“啟發式認知偏差”(heuristic bias),而“小樣本偏見”是它的一種表現形式。
在體育運動中,曾經有過許多基于這種偏差總結的經驗,特別是所謂的“世界杯定律”,比如“巴西隊的禮物”:
這是世界杯歷史上最著名的定律之一,其定律是:只要巴西國家足球隊稱雄,下一屆的冠軍就將是主辦大賽的東道主,除非巴西隊自己將禮物收回。
1962年,巴西奪冠,4年后英格蘭本土稱雄。1970年巴西三奪金杯,1974年輪到東道主西德捧杯。1994年巴西在美國奪冠,1998年法國在本土一鼓作氣首次捧得大力神杯。1958年,巴西在瑞典奪取了冠軍,4年后他們成功衛冕,收回了“禮物”。
直到2006年,這一魔咒被破解:在德國,巴西隊和東道主德國國家足球隊都沒能奪冠。
其實“破解魔咒”的也不是什么魔法,而是這些定律本身只是基于一些有限數據樣本的擬合,當數據樣本逐步增加后,這類“規律”自然就失效了。
所以,還是盡早放棄自己通過一些簡單指標計算發明一個“神奇公式”就能預測股票漲跌的幻想,更不用提所謂的“彩票中獎號碼走勢分析”。因為即使是經過了大量回測、優化的量化策略,也往往逃不過“解釋一流,預測無力”的命運。根據本書的說法,這種基于復制成功經驗的學習方式,并不能接近成功的本質,在一個穩定的環境下往往也只能得到局部最優解,更何況我們面對的是如此復雜多變的一個世界。
首次超越定理和競爭上限定理
這個在文中簡單提到,但是沒有具體解釋,如果有了解的也可以給我普及一下知識。
首次超越定理說的大概是,例如擲一個無偏硬幣,要多少次之后正反面的次數多少會發生變化,即正面的次數超過反面(或者相反)。直覺上需要的次數比平均而言的實際次數要少得多。
競爭上限定理說的是,假設有兩個相同的競爭者,每次競爭的績效取自一個平均值為0,標準差為1的正態分布。如果排名按照歷次績效的平均值,那對于t次績效較高的那個人來說,t+1次績效平均值更大的可能性也會增大。根據這個績效來評判兩個人,排名會在很長時間內保持不變。
我覺得這主要是講初始條件對于學習結果的影響,通過復制成功來學習的結果很大程度上會被一開始的結果左右。這讓我想到了心理學的首因效應,假設人們普遍使用復制以往經驗的學習方法(按照本書的說法這確實是被普遍使用的),那么這兩個定理似乎解釋第一印象(特別是多方進行競爭時)的重要性。
練習效應、勝任力陷阱、馬太效應
復制成功,眾選項的潛在結果分布受到歷次所做選擇和歷次變現結果的影響。每次選擇的結果顯然會影響被選選項,因為產生了實際的變現結果。但是即使是未被選擇的選項,潛在的結果分布也可能會受到影響。
復制成功本身有可能造成消耗或是改進,其中一個比較好的例子就是“練習效應”。
練習效應:
優勢有可能因為開發而喪失——比如網球比賽中,把球打向對手的弱側,短期來看是一個獲勝的好方法。然而每次這么做都讓對手的弱側得到了練習的機會,削弱了“打向弱側”這個選項的成功概率。
但是更多情況下,練習效應都是正向的——我們選擇的選項讓我們得到練習的機會,從而提高在這個選項下的表現。也就是說,讓所選選項的結果分布平均值變大、標準差變小。
但即使是正向的練習效應,也不見得對復制成功是好事——甚至正向的練習效應常常會讓我們錯過最佳選項,這個問題一般被稱為“勝任力陷阱”。
勝任力陷阱:
假設有兩個選項,其中一個潛力較高但學習曲線較為陡峭而另一個潛力較低但是容易上手。因為練習效應的緣故,選擇潛力較低的選項,會快速提高這一效果的變現結果,從而讓學習者更愿意選擇——從而錯過了高潛力的選項。
組織常常面臨這樣的場景:老做法(或者流程、形式),缺點較多,但是用順手了;新方法有很多優點,但是不大會用。因為練習效應的累計,組織更可能選擇前者,復制成功的做法會加重這種現象。
至于如何解決這個問題,也許正是區分了偉大與平庸公司的分界之一。“It always comes down to people.”這是一篇寫Google的文章里提到的,真正地把最好的人才作為一個公司最重要的資產,也許是其中的關鍵。只有在這個組織中充滿了不斷尋求超越自我的人,才會幫助組織保持活力而非落入“勝任力陷阱”中從此無法掙脫。
當然,成功也會帶來更多的成功,典型的就是所謂“馬太效應”。
馬太效應:
馬太效應的名稱來源于《新約·馬太福音》:“凡有的,還要加給他,叫他多余;沒有的,連他所有的,也要奪過來。”
有意思的是,幾千年前老子也提出了類似的想法:“天之道,損有余而補不足。人之道則不然,損不足以奉有余。”
歷史上一再發生的土地兼并和如今互聯網經濟下“贏家通吃”的現象都一再向我們展現著“馬太效應”的魔力。很多時候,我們的不安也來源于此,無數家長們把孩子們早早推上“起跑線”,也是害怕在一場會被“馬太效應”左右的競爭中失了先機。當然有些情況也是馬太效應無法解釋的,比如在一些領域存在所謂的“后發優勢”。
風險偏好與福利彩票
在許多經濟學或是心理學的書中,都談到過“風險偏好”的問題。有一個共識是,人們在面對收益的時候是風險厭惡的,而在面對損失的時候是風險偏好的,即使他們的數學期望一致。
最常見的例子是,如果有一個選擇題,100%獲得10塊錢還是10%機會獲得100塊錢,大多數人會選擇直接拿10塊錢。如果反過來,100%損失10塊錢還是10%可能損失100塊,大多數人又會選擇搏一下那10%的概率。
書中對于這一點給了個經典的解釋:“因為金錢的邊際效用遞減,所以確定選項的期望大于不確定選項的期望。”
我對這個解釋理解是,對于一個快要餓死的人來說,第一個饅頭和第十個饅頭的效用是不一樣的,第一個是用來救命的;如果認為金錢也是這樣,那第一個10塊比第十個10塊的效用要大,因此100塊的實際效用是低于10個第一10塊錢的,所以10%幾率的100塊實際期望低于一個確定的10塊錢。
而這本書說,及時不考慮所謂的邊際效用或者心理人性,通過簡單的復制成功的學習方式,也會產生這種結果——復制行動時往往根據初始幾次的嘗試結果決定偏好,于是開始選擇拿100塊結果一無所獲和選擇承受風險卻沒有損失就是大概率事件——從而形成了人們的風險偏好選擇。
這個解釋是很合理的,然而當我們把數字放大之后,似乎又會有一些變化。比如按照這個解釋的話,為什么人們會樂此不疲地花2塊錢去爭取一個1700萬分之一概率的得到500萬獎金的機會就是一個難解之謎了。我能想到的區別可能有:
- 在這個模型下人們也在學習,只不過學習對象不是自己的中獎結果經驗,而是被廣為傳播的“別人獲獎的經驗”,也就是說,在這時候大家并不是在“試誤”而是在“模仿”。而由于信息傳播過濾,人們通過媒體看到的都是具有“幸存者偏見”的結果,從而導致人們大大高估了中獎的概率。由此可見,媒體真的是一個很強大的力量,能夠扭曲人們的認識,所謂眾口鑠金,三人成虎。口碑營銷之所以成功,恐怕也多少是建立在人們樂于“模仿”的基礎上。
- 也可能是當獎金數量高到一定程度之后,會模糊人們對這筆錢的效用估計——我們能清楚地判斷出100和10塊的差距只是讓我能改善一頓伙食,然而500萬,就不免讓人想入非非,能夠讓我過上“理想中”的生活——這種模糊而又理想化的美好愿景,讓我們高估了這筆錢的效用。
最后再加一道思考題:假如來玩類似“俄羅斯輪盤賭”的游戲,贏的話能有1個億,輸的話就去見上帝,這個游戲的獲勝概率多大你會愿意去玩一下?百分之一?千分之一?..不?那萬分之一怎么樣呢?...
當我們談論創新時…
創新已經成了老生常談,似乎大家都在追求改變。然而對于組織來說,適應與復制成功和創新之間是沖突的。新東西往往是不成熟不完善甚至根本就是錯的,哪怕真的是具有不錯潛力的新事物在短期也可能會損害績效表現,從而被拋棄。但是,根據我們對于組織的觀察新的變化又確實發生著,這些新事物是怎么出現的?讀完本書,總結了以下一些收獲和想法:
當我們談論創新時,很多時候其實說的還是經驗學習中的“模仿”,把別人已經證明可行的方法用到自己身上,真正“前無古人”的嘗試并不是特別多。當然在學習的過程中通常會加入一些改進,大概就是所謂的“微創新”。
組織在“開發”(挖掘現有技術、方法的潛力予以改進)和“探索”(嘗試全新的方法)之間,通常會偏向于“開發”。許多看起來大膽的創新,其實是逼不得已的選擇,因為“開發”到達極限仍然無法滿足需要,只能另起爐灶。
適應學者對于組織中出現新事物有兩種大的解釋路線,一種是“適應結合”,類似生物進化論,老元素的結合產生新元素,然而一直沒有像遺傳法則這樣好的理論來產闡述結合的機制和過程;另一種是“適應低效”,創新是自發產生的,雖然適應過程會消滅新的事務,但是由于適應過程的低效,導致一些新事物留存下來。
適應機制對創新存在抑制作用,但是適應同時也為新事物出現提供了有利條件:一是適應的成功帶來“組織寬裕”,有更充分的資源吸收創新失敗的負面效應,減少對創新活動的管控;二是適應的成功帶來的“管理者自負”,讓管理者高估自己的能力和創新的成功可能從而過度支持創新想法;(許多創業者連續創業除了確實有過人之處,也許也有前一次成功造成的自負因素)三是“對新想法過度樂觀”,由于新想法不大為人了解,更容易陷入樂觀偏見中,就如書中所說的“在一個競相承諾的世界,獲勝的項目是那些希望壓倒現實的項目”。
組織工程師和社會工程師也一直在尋找可以影響新事物存活率或成功率的組織形式和政府流程。一種方法是,在大量新想法中盡早分辨出稀有的好想法。但是一直以來的實踐證明這個方法效果不好,特別是對于重大創新來說,往往都是一些離經叛道的想法,很難事先判斷。(是否也從側面證明了,所謂成功的創業經驗總結,其實并不像大家想的那么重要和有效,事后研究也未必能真的找到了成功的原因,更不用提事前判斷了)。第二種是現在被普遍采取的方式,就是控制創新失敗的成本,盡量不損害好想法的收益。各種“孵化器”、“事業部”都屬于這一想法的實踐——拿小賭注試一試水。但是這種策略也有局限性,也許確實更適合于互聯網和軟件服務這種邊際成本較低且易于復制和擴大規模的項目。
說了這么多,總結下來就是,創新帶有很大的不可預測性,在組織中與適應過程相互作用;過去成功的經驗可能有利新事物出現,也可能容忍了愚蠢的新想法,兩者形成了一個近似負反饋的環,前提是不因為創新失敗而徹底扼殺創新的可能。
最后再記錄一個粗淺的想法:凡事要多從第一性原理去考慮,想明白本質的目標,做對的事情比把事情做對更重要。接下來無論是開發還是探索,都是圍繞著本質的目標去做。這對于一個人來說應該就取決于他的“三觀”,對于一個組織和企業,大概就是所謂“愿景”。而一個成功的創新的組織或是系統架構或者人生(每個人生都應該是“新”的吧^^),往往都是“生長”而不是“設計”出來的,這個生長過程的藍圖就是向著那個目標前進的路線。
能做到這樣的思考和努力,已經足夠度過有意義的一生了,至于所謂“成敗”,時也運也命也。畢竟是生命的過程而不是結果,才是你生活動力和快樂的源泉。
寫在最后
沒有想到這篇讀書筆記寫了這么多,這么久。從這次寫作的過程,我充分體會到了這句話“如果你不把想法寫下來,永遠都不知道自己想的是什么”。有很多沒想清楚,或者自以為想清楚的問題,在寫的過程中越來越清晰,然后把一些原本孤立的東西聯系了起來,那瞬間產生的大概就是“經脈打通醍醐灌頂”的舒暢感覺。我覺得這么長的東西,愿意讀完的恐怕不多,更多地是寫給自己來看,這是一個痛苦又快樂的過程,希望能堅持著這么讀下去,思考下去,寫下去,好好地生活下去吧。