《簡捷啟發式:讓我們更精明》是德國的適應行為與認知(adaptive behavior and cognition,ABC)研究組所寫就的一本研究報告集。不過在我看來,這本書其實講的遠不止豆瓣中所提到的機器學習、人工智能,對于人的學習與思維發展也有著較大的啟發意義。
1、背景
簡捷啟發式的提出建立在全能理性的歷史背景下,人們癡迷于古希臘時期的數學理性,渴望著用各種各樣的數學模型來模擬現實世界。在這種背景下,多元回歸等統計模型應運而生,甚至產生了拉普拉斯妖這樣的科學神話。盡管后來出現了赫伯特·A·西蒙提出的有限理性理論,但人們對有限理性的誤解又進一步導致了人們制造更復雜的模型的現象。
但現實生活中,真的需要這么復雜的模型嗎?舉個經典的問題,你媽和你女朋友同時掉水里了,你要救誰?作為一個正常人,顯然不可能真的根據各種變量去求選擇就那個的概率。時間和資源也不允許這樣。但是,這是否就意味著我們的就沒有辦法在這種匆忙的狀態下作出理性的選擇呢?ABC研究組在研究的,也就是這種時間、知識甚至計算能力有限的情況下如何作出理性決策的方法。
2、適應工具箱
ABC研究組的研究基于這樣一個觀點:人類和動物的理性是有限的(既不是無理性,也不是完全理性),但這種有限理性并非人類進化中的缺陷。恰恰相反,這種有限理性讓我們能夠實現知識的更新,從而充分適應環境。也就是說,我們的理性只要能夠滿足環境以及社會的需要,就足夠了。但現實生活的問題很多,僅靠一種思考方式是無法適應環境的,因此就需要針對不同問題,采用不同的啟發式解決問題,這種像工人的工具箱一樣,針對不同的問題采用不同啟發式的思考模式,就叫做適應工具箱。
書中提及了很多種啟發式,我在這里重點介紹其中的三種。
(1)再認啟發式
再認啟發式主要適用于僅有兩個選項的選擇場景。它的內容是:當你認得其中一個選項,但不能再認另外一個選項的時候,選擇能再認的那個選項。
舉個例子:以下兩個國家那個人口更多?A)日本;B)?厄立特里亞。請讀者朋友們選擇一下。
按照再認啟發式的原理,我只認得A,B選項完全沒聽說過,因此選擇A。
事實也是如此。據百度百科,日本2013年的人口為1.26億人;而厄立特里亞位于東非,2012年的人口數據也僅有609萬人。
也許有朋友會認為:這不會是作者隨便找了個不認識的地方來硬湊一個說法吧?但事實上,類似問題的科學研究已經顯示了這種再認啟發式的準確性。ABC針對”哪一個美國城市有更多居民:圣地亞哥或者是圣安東尼奧?“分別向芝加哥大學(美國學生)和慕尼黑大學(德國學生),結果顯示,盡管美國學生的正確率僅有62%,而100%的德國學生都作出了正確的選擇。這種選擇的依據在事后發現,德國學生們都聽說過圣地亞哥,但他們多數人都不知道圣安東尼奧,因此他們能夠運用再認啟發式,從而作出了正確的選擇。
(2)采納最佳啟發式
那么,當選項均能再認,且線索和選項變得更多的時候,人們是如何根據這些繁雜且依舊不完善的線索和信號進行推斷、預言和決策呢?
歷史上一種理性的決策方式是道德決策代數學(moral algebra)——就是將一張紙折成兩欄,一欄寫正面影響;另一欄寫負面影響,接下來對兩欄的線索進行衡量,如果正面影響的m條理由抵得上另一欄的n條理由,就把它劃去。直到最后留下的線索就是決策的關鍵因素。但在這種決策方法中,需要大量的時間、知識、計算能力,在復雜的人類選擇情境下,這種方法是很難奏效的。因此,書中介紹了一種能在有限資源下進行迅速決策的方法:采納最佳啟發式。
采納最佳啟發式(take the best)的本質,就是“為一個好理由下賭注”。這種啟發式將我們參與選擇的線索進行權重上的排序。在決策時優先使用權重最大的線索進行判斷,如果一個線索能夠區分兩個選項。就停止搜索,并選擇線索支持的那個選項;否則就選擇剩下線索中權重最高的線索接著判斷。
比如說,《寵物小精靈》中的噴火龍和《數碼寶貝》中的暴龍獸,誰更厲害?由于這兩個角色一般看動漫的人都知道(即都能再認,應該沒有人不知道噴火龍和暴龍獸吧= =),不能采用再認啟發式進行判斷。評價的標準有很多,這里不妨考慮6個比較明顯的線索(參考了JOJO提升使者的評價標準):招式破壞力、速度、射程、持續戰斗力、成長性、精密性。根據采納最佳啟發式的方法,需要對這些標準(線索)進行排序。根據啟發式的觀點,單獨使用時作出正確歸類的線索應當排在作出較少正確歸類的線索之前。根據以前看動漫的經歷,考慮到這是團隊作戰,不妨設想:成長性是最佳線索,其次是招式破壞力、速度、精密性、射程、持續戰斗力。
那么首先對成長性進行判斷,由于《寵物小精靈》中噴火龍與小智之間出現過摩擦,并不如《數碼寶貝》中太一與亞古獸之間的友情那么持久。再加上數碼寶貝和人類是能夠直接交流的,比寵物小精靈的交流便捷得多,因此認為噴火龍的可成長性弱于能向人類直接交流學習的暴龍獸。因此停止搜索,選擇暴龍獸。
至于結果,請看這個:【個人漢化】神奇寶貝VS數碼寶貝【生死決斗DEATH BATTLE】
采納最佳啟發式為什么能起到這樣的作用呢?書中提到了3個原因:(1)采納最佳啟發式的本質是一個擁有不可替代權重的線性模型。當一個線索擁有者不可替代的權重時,其計算結果事實上與綜合考慮所有線索的結果是一樣的;(2)采納最佳啟發式已經進行過最高權重的線索值間的比較;(3)采納最佳啟發式相當于一個簡單分類樹,根節點就是最高效度的線索,這保證了其科學性。
(3)排除歸類法
排除歸類法(categorization by elimination)主要用于多種線索多種選擇的場合。它首先對線索進行權重上的排序,然后將所有線索分別對這些選擇進行分類,獲得數量等同于線索數的分類方式,最后對新的待分類物按照順序分別使用分類方式進行匹配,并排除不再這些分類方式交集中的選項,直到最后只剩下一個選項。
這里偷懶地使用了書中的例子(P301),假設我們要對一種酒的類別進行判斷,那我們首先需要在訓練時,對甜味、色澤、芳香、有無酒精進行排序(就品酒來說,色澤>芳香>甜味>有無酒精),然后用著四個線索分別對已知的酒類進行劃分,得到4種分類方法。最后用這種分類方法,分別從色澤、芳香、甜味、酒精進行匹配排除。直到剩下一個選項,或者所有線索用盡(此時需要在剩下的選項中隨機猜測)。
3、簡捷啟發式的啟示是什么
縱觀書中提到的簡捷啟發式,一個有趣的共同點在于:書中提到的簡捷啟發式,其關鍵步驟都包括了對線索的權重排序。即使是再認啟發式,也只是將“能否再認”這一線索的權重放到最大的采取最佳啟發式。這也意味著,當我們能夠掌握一兩個效度最高的線索,就足以進行比較準確的決策了。
那么問題來了,我們如何知道這個線索是效度最高的呢?
對于這個問題,RAFT模型(reconstruction after feedback with the best,采用采納最佳啟發式的反饋后重建)可以提供這樣一種解釋的思路。RAFT模型描述的是事后通現象(一種人們事后自欺欺人地相信自己早已正確地預測了事件結果的傾向)的過程,這個模型認為,有關答案的反饋信息導致了線索值的更新,如果原始知識無法直接得到,則依據反饋的結果來更新自己判斷的線索值。(見圖)
這個流程圖的其中一個核心思想是,當人們不能回憶選項在某個線索的關系時,根據反饋的結果,推斷出選項各個線索的關系,并應用采納最佳啟發式,只選取最重要的線索,作為今后的決策標準。
這也意味著,線索的效度需要來源于現實的不斷實踐與對反饋的回憶。我們的一些選擇和判斷肯定不會一直準確,而是會有出錯的時候。這時,我們的總結與反思事實上是在將我們犯錯的過程與事實進行不斷對照,從而發現了通往正確選擇的最重要的線索。這種過程和研究時的學習階段一樣,是需要通過大量類似的實踐來不斷調整的。當這種訓練達到一定階段的時候,我們的決策才會變得又快又準。
4、總結
簡捷啟發式,是在我們面對知識、時間存在限制的情況下保證決策理性與準確度的途徑。本文認為,簡捷啟發式的本質,是對線索順序的優化與選擇,并從中選擇最大權重若干個線索,作為決策的標準。而線索的權重,需要依靠現實的實踐不斷調整,在回憶與反思中調整線索甚至識別新的更重要的決策標準。
正如書中巴特萊特提到的“記憶不是無數固定不變的、毫無活力的不連貫痕跡的重新激活。它是富有想象力的建構或重新建構過程”(P233),成為一個理性的人未必需要像計算機一樣,擁有海量的知識和運算能力(也不可能),但我們完全有可能通過實踐中的反思與調整,得到更為簡練而有效的知識結構。而這,也是作為高段位的學習者真正應該具備的。