聊聊洞察力

都說(shuō)上了大學(xué)之后要知道"學(xué)習(xí)如何學(xué)習(xí)"而不是去學(xué)習(xí),結(jié)果這句話(huà)仿佛變成了一句俗語(yǔ),并沒(méi)有人深究什么叫做學(xué)習(xí)如何學(xué)習(xí)了。不管是快速學(xué)習(xí)新知識(shí)(而非系統(tǒng)性),還是在科研領(lǐng)域追求突破,還是學(xué)以致用精進(jìn)工作之后的工程實(shí)踐,都頻繁的需要一種能力,這種能力是和死讀書(shū)、背知識(shí)點(diǎn)背道而馳的,它可以提煉新規(guī)律,發(fā)現(xiàn)新定理,形成新方法。

這種東西就是洞察力。

《Seeing What Others Don't》,即《洞察力的秘密》一書(shū)提到的120個(gè)案例中,82%的案例使用了觸類(lèi)旁通(即類(lèi)比)的辦法,38%來(lái)自于錯(cuò)誤理論自相矛盾導(dǎo)致正確理論的建立,10%來(lái)自于巧合(偶然發(fā)現(xiàn)了正確的事實(shí)),7。5%來(lái)自于好奇心,25%的情景是打破僵局急中生智。你能夠?qū)σ陨蠑?shù)字加總后發(fā)現(xiàn),很多案例都具備2種或以上的情景。

我不禁有些好奇,以上的分類(lèi)數(shù)目——5類(lèi)——就一定合理嗎?在聚類(lèi)算法中,隨便選擇一個(gè)magic number并不是什么特別好的方案,就算是自動(dòng)選擇聚類(lèi)數(shù)目的算法,其中的超參數(shù)也是指定的吧?我們可以簡(jiǎn)單一點(diǎn)把上面幾個(gè)分類(lèi)再次聚成3類(lèi)。


1 ?洞察力的根源


a 觸類(lèi)旁通+好奇心導(dǎo)致的洞察力

很少有人聽(tīng)說(shuō)過(guò)二戰(zhàn)爆發(fā)之初,1940年11月11-12日的塔蘭托戰(zhàn)役,英國(guó)的老式戰(zhàn)機(jī)使用改造后沉水較慢的機(jī)載魚(yú)雷轟炸了意大利艦隊(duì),使后者的半支艦隊(duì)退出戰(zhàn)隊(duì)長(zhǎng)達(dá)半年之久。如果你是一個(gè)充滿(mǎn)好奇心、懂得觸類(lèi)旁通旁通的人,那么恭喜你,你和當(dāng)年日美兩國(guó)的海軍上將想到一塊兒去了。極為諷刺的是,時(shí)任美國(guó)海軍作戰(zhàn)部部長(zhǎng)的上將哈羅德塔斯克在40年11月22日就簽署一份備忘錄,"在珍珠港內(nèi)放置魚(yú)雷網(wǎng)非常有必要",還給海軍部部長(zhǎng)寫(xiě)信說(shuō)明這一點(diǎn)。結(jié)果其他的美國(guó)人根本就不重視這一點(diǎn),認(rèn)為珍珠港水深足夠淺,而日本人長(zhǎng)途跋涉也無(wú)法在不被發(fā)現(xiàn)的情況下進(jìn)行物資補(bǔ)給。魚(yú)雷護(hù)網(wǎng)也根本沒(méi)落實(shí)。更邪門(mén)的是,日本海軍上將山本五十六本身是一個(gè)反對(duì)侵占東北、反對(duì)全面侵華、反對(duì)與納粹德國(guó)結(jié)盟、反對(duì)日美戰(zhàn)爭(zhēng)的將領(lǐng),海軍大臣出于保護(hù)他仕途的目的讓他在海上工作。與驕傲自大的日陸軍決策層不同,山本擔(dān)心的是日美正面對(duì)抗,以及是否真的對(duì)最后的戰(zhàn)果有信心。時(shí)勢(shì)所迫,山本在1941年1月把突襲思路落實(shí)在書(shū)面上,并在當(dāng)年12月放手一搏,成功地實(shí)施了震驚世界的偷襲珍珠港事件。

在這里要充分說(shuō)明的是,無(wú)端地認(rèn)為重型魚(yú)雷要下沉水深至少30米才能工作這一點(diǎn)本身就是錯(cuò)誤的:英國(guó)人用金屬絲提起魚(yú)雷前端,使腹部先落水,而且還給魚(yú)雷增設(shè)了木質(zhì)的鰭來(lái)減緩下落,在塔蘭托軍港水深僅有12米的情況下成功實(shí)施了打擊。好奇心是一種不存在先入為主的見(jiàn)解:如果不是專(zhuān)家或者科學(xué)家,你很難想象一位英國(guó)海軍將領(lǐng)不對(duì)"30米"這一神奇的數(shù)字深信不疑,但如果這一數(shù)字變成了一個(gè)科學(xué)研究任務(wù),那么事情就又不同了:人類(lèi)的主觀能動(dòng)性,或者說(shuō)"不設(shè)限"的思想就能把一部分人認(rèn)為不可行的方案變成可行方案。


b 急中生智:不能小看腎上腺素和求生意志

1949年8月5日,西蒙大拿。

15位空降消防員希望控制在曼恩峽谷發(fā)生的森林大火,然而他們?cè)诮德浜笤庥隽艘贿B串二次火災(zāi)的大爆發(fā),在每小時(shí)30英里的風(fēng)勢(shì)下,他們馬上就要被山火在1分鐘內(nèi)追上。幸存的3位消防員在瓦格納。道奇的急中生智下得以幸存:與其被火追上,不如在自己面前先放一把火,然后自己用浸濕的手帕堵住口鼻,把臉藏在余燼里。既然火的燃料就是干草,沒(méi)有了燃料火就不能蔓延,那么只要除掉干草就好了。如何除掉呢?就是用自己點(diǎn)的火除掉。

類(lèi)似的故事不一定是在求生時(shí)發(fā)生的。為什么大學(xué)生喜歡臨時(shí)抱佛腳、喜歡趕在deadline之前完成任務(wù)、作業(yè)、甚至論文?因?yàn)樵谀莻€(gè)緊張的狀態(tài)下,整個(gè)身體的機(jī)能是高效、協(xié)調(diào)的,在12個(gè)小時(shí)內(nèi)就能完成別人一周的工作任務(wù)。雖然這一點(diǎn)也不值得鼓勵(lì),但是在這種情況下,論文往往還會(huì)出現(xiàn)創(chuàng)新思維的火花,而不是像別人的工作一樣中規(guī)中矩。適度的腎上腺素是我們的朋友。因此一成不變的時(shí)間表對(duì)我而言也是毫無(wú)吸引力,適當(dāng)?shù)拇碳ひ约笆虑笆潞蟪浞值男菹ⅲ艜?huì)真正讓人感覺(jué)到"活著"。


2 破壞洞察力的根源:懶惰。

發(fā)現(xiàn)矛盾不破不立,以及巧合是提高洞察力的另外一組有效機(jī)制,這里就不得不先談?wù)勂茐亩床炝Φ母础季S上的懶惰。先把有沒(méi)有好奇心放在一邊,對(duì)問(wèn)題的視而不見(jiàn),或者習(xí)慣于把所有不滿(mǎn)足自身想法的樣本全部歸位巧合本身,就是一種思維的懶惰。而有時(shí)候太依賴(lài)巧合性的實(shí)驗(yàn)則充分說(shuō)明了行動(dòng)上的懶惰。

19世紀(jì)中期霍亂流行,當(dāng)時(shí)已經(jīng)很有名的醫(yī)生約翰斯諾提出霍亂并非是毒氣傳播時(shí),仍然遭受了不少非議。霍亂弧菌會(huì)導(dǎo)致腹瀉、嘔吐,使人脫水死亡,但那個(gè)時(shí)代里,人們并不了解細(xì)菌致病的機(jī)理,也沒(méi)有檢測(cè)微生物的儀器,因此盲目相信空氣致病是一種思維上的懶惰,畢竟大家呼吸的是同樣的空氣。隨著研究的展開(kāi),斯諾不斷發(fā)現(xiàn):

* 同一間屋子里住著的人有一部分感染霍亂,另一部分沒(méi)有

* 病人解剖后,肺部沒(méi)有病變,消化系統(tǒng)有病變特征

* 同一個(gè)社區(qū)從兩家給水公司取水,上游公司的客戶(hù)都沒(méi)有感染,下游公司客戶(hù)有較大比例感染

* 寬街水泵水井附近聚集著大量霍亂病例

第一點(diǎn)是現(xiàn)象,第二點(diǎn)是有針對(duì)性的研究,第三四點(diǎn)是帶一些巧合性的天然實(shí)驗(yàn)結(jié)果。有的時(shí)候,人是會(huì)在第三次、第四次"巧合"發(fā)生時(shí),才驚覺(jué)應(yīng)該使用新的理論來(lái)解釋之前的矛盾現(xiàn)象,而不是抱著錯(cuò)誤的理論不放,把所有outliers(異常點(diǎn))都?xì)w為巧合。按理說(shuō),斯諾的這些發(fā)現(xiàn)幾乎能徹底推翻了之前的理論了,那么為什么在醫(yī)學(xué)界里,哪怕是《柳葉刀》這樣的科學(xué)雜志都仍然執(zhí)迷不悟,長(zhǎng)達(dá)數(shù)年地反對(duì)斯諾的觀點(diǎn)呢?

思維上的懶惰和身體上的懶惰簡(jiǎn)直同樣可怕。

3 ?機(jī)器何時(shí)能有洞察力

先從一個(gè)等式說(shuō)起:

提升效果 = 增加效率(準(zhǔn)確率和速度)+ 加深洞察力(做減法)

在我眼里這就在說(shuō)一件事:機(jī)器學(xué)習(xí)的發(fā)展是離不開(kāi)前者(有監(jiān)督學(xué)習(xí))和后者(無(wú)監(jiān)督學(xué)習(xí)的)。但是往往,受到功利性、KPI的制約,前者更容易在工程化里做到極致,而后者往往能夠出現(xiàn)在科研機(jī)構(gòu)、高校研究所,在機(jī)器學(xué)習(xí)領(lǐng)域的重大突破所需要的洞察力大量來(lái)自于人類(lèi)自身的思考模式或者人類(lèi)自身的結(jié)構(gòu)(知識(shí)庫(kù),專(zhuān)家決策系統(tǒng),神經(jīng)科學(xué)etc),然而大家都把這些類(lèi)比寫(xiě)成了套路性質(zhì)的代碼,用來(lái)提高算法的準(zhǔn)確率和速度,幾乎沒(méi)人關(guān)心機(jī)器如何模仿人類(lèi)的洞察力。

直到現(xiàn)在為止,我在數(shù)據(jù)清洗上對(duì)于一份殘破不全的身份證還需要寫(xiě)正則表達(dá)式規(guī)則才能提取出其中的有效信息,但仍然有人還在迷信"機(jī)器學(xué)習(xí)包治百病,自動(dòng)化處理數(shù)據(jù)100%準(zhǔn)確",這不能怪他們——他們并不知道機(jī)器學(xué)習(xí)在現(xiàn)在的階段并不擁有真正的智能:我們有預(yù)測(cè)銷(xiāo)售的模型、物品分類(lèi)的模型、自動(dòng)駕駛的模型、自動(dòng)下圍棋的模型等等,但是誰(shuí)真正在乎讓自動(dòng)駕駛汽車(chē)又一天突然會(huì)下圍棋,又有一天突然會(huì)跟人類(lèi)實(shí)現(xiàn)智能對(duì)話(huà)?幾乎全部的機(jī)器學(xué)習(xí)模型本身仍然還是"習(xí)得性"的知識(shí)。如果沒(méi)有長(zhǎng)期無(wú)監(jiān)督學(xué)習(xí)的研究積累,機(jī)器學(xué)習(xí)模型就無(wú)法跳變式地增加準(zhǔn)確率和速度(比如大家現(xiàn)在已經(jīng)知道在多層神經(jīng)網(wǎng)絡(luò)下面加AE了);如果沒(méi)辦法對(duì)整個(gè)結(jié)構(gòu)進(jìn)行松弛,而只是對(duì)參數(shù)進(jìn)行松弛(比如注意力模型)得到的效果也只能像是行星運(yùn)動(dòng)大圓套小圓那樣的修修補(bǔ)補(bǔ)了。

機(jī)器學(xué)習(xí)的邏輯對(duì)人類(lèi)學(xué)習(xí)的邏輯模仿至少要滿(mǎn)足幾點(diǎn)才可能接近到達(dá)產(chǎn)生智能的關(guān)鍵點(diǎn):

* 單位時(shí)間耗電量(能源)就像人類(lèi)的精力約束一樣,將成為新的懲罰項(xiàng)

* 在1的基礎(chǔ)之上,模型對(duì)于增加新參數(shù)而言,更喜歡對(duì)參數(shù)分類(lèi)或者去除(決策樹(shù)剪枝、L1正則化)

* 注意力僅僅是學(xué)習(xí)的一小部分:知道哪里需要注意本身就是一種洞察力,這種洞察力絕對(duì)不是僅有領(lǐng)域內(nèi)的知識(shí)就足夠的,要把知識(shí)應(yīng)用于領(lǐng)域外,再進(jìn)行迭代,才有可能更好地進(jìn)行注意力管理。人尚且有自控力不足,不想學(xué)習(xí)只想打游戲的時(shí)候,何況暫時(shí)沒(méi)有自主挑選能力的機(jī)器?如果機(jī)器知道哪本書(shū)寫(xiě)得好,哪本書(shū)寫(xiě)得爛,很明顯要比不加挑選地學(xué)習(xí)幾十萬(wàn)本書(shū)高端得多。總讓機(jī)器看10w+的朋友圈,這個(gè)機(jī)器的思維估計(jì)會(huì)low破天際。


結(jié)論:今天的努力工作和思考,不僅僅是為了維護(hù)人類(lèi)洞察力的尊嚴(yán),也是為了以后還能有資格腦后插管。CPU、GPU、FPGA能異構(gòu)計(jì)算,在其中加入人腦也并不違和。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容