獎勵與懲罰
? ? ? 獎勵什么就會得到什么,這是生活的剛性原則。
? ? ? 如果你想吸引螞蟻,就把糖放在地上。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ——查理·芒格
? ? ? 約翰的所作所為讓他名利雙收,這也促使他繼續發揚這樣的行事風格。
? ? 我們貫徹能夠帶來獎勵的行為,避免會導致懲罰的行為,所以通過行為的后果——我們了解是非對錯。通過正強化可以使某種行為不斷重復下去,而懲罰將使得某種行為被終止。 能帶來利益、快樂的行為將會不斷得到重復,而帶來懲罰的行為則會消除。這就是說,獎勵(或消除痛苦)能強化行為,懲罰(或剝奪快樂)能結束行為。如果某種行為在不斷重復后,能夠及時地貫徹獎賞或懲罰,則效果最佳。
? ? 習得某種行為后,各種不同的獎勵將會強化該行為。獎賞如果事先無法預測,則反應最大,且這種行為最難以消退。賭博得到的獎勵就是如此。我們無法預測獎勵何時來臨,就無止境地嘗試。此外,獎勵的誘惑越大,則行為消退的阻力越強。
? ? 究竟什么屬于獎勵性行為,什么屬于懲罰性行為,我們總習慣把它們與過去的經歷、結果或者與生俱來的價值觀、 偏好相聯系作出判斷。(聯結效應)
? ? 得到強化的行為將越來越深入骨髓。這也是習慣、迷信、 嗜好形成的原因,它們很難一時消除。18 世紀英國作家薩繆爾·約翰遜曾說 :“習慣的枷鎖最初總是難以察覺,等你察覺的時候,已把你牢牢拴住?!?/p>
? ? 這意味著什么?意味著人們總是實施那些對他們有利的 行為。就像蜜蜂對花蜜一樣,它們去能夠得到獎勵的地方。 這同樣表明,如果給我們的獎勵是我們不需要的東西,我們同樣照收不誤。正如加勒特·哈丁(Garrett Hardin)在《鴕鳥政策》(The ostrich factor)中所說的 :“如果一個社會法律獎勵搶劫銀行的行為,那這個社會就會多出許多銀行搶劫犯。如果選拔官員的方法青睞于傻瓜,那我們就會冒出更多愚蠢的政客?!?/p>
? ? 根據瑞典的調查顯示,疾病保險系統的變化將直接影響職工病假行為。如果疾病保險系統的改革意味著病假能得到更為慷慨的賠償,則每位雇員的病假天數呈直線上升狀態。根據美國有關醫療服務的調查顯示,一旦醫療成本費用由其他人支付,則病人將會過分消費(overconsume)醫療服務。
? ? ? 為什么人們會濫用 醫療保健和 福利系統? 政府給自己買單,我們使用系統不是很自然嗎?如果不必為福利掏錢,則勢必導致這種權利的濫用。一旦越來越多的人從濫用系統中受惠,群體將日趨漠視這種行為。從個人來說,他們獲得巨大利益,而對社會來說,損失也很有限。最后每個人都形成這樣的思維。古希臘哲學家亞里士多德曾說 :“越是共有的東西,受到的關注越少,因為人們只是關注私人財產,對于公共財產卻不甚熱心。”
為什么有人會偷竊?
? ? 有一項調查顯示,在不會被抓住的情況下,23%的人表示將會實施偷竊行為。經預測,每年美國企業由于偷竊造成的損失約達到 4,000 億美元,其中 1/3的損失金額都是自己的員工所為。為什么? 幾率和獎勵。用查理·芒格的話說 :“在無法抗拒的誘惑面前,常常導致最糟糕的濫用行為?!比绻h境讓偷竊容易得逞,就變相鼓勵了偷竊行為(壞行為將形成風氣)。
? ? 查理·芒格告訴我們一種糟糕的政策是如何成為規范的 :
? ? 美國警察部門有個簡單的制度 :養老金將根據退休前一年的最后收入來派發。所以,在工作生涯的最后一年,大家一起合作,把當事人的加班時間累積增加到 1,000 個小時。退休后——盡管有些人的服務時間才達到20 年——就有一 筆可觀的收入。當然了,這都是與同事們合作、欺騙國家系統的結果。大體就是這樣,但有一點可以保證的是 :沒有一 個人為此感到羞恥。不久,他們反而覺得這是自己的義務。這樣,前有古人,后有來者——不間斷矣。
迷信的鴿子:為什么網球選手都喜歡在決賽時穿著自己的幸運服?
? ? 美國心理學家 B.F. 斯金納(B.F.Skinner)在一個實驗中,每隔一段時間就向鴿籠投放少量的食物。連續幾次后,鴿子們開始表現一些“迷信行為”。如果鴿子正在搖頭的時 候,食物掉下來,這只鴿子就認為是搖頭使食物掉下來。于是它們開始重復這種行為——因為每次這么做,總會出現食物,但實際上,食物的出現與鴿子的行為毫無關系。斯金納 在《鴿子的迷信》中說 :“人類有同樣類似的行為......一些習慣性行為與好的行為結果之間偶然的聯系將使得這種行為保持下去。盡管其中出現許多負強化的例子?!?/p>
正確的誘因重要嗎?
? ? 誘因可以作為強化物(也可稱為激勵,誘因指引起個體動機,滿足個體需求的外在刺激和獎賞——譯者注) 查理·芒格曾通過一個小故事來闡明建立正確誘因的重要性 :
? ? 在眾多企業的激勵案例中,我最喜歡的一個是聯邦快遞。它運行系統的核心——也是能使產品一體化的關鍵——就是在午夜時分,聚集所有的飛機,把所有的包裹從一個飛機轉到另外一個飛機。如果稍有延遲,整個操作就無法順利地把產品送到聯邦快遞的客戶手中。但聯邦快遞的員工總是搞砸,從沒有準時完成過任務。管理者嘗試了其他許多方法——道德勸說、威脅等等,但并不奏效。最后,有人想出了一個好方法,即降低小時薪資,但提高每個班次的薪水——一旦所有的工作都完成,他們就可以回家。瞧,一個晚上就把老問題解決了。
? ? 約翰投資了一家生化行業的新興企業,但公司業績不佳,最終約翰虧損了一大筆錢。
? ? 如果獲得成功,我們就會成為意氣奮發的風險偏好者。相反,失敗了,則讓我們畏首畏腳,消沉起來,成為風險厭惡者——即使成功或失敗完全取決于運氣。好結果并不意味著我們之前作出了好決策,而壞結果同樣不代表做出了壞決策。
? ? 所以,如果下面有人給約翰介紹一個到生化行業新興企業投資的機會,約翰很可能就此拒絕。因為大家認為過去能反映未來,約翰當然不會接受這個投資機會。假設約翰的第一個投資業績非常出色,他是否會把新提議與過去成功的經歷相聯系起來嗎?因而更加積極地參與投資計劃?這種與過去成敗經歷自動聯接的天性使得我們面對新狀況、新環境時反應活躍度下降。
? ? 對于盲目依賴過去經驗來應對現在和未來的危險性,馬克·吐溫了解得很透徹 :“有時候我們滿足于從經驗中獲取智慧,并停止嘗試。應謹慎這種行為,否則就如一屁股坐上了熱火爐蓋(on a hot stove-lid) 的貓一樣。它再也不會爬到這個熱火爐蓋上,但從此也不會有機會坐到一個冷火爐蓋上。”
那獎勵與懲罰的程度或者前后順序有什么影響?
? ? 瑪麗從不把孩子的禮物全部放在同一個禮盒里。
? ? 如果把生活經歷分割成一個個小片段,人生似乎更有嚼 頭。所以,我們喜歡把愉快的經歷分成小片段,而把痛苦的經歷揉成一團。這也是為什么瑪麗把禮物放在幾個不同禮盒中的原因。不斷有獎勵就會不斷有驚喜。比如說,一下子贏得 100美元的感覺不如連續兩次贏得 50 美元的感覺好,因為每次贏錢都會讓人有成就感。而一下子輸100 美元比兩次輸掉 50 美元的感覺要棒,因為每一次輸錢都是痛苦的過程。
? ? 我們希望事情發展越來越好。所以,先輸 100 美元,再贏得 50 美元要好于先贏得 50美元再輸 100美元的結果。我們希望先把失敗的陰霾通通驅趕掉,所以寧可先輸錢,而不是先贏再輸。因為討厭失敗的經歷,我們也不喜歡在等待失敗的過程中煎熬。我們喜歡能盡快從失敗中走出來。
? ? 聯結效應和強化都是條件反射的表現。查理·芒格曾舉了一個例子,講述如何利用這種心理力量來發明一種不含酒精的飲料。
? ? 飲料中的食用價值等作為強化物,而飲料瓶的包裝、商標名和飲料的外觀等作為刺激物......然后,我們繼續利用第二種條件反射——巴甫洛夫的條件反射理論。如何利用該理論取得巴甫洛夫的聯結效應呢? 顯然,我們只要把該飲料和商標與大眾喜歡的東西聯系起來 :讓人熱血沸騰的經歷、性感的尤物、快樂的時光——諸如此類。
? ? 那在什么情況下昔日奏效的條件反射又失去作用呢?查理·芒格繼續說 :如果顧客嘗試另外一種飲料品牌,并發現該品牌為一大 強化物(reinforcer),他將會改用這種品牌正如我們所知,在婚姻中,如果你一直陪伴左右、隨時待命,則伴侶換用另外一種品牌的可能性就小,因為婚姻的設置并不包括長久的分離。同樣,如果你銷售的產品隨處可見,那顧客改用其他產品的可能性也小,由此,就產生了強化作用。
注意點
? ? 1·美國政治家、科學家和哲學家本杰明·富蘭克林告訴我們 :“一小匙的蜂蜜比一加侖的醋更能吸引蒼蠅?!?b>在改變行為方面,表揚比懲罰更有效,所以鼓勵正確的行為要比 打擊錯誤行為的效果更明顯。
? ? 2·蒙田曾說 :“司法部門傳統的做法就是殺一儆百。懲罰人們過去的錯誤無疑是愚蠢的,正如柏拉圖所說 :做過的 事,潑出去的水?!钡@么做的目的是防止重蹈覆轍,也是防止其他人犯同樣的錯誤。絞死犯人,我們不是為了讓他贖罪,而是為了改造其他人。
? ? 3·不要從自己或別人的成敗經歷中過度學習(overle-arn)。同樣的行為在不同的情況下可能會取得不同的結果。
? ? 4·區分技能和運氣。查理·芒格說 :“如果你坐上了具有競爭力的高薪職位,你心里應該弄清楚,今天的成就與能力和成功的動力因素 有幾分關系,而 運氣因素 又占到幾成?!?/p>
? ? 5·美國小說家厄普頓·辛克萊(Upton Sinclair)說 :“一個人的興趣范圍取決于他所拿薪水要求的范圍?!?b>因為我們只做能奏效的事情,所以應保證誘因的正確性。要把激勵機制和業績聯系起來,也要與你最終達成的目標因素聯系起來。讓別人知道正確和錯誤行為的分水嶺,并了解他們的表現、獎勵以及你最終要達成的成果三者之間的聯系。比如說, 把經理的薪酬與其(管理的部門)取得的商業價值聯系起來,剔除其中所花費的成本因素等。汽車保險商蓋可(GEICO) 的計劃就體現了伯克夏·哈撒韋公司的薪資原則沃倫·巴菲特表示 :
? ? 目標的制定,必須遵循 :(1)與經營業務的財政狀況相符合 ;(2)簡單扼要,便于順利執行 ;(3)與方案參與者每日的活動直接掛鉤。最后(4)我們必須避免類似于“中彩票” 的方案,比如說派發伯克夏股票期權用來激勵員工,因為它們的最終價值——0 ∞——完全不在我們想要影響的目標人 群的掌控內。我們認為,不切實際的薪資系統對于業主來說是一種浪費,而且可能抵消我們在管理層推行的行為價值觀。
? ? 6·獎勵需要落實到個人的表現,而非表揚整個組織機構的努力或進度等 ;此外,事后進行獎勵,而非事前獎勵。
? ? 7·不要把金錢作為惟一的激勵。有時候完成自己喜歡的事情后得到獎勵,會把自己熱愛的東西淪為冷冰冰的工作。獎勵會改變我們的想法。曾經我們因為喜歡做而做,現在變成為了賺錢而做,所以其中的玄機就是要表明獎勵的性質。因為取得了成就而得到嘉獎將激發更強的斗志,因為我們感覺到額外的滿足。如果一種獎勵讓人感覺受控,則會變成為了取得報酬的被動產物,也會讓這件事的吸引力大打折扣。 布萊茲·帕斯卡爾(Blaise Pascal)曾說 :“我們通常能被自己所發現的原因說服,而不是別人告訴我們的理由?!?/p>
? ? 8·制度或者章程的建立必須大力倡導和鼓勵目標行為。對于不提倡的行為不要給予物質獎勵。在這種制度下,必須讓那些負面行為付出代價、難逃懲罰。同時,不受歡迎 的行為 付出的代價 必須要高于其帶來的利益。比如說,盜竊得逞的快樂必須要低于入獄的痛苦。
? ? 9·有時候,很難改革一種制度。沃倫·巴菲特說 : 如果手握重權的人從某種體制中獲得巨大收益,特別是所獲利益跟該體制不成比例,這時候,一個體制就很難被改革。
? ? 10·決策人應對自己的行動負責。美國哲學家查理·弗 蘭克爾(Charles Frankel)在《現代人的案例》(The Case for Modern Man)中是這樣定義“責任”的 :“負責任的決定就是決策人或組織必須對間接或直接受到該決策影響的人負責?!辈槔怼っ⒏褚苍硎?:“有個例子可以用來解釋所謂的‘責任體制,這就是羅馬人在建造拱門時設立的一 套制度。負責拱門設計的人必須在施工架撤掉后,自己先站在拱門下。這就像自己幫自己捆扎降落傘一樣。”