蓋爾-沙普利算法 課程分享14 2022-07-29

蓋爾-沙普利???課程分享14

? ? ? ?這是通識選修課《經濟研究中的計算方法》第六講課例之一,旨在說明一種選擇背景下的博弈算法。

一、羅伊德·沙普利

? ? ? ?2012年,美國羅伊德·沙普利(Lloyd S. Shapley,1923-2016)與埃爾文·羅斯(Alvin E. Roth1951-)因“穩定配置理論和市場設計實踐”(for the theory of stable allocations and the practice of market design)的貢獻共同獲得了諾貝爾經濟學獎。在頒獎典禮上,當年近九十的沙普利顫顫巍巍地登上領獎臺時,掌聲響起,實至名歸。而這一切的發生,最初不過是源于沙普利和伙伴大衛·蓋爾(David Gale,1921-2008)之間的一場關于婚姻的討論。

2012年諾貝爾獎頒獎儀式現場,從左至右依次為:生理學或醫學獎得主日本科學家山中伸彌、文學獎得主中國作家莫言、經濟學獎得主美國人埃爾文·羅斯和羅伊德·沙普利。

? ? ? ?羅伊德·沙普利,1923年出生于美國馬薩諸塞州的劍橋市。他的父親是當時美國鼎鼎有名的天文學家——哈洛·沙普利。他不僅是美國知識界熟悉的公眾人物,同時也是政治上的活躍人物之一。出身于這樣的家庭,沙普利如果選擇子承父業學習天文學的話,那么無異于踏上了自己事業成功的康莊大道。

? ? ? ?但是沙普利選擇聽從內心。相比于星空的廣袤無垠、星圖的宏偉壯觀,沙普利似乎更偏愛數學的嚴謹。因此進入哈佛大學后,他開始學習數學。然而大學第三年,第二次世界大戰爆發,沙普利應征入伍。

? ? ? ?因為這樣的家庭,沙普利耳濡目染之下,對于天文學也有一定的了解。進入軍隊后,他就被任命為氣象預報員。1943年,沙普利被派遣跟隨美國陸軍航空隊,越過太平洋、毛里塔尼亞、印度、喜馬拉雅山,最近輾轉到達中國成都支援抗戰。

? ? ? ?1944年,沙普利因破解了日本的氣象密碼而獲得美國青銅星章。

? ? ? ?戰爭結束后,沙普利重新回到哈佛校園。在取得學士學位后,他轉至普林斯頓大學繼續學習數學。

? ? ? ?沙普利剛剛進入普林斯頓學習,就被馮·諾依曼認為是博弈論研究領域里最明亮的新星。沙普利的思路十分敏捷,而且相當清晰。一個同齡人評價他“能做很好的數學演講,知道很多東西”。《美麗心靈---納什傳》一書中也提到過約翰·納什對沙普利的看法:“沙普利完美無缺,一個才華橫溢的數學家,戰斗英雄,哈佛學生,哈洛的兒子,馮·諾依曼的寵兒,塔克也對他有所偏愛。沙普利在老師和學生中一樣討人喜歡,是普林斯頓校園中少有的幾個人物之一。”

? ? ? ?沙普利在生活中扮演著良師益友的角色。當納什在為自己論文想出一個例子而絞盡腦汁時,沙普利花費好幾個星期幫他提出并證明了一個復雜而精妙的例子。

二、蓋爾-沙普利GS算法Gale-Shapley?algorithm)

? ? ? ?1960年,大衛·蓋爾問沙普利:“不論人們一開始的最佳選擇是誰,人們最終都能獲得穩定的婚姻嗎?”

? ? ? ?沙普利最終在回信中回答:“讓每個男生先向自己最佳選擇求婚,然后讓女生們在追求者中選出最喜歡的那一個,但先不告訴這個男生,而是告訴其他男生他們已經被拒絕。直到再也沒有追求者出現,女生才告訴她最喜歡的那個男生,他被接受了。接著那些被拒絕了的男生會向他們的第二選擇、第三選擇求婚,直到被接受為止。最后,每個女生都只剩下一個追求者。這時候他們的婚姻就是穩定的,因為男方和女方都會對拒絕過他們的異性產生反感。”

? ? ? ?征婚選擇的最佳策略:“有n個美女逐個介紹與你約會,依序每次只見一個,你選了她就沒機會見到后面可能更好的;如果讓她走了,也許后面都不如她,問怎么選結果最好?”這問題經數學推演后有個很簡單的一般結果,最大概率選到了心儀美女的策略是:對于n個依次來臨的機會,首先對前[n/e]個僅僅作了解,不做選擇,然后開始將約會的與前面所有見到的相比,如果更好就接受,否則等下一個。這里e=2.71828…,[n/e]是n/e的整數部分。

? ? ? ?1962年沙普利和大衛合寫了論文《高校招生與婚姻穩定性》,并發表在《美國數學月刊》上。看似兩個風馬牛不相及的事情,被這二位發現了相同的數學形式,不得不佩服數學家的敏銳目光。在這篇文章的基礎上,后人不斷將其應用于社會的各個方面,比如高校招生、腎臟匹配等,大大促進了社會的發展與穩定。

? ? ? ?蓋爾-沙普利算法沒有用到什么高深的數學,羅斯的應用基本也是套用公式定理,他們只是把數學應用的本領發揮了出來。套用公式定理的數學應用比較簡單,基本是將與公式定理適用的實際問題,規范整理一下,直接套用就行了。對于離現成理論比較遠,不大靠近規范的數學問題,就需要剔除枝節抓住重點,抽象歸納成一個數學模型,然后尋求數學的答案。

? ? ? ?由此可見,此獎本應三個人分享,包括原先加州大學的大衛·蓋爾教授,遺憾的是,他已經去世了,而諾獎規則只授予在世的專家。實際上,是大衛·蓋爾和沙普利做出了理論方面的結果,而埃爾文·羅斯后幾年在很多實際應用方面落實了,做出了具有現實意義的貢獻。

? ? ? ?這課題雖然以“征婚選擇”為切入點,其實談的是對于n個依次來臨機會,最佳選擇策略的公式和定理。現實中遇到的相親、考大學、求職、選項目和逛商店買東西,都是符合這公式和定理的應用。

? ? ? ?直觀起見,這里以一個“電梯選物”的例子說明蓋爾-沙普利算法。

有三包米,大、中、小各一袋,分別放置于1、2、3樓電梯門口外。一人在電梯內,從1樓升至3樓,只能取其中一袋,當然希望越大越好。如果隨機取,則取得大、中、小袋的概率均為1/3。

現在我們應用蓋爾-沙普利算法,在[n/e]=2樓時做出選擇。即,在一樓不取,只看米袋大小;升至二樓看,比一樓大就取走,比一樓小就升到三樓取。這樣的策略得到米袋大小的概率分別為:大1/2,中1/3,小1/6,見下圖所示。

電梯選物

三、沙普利的中國情結

? ? ? ?談起沙普利,許多中國學者會對他有一種天然的親切感,這主要源于他曾經在中國的土地上與中國軍民并肩抗擊過日本侵略軍。1943年,作為哈佛大學數學系的一名本科生,他應征入伍成為一名空軍中士,并很快奔赴中國成都戰區。據說那里的抗戰博物館里,就有當年的年輕軍人羅伊德·沙普利的照片。當時,沙普利就展現出卓越的數學天才,曾因為破解氣象密碼獲得銅星獎章(Bronze Star)。

? ? ? ?戰爭結束后,沙普利回到哈佛大學繼續念書,在1948年取得數學學士學位,隨后進入普林斯頓大學數學系,一路念到博士畢業,他的博士導師也是約翰·納什的導師塔克(A.W.Tucker)教授。此后,他長期在美國著名的“戰略思想庫”蘭德公司工作,1981年后,則一直擔任美國加州大學洛杉磯分校數學和經濟系教授。

? ? ? ?2002年8月14日到17日,沙普利因為參加青島大學承辦的“2002國際數學家大會‘對策論及其應用’衛星會議”,再次來到中國。青島大學的高紅偉教授作為會議組織者,至今還留著一份為沙普利辦理入境簽證時青島市政府出具的邀請函原件,“沙普利被譽為博弈論的無冕之王,精通博弈理論,但卻不太喜歡現代的信息技術,不喜歡使用電子郵件與別人進行溝通”。昔日的英武少年已成為一個科學“老頑童”,他不拘小節,動不動玩“消失”。一次,高紅偉派十幾個學生把他找到時,發現79歲的教授沒有回賓館,而是在大廳的沙發上睡著了,而且一睡就是3個小時。

? ? ? ?青島之行,沙普利再次講述起他與中國將近70年的淵源時,依然激動。

羅伊德·沙普利

四、諾貝爾獎

1.獎項

? ? ? ?諾貝爾獎(瑞典語:Nobel priset,英語:Nobel Prize)是指根據瑞典化學家諾貝爾(阿爾弗雷德·貝恩哈德·諾貝爾,Alfred Bernhard Nobel,1833年10月21日-1896年12月10日)1895年的遺囑而設立的五個獎項,包括:物理學獎、化學獎、和平獎、生理學或醫學獎和文學獎,旨在表彰在物理學、化學、和平、生理學或醫學以及文學上“對人類作出最大貢獻”的人士,并于1901年首次頒發。獎金為他捐出的3100萬瑞典克朗所產生的利息和其它收益。

? ? ? ?1968年瑞典中央銀行為紀念其成立300周年,增設“瑞典中央銀行紀念諾貝爾經濟科學獎”,該獎于1969年首次頒發,人們習慣上稱這個額外的獎項為諾貝爾經濟學獎

? ? ? ?諾貝爾獎的甄選委員會通常在每年10月公布得主。頒獎典禮于每年12月10日,即諾貝爾逝世周年紀念日,分別在瑞典首都斯德哥爾摩和挪威首都奧斯陸由國王舉行授獎儀式。

? ? ? ?遵照諾貝爾遺囑,物理學獎和化學獎由瑞典皇家科學院評定,生理學或醫學獎由瑞典皇家卡羅林醫學院評定,文學獎由瑞典文學院評定,和平獎由挪威議會選出。經濟獎委托瑞典皇家科學院評定。每個授獎單位設有一個由5人組成的諾貝爾委員會負責評選工作,該委員會三年一屆。

2.為什么沒有數學獎?

? ? ? ?對這個問題有許多猜測:

A.數學太理論化:作為一名發明家和實業家,諾貝爾設立獎項的初衷是為了獎勵那些對世界有益的、杰出的“實用”發明或發現。他可能認為數學太理論化,沒有太多實際應用。

B.數學并不有趣:諾貝爾自己的研究領域是物理和化學,他對文學感興趣,而醫學在世紀之交開始走向成熟,和平獎的設立是為了改善他作為發明炸藥的“死亡商人”的公眾形象。而他對數學既不感興趣,也不需要感興趣。

C.當時已經有著名數學獎:瑞典和挪威的國王奧斯卡二世本身就是數學家,他設立了一個著名的數學貢獻獎。諾貝爾可能認為自己沒必要復制一個已有的知名獎項,何況,他感興趣的那些領域正好需要設置一些享有聲望的獎項。

D.愛情有傳聞說諾貝爾之所以沒設數學獎,是因為諾貝爾心儀的女人被當時瑞典最著名的數學家搶走了。恨屋及烏,諾貝爾就不想設立數學獎,因為首次很可能頒給他。

諾貝爾獎

? ? ? ?還是覺得A靠譜些。結合諾貝爾的遺囑和后來頒獎的情況看,該獎的確更青睞那些對人類社會的文明進步有“看得見效果”的成果,包括自然的和社會的。這樣,沒有數學獎就可以理解了。

? ? ? ?不僅如此,就連物理學獎都必須是經過實驗或觀測證實的理論才授獎。比如大名鼎鼎的天體物理學家霍金就終生無緣諾獎;愛因斯坦的相對論和引力理論也沒有得獎,他1922年獲獎的成果是光電效應定律,評委會的通知直接說:“沒有考慮您的相對論和引力理論的價值,將來這些理論得到確認后再考慮。”

? ? ? ?正因如此,一些諾貝爾獎頒獎成果的周期很長,有的甚至經過幾十年的檢驗后才頒獎。特別是經濟學獎,一個理論看到效果,往往需要很長時間,而經受住時間考驗的好東西,諾貝爾獎組委會才敢頒獎。但諾獎又規定不頒發逝者,于是有人說,要得諾貝爾經濟學獎,不但要聰明,還要長壽,比如約翰·納什,比如羅伊德·沙普利,以及大衛·蓋爾的遺憾。

? ? ? ?說回前面的話題,雖然諾貝爾沒有設立數學獎,但還是有不少數學家得到過諾貝爾獎。這里面最多的就是經濟學獎,比如約翰·納什(1994年)和羅伊德·沙普利(2012年)都是數學家,還有1975年的蘇聯數學家康托羅維奇,1983年的美國數學家G·迪布魯,等等。有人戲言,諾獎沒有數學獎,于是數學家組團去拿經濟學獎。

? ? ? ?此外還有,1979年,美國數學家阿蘭·柯馬克因為創立了計算機X射線斷層成像(CT)的數學理論,從而獲得了諾貝爾醫學獎。

? ? ? ?1985年,美國數學家赫伯特·豪普曼因為與物理學家卡勒合作發明X射線直接測定晶體結構的數學方法,從而獲得了諾貝爾物理學獎。

3.評獎程序

? ? ? ?根據諾貝爾遺囑,在評選的整個過程中,獲獎人不受任何國籍、民族、意識形態和宗教信仰的影響,評選的第一標準是成就的大小。

? ? ? ?然而,某些獎項有時帶有明顯的政治傾向,也是眾所周知的。

? ? ? ?諾貝爾獎之所以得到世界公認,原因之一是它的評獎程序公平。獲得者事先一無所知,既不用把自己科研成果一一上報,也不需要填表,更無需自吹自擂成果有什么獨創和高明,不可能拉關系、走后門、行賄等等。評獎程序是由同行專家提出推薦,再由權威專家評判。評判后,發布消息,最后通知本人。

? ? ? ?實際上,歷史上有3個人在去世后獲得諾獎。

? ? ? ?第一位是瑞典詩人卡爾費爾德。他是諾獎評委和終身秘書,一生中多次被提名,自己都為避嫌而拒不接受。所以在他去世半年后,被追授了1931年諾貝爾文學獎。

? ? ? ?第二位是聯合國第二任秘書長達格·哈馬舍爾德。1961年9月18日,他在剛果飛機失事遇難,一個月后他被追授了諾貝爾和平獎。

? ? ? ?1974年開始,諾貝爾基金會規定:諾貝爾獎原則上不能授予已去世的人,所以以后就不會有這類情況出現了。

? ? ? ?但第三位特例還是發生了。2011年,瑞典卡羅琳醫學院宣布拉爾夫·斯坦曼憑借“發現樹突狀細胞及其在后天免疫系統中的作用”而另外兩位科學家分享諾貝爾生理學或醫學獎。在諾貝爾委員會公布得獎名單前三天,2011年9月30日,斯坦曼因胰臟癌離世,諾貝爾委員會維持授獎的決定,他仍然獲得諾貝爾獎。拉爾夫·斯坦曼成為目前最后一個去世后追授的人。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
禁止轉載,如需轉載請通過簡信或評論聯系作者。

推薦閱讀更多精彩內容