新聞類別
副刊
詳情#
【明報專訊】二○○三年,《有你終生美麗》裏的數學家納殊(John Nash),得了諾貝爾經濟學獎九年後,來到香港與大學生分享,可容納四百人的演講廳,塞滿了逾千人。
那年頭,「博弈論」在香港成為一時的話題。
往後,納殊再訪港,都是應國際知名的動態合作博弈學家楊榮基教授邀請而來。
只是,沒想到今年夏天,博弈論再一次成為話題,不過是因為納殊突然遇上車禍,與世長辭。
「人人懂博弈,世界會更美好」
雖然我們都聽過博弈論(Game Theory),但很多不精於數學或經濟理論的人如我,其實都對納殊和他的博弈論一知半解。像不少傳媒報道這次壞消息時,介紹納殊時說他是博弈論的始創人。
在學術界裏,真正開始有系統地研究博弈的人,是納殊的兩個老師摩根斯坦(Oskar Morgenstern)及馮諾曼(John von Neumann),他們在一九四四年出版了《博弈論和經濟行為》(The Theory of Games and Economic Behavior)。那時候,納殊還是學生,五年後,他在研究博弈論的博士論文中,提到「納殊均衡」(Nash Equilibrium),這才是讓他在四十五年後獲得諾貝爾獎的。
楊榮基教授說,很多人不知道什麼叫博弈,以為這是與賭博有關,「雖然賭博也是博弈的一種」。那麼,什麼是博弈?一盤棋?一個遊戲?「博弈是一個情况,你做的行為影響人,人的行為也影響你,這當中不一定有競爭(competition),不過人與人之間互相有存在矛盾的利益(conflicting interest),例如你排隊買食物,你排在前面,會令後面的人排隊的時間長了。人生當中,除非住在荒島一人過活,否則不論在經濟、社會,甚至在家裏,也會存在博弈,我看電視,聲浪太大,會影響太太,而她所做的事,會影響我,於是我或許要把聲浪收細一點,然後她又遷就我。如果每個人都懂得博弈,這個世界會更美好。」
不一定是競爭中取勝
不過,若人人都懂得博弈,不是反而會愈來愈不和平嗎?計算、策略、致勝之道,坊間不少博弈教學,都說學博弈可讓人推算出最有利自己的策略,從競爭中勝出,楊教授說,很多人都誤解了博弈論,尤其納殊說的「納殊均衡」,「數學告訴我們,只顧自己利益的話,長遠會是個悲劇,納殊均衡其實就是解釋這現象」。
古人的博弈——《孫子兵法》
楊教授說,博弈的概念,其實自古就有。「你若問我,什麼時候有博弈的概念,我會說是《孫子兵法》。人們打仗,有敵有我,兵法就是談博弈,研究怎樣才可以打勝仗,孫子也有教兵怎做間諜、心理、處理兵糧等,只是它沒什麼系統地歸納,只說了兵法的精要。但孫子其實也不是主張打仗的,他是怎樣說的?『百戰百勝,非善之善者;不戰而屈人之兵,善之善者也。』百戰百勝,仍未是最好,最好是不用打,也可以解決問題,才是最高境界。」
大影響力的納殊均衡
納殊在數學學術研究之上貢獻很多,最為人知的就是「納殊均衡」。
楊教授說,國際上幾乎每十篇關於博弈論的文章,十之八九會引用納殊,「這樣的紀錄,可見他在博弈論的影響力真的好大」。
要解釋納殊均衡,一般人會用「囚徒困境」(Prisoner's Dilemma)的個案來做例子。
楊教授強調,納殊均衡並不止於囚徒困境,只是在囚徒困境中,出現了納殊均衡。
經典例子﹕囚徒困境
假設兩個懷疑爆竊的賊人被捕,在警署分開審問。警察分別對兩人說﹕爆竊罪可判十年;若兩人同時認罪,則同判五年;若認罪頂證另一人,認罪的人可獲釋放。不過,若兩人都不認罪,證據不足,頂多被扣留一個月。
這樣看的話,最佳的情況,就是兩人都死不認罪,但由於兩人無法通訊,互不知道自己會否被出賣,最後還是會選擇出賣對方,這個選擇就叫做「納殊均衡」。「不論對方認不認罪,自己都是認罪最有利﹕若對方認罪,自己不認,則坐十年,若認罪,只坐五年;若對方不認罪,兩人同被扣留一個月,若認罪,就立刻可獲釋方。只考慮自己利益的話,當然認。」
另一例子﹕鷹與鴿
楊教授說,他不喜歡用囚徒困境來解釋納殊均衡,事關這就像在教人犯事後最好不要認罪,所以他多會用「鷹與鴿」來舉例。
假設有兩隻雀仔,樹上有20顆果實,本來若是兩隻鴿平均分配,每人可得10顆,這是最理想的狀況。可是,若有一隻變成鷹,鷹鴿相爭,鷹強一點,可得14顆,而鴿得2顆,其餘4粒則在打鬥時掉了;要是兩隻都變成鷹,則每人只分得4顆,因為兩鷹惡鬥,過程把12顆都掉了。那麼,可以選的話,做鷹還是做鴿好?「同一道理,不論對方是鷹還是鴿,自己做鷹都是最好。所以最後,兩者都會是鷹,但這對整體利益來說並非最好,因為當中掉了不少果實,兩者都會是鴿的話,則可吃盡樹上20顆果實,1顆不浪費。」
現實的應用:無國家願減排?
納殊均衡,可以廣泛應用在現實生活的博弈,像多年來的氣候峰會無法達成減排協議,就是因為國家之間的博弈,在只顧自己利益的前提下,最後兩個國家的選擇,都是不願減排,維護一己利益之時,結果是對整個地球都不利的選擇。「如果中國減排,印度不減,則中國成本增加,訂單都流失到印度。同樣道理,若中國不減,印度為確保工廠不倒閉,也會拒絕減排。最後,兩國不減排,最大損失的是整個環境。」
從這些例子可見,單是為求符合個人理性的時候,後果未必是最好的。「所以博弈論是教人不要只看自己的利益,要互相得益更大,就要互相合作。人人都懂得這道理的話,仗都打少一點,架都吵少一點。」
不過,楊教授說,不少人將「納殊均衡」局限於類似「囚徒困境」或「鷹與鴿」的簡單模式。其實這個均衡概念亦廣泛應用於動態博弈學,如「回饋納殊均衡」,而它的複雜性,遠非以上圖表顯示般簡單。就像孫子,納殊認為在博弈之中,最好是可以合作,他後來提出合作博弈的解法,創出「納殊協商解法」(Nash Bargaining Solution),以達至最優的局面。
克服精神分裂 與數字鬥智
納殊在一九二八年出生於美國,父親是工程師,母親是教師。一九五○年,他在普林斯頓大學取得博士學位,其論文中就提出了納殊均衡。畢業後,他在麻省理工大學獲得教職,但不久就出現精神分裂徵狀。他向大學辭職時,說自己要到南極當皇帝。他被送進精神病院,被迫吃重藥、打針、綁起。楊教授說,那個年代,精神病院對待病人是比較粗暴的,後來納殊好轉出院,「可以的話,他也不想吃藥,因為吃藥後,思想就慢下來,做不到他本來做的研究」。因為不吃藥,病徵重臨,身邊的人吃不消,就又送他入院。楊教授說,納殊就是這樣出入精神病院,斷續地做研究。納殊做研究的時候,除了與數字鬥智,也與病魔鬥力,「過程是艱苦的」。九四年,納殊獲頒諾貝爾獎,當時的精神狀態已好轉。
人們覺得與納殊,但楊教授說,「我理解他有焦慮,不容易接受轉變,所以他多年來也待在普林斯頓,雖有不少大學歡迎他,但他從沒去意。不要問他為什麼。」納殊不喜歡外遊,但楊教授幾次邀他來港,納殊也一口答應。「我很幸運,可以認識人們不大了解他的另一面。他其實也有健談的一面,單純率直笑起來也很可愛。」作家Sylvia Nasar以「a beautiful mind」來作為納殊傳記的命字,楊教授認同,他的確有優美的思維。
文/ 陳嘉文
圖/SRS動態合作博弈高研平臺
編輯/洪慧冰
fb﹕http://www.facebook.com/SundayMingpao
那年頭,「博弈論」在香港成為一時的話題。
往後,納殊再訪港,都是應國際知名的動態合作博弈學家楊榮基教授邀請而來。
只是,沒想到今年夏天,博弈論再一次成為話題,不過是因為納殊突然遇上車禍,與世長辭。
「人人懂博弈,世界會更美好」
雖然我們都聽過博弈論(Game Theory),但很多不精於數學或經濟理論的人如我,其實都對納殊和他的博弈論一知半解。像不少傳媒報道這次壞消息時,介紹納殊時說他是博弈論的始創人。
在學術界裏,真正開始有系統地研究博弈的人,是納殊的兩個老師摩根斯坦(Oskar Morgenstern)及馮諾曼(John von Neumann),他們在一九四四年出版了《博弈論和經濟行為》(The Theory of Games and Economic Behavior)。那時候,納殊還是學生,五年後,他在研究博弈論的博士論文中,提到「納殊均衡」(Nash Equilibrium),這才是讓他在四十五年後獲得諾貝爾獎的。
楊榮基教授說,很多人不知道什麼叫博弈,以為這是與賭博有關,「雖然賭博也是博弈的一種」。那麼,什麼是博弈?一盤棋?一個遊戲?「博弈是一個情况,你做的行為影響人,人的行為也影響你,這當中不一定有競爭(competition),不過人與人之間互相有存在矛盾的利益(conflicting interest),例如你排隊買食物,你排在前面,會令後面的人排隊的時間長了。人生當中,除非住在荒島一人過活,否則不論在經濟、社會,甚至在家裏,也會存在博弈,我看電視,聲浪太大,會影響太太,而她所做的事,會影響我,於是我或許要把聲浪收細一點,然後她又遷就我。如果每個人都懂得博弈,這個世界會更美好。」
不一定是競爭中取勝
不過,若人人都懂得博弈,不是反而會愈來愈不和平嗎?計算、策略、致勝之道,坊間不少博弈教學,都說學博弈可讓人推算出最有利自己的策略,從競爭中勝出,楊教授說,很多人都誤解了博弈論,尤其納殊說的「納殊均衡」,「數學告訴我們,只顧自己利益的話,長遠會是個悲劇,納殊均衡其實就是解釋這現象」。
古人的博弈——《孫子兵法》
楊教授說,博弈的概念,其實自古就有。「你若問我,什麼時候有博弈的概念,我會說是《孫子兵法》。人們打仗,有敵有我,兵法就是談博弈,研究怎樣才可以打勝仗,孫子也有教兵怎做間諜、心理、處理兵糧等,只是它沒什麼系統地歸納,只說了兵法的精要。但孫子其實也不是主張打仗的,他是怎樣說的?『百戰百勝,非善之善者;不戰而屈人之兵,善之善者也。』百戰百勝,仍未是最好,最好是不用打,也可以解決問題,才是最高境界。」
大影響力的納殊均衡
納殊在數學學術研究之上貢獻很多,最為人知的就是「納殊均衡」。
楊教授說,國際上幾乎每十篇關於博弈論的文章,十之八九會引用納殊,「這樣的紀錄,可見他在博弈論的影響力真的好大」。
要解釋納殊均衡,一般人會用「囚徒困境」(Prisoner's Dilemma)的個案來做例子。
楊教授強調,納殊均衡並不止於囚徒困境,只是在囚徒困境中,出現了納殊均衡。
經典例子﹕囚徒困境
假設兩個懷疑爆竊的賊人被捕,在警署分開審問。警察分別對兩人說﹕爆竊罪可判十年;若兩人同時認罪,則同判五年;若認罪頂證另一人,認罪的人可獲釋放。不過,若兩人都不認罪,證據不足,頂多被扣留一個月。
這樣看的話,最佳的情況,就是兩人都死不認罪,但由於兩人無法通訊,互不知道自己會否被出賣,最後還是會選擇出賣對方,這個選擇就叫做「納殊均衡」。「不論對方認不認罪,自己都是認罪最有利﹕若對方認罪,自己不認,則坐十年,若認罪,只坐五年;若對方不認罪,兩人同被扣留一個月,若認罪,就立刻可獲釋方。只考慮自己利益的話,當然認。」
另一例子﹕鷹與鴿
楊教授說,他不喜歡用囚徒困境來解釋納殊均衡,事關這就像在教人犯事後最好不要認罪,所以他多會用「鷹與鴿」來舉例。
假設有兩隻雀仔,樹上有20顆果實,本來若是兩隻鴿平均分配,每人可得10顆,這是最理想的狀況。可是,若有一隻變成鷹,鷹鴿相爭,鷹強一點,可得14顆,而鴿得2顆,其餘4粒則在打鬥時掉了;要是兩隻都變成鷹,則每人只分得4顆,因為兩鷹惡鬥,過程把12顆都掉了。那麼,可以選的話,做鷹還是做鴿好?「同一道理,不論對方是鷹還是鴿,自己做鷹都是最好。所以最後,兩者都會是鷹,但這對整體利益來說並非最好,因為當中掉了不少果實,兩者都會是鴿的話,則可吃盡樹上20顆果實,1顆不浪費。」
現實的應用:無國家願減排?
納殊均衡,可以廣泛應用在現實生活的博弈,像多年來的氣候峰會無法達成減排協議,就是因為國家之間的博弈,在只顧自己利益的前提下,最後兩個國家的選擇,都是不願減排,維護一己利益之時,結果是對整個地球都不利的選擇。「如果中國減排,印度不減,則中國成本增加,訂單都流失到印度。同樣道理,若中國不減,印度為確保工廠不倒閉,也會拒絕減排。最後,兩國不減排,最大損失的是整個環境。」
從這些例子可見,單是為求符合個人理性的時候,後果未必是最好的。「所以博弈論是教人不要只看自己的利益,要互相得益更大,就要互相合作。人人都懂得這道理的話,仗都打少一點,架都吵少一點。」
不過,楊教授說,不少人將「納殊均衡」局限於類似「囚徒困境」或「鷹與鴿」的簡單模式。其實這個均衡概念亦廣泛應用於動態博弈學,如「回饋納殊均衡」,而它的複雜性,遠非以上圖表顯示般簡單。就像孫子,納殊認為在博弈之中,最好是可以合作,他後來提出合作博弈的解法,創出「納殊協商解法」(Nash Bargaining Solution),以達至最優的局面。
克服精神分裂 與數字鬥智
納殊在一九二八年出生於美國,父親是工程師,母親是教師。一九五○年,他在普林斯頓大學取得博士學位,其論文中就提出了納殊均衡。畢業後,他在麻省理工大學獲得教職,但不久就出現精神分裂徵狀。他向大學辭職時,說自己要到南極當皇帝。他被送進精神病院,被迫吃重藥、打針、綁起。楊教授說,那個年代,精神病院對待病人是比較粗暴的,後來納殊好轉出院,「可以的話,他也不想吃藥,因為吃藥後,思想就慢下來,做不到他本來做的研究」。因為不吃藥,病徵重臨,身邊的人吃不消,就又送他入院。楊教授說,納殊就是這樣出入精神病院,斷續地做研究。納殊做研究的時候,除了與數字鬥智,也與病魔鬥力,「過程是艱苦的」。九四年,納殊獲頒諾貝爾獎,當時的精神狀態已好轉。
人們覺得與納殊,但楊教授說,「我理解他有焦慮,不容易接受轉變,所以他多年來也待在普林斯頓,雖有不少大學歡迎他,但他從沒去意。不要問他為什麼。」納殊不喜歡外遊,但楊教授幾次邀他來港,納殊也一口答應。「我很幸運,可以認識人們不大了解他的另一面。他其實也有健談的一面,單純率直笑起來也很可愛。」作家Sylvia Nasar以「a beautiful mind」來作為納殊傳記的命字,楊教授認同,他的確有優美的思維。
文/ 陳嘉文
圖/SRS動態合作博弈高研平臺
編輯/洪慧冰
fb﹕http://www.facebook.com/SundayMingpao
回應 (0)