通識導賞﹕互相合作得益最大

2015年05月31日

新聞類別

副刊

詳情#

【明報專訊】二○○三年，《有你終生美麗》裏的數學家納殊（John Nash），得了諾貝爾經濟學獎九年後，來到香港與大學生分享，可容納四百人的演講廳，塞滿了逾千人。

那年頭，「博弈論」在香港成為一時的話題。

往後，納殊再訪港，都是應國際知名的動態合作博弈學家楊榮基教授邀請而來。

只是，沒想到今年夏天，博弈論再一次成為話題，不過是因為納殊突然遇上車禍，與世長辭。

「人人懂博弈，世界會更美好」

雖然我們都聽過博弈論（Game Theory），但很多不精於數學或經濟理論的人如我，其實都對納殊和他的博弈論一知半解。像不少傳媒報道這次壞消息時，介紹納殊時說他是博弈論的始創人。

在學術界裏，真正開始有系統地研究博弈的人，是納殊的兩個老師摩根斯坦（Oskar Morgenstern）及馮諾曼（John von Neumann），他們在一九四四年出版了《博弈論和經濟行為》（The Theory of Games and Economic Behavior）。那時候，納殊還是學生，五年後，他在研究博弈論的博士論文中，提到「納殊均衡」（Nash Equilibrium），這才是讓他在四十五年後獲得諾貝爾獎的。

楊榮基教授說，很多人不知道什麼叫博弈，以為這是與賭博有關，「雖然賭博也是博弈的一種」。那麼，什麼是博弈？一盤棋？一個遊戲？「博弈是一個情况，你做的行為影響人，人的行為也影響你，這當中不一定有競爭（competition），不過人與人之間互相有存在矛盾的利益（conflicting interest），例如你排隊買食物，你排在前面，會令後面的人排隊的時間長了。人生當中，除非住在荒島一人過活，否則不論在經濟、社會，甚至在家裏，也會存在博弈，我看電視，聲浪太大，會影響太太，而她所做的事，會影響我，於是我或許要把聲浪收細一點，然後她又遷就我。如果每個人都懂得博弈，這個世界會更美好。」

不一定是競爭中取勝

不過，若人人都懂得博弈，不是反而會愈來愈不和平嗎？計算、策略、致勝之道，坊間不少博弈教學，都說學博弈可讓人推算出最有利自己的策略，從競爭中勝出，楊教授說，很多人都誤解了博弈論，尤其納殊說的「納殊均衡」，「數學告訴我們，只顧自己利益的話，長遠會是個悲劇，納殊均衡其實就是解釋這現象」。

古人的博弈——《孫子兵法》

楊教授說，博弈的概念，其實自古就有。「你若問我，什麼時候有博弈的概念，我會說是《孫子兵法》。人們打仗，有敵有我，兵法就是談博弈，研究怎樣才可以打勝仗，孫子也有教兵怎做間諜、心理、處理兵糧等，只是它沒什麼系統地歸納，只說了兵法的精要。但孫子其實也不是主張打仗的，他是怎樣說的？『百戰百勝，非善之善者；不戰而屈人之兵，善之善者也。』百戰百勝，仍未是最好，最好是不用打，也可以解決問題，才是最高境界。」

大影響力的納殊均衡

納殊在數學學術研究之上貢獻很多，最為人知的就是「納殊均衡」。

楊教授說，國際上幾乎每十篇關於博弈論的文章，十之八九會引用納殊，「這樣的紀錄，可見他在博弈論的影響力真的好大」。

要解釋納殊均衡，一般人會用「囚徒困境」（Prisoner's Dilemma）的個案來做例子。

楊教授強調，納殊均衡並不止於囚徒困境，只是在囚徒困境中，出現了納殊均衡。

經典例子﹕囚徒困境

假設兩個懷疑爆竊的賊人被捕，在警署分開審問。警察分別對兩人說﹕爆竊罪可判十年；若兩人同時認罪，則同判五年；若認罪頂證另一人，認罪的人可獲釋放。不過，若兩人都不認罪，證據不足，頂多被扣留一個月。

這樣看的話，最佳的情況，就是兩人都死不認罪，但由於兩人無法通訊，互不知道自己會否被出賣，最後還是會選擇出賣對方，這個選擇就叫做「納殊均衡」。「不論對方認不認罪，自己都是認罪最有利﹕若對方認罪，自己不認，則坐十年，若認罪，只坐五年；若對方不認罪，兩人同被扣留一個月，若認罪，就立刻可獲釋方。只考慮自己利益的話，當然認。」

另一例子﹕鷹與鴿

楊教授說，他不喜歡用囚徒困境來解釋納殊均衡，事關這就像在教人犯事後最好不要認罪，所以他多會用「鷹與鴿」來舉例。

假設有兩隻雀仔，樹上有20顆果實，本來若是兩隻鴿平均分配，每人可得10顆，這是最理想的狀況。可是，若有一隻變成鷹，鷹鴿相爭，鷹強一點，可得14顆，而鴿得2顆，其餘4粒則在打鬥時掉了；要是兩隻都變成鷹，則每人只分得4顆，因為兩鷹惡鬥，過程把12顆都掉了。那麼，可以選的話，做鷹還是做鴿好？「同一道理，不論對方是鷹還是鴿，自己做鷹都是最好。所以最後，兩者都會是鷹，但這對整體利益來說並非最好，因為當中掉了不少果實，兩者都會是鴿的話，則可吃盡樹上20顆果實，1顆不浪費。」

現實的應用：無國家願減排？

納殊均衡，可以廣泛應用在現實生活的博弈，像多年來的氣候峰會無法達成減排協議，就是因為國家之間的博弈，在只顧自己利益的前提下，最後兩個國家的選擇，都是不願減排，維護一己利益之時，結果是對整個地球都不利的選擇。「如果中國減排，印度不減，則中國成本增加，訂單都流失到印度。同樣道理，若中國不減，印度為確保工廠不倒閉，也會拒絕減排。最後，兩國不減排，最大損失的是整個環境。」

從這些例子可見，單是為求符合個人理性的時候，後果未必是最好的。「所以博弈論是教人不要只看自己的利益，要互相得益更大，就要互相合作。人人都懂得這道理的話，仗都打少一點，架都吵少一點。」

不過，楊教授說，不少人將「納殊均衡」局限於類似「囚徒困境」或「鷹與鴿」的簡單模式。其實這個均衡概念亦廣泛應用於動態博弈學，如「回饋納殊均衡」，而它的複雜性，遠非以上圖表顯示般簡單。就像孫子，納殊認為在博弈之中，最好是可以合作，他後來提出合作博弈的解法，創出「納殊協商解法」（Nash Bargaining Solution），以達至最優的局面。

克服精神分裂與數字鬥智

納殊在一九二八年出生於美國，父親是工程師，母親是教師。一九五○年，他在普林斯頓大學取得博士學位，其論文中就提出了納殊均衡。畢業後，他在麻省理工大學獲得教職，但不久就出現精神分裂徵狀。他向大學辭職時，說自己要到南極當皇帝。他被送進精神病院，被迫吃重藥、打針、綁起。楊教授說，那個年代，精神病院對待病人是比較粗暴的，後來納殊好轉出院，「可以的話，他也不想吃藥，因為吃藥後，思想就慢下來，做不到他本來做的研究」。因為不吃藥，病徵重臨，身邊的人吃不消，就又送他入院。楊教授說，納殊就是這樣出入精神病院，斷續地做研究。納殊做研究的時候，除了與數字鬥智，也與病魔鬥力，「過程是艱苦的」。九四年，納殊獲頒諾貝爾獎，當時的精神狀態已好轉。

人們覺得與納殊，但楊教授說，「我理解他有焦慮，不容易接受轉變，所以他多年來也待在普林斯頓，雖有不少大學歡迎他，但他從沒去意。不要問他為什麼。」納殊不喜歡外遊，但楊教授幾次邀他來港，納殊也一口答應。「我很幸運，可以認識人們不大了解他的另一面。他其實也有健談的一面，單純率直笑起來也很可愛。」作家Sylvia Nasar以「a beautiful mind」來作為納殊傳記的命字，楊教授認同，他的確有優美的思維。

文/ 陳嘉文

圖/SRS動態合作博弈高研平臺

編輯/洪慧冰

fb﹕http://www.facebook.com/SundayMingpao

0

書籤

回應 (0)

登入即可留言

舉報留言

舉報此留言的原因是....
確認舉報

確定

通識導賞﹕互相合作 得益最大

舉報留言

相關內容

通識導賞﹕互相合作得益最大