轉載自——董志強 1999-6
對于一些非數學專業和經濟學專業的人們來說,博弈論可能是一個極為陌生的概念。事實上,就是一些經濟學專業畢業的學生,他們的博弈論知識也十分有限,我自己也是這樣,略知皮毛而已(不,甚至連皮毛都未能真正了解)。因為國內學者把博弈論運用于經濟學研究不過是近幾年的事,也不普遍,而且它本身的內容也博大精深。但在國外,博弈論已成為占據主流的分析工具,如果你不懂得博弈論,那么你會被認為是沒有真正懂得經濟學。 博弈論的提法可能太過于學術化,容易讓人們退避三舍。其實它有一個非常通俗的名字——游戲理論(博弈論的英文名字叫做“Game Theory”,如果直譯,就是“游戲理論”)。博弈論在我國還有一個名字,叫對策論。這些名字都很好理解,博弈字面意思就是賭博、下棋,賭博和下棋當然是游戲了,賭博和下棋的時候常常要千方百計地應付對手,自然是要講究對策了。
如果我們要進行一場游戲,首先肯定要有參加游戲的人,沒有人參加,游戲就不會進行下去,游戲活動的參與人有一個學術名稱叫“局中人”;其次,每一個“局中人”都有自己的“行動”,或者叫做“策略”、“對策”,如果行動不是單一的,那么這個局中人所有的行動構成一個集合,稱行動組合或策略組合;另外,還應該約定輸家要付出什么代價,贏家可獲得什么利益,這在術語上叫做“支付”(或“報酬”)。當然,一場游戲肯定結果不是唯一的,各個參與人分散決策采取不同的行動,會造成不同的結果。但是納什證明出,在有限個局中人參加的有限行為對策中,至少存在一個所有參與人的最優戰略的組合,這叫做“納什均衡”。處于納什均衡狀態下,每個人都不能通過改變策略來得到更大的收益,所以誰也不存在改變現狀的動力。
舉一個具體的例子來說明一下。這個例子叫“囚犯困境”,是被一些教材廣泛引用的例子,并且西方經濟學者圍繞這個例子發表過不下百篇學術論文。它是這樣的(有興趣的讀者可參見青年經濟學家張維迎的《博弈論與信息經濟學》,這本書幾乎成了經濟學研究生的必讀書):兩個嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴”,如果兩人都坦白各判8年,如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年,如果都不坦白則因證據不足各判1年。
在這個例子里,局中人就是兩個嫌疑犯A和B,他們每個人都有兩個策略即坦白和不坦白,判刑的年數就是他們的支付。可能出現的四種情況:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的結果。A和B均坦白是這個博弈的納什均衡。我們可以用下面的表來表述這個博弈,表中,第一個數字是A的支付(因為是判刑是負效用,故以負號記之),第二個數字是B的支付。
囚犯B
坦白 抵賴
囚犯A 坦白 -8,-8 0,-10
抵賴 -10,0 -1,-1
我們看到,假定A選擇坦白的話,B最好是選擇坦白,因為B坦白判8年而抵賴卻要判十年;假定A選擇抵賴的話,B最好還是選擇坦白,因為B坦白判不被判刑而抵賴確要被判刑1年。即是說,不管A坦白或抵賴,B的最佳選擇都是坦白。反過來,同樣地,不管B是坦白還是抵賴,A的最佳選擇也是坦白。結果,兩個人都選擇了坦白,各判刑8年。在(坦白、坦白)這個組合中,A和B都不能通過單方面的改變行動增加自己的收益,于是誰也沒有動力游離這個組合,因此這個組合是納什均衡。
張維迎指出,囚徒困境反映了個人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當然,A和B可以在被警察抓到之前訂立一個“攻守同盟”,但是這可能不會有用,因為它不構成納什均衡,沒有人有積極性遵守這個協定。
“囚犯困境”在經濟學上有很多應用,也有力地解釋了一些經濟現象。比如中東石油輸出國組織(Organization of Petroleum Exporting Countries,簡稱OPEC)的成立,本身要限制各石油生產國的產量,以保持石油價格,以便獲取利潤。但成員國并不遵守組織的協定,每個成員國都這樣想,只要他們不增加產量,我增加一點點產量對價格沒什么影響,結果每個國家都增加產量,造成石油價格下跌,大家的利潤都受到損失。當然,一些產量增加較少的國家損失更多,于是也更加大量生產,造成價格進一步下降——結果,陷入一個困境:大家都增加產量,價格下跌,大家再增加產量,價格再下跌……我們不妨考察一下歷史:
1960年,5個產油國成立歐佩克(OPEC)。1973年成員國擴大到13個。當時各國還少有產量欺騙行為。1973年,阿-以戰爭爆發,為了報復以色列和西方國家,OPEC突然大幅度削減石油出口,致使世界原油價格由$2.91/桶暴漲到1974年$10.77/桶。這一意外事件讓OPEC看到了組建卡特爾的誘人前景。1978年伊朗發生革命,其石油生產一度陷于癱瘓,既而兩伊戰爭爆發,許多石油設施受到破壞,世界石油價格進一步漲到80年代初的$40/桶。但是,高額的利潤導致各個國家的產量欺騙行為(實際產量大于限產計劃),即各國不再遵守產量協定,擅自提高產量以獲取更大的市場和更多的利潤,從而導致石油價格下跌——當然,價格下跌也與世界其他地區如墨西哥油田、阿拉斯加油田、北海油田等石油供給增加有關。1982年世界石油價格為$32/桶,1984年為$27/桶,1987年為$18/桶,以后基本上在$15-18/桶之間波動。
理論上,幾乎所有的卡特爾都會遭到失敗,原因就在于卡特爾的協定(類似囚犯的攻守同盟)不是一個納什均衡,沒有成員有興趣遵守。最近發生的一個案例再次證明了這一點。今年4月,長虹突然宣布彩電降價,對彩電業帶來了巨大震動。隨即,康價佳老總陳偉榮、TCL老總李東生、創維老總黃宏生達成默契:建立彩電聯盟。直到4月20日下午,康佳仍表示不降價,但當晚陳偉榮突然改變主意,搞得李、黃措手不及。4月24日,本來三方準備坐下來商討降價后的進一步策略,結果又是陳偉榮爽約。
那么不可能有卡特爾合作成功了?理論上,如果是無限期的合作,雙方考慮長遠利益,他們的合作是會成功的。但只要是有限次的合作,合作就不會成功。比如合作10次,那么再第九次博弈參與人就會采取不合作態度,因為大家都想趁最后一次機會撈一把,反正以后我也不會跟你合作了。但是大家料到第九次會出現不合作,那么就很可能再第八次就采取不合作的態度。第八次不合作會使大家在第七次就不合作……一直到,從第一次開始大家都不會采取合作態度。
當然,這只是理論上的分析。現實中影響人們決策和態度的因素很多,所以,有些博弈的結果并不體現為納什均衡。在國外曾做過一個“囚犯困境”的實驗,被實驗者是素未謀面的一個男生和一個女生。開始,這個男生每次都選擇“坦白”,這是符合納什均衡的。后來實驗者有意安排了一次喝咖啡的機會,使男生發現自己的對手是一個漂亮的女生。結果以后的測驗中,男生每次都選擇不坦白以獲取女孩的好感。
不過,不管怎樣,博弈論都是一個強有力的分析工具。現在,它不僅在經濟學領域得到廣泛應用,在軍事、政治、商業征戰、社會科學領域以及生物學等自然科學領域都有非常重大的影響,工程學中如控制論工程也少不了它。我們舉的例子,只是幫助大家形成博弈論的基本概念,實際上它是非常精深的。現在與它緊密聯系的經濟學分支是信息經濟學。信號游戲、拍賣形式、激勵機制、委托人—代理人理論和公共財政學是博弈論和信息經濟學研究的重要課題。
應該感謝美國數學家馮?諾依曼(Von Neumann)和摩根斯坦(Morgenstern),是他們在《博弈論和經濟行為》(1944)一書中提出了博弈論的經濟思想。馮?諾依曼在數學、計算機、經濟學等領域都有奇才般的貢獻,可惜英年早逝。1950-1954年,美國數學家統計學家納什接連發表多篇論述對策論的文章,奠定了現代博弈論學科體系的基礎。