轉(zhuǎn)載自——董志強(qiáng) 1999-6
對(duì)于一些非數(shù)學(xué)專業(yè)和經(jīng)濟(jì)學(xué)專業(yè)的人們來說,博弈論可能是一個(gè)極為陌生的概念。事實(shí)上,就是一些經(jīng)濟(jì)學(xué)專業(yè)畢業(yè)的學(xué)生,他們的博弈論知識(shí)也十分有限,我自己也是這樣,略知皮毛而已(不,甚至連皮毛都未能真正了解)。因?yàn)閲?guó)內(nèi)學(xué)者把博弈論運(yùn)用于經(jīng)濟(jì)學(xué)研究不過是近幾年的事,也不普遍,而且它本身的內(nèi)容也博大精深。但在國(guó)外,博弈論已成為占據(jù)主流的分析工具,如果你不懂得博弈論,那么你會(huì)被認(rèn)為是沒有真正懂得經(jīng)濟(jì)學(xué)。 博弈論的提法可能太過于學(xué)術(shù)化,容易讓人們退避三舍。其實(shí)它有一個(gè)非常通俗的名字——游戲理論(博弈論的英文名字叫做“Game Theory”,如果直譯,就是“游戲理論”)。博弈論在我國(guó)還有一個(gè)名字,叫對(duì)策論。這些名字都很好理解,博弈字面意思就是賭博、下棋,賭博和下棋當(dāng)然是游戲了,賭博和下棋的時(shí)候常常要千方百計(jì)地應(yīng)付對(duì)手,自然是要講究對(duì)策了。
如果我們要進(jìn)行一場(chǎng)游戲,首先肯定要有參加游戲的人,沒有人參加,游戲就不會(huì)進(jìn)行下去,游戲活動(dòng)的參與人有一個(gè)學(xué)術(shù)名稱叫“局中人”;其次,每一個(gè)“局中人”都有自己的“行動(dòng)”,或者叫做“策略”、“對(duì)策”,如果行動(dòng)不是單一的,那么這個(gè)局中人所有的行動(dòng)構(gòu)成一個(gè)集合,稱行動(dòng)組合或策略組合;另外,還應(yīng)該約定輸家要付出什么代價(jià),贏家可獲得什么利益,這在術(shù)語上叫做“支付”(或“報(bào)酬”)。當(dāng)然,一場(chǎng)游戲肯定結(jié)果不是唯一的,各個(gè)參與人分散決策采取不同的行動(dòng),會(huì)造成不同的結(jié)果。但是納什證明出,在有限個(gè)局中人參加的有限行為對(duì)策中,至少存在一個(gè)所有參與人的最優(yōu)戰(zhàn)略的組合,這叫做“納什均衡”。處于納什均衡狀態(tài)下,每個(gè)人都不能通過改變策略來得到更大的收益,所以誰也不存在改變現(xiàn)狀的動(dòng)力。
舉一個(gè)具體的例子來說明一下。這個(gè)例子叫“囚犯困境”,是被一些教材廣泛引用的例子,并且西方經(jīng)濟(jì)學(xué)者圍繞這個(gè)例子發(fā)表過不下百篇學(xué)術(shù)論文。它是這樣的(有興趣的讀者可參見青年經(jīng)濟(jì)學(xué)家張維迎的《博弈論與信息經(jīng)濟(jì)學(xué)》,這本書幾乎成了經(jīng)濟(jì)學(xué)研究生的必讀書):兩個(gè)嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴(yán)”,如果兩人都坦白各判8年,如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年,如果都不坦白則因證據(jù)不足各判1年。
在這個(gè)例子里,局中人就是兩個(gè)嫌疑犯A和B,他們每個(gè)人都有兩個(gè)策略即坦白和不坦白,判刑的年數(shù)就是他們的支付。可能出現(xiàn)的四種情況:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的結(jié)果。A和B均坦白是這個(gè)博弈的納什均衡。我們可以用下面的表來表述這個(gè)博弈,表中,第一個(gè)數(shù)字是A的支付(因?yàn)槭桥行淌秦?fù)效用,故以負(fù)號(hào)記之),第二個(gè)數(shù)字是B的支付。
囚犯B
坦白 抵賴
囚犯A 坦白 -8,-8 0,-10
抵賴 -10,0 -1,-1
我們看到,假定A選擇坦白的話,B最好是選擇坦白,因?yàn)锽坦白判8年而抵賴卻要判十年;假定A選擇抵賴的話,B最好還是選擇坦白,因?yàn)锽坦白判不被判刑而抵賴確要被判刑1年。即是說,不管A坦白或抵賴,B的最佳選擇都是坦白。反過來,同樣地,不管B是坦白還是抵賴,A的最佳選擇也是坦白。結(jié)果,兩個(gè)人都選擇了坦白,各判刑8年。在(坦白、坦白)這個(gè)組合中,A和B都不能通過單方面的改變行動(dòng)增加自己的收益,于是誰也沒有動(dòng)力游離這個(gè)組合,因此這個(gè)組合是納什均衡。
張維迎指出,囚徒困境反映了個(gè)人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當(dāng)然,A和B可以在被警察抓到之前訂立一個(gè)“攻守同盟”,但是這可能不會(huì)有用,因?yàn)樗粯?gòu)成納什均衡,沒有人有積極性遵守這個(gè)協(xié)定。
“囚犯困境”在經(jīng)濟(jì)學(xué)上有很多應(yīng)用,也有力地解釋了一些經(jīng)濟(jì)現(xiàn)象。比如中東石油輸出國(guó)組織(Organization of Petroleum Exporting Countries,簡(jiǎn)稱OPEC)的成立,本身要限制各石油生產(chǎn)國(guó)的產(chǎn)量,以保持石油價(jià)格,以便獲取利潤(rùn)。但成員國(guó)并不遵守組織的協(xié)定,每個(gè)成員國(guó)都這樣想,只要他們不增加產(chǎn)量,我增加一點(diǎn)點(diǎn)產(chǎn)量對(duì)價(jià)格沒什么影響,結(jié)果每個(gè)國(guó)家都增加產(chǎn)量,造成石油價(jià)格下跌,大家的利潤(rùn)都受到損失。當(dāng)然,一些產(chǎn)量增加較少的國(guó)家損失更多,于是也更加大量生產(chǎn),造成價(jià)格進(jìn)一步下降——結(jié)果,陷入一個(gè)困境:大家都增加產(chǎn)量,價(jià)格下跌,大家再增加產(chǎn)量,價(jià)格再下跌……我們不妨考察一下歷史:
1960年,5個(gè)產(chǎn)油國(guó)成立歐佩克(OPEC)。1973年成員國(guó)擴(kuò)大到13個(gè)。當(dāng)時(shí)各國(guó)還少有產(chǎn)量欺騙行為。1973年,阿-以戰(zhàn)爭(zhēng)爆發(fā),為了報(bào)復(fù)以色列和西方國(guó)家,OPEC突然大幅度削減石油出口,致使世界原油價(jià)格由$2.91/桶暴漲到1974年$10.77/桶。這一意外事件讓OPEC看到了組建卡特爾的誘人前景。1978年伊朗發(fā)生革命,其石油生產(chǎn)一度陷于癱瘓,既而兩伊戰(zhàn)爭(zhēng)爆發(fā),許多石油設(shè)施受到破壞,世界石油價(jià)格進(jìn)一步漲到80年代初的$40/桶。但是,高額的利潤(rùn)導(dǎo)致各個(gè)國(guó)家的產(chǎn)量欺騙行為(實(shí)際產(chǎn)量大于限產(chǎn)計(jì)劃),即各國(guó)不再遵守產(chǎn)量協(xié)定,擅自提高產(chǎn)量以獲取更大的市場(chǎng)和更多的利潤(rùn),從而導(dǎo)致石油價(jià)格下跌——當(dāng)然,價(jià)格下跌也與世界其他地區(qū)如墨西哥油田、阿拉斯加油田、北海油田等石油供給增加有關(guān)。1982年世界石油價(jià)格為$32/桶,1984年為$27/桶,1987年為$18/桶,以后基本上在$15-18/桶之間波動(dòng)。
理論上,幾乎所有的卡特爾都會(huì)遭到失敗,原因就在于卡特爾的協(xié)定(類似囚犯的攻守同盟)不是一個(gè)納什均衡,沒有成員有興趣遵守。最近發(fā)生的一個(gè)案例再次證明了這一點(diǎn)。今年4月,長(zhǎng)虹突然宣布彩電降價(jià),對(duì)彩電業(yè)帶來了巨大震動(dòng)。隨即,康價(jià)佳老總陳偉榮、TCL老總李東生、創(chuàng)維老總黃宏生達(dá)成默契:建立彩電聯(lián)盟。直到4月20日下午,康佳仍表示不降價(jià),但當(dāng)晚陳偉榮突然改變主意,搞得李、黃措手不及。4月24日,本來三方準(zhǔn)備坐下來商討降價(jià)后的進(jìn)一步策略,結(jié)果又是陳偉榮爽約。
那么不可能有卡特爾合作成功了?理論上,如果是無限期的合作,雙方考慮長(zhǎng)遠(yuǎn)利益,他們的合作是會(huì)成功的。但只要是有限次的合作,合作就不會(huì)成功。比如合作10次,那么再第九次博弈參與人就會(huì)采取不合作態(tài)度,因?yàn)榇蠹叶枷氤米詈笠淮螜C(jī)會(huì)撈一把,反正以后我也不會(huì)跟你合作了。但是大家料到第九次會(huì)出現(xiàn)不合作,那么就很可能再第八次就采取不合作的態(tài)度。第八次不合作會(huì)使大家在第七次就不合作……一直到,從第一次開始大家都不會(huì)采取合作態(tài)度。
當(dāng)然,這只是理論上的分析。現(xiàn)實(shí)中影響人們決策和態(tài)度的因素很多,所以,有些博弈的結(jié)果并不體現(xiàn)為納什均衡。在國(guó)外曾做過一個(gè)“囚犯困境”的實(shí)驗(yàn),被實(shí)驗(yàn)者是素未謀面的一個(gè)男生和一個(gè)女生。開始,這個(gè)男生每次都選擇“坦白”,這是符合納什均衡的。后來實(shí)驗(yàn)者有意安排了一次喝咖啡的機(jī)會(huì),使男生發(fā)現(xiàn)自己的對(duì)手是一個(gè)漂亮的女生。結(jié)果以后的測(cè)驗(yàn)中,男生每次都選擇不坦白以獲取女孩的好感。
不過,不管怎樣,博弈論都是一個(gè)強(qiáng)有力的分析工具。現(xiàn)在,它不僅在經(jīng)濟(jì)學(xué)領(lǐng)域得到廣泛應(yīng)用,在軍事、政治、商業(yè)征戰(zhàn)、社會(huì)科學(xué)領(lǐng)域以及生物學(xué)等自然科學(xué)領(lǐng)域都有非常重大的影響,工程學(xué)中如控制論工程也少不了它。我們舉的例子,只是幫助大家形成博弈論的基本概念,實(shí)際上它是非常精深的。現(xiàn)在與它緊密聯(lián)系的經(jīng)濟(jì)學(xué)分支是信息經(jīng)濟(jì)學(xué)。信號(hào)游戲、拍賣形式、激勵(lì)機(jī)制、委托人—代理人理論和公共財(cái)政學(xué)是博弈論和信息經(jīng)濟(jì)學(xué)研究的重要課題。
應(yīng)該感謝美國(guó)數(shù)學(xué)家馮?諾依曼(Von Neumann)和摩根斯坦(Morgenstern),是他們?cè)凇恫┺恼摵徒?jīng)濟(jì)行為》(1944)一書中提出了博弈論的經(jīng)濟(jì)思想。馮?諾依曼在數(shù)學(xué)、計(jì)算機(jī)、經(jīng)濟(jì)學(xué)等領(lǐng)域都有奇才般的貢獻(xiàn),可惜英年早逝。1950-1954年,美國(guó)數(shù)學(xué)家統(tǒng)計(jì)學(xué)家納什接連發(fā)表多篇論述對(duì)策論的文章,奠定了現(xiàn)代博弈論學(xué)科體系的基礎(chǔ)。