貝葉斯決策理論的創(chuàng)立者美國(guó)數(shù)學(xué)家和統(tǒng)計(jì)學(xué)家萊昂納多·薩維奇(Jimmie Savage,1951)在其代表作《統(tǒng)計(jì)學(xué)的基礎(chǔ)》(The Foundations of Statistics)指出,貝葉斯決策理論只能應(yīng)用于他在該書中所指的“小世界”中,本書作者肯·賓默爾贊同這一觀點(diǎn),認(rèn)為貝葉斯更新并不是科學(xué)歸納問(wèn)題的唯一解,因而在本書中詳盡闡述了什么是正統(tǒng)的貝葉斯決策理論之后,對(duì)貝葉斯決策理論進(jìn)行了擴(kuò)展,將理性決策理論推進(jìn)到了比薩維奇考慮的“小世界”更大的世界中去,以超代表當(dāng)前正統(tǒng)的貝葉斯范式。全書共分10章,前9章分別介紹了顯示偏好、博弈論、風(fēng)險(xiǎn)、功利主義、古典概率、頻率、貝葉斯決策理論、認(rèn)識(shí)論和大世界,最后一章是數(shù)學(xué)表述。
《理性決策》一書是“當(dāng)代經(jīng)濟(jì)學(xué)譯庫(kù)”中的一本。該書用縝密的邏輯分析、翔實(shí)生動(dòng)的例證,深刻闡述了作者的觀點(diǎn)。作者認(rèn)為,雖然關(guān)于什么是理性、什么是科學(xué)歸納問(wèn)題的解等問(wèn)題沒(méi)有明確的答案,但是我們?nèi)阅軌驅(qū)⒗硇詻Q策理論的前沿向前推進(jìn),超代表當(dāng)前正統(tǒng)的貝葉斯范式。作者首先用大量篇幅論述了他認(rèn)為什么應(yīng)該被看作是貝葉斯決策理論的正統(tǒng),糾正了他認(rèn)為對(duì)于該理論有誤讀的觀點(diǎn),在此基礎(chǔ)上,他將貝葉斯決策理論擴(kuò)展到比薩維奇考慮的小世界更大的世界中去,拓展了這一理論。該書適用于經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)學(xué)等專業(yè)的師生,以及探尋決策理論基礎(chǔ)的研究者。
什么是理性?什么是科學(xué)歸納問(wèn)題的解?我認(rèn)為期待這些問(wèn)題有明確的答案是不合理的,人們倒不如詢問(wèn)生命或意識(shí)的精準(zhǔn)定義。但我們的確仍能試著將理性決策理論的前沿向前推進(jìn),以超越代表當(dāng)前正統(tǒng)的貝葉斯范式。
許多人沒(méi)有看到這種努力的必要。他們認(rèn)為貝葉斯主義已經(jīng)提供了所有可能被問(wèn)的問(wèn)題的答案。我認(rèn)為這種類型的貝葉斯主義者沒(méi)能明白,他們的理論只能應(yīng)用于倫納德?薩維奇(Leonard Savage, 1954?)在其著名的《統(tǒng)計(jì)學(xué)基礎(chǔ)》(The Foundations of Statistics)一書里所指的“小世界”中。而科學(xué)探詢的世界卻如此之大,大到未來(lái)的科學(xué)家們將帶著疑問(wèn),來(lái)回顧知識(shí)史上那段宣稱貝葉斯更新是科學(xué)歸納問(wèn)題的唯一解可能被當(dāng)真的時(shí)期。
歐文?古德(Irving J. Good)曾經(jīng)聲稱發(fā)現(xiàn)了46656種不同類型的貝葉斯主義者。因此我首先要來(lái)澄清我認(rèn)為什么應(yīng)該被看作關(guān)于貝葉斯決策理論的正統(tǒng)——一組給未來(lái)留下最少口實(shí)的基礎(chǔ)假定。這占據(jù)了本書的大部分內(nèi)容,因?yàn)槲因v出時(shí)間來(lái)沿著這個(gè)方向重新思考了概率論的各個(gè)方面。我之所以花這么多時(shí)間來(lái)提供標(biāo)準(zhǔn)決策理論的一個(gè)超越正統(tǒng)的回歸,是因?yàn)槲腋械皆陂_始我自己的將貝葉斯決策理論擴(kuò)展到比薩維奇考慮的小世界更大的世界中去的嘗試(第9章)之前,有必要否定那些有關(guān)這個(gè)理論到底在說(shuō)什么——或者說(shuō)我認(rèn)為這個(gè)理論應(yīng)該在說(shuō)什么——的無(wú)數(shù)誤讀(既有肯定的,也有否定的)。
我從來(lái)沒(méi)有想象我對(duì)貝葉斯決策理論的擴(kuò)展會(huì)最終解決科學(xué)歸納問(wèn)題,但我的確認(rèn)為我的方法有時(shí)候會(huì)被發(fā)現(xiàn)在應(yīng)用中有用。比如,我的理論允許博弈論的混合策略(mixed strategy)擴(kuò)展為我所命名的混同策略(muddled strategy),正如純策略(pure strategy)被博弈論的創(chuàng)立者擴(kuò)展為混合策略一樣。
本書的讀者有哪些人呢?我希望讀者群不僅僅來(lái)自我所在的經(jīng)濟(jì)學(xué)圈子,還包括統(tǒng)計(jì)學(xué)家和哲學(xué)家。就算本書只是成功地拉近了這三個(gè)圈子各自之間的距離,它也是有價(jià)值的。然而,那些尋找對(duì)所有最近研究的通盤回顧的讀者就需要找一本比本書厚得多的書看了。我已經(jīng)盡力將本書范圍之外的文獻(xiàn)放到書后的參考書目中,不過(guò)我從未偏離我寫作此書的初衷太遠(yuǎn)。這種靈活的方法意味著本書會(huì)吸引那些想要學(xué)一點(diǎn)決策理論但又不被大量繁難的數(shù)學(xué)或艱深哲學(xué)推理所包圍的學(xué)生,以及那些探尋決策理論基礎(chǔ)的研究者。
那些我沒(méi)能成功地將數(shù)學(xué)維持在低水平的章節(jié),或者那些因?yàn)槠渌蚨兊糜行╇y的章節(jié),被我在頁(yè)邊空白處用向下指的箭頭標(biāo)明了。當(dāng)這樣的箭頭出現(xiàn)時(shí),讀者可以直接跳到下一個(gè)章節(jié)。
最后,我要代表每一個(gè)研究決策理論的人感謝鄧肯?盧斯(Duncan Luce)和霍華德?雷法(Howard Raiffa),他們的《博弈與決策》(Games and Decisions)一書在寫完后50多年來(lái)仍然是我們獲取靈感的來(lái)源。我還要以個(gè)人的名義感謝弗朗切斯科?喬凡諾尼(Francesco Giovannoni),拉里?薩繆爾森(Larry Samuelson),杰克?施特歇爾(Jack Stecher), 彼得?瓦克(Peter Wakker)和Zibo Xu,他們對(duì)本書的初稿提出過(guò)許多有益的評(píng)論。
肯·賓默爾,是一位由數(shù)學(xué)家轉(zhuǎn)而成為經(jīng)濟(jì)學(xué)家的學(xué)者,他致力于博弈論及其在經(jīng)濟(jì)學(xué)、演化生物學(xué)、心理學(xué)和道德哲學(xué)中的應(yīng)用。是著名的博弈論四君子之一。主要著作《博弈論和社會(huì)契約》《自然正義》等都非常有影響力。
主編的話
序
1顯示偏好
1.1 理性
1.2 模型化一個(gè)決策問(wèn)題
1.3 理智是激情的奴隸
1.4 來(lái)自伊索的教訓(xùn)
1.5 顯示偏好
1.6 理性和進(jìn)化
1.7 效用
1.8 挑戰(zhàn)傳遞性
1.9 因果效用謬論
1.10實(shí)證和規(guī)范
2 博弈論
2.1 引言
2.2 什么是博弈
2.3 理性的悖論
2.4 紐科姆難題
2.5 擴(kuò)展式博弈
3 風(fēng)險(xiǎn)
3.1 風(fēng)險(xiǎn)和不確定性
3.2 馮?諾依曼和摩根斯坦
3.3 圣彼得堡悖論
3.4 期望效用理論
3.5 阿萊悖論和澤克豪瑟悖論
3.6 效用刻度
3.7 對(duì)風(fēng)險(xiǎn)的態(tài)度
3.8 無(wú)界效用?
3.9 實(shí)證應(yīng)用?
4 功利主義
4.1 社會(huì)選擇中的顯示偏好
4.2 功利主義的傳統(tǒng)方法
4.3 偏好的強(qiáng)度
4.4 人際間的效用比較
5 古典概率
5.1 起源
5.2 可測(cè)度集合
5.3 柯爾莫哥洛夫公理
5.4 自然數(shù)的概率
5.5 條件概率
5.6 更高和更低的概率
6 頻率
6.1 解釋經(jīng)典概率
6.2 隨機(jī)化機(jī)制
6.3 理查德?馮?米塞斯
6.4 完善理查德?馮?米塞斯的理論
6.5 完全混同盒子
7 貝葉斯決策理論
7.1 主觀概率
7.2 倫納德?薩維奇的理論
7.3 荷蘭賭
7.4 貝葉斯更新
7.5 構(gòu)造先驗(yàn)概率
7.6 博弈中的貝葉斯推理
8 認(rèn)識(shí)論
8.1 知識(shí)
8.2 貝葉斯認(rèn)識(shí)論
8.3 信息集
8.4 大世界中的知識(shí)
8.5 顯示知識(shí)?
9 大世界
9.1完全無(wú)知
9.2 擴(kuò)展貝葉斯決策理論
9.3 博弈論中的混同策略
9.4 結(jié)論
10 數(shù)學(xué)表述
10.1相容偏好
10.2 球體的豪斯多夫悖論
10.3 以零概率事件為條件
10.4 應(yīng)用巴拿赫—塔斯基悖論定理
10.5 混同盒子
10.6 求解函數(shù)方程
10.7 加性
10.8 博弈論中的混同均衡
參考文獻(xiàn)
1. 顯示偏好
1.1理性
有理數(shù)是兩個(gè)整數(shù)之比。古人認(rèn)為所有的數(shù)都是有理數(shù),但畢達(dá)哥拉斯定理證明單位面積正方形對(duì)角線的長(zhǎng)度是無(wú)理數(shù)。傳統(tǒng)觀點(diǎn)認(rèn)為,真正作出這一發(fā)現(xiàn)的天才被溺斃了,以免他動(dòng)搖對(duì)數(shù)的難以表達(dá)的(ineffable)性質(zhì)的畢達(dá)哥拉斯信念。但現(xiàn)在每個(gè)人都知道2的平方根沒(méi)有什么不合理的,即使我們?nèi)匀环Q其為無(wú)理數(shù)。
類似地,一個(gè)哲學(xué)家不是一個(gè)理性主義者也沒(méi)什么不合理的。哲學(xué)中的理性主義包含著不應(yīng)用任何數(shù)據(jù)就得出實(shí)質(zhì)性結(jié)論。如果你遵循科學(xué)方法,人們會(huì)認(rèn)為你是一個(gè)經(jīng)驗(yàn)主義者,而不是理性主義者。但只有當(dāng)今的創(chuàng)造主義者才感到有強(qiáng)烈的愿望來(lái)指責(zé)科學(xué)家們非理性。
理性決策理論到底是什么呢?下面關(guān)于什么才算理性的爭(zhēng)論非常生動(dòng)有趣。
貝葉斯主義 貝葉斯主義是指貝葉斯決策理論總是理性的主義。例如,該主義認(rèn)為大衛(wèi)?休謨(David Hume)的科學(xué)歸納不能在理性基礎(chǔ)上得到驗(yàn)證的觀點(diǎn)是錯(cuò)誤的。許多學(xué)者確信貝葉斯推斷已經(jīng)被證明是唯一連貫的推斷形式,丹尼斯?林德利(Dennis Lindley, 1988)是其中之一。
由丹尼斯?林德利和其他學(xué)者所推崇的這一正統(tǒng)觀點(diǎn)在經(jīng)濟(jì)學(xué)中已經(jīng)變得越來(lái)越無(wú)所不在了,但伊扎克?基利波和戴維?施梅德勒(Gilboa and Schmeidler, 2001)已證明,考慮與此正統(tǒng)觀點(diǎn)不同的其他觀點(diǎn)而不遭受與發(fā)現(xiàn)了√2的無(wú)理性的畢達(dá)哥拉斯異教徒們類似的命運(yùn)仍是有可能的。受他們兩人的激勵(lì),我以他們?yōu)榘駱犹岢鋈齻(gè)問(wèn)題:
什么是貝葉斯決策理論?
什么時(shí)候我們應(yīng)該把貝葉斯決策理論看作理性的?
當(dāng)貝葉斯決策理論是非理性的時(shí)候我們應(yīng)該做什么?
在回答第一個(gè)問(wèn)題時(shí),我希望將貝葉斯決策理論和貝葉斯主義區(qū)別開來(lái)。我們可以堅(jiān)持前者的優(yōu)點(diǎn),而無(wú)后者“走火入魔”之虞。
在回答第二個(gè)問(wèn)題時(shí),我將指出倫納德?薩維奇(Leonard Savage)——通常被認(rèn)為是貝葉斯決策理論的創(chuàng)立者——持有的觀點(diǎn)是:只有在小世界中運(yùn)用貝葉斯決策理論才是理性的。但什么是小世界呢?
宏觀經(jīng)濟(jì)學(xué)和高級(jí)金融的世界最不可能是小世界。當(dāng)我們不得不在這樣的大世界中作決策時(shí)我們應(yīng)該做什么?我之所以寫這本書,就是因?yàn)槲蚁氤蔀槟切┱J(rèn)為自己已經(jīng)有第三個(gè)問(wèn)題的初始答案的精英分子中的一員。
本書不會(huì)提供理性的正式定義。我不相信理性主義哲學(xué)家們?cè)趹?yīng)用康德的實(shí)踐理性概念時(shí)頭腦里似乎已經(jīng)存在的那種柏拉圖式的理想。我認(rèn)為理性原理是被發(fā)明而不是被發(fā)現(xiàn)的。堅(jiān)持一個(gè)先驗(yàn)的定義會(huì)犯畢達(dá)哥拉斯式的提前向可能的未來(lái)發(fā)明關(guān)閉我們的思維的錯(cuò)誤。因此,我只是尋求將正統(tǒng)決策理論向大世界情形作最小擴(kuò)展,而不是假裝我能接通某部形而上的熱線電話以到達(dá)絕對(duì)真理的本質(zhì)。
1.2模型化一個(gè)決策問(wèn)題
當(dāng)潘多拉作一個(gè)決定時(shí),她會(huì)從所有可行的行動(dòng)中選擇一個(gè)。她行動(dòng)的結(jié)果通常會(huì)取決于她作決策時(shí)世界所處的狀態(tài)。比如,如果她選擇上路,她未來(lái)的命運(yùn)將取決于是否有輛汽車碰巧經(jīng)過(guò)。
我們可以通過(guò)將一個(gè)決策問(wèn)題模型化為如下的方程來(lái)刻畫這樣一個(gè)場(chǎng)景:
D : A×B→C
其中,A是可行行動(dòng)集合,B是可能的世界狀態(tài)集合,C是可能的后果集合。因此,當(dāng)潘多拉在世界處于狀態(tài)b時(shí)選擇行動(dòng)a,結(jié)果就是c = D(a, b)。圖1.1給出了一個(gè)簡(jiǎn)單例子。
……