原文

http://plato.stanford.edu/entries/paradox-stpetersburg/

這是困擾了許多科學家200多年的一個矛盾,事情是這樣的,最早在18世紀的科學家尼可拉斯白努力(Nicolaus Bernoulli)發現了這個問題,並且由他的兄弟Daniel Bernoulli刊登在St. Petersburg Academy Proceedings. 所以它被叫做St. Petersburg Paradox。 回到正題,這是在講一個賭注,假如有一天你的舅舅告訴你他跟你玩一個賭注,你今天擲硬幣若是正面,它給你2塊錢,擲背面沒有錢且結束遊戲,擲到正面的話可以再擲一次,又擲到可以拿到4塊錢,以此類推。其獎項為2^n。所以說呢,這個遊戲如果一直擲到正面那就會有一直玩不完的遊戲,且隨著時間獎項持續指數成長。以下列表格可以列出其每次擲硬幣的機率和獎項以及其期望值

遊戲次數 機率 獎金 期望值
1  1/2 2 1
2  1/4 4 1
3  1/8 8 1
4 1/16 16 1
5 1/32 32 1
6 1/64 64 1
7 1/128 28 1
8 1/256 256 1
9 1/512 512 1
10 1/1024 1024 1

 

所以問題來了,你會花多少錢參加這場遊戲賭注? 以數學期望值來看,參加這場遊戲賭注值得花無限大的錢,因為它的期望值無限大... 這件事困擾著很多科學家,他們想不透,如果把這個賭注呈現在他們面前,他們也不會用無限大的金錢去參加,因為每次的期望值只有一塊,如果夠幸運是可能拿到很多很多的錢沒有錯,但那也是要等到好幾次都擲到聖盃才行,如果拿無窮大的錢去參加這賭注很明顯不make sense。但是在數學上這樣的期望值就是無限大。

解法一: Utility

當時白努力給了一個解答,卻沒有滿足所有的數學家,他以utility去解決這個矛盾。 他認為人們的決定不是基於錢幣的絕對值,而是他們心理面認為的數值(utility),後來這個想法成為Utility Theory,同樣的讓科學家困在這個theory很久很久,直到快思慢想的作者提出prospect theory,才讓大家知道utility theory不是萬能。題外話,白努力假設每個人在擁有一個東西到一定程度時,對於他的喜好度會下降,這個喜好度他稱之為utility。他把這個utility假定為log(獎值)。 結果如下表

遊戲次數 機率 Log獎金 期望值
1  1/2 0.301 0.1505
2  1/4 0.602 0.1505
3  1/8 0.903 0.1129
4 1/16 1.204 0.0753
5 1/32 1.505 0.047
6 1/64 1.806 0.0282
7 1/128 2.107 0.0165
8 1/256 2.408 0.0094
9 1/512 2.709 0.0053
10 1/1024 3.01 0.0029

 

順利解決此矛盾讓其期望值不再等於無窮大,但是問題來了,如果我們重新設計這個遊戲,假設獲得的獎勵是10的(2^n)次方呢? 白努力以log來當作人們對金錢的utility表示法只是一個假設想告訴大家這個值越大會越趨於平坦,越小則越接近指數,但是如果把規則改成10^(2^n),如下表所示。

遊戲次數 機率 獎金 Log獎金(Utility) 期望值
1  1/2 10^2 2 1
2  1/4 10^4 4 1
3  1/8 10^6 8 1
4 1/16 10^8 16 1
5 1/32 10^10 32 1
6 1/64 10^12 64 1
7 1/128 10^14 128 1
8 1/256 10^16 256 1
9 1/512 10^18 512 1
10 1/1024 10^20 1024 1

 

St. Petersburg的矛盾又回來了....

解法二: Risk Aversion

對於此St. Petersburg遊戲來說,如果你能40次都擲到硬幣正面,那可以拿到1.1兆的獎金,但是機率則是1.1兆分之一。玩這遊戲有一半的人只會拿到2元,75%的人只會拿到4元以下的獎金,你拿到高於25塊錢獎金的機率低於1/25。所以任何要花25塊錢玩這個遊戲的人其實都面對了很愚蠢的一項風險。為何說這是一項愚蠢的風險,最能說服人的點在於在這個遊戲中要拿到高額的獎金就要冒很大拿不到的風險,所以在白努力的定義中人們是Risk averse,風險趨避的,所以對於這項遊戲他們給的utility在越後面的輪次一定不到1,所以會讓整場遊戲的期望值收斂為一個數字,對大部分的人而言可能落在25元左右,而不會是無限大。但是依據數學期望值來說,對於這項遊戲,真正"理性"的人應該是要付出哪怕無窮大的錢都要玩這遊戲,因為它的期望值就是無窮大,縱使我們知道人有個risk averse的傾向,但如果你說人們不接受這遊戲賭注才叫作理性,那是否這期望值的理論要整個被推翻掉了? 當然不可能。所以St. Petersburg矛盾仍在......

解法三: 有限的結果

也就是這個N是有限的而非無限的,為什麼? 有幾種可能,如這遊戲是在賭場進行,一個人的壽命是有限的,我們如何能說這個N是無限的? 所以它當然是有限的,但是我們擲到連續40次正面就有1.1兆的收入,擲40次硬幣不必花到一輩子吧? 所以第二個限制就是跟你對賭的人,或者說是賭場他的錢不是無限的而是有限的。所以賭場如有這個遊戲他一定會設定一個最大值N,譬如說在25,確保玩的人最高獎金在33,554,432元,賭場可以負擔的獎金數目。所以為什麼大家心中直覺對參與這遊戲願意付的錢大概就25塊,因為人們不信任提供這遊戲的人在擲了40次正面硬幣後會給參予者1.1兆的獎金,他們認為莊家在說謊。這個理由很合理,但是依然沒有解決St. Petersburg Paradox這項理論上的矛盾問題。

 

[St. Petersburg Paradox Simulation: graph of average winnings (y-axis, ranging from 0 to 9) over game plays (x-axis, 1 to about 20,000).  Starts at an average win of $1 with big jumps at  200 (to about $5 but then down to $4.50), 1300 (back to $5), 4000 (to about $6), 6400 (to about $7), and 13500 (to about $8).  It ends at about $7.75]

 

上圖對此St. Petersburg遊戲作了電腦模擬,如果只玩452次以下贏的次數平均在4次以下,但隨著玩的次數越來越多,贏的次數會慢慢往上跳,也就是說如果你一次要花很多的錢玩此遊戲,那肯定要玩非常非常多次才能夠得到所謂的正報酬。這有點類似Martingale Strategy,此strategy在講說一個賭徒設定賭博要賺的目標錢,如果輸了,下一注就double,以此類推直到賺到原本的目標為止,如果賭徒有無限的資本,那他一定可以達到此目標,但問題是一般的賭徒並不會有無限的資本,他很可能在達到他要的目標前就輸個精光了。Martingale strategy成立的條件只有在賭徒確定他身上的錢足夠度過可能有的幾次連續的損失,但他一定無法確定他要經過幾次損失之後才會贏那麼一次,可能他輸的局數是0、100或是很大的數字,他無法確定。同樣地,一間賭場如果要給客戶玩St. Petersburg賭局並讓客戶給予很高的參加費,總是有機會(low probability, maybe really low)會讓一個客戶總是擲到正面然後讓這家賭場沒辦法支付足夠的獎金,賭場無法確定每位客戶一定會在哪一局結束。

評論: 這讓我想到過年的擲杯遊戲,每人付2000元擲最多杯的人開回汽車。查新聞最高紀錄大概也只在13杯,以St. Petersburg遊戲來說賭場僅損失8192元,以上圖看理論上要有很多很多的人參予才會有機會有人能擲硬幣擲到讓賭場倒掉,但問題是,在數學的期望值來說這場遊戲的期望值是無限大,真的有賭場敢收10,000元來讓客人玩這遊戲嗎? 當然如果每人要繳10,000元去玩這個遊戲,理論上玩的人不多,最終應該是賭場全部沒收賭金,但有哪幾個賭場會敢出這個遊戲呢? 如果出了也一定會定局數,就跟Martingale的賭徒,理論上他無限double賭注最終一定讓他得到,但前提是他要有無限的資源足夠準備可能無法確定的賭注次數,並且在輸過一個輪數危及他財產安全時,多數賭徒不太可能會繼續double下去。

有人說St. Petersburg因為有無限大的期望值,在現實生活中雖並非不可能,但理論上令人反感,這是個無法被思考的實驗,但真的是如此嗎? 如果你去想像你能夠用錢買到一個鑄幣機,並且可以事後付款,那你會用多少錢買這個鑄幣機? 你會認為這個問題無法思考或沒有答案嗎? 也許你的答案是任何價格你都會買,因為你可以在買完後打出這些硬幣然後付款。

當然,這裡有些實際的考量在於,這台鑄幣機要花多久才能有錢幣出來,每次花多少時間,這機器會壞掉嗎? 或者你出的價格會讓你這輩子都在鑄幣鑄到死都沒辦法鑄到此鑄幣機的價格? 很顯然St. Petersburg Paradox是可以思考的問題。 鑄幣機的問題跟St. Petersburg的差別只在於前者是可以保證讓你有大量的回報而後者則像是一個有無限回報的樂透,兩者的期望值都是無限大。這兩者的問題都可以被思考。

然這概念產生了一項混亂,假設一個人上天堂對他有無限的價值,神對你說如果你做了一件好事情就有1%的機會上天堂,作100件就會上天堂,那以期望值來講我們是否只需要作一件好事然後就變回一個自私自利的人? 因為0.01 * 無限大 = 無限大。  這顯然完完全全不合邏輯也不正確。

舉電腦的例子,電腦隨著時間推移會越快越實用,而價格也會越便宜,那如果一個人要等到能夠花到最少的錢買到最好的電腦要等多久? 可能他這輩子都沒辦法去買一台電腦了。所以對於這類矛盾,我們可以藉由引入一個實際的情境去補充,如電腦這個例子,但如果我們不這麼去作,引入實際情境讓其行不通,這個理論還是存在所謂的矛盾性,這理論本身的矛盾依然沒有被解決。

同樣地,以美學去評價一個電影並沒考慮到這個電影在實際放映時因為距離太遠所以到找到裡面的一個內容物很困難。假如美學理論告訴你這部電影極棒,但其他因素告訴你不要去看,這不是美學理論本身有問題。再舉例,如果你在玩撲克牌,正決定是否要加錢、按兵不動或者回家時,你會考慮到現在凌晨5點你想回家了,但是以純粹數學理論來看,你想回家了不是考慮的因素,他只考慮你現在有甚麼牌、對手可能有甚麼牌,現在大家出的籌碼有多少等等。你認為這局不能玩了因為你想睡覺並不在整個數學理論的討論範圍內。

以純期望值理論來說,它告訴我們在St. Petersburg賭局中付再多的錢參予此賭局都划算因為它的期望值是無限大。這是非常奇怪的結果。這項結果並沒有引出期望值理論是錯的這項結論,我們可能必須去接受這項很奇怪的結果,這個矛盾到200年的今天依然沒一個完美的解答。所以我們稱它為St. Petersburg Paradox。就像Clarky在2002年說過的"St. Petersburg這項矛盾是我們必須吞下去的其中一個矛盾之一"。

 

 

arrow
arrow
    全站熱搜

    Charles 發表在 痞客邦 留言(1) 人氣()