闲聊概率论1

(1) St. Petersburg 问题

有两位玩家 A 和玩家 B，同意玩一游戏。玩家 A 被要求掷一公平硬币，直到掷到
出现正面为止。假设玩家 A 掷了 k 次，玩家 B 同意付 2^(k-1) 美元。
很明显，期望值 E = (1/2)*1 + (1/4)*2 + (1/8)*4 + (1/16)*8 + ... = 1/2 +
1/2 + 1/2 + ... = 无穷大
问题是玩家 A 愿意付多少钱玩这个回报期望值为无穷大的游戏？
这是一个只有不太可能发生的事件会产生导致无限期望值的高奖的游戏。
玩家 A 当然要考虑风险等因素。这说明仅仅根据期望收益最大进行决策是不尽合理。

这个问题牵涉到效用(Utility)概念。
例如，假设某消费者的消费集为X ={无，1个苹果，1个橙子，1个苹果和1个橙子，
2个苹果，2个橙子}，他的效用函数为u (无)=0，u (1个苹果) = 1, u (1 orange)
= 2, u (1 apple and 1 orange) = 5, u (2 apples) = 2 and u (2 oranges) =
4. 那么这个消费者更喜欢 1 orange 和 1 apple, 喜欢 1 个到 2 个橙子。
货币的效用值是指人们主观上对货币价值的衡量。数学家根据货币的数量来估计货
币，而理性的人则根据他们对货币的使用来估计货币。确定一件物品的价值不能以
价格为基础，而是以它产生的效用为基础。$1000 的收益对穷人来说比对富人更重
要，尽管两者都有相同的数量。

伯努利提出一种对数效用模型：U ( w ) = ln ( w )，U ( w ) 是效用函数，ln 是
对数函数，w 是玩家总财富。他提出下列公式来计算玩上述游戏的费用 c

E(U) = Sigma((k=1, 无穷大), ((1/(2^ k)) * (ln (w + 2^k - c) - ln(w))
Sigma((i=a, b), f(i)) 表示连加(summation) 运算符。

根据上述公式，百万富翁， U (1 M)，需要付 20.88，只有$1000 的穷人， U (1000)，
需要付 10.95 。
实际上，上述方法是从每个可能的结果中找到效用的概率加权平均值。

EU=[P(z) * U(z)]+[P(y) * U((y))] P(z) 是效用的概率

假设有两个方案，方案A ；稳获100美元；
方案B：获250美元的概率是41%，获0美元的概率是59%。计算一下两个方案的期望效
用
E(B) = 0.41 * U( 250) + 0.59 * U(0) = 102.5 > 100 = E(A) ，设 U ( x ) =
x
很多人会采用方案A ，因为它是0风险。
关于效用，可见 LINK
https://en.wikipedia.org/wiki/Utility

(2) 凯利准则

木头姐( Cathie Wood) 说过，这世界上没有股神，只有睹神。

凯利准则是一个确定下注最佳理论规模的公式。凯利赌注大小是通过最大化财富对
数的期望值得到的，相当于最大化期望的几何增长率。早年，伯努利曾建议，当一
个人可以选择赌注或投资时，应该选择结果几何平均值最高的那个。这在数学上等
同于凯利准则。见本文的 (1) 。

投资公式

凯利公式的一般形式允许部分损失，这与投资相关：

fo = p/a - q/b (a)

式中

fo 是应用于证券的资产部分；
p 是资产价值增加的概率；
q 是资产价值下降的概率；.( q = 1 - p )
a 是资产损失的比例；如果证券价格下跌 10%，则 a = 0.1
b 是资产增值的比例；如果证券价格上涨 10%，则 b = 0.1

我们从 1 个单位的资产开始并投入一小部分资产 f 。获利的概率是 p，在这种情
况下，所得资产等于 1 + f * b 。输的概率是 q ，在这种情况下，所得资产等于
1 - f * a 。因此，预期的几何增长率 r 是：

r = (1 + f*b)^p * (1 - f*a)^q

先取每一边的对数

E = log(r) = p log(1 + f*b) + q log(1 - f*a)

E 表示对数资产增长。
对上式取导和令得到的等式为零：

dE/df| (f = fo) = pb/(1+ fo*b) + (-qa )/(1- fo * a) = 0

最后得到凯利公式：

fo = p/a - q/b

fo 是使价值增长率最大化的投入资产。
据说巴菲特也采用此法。

赌博公式

令上面(a) 式中的 a = 1，即“输率”是 100%，我们得到赌博游戏凯利公式

fo = p - q/b (b)

式中

fo 是部分睹注；
p 是获胜的概率；
q 是损失的概率；.( q = 1 - p )
b 是赢得赌注的比例；也叫“赔率”(odds)。赔率是结果发生的概率与结果不发生
的概率之比；odds = p/(1-p) ，时常是奖金与本金的比率。
如果 b = q/p ，那么该准则建议赌徒什么都不下注。

例子

有$25 投入一赌博。每次投入睹注的20%(超出$25可以暂借)。这时

r = (1 + f*b)^p * (1 - f*a)^q = (1 + 0.2 * 1)^0.6 * (1- 0.2 * 1)^0.4 ，
b = 1, a = 1

每轮平均收益为 2.034%。300 轮后的理论预期财富为 10,505 美元 ( = 25 * (1.02034)
^300 ) 。

(3) 鞅策略(Martingale)

鞅策略是一类投注策略，该策略让赌徒在每次失败后加倍下注，这样在连续失败后
的第一场胜利将弥补之前的所有损失。但在输的概率 q > 1/2 时，在整个过程结束
时睹徒还是输钱(下面有证明)。在赢的概率 p 和输的概率 q 都等于 1/2，赌徒拥
有无限的财富、赌注和时间的情况下，鞅是一种获胜策略。
注意：这里介绍的鞅策略是一类投注策略，不是鞅论；那是讨论一种随机过程，详
见 LINK
https://en.wikipedia.org/wiki/Martingale_(probability_theory)

单轮数学分析

将一轮定义为一系列连续的失败，然后是赌徒获胜或破产。赢了之后，赌徒“重置”，
被认为开始了新一轮。因此，可以将连续的鞅投注序列划分为一系列独立的回合。
下面分析一轮的期望值。

令 q 为输的概率（例如，对于美式双零轮盘赌，下注黑色或红色的概率为 20/38）。
令 B 为初始投注金额。设 n 是赌徒可以输的有限赌注数。

赌徒将输掉所有n 个赌注的概率是q^n 。当所有赌注都输时，总损失为

Sigma((i=1, n), B * 2^(i-1)) = B(2^n - 1)
Sigma((i=a, b), f(i)) 表示连加(summation) 运算符。

赌徒没有输掉所有n 个赌注的概率是 1- q^ n 。在所有其他情况下，赌徒赢得初始
赌注 ( B )。因此，每轮的预期利润为

(1 - q^n) * B - q^n * B(2^n - 1) = B(1 - (2q)^n )

当q > 1/2 时，对于所有n > 0 ，表达式 1 - (2 q )^n 给定赌注，赌徒输的可能性大于赢的可能性的所有游戏，平均来说，每一轮该赌徒
预计会输钱。

(4) 巴拿赫的火柴盒问题

一位先生随身携带两个火柴盒：一个在他的左口袋里，一个在他的右口袋里。每次
他需要一根火柴时，他都可能从任一口袋中取出。假设他把手伸进口袋，第一次发
现捡到的盒子是空的。如果假设各个火柴盒最初包含N根火柴，问在另一个盒子里恰
好有 k 根火柴概率是多少？
不失一般性，考虑他右口袋里的火柴盒有无限数量的火柴的情况，令M是在发现左口
袋里的火柴盒为空之前从该火柴盒中取走的火柴数。当发现左边的口袋是空时，这
先生已取了那个口袋N + 1 次。则M是伯努利试验N + 1 次失败之前成功的次数，
该试验为负二项分布，于是：

P(M = m) = Combination( N + m, m) * (1/2)^ ( N + 1 + m)
Combination(a, b) 表示组合运算符。

我们看到左边的口袋先被发现是空的概率是 P(M 者的可能性相同。
我们看到数K另一个口袋里剩下的火柴是

P(K = k ) = P(M = N - k | M N - k) * (1/2)^(2N-k)

分布的期望值约为 2 * SquareRoot(N/PI) - 1 。(这是使用斯特林近似式)。
所以火柴盒最初N = 40 根火柴，另一个火柴盒中的预期火柴数是 6。.

(5) 两个信封问题

给一个人两个无法区分的信封，每个信封里都有一笔钱。一个信封的钱是另一个的
两倍。该人可以选择一个信封并保留其中的钱。他们随机挑选一个信封，但在打开
信封之前，他们可以更换信封，取走另一个信封。你应该更换吗？

更换理由：假设这个人的理由如下：

1。用A表示玩家所选信封中的金额。
2。A是较小金额的概率是 1/2，A 是较大金额的概率也是 1/2。
3。另一个信封可能包含 2 A或A /2。
4。如果A是较小的金额，则另一个信封包含 2 A。
5。如果A较大，则另一个信封包含A /2。
6。因此，另一个信封包含概率为 1/2 的 2 个A和概率为 1/2的 A /2。
7。所以另一个信封里的钱的期望值是：

(1/2) * (2A) + (1/2) * (A/2) = (5/4) A

8。这大于A，因此，人们认为他们可以通过更换获利。
9。更换后，用B表示该信封中的金额。与上述完全相同的方式推出另一个信封里的
钱的期望值是(5/4)B。
10。该人得出结论，最理性的做法是再次换回。
11。因此，这个人最终将无限次地交换信封。

一种简单方法解决这个悖论。

两个信封中的总量是一个常数 3x, x 在一个信封和 2x 在另一个信封。
如果您选择带有x 的信封, 通过交换你获得金额 x。如果您选择带有 2x 的信封,
通过交换你失去了金额 x。所以通过交换，你平均获得

G = (1/2) x + (1/2)(-x) = 0

交换并不比保留好。期望值 E = (1/2) (2x) + (1/2)x = (3/2)x 对两个信封都一
样。因此不存在矛盾。
还有很多方法决这个悖论，见LINK：
https://en.wikipedia.org/wiki/Two_envelopes_problem

(6) 伯克森谬误

某医院研究检查了来自医院住院患者的统计样本中疾病的风险因素。由于样本是从
医院住院患者中采集的，而不是从普通公众中采集的，这可能会导致疾病与风险因
素之间出现虚假的负相关。例如，如果风险因素是糖尿病，而疾病是胆囊炎，统计
结果表明：与公共社会统计比较，没有糖尿病的住院病人患有胆囊炎可能性更高。
实际上，因为病人必须有某种非糖尿病(可能是胆囊炎引起)才能住进医院。
设有两个独立事件 A 和 B (如，测试疾病与风险因素之间关系)，我们有：

P(A|B) = P(A), then P(A|B ^ (A & B)) = P(A), 这里，^ 是交，而 & 是并。然
后
P(A|(A & B)) > P(A)
上式的结果是因为 (A & B) 事件组不再是完备的，它排除了 ~A & ~B，~ 是非(not)。

举例1：如果有一个样本100，A 和 B 独立发生，对总体来说，P(A) = P(B) = 1/2

| A | ~A | | A | ~A
|
--------------------------- ----------------------------
B | A&B | ~A&B | B | 25 | 25 |
--------------------------- ----------------------------
~B |A&~B | ~A&~B| ~B | 25 | 25 |
--------------------------- ----------------------------

但是，对上面表格的三个子单元来说， P(A|(A & B)) = 50/75 = 2/3

举例2：一收藏家有 1000 张邮票，其中 300 张是精美的，100 张是稀有的，其中
30 张既精美又稀有。他的所有邮票中有 10% 是稀有的，而他的精美邮票中有 10%
是稀有的，所以精美并不能说明稀有性。他展出了370枚精美或稀有的邮票。展出邮
票中有100枚稀有邮票，虽然仍然只有 10% 的精美邮票是稀有邮票，但展出的 70
枚不精美邮票全是稀有邮票 (100枚稀有邮票中有30枚既精美又稀有邮票，剩下70
枚稀有邮票全是不精美邮票)。如果观察者只考虑展出的邮票，由于“选择偏差”，
他们会观察到精美和稀有之间虚假的负相关关系（也就是说，不精美强烈表明陈列
中的稀有性，而不是整个收藏中的稀有性）。
与“选择偏差”(Selection bias) 有关的还有“ 辛普森悖论”( Simpson's paradox)，
“幸存者偏差”( Survivorship bias ) 等等。

(7) 点数分配问题

两名玩家玩一游戏，每轮获胜的机会均等。玩家平均贡献一个奖池，并事先约定第
一个赢得商定回合数的玩家将获得全部奖金。现在假设游戏在任一玩家取得胜利之
前被意外事件打断。那么如何公平地分配奖金呢？凭直觉可以知道，划分应该以某
种方式取决于每个玩家赢得的回合数，这样接近获胜的玩家将获得更大的奖池部分。
但问题不仅仅是计算问题；它还涉及决定什么是“公平”划分。
有人提出按照每个玩家获胜的回合数来分配赌注。如果比赛只进行了一轮就被打断，
这个规则会将整个奖池奖励给该单轮的获胜者，显然是不合理。有人构建了一种方
案，通过根据领先优势的大小来分配奖金。然而，这个解决方案仍然存在问题。假
设有两场商定回合数为 100 的比赛，它在以 65-55 领先和在以 99-89 领先时分别
中断。如果认为以 65-55 领先和以 99-89 领先是相同优势(都是领先10 点)，依此
方式划分赌注显然是不合理。因为前者仍然是一个结果不明确的游戏，而对于后者，
领先玩家的胜利几乎是肯定的. 。
所以划分不应该过多地依赖于实际发生的被中断博弈部分的历史，而应该依赖于博
弈在没有被中断的情况下可能继续进行的可能方式。很明显，在一场比赛中以 7-5
领先(商定回合数 10) 的选手最终获胜的机会与在一场比赛中以 17-15 领先 (商定
回合数20) 的选手最终获胜的机会相同。
因此帕斯卡和费马认为中断上述这两种情况应该导致相同的赌注分配。换句话说，
重要的不是每个选手到目前为止赢了多少局，而是每个选手还需要赢多少局才能取
得全面胜利。
费马这样推理：如果一个玩家需要 r 更多回合获胜和另一个玩家需要 s 更多回合
, 以后肯定有人在大于 (r + s - 1) 回合赢了这场比赛。因此，假设玩家要玩 r
+ s - 1更多回合；这些回合总共有 2 ^ ( r + s - 1) 不同的可能结果，每一个
2^ ( r + s - 1)可能性是同等。在其中一些可能的未来中，游戏实际上会在不到
r + s - 1 回合结束。费马因此能够计算出每个玩家获胜的概率，一个玩家获胜
的概率是 p ，另一个玩家获胜的概率是 1 - p 。只需简单地列表 2^ ( r + s - 1)
所有可能并计算其中有多少会导致每个玩家获胜。费马现在认为按赔率比例分配赌
注显然是公平的。
帕斯卡在几个方面进行了改进。通过操纵帕斯卡三角的恒等式和组合运算等，帕斯
卡得到：

玩家获胜的概率是 Sigma((k=r, r + s-1), Combination( r + s - 1, k)) * (1/(2^
( r + s - 1))
Sigma((i=a, b), f(i)) 表示连加(summation) 运算符。Combination(a, b) 表示
组合运算符。

帕斯卡的结果和费马的相同。

例子：两名玩家A和B玩一游戏，商定回合数为 4 。玩家各人的睹注为32。在被意
外事件打断前，玩家A已赢 2 点，玩家B已赢 1 点。r + s - 1 = 2 + 3 -1 = 4 。
在下一个 4 回合，玩家A至少要赢 2 点。现计算出玩家A再赢 2 点的概率。
设玩家A 的成功为 S (Success) ，失败为F (Failure) 。2 ^ ( r + s - 1) =
16 。16 种结果列出如下：
SSSS*，SSSF*，SSFS*，SSFF*，SFSS*，SFFS*，SFFF，FSSS*，FSSF*，FSFS*，FSFF，
FFSS*，FFSF，FFFS，FFFF
其中，至少有2个S 有 11 次 (带星号 * 的)。所以玩家A再赢 2 点的概率是 11/16
= 0.6875 。
玩家A应得到赌注为 0.6875 * 64 = 44 。
用帕斯卡的计算(实际上就是二项分布计算)：
Sigma((k=2, 4), Combination( 4, k)) * (1/(2^ 4) = 6 * (1/2^4) + 4 * (1/2^4)
+ (1/2^4) = 11/16 = 0.6875
帕斯卡的结果和费马的相同。

今日热点

一周热点