1) Chevalier De Mere 问题
这位老兄提出投掷 4 次骰子数字 6 出现的概率和投掷 24 次一对骰子数字对 (6,
6) 出现的概率是相同的。要注意的是投掷一对骰子是投掷一对相互独立集合系列。
投掷一次骰子数字 6 不出现的概率是 5/6 ,而投掷一 次一对骰子数字对 (6, 6)
不出现的概率是
35/36。由此,投掷 4 次骰子数字 6 出现的概率是:1 - (5/6)^4 = 0.516
而投掷 24 次一对骰子数字对 (6, 6) 出现的概率是:1 - (35/36)^24 = 0.491
投掷 4 次骰子数字 6 出现的概率比投掷 24 次一对骰子数字对 (6, 6) 出现的概
率高。
2) 伯特兰盒子问题
现有三个盒子,一个装有两金币(G);一个装有一金币(G)和一银币(S);一个装有两
银币(S)
-------- --------- ----------
| G G| | G S | | S S |
-------- -------- ----------
一个人随机地抽到一个盒子,从中随机地摸出一个硬币。如果是一个金币(G),请问
在相同盒子拿到金币(G)的概率有多大?
有人认为 概率是 1/2。理由是:接下来 只有 GG盒子和GS盒子含有金币,对于两盒
子能拿到金币(G)的概率是相同的,都是 1/2。
有人认为 概率是 2/3。理由是: GG盒子和GS盒子含有金币,原始时对于两盒子能
拿到金币(G)的概率是相同的,都是 1/2。但是,如果你选了GG盒子,事实上已经确
定能拿到金币(G)的概率是1; 而如果你选了 GS盒子,能拿到金币(G)的概率仍是 1/2。
用贝叶斯公式计算:
P(GG|seeG)=P(seeG|GG)*(1/3) / (P(seeG|GG)*(1/3) + P(seeG|SS)*(1/3) + P(seeG|GS)*(1/3)) = 1 / (1 + 0 + 1/2 ) = 2/3
概率论的“几何概率”(几何概型)曾给早期数学家带来麻烦:如投标(或射击)击中
2环,3环等导致概率为 1/无穷大 或 无穷大/无穷大。不得不将离散型随机变量概
率分布改为连续型随机变量概率均匀分布。
参考书:
A M Mathai, "An Introduction to Geometrical Probability: Distributional
Aspects with Applications"
3) 布丰投针问题
设我们有一个以平行且等距木纹铺成的地板,现在随意抛一支长度比木纹之间距离
小的针,求针和其中一条木纹相交的概率。
| |
|---- t ----|
| |
设针的长度为 l ,平行线之间距离 t 。x 为针的中心与最近平行线的距离。a 为
针和线之间夹角(锐角)。
x -- [0, t/2] , 均匀分布,其概率密度函数为 2/t
a -- [0, pi/2], 均匀分布,其概率密度函数为 2/pi
x, a 两者结合,概率密度函数为两者的积:4/(t* pi)
当 x 积分后 可得概率P: 2l/(t* pi)
(“短针”情况,l
P = integration (0, pi/2) integration (0, l/2 sin(a)) (4/(t* pi) dx da)
= 2l/(t* pi)
据说计算结果与坐标系有关(直角坐标系或极坐标系)。
4)伯特兰悖论
考虑一个内接于圆的等边三角形。若随机选圆上的弦,则此弦的长度比三角形的边
较长的概率为何?
伯特兰给出了三个方法,全是有效的,但导致的结果都不相同。
方法1
「随机端点」方法:在圆周上随机选给两点,并画出连接两点的弦。为了计算问题
中的概率,可以想像三角形会旋转,使得其顶点会碰到弦端点中的一点。可观察到,
若另一个弦端点在弦会穿过三角形的一边的弧上,则弦的长度会比三角形的边较长。
而弧的长度是圆周的三分之一,因此随机的弦会比三角形的边较长的概率为1/3。
方法2
「随机半径」方法:选择一个圆的半径和半径上的一点,再画出通过此点并垂直半
径的弦。为了计算问题的概率,可以想像三角形会旋转,使得其一边会垂直于半径。
可观察到,若选择的点比三角形和半径相交的点要接近圆的中心,则弦的长度会比
三角形的边较长。三角形的边会平分半径,因此随机的弦会比三角形的边较长的概
率亦为1/2。
方法3
「随机中点」方法:选择圆内的任意一点,并画出以此点为中点的弦。可观察到,
若选择的点落在半径只有大圆的半径的二分之一的同心圆之内,则弦的长度会比三
角形的边较长。小圆的面积是大圆的四分之一,因此随机的弦会比三角形的边较长
的概率亦为四分之一。
因博文不好画图,要看插图请参考原LINK:
https://en.wikipedia.org/wiki/Bertrand_paradox_(probability)
引起悖论的原因:有人认为是概率分布的问题。上述三种方法会给出不同弦的中点
分布。
方法3 给出一个均匀分布。
有人认为提出问题应该 WELL-POSED 。必须具有转换不变量。
这问题也发生在统计力学和气体物理学。
5) 酒/水悖论
先来介绍一个智力测试题: 酒和水混合问题。
我们有两个桶,桶1装有酒,桶2装有相等容量的水。我们从桶1取出一杯酒,放到桶
2。然后我们从桶2取出一杯混合酒水,放到桶1使两桶有相等容量的液体。请问这时,
桶1酒的含量百分比,桶2水的含量百分比,哪个更高? 答案是相等的。并且,不管
上述过程进行了多少次,是否有搅拌,杯的大小,只要结果是两桶有相等容量的液
体,答案都是相同的。
有一桶酒和水混合的液体,设 x 为酒和水之比,即 x = 酒/水。已知 x 的范围是
1/3
因为没有足够信息可找到严格的解答,我们采用“无区别原则”,假定 x 均匀分布。
对 x 来说,中点值是 5/3,两边间隔是 4/3 。
1/3---5/3---3
等间隔有相同50%的概率
Prob ( x
P = Prob ( x
当然也可以设 y = 水/酒,y = 1/x 。y 的范围是
1/3
对 y 来说,中点值也是 5/3,两边间隔也是 4/3 。
但是 x 的等间隔有相同50%的概率成问题;x 的 5/3 对应于 y 是 3/5 。
1/3--1/2--3/5---5/3---3
Prob ( y => a ) = 3/8 * (3 - a)
P = Prob ( x = 1/2 ) = 15/16
很明显,两个 P 有不同的值。
“均匀分布”意味累积分布是线性的,但 y = 1/x 不能同时是线性,因此 x, y 不
能同时是均匀分布。
6)最大似然估计法与太阳是否明天升起?
最大似然估计法就是根据试验结果估计参数最大可能值。
袋中有白球和黑球(不知数量),从中取出 80 个球,发现 白球出现 49 次,W = 49;
而黑球出现 31 次,B = 31。最大似然估计为
L(p | W = 49, B = 31 ) = P(W = 49, B = 31| p) = combination(80, 49) * p^49
* (1-p)^31
将上式对 p 求导,令求导式等于 0,得到
p^48 * (1-p)^30 * (49(1-p) -31p)) = 0
p 的最大似然估计为 49/80
对伯努利试验,成功次数为 k ,试验总数为 n ,p 的最大似然估计 p'
p' = k/n (a)
拉普拉斯提出另一种最大似然估计法,考虑到下一次期望概率就是以前 p 的期望值。
P (Xn+1 = 1 | X1 =x1, X2 = x2, ..., Xn = xn) = E( f(p| X1 =x1, X2 = x2, ..., Xn = xn))
= (k+1)/(n+2) (b)
k = x1+ x2+ ... + xn ,
因此上述取球试验,根据 (b),p 的最大似然估计为 50/82 。
拉普拉斯提出了太阳明天升起问题。他认为在过去的 5000 年(5000 * 365.25 天),
太阳每天升起。根据 (b),太阳明天升起的概率大约为 1826200 比 1 。
在我以前写的博文“你的判断正确吗?”曾提到“基础概率缪误"。
这里补充一个与此有关的
7) 法庭取证问题
一起凶杀案,现场证据不多,但死者挣扎时疑似抓到了来自凶手身上的皮肤,实验
室鉴定结果发现被抓到的嫌疑犯与之相符,于是嫌疑犯被起诉。检察官说,这种检
验准确率为 99.9% 因此嫌疑犯有罪的概率是999/1000。
正确的计算方法要使用贝氏定理。
P(I|E)=P(E|I) * P(I)/P(E)
P(E) = P(E|I) * P(I) + P(E|~ I) * (1 - P(I))
P(E|I) :当嫌疑犯是无辜的 严重的证据被发现的概率
P(I|E) :尽管有证据嫌疑犯是无辜的概率
P(I) :嫌疑犯是无辜的先验概率
P(E):证据被发现的先验概率
P(E|~ I) :证据证实嫌疑犯有罪的概率
嫌疑犯有罪的先验概率若为P(I),则嫌疑犯确实有罪的概率为(0.999*P)/(0.999*P+0.001*
(1-P)),而P(I)值是变的。这是“引用类问题”,即不同的人可能提供不同的P(I)。
假定对嫌疑犯不利的 P(I)为1/1,000,000,代入上式可知嫌疑犯确实有罪的概率低
于1/1000。