也谈'意想不到的老虎'(续)

用调侃去书写思考,以故事来叙述理论。
打印 被阅读次数

       榕城老应

贴出《也谈“意想不到的老虎”》后,有人说:“如果这个老虎是‘意想不到的’,那么无论麦克说什么,国王都可以说他不对。因为能被你猜着了,就不是意想不到的。”

如果那样,国王是不讲理了。这首先必须弄清“意想不到”这个比较含糊话的含义,故事中国王的这句话其实只是提个醒,有“谅你也想不到”的意思。并不是用它来判决麦克的答案。实际上,答案的对错是由预先关在房间里老虎的事实来验证的。

所谓的悖论,指推理的结论与常识相矛盾,却不能发现逻辑上的漏洞。破解悖论不是说明结果是多荒谬,而是要沿着推理的思路指出错在什么地方。悖论的价值在于促进人们思考。

这个悖论在这几十年中外学术期刊上都有些论文来分析。在逻辑学,认知科学,哲学和博弈论上都有些讨论。在英文上多数以“Surprise Examination” 或 “Unexpected Hanging Paradox”为题。

为了消除故事其他情节带来的误解,我将“Surprise Examination”的故事介绍如下,它们内涵是完全一样的。

老师向学生宣布下星期一到五的某一天,有一个意想不到的考试。学生想:如果考试在星期五,那从一到四都没有考试。到了星期五,这个考试就不是意想不到的。所以不可能在星期五。星期五被排除了,剩下四天。按照同样的逻辑推理,星期四,三,二和一也都不可能,所以认为没有考试。结果考试在星期三举行,这是学生意想不到的。


上一个帖子说到,这句“意想不到的”提醒纯属忽悠,它和老虎在这五间之中命题不相容。麦克自作聪明用它作为依据来推理,结果是你要推出什么结论都可以,不过是蒙人蒙己。世上的大道理系统也包含许多不相容的命题。所以麦克要讲出“婚姻自主,民主人权”的大道理,国王也可以用“女儿幸福,家长把关”的大道理顶回去。这些都是从大道理集合中合乎逻辑中推理来的,只要公主还爱麦克,又不想和老爸闹翻,谁都不亏理。大道理碰到明白人都是说不出结果来的,要不世界上怎么不缺战争呢?

国王和麦克都是明白人,不玩嘴皮子了,还是实力对撼来得真确。文明一些,就赌个输赢。这个故事的议题就从逻辑的问题转为博弈的问题了。

要最不费什么心思的赌赛就是:国王随便将老虎关一个房间。麦克猜一次,有20%机会中奖,纯粹碰运气,没有谁蒙谁的问题,就是没有什么技术含量,对麦克也不公平。要是国王还想考究麦克的智商,那就要有个比赛规则。麦克可以猜多次,直到见着老虎。要猜着见了老虎,10分;没猜着见了老虎,负10分;没老虎说有,扣些分,比如说M分,接着猜。最后看积分正负定输赢。我们来看看这个博弈该怎么玩,扣分M该多少才公平。

国王没什么花招可用,必须预先将老虎放入一个房间,策略分别记为1,2,3,4,5,对应着把老虎放在那个房间。麦克当然可以从头到尾每个房间都说有老虎,但是老虎要是在比较后的房间,猜不中扣分很多,显得傻,未必是最好的策略。如果前面房间都没有,后面有的概率就较大了,所以没有前面说有,没猜中,后面的房间又猜没有的道理。因此麦克比较现实的策略是:1从头开始都说有,直到猜中为止;2从第二间开始猜有,直到猜中为止;如此3,4,5类推。比如说国王的策略为4,麦克的策略为3,意味着国王把老虎放在第四个房间,麦克在第一,二房间都说没有,从第三个房间开始说有老虎,丢了M分,第四个房间蒙着了得10。这个对局麦克的得分就是10-M,把这个数值放在博弈支付矩阵的第三行第四列中。这是一个零和的博弈,国王的得分是麦克的负值。我们可以写出麦克博弈支付矩阵如下。

      1     2         3         4           5
1   10  10-M  10-2M 10-3M  10-4M
2  -10  10       10-M  10-2M  10-3M
3  -10 -10       10       10-M   10-2M
4  -10 -10       -10     10        10-M
5  -10 -10       -10     -10       10

从这个矩阵可以看出,除非麦克蒙错了不受罚(M=0),不存在着优势策略。也就是说在这个问题上别指望国王和麦克有什么策略一定比别的高明。

公主说:“国王和麦克如果随机选策略,他们的数学期望是这个博弈的平均分,它是矩阵里所有分量都加起来除25。M=2.5 时这个平均分为零,这个最公平。”

国王如果同意这个数,就被公主忽悠了。因为麦克这时可以选第一个策略,就是每个房间前都说有老虎,无论老虎在哪个房间,都不会是负值,这就稳操胜卷了。

国王说:“我明白了,这第一个策略优势太大,必须加大扣分惩罚力度才行。M=5时,这个策略的平均分是零,才合理。”

麦克说:“要那样,我所有策略没有一个是正的均值,这能合理吗?真正合理的M值,必须使得你和我全部采用最好的策略时得分是零。”

对于这个博弈,我们知道,双方都没有优势策略和纯策略的纳什均衡,只有一个混和策略的纳什均衡。这时候M=3.78,国王的最优策略是以16%,13%,11%,10%,50%的概率把老虎方进房间序号1,2,3,4,5。麦克是以50%,10%,11%,13%,16%的概率选取他的策略1,2,3,4,5。这时候的得分的数学期望为零。

这是按照博弈理论计算出来的公平记分规则和双方最为明智的策略。

国王和麦克不论是采用什么概率分布的混合策略,在实现时必定还是取了一个具体的策略。按照概率取定这个策略的过程意味着放弃逻辑的判断而将命运交付给卜爻的决定,这难道就是以科学理论论证出来的最为理性的回答?

登录后才可评论.