形式逻辑对于贝氏定理的解释以及意义上的启发
现状
国内对贝氏定理,作了各种各样的讲解。给人启发。
但是,贝氏定理公式涉及形式逻辑推理的分析,以贝氏定理解决问题的方式,多是以记忆公式来解决问题,道理并不简单明了。在相关的教学中,我还没有发现有简单明了的解释。
本文试着从形式逻辑角度给予解释,以解决人们在理解和应用贝氏定理公式方面的困扰。
本文的结构是,先以例子说明它在现实方面的应用。引出其数学公式所表达的,看起来与现实意义方面的不合理之处。再以形式逻辑解释之。
例:新冠患者检测
下面展示贝叶斯定理在新冠病毒检测时的应用。
假设某个试剂的检测结果的灵敏度和差异度均为99%,即新冠患者每次检测呈阳性(+)的概率为99%。而非新冠患者每次检测呈阴性(-)的概率为99%。
已知0.5%的雇员感染新冠病毒。
请问每位检测结果呈阳性的雇员染病的概率有多高?
解:
符号记作,检测结果呈阳性,为+;染病毒为D。所求的结果写作:P(D|+)。它是每位检测结果呈阳性的雇员染病毒的概率表达。
已知的值:
从已知0.5%的雇员染病毒知,不设任何条件,某公司新冠患者的概率P(D)=0.005。0.5%是怎么已知的?合理的推测是,根据以前的,或者,其它公司的数据,所做的猜想。注意,它不来自公司本身,因为,如果这数据来自公司本身,题目的问题没有了意义。因此,这种“已知”的信息,也叫做先验信息。
在染病毒条件下,被检测呈阳性的概率P(+|D)=0.99
请注意区别,P(+|D)与P(D|+)的形式不同,含义也不同。
以上,
“不论条件”,皆呈阳性的概率P(+)=0.005*0.99+0.995*0.01=0.015。白话来说,即该公司有多少比例的雇员,其检测结果为阳性。
根据贝叶斯定理:
1.P(+)P(D|+)=P(D)P(+|D)
2.P(D|+)=P(D)P(+|D)/P(+)=0.005*0.99/0.015 =0.332
这里贝叶斯定理公式1.所表达的意义为:无论条件,被测为阳性的概率,“并且(以及)”,在被测为阳性的条件下,染病毒的概率,等于,无论条件,染病毒的概率,“并且(以及)”,在染病毒条件下,被测为阳性的概率。
这里贝叶斯定理公式2.从各式的数值可得它的答案0.332。答案的意义可描述为,在被测为阳性的条件下,染病毒的概率是0.332。
结果说明什么?你猜想过吗?
从试剂的检测结果(99%)来看,是比较准确的,但是贝叶斯定理却可以揭示一个潜在的问题,在被测为阳性的条件下,“真正”染病毒的概率,并没有我想象的那样高,与我从直觉得出的结论相差太大。你想象过吗?
进一步分析这个例子,有一种看法就是证据的有效性。
P(+|D)=0.99,作为染病毒的证据的准确性(或称之为,准确的可能性)很高了。即使很高,仍然还要取决于“真正”新冠患者的群体的大小,即P(D)=0.005。如果很小,证据的有效性(注意,不是“准确性”)会被大打折扣,即结果P(D|+)的影响并不著显,反而显得证据是无能为力(仅为0.332)。这一事实表明,证据的“准确性”是证据本身的特征;而证据“有效性”,则描述了某种关系的性质,也就是,它描述证据与结论之间的关系特性。这两个形容词应用的场景不一样。这种“不一样”的区分,具有哲学意义,即“准确性”描述“事物”是什么?而“有效性”描述“事实之间”的关系。比如,任何事实之间有因必有果的理性(reason)关系。
贝叶斯定理又可以这样看,P(D|+)=P(D)*P(+|D)/P(+),从形式上变成:P(D|+)=P(+|D)*(P(D)/P(+)),其中P(D)/P(+)可看作P(+|D)的参数。
这样,我们可以看到,P(D|+)与P(+|D)的关系。有必要强调一下,P(+|D)表达的是这试剂(证据)的准确性。它给我们新的启发,就是P(+|D)对于P(D|+)来说,基于参数P(D)/P(+),具有似然性。又称为标准相似度(standardized likelihood)。就是,在多大程度上,P(D|+)接近于P(+|D)。
显而易见,这取决于参数P(D)/P(+)的大小,极端情况是,若参数=1,二者一样,也可以说,完全相似。而分析P(D)/P(+)易知,其中,P(D)是先验概率,这取决于这个公司的群体是否具有典型性,比如,与社会群体染病的一致性,偏差大,还是小。而其中的P(+)=0.005*0.99+0.995*0.01又受到P(D)的影响。重新展现这个参数,是这样的:
P(D)/P(+)=0.005/(0.005*0.99+0.995*0.01)
你可以通过对其中P(D)做从小到大的测试。容易知道,P(D)向1,P(D|+)与P(+|D)二者更加具有似然性。
我理解的意思是,要找到那个先验可能性比较大的群体,这时,证据的“准确性”才接近“有效性”。
这给我们的启示是什么呢?通常人们以证据的高准确性直接作有效性推理,这也许符合“直觉”,然而,这种“直觉”并不常常正确。
这可以解释社会上许多现象,比如,“成功学”大多无效。你可以解释一些社会现象吗?
比如,勤奋对于成功者来说,有人说,可以看到大多数成功者都很勤奋。于是,得出结论,只要勤奋为条件,那么,就有可能成功。但是,这个结论忽略了,成功人士的群体太小了,比如,马云及其成功的事实,是社会上,极少数人及其成功的事件。因此,勤奋对于想获得马云这样成功的人来说,证据的有效性就很差。
类似的模型很多。又如,高中生普遍拟通过做对高考模拟题,期望获得好成绩。然而,容易测算,每年高考题与模拟题的一致性极低,即使我们所模仿的都对,也就是“证据”的准确性极高,期望也不容易实现。结论是,以大量的模拟题训练,并不是有效的路径。这与直觉不一致。
顺便说,如果我们从成功人士的做法上,受到启发;从高考题目的解答中,受到启发,是另一回事。这跟单纯地模仿不同。他们的任何成功的思想、行为方式的典型特征与我们所处的时空场景很难具有一致性,同时,对于我们想要的成功,也不具有效性。可怜。
进一步分析,
P(+)P(D|+)=P(D)P(+|D)=P(+^D)
意思是,检测为阳的概率,并且,在被检为阳性的条件下,确是染病毒的概率等于
染病毒的概率,并且,在染病毒条件下,被检出阳性的概率
二者都等于:被检为阳和染病毒同时发生的概率
叶斯定理的公式所要表达的事实意义是明确的。
我有问题是,
P(D|+)=P(+^D)?意思是,在被检为阳性的条件下,确是染病毒的概率。为什么不等于“被检为阳和染病毒同时发生的概率”?
或者,为什么不可以P(D|+)=P(D)P(+|D)?
从直觉,总觉得,没有不可以。
从形式逻辑上,很容易推理出,不可以。
因为,分析如下:
1被检为阳 染病毒
2被检为阳 不染病毒
3被检为非阳 不染病毒
4被检为非阳 染病毒
有四种关系。举不出更多。
分析P(D|+),陈述为:“在被检为阳性的条件下,确是染病毒的概率。” 这个陈述句为一个条件句。
从形式推理的原则,只要“染病毒”为真,无论条件如何,这个推论即为真。
对比以上四种关系,应该很容易指出是上述哪个关系,即1,4,对吗?
当+^D时,即当“被检测为阳”跟“染病毒”,作乘积,求概率P(+^D)时,这意味着,被检测为阳,在这个陈述中,确保是真的。由此,在推理上,即明确了(被检为阳性的)条件为真。在此真的前提条件下,染病毒为真。这个推论才为真。对比,P(D|+)的含义及推理,显然,P(D|+)陈述所得出结论的条件,要比 P(+^D)得出结论的条件,宽泛得多。
再重述一遍:P(D|+),只要“染病毒”为真,无论条件如何,这个推论即为真。
而P(+^D),则染病毒为真,则明确要求了(被检为阳性的)条件为真,这个陈述为真。
简言之,P(D|+)与P(+^D)二者陈述所得出的结论相同,而“条件”不同。因此,不是同一陈述。不可代换。
也就是说,P(D|+)=P(+^D)不成立,当然,P(D|+)=P(D)P(+|D)也不成立。
我觉得,先有形式逻辑的思想基础,才有条件概率公式的发展。任何抛开形式逻辑的思想,单纯作公式推导,是不理解条件概率本质的记忆游戏。