江湖呓语——理解新冠病毒的测试结果(Sensitivity, Specificity, and Testing)

本博客文章除非注明转贴(ZT)之外的,版权均为作者所有。若要转载,请通知博主。
打印 被阅读次数

上周五,川普总统也染上了新冠。除去政治的考量和争斗,让我们从数学上来看看化验的准确性和重复化验的重要性。

病毒化验与灵敏度、确定性两个指标及人群中感染病毒的比例有关。对新冠而言用简单的重复测试是最佳确诊方法。

一. 病毒化验的精确性

医学上对病毒的化验都很相似,其结果就是病人是否带病毒。最近,俄亥俄州长麦克·德文(Mike DeWine)的新冠病毒化验就是一个很简单,但很有意思的例子。化验就是要回答被测者是否带病毒这个简单问题。德文州长第一次化验结果是阳性,第二次是阴性,第三次也是阴性。从这些结果来看,化验肯定存在问题。

怎样确定化验的精确性?有两个常用的指标:灵敏度和确定性。灵敏度说的是带病毒的可能性;确定性是不带病毒的可能性。下面是严格的定义:

灵敏度:病毒携带者人群中化验结果为阳性的百分比。灵敏度高的含义是被测人群中病毒携带者很多。这是最重要的化验指标。比如,西班牙的健康部门把一个公司的化验结果全部打了回去,因为其化验灵敏度仅为30%,也就是说70%的病毒携带者漏网了。

确定性:非病毒携带者人群中化验结果为阴性的百分比。确定性高的含义被测人群中病毒携带者很少。

目前的化验中,高灵敏度很重要,因为假阴性是人群中重要的传染源。确定性就没那么重要了,因为假阳性没有传染性,当然了化验结果对当事人来说也很不幸。

灵敏度和确定性是两个独立变量,而且互补。新冠的化验有两种,一是化验是否感染了病毒,一是化验是否携带病毒抗体。病毒抗体阳性不能说明是否当前正感染病毒,但能说明被化验者曾经感染过病毒。

目前的病毒化验中,有两种不同的方法。一是PCR化验,它直接化验人体中新冠病毒的基因片段;另一方法是化验病毒的蛋白组分,即间接化验人体对病毒的免疫反应产生的蛋白组分。前一化验比后一化验精确,后一化验很快,只需几分钟而不是几天。两种化验都不能保证结果的百分之百精确。

德文州长第一次化验,用的是蛋白组分法,后两次是PCR。三次化验的采样方式同样。蛋白组分法的灵敏度是80%,后来该方法的灵敏度提高到了97%,与PCR化验几乎一相同。PCR化验的灵敏度从一开始就声称为100%了。

. 化验结果的分析

灵敏度和确定性的有何意义?德文州长的化验结果阳性,他感染病毒概率是多少呢?

假定对1000个美国人进行随机化验,其阳性并感染病毒的概率是整体人群感染水平的函数,我们只能对整体人群感染水平进行合理假设。和很多其他事情一样,我们不知道新冠的整体人群感染水平。这一整体人群感染水平可能从1%到15%。我们的计算基于不同的整体人群感染水平。

  1. 德文州长的情况是,灵敏度97%,确定性100%,整体人群感染水平为5%。
    • 在1000个人的样本中,有50人感染病毒。
    • 染病人群的化验结果为50×%97 = 48人阳性,有2人假阴性。
    • 未染病人群的化验结果为1000×(100%-5%)× 100% = 950人。结论是,用前述的灵敏度和确定性来估算,1000人中,48人阳性,952人阴性。

上述计算结果是未感染病毒的人群中100%阴性,0%阳性,后来被证明为未感染病毒的德文州长第一次化验结果为阳性,这又怎么解释呢?原来灵敏度和确定性都是理论上的定义,只在理想情况下适用。灵敏度和确定性在文献中经常被称为临床数据,也就是在可控环境下的实验数据,这样的数据在真实世界中并不可能100%准确。采样的误差最大。但是,人们还是很难想象对一个完全没有症状又未感染病毒的人进行化验的结果会是阳性。这就是墨菲定律(Murphy’s Law)起作用的时候了,误差总会降低化验的可信度。

  1. 假定灵敏度和确定性为90%和95%,整体人群感染水平5%,再来算一遍:
    • 以灵敏度90%来计算,化验结果为:1000×5%×90% = 45人阳性,即化验结果为45人感染病毒,5人为假阴性。
    • 以确定性为95%来计算,化验结果为:1000×(100%-5%)× 95% = 902人为阴性,即化验结果为902人未感染病毒,48人为假阳性。
    • 最终结论是,1000个被化验人群中有45 + 48 = 93人为阳性。
    • 这1000人的化验中,45人是真阳性,48人假阳性,其化验阳性的感染病毒概率为45/93 = 49%。
  1. 假定灵敏度和确定性为90%和95%,整体人群感染水平1%,再算一遍:
    • 以灵敏度90%来计算,化验结果为:1000×1%×90% = 9人阳性,即化验结果为9人感染病毒,1人为假阴性。
    • 以确定性为95%来计算,化验结果为:1000×(100%-1%)× 95% = 941人为阴性,即化验结果为941人未感染病毒,49人为假阳性。
    • 最终结论是,1000个被化验人群中有9 + 49 = 58人为阳性。
    • 这1000人的化验中,9人是真阳性,49人假阳性,其化验阳性的感染病毒概率为9/58 = 15%。
  1. 假定灵敏度和确定性为90%和95%,整体人群感染水平20%,再算一遍:
    • 以灵敏度90%来计算,化验结果为:1000×20%×90% = 180人阳性,即化验结果为180人感染病毒,20人为假阴性。
    • 以确定性为95%来计算,化验结果为:1000×(100%-20%)× 95% = 760人为阴性,即化验结果为760人未感染病毒,40人为假阳性。
    • 最终结论是,1000个被化验人群中有40 + 180 = 220人为阳性。
    • 这1000人的化验中,180人是真阳性,40人假阳性,其化验的感染病毒概率为180/220 = 82%。
  1. 来看一个一般情况:假定灵敏度和确定性为a(0
  2. aP:化验后的阳性人数。
  3. (1-a)P:化验后的假阴性人数。
  4. N–P:未感染病毒人数。
  5. b(N-P):化验后的阴性人数。
  6. (1–b)(N-P):化验后的假阳性人数。
  7. 化验后总的阳性人数为:aP + (1–b)(N-P),其中部分是真阳性。于是,化验阳性的感染病毒概率为

?

  • 整体人群的感染病毒水平为p = P/N,q = (N-P)/N为人群中未感染病毒的百分比,于是,上述公式可以改写为:

这个公式的好处是,在给定的灵敏度和确定性下能画出化验者感染病毒概率与整体人群感染水平关系的曲线:

好的病毒检测就是化验结果接近真实情况,也就是化验阳性的感染病毒概率接近于1。上图说明了在整体人群感染水平很低的情况下,化验结果不好。

人群中化验后假阴性的概率为:

画成曲线如下:

好的病毒检测是假阴性越少越好。上面两条曲线说明了灵敏度和确定性的互补关系。

. 重复化验

就像德文州长那样,重复化验的情况又如何呢?

和上面的假设一样:假定灵敏度和确定性为a和b,整体人群感染水平为p,未感染水平为q = 1-p。

化验将人群分为两组:化验阳性与化验阴性。化验并不是完全准确的,于是每组又可以细分为{感染:未感染}。化验阳性组的细分为{ap:(1-b)q},相应的化验阴性的细分为{(1-a)p:bq}。

第一次化验将整体人群分为两组,每组又可细分为感染与未感染两组,于是,第一化验为阳性组的新的p和q值为:

相应的第一化验为阴性组的新的p和q值为:

现在再来看看德文州长的化验情况,第一次化验的灵敏度和确定性为a = 0.90 和b = 0.95,人群感染率为p = 0.05。德文州长在化验阳性的人群中的病毒感染概率为0.49,非常不准。再对德文州长进行一次化验会怎样呢?假定这次化验的灵敏度和确定性为a = 0.80 和b = 0.99,新的结果为0.16,还是不好。在化验一次呢,这一结果为0.037;再来一次,这一结果就成了0.008。这就很好了看来德文州长的确没有感染上病毒。

. 估算感染人数

化验可以把整体人群分为两类,感染病毒的和未感染的。化验的另一个用处是知道人群中感染病毒的百分比。这很重要,因为有很多人感染力新冠病毒但没有症状,这只能通过化验才知道。

在上面的例子中,N = 1000, a = 0.90, b = 0.95,加假设P = 150人感染病毒。第一次化验结果阳性177人,第二次的阳性为123人,第三次的阳性为109人。这些数据有什么用呢?化验阳性的人中,有真阳性和假阳性,但是很明显真阳性的人数随着重复化验的进行而递减,递减率为a。第一次化验后,其比例为a=0.9;第二次化验后,这一比例为0.9×0.9=0.81;第三次为0.9×0.9×0.9=0.729。对最初人群中的真实阳性人数的估值为化验后阳性人数除以这一比例。

P为人群中的感染病毒人数,N+为化验阳性的人数,上面的公式说明当多次化验后,其结果N+/r趋近于人群中的感染病毒人数。把上述结果列为下表:

很明显,三次化验后,对整体人群中的感染者估值就已经是100%了。

. 资讯来源

个人以为YouTube上的MEDCram是最好的资讯来源,这是链接.其中的59期讲了一线医生的防护,99期讲了重复测试的重要性。

博主已关闭评论