cfc好多的高知, 出道题测试一下

我是这么看的。同一个人先后两次检查,均为阳性。这两件事情是相关的。也就是说, 第二次检查不是独立事件。 逻辑上

第一次检查,前提是5%得了新冠病毒, 所有得到阳性结果的人都是55%的概率真阳性。

第二次检查,前提就变了, 新的人群,不再是我太花群众,而是第一次阳性结果的人群,这个人群,55%的人得了新冠。

1.如果一个人被感染了,有94%的概率测试结果为阳性(证明他有病毒)
2.如果一个人没被感染,有96%的概率测试结果为阴性(证明他没有病毒)

大牛们根据新的前提,再算一遍,会得出两次都是阳性的,患病概率

PPV = P(infected | test positive) = sensitivity * prevalence / ( sensitivity * prevalence + (1-specificity) * (1-prevalence))
= 0.94*0.55/(0.94*0.55+0.04*0.45) = 96.64%

当然了前提是,这个两次都是正确操作的结果。

概率论中的概念比较绕人,用起来往往令人困惑,但也很有趣。概率论中对随机事件之间的独立性有明确的定义。通俗地说,如果各个事件发生的概率互不影响,那么称这些事件之间为独立的,反之则为非独立的。举个例子来说,一副扑克有 54 张牌。随机抽取一张,抽到任何一张牌的概率是 1/54。如果把抽到的牌放回去并混合均匀后再随机抽取一次,那么第二次抽到任何一张牌的概率仍然是 1/54。显然第二次抽取的结果不受第一次抽取结果的影响。在概率理论中,称这两次抽取的过程和结果是独立的,无论两次是否抽到相同的牌。抽到两张相同的牌的概率是 (1/54) x (1/54)= 1/2916。

与此相反,如果第一次抽到的牌不放回去,那么第二次抽到哪张牌的结果就与第一次抽到哪张牌有关系。譬如,如果第一次抽到♦A,那么第二次也抽到♦A 的概率是0;如果第一次抽到♦K,那么第二次也抽到♦K 的概率是0;而抽到任何其它一张牌的概率为 1/53。显然,抽到两张相同牌的概率为零,抽到某两张不同牌的概率为 (1/54) x (1/53)= 1/2862。在概率理论中,称这样两次抽取的过程和结果为非独立的。

回到我们讨论的问题,假设第二次检测的结果不受第一次检测结果的影响,那么两次检测的结果是独立的。在这种情况下,真阳性的人两次都被检测为阳性的概率是 0.94 x 0.94 = 0.8836,而健康的人两次都被检测为阳性的概率是 0.04 x 0.04 = 0.0016。现在仍然用原来的计算方法, 但分别用 0.8836 和 0.0016 代替 0.94 和 0.04,可以算出 “在两次检测结果都为阳性的条件下受试者是真阳性的概率” 为 0.05*0.8836/(0.05*0.8836 + 0.95*0.0016) = 96.67%。

这个结果和贵圈的结果是一样的,虽然思路不相同。不难证明,这两种计算方法其实是一回事,都假设了两次检测的结果是独立的。
 
最后编辑:
PPV、NPV 和 sensitivity、specificity 的转换公式是基于条件概率推导出来的,其实就是 Bayes' Theorem 具体到 PPV as a function of prevalence & sensitivity, specificity 的表述,如果知道怎么推导就不必强记。

不论学什么专业的,只要能够充分理解什么是 条件概率 就可以正确回答问题,如果了解一点 epidemiology 或者 biostatistics 中 diagnostic accuracy 的背景就比较占便宜 (虽然学这两个专业的人或许更熟悉的是 comparative effectiveness / safety of treatments,或者 prognosis / prediction,每个地方的课程和研究侧重不一样)。的确也有人凭直觉算对了 (直觉和条件概率暗合)。

我又不是出题者,我只能猜测他出题的动机是在说,“即便 sensitivity, specificity 很高,只要 prevalence 偏低,PPV 仍然可能不太高 (违反直觉)”。我回答完题目,顺便告诉看帖的人,在有多次检测的情况下,这个说法并不一定对。

从条件概率的定义出发,把我缩略没有全写出来的内容推一遍,就能回答 #8.
PPV = P(infected | test positive) = (# infected AND tested positive)/(# tested positive) = TP/(TP+FP)
= ( P(test positive | infected) * prevalence * Total )/ ( P(test positive | infected) * prevalence * Total + P(test positive | not infected)*(1-prevalence)*Total )
用 1-specificity 取代 P(test positive | not infected),分子分母同时去掉 Total
= sensitivity * prevalence / ( sensitivity * prevalence + (1-specificity) * (1-prevalence))
太佩服了。从小数学就不好。别说让我算,看这些公式都晕。
 
活蹦乱跳的就三种可能。没感染,有抗体,无症状感染者。
 
太佩服了。从小数学就不好。别说让我算,看这些公式都晕。
没那么玄乎,真的算起来,就是点儿加减乘除,用不着多深的数学。
 
后退
顶部
首页 论坛
消息
我的