cfc好多的高知, 出道题测试一下

用下面的数来验正你的计算方法。

我太花村人口有5%得了新冠病毒
1.如果一个人被感染了,有100%的概率测试结果为阳性(证明他有病毒)
2.如果一个人没被感染,有100%的概率测试结果为阴性(证明他没有病毒)


如果一个人被测试之后得到阳性结果,他被感染的概率是多少?
 
用下面的数来验正你的计算方法。

我太花村人口有5%得了新冠病毒
1.如果一个人被感染了,有100%的概率测试结果为阳性(证明他有病毒)
2.如果一个人没被感染,有100%的概率测试结果为阴性(证明他没有病毒)


如果一个人被测试之后得到阳性结果,他被感染的概率是多少?
你的假设不成立。当100%时,就变为不相关的两个随机事件(P(B)或p(A)=0),不符合Bayes定理的条件。
 
那这么算:
患者阳性概率: 94%*5%
非患者阳性概率 :4%*95%
患者占阳性比例:(94%*5%)/(94%*5%+4%*95%)=0.55

用不同比例演算也一致。

LOL
 
一项测试的准确率和感染人数的百分比相关,用屁股想都不make sense。
 
如果检测一次的结果是阴性,那么有很高的概率被测人的确是阴性。但是如果检测一次的结果是阳性,则很难断定被测人是否真是阳性。不过只要再测一次,如果连着两次检测结果都是阳性,那么被测人确实是阳性的概率就很高了。
 
你的假设不成立。当100%时,就变为不相关的两个随机事件(P(B)或p(A)=0),不符合Bayes定理的条件。
如果一个算法在测试准确率达到100%时失效,那是问题错了还是解法不适合?
 
CFC最高的高知,不就是圈哥你嘛!
 
CFC最高的高知,不就是圈哥你嘛!
开啥玩笑。
圈儿看得都是不需要专业知识都能看明白的。
像这种概率分析。我没有这专业的能力。
 
如果一个算法在测试准确率达到100%时失效,那是问题错了还是解法不适合?
你的问题并没有问题,照样可以用上面几位高手给出的方法计算,得出的结果是检测为阳性的 100% 是阳性。也可从另一个角度分析,既然 “没被感染者” 100% 测试结果都为阴性,即没有一个“没被感染者” 被错测为阳性,那么测试结果为阳性的一定全部都真的是阳性。
 
prevalence = (TP+FN)/Total = 0.05, Total = TP+FN+TN+FP
sensitivity = P( test positive | infected) = TP/(TP+FN) = 0.94
specificity = P( test negative | not infected) = TN/(TN+FP) = 0.96
By Bayes' Theorem,
PPV = P(infected | test positive) = sensitivity * prevalence / ( sensitivity * prevalence + (1-specificity) * (1-prevalence))
= 0.94*0.05/(0.94*0.05+0.04*0.95) = 0.553

Caveat: Residents with suspected mild symptoms who requested for nucleic acid testing at any Community Testing Centers were tested at least twice. Hospitalized patients received much more nucleic acid testing + serological testing + examination of clinical & radiologic signs. The sensitivity for multiple tests combined (at least one positive) is higher than sensitivity of a single nucleic acid test, and the PPV of multiple tests combined is higher than PPV of a single test.

test positive​
test negative​
disease positive​
true positive (TP)​
false negative (FN)​
sensitivity = TP/(TP+FN)​
disease negative​
false positive (FP)​
true negative (TN)​
1-specificity = FP/(FP+TN)​
PPV=TP/(TP+FP)​
你的结论与第二条矛盾。
 
其实没什么好争论的,楼主说的概率英文叫PPV(positive prediction value),用于医学,流行病学统计。。。

和仪器检测准确率没什么关系,搞设备工程仪器的就没必要较真了。

有兴趣可以自己Google,百度一下。
 
Caveat 是一个警示而不是结论。我的意思是,在多次检测的情况下,题目里设定的情景所要说明的 “PPV 并不是那么高” 这个结论可能并不成立。把多次检测的情况简化为社区检测中心的两次核酸检测 (实际上入院的检测包括了至少两次 nucleic acid testing + serological testing + examination of clinical & radiologic signs),sensitivity = P( at least one test positive | infected) 会比 sensitivity of a single test 高,如果简单地假定 specificity 不变的话,不难得出多次检测的 PPV=P(infected | at least one test positive) 比题目里计算出的 PPV of a single test 要高。但是 sensitivity 里并集 at least one test positive 对应的是 specificity 里的交集 both tests negative,specificity = P( both tests negative | not infected),因此并不能简单假定 specificity 不变;specificity = P( both tests negative | not infected) 实际上 <= specificity of a single test,依据我给出的 PPV 公式,PPV=P(infected | at least one test positive) > PPV of a single test 需要特定条件才成立。不止核酸检测,临床表征、影像学检查也应该算作是 test,基于各种不同的诊断学检测和临床表征的 PPV 是可以做到比较高的。

In epidemiology, assuming there is no spectrum bias, sensitivity and specificity are independent of prevalence. PPV is a function of prevalence, sensitivity and specificity. PPV = P(infected | test positive) = sensitivity * prevalence / ( sensitivity * prevalence + (1-specificity) * (1-prevalence)).
以上的概率记号里竖线均表示条件概率。如果学习工作里从未接触条件概率,也不是 medicine, public health, epidemiology, biostatistics 专业的,就请不必过于劳心钻研了。

你的结论与第二条矛盾。

prevalence = (TP+FN)/Total = 0.05, Total = TP+FN+TN+FP
sensitivity = P( test positive | infected) = TP/(TP+FN) = 0.94
specificity = P( test negative | not infected) = TN/(TN+FP) = 0.96
By Bayes' Theorem,
PPV = P(infected | test positive) = sensitivity * prevalence / ( sensitivity * prevalence + (1-specificity) * (1-prevalence))
= 0.94*0.05/(0.94*0.05+0.04*0.95) = 0.553

Caveat: Residents with suspected mild symptoms who requested for nucleic acid testing at any Community Testing Centers were tested at least twice. Hospitalized patients received much more nucleic acid testing + serological testing + examination of clinical & radiologic signs. The sensitivity for multiple tests combined (at least one positive) is higher than sensitivity of a single nucleic acid test, and the PPV of multiple tests combined is higher than PPV of a single test.

test positivetest negative
disease positivetrue positive (TP)false negative (FN)sensitivity = TP/(TP+FN)
disease negativefalse positive (FP)true negative (TN)1-specificity = FP/(FP+TN)
PPV=TP/(TP+FP)
 
最后编辑:
按照楼主假设的数据,如果检测两次,结果都是阳性,那么被测者确实是阳性的概率是多少?如果两次结果为阴阳各一次,那么被测者确实是阳性的概率又是多少?
 
Caveat 是一个警示而不是结论。我的意思是,在多次检测的情况下,题目里设定的情景所要说明的 “PPV 并不是那么高” 这个结论可能并不成立。把多次检测的情况简化为社区检测中心的两次核酸检测 (实际上入院的检测包括了至少两次 nucleic acid testing + serological testing + examination of clinical & radiologic signs),sensitivity = P( at least one test positive | infected) 会比 sensitivity of a single test 高,如果简单地假定 specificity 不变的话,不难得出多次检测的 PPV=P(infected | at least one test positive) 比题目里计算出的 PPV of a single test 要高。但是 sensitivity 里并集 at least one test positive 对应的是 specificity 里的交集 both tests negative,specificity = P( both tests negative | not infected),因此并不能简单假定 specificity 不变;specificity = P( both tests negative | not infected) 实际上 <= specificity of a single test,因此依据我给出的 PPV 公式,PPV=P(infected | at least one test positive) is higher than PPV of a single test 仍然是成立的。不止核酸检测,临床表征、影像学检查也应该算作是 test,基于各种不同的诊断学检测和临床表征的 PPV 是可以做到比较高的。

In epidemiology, assuming there is no spectrum bias, sensitivity and specificity are independent of prevalence. PPV is a function of prevalence, sensitivity and specificity. PPV = P(infected | test positive) = sensitivity * prevalence / ( sensitivity * prevalence + (1-specificity) * (1-prevalence)).
以上的概率记号里竖线均表示条件概率。如果学习工作里从未接触条件概率,也不是 medicine, public health, epidemiology, biostatistics 专业的,就请不必过于劳心钻研了。
1, 既然是题目,就应该有确定的答案,不能模棱两块可,似是而非。
2, 所谓应用题虽然来自某一实践,但已经抽象为清晰的数学模型。和实践没有关系了。所谓检测可以是任何方式。
3, 即使是练习题,结论也要合情合理。病人来做检测,完了你告诉他你得病的几率是百分之50,这不是扯淡吗。
4, 能记住公式不一定是好事。因为如果定义和适用条件搞不清楚反而误事。
5, 学过不等于学懂了。
6, 对待陌生人的态度最好是那老虎,而不是那黔驴。
7, 不是你上面列出的任何一种人,但是学过概率论与数理统计,教过统计物理,不知道能不能钻研这个题目。
8, 你公式里分母的意义是随机的找一个人来测试,结果是阳性的概率。分子是误警率为零时随机检测阳性的概率。这两个概率之比就是阳性结果者确实是感染者的概率吗?
 
按照楼主假设的数据,如果检测两次,结果都是阳性,那么被测者确实是阳性的概率是多少?如果两次结果为阴阳各一次,那么被测者确实是阳性的概率又是多少?
第一个概率是99.86。
第二个,样本数太少不遵从统计规律。两次对同一样本的检测相反,说明准确率只有50%,楼主的假设不成立。
 
后退
顶部
首页 论坛
消息
我的