淘客熙熙

主题:说一下贝叶斯公式 -- 天空不空

共:💬27 🌺148 新:
分页树展主题 · 全看 下页
  • 家园 说一下贝叶斯公式

    看了一下高中三年的那个帖子,https://www.talkcc.net/article/4518147,顺便说两句

    我知道河里有很多专业人士,但我还是想说一下贝叶斯公式,尤其是跟新冠的统计疫情有关的

    众所周知,感染新冠并不必然检测出阳性,检测出阳性也不必然代表感染新冠,都是一个概率的问题,简单的说,就是,用A表明检测阳性事件,用B表示感染新冠事件,P(B|A)表示在检测阳性时感染新冠的概率,P(B)表示感染新冠的概率,P(A|B)表示在感染新冠的情况下检测出阳性的概率,P(A)表示总体样本中检测出阳性的概率,那么根据贝叶斯公式,举例说明,假设新冠的发病率为6%,P(B)=0.06,新冠病人检测出阳性的概率为99%,P(A|B)=0.99,如果检测一万个非新冠病人,有200个阳性,那么非新冠患者检测出阳性的概率为0.02,P(A|非B)=0.02那么总体阳性的概率P(A)=P(B)*P(A|B)+P(非B)*P(A|非B)=0.06*0.99+0.94*0.02=0.0782,在检测出阳性的情况下可以确诊为新冠的概率为

    P(B|A)=P(B)P(A|B)/P(A)=0.06*0.99/0.0782=0.76,也就是检测出阳性时有四分之三的概率为新冠患者,但如果检测一万个非新冠病人里,有500个阳性患者,那么这个数值就变成

    总体阳性的概率P(A)=P(B)*P(A|B)+P(非B)*P(A|非B)=0.06*0.99+0.94*0.05=0.1064,那么

    P(B|A)=P(B)P(A|B)/P(A)=0.06*0.99/0.1064=0.56,也就是说此时检测养性是时感染新冠概率就只有二分之一左右,简单的说,感染新冠的概率既跟新冠患者中,检测出阳性的概率有关,也和非新冠患者中检测出阳性的概率有关,所以单纯看新观患者中检测出阳性的概率,是没办法得到检测出阳性时,感染新冠的概率,这段说的有点绕口,大家可以仔细体会一下。

    通宝推:桥上,铁手,菜根谭,
    • 家园 这是和发病率与疾病的危害性有关系的

      发病率高的病,和发病率低的病,对于sensitivity和specificity的精度要求差很多。比如艾滋病发病率很低,所以需要假阴性足够低,假阳性多一点没关系。

      新冠的发病率也算不上高,再加上传染性强后果恶劣,真正需要保证的是假阴性足够少,假阳性的问题可以用多次检测解决。说实话,假阴性只要能降低到0.001%,假阳性就算是40%也比两个都是1%的检测方法好的多。

      通宝推:桥上,
    • 家园 我活学活用,顺便验算一下

      按照你的例子,我加多一个人口的数字,整个过程就很容易理解了

      点看全图

      点看全图

      如果我算错了,也请指出。

    • 家园 前几个月看书,有个容易让非统计专业人士理解的例子

      是我见过,最容易理解贝叶斯公式的例子了,不敢私藏,给大家看看

      点看全图

      通宝推:陈王奋起,
      • 家园 这么说吧,理论上病毒A可以让检测试剂呈阳性

        这么说吧,理论上病毒A可以让检测试剂呈阳性,虽然100个病人当中都带有病毒A,但在实际检测中由于种种原因,只有99个病人的检测结果呈阳性,但除了病毒A,细菌B也可让试剂呈阳性,如果健康人携带细菌B的概率为50%,那么健康人中检测阳性率就是49%,这样病人阳性率+健康人阳性率就是148%,这个例子举得极端了一点,最理想的试剂当然是只对病毒A起反应,对其他生命体都没反应,但实际上这种情况很难,人体太复杂了

      • 家园 你的理解稍微有一点误区

        问题还是出在试剂的准确率那里,同样的试剂,一百个病人里检测出99个阳性,并不代表在一百个健康人里一定就检测出一个阳性,也可能能检测出三个阳性,五个阳性,这句话的意思就是(假设S=健康人阳性率+病人阳性率,则S并不必然为1,也可以为1.02,1.04或者其他值)

        • 家园 谢谢指点,再请教一下

          我第一个例子确实隐含了一个假设,即对健康人口,与患病人口的检测准确率是一致的,都是99%。

          而您的例子中,估计在实践操作中也是,这两个准确率是不一样的。

          实际上,在试剂上市前,肯定也要测,测试的结果有几种可能性:

          1. 已知是病人,检测有真阳性

          2. 已知是病人,检测有假阴性

          3. 已知是健康人,检测有真健康

          4. 已知是健康人,检测有假健康

          出现假阴性,与假健康,两者概率是可以不一样的。

          我这个理解,应该没错吧?

    • 家园 被点名,补充一下

      白宫那专家只是举例,检测手段“准确度”是本人的措词,记得专家原话是“99% specific”,不晓得专业上是什么定义。

      反正是举例,瞎假设一个,阳性结果=感染病毒,阴性结果=没感染,“准确度99%”的检测盒,100个阳性,1个错检测出阴性结果,100个阴性,1个错检测出阳性结果。100万检测者,1%的感染率,实际含有1万个感染者,99万没感染。用这个99%的检测盒检测这100万个人,结果将检测出来9千9百个真病人,9千9百个假病人,真假一半一半,而另有100个真病人漏网。如果人群感染率不是1%而是0.1%,那检测结果更离谱。

      专家的话只说一小半,更核心的意思是,不能无把关地大面积检测,尤其是初期人群中的感染率很低的时候,必须由医生决定谁该不该检测。

      • 家园 你说的没错,这个specific其实是很关键的指标。

        如果是accuracy。假设新冠的发病率是1%,那检测100个人,假设有一种试剂对每个样本都检测为阴性,那样的话它的准确度(accuracy)也有99%。可实际上这个试剂是完全没有指导意义的。

        你假设的“‘准确度99%’的检测盒,100个阳性,1个错检测出阴性结果,100个阴性,1个错检测出阳性结果。”实际上是不成立的,我估计也没有这么高效的试剂。

        我猜测可能会和F1 score有关系。

      • 家园 specificity就是特异性,不同方法交叉检测可确诊

        主贴的贝叶斯公式解释的很清楚了

        但是,这种问题存在于只存在单一检测方式的时候

        一旦发现假阳性,结合上病史流调/CT/抗体检测,几样一结合,就可以测的非常准

        只用抗体检测发抗体护照对于单次检查的个人是不靠谱的

        但是核酸检查普查是很靠谱的,因为核酸PCR的特异性极高,接近100%,PCR检查几乎不存在假阳性,PCR的问题是敏感度低,假阴性不低,所以会漏掉不少无症状的人。但是挑出一个是一个,并且新冠病毒一旦传染,经常是聚集性传染,一发现基本是一个小集群,1。这种普查对武汉人的信心有意思,2。这种普查具有很大的科学意义。

        这是湖北那边物资充足/检测能力充足的自然选择。海外连实际被感染的人都检测不过来,那是做不了普查。冰岛好像搞过一次类似的,冰岛总人口也才30万。

分页树展主题 · 全看 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河