主题：说一下贝叶斯公式 -- 天空不空

共:💬27 🌺148 新:

老大河待整

说一下贝叶斯公式

看了一下高中三年的那个帖子，https://www.talkcc.net/article/4518147，顺便说两句

我知道河里有很多专业人士，但我还是想说一下贝叶斯公式，尤其是跟新冠的统计疫情有关的

众所周知，感染新冠并不必然检测出阳性，检测出阳性也不必然代表感染新冠，都是一个概率的问题，简单的说，就是，用A表明检测阳性事件，用B表示感染新冠事件，P(B|A)表示在检测阳性时感染新冠的概率，P(B)表示感染新冠的概率，P(A|B)表示在感染新冠的情况下检测出阳性的概率，P(A）表示总体样本中检测出阳性的概率，那么根据贝叶斯公式，举例说明，假设新冠的发病率为6%，P(B)=0.06,新冠病人检测出阳性的概率为99%，P(A|B)=0.99,如果检测一万个非新冠病人，有200个阳性，那么非新冠患者检测出阳性的概率为0.02，P(A|非B）=0.02那么总体阳性的概率P（A）=P(B)*P(A|B)+P(非B）*P(A|非B)=0.06*0.99+0.94*0.02=0.0782，在检测出阳性的情况下可以确诊为新冠的概率为

P(B|A)=P(B)P(A|B)/P（A）=0.06*0.99/0.0782=0.76，也就是检测出阳性时有四分之三的概率为新冠患者，但如果检测一万个非新冠病人里，有500个阳性患者，那么这个数值就变成

总体阳性的概率P（A）=P(B)*P(A|B)+P(非B）*P(A|非B)=0.06*0.99+0.94*0.05=0.1064，那么

P(B|A)=P(B)P(A|B)/P（A）=0.06*0.99/0.1064=0.56，也就是说此时检测养性是时感染新冠概率就只有二分之一左右，简单的说，感染新冠的概率既跟新冠患者中，检测出阳性的概率有关，也和非新冠患者中检测出阳性的概率有关，所以单纯看新观患者中检测出阳性的概率，是没办法得到检测出阳性时，感染新冠的概率，这段说的有点绕口，大家可以仔细体会一下。

通宝推：桥上,铁手,菜根谭,

复说一下贝叶斯公式

家园

技术帖，说两句

一个人去检测新冠（抗体或核酸），结果呈阳性，那么他真正得新冠的概率是多少？需要什么数据、怎么计算？其实模型不复杂，以楼主所列贝叶斯公式主打，俺来简化一下：

假设：1、试剂盒的敏感性为x

2、试剂盒的特异性为y

3、发病率为z

根据贝叶斯公式可计算，被查出阳性者真正得新冠的概率为：

点看全图

可以看出，特异性y、发病率z越高，概率P越大。所以当务之急是提高试剂盒的特异性和摸排出新冠的发病率。

======================

高三河友帖子中提到的是特例，可以列出一大组数据得到同样的结果。暂把特异性和敏感性笼统地称为准确度。

当准确度为 90%，发病率为 10%；

当准确度为 80%，发病率为 20%；

当准确度为 70%，发病率为 30%；

.........

这些情况下，一个人即使查出阳性，他真正得新冠的概率只有50%，简直就是在抛硬币。

这看起来很不科学，但科学就是这样

复技术帖，说两句

家园

这个解释存在问题

假阴性比假阳性更重要，假阳性无非就是浪费了医疗/隔离资源，假阴性才是真正的社区传染源。无论如何，大规模排查相当于减少了传染源，使其更容易控制。这个所谓的50%的概率的逻辑和戴口罩没有用的逻辑是类似的

复说一下贝叶斯公式

家园

被点名，补充一下

白宫那专家只是举例，检测手段“准确度”是本人的措词，记得专家原话是“99％ specific”，不晓得专业上是什么定义。

反正是举例，瞎假设一个，阳性结果=感染病毒，阴性结果=没感染，“准确度99％”的检测盒，100个阳性，1个错检测出阴性结果，100个阴性，1个错检测出阳性结果。100万检测者，1％的感染率，实际含有1万个感染者，99万没感染。用这个99％的检测盒检测这100万个人，结果将检测出来9千9百个真病人，9千9百个假病人，真假一半一半，而另有100个真病人漏网。如果人群感染率不是1％而是0.1％，那检测结果更离谱。

专家的话只说一小半，更核心的意思是，不能无把关地大面积检测，尤其是初期人群中的感染率很低的时候，必须由医生决定谁该不该检测。

复这个解释存在问题

家园

假阳性收治太多也不妥，医院受不了，而且有风险没病也治出病

复假阳性收治太多也不妥，医院受不了，而且有风险没病也治出病

家园

隔离就可以啊，结合CT判断收治标准

复被点名，补充一下

家园

手机回复，这个没关系

你说的这种是只有一种检测手段的时候，比如单一的核酸检测，如你所说，检测出9900个患者和9900个健康人，那没关系，再对这9900*2的人群抽血，查白细胞，淋巴细胞，血气分析，照传统ct,哪怕一种检测手段误诊的概率是50%，连续十种独立检测手段的误诊概率就变成千分之一了

复被点名，补充一下

家园

specificity就是特异性，不同方法交叉检测可确诊

主贴的贝叶斯公式解释的很清楚了

但是，这种问题存在于只存在单一检测方式的时候

一旦发现假阳性，结合上病史流调/CT/抗体检测，几样一结合，就可以测的非常准

只用抗体检测发抗体护照对于单次检查的个人是不靠谱的

但是核酸检查普查是很靠谱的，因为核酸PCR的特异性极高，接近100%，PCR检查几乎不存在假阳性，PCR的问题是敏感度低，假阴性不低，所以会漏掉不少无症状的人。但是挑出一个是一个，并且新冠病毒一旦传染，经常是聚集性传染，一发现基本是一个小集群，1。这种普查对武汉人的信心有意思，2。这种普查具有很大的科学意义。

这是湖北那边物资充足/检测能力充足的自然选择。海外连实际被感染的人都检测不过来，那是做不了普查。冰岛好像搞过一次类似的，冰岛总人口也才30万。

复技术帖，说两句

家园

如果只存在单一检测手段，你的分析是对的

可是我们检测武器很多啊，流行病学调查/问诊/血检/抗体/CT

并且新冠病毒传染性极高，一例阳性经常带起一个小集群

这些方法一结合，就可以确诊或疑似隔离起来，大大降低传播风险

复 specificity就是特异性，不同方法交叉检测可确诊

家园

明白。即是需要辅助手段或说综合手段

复技术帖，说两句

家园

我是偷懒了，像你这样用图片把公式说清楚可能更直观一些

复说一下贝叶斯公式

家园

前几个月看书，有个容易让非统计专业人士理解的例子

是我见过，最容易理解贝叶斯公式的例子了，不敢私藏，给大家看看

点看全图

通宝推：陈王奋起,

复说一下贝叶斯公式

家园

我活学活用，顺便验算一下

按照你的例子，我加多一个人口的数字，整个过程就很容易理解了

点看全图

如果我算错了，也请指出。

复前几个月看书，有个容易让非统计专业人士理解的例子

家园

你的理解稍微有一点误区

问题还是出在试剂的准确率那里，同样的试剂，一百个病人里检测出99个阳性，并不代表在一百个健康人里一定就检测出一个阳性，也可能能检测出三个阳性，五个阳性，这句话的意思就是（假设S=健康人阳性率+病人阳性率，则S并不必然为1，也可以为1.02,1.04或者其他值）

复前几个月看书，有个容易让非统计专业人士理解的例子

家园

这么说吧，理论上病毒A可以让检测试剂呈阳性

这么说吧，理论上病毒A可以让检测试剂呈阳性，虽然100个病人当中都带有病毒A，但在实际检测中由于种种原因，只有99个病人的检测结果呈阳性，但除了病毒A，细菌B也可让试剂呈阳性，如果健康人携带细菌B的概率为50%，那么健康人中检测阳性率就是49%，这样病人阳性率＋健康人阳性率就是148%，这个例子举得极端了一点，最理想的试剂当然是只对病毒A起反应，对其他生命体都没反应，但实际上这种情况很难，人体太复杂了

全看树展主题 · 分页下页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明