淘客熙熙

主题:Mar.14 Nextstrain上COVID-19解读 -- 陈王奋起

共:💬17 🌺141 新:
分页树展主题 · 全看 下页
  • 家园 Mar.14 Nextstrain上COVID-19解读

    非专业胡说,大家随便拍砖。

    3月14日Nextstrain上有了477个上传的全序列基因库,其中中国144, 荷兰107,美国51, 英国33。目前水深火热的意大利只有4例,不知道是不是忙得没空了。

    图中放的是Radical模式,就是假定有一个根,和这个根出发,不同病毒序列的差异,越远变异越大,同一条径线上最小距离就是1个核苷酸的差异。有较大的片段不同的,就是一条新的径线。

    首先出场的中国vs美国:

    点看全图

    解读一下,中美重合度一般,有交集,但各自有自己的谱系。因为中国的基因序列库多,显得很密,但同样密度下美国的基因多样性比中国高,中国最远的那个变异是香港的,而港人到处跑,感染的病源何处并不清楚。今天早上美国还上传了一个diversence高达14.046的,远高于其他样本,显示美国已经传播很久了,是病毒的起源更有可能。

    下面的是中国vs荷兰

    点看全图

    荷兰目前第二高测序数量,病毒谱系和中国几乎完全不一样,显示该病毒的传播起源于中国的可能性真的不高。荷兰人大概知道点什么,开始大力上传,希望能够解开真相。

    美国vs荷兰:

    点看全图

    美国和荷兰的谱系重叠比中国多得到,嘿嘿。

    中国vs英国

    点看全图

    英国和中国的重叠也很少,说明什么呢?

    英国vs荷兰:

    点看全图

    英国和荷兰的重叠不算少了,有限的几个测序,都这么多重叠,毕竟是亲戚。

    我的文中没有放矩形树根图,因为看得懂的人不多。

    我解释一下,nextstrain是从GISAID数据库读取数据,再转化成可视化图形的,因为时间更新关系,彼此会有一定差距,还有香港,台湾算不算中国,因此统计上会有一点出入。

    在树状图中,根部是自动计算出来的,我猜测是根据最小diversence原则,因此根部的几个数据点的diversence的数据都是10的负13次方,差距及其微小, 所以你用unroot模式显示的时候,一会儿显示美国是根节点,一会儿是中国是根节点,根本原因是软件无法判断谁是根。在矩形树状图上可以看到一排的样本处于根节点位置上,增加一个样本数据,就会导致根节点的diversence变化。

    我个人推断是根据样本的总diversence除以总样本数,得到平均diversence,以此来分辨基因的多样性差异,这个方法需要大量的数据,现在还无法确定, 但美国显然处于领先位置,留给中国队的时间不多了。

    通宝推:桥上,witten1,青颍路,nettman,明心灵竹,纳米小洞儿,
    • 家园 del

      del

    • 家园 提醒一下,双击上面的线条可以放大图谱进一步观察分叉的情况

      点看全图

      双击上面的点可以看到其具体的情况,右侧的地图会显示其行迹追踪

      点看全图

      目前已知的最古老代际的病毒患者是武汉的一名男子,12月24号确诊或者上传的数据,之前有过欧洲旅行史,但是看图去的是德国或者比利时。

    • 家园 中国今天疑似新增为0了,应该把所有外部传入的归结于输出国

      不要把这些数据当成中国的,造成数据污染与误导。

    • 家园 我去,换了个图型以后发现,欧洲的明显跟中国没关系

      点看全图

      gisaid的基因图上,中国是明显的原发地。但是不知道gisaid的数据是不是经过了筛选的,之前世卫组织一直在说有些发达国家不愿意分析病患的相关信息,我看说的就是美国。

      但是换了一个图型以后就明显能看出欧洲的病毒基因族群跟中国的没多大关系,欧洲的基本上是独成一体的三大族群(上半球浅蓝、浅绿、浅黄的那几支),而且基因的族群代际从树杈来观察几乎直通始祖代际。而美国的那支主要族群(左半球中部红色那一支)看起来跟中国(下半球深蓝色那一群)左边的那一支有关系,但是细看连接线就会发现中美两个颜色在基因树杈上是并列的,说明跟中国的关系也不大,只不过其基因代际相对比较年轻。

      点看全图

      为啥在图中美国的基因族群看起来是比较新的,我估计跟美国的样本数量偏少有关。有可能美国传上来的数据是经过了筛选的,更接近始祖型的数据隐藏不报。近段时间美国的病毒检测速度表现极差,会不会是很多检测人员都被调派去搞基因检测和筛选去了,所谓的病毒检测盒有缺陷只是个人手不足的借口?否则不管不顾地上传数据,直接就会暴露美国才是病毒原发地的事实真相。

      通宝推:witten1,
    • 家园 这些序列是谁上传的?

      自由上传?无组织还是有组织?

      一手数据要自己测才放心,美国各种不透明党国查不到的,不过美国说美国的所谓零号病人就是武汉来的,党国也可以顺着这个思路仔细比对各国回国的留学生华侨华人的病毒"款式"区别,比如意大利伊朗中国这些崩过的和打算躺平任操的英国美国澳大利亚的,看看是不是不同"款式"转重症的概率不同。

    • 家园 陈王兄您稍微总结一下给个判断啊!

      生物学门外汉看不懂!

    • 家园 是不是说中美相关性大

      英国荷兰相关性大,其他的样本有差异?

分页树展主题 · 全看 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河