【转】科普+辟谣:Nextstrain的进化树到底表达了什么?

muskell

初级会员
注册
2016-07-08
消息
567
荣誉分数
112
声望点数
53

本来想早点发,但我也是有工作有生活的人,所以帖子发的晚了,抱歉。另外此贴也比较长,有很多图,一半科普,一半辟谣,顺带打脸王某某。既然一半是科普,我就不在正贴里怼了。欢迎回帖怼,但也请拿出干货。

最近看见几次某些人贴的那张进化树。转发图的人很多也会说“此图证明COVID-19病毒是武汉来的”。



36289a5.jpg_b.jpg


起初我问了图是哪里来的,然而没有收到回应,于是我用谷歌反向搜索此图,也并没有发现任何专业的网站发或转发此图(只有三页搜索结果,所有结果都是四个社交平台来的,包括留园。留园的可信度相信大家也清楚,这个我不多说了),于是我就猜这个图是假的。但是后来经过仔细搜索,发现猜错了。确实是真的,是从一个名叫Nextstrain的专家建立的网站来的,用于汇总一些已知的数据。


既然我的工作与生物科研有关,本着科学的态度,我承认先前确实说错了一半,这图是真的。可能样子不完全相同,但鉴于Nextstrain一直在更新,又不断地有新数据新样本出现,这图又明显不是最近几天才生成的,所以不完全一样也可以理解。


但是,虽然图是真的,Nextstrain却并没有证明COVID-19是武汉来的,甚至没有说过病毒是哪来的。病毒来源目前还是未知。


有些人,比如王某某,看到这就会说“哈!所以你这个五毛狗/共狗/共匪/小粉红/宣传员/战狼/奴才认为病毒是美国来的”。这是个可笑的看法。未知,不是说是某某国或某某地方来的,仅仅是我们现在还不知道。既然提及科学,那我们要尊重现有的事实,所以稍安毋躁,我们慢慢来。


其实几张Nextstrain网站的截图就可以说明问题。以下我会给出链接供大家细读,在截图里划出重点。


比如就在进化树之下的一段声明。这一段,只要你懂英文,就应该明白写的是什么意思:



a1f8756.jpg_b.jpg


这是Nextstrain给的中文翻译:



9b65956.jpg_b.jpg



再比如建立Nextstrain的专家给的声明,分析,和结论:auspice



e7f3631.jpg_b.jpg


72a373b.jpg_b.jpg


f9fce89.jpg_b.jpg



再比如Nextstrain的“帮助”页(此页貌似无中文版):SARS-CoV-2 / COVID-19



4b0a429.jpg_b.jpg



再比如Nextstrain的“如何读懂进化树”:auspice



c98d9ac.jpg_b.jpg



基于网站上的信息,总结一下重要的几点:


- Nextstrain的功能目前只限于假设病毒的传播轨迹,给出扩散范围与各地区的疫情严重性的参考。


- Nextstrain的用途基本有三:用于制定应对疫情的措施,用于分析未来疫情发展,用于向大众报告。


- Nextstrain生成的所有图表的精确度局限于已提交的样本。


- Nextstrain用的样本来源里,有一些地区提交的样本数量在总量里占比偏大。


- COVID-19病毒的来源目前未确定。



看完了网站创始专家们对Nextstrain的介绍,再挨个说一下这几点意味着什么:


- Nextstrain目前还不能推测病毒来源。


- Nextstrain的取样目前有缺陷,只是冰山一小角(全球总共652079病例,Nextstrain却只有2084个病例的数据,是总病例数的0.32%,占比非常小)。


- 取样的缺陷导致结论也只能供参考(俗语:“看看就好”),不能作为确凿“证据”看待。


- 对于研究人员,Nextstrain的意义在于汇总当下已有的数据,并给出一些建议性的分析。


- 对于大众,Nextstrain的意义在于提供当下的科学界意见,让大家能了解当下情况。



但是对大众公开不代表大众就都能看明白网站内容,比如那个进化树图。所以我们有必要解释一下进化树图到底怎么看。


(大家如果还记得高中生物内容,可以直接去看Nextstrain的“如何读进化树图”那页,跳过本帖下面一段:https://nextstrain.org/help/general...//nextstrain.org/narratives/trees-background)


=================================================================


既然进化树图与进化论有密切关联,我们就从这开始。


进化论是描述生物物种为了生存在变化的环境里而表现出的演化。这样的例子随处可见,比如近些年来出现的一些致病抗药菌(俗称“超级细菌”),如MRSA(Methicillin-resistant
Staphylococcus aureus/多重抗药金黄色葡萄球菌)。这些抗药菌就是因为人类社会中越来越多地使用抗生素,导致(人为地)筛选出能抗药的细菌存活下来。


可为什么这些菌变得能抗药呢?换句话说,演化到底是怎么实现的?


是由基因变异一点点实现的。


很多人都知道,基因(DNA)是双链的,有一个个含氮碱基组成的碱基对。DNA的含氮碱基有四个:A(Adenine/腺嘌呤),G(Guanine/鸟嘌呤),C(Cytosine/胞嘧啶),和T(Thymine/胸腺嘧啶)。如果是RNA,就会把T换成U(Uracil/尿嘧啶)。其中,A与T或U配对(这要看是DNA还是双链RNA),C与G配对。


但是徒有基因还没什么用处。真正应用起来,必须要把基因携带的信息想办法变成蛋白质。(RNA确实也可以有功能,如rRNA,但鉴于这是基础科普,又与本贴要说的没有太大关系,就不讲太多了)


这个过程就是生物学的“中心法则”(central
dogma of molecular biology)。中心法则大致是这样的:DNA
转录(transcription)成 RNA,RNA再转译(translation)到 蛋白质。其中因为细胞需要分裂(繁殖),DNA需要复制。RNA也同样可以复制,并且可以逆转录(reverse-transcription)回到DNA。也就是说,DNA和RNA的信息内容可以是一样的。


中心法则变成图就是这样:



p1585432958_79194.jpg_b.jpg


所以,想要表现出实质的稳定的蛋白质的变化,就需要改变基因或RNA(取决于某物种用哪一个做基本“蓝图”)。由于组成蛋白质的氨基酸有21个,远大于含氮碱基的数量(DNA有4个,RNA有4个),因此基本上每三个含氮碱基为一个密码子(codon),不同的含氮碱基组合决定某蛋白质某位置是哪个氨基酸(Amino
acid,AA)。



p1585432958_35116.jpg_b.jpg


通常来说,对于基本“蓝图”是DNA的生物来说,在每一次复制DNA的时候,都有可能会出现复制错误,这些复制错误如果不被修复,就会影响到根据DNA做出的蛋白质,这就是基因变异。如果蛋白质的关键部位受到影响,就会有三种结果:功能不受影响,功能受到不好影响乃至功能完全消失,或功能提高甚至增加新功能。在自然环境中,如果环境不变,第一种结果意味着生物还和以前一样,而第二或第三种结果都会影响到个体的生存能力。如果生存不下去,就会被淘汰。但如果中奖了,变异提高了生存能力并传给了下一代,那么这就算是演化了一点点。通过分析每个物种的全基因组,并找到这些突变的地方,就可以了解一个物种是如何演化而来,以及一个物种与其他物种在基因上的关系。


COVID-19病毒显然不太一样,因为是单链RNA病毒,但它也会遵循这个基本规律,并且变异速度会比多细胞生物更快。在全球许多实验室收到并分析病例病毒样本的cDNA基因组(cDNA是由原本的RNA逆转录得来的,因此信息是相同的)之中的不同之处。以出现较早(但不是最早)有样本的病例为标准(Wuhan-Hu-1/2019; "nonucleotide mutations";“标准”不等于“起源”),分析出其他病例中病毒的基因组都有哪些变异。



d14a5af.jpg_b.jpg




401c1d7.jpg_b.jpg



=================================================================


现在再讲进化树图。


其实进化树图并不是放射形的,而是..........树形的。以下是一张艺术化的早期进化树图,由生物学家恩斯特·海克尔(Ernst
Haeckel)于1866年绘制(图中内容已经过时,看看样子就好):



p1585432959_71782.jpg_b.jpg


那么横过来就是这样的:



1f22fab.jpg_b.jpg



“根”代表起始,从根开始,随着时间的推移,出现了“变异a”和“变异b”,于是就分出两个枝条,分别指向已知的A和B。


但是如果不知道“根”,怎么办呢?最好的办法就是改成无根进化树,也就是包含假设和推断最少的最基本的进化树。下图中并没有根,但是如果在“A”和“B”之间的线上取一个点假定为“根”,就可以画出之前的图:



f9d4e83.jpg_b.jpg



以上的两种图实际上都是同样的数据,只是有根树图包含一些推断(如时间,如“根”)。第三种体现方式,也就是放射形进化树图,看着很高大上,但和有根树图是一模一样,只不过以“根”为中心点:



db2226e.jpg_b.jpg



Nextstrain有以上3种进化树图的体现方式,分别在侧面的“Tree
Options”之下的“Rectangular”(普通树形),“Unrooted”(无根树形),和“Radial”(放射形)。实际表达的都是同样的数据同样的分析。


由于无根进化树(Unrooted)是最基本的,推断假设最少的体现方式,我们就先看这个。从这个进化树图可以发现,没有一个病例(点)在中心点。这就说明网站上显示的所有病例里没有一个是“0号病人”,而且都是后来才有的。



15f9755.png_b.jpg



再来看有根进化树(Rectangular)。实际有根树图就是把无根进化树那个中心点“根”变成最下面的枝。真正的“根”,也就是干,在哪里我们并不知道,因为那个时候的样本数量严重不足。



0ff3fcd.png_b.jpg



最后再看放射形进化树。放射形进化树中心的那个“根”,其实是先前的有根进化树上最下面的那个枝从一条线缩成一个点。



ac17e33.png_b.jpg



所以,Nextstrain的进化树没有一个说明COVID-19是从哪里来的。


有些人会问:可为什么离假设“根”最近的都是武汉的病例呢?这不就说明是病毒是武汉来的吗?


其实原因只是因为最早公布给科学界的病毒基因组是武汉的病例。现在已经有有专家怀疑其他国家其他地区在比武汉病例出现更早的时间就已经出现病例,只是苦于没有样本没有测序,所以在Nextstrain没有显示。就这么简单。


在没有更多数据出现之前,如果有人拿着Nextstrain的进化树图说“病毒是武汉来的”,此人要么是没看懂Nextstrain的进化树,要么就是造谣传谣。


谣言止于智者。在这样谣言满天飞的时候,请诸位(包括我在内)尽量做智者。
 
荣耀与批判(版权)归于原作者。
 
荣耀与批判(版权)归于原作者。
虽然科普做得很好,大部分还是基本不懂,但是欢迎各方面的观点。
 
不能说明病毒来源。零号找到之前。神仙也不知道。

但是这些研究展示了病毒演化的时间线和变异途径。

因此指明了大致的病毒传播大数据途径。

武汉只有拿到铁证,拿到零号。否则。在没有新证据情况下。很难翻牌。
 
虽然科普做得很好,大部分还是基本不懂,但是欢迎各方面的观点。

其实看最后两个图就行了:武汉发现的病毒和一些其他国家已经测序过的病毒是分别进化的,有一个共同来源,这个来源不明。
 
谢谢,虽然不是太明白。

无立场理工男,说两句。

从结论推断来看,牵强。为什么?

“可为什么离假设“根”最近的都是武汉的病例呢?这不就说明是病毒是武汉来的吗? ”--- 这话问的不太严谨,应该是“可为什么离假设“根”最近的都是武汉的病例呢?这不就说明是病毒最有可能是武汉来的吗?”

确实,没有确凿证据认定武汉是病毒发源地,但是,没有确凿证据说明武汉不是发源地, 对吧?

说起来,就是概率问题,也许随着时间的推移,以后更难甚至再无更有价值的、更早的能证明起点传播路径的采样出现,就像以前的一些病毒几十年也无定论一样,不会有对Covid-19 的溯源定论,但是不妨碍人们按照已有的信息、概率形成客观的认识。

甚至,从逻辑上讲,真(以为)找到了“病毒发源地”,也会有人可以讲,“是不是在更早的时候从别的地方传来的呢?我们再查吧!”-----形成永远不能结论的悖论。

没错,病毒是全球人类应该共同面对的,其一般是在自然界演化而来,在哪里爆发只能说是这个地方、百姓甚至政府运气不佳,没什么特别需要怨恨的。

但是,如果是人工合成的, 就是另一回事了。
 
根据自然选择的原理,高致死性的病毒突变不利于遗传。估计最后剩下的都是低致死高传染性的。跟普通流感没区别。
mers致死率30%,而且发病很快,所以很快就被控制了。
 
对高传染率病毒来说,指望自然进化毒力降低,是水中月。

为什么。

1。病毒变异是没有方向性的。rna病毒变异迅速。新冠传播能力极强。
2。自然选择有方向性。

但是对传染能力强的病毒,第一点远比第二点明显。因此。理论上这个病毒只有靠光谱疫苗。时间可能减毒。那是运气。


时间也可能催生更加厉害的毒株。
 
不能说明病毒来源。零号找到之前。神仙也不知道。

但是这些研究展示了病毒演化的时间线和变异途径。

因此指明了大致的病毒传播大数据途径。

武汉只有拿到铁证,拿到零号。否则。在没有新证据情况下。很难翻牌。

其实不需要零号病人。如果两只病毒没有父系关系,就只能是独立进化。

这个病毒确实是中国先发现,也确实是有些人带到了许多国家。但是至少一些国家的病毒和中国最初发现的病毒在基因上没有传承关系(倒数第二图(?))。

关键的问题是,至少在这篇文章中看,在没有铁证的情况下,中国就被冠上了发源地....话语权很重要
 
对高传染率病毒来说,指望自然进化毒力降低,是水中月。

为什么。

1。病毒变异是没有方向性的。rna病毒变异迅速。新冠传播能力极强。
2。自然选择有方向性。

但是对传染能力强的病毒,第一点远比第二点明显。因此。理论上这个病毒只有靠光谱疫苗。时间可能减毒。那是运气。


时间也可能催生更加厉害的毒株。

其实我感觉疫苗也是水中月,流感疫苗多少年了,防住了什么,还是年年感冒。只是降低了一些高风险人群的死亡率。
 
現在已經有 2000+ 個樣本了,系統暫時判定二月七日英國樣本為核心病人 (其實基因完全一樣的還有十幾例,有武漢(共四例)、上海、浙江、江蘇、重慶、台灣、英國(共三例)、泰國、冰島、美國、芬蘭。不曉得是「趨同演化」又突變回去了,還是原版病毒很早就在全世界傳開了,兩個都有吧。
 
最后编辑:
谢谢,虽然不是太明白。

无立场理工男,说两句。

从结论推断来看,牵强。为什么?

“可为什么离假设“根”最近的都是武汉的病例呢?这不就说明是病毒是武汉来的吗? ”--- 这话问的不太严谨,应该是“可为什么离假设“根”最近的都是武汉的病例呢?这不就说明是病毒最有可能是武汉来的吗?”

确实,没有确凿证据认定武汉是病毒发源地,但是,没有确凿证据说明武汉不是发源地, 对吧?

说起来,就是概率问题,也许随着时间的推移,以后更难甚至再无更有价值的、更早的能证明起点传播路径的采样出现,就像以前的一些病毒几十年也无定论一样,不会有对Covid-19 的溯源定论,但是不妨碍人们按照已有的信息、概率形成客观的认识。

甚至,从逻辑上讲,真(以为)找到了“病毒发源地”,也会有人可以讲,“是不是在更早的时候从别的地方传来的呢?我们再查吧!”-----形成永远不能结论的悖论。

没错,病毒是全球人类应该共同面对的,其一般是在自然界演化而来,在哪里爆发只能说是这个地方、百姓甚至政府运气不佳,没什么特别需要怨恨的。

但是,如果是人工合成的, 就是另一回事了。

武汉离根部最近,只不过是武汉最先测序

同意你说的其他的。现在最关键的事情,是研发怎么控制治疗,而不是“强调”来源。可惜政治不是科学。国际政治更不是科学
 
对高传染率病毒来说,指望自然进化毒力降低,是水中月。

为什么。

1。病毒变异是没有方向性的。rna病毒变异迅速。新冠传播能力极强。
2。自然选择有方向性。

但是对传染能力强的病毒,第一点远比第二点明显。因此。理论上这个病毒只有靠光谱疫苗。时间可能减毒。那是运气。


时间也可能催生更加厉害的毒株。
从现在的情况看,从武汉到米兰到纽约未见减弱,似乎传染性更强了,除非是人为防范不利造成的结果。
 
武汉离根部最近,只不过是武汉最先测序
假设这里和其他一些地方有人怀疑的今冬加拿大的流感,美国流感和其他地区的流感包括了新冠病毒,但是却没有测序研究,所以武汉是大家看到的最先发病区。
 
現在已經有 2000+ 個樣本了,系統暫時判定二月七日英國樣本為核心病人 (其實基因完全一樣的還有十幾例,有武漢(共四例)、上海、浙江、江蘇、重慶、台灣、英國(共三例)、泰國、冰島、美國、芬蘭。

希望以后有更多的测序。尤其是武汉爆发之前的测序。
现在已经是国际化事件了,希望所有的国家都能够认真的寻找来源
 
后退
顶部