新冠病毒精确完整基因注释图谱完成

2021-05-13 15:39:08来源：基因谷

美国麻省理工学院的科学家在11日出版的《自然·通讯》杂志撰文称，在进行了广泛的比较基因组学研究之后，他们绘制出了新冠病毒迄今最精确完整的基因注释图谱，确认了几种蛋白质编码基因，也发现有些基因并不编码任何蛋白质。此外，他们还分析了新冠病毒不同毒株产生的近2000个突变，从而能更好地评估这些突变的重要性。

新冠病毒的基因组由近30000个RNA碱基组成。此前科学家已经根据与相关病毒中蛋白质编码基因的相似性，确定了一些能编码蛋白质的基因。他们认为，另外还有些基因能编码蛋白质，但它们并没有明确归类为蛋白质编码基因。

为确定这些蛋白质编码基因，计算机科学和人工智能实验室的玛诺里斯·克里斯教授领导的实验团队利用自己开发出的计算技术，对新冠病毒、萨斯病毒和42株蝙蝠沙贝病毒亚属进行了分析。这一技术的基本原理是分析物种之间是否保存着某些DNA或RNA碱基，并比较它们随时间如何进化，他们此前已利用该技术比较了人类基因组与其它哺乳动物的基因组。

结果表明，除发现此前已在其他冠状病毒中发现的5个基因外，克里斯团队还确认了新冠病毒基因组中6个蛋白质编码基因，而其他5个被认为能编码蛋白的基因并无此能力。他们表示，在分析了整个基因组后，非常确信没有其他蛋白质编码基因成为“漏网之鱼”。他们计划继续开展实验研究，以弄清这些没有特征的基因的功能。

此外，克里斯团队还分析了自新冠病毒首次被发现以来，已经出现的1800多个突变，并比较了每个基因在过去的进化速度和疫情暴发以来的进化速度。结果表明，大多数情况下，在疫情暴发之前长时间快速进化的基因仍在继续快速进化，而缓慢进化的基因也保持着自身的节奏。不过也有例外，这可能有助于揭示病毒在适应新的人类宿主时是如何进化的。

研究人员还分析了几种新冠病毒变异毒株——B.1.1.7、P.1和B.1.351等出现的突变。结果发现，许多使这些变异更危险的突变存在于刺突蛋白中，有助于病毒更快地传播并避开免疫系统。他们指出，每个变异毒株都拥有20多个独特的突变，知道哪些可能有用，哪些无用非常重要，有助于科学家专注最有可能对病毒传染性产生重大影响的突变。

﻿新冠病毒精确完整基因注释图谱完成

新冠病毒精确完整基因注释图谱完成