新冠病毒的基因组由近30000个RNA碱基组成。此前科学家已经根据与相关病毒中蛋白质编码基因的相似性,确定了一些能编码蛋白质的基因。他们认为,另外还有些基因能编码蛋白质,但它们并没有明确归类为蛋白质编码基因。
为确定这些蛋白质编码基因,计算机科学和人工智能实验室的玛诺里斯·克里斯教授领导的实验团队利用自己开发出的计算技术,对新冠病毒、萨斯病毒和42株蝙蝠沙贝病毒亚属进行了分析。这一技术的基本原理是分析物种之间是否保存着某些DNA或RNA碱基,并比较它们随时间如何进化,他们此前已利用该技术比较了人类基因组与其它哺乳动物的基因组。
结果表明,除发现此前已在其他冠状病毒中发现的5个基因外,克里斯团队还确认了新冠病毒基因组中6个蛋白质编码基因,而其他5个被认为能编码蛋白的基因并无此能力。他们表示,在分析了整个基因组后,非常确信没有其他蛋白质编码基因成为“漏网之鱼”。他们计划继续开展实验研究,以弄清这些没有特征的基因的功能。
此外,克里斯团队还分析了自新冠病毒首次被发现以来,已经出现的1800多个突变,并比较了每个基因在过去的进化速度和疫情暴发以来的进化速度。结果表明,大多数情况下,在疫情暴发之前长时间快速进化的基因仍在继续快速进化,而缓慢进化的基因也保持着自身的节奏。不过也有例外,这可能有助于揭示病毒在适应新的人类宿主时是如何进化的。
研究人员还分析了几种新冠病毒变异毒株——B.1.1.7、P.1和B.1.351等出现的突变。结果发现,许多使这些变异更危险的突变存在于刺突蛋白中,有助于病毒更快地传播并避开免疫系统。他们指出,每个变异毒株都拥有20多个独特的突变,知道哪些可能有用,哪些无用非常重要,有助于科学家专注最有可能对病毒传染性产生重大影响的突变。