随着年龄的增长,人体细胞中不断发生着遗传变异,这是一个自然过程,一个细胞每年会发生约15-40个突变。这些突变中的大多数是无害的,但其中一些可以导致癌症。
自20世纪后期基因组测序问世以来,科学家们已经能够通过研究肿瘤中的基因突变更好地了解癌症的形成以及如何治疗癌症。近年来,新技术的发展还使科学家能够研究从健康组织中提取的干细胞中的突变。
但是,直到现在,基因组测序还不够精确,难以研究非分裂细胞中的新突变,这意味着我们绝大多数细胞中的基因突变尚无法准确观察到。
2021年4月28日,英国 Wellcome Sanger 研究所的 Iñigo Martincorena、Robert J. Osborne 等人在 Nature 发表了题为:Somatic mutation landscapes at single-molecule resolution 的研究论文。
研究团队开发了一种名为 Nanorate Sequencing(简称NanoSeq)的新方法,该测序方法精度非常高,细胞群中单个DNA分子的错误率低于5个/10亿碱基对。并使用NanoSeq研究了血液、结肠、大脑和肌肉的大量样本,挑战了细胞分裂是驱动基因突变的主要机制的观点。
更重要的是,这一测序方法使得科学家首次可以研究任何人体组织的DNA变化,而且让准确率达到前所未有的高度,该方法还能够更快、更大规模地研究致癌物对健康细胞的影响。可以说这项研究代表了癌症和衰老研究的一个重大进展。
2012年,美国华盛顿大学的研究人员开发了一种名为双重测序(Duplex Sequencing)的新型测序技术,通过对DNA双链分别进行独立的标记和测序,然后比对双链测序结果。由于DNA双链是互补配对的,真实的突变应同时发生于双链的同一位置,如果某个突变仅存在于一条链,则可以认为是测序错误,这就能显著地减少测序错误,大大提高测序精度。
达到前所未有的精度
在这项新研究中,Wellcome Sanger 研究所的研究人员试图进一步完善上述双重测序方法。
研究团队首先检索了双重测序结果中的错误,发现这些错误集中在DNA片段的末端,这表明制备DNA进行测序的过程中存在缺陷。然后,他们对DNA制备过程进行了改进,例如使用特定的酶更干净地切割DNA,以及改进了生物信息学方法。
在长达四年的时间里,研究团队一直在进行改进和提升,测序精确度也一直提高,直到这篇论文中的每十亿个碱基对测序错误少于五个。
检测仅存在于一个或几个细胞中的体细胞基因突变在技术上极具挑战性,因为必须在数千万个碱基中找到一个碱基变化,而以前的测序方法的精确度根本达不到这一要求。而NanoSeq测序技术在每十亿个碱基对只会产生几个错误,这足以使我们能够准确地研究任何组织中的体细胞基因突变。
细胞分裂并非基因突变主要驱动机制
接下来,研究团队利用NanoSeq的更高灵敏度来比较几种人体组织类型中干细胞和非分裂细胞中突变的速率和模式。
出乎意料的是,在对血细胞的分析中发现,缓慢分裂的干细胞和分裂更快的祖细胞中发现了相似数量的突变,这表明细胞分裂不是导致血细胞基因突变的主要过程。
对非分裂的神经元和很少分裂的肌肉细胞进行的测序分析还表明,突变在整个生命中都在没有发生分裂的细胞中积累,并以与血细胞相似的速度积累。
通常认为细胞分裂是发生体细胞基因突变的主要因素,更多的分裂会产生更多的突变。然而,这项研究清楚地表明,分裂得比其他细胞多很多倍的血细胞,和很少分裂的肌肉细胞,以及不分裂的神经元,它们具有相同的突变率和突变模式。
这改变了我们对基因突变的看法,并提示了细胞分裂外的其他生物学机制是基因突变的关键。
使研究任何组织中的基因突变成为可能
这项研究具有在所有细胞中观察基因突变的能力,将极大提升我们对生活方式的选择和致癌物暴露如何导致癌症的理解。例如研究已知致癌物如烟草或日晒的影响,以及发现新致癌物,开辟了研究癌症和衰老的新途径。
NanoSeq测序方法的另一个好处是可以相对更简单地收集样品,除了对组织进行活检,还可以无创收集细胞,例如做皮肤拭子和咽拭子,让大规模研究体细胞基因突变变得更容易、更便宜,且更少侵入性。
论文链接:
https://www.nature.com/articles/s41586-021-03477-4