然而,传统的short reads NGS方法具有众所周知的局限性,某些技术上具有挑战性的变异如大indel、小CNVs和复杂改变,至少在不应用专门的生物信息学和生物化学方法的情况下很难被准确检测到。即使是片段重复(segdup,假基因)或低复杂性基因组区域中的简单SNVs和indel也会带来实质性的挑战。
这种技术上具有挑战性的变异对常规临床基因检测的实施、验证和诊断阳性率的影响尚未被彻底描述。最近有项研究检查了在遗传性癌症、心血管、神经和儿科疾病、生殖携带者筛查和其他临床指征的特定基因或多基因组的胚系基因测试中发现的致病性胚系变异的突变谱。相关文章发表于遗传学顶级期刊Genetics in Medicine。
为了实现这一点,作者首先进行了一项实验室间试点研究,使用包含已知对NGS具有挑战性的变异类型的人工合成阳性对照来评估十种不同的NGS实验室工作流程。其中一个工作流程在高容量临床测试实验室中实施并扩大规模,并使用额外的人工合成、参考和临床样本进一步评估该工作流程的敏感性。最后,检查了在日常实践中使用该工作流程报告的致病变异的属性。
具有挑战性的变异类型如下图
工作流程
结果
实验室间pilot研究
13个挑战性变异,10套分析流程,只有2个变异全部的流程都检测出来,只有3套流程检测出所有的13个变异。10套流程如下
游侠特地查阅了一下,检测出全部13个挑战性变异的是前面3个流程。
使用IGV的人工审阅表明,遗漏变异的证据在大多数原始数据集中是可见的,表明敏感性限制在本质上主要是由于生物信息分析。来自合成对照和含有相同变异的患者样本的数据的IGV审阅显示了类似的挑战,包括artifacts, misalignments,clipped reads, stutter, and deviations from 50:50 allele fractions。
具有技术挑战性变异的占比
在符合研究标准的471,591名患者的队列中,102,085人(21.6% )在1,217个不同基因中携带一个或多个临床报道的致病或可能致病(P/LP)变异。考虑到患者的临床指征和所进行的测试,这一阳性率是符合预期的。总共报告了127,710个P / LP变异,其中插入缺失占31.4%,CNV占9.7%,SNV占58.9%。这些变异已被确认为需要报告,因此所有这些变体都可以肯定地认为是真正的阳性。技术上具有挑战性的变异很普遍。在127,710个P / LP结果中,有17,561个(13.8%;95%CI为13.6–13.9%)满足了我们一项或多项针对技术挑战性的标准。
在具有挑战性的P / LP变异中,有42.3%(7,423)位于低复杂度区域(例如homopolymers,短串联重复序列)中,有35.0%(6,153)位于片段重复中(segdups)。此外,small CNV占11.4%(1,995),大片段Indel占6.5%(1,135),复杂重排占1.4%(238)。最后,基于具有异常低的NGS突变丰度,将0.6%的变异(740)标记为嵌合。
结论
总而言之,本文的结果表明,与广泛的临床适应症相关的基因中普遍存在具有临床意义但具有技术挑战性的变异。与大多数遗传疾病一样,这些变异是多种多样的,虽然从单个看比较罕见,但归类起来很常见。检测的局限性可能导致相当大的临床假阴性率。本文所述的资源和方法可以帮助实验室和临床医生优化基因测试,以进一步改善患者护理。