推医汇

首页 > 行业动态

甲基化测序,究竟如何创新?

2024-08-15 15:11:23来源:基因谷
DNA 甲基化是表观遗传学的重要内容之一,DNA 甲基化测序方法中最重要且经典的一种方法即重亚硫酸盐测序。

 

由于未甲基化的 C 会转变为 T,这种转变会让基因组内的 C 相对变少,ATG 相对变多了;

 

而对于正常基因组的测序而言:

 

正常构建的文库,应该是碱基平衡的文库,也就是说,A/C/G/T 四种碱基的比例,各占 25% 左右;

 

只有这样,测序仪对碱基的判读才会更准确。如果缺少了一种或者几种碱基,测序仪对碱基的判读就会出现问题。测序得到的数据质量就会下降。

 

而甲基化文库中经过亚硫酸氢盐处理,绝大多数的 C 都变成了 T。所以,这个文库中是严重地缺少 C 碱基的,也就是四种碱基的比例是严重不平衡的。

 

这时候再来测序,得到的数据质理就较差。

 

这就是 BS-Seq 与常规转录组相比存在的问题之一。

面对甲基化测序,我们经常需要思考与解决的问题。

 

其一是如何将甲基化和其他突变同时测序,通过一份样本,提供更全面的基因信息,即“合”则“多”,“多”的价值无需赘言,毕竟,能减少样本量,少抽血少送片,就是提升了产品的终端竞争力;

 

另一个是如何更精确的区分不同的甲基化模式,即“分”则“少”,“少”不是“能力不足”,而是“更精准”,因为羟甲基化,来源于甲基化,使命却是终结甲基化,唯有准确区分,分而测之,是相关方法学创新的焦点问题。

 

 

 

我们以两篇文献为引,且作管中窥豹。

 

第一篇

 

 

01

是 2023 年 2 月发表于 PNAS 上的一篇文章[1],可以实现在同一模板 DNA 中检测罕见突变,拷贝数变异和甲基化。

 

作者开发了一种名为 MethylSaferSeqS 的方法,可以应用于任何适合大规模平行测序的标准文库制备方法。

 

其创新步骤是用引物复制每个 DNA 条形码分子的两条链,然后将原始链(保留其 5-甲基胞嘧啶残基)与复制链(其中 5-甲基胞嘧啶残基被未修饰的胞嘧啶残基取代)分离。这样就可以分别从原始链和复制链中获得 DNA 分子中存在的表观和遗传改变。

 

MethylSaferSeqS 方法的主要步骤:

1. 在接头连接后,复制每个模板 DNA 分子的两条链

2. 将原始 DNA 链与复制的 DNA 链进行分离

3. 构建两个文库,一个来自原始 DNA 链 (a),一个来自复制链 (b):

a. 使用亚硫酸氢盐对原始链中未修饰的胞嘧啶残基进行脱氨基处理,然后进行 PCR 扩增,并评估表观遗传学变化;

b. PCR 扩增复制链,评估基因型变化;

 

看似很简单,但其中有两点至关重要。

 

第一

修改 adaptor 序列,以确保与标准文库制备和测序方法兼容。通过对模板分子上的 adaptor 进行修改,使亚硫酸氢盐介导的脱氨基作用不会改变 adaptor 序列。

 

在 adaptor 序列中用 5-甲基胞嘧啶 (5-meC) 取代胞嘧啶 (C) 残基。或者,adaptor 也可以有其他改变形式,比如只使用 A、T 和 G,而不使用任何 C。

 

第二

由于异常基因变化或表观遗传学变化在某些 cfDNA 样本中是非常罕见的,因此在文库制备过程中需要避免这些等位基因的丢失,得到更多的模板分子。

 

我们将 MethylSaferSeqS 方法的重要步骤和细节点拆解如下:

 

步骤 1:复制模板分子,这一步是与传统文库制备方法的主要区别。

在传统的文库制备过程中,一旦 adaptor 体连接到 DNA 模板上,就会使用 PCR 扩增文库,以获得足够的DNA用于目标富集。然而,一旦进行扩增,DNA 模板的所有共价修饰(如甲基化或羟甲基化)都会丢失,并在复制过程中被未修饰的 DNA 残基取代。

 

而在 MethylSaferSeqS 中,两条 DNA 链会像典型的 PCR 步骤一样被热变性,但随后每条链都会被含有双生物素修饰和 5' 端脱氧尿苷(dU)的单引物复制。由于这一步每个反应只使用一个引物而不是两个引物,因此不会出现指数扩增。在复制之后,会产生 n+1 条链,而不是 2n 条链 (n= PCR 循环的次数)

 

步骤 2:分离复制链和原始链。

如上所述,用于复制的引物在5' 端含有双生物素修饰和一个 dU。5' 双生物素修饰可使复制链(仍与原始链杂交)与链霉亲和素磁珠结合,并确保这种相互作用不会被热破坏。结合后,原始链通过热变性与磁珠和结合的复制链分离。

 

最后,利用尿嘧啶 DNA 糖基化酶和 DNA 糖基化酶-裂解酶 EndonucleaseVIII 在 dU 残基处进行裂解,将剩余的复制链从磁珠上去除。从磁珠上去除 DNA 模板是因为作者发现,对于后续文库构建,在溶液中扩增比在磁珠上扩增更有效。

 

步骤 3a:使用亚硫酸氢盐对原始链中未甲基化的胞嘧啶进行脱氨基处理。

主要对温度和时间进行了优化,提升转化效率和得率,不做详述。另一个需要关注的点是,亚硫酸氢盐处理文库的扩增,与步骤 3b 相比有一个重要区别:用于 PCR 的引物较短,因此,只有具有甲基化 adaptor 的原始分子才会与引物序列保持同源性,并选择性地进行扩增。

 

步骤 3b:对复制的链进行 PCR 扩增。

该步骤与基本的 SaferSeqS 方案相同。在这一步中,使用针对每个 DNA 片段末端适配序列的引物进行扩增

 

这三个步骤结束后会产生两个文库:一个文库来自复制的分子,用于评估基因变异(如突变和拷贝数变化);另一个文库来自原始分子,用于评估DNA甲基化 。

 

作者用该方法,对 265 名患者的血浆样本进行测序分析,其中包括 198 名胰腺癌、卵巢癌、肺癌和结肠癌患者,发现了预期的突变、拷贝数改变和甲基化模式。

 

MethylSaferSeqSh 巧妙地实现了原始 cfDNA 序列和复制后序列的分离和分别 PCR 扩增,避免了扩增后序列甲基化信号丢失的问题,实现了遗传学和表观遗传学双组学标志物的联合分析。

 

BS-Seq 存在的另一个问题,则是无法区分 5mC 和 5-羟甲基胞嘧啶 (5hmC)。

 

而这两种甲基化模式,对基因表达的调控作用又完全不同:启动子区的 DNA 甲基化对基因表达有抑制作用,而 DNA 羟甲基化则会促进基因的表达;也就是说 5mC 和 5hmC 在功能上,其实经常是相互间拮抗的。

 

第二篇

 

 

02

是 2023 年 8 月发表于 Nature Chemical Biology 上的一篇文章[3],对 BS-Seq 做了改进,实现了对 5mC 和 5hmC 的准确解析。

 

当然,这并不是第一种可以准确解析 5mC 和 5hmC 的测序方法。

 

氧化亚硫酸盐测序 (oxBS-Seq) 法,也能实现这一目标。

 

其原理是将传统的 BS-Seq 技术与化学氧化相结合,先利用高钌酸钾将 DNA 上的 5hmC 氧化成 5fC,再用重亚硫酸盐处理,5fC 和没有任何修饰的 C 就被转化成 U,而 5mC 则不会被转化,仍然保持为 C。因而可以特异性的检测 5mC。

 

但是,它有一个小缺点,那就是 DNA 需求量较大,一般为微克(μg)级 DNA;

 

而 Nature Chemical Biology 的这篇文章,使用纳克级 DNA,并且在测序覆盖范围和 5mC 的准确定量方面优于 BS-Seq。

 

这种方法称之为 DM-Seq。

 

采用了两种关键的 DNA 修饰酶:一种是新 DNA 甲基转移酶,另一种是能够精确区分胞嘧啶修饰状态的 DNA 脱氨酶。将这些活性与脱氨酶抗性 adapter 偶联,可以通过测序中的 C-to-T 转换直接准确检测 5mC。

 

整体而言,该方法的创新之处主要是两点,一是酶,一是 adapter;

 

首选说酶

研究团队筛选了一系列的工程化甲基转移酶(MTase*)以及其底物 SAM,试图找到一种能够将保护基团有效地转移到未修饰的 CpG 上,并完全保护新生成的修饰碱基不受 A3A 介导的脱胺作用的影响的胞嘧啶。结果发现 5-羧甲基胞嘧啶(5cxmC)具有尺寸和负电荷的特征,作为抗 DNA 脱氨酶 APOBEC3A(A3A)脱氨的修饰胞嘧啶碱基。

 

再说 adapter

最初,此方法有一个问题,即 DNA 互补链的 CpG 羧甲基化不完全的问题,因此作者设计了一个 5-丙炔基胞嘧啶(5pyC)adapter,通过 5pyC adapter 实现的拷贝链合成克服了不对称 DNA 羧甲基化的挑战。

 

在最终的 DM-Seq 工作流程中, 5pyC adapter 连接到 gDNA 片段上并复制以产生一条只含有 5mCs 的链来代替 C,然后 gDNA 被 CxMTase (作用于未修饰的 CpGs) 和 βGT 的糖基化 (用于 5hmCs) 所保护。在 PCR 扩增和测序之前进行 A3A 脱氨。

 

当然,一个创新方法的性能究竟如何,需要和经典方法进行比较,我们看看 DM-seq 和 BS-seq 的比较数据。

 

首选看上样 DNA 量,从下图A可以看到,通过定量 PCR (qPCR) 检测,DM-Seq 样品的可扩增 DNA 含量是 BS-Seq 样品的 22 倍,意味着 DM-seq 可以检测样本量更少的核酸样品 (Ct:17.0 vs 12.5)。

 

未修饰的噬菌体 gDNA 的全基因组比较结果中,BS-Seq 的 CpG 不转化率低 (0.23%),而 DM-Seq 的脱氨保护率高 (96.7%),验证了复制链流程将 CpG 转化为 5cxmCpG 的效率。

 

用 M.SssI 处理的 gDNA 样本中,91.3% 的 CpGs 被 BS-Seq 保护;而在 DM-Seq 中,93.1% 的 CpGs 被 A3A 脱胺。在 M.CviPI MTase 条件下,BS-Seq 和 DM-Seq 在全基因组水平上检测到的 5mCpG 相似 。

 

以上结果均表明 DM-Seq 能够在单基分辨率下精确检测 5mCpG。

 

DM-Seq 提供了一种全酶、无损、可靠和直接的方法来单独读取 5mC,可以更好地确定单独 5mC 的生物学功能。

 

参考文献:

[1] Proc Natl Acad Sci U S A. 2023 Apr 11;120(15):e2220704120. doi: 10.1073/pnas.2220704120. Epub 2023 Apr 4.Detection of rare mutations, copy number alterations, and methylation in the same template DNA molecules

[2] BSMAP: whole genome bisulfite sequence MAPping program; BMC Bioinformatics. 2009 Jul 27;10:232.doi: 10.1186/1471-2105-10-232.

[3] Nat Chem Biol. 2023 Aug;19(8):1004-1012. doi: 10.1038/s41589-023-01318-1. Epub 2023 Jun 15.

Direct enzymatic sequencing of 5-methylcytosine at single-base resolution