摘要
目的:研究枫糖尿病的临床症状,揭示其发病的遗传原因。
方法:采用靶向捕获测序法筛选患者的突变。对患者的父亲、母亲和姐姐的样本进行了实时PCR,对1、5、9号外显子进行了CNV分析。行全基因组测序,定位大段缺失的断点的大致位置。行Long-range PCR和Sanger测序,以识别缺失的长度并定位断裂位点。
结果:病人在BCKDHA基因上有复合杂合变异,包括一个小缺失(c.1227_1229del chr19: 41930402) 和一个新型的涉及1-9号外显子的大段缺失。大段缺失的连接位点定位在两个Alu元件的微同源序列中。
结论:本研究是对引发MUSD(枫糖尿病)的由Alu元件介导的BCKDHA重排序列的首次报道。该结果可能拓展对MSUD的发生和致病原理的了解,益于日后的遗传咨询与遗传检测。
1. 介绍
MUSD(枫糖尿病)是一种罕见的影响BCAAs(支链氨基酸)代谢的常染色体隐性遗传疾病。MSUD是由于支链a-酮酸脱氢酶复合物(BCKDC)的活性缺陷造成的。BCKDC包括三个催化组分,即支链酮酸脱羧酶(由两个E1α亚基和两个E1β亚基组成)、二氢硫辛酰胺转酰化酶(E2)和二氢硫辛酰胺脱氢酶(E),分别由BCKDHA、BCKDHB、DBT和DLD基因编码。已在DBT、BCKDHB和BCKDHA基因中发现MSUD的致病突变。
当BCKDC的活性降低时,各BCAAs及其α酮酸在血浆中积累,引发致渐有害的临床后果。由于α酮酸积累的结果,MSUD患者尿液中有一种近似焦糖或枫糖浆的特征气味。MSUD患者的临床表现包括精神运动迟缓、进食不良、发育迟缓、癫痫发作、嗜睡、昏迷甚至死亡。根据临床表现、发病年龄和持续的BCKDC活性,MSUD可分为五种形式(E3缺乏型、间歇型、中间型、经典型和像中间型的硫胺素反应型)。其中,经典型是最常见的类型,特征表现为常规酶活性<2%,75%左右的严重临床症状发生在出生后几天,预后不良。
在本次研究中,我们描述了一例由小缺失突变(C.1227_1229del chr19:41930402)和BCKDHA基因中的一个新型大段缺失突变引发严重经典型MSUD的中国病人。缺失的连接位点定位在两个Alu元件的微同源序列中。 因此,我们推测Alu/Alu介导的重排是引发大段缺失的突变事件。
2. 方法与材料
2.2病人描述
本研究报告的病例是一名女性新生儿。病人的父母和姐姐都是健康的,非近亲结婚。
2.3靶向捕获测序和分析
我们通过靶向捕获测序来筛选病人的突变。共选择了650个与遗传性代谢紊乱相关的基因,并使用定制的外显子富集试剂盒捕获了它们的编码区域。我们从先证者中精确地利用15μgDNA生成了HiSeq2500测序仪的索引库。产生的平均外显子覆盖率和变异的准确性大于99%。
用IlluminaHiSeq2500获得原始短序列。去除测序数据中接头和低质量数据。用SOAP比对软件定位短序列到相应的人类基因组数据中。测序结果包括分析了短序列的数量、目标区域的覆盖大小、平均测序深度等。用SOAPsnp鉴定基因型目标区域的位点。用GATK软件查找序列中的插入或缺失信息(InDel)。
输入单个样本的每个捕获目标区域的文件区域计数reads。 将同一批样本(与芯片混合)的区域计数合并,并计算每个区域所有样本的reads及总和。对于每个区域,计算每个样本的reads数和所有样本总和的比值。要输出所需的样本,重点是基因所覆盖区域的最终比率(可以通过柱状图展示)。在正常情况下(二倍体)的最终比例估计为1。 <0.55表示可能丢失,>1.35表示可能重复。
2.5 全基因组测序(WGS)和分析
由于病人已经去世,没有办法得到足够的样本。该大段缺失遗传自患者的父亲。我们收集了父亲的样本作进一步的分析。从父亲的外周血单核细胞中提取基因组DNA。用Covaris声波仪将纯化的DNA剪切成400-500bp的片段。用TruSeq DNA Nano Library Prep Kit (Illumina)制备了WGS文库。在Illumina NovaSeq6000仪器上分析了WGS库,该仪器产生了2×150bp的配对端reads,平均覆盖深度至少为×30。使用内部分析流程处理WGS数据。简单地说,使用BWA-0.7.5a将reads定位到hg19人类参考基因组。用PicardMarkDuplicates去除重复reads。用ClinSV分析WGS数据的结构变异(SVs),通过断裂的reads、不一致的reads对和覆盖深度的证据,获得罕见的、高置信度的结构。
2.7 silica分析中的蛋白质结构
从NCBI数据库(https://www.ncbi.nlm.nih.gov),UniProt数据库(http://www.uniprot.org/) 和PDB数据库(http://www.rcsb.org), 获得了不同物种BCKDHA蛋白质的FASTA序列和三级结构。用Mafft7.450和Jalview2.11进行多序列比对、保守性分析和处理。用Swiss model预测突变后的蛋白质结构,使用PyMOL2.3.4来可视化蛋白质结构。
3. 结果
3.1 临床特征及实验室检查
患者有正常的出生体重2.9kg。在第四天出现特征性表现,包括喂养不良、间歇性抽搐、低血糖。脑磁共振成像(MRI)报告显示在小脑半球、内囊后肢、脑干、小脑脚和大脑脚(图1)呈现高弥散加权成像(DWI) 信号。代谢筛查结果显示病人的血浆亮氨酸和缬氨酸水平分别为1787.3μM(正常值为53-284μM)和1129.7μM(正常值为46-256μM)。通过GC-MS分析,检测到尿中乳酸、α酮异戊酸、α酮异己酸和α-酮-β-甲基戊酸水平上升。根据生化数据和呈现的临床表现,患者MUSD分类为经典型。该患者在出生后第二十三天去世。
3.2 靶向捕获测序和实时PCR
靶向捕获测序用于检测患者的突变。采用Sanger测序和实时PCR对突变进行验证。我们报告发现先证者在BCKDHA基因上有一个来自母亲的小缺失突变(C.1227_1229del chr19:41930402)和来自父亲的1-9号外显子的大段缺失(图2, 3)。小缺失突变(c.1227_1229del chr19:41930402)位于BCKDHA基因9号外显子。
图 2. 通过靶向捕获测序、Sanger测序鉴定突变。 (a,b,c,d)结果显示先证者从母亲遗传了一个在BCKDHA基因上小的缺失突变(C.1227_1229delchr19:41930402)。患者BCKDHA基因1-9号外显子的拷贝数比正常对照低1倍(e)
图 3. 使用实时PCR对患者父亲、母亲和姐姐的样本进行第1、5、9号外显子CNV分析。根据缺失片段与内参基因(GAPDH)拷贝数的比例确定拷贝数变异。 y坐标上的数字指的是缺失区域与GAPDH拷贝数的比率。一般情况下,正常拷贝数为0.7 < 2-ΔΔCt<1.3,杂合度缺失异常拷贝数为0.3 < 2-ΔΔCt < 0.6(a,b,c)
3.3 行WGS分析和long-rangePCR
WGS分析显示,父亲中存在45598bp(chr19:41896116-41941714)的大段缺失(图4a)。在UCSC网站上查询到断点附近的碱基序列,如图4b所示,灰色部分是缺失的碱基,断裂点两侧的Alu序列分别为Alu Sq2和Alu Jr。为了进一步表征大段缺失的连接位点,行long-range PCR,PC R产物做琼脂糖凝胶电泳,发现正常对照标本中未扩增出目标片段,而在父亲的标本中扩增出目标片段(图5a)。通过Sanger测序获得断裂点附近的序列(图5c),然后在NCBI网站上进行blast比对,进一步确认断点的位置(chr19:41896093-41941721)(图5b)。
图 4. 全基因组测序证实了BCKDHA基因的缺失。空白表示减少的测序深度和大段缺失的位置。红色箭头表示断点,在附近可以看到红色的断裂reads(a)。在UCSC网站查询到断点附近的碱基序列,灰色部分是缺失的碱基。UCSC网站显示,断裂点两侧的Alu序列分别为AluSq2和AluJr。缺失周围的微同源序列显示在黄色框中(b)
3.4 silica分析中的蛋白质结构
BCKDHA基因9号外显子上的小缺失突变(c.1227_1229del chr19:41930402)导致BCKDHA多肽链中409和410位的苯丙氨酸和丝氨酸的缺失,代之以亮氨酸的插入。409和410位置上的苯丙氨酸和丝氨酸在不同物种间进化高度保守(图6)。进一步silica分析,构建E1组分(E1⍺,白色;E1β,橙色)复合物的三维蛋白质结构模型(图7)。野生型蛋白质与天冬酰胺、亮氨酸、精氨酸形成四个极性接触,而突变的亮氨酸只与亮氨酸形成一种极性接触,这可能会干扰E1⍺结构的稳定性。
图 7. 三维蛋白结构的E1组分复合物和结构说明突变。 三维蛋白结构的E1组分(E1⍺,白色;E1β,橙色)复合物。野生型(A)和突变残基(B)显示为树枝状,并着色(绿色;红色)。目标残基的极性接触显示为黄色虚线。野生型蛋白与天冬酰胺、亮氨酸、精氨酸形成四个极性接触。突变型与亮氨酸有一个接触,丢失与精氨酸的两个极性接触、与天冬酰胺的一个极性接触
4. 讨论
根据临床表现、发病年龄及持续的BCKDC活性,MUSD被分为五种类型(E3缺乏型、间歇型、中间型、经典型和像中间型的硫胺素反应型)。大多数报告表明,大部分MSUD患者表现为经典型。本次报告的病例也被归类为经典型的MSUD。该患者在出生后第四天出现特征性表现,包括喂养不良、间歇性抽搐、低血糖。患者血浆亮氨酸和缬氨酸水平分别为1787.3μM(正常53-284μM)和1129.7μM(正常46-256μM)。尿中支链氨基酸代谢产物的增多进一步证实了该诊断。作为一种在早期发现细胞毒性脑水肿的技术方法,与常规MRI相比,在急性期MUSD相关脑组织病变中显示MSUD水肿高信号方面,DWI有更高的灵敏度。在本次报告的病例中,DWI显示小脑半球、内囊后肢、脑干、小脑脚和大脑脚的标志性高信号。这与以前的研究是一致。
虽然已经确定了许多MSUD相关的分子病因,包括缺失、插入、错义和无义替换,但DBT、BCKDHB和BCKDHA基因的大片段缺失,目前只证实了几个。在MSUD患者中,DBT基因内已确定了四个大片段缺失。在一名伊朗病人和两名中国病人发现了BCKDHB基因的三个缺失变异。
对于BCKDHA,已经报告了三个大片段缺失,一个来自西班牙患者的6号外显子跳跃,一个来自葡萄牙患者的2-4号外显子纯合缺失,一个来自中国患者的6-8号外显子杂合缺失。 然而,这些缺失的原因尚未得到很好的描述,断裂位点还不明确。本研究描述了BCKDHA基因的45598bp缺失(chr19:41896116-41941714)。对连接片段的分析表明,近端和远端断点位点有两个Alu元件(AluSq2和AluJr)。缺失片段周围的微同源序列包含29个碱基。缺失断点连接的表征表明,断点发生在ALU重复序列中,缺失最有可能是由微同源事件介导的。
Alu重复序列占人类基因组的11%,每个单倍体基因组都有100多万份拷贝的Alu序列。据估计,不论类型、反复或非反复重排,0.3%的人类遗传疾病都有Alu/Alu介导的基因组重排的参与。在这些遗传病中,一些疾病是由于基因缺陷导致酶功能障碍引起,例如:糖原储累积症II型、X-连锁肝糖原病、Lesch-Nyhan综合征、血友病等等。MSUD也是由BCKDC功能受损引起的常染色体隐性疾病。2018年,报道了一例在中国MSUD患者发现的由Alu介导的非等位基因重组引起BCKDHB全基因缺失。本研究是首次报道由Alu元件介导的BCKDHA序列重排引发MSUD。
不同的Alu亚家族,如AluJ、AluSx和AluSq、AluYa和AluYb,与Alu一致序列的同源性达70-80% 。当一对Alus介导基因组重排(AAMR)时,在交界处会形成嵌合的Alu序列。我们的研究发现两个不同Alu元件(AluSq2和AluJr) 共有一段29bp的微同源序列,在接合处形成一个新的嵌合的Alu元件。
小缺失突变(c.1227_1229del chr19:41930402)位于BCKDHA基因第9外显子。2016年曾 报道过这个突变。该变异会导致BCKDHA多肽链上第409和410位上的苯丙氨酸和丝氨酸缺失,代之以一个亮氨酸的插入。在BCKDHA多肽链中,第409和410位上的苯丙氨酸和丝氨酸在不同物种之间高度保守(图 6),如猴子、雪貂、兔子、老鼠等。这意味着这些位点在我们的人体中起着至关重要的作用,如果残基发生变化,会带来有害影响。在本研究中,野生型蛋白与天冬酰胺、亮氨酸、精氨酸形成四个极性接触,而突变型中的亮氨酸只与亮氨酸形成一个极性接触,这可能会干扰E1⍺结构的稳定性。我们推测这种变化对BCKDC的功能有负面影响。
5. 结论
在此,我们描述了MSUD患者的复合杂合的BCKDHA突变,包括小缺失突变(c.1227_1229del chr19:41930402)和包含整个BCKDHA基因的大段缺失。对接合片段的分析表明,在近端和远端断点位点上分布两个Alu元件(AluSq2和AluJr)。这一发现表明,BCKDHA基因中的新型大段缺失似乎是通过Alu/Alu介导的重排造成的。本研究是对引发MSUD的由Alu元件介导的BCKDHA重排序列的首次报道。我们的研究结果可能拓展对MSUD的发生和致病原理的了解,益于日后的遗传咨询与遗传检测。