]
背景:脑肿瘤(中枢神经系统(CNS)肿瘤)的精准分类对临床诊断和治疗至关重要。尽管基于全基因组DNA甲基化谱的AI(机器学习分类器)(如“海德堡脑肿瘤分类器/AI诊断工具”)已在临床中广泛应用,但其决策机制仍缺乏可解释性。DNA甲基化作为关键表观遗传标记,在肿瘤发生和细胞表型调控中起重要作用,但基于其的AI诊断脑肿瘤的决策过程有待于进一步阐明;
方法:本研究开发了一种基于随机森林(Random Forest, RF)算法的可解释人工智能(XAI)框架,解析海德堡脑肿瘤分类器的决策逻辑。通过分析2801个样本(涵盖82种肿瘤和9种正常对照)的428,799个DNA甲基化位点,提取并量化分类器在训练过程中每个甲基化探针的使用频率(“探针使用值”)。研究进一步结合功能基因组注释(如CpG岛、增强子、异染色质区域),并开发交互式网络应用(shinyMNP)以支持数据探索;
结果:①功能基因组区域的关键作用:分类器主要依赖不同大小的功能区域(如CpG岛、增强子、异染色质域)区分肿瘤类别。例如,IDH突变型胶质瘤通过CpG岛高甲基化(CIMP表型)显著区分,而PITAD和LIPN类肿瘤则依赖远端开放海区域的低甲基化。②基因组冗余性:分类器利用大量冗余探针(如10,000个关键探针贡献78.1%的区分能力),分布于多个基因组区域,确保了模型的稳定性。③生物学关联发现:通过交互工具识别了多个肿瘤特异性表观遗传标记(如ETMR中SHPRH启动子高甲基化、HGNET_MN1中PWWP3A基因体低甲基化),揭示了潜在治疗靶点和生物学机制;
结论:本研究首次系统解析了DNA甲基化分类器的决策机制,证实功能基因组区域和冗余探针在肿瘤分类中的核心作用。开发的shinyMNP工具为生物标志物发现、靶向治疗探索及表观遗传学研究提供了开放平台。该框架可扩展至其他甲基化分类器,并支持便携式检测技术的开发,推动精准肿瘤诊断与治疗的进一步发展。
原文信息
Explainable artificial intelligence of DNA methylation-based brain tumor diagnostics
作者信息
第一作者:Salvatore Benfatto
通讯作者:Volker Hovestadt
通讯作者单位:
Department of Pediatric Oncology, Dana-Farber Cancer Institute, Boston, MA, USA
Division of Hematology/Oncology, Boston Children’s Hospital, Boston, MA, USA
Broad Institute of MIT and Harvard, Cambridge, MA, USA
doi: 10.1038/s41467-025-57078-0