学术进展丨我院秦国友、余勇夫团队提出高维中介迁移学习方法赋能小样本研究

更新日期:2025/09/16 | 点击数:169

近日,复旦大学公共卫生学院秦国友、余勇夫团队在生物信息学权威期刊《Briefings in Bioinformatics》上在线发表了题为“Transfer learning reveals the mediating mechanisms of cross-ethnic lipid metabolic pathways in the association between APOE gene and Alzheimer's disease.”的研究论文。该研究提出了提出了一种基于迁移学习的高维中介分析框架(TransHDM),为为小样本人群(如少数族裔或罕见病等研究)的疾病机制研究提供了有力的方法学工具。

脂质介导效应在阐明载脂蛋白E基因ε4等位基因(APOE ε4)与阿尔茨海默病(AD)之间的病理联系中至关重要。然而,由于样本量受限,在非裔美国人群体中有关脂质介导机制的实证证据仍然不足。此外,传统的中介分析方法在小样本人群研究中常面临统计功效不足的问题。为此,本文创新性地提出了一个基于迁移学习框架的高维中介分析模型 TransHDM,通过借助大样本“源数据”的信息,显著提升在小样本“目标数据”中识别潜在中介变量的能力。

该方法首先将源数据与目标数据进行联合建模,构建初始高维Lasso回归;随后在目标数据上对初始参数进行微调,以校正源数据与目标数据之间的异质性,并对高维 Lasso 回归的估计偏差进行矫正;最终实现中介效应在数据源间的迁移,从而降低小样本导致的统计偏倚与推断不确定性。模拟结果表明,与传统方法相比,TransHDM 在识别真实中介变量方面显著提高了Power,同时有效控制了多重检验中的FWER。

在阿尔茨海默病神经影像倡议(ADNI)队列的应用中,TransHDM 将来自白人及其他族裔的大规模数据迁移到非裔美国人(目标人群);与迁移前分析相比,TransHDM识别出了更多介导APOE ε4对AD病理进展影响的脂质代谢通路(FDR < 0.05),包括:甘油磷脂代谢、甘油脂代谢、鞘脂代谢和醚脂代谢。总体而言,TransHDM 不仅为小样本人群研究提供了有力的方法学工具,也为未来探索疾病机制与开发疾病预测生物标志物提供了重要启示。

复旦大学公共卫生学院博士生潘璐璐、刘亚航、黄晨为本文共同第一作者,复旦大学公共卫生学院余勇夫教授、复旦大学公共卫生学院秦国友教授为共同通讯作者。该研究得到了国家自然科学基金(82173612;82273730)、上海市青年科技启明星计划(21QA1401300)、上海市自然科学基金(22ZR1414900)、上海三年公共卫生行动计划(GWVI-11.2-XD10;GWVI-11.1-01)、上海市人才计划(BJKJ2024050)和上海市市级科技重大专项(ZD2021CY001)的资助。

 

论文链接:https://academic.oup.com/bib/article/26/5/bbaf460/8252878?login=true