多基因风险评分 (Polygenic Risk Score,PRS) 是一种广泛使用的将遗传信息转化为疾病风险的方法。通常,PRS 表示为个人风险等位基因 (risk allele)的总和,这个总和由从外部 GWAS 获得的效应大小进行加权。现有的PRS 方法【1】往往依赖于复杂性状 (complex traits)的多基因性(polygenicity),并且在输入数据、模型假设、验证程序以及是否包含功能注释 (functional annotations)或多效性信息 (pleiotropic information)方面有所不同。除了遗传风险因素之外,广泛的与健康相关的生物标志物、中间特征、生活方式和环境变量——在本研究中被概括为“暴露” (exposures)——也会影响疾病风险。例如,高体重指数、吸烟、血脂水平和预先存在的 2 型糖尿病 (T2D) 被认为是心血管疾病、呼吸系统疾病和癌症的主要危险因素。鉴于这些通常可以改变的发病率和死亡率风险因素的相关性,暴露信息对于精确预防 (precision prevention)至关重要。然而,即使是常见的暴露数据也不总是能够得到的,尤其是在使用电子健康记录 (electronic health records,EHR) 时。此外,数据也可能出现测量误差、偏差和非随机缺失. 然而,有一些暴露具有可通过全基因组关联分析 (genome-wide association analysis)识别的可遗传成分 (heritable component),因此给我们提供了构建健康相关暴露的多基因风险评分Exposure PRS (ExPRS) 的机会。2022 年9月23日,美国密歇根大学、生物统计系Lars Fritsche/Bhramar Mukherjee和周翔课题组(博士研究生马莹为第一作者)在American Journal of Human Genetics杂志上发表了题为ExPRSweb – An Online Repository with Polygenic Risk Scores for Common Health-related Exposures的研究,构建了常见健康相关暴露的多基因风险评分在线交互式数据库:ExPRSweb。该研究收集了80 多个GWAS 汇总数据(summary statistics), 对密西根基因组 (Michigan Genomics Initiative, MGI)以及英国生物银行 (UK Biobank)数据库中28种暴露形状用四种常见的PRS方法构建了暴露多基因风险评分 (ExPRSs)。该研究证明了这些ExPRSs在全表型关联研究(phenome-wide association studeis, PheWAS)的适用性以及他们作为常见慢性病的预测因子的有效性。特别是,当联合添加多个ExPRS作为预测因子,对于某些慢性病的预测模型和只包含传统的,单一疾病为主的PRS作为预测因子的预测模型相比,其预测能力更高。为了促进后续研究,该课题组将所有构建的ExPRS以及产生的分析结果通过名为ExPRSWeb的在线交互式数据库分享。图一:ExPRSs的构建,评估,和选择流程图
ExPRSs的构建评估和选择流图见图一。该研究通过对从UK Biobank 和其他大型基因银行收集的汇总数据用四种常见的PRS方法建模,并将外部数据分成训练集和测试集对每种模型进行训练和测试,最终得到300多个有统计学意义的可预测疾病风险的ExPRSs。这些ExPRSs包括 21 种连续形状(例如脂质水平相关暴露形状)和7种二分类形状 (例如吸烟、喝酒的暴露情况)的PRSs。在不同PRS方法的评估中,该研究发现这些方法的表现可能也与具体的暴露性状有关。对于MGI数据中遗传度高的形状,例如身高,BMI和HDL,PRS-CS总体表现较好。此外,该研究还评估了不同Exposures 形状之间,不同ExPRSs之间,以及这两者之间的相关关系。结果显示不同ExPRSs之间的相关性和不同Exposure性状之间的相关性高度一致,且相对应的Exposure之间的相关性也都有据可查(例如酯类水平形状之间的高度相关性)。同时这也反映了ExPRS 可以相对较好地复制测量暴露的相关性,因此可能是暴露的合适替代(surrogates),特别是对于测量不可行或者有偏差的数据。另外该研究还进行了大量的基于建立的ExPRS的下游分析,例如将每个Exposure的最优ExPRS作为作PheWAS的预测因子去揭示具有共同遗传成分的表型,从而发现可能从早期干预中受益的疾病。该研究对1685种基于HER数据的表型和构建的最优ExPRS进行了关联分析。结果显示,具有统计学意义的关联数量和强度取决于暴露的影响和遗传度。例如,在MGI数据中,BMI的ExPRS与329个表型相关 (例如肥胖和血压,骨关节病相关表型)而遗传度较低的维生素B-12的ExPRS仅和两个表型相关 (例如皮肤癌)。除了PheWAS分析,该研究还进行了Exclusion-PRS-PheWAS分析来探究以上关联是否是由暴露的个体所驱动。具体结果可见文章【2】。值得一提的是,该研究还用这些构建好的最优ExPRS对27种常见慢性病进行预测。这些常见慢性病包括中风/短暂性脑缺血发作、心力衰竭、肺癌、高血压、慢性肾病、哮喘等。该研究发现利用多个ExPRS构建的联合预测因子比单个ExPRS对慢性病的预测更有效。同时多个ExPRS联合起来对于风险分层(risk stratification)能有更显著的提高,例如对2型糖尿病的风险分层,比值(Odds Ratio,OR)能从单个ExPRS模型的2.55提高到3.33。图二:ExPRSweb平台的构建流程
为了便于以后ExPRS的应用,该团队搭建了ExPRSweb平台 (https://exprsweb.sph.umich.edu:8443),平台搭建流程详见图二。此平台提供了所有可下载的ExPRS,以及交互性可视化结果。总之,该研究从多个层面对暴露多基因风险评分进行了深度探究,其提供的方法比较,ExPRS的应用分析结果将有利于促进PRS在生物医学研究中的应用。原文链接:
https://www.cell.com/ajhg/fulltext/S0002-9297(22)00404-9
制版人:十一
1. Ying Ma and Xiang Zhou. "Genetic prediction of complex traits with polygenic scores: a statistical review." Trends in Genetics 37.11 (2021): 995-1011.
2. Ying Ma, Snehal Patil, Xiang Zhou, Bhramar Mukherjee, Lars G. Fritsche. “ExPRSweb: An online repository with polygenic risk scores for common health-related exposures” The American Journal of Human Genetics (2022)
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。