当前位置: X-MOL 学术Bioinformatics › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Joint eQTL mapping and inference of gene regulatory network improves power of detecting both cis- and trans-eQTLs
Bioinformatics ( IF 4.4 ) Pub Date : 2021-09-06 , DOI: 10.1093/bioinformatics/btab609
Xin Zhou 1 , Xiaodong Cai 1
Affiliation  

Motivation Genetic variations of expression quantitative trait loci (eQTLs) play a critical role in influencing complex traits and diseases development. Two main factors that affect the statistical power of detecting eQTLs are: (i) relatively small size of samples available, and (ii) heavy burden of multiple testing due to a very large number of variants to be tested. The later issue is particularly severe when one tries to identify trans-eQTLs that are far away from the genes they influence. If one can exploit co-expressed genes jointly in eQTL-mapping, effective sample size can be increased. Furthermore, using the structure of the gene regulatory network (GRN) may help to identify trans-eQTLs without increasing multiple testing burden. Results In this article, we use the structure equation model (SEM) to model both GRN and effect of eQTLs on gene expression, and then develop a novel algorithm, named sparse SEM for eQTL mapping (SSEMQ), to conduct joint eQTL mapping and GRN inference. The SEM can exploit co-expressed genes jointly in eQTL mapping and also use GRN to determine trans-eQTLs. Computer simulations demonstrate that our SSEMQ significantly outperforms nine existing eQTL mapping methods. SSEMQ is further used to analyze two real datasets of human breast and whole blood tissues, yielding a number of cis- and trans-eQTLs. Availability and implementation R package ssemQr is available at https://github.com/Ivis4ml/ssemQr.git. Supplementary information Supplementary data are available at Bioinformatics online.

中文翻译:

基因调控网络的联合 eQTL 作图和推断提高了检测顺式和反式 eQTL 的能力

动机 表达数量性状基因座 (eQTL) 的遗传变异在影响复杂性状和疾病发展中起着关键作用。影响检测 eQTL 统计能力的两个主要因素是:(i) 可用样本相对较小,以及 (ii) 由于要测试的变体数量非常多,多重测试的负担很重。当人们试图识别远离它们影响的基因的反式 eQTL 时,后一个问题尤为严重。如果可以在 eQTL 定位中联合利用共表达基因,则可以增加有效样本量。此外,使用基因调控网络 (GRN) 的结构可能有助于在不增加多重测试负担的情况下识别反式 eQTL。结果在这篇文章中,我们使用结构方程模型 (SEM) 对 GRN 和 eQTL 对基因表达的影响进行建模,然后开发了一种名为稀疏 SEM for eQTL 作图 (SSEMQ) 的新算法,以进行联合 eQTL 作图和 GRN 推断。SEM 可以在 eQTL 作图中联合利用共表达基因,也可以使用 GRN 来确定反式 eQTL。计算机模拟表明我们的 SSEMQ 明显优于现有的九种 eQTL 映射方法。SSEMQ 进一步用于分析人类乳腺和全血组织的两个真实数据集,产生了许多顺式和反式 eQTL。可用性和实施​​ R 包 ssemQr 可在 https://github.com/Ivis4ml/ssemQr.git 获得。补充信息 补充数据可在 Bioinformatics 在线获取。进行联合 eQTL 作图和 GRN 推断。SEM 可以在 eQTL 作图中联合利用共表达基因,也可以使用 GRN 来确定反式 eQTL。计算机模拟表明我们的 SSEMQ 明显优于现有的九种 eQTL 映射方法。SSEMQ 进一步用于分析人类乳腺和全血组织的两个真实数据集,产生了许多顺式和反式 eQTL。可用性和实施​​ R 包 ssemQr 可在 https://github.com/Ivis4ml/ssemQr.git 获得。补充信息 补充数据可在 Bioinformatics 在线获取。进行联合 eQTL 作图和 GRN 推断。SEM 可以在 eQTL 作图中联合利用共表达基因,也可以使用 GRN 来确定反式 eQTL。计算机模拟表明我们的 SSEMQ 明显优于现有的九种 eQTL 映射方法。SSEMQ 进一步用于分析人类乳腺和全血组织的两个真实数据集,产生了许多顺式和反式 eQTL。可用性和实施​​ R 包 ssemQr 可在 https://github.com/Ivis4ml/ssemQr.git 获得。补充信息 补充数据可在 Bioinformatics 在线获取。SSEMQ 进一步用于分析人类乳腺和全血组织的两个真实数据集,产生了许多顺式和反式 eQTL。可用性和实施​​ R 包 ssemQr 可在 https://github.com/Ivis4ml/ssemQr.git 获得。补充信息 补充数据可在 Bioinformatics 在线获取。SSEMQ 进一步用于分析人类乳腺和全血组织的两个真实数据集,产生了许多顺式和反式 eQTL。可用性和实施​​ R 包 ssemQr 可在 https://github.com/Ivis4ml/ssemQr.git 获得。补充信息 补充数据可在 Bioinformatics 在线获取。
更新日期:2021-09-06
down
wechat
bug