当前位置: X-MOL 学术BMC Med. Genomics › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Optimized homomorphic encryption solution for secure genome-wide association studies.
BMC Medical Genomics ( IF 2.7 ) Pub Date : 2020-07-21 , DOI: 10.1186/s12920-020-0719-9
Marcelo Blatt 1 , Alexander Gusev 1, 2 , Yuriy Polyakov 1 , Kurt Rohloff 1 , Vinod Vaikuntanathan 1
Affiliation  

Genome-Wide Association Studies (GWAS) refer to observational studies of a genome-wide set of genetic variants across many individuals to see if any genetic variants are associated with a certain trait. A typical GWAS analysis of a disease phenotype involves iterative logistic regression of a case/control phenotype on a single-neuclotide polymorphism (SNP) with quantitative covariates. GWAS have been a highly successful approach for identifying genetic-variant associations with many poorly-understood diseases. However, a major limitation of GWAS is the dependence on individual-level genotype/phenotype data and the corresponding privacy concerns. We present a solution for secure GWAS using homomorphic encryption (HE) that keeps all individual data encrypted throughout the association study. Our solution is based on an optimized semi-parallel GWAS compute model, a new Residue-Number-System (RNS) variant of the Cheon-Kim-Kim-Song (CKKS) HE scheme, novel techniques to switch between data encodings, and more than a dozen crypto-engineering optimizations. Our prototype can perform the full GWAS computation for 1,000 individuals, 131,071 SNPs, and 3 covariates in about 10 minutes on a modern server computing node (with 28 cores). Our solution for a smaller dataset was awarded co-first place in iDASH’18 Track 2: “Secure Parallel Genome Wide Association Studies using HE”. Many of the HE optimizations presented in our paper are general-purpose, and can be used in solving challenging problems with large datasets in other application domains.

中文翻译:

优化的同态加密解决方案,用于安全的全基因组关联研究。

全基因组关联研究(GWAS)是指对许多个体进行全基因组范围的遗传变异的观察性研究,以查看是否有任何遗传变异与某个性状相关。疾病表型的典型GWAS分析涉及具有定量协变量的单神经肽多态性(SNP)上病例/对照表型的迭代逻辑回归。GWAS是一种非常成功的方法,可用于识别与许多认识不足的疾病的遗传变异关联。但是,GWAS的主要局限性是对个体水平基因型/表型数据的依赖以及相应的隐私问题。我们提供了一种使用同态加密(HE)的安全GWAS的解决方案,该解决方案在整个关联研究过程中对所有单个数据进行加密。我们的解决方案基于优化的半并行GWAS计算模型,Cheon-Kim-Kim-Song(CKKS)HE方案的新残数系统(RNS)变体,在数据编码之间切换的新颖技术等等超过十二种加密工程优化。我们的原型可以在一个现代的服务器计算节点(具有28个核)上,在大约10分钟内为1,000个人,131,071个SNP和3个协变量执行完整的GWAS计算。我们针对较小数据集的解决方案在iDASH'18 Track 2:“使用HE进行安全的平行基因组广泛关联研究”中获得共同第一名。本文中介绍的许多HE优化都是通用的,可用于解决其他应用领域中大型数据集的难题。可以在数据编码之间进行切换的新颖技术,以及十多种加密工程优化。我们的原型可以在一个现代的服务器计算节点(具有28个核)上,在大约10分钟内为1,000个人,131,071个SNP和3个协变量执行完整的GWAS计算。我们针对较小数据集的解决方案在iDASH'18 Track 2:“使用HE进行安全的平行基因组广泛关联研究”中获得共同第一名。本文中介绍的许多HE优化都是通用的,可用于解决其他应用领域中大型数据集的难题。可以在数据编码之间进行切换的新颖技术,以及十多种加密工程优化。我们的原型可以在一个现代的服务器计算节点(具有28个核)上,在大约10分钟内为1,000个人,131,071个SNP和3个协变量执行完整的GWAS计算。我们针对较小数据集的解决方案在iDASH'18 Track 2:“使用HE进行安全的平行基因组广泛关联研究”中获得共同第一名。本文中介绍的许多HE优化都是通用的,可用于解决其他应用领域中大型数据集的难题。和3个变量在现代服务器计算节点(具有28个内核)上约需10分钟。我们针对较小数据集的解决方案在iDASH'18 Track 2:“使用HE进行安全的平行基因组广泛关联研究”中获得共同第一名。本文中介绍的许多HE优化都是通用的,可用于解决其他应用领域中大型数据集的难题。和3个变量在现代服务器计算节点(具有28个内核)上约需10分钟。我们针对较小数据集的解决方案在iDASH'18 Track 2:“使用HE进行安全的平行基因组广泛关联研究”中获得共同第一名。本文中介绍的许多HE优化都是通用的,可用于解决其他应用领域中大型数据集的难题。
更新日期:2020-07-21
down
wechat
bug