当前位置: X-MOL 学术medRxiv. Genet. Genom. Med. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Genetic risk score for ovarian cancer based on chromosomal-scale length variation.
medRxiv - Genetic and Genomic Medicine Pub Date : 2020-07-21 , DOI: 10.1101/2020.07.18.20156976
Chris Toh , James P Brody

Introduction. Twin studies indicate that a substantial fraction of ovarian cancers should be predictable from genetic testing. Genetic risk scores can stratify women into different classes of risk. Higher risk women can be treated or screened for ovarian cancer, which should reduce overall death rates due to ovarian cancer. However, current ovarian cancer genetic risk scores, based on SNPs, do not work that well. We developed a genetic risk score based on structural variation, quantified by variations in the length of chromosomes. Methods. We evaluated this genetic risk score using data collected by The Cancer Genome Atlas. From this dataset, we synthesized a dataset of 414 women who had ovarian serous carcinoma and 4225 women who had no form of ovarian cancer. We characterized each woman by 22 numbers, representing the length of each chromosome in their germ line DNA. We used a gradient boosting machine, a machine learning algorithm, to build a classifier that can predict whether a woman had been diagnosed with ovarian cancer in this dataset. Results. The genetic risk score based on chromosomal-scale length variation could stratify women such that the highest 20% had a 160x risk (95% confidence interval 50x-450x) compared to the lowest 20%. The genetic risk score we developed had an area under the curve of the receiver operating characteristic curve of 0.88 (estimated 95% confidence interval 0.86-0.91). Conclusion. A genetic risk score based on chromosomal-scale length variation of germ line DNA provides an effective means of predicting whether or not a woman will develop ovarian cancer.

中文翻译:

基于染色体尺度长度变化的卵巢癌遗传风险评分。

介绍。两项研究表明,从基因检测中可以预测到很大一部分卵巢癌。遗传风险评分可以将妇女分为不同类别的风险。可以对较高风险的妇女进行卵巢癌的治疗或筛查,这应降低由于卵巢癌引起的总死亡率。但是,当前基于SNP的卵巢癌遗传风险评分效果不佳。我们根据结构变异建立了遗传风险评分,并通过染色体长度的变异来量化。方法。我们使用癌症基因组图谱收集的数据评估了这种遗传风险评分。从该数据集中,我们合成了414个患有卵巢浆液性癌的女性和4225个没有卵巢癌的女性的数据集。我们用22个数字来描述每个女人,代表其种系DNA中每个染色体的长度。我们使用梯度提升机(一种机器学习算法)来构建分类器,该分类器可以预测该数据集中是否已诊断出患有卵巢癌的女性。结果。基于染色体尺度长度变化的遗传风险评分可以对女性进行分层,使得最高的20%的女性具有160倍的风险(95%的置信区间50x-450x),而最低的20%。我们开发的遗传风险评分在接受者操作特征曲线的曲线下面积为0.88(估计95%置信区间0.86-0.91)。结论。基于种系DNA染色体尺度长度变化的遗传风险评分为预测女性是否会患卵巢癌提供了有效的手段。机器学习算法,以建立可以预测此数据集中是否已诊断出卵巢癌的分类器。结果。基于染色体尺度长度变化的遗传风险评分可以对女性进行分层,使得最高的20%的女性具有160倍的风险(95%的置信区间50x-450x),而最低的20%。我们开发的遗传风险评分在接受者操作特征曲线的曲线下面积为0.88(估计95%置信区间0.86-0.91)。结论。基于种系DNA染色体尺度长度变化的遗传风险评分为预测女性是否会患卵巢癌提供了有效的手段。机器学习算法,以建立可以预测此数据集中是否已诊断出卵巢癌的分类器。结果。基于染色体尺度长度变化的遗传风险评分可以对女性进行分层,使得最高的20%的女性具有160倍的风险(95%的置信区间50x-450x),而最低的20%。我们开发的遗传风险评分在接受者操作特征曲线的曲线下面积为0.88(估计95%置信区间0.86-0.91)。结论。基于种系DNA染色体尺度长度变化的遗传风险评分为预测女性是否会患卵巢癌提供了有效的手段。基于染色体尺度长度变化的遗传风险评分可以对女性进行分层,使得最高的20%的女性具有160倍的风险(95%的置信区间50x-450x),而最低的20%。我们开发的遗传风险评分在接受者操作特征曲线的曲线下面积为0.88(估计95%置信区间0.86-0.91)。结论。基于种系DNA染色体尺度长度变化的遗传风险评分为预测女性是否会患卵巢癌提供了有效的手段。基于染色体尺度长度变化的遗传风险评分可以对女性进行分层,使得最高的20%的女性具有160倍的风险(95%的置信区间50x-450x),而最低的20%。我们制定的遗传风险评分在接受者工作特征曲线的曲线下面积为0.88(估计的95%置信区间为0.86-0.91)。结论。基于种系DNA染色体尺度长度变化的遗传风险评分为预测女性是否会患卵巢癌提供了有效的手段。88(估计95%置信区间0.86-0.91)。结论。基于种系DNA染色体尺度长度变化的遗传风险评分为预测女性是否会患卵巢癌提供了有效的手段。88(估计95%置信区间0.86-0.91)。结论。基于种系DNA染色体尺度长度变化的遗传风险评分为预测女性是否会患卵巢癌提供了有效的手段。
更新日期:2020-07-21
down
wechat
bug