当前位置: X-MOL 学术J. R. Stat. Soc. Ser. C Appl. Stat. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Structured penalized regression for drug sensitivity prediction
The Journal of the Royal Statistical Society: Series C (Applied Statistics) ( IF 1.0 ) Pub Date : 2020-02-23 , DOI: 10.1111/rssc.12400
Zhi Zhao 1 , Manuela Zucknick 1
Affiliation  

Large‐scale in vitro drug sensitivity screens are an important tool in personalized oncology to predict the effectiveness of potential cancer drugs. The prediction of the sensitivity of cancer cell lines to a panel of drugs is a multivariate regression problem with high dimensional heterogeneous multiomics data as input data and with potentially strong correlations between the outcome variables which represent the sensitivity to the different drugs. We propose a joint penalized regression approach with structured penalty terms which enable us to utilize the correlation structure between drugs with group‐lasso‐type penalties and at the same time address the heterogeneity between ‘omics’ data sources by introducing data‐source‐specific penalty factors to penalize different data sources differently. By combining integrative penalty factors (IPFs) with the tree‐guided group lasso, we create a method called ‘IPF‐tree‐lasso’. We present a unified framework to transform more general IPF‐type methods to the original penalized method. Because the structured penalty terms have multiple parameters, we demonstrate how the interval search ‘Efficient parameter selection via global optimization’ algorithm can be used to optimize multiple penalty parameters efficiently. Simulation studies show that IPF‐tree‐lasso can improve the prediction performance compared with other lasso‐type methods, in particular for heterogeneous sources of data. Finally, we employ the new methods to analyse data from the ‘Genomics of drug sensitivity in cancer’ project.

中文翻译:

预测药物敏感性的结构化惩罚回归

大规模体外药物敏感性筛查是个性化肿瘤学中预测潜在癌症药物有效性的重要工具。癌细胞系对一组药物的敏感性的预测是一个多变量回归问题,具有高维异质多组学数据作为输入数据,并且结果变量之间的潜在强相关性代表了对不同药物的敏感性。我们提出了一种带有结构惩罚条款的联合惩罚回归方法,该方法使我们能够利用具有组套索型惩罚的药物之间的相关结构,同时通过引入特定于数据源的惩罚来解决“组学”数据源之间的异质性惩罚不同数据源的不同因素。通过将综合惩罚因子(IPF)与树引导的组套索结合起来,我们创建了一种称为“ IPF-树套索”的方法。我们提供了一个统一的框架,可以将更多的IPF类型的常规方法转换为原始的惩罚方法。由于结构惩罚项具有多个参数,因此我们演示了如何使用区间搜索“通过全局优化进行有效参数选择”算法来有效地优化多个惩罚参数。仿真研究表明,与其他套索类型方法相比,IPF树套索可以提高预测性能,尤其是对于异构数据源。最后,我们采用新方法来分析“癌症药物敏感性的基因组学”项目中的数据。我们提出了一个统一的框架,可以将更多的IPF类型的常规方法转换为原始的惩罚方法。因为结构化惩罚项具有多个参数,所以我们演示了如何使用区间搜索“通过全局优化进行有效参数选择”算法来有效地优化多个惩罚参数。仿真研究表明,与其他套索类型方法相比,IPF树套索可以提高预测性能,尤其是对于异构数据源。最后,我们采用新方法来分析“癌症药物敏感性的基因组学”项目中的数据。我们提供了一个统一的框架,可以将更多的IPF类型的常规方法转换为原始的惩罚方法。由于结构惩罚项具有多个参数,因此我们演示了如何使用区间搜索“通过全局优化进行有效参数选择”算法来有效地优化多个惩罚参数。仿真研究表明,与其他套索类型方法相比,IPF树套索可以提高预测性能,尤其是对于异构数据源。最后,我们采用新方法来分析“癌症药物敏感性的基因组学”项目中的数据。我们演示了如何使用区间搜索“通过全局优化进行有效参数选择”算法来有效地优化多个惩罚参数。仿真研究表明,与其他套索类型方法相比,IPF树套索可以提高预测性能,尤其是对于异构数据源。最后,我们采用新方法来分析“癌症药物敏感性的基因组学”项目中的数据。我们演示了如何使用区间搜索“通过全局优化进行有效参数选择”算法来有效地优化多个惩罚参数。仿真研究表明,与其他套索类型方法相比,IPF树套索可以提高预测性能,尤其是对于异构数据源。最后,我们采用新方法来分析“癌症药物敏感性的基因组学”项目中的数据。
更新日期:2020-02-23
down
wechat
bug