当前位置: X-MOL 学术J. Comput. Graph. Stat. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Automatic Transformation and Integration to Improve Visualization and Discovery of Latent Effects in Imaging Data
Journal of Computational and Graphical Statistics ( IF 1.4 ) Pub Date : 2020-04-27 , DOI: 10.1080/10618600.2020.1741379
Gregory J Hunt 1 , Mark A Dane 2 , James E Korkola 2 , Laura M Heiser 2 , Johann A Gagnon-Bartsch 3
Affiliation  

Abstract Proper data transformation is an essential part of analysis. Choosing appropriate transformations for variables can enhance visualization, improve efficacy of analytical methods, and increase data interpretability. However, determining appropriate transformations of variables from high-content imaging data poses new challenges. Imaging data produce hundreds of covariates from each of thousands of images in a corpus. Each of these covariates will have a different distribution and needs a potentially different transformation. As such imaging data produce hundreds of covariates, determining an appropriate transformation for each of them is infeasible by hand. In this article, we explore simple, robust, and automatic transformations of high-content image data. A central application of our work is to microenvironment microarray bio-imaging data from the NIH LINCS program. We show that our robust transformations enhance visualization and improve the discovery of substantively relevant latent effects. These transformations enhance analysis of image features individually and also improve data integration approaches when combining together multiple features. We anticipate that the advantages of this work will likely also be realized in the analysis of data from other high-content and highly multiplexed technologies like Cell Painting or Cyclic Immunofluorescence. Software and further analysis can be found at gjhunt.github.io/rr. Supplementary materials for this article are available online.

中文翻译:

自动转换和集成以改进成像数据中潜在影响的可视化和发现

摘要 正确的数据转换是分析的重要组成部分。为变量选择适当的转换可以增强可视化,提高分析方法的效率,并增加数据的可解释性。然而,从高内涵成像数据中确定变量的适当转换提出了新的挑战。成像数据从语料库中的数千幅图像中的每幅图像中产生数百个协变量。这些协变量中的每一个都将具有不同的分布,并且需要进行潜在不同的转换。由于此类成像数据会产生数百个协变量,因此手动确定每个协变量的适当变换是不可行的。在本文中,我们探讨了高内容图像数据的简单、稳健和自动转换。我们工作的一个核心应用是来自 NIH LINCS 计划的微环境微阵列生物成像数据。我们展示了我们稳健的转换增强了可视化并改进了实质性相关潜在效应的发现。这些转换增强了对图像特征的单独分析,并在将多个特征组合在一起时改进了数据集成方法。我们预计这项工作的优势也可能在分析来自其他高含量和高度多重技术(如细胞涂漆或循环免疫荧光)的数据中实现。软件和进一步分析可以在 gjhunt.github.io/rr 找到。本文的补充材料可在线获取。我们展示了我们稳健的转换增强了可视化并改进了实质性相关潜在效应的发现。这些转换增强了对图像特征的单独分析,并在将多个特征组合在一起时改进了数据集成方法。我们预计这项工作的优势也可能在分析来自其他高含量和高度多重技术(如细胞涂漆或循环免疫荧光)的数据中实现。软件和进一步分析可以在 gjhunt.github.io/rr 找到。本文的补充材料可在线获取。我们展示了我们稳健的转换增强了可视化并改进了实质性相关潜在效应的发现。这些转换增强了对图像特征的单独分析,并在将多个特征组合在一起时改进了数据集成方法。我们预计这项工作的优势也可能在分析来自其他高含量和高度多重技术(如细胞涂漆或循环免疫荧光)的数据中实现。软件和进一步分析可以在 gjhunt.github.io/rr 找到。本文的补充材料可在线获取。我们预计这项工作的优势也可能在分析来自其他高含量和高度多重技术(如细胞涂漆或循环免疫荧光)的数据中实现。软件和进一步分析可以在 gjhunt.github.io/rr 找到。本文的补充材料可在线获取。我们预计这项工作的优势也可能在分析来自其他高含量和高度多重技术(如细胞涂漆或循环免疫荧光)的数据中实现。软件和进一步分析可以在 gjhunt.github.io/rr 找到。本文的补充材料可在线获取。
更新日期:2020-04-27
down
wechat
bug