当前位置: X-MOL 学术Stat. Sin. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Covariance-engaged Classification of Sets via Linear Programming
Statistica Sinica ( IF 1.5 ) Pub Date : 2022-01-01 , DOI: 10.5705/ss.202020.0253
Zhao Ren , Sungkyu Jung , Xingye Qiao

Set classification aims to classify a set of observations as a whole, as opposed to classifying individual observations separately. To formally understand the unfamiliar concept of binary set classification, we first investigate the optimal decision rule under the normal distribution, which utilizes the empirical covariance of the set to be classified. We show that the number of observations in the set plays a critical role in bounding the Bayes risk. Under this framework, we further propose new methods of set classification. For the case where only a few parameters of the model drive the difference between two classes, we propose a computationally-efficient approach to parameter estimation using linear programming, leading to the Covariance-engaged LInear Programming Set (CLIPS) classifier. Its theoretical properties are investigated for both independent case and various (short-range and long-range dependent) time series structures among observations within each set. The convergence rates of estimation errors and risk of the CLIPS classifier are established to show that having multiple observations in a set leads to faster convergence rates, compared to the standard classification situation in which there is only one observation in the set. The applicable domains in which the CLIPS performs better than competitors are highlighted in a comprehensive simulation study. Finally, we illustrate the usefulness of the proposed methods in classification of real image data in histopathology.

中文翻译:

通过线性规划对集合进行协方差分类

集合分类旨在将一组观察作为一个整体进行分类,而不是单独对单个观察进行分类。为了正式理解二元集分类这个陌生的概念,我们首先研究正态分布下的最优决策规则,它利用了待分类集的经验协方差。我们表明集合中的观察数量在限制贝叶斯风险方面起着关键作用。在这个框架下,我们进一步提出了新的集合分类方法。对于模型中只有少数参数导致两个类别之间存在差异的情况,我们提出了一种使用线性规划的计算效率高的参数估计方法,从而产生了协方差参与线性规划集 (CLIPS) 分类器。研究了每个集合内观测值之间的独立情况和各种(短程和长程相关)时间序列结构的理论特性。CLIPS 分类器的估计误差和风险的收敛率被建立以表明与集合中只有一个观测值的标准分类情况相比,在一个集合中有多个观测值会导致更快的收敛速度。综合模拟研究强调了 CLIPS 比竞争对手表现更好的适用领域。最后,我们说明了所提出的方法在组织病理学中真实图像数据分类中的有用性。CLIPS 分类器的估计误差和风险的收敛率被建立以表明与集合中只有一个观测值的标准分类情况相比,在一个集合中有多个观测值会导致更快的收敛速度。综合模拟研究强调了 CLIPS 比竞争对手表现更好的适用领域。最后,我们说明了所提出的方法在组织病理学中真实图像数据分类中的有用性。CLIPS 分类器的估计误差和风险的收敛率被建立以表明与集合中只有一个观测值的标准分类情况相比,在一个集合中有多个观测值会导致更快的收敛速度。在综合模拟研究中突出显示了 CLIPS 比竞争对手表现更好的适用领域。最后,我们说明了所提出的方法在组织病理学中真实图像数据分类中的有用性。综合模拟研究强调了 CLIPS 比竞争对手表现更好的适用领域。最后,我们说明了所提出的方法在组织病理学中真实图像数据分类中的有用性。在综合模拟研究中突出显示了 CLIPS 比竞争对手表现更好的适用领域。最后,我们说明了所提出的方法在组织病理学中真实图像数据分类中的有用性。
更新日期:2022-01-01
down
wechat
bug