当前位置: X-MOL 学术Comput. Stat. Data Anal. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Sparse functional principal component analysis in a new regression framework
Computational Statistics & Data Analysis ( IF 1.8 ) Pub Date : 2020-12-01 , DOI: 10.1016/j.csda.2020.107016
Yunlong Nie , Jiguo Cao

Abstract The functional principal component analysis is widely used to explore major sources of variation in a sample of random curves. These major sources of variation are represented by functional principal components (FPCs). The FPCs from the conventional FPCA method are often nonzero in the whole domain, and are hard to interpret in practice. The main focus is to estimate functional principal components (FPCs), which are only nonzero in subregions and are referred to as sparse FPCs. These sparse FPCs not only represent the major variation sources but also can be used to identify the subregions where those major variations exist. The current methods obtain sparse FPCs by adding a penalty term on the length of nonzero regions of FPCs in the conventional eigendecomposition framework. However, these methods become an NP-hard optimization problem. To overcome this issue, a novel regression framework is proposed to estimate FPCs and the corresponding optimization is not NP-hard. The FPCs estimated using the proposed sparse FPCA method is shown to be equivalent to the FPCs using the conventional FPCA method when the sparsity parameter is zero. Simulation studies illustrate that the proposed sparse FPCA method can provide more accurate estimates for FPCs than other available methods when those FPCs are only nonzero in subregions. The proposed method is demonstrated by exploring the major variations among the acceleration rate curves of 107 diesel trucks, where the nonzero regions of the estimated sparse FPCs are found well separated.

中文翻译:

新回归框架中的稀疏函数主成分分析

摘要 泛函主成分分析被广泛用于探索随机曲线样本的主要变异来源。这些主要的变异来源由功能主成分 (FPC) 表示。来自传统 FPCA 方法的 FPC 在整个域中通常是非零的,并且在实践中很难解释。主要重点是估计函数主成分 (FPC),它们仅在子区域中不为零,被称为稀疏 FPC。这些稀疏的 FPC 不仅代表了主要的变异来源,还可以用来识别存在这些主要变异的子区域。当前的方法通过在传统特征分解框架中在 FPC 的非零区域的长度上添加惩罚项来获得稀疏 FPC。然而,这些方法变成了一个 NP-hard 优化问题。为了克服这个问题,提出了一种新的回归框架来估计 FPC,并且相应的优化不是 NP-hard。当稀疏参数为零时,使用所提出的稀疏 FPCA 方法估计的 FPC 与使用传统 FPCA 方法的 FPC 等效。模拟研究表明,当 FPC 仅在子区域中非零时,所提出的稀疏 FPCA 方法可以提供比其他可用方法更准确的 FPC 估计。通过探索 107 辆柴油卡车的加速度曲线之间的主要变化来证明所提出的方法,其中发现估计的稀疏 FPC 的非零区域分离得很好。当稀疏参数为零时,使用所提出的稀疏 FPCA 方法估计的 FPC 与使用传统 FPCA 方法的 FPC 等效。模拟研究表明,当 FPC 仅在子区域中非零时,所提出的稀疏 FPCA 方法可以提供比其他可用方法更准确的 FPC 估计。通过探索 107 辆柴油卡车的加速度曲线之间的主要变化来证明所提出的方法,其中发现估计的稀疏 FPC 的非零区域分离得很好。当稀疏参数为零时,使用所提出的稀疏 FPCA 方法估计的 FPC 与使用传统 FPCA 方法的 FPC 等效。模拟研究表明,当 FPC 仅在子区域中非零时,所提出的稀疏 FPCA 方法可以提供比其他可用方法更准确的 FPC 估计。通过探索 107 辆柴油卡车的加速度曲线之间的主要变化来证明所提出的方法,其中发现估计的稀疏 FPC 的非零区域分离得很好。模拟研究表明,当 FPC 仅在子区域中非零时,所提出的稀疏 FPCA 方法可以提供比其他可用方法更准确的 FPC 估计。通过探索 107 辆柴油卡车的加速度曲线之间的主要变化来证明所提出的方法,其中发现估计的稀疏 FPC 的非零区域分离得很好。模拟研究表明,当 FPC 仅在子区域中非零时,所提出的稀疏 FPCA 方法可以提供比其他可用方法更准确的 FPC 估计。通过探索 107 辆柴油卡车的加速度曲线之间的主要变化来证明所提出的方法,其中发现估计的稀疏 FPC 的非零区域分离得很好。
更新日期:2020-12-01
down
wechat
bug