当前位置:
X-MOL 学术
›
arXiv.eess.SP
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
Bounded Simplex-Structured Matrix Factorization
arXiv - EE - Signal Processing Pub Date : 2022-09-26 , DOI: arxiv-2209.12638 Olivier Vu Thanh, Nicolas Gillis, Fabian Lecron
arXiv - EE - Signal Processing Pub Date : 2022-09-26 , DOI: arxiv-2209.12638 Olivier Vu Thanh, Nicolas Gillis, Fabian Lecron
In this paper, we propose a new low-rank matrix factorization model dubbed
bounded simplex-structured matrix factorization (BSSMF). Given an input matrix
$X$ and a factorization rank $r$, BSSMF looks for a matrix $W$ with $r$ columns
and a matrix $H$ with $r$ rows such that $X \approx WH$ where the entries in
each column of $W$ are bounded, that is, they belong to given intervals, and
the columns of $H$ belong to the probability simplex, that is, $H$ is column
stochastic. BSSMF generalizes nonnegative matrix factorization (NMF), and
simplex-structured matrix factorization (SSMF). BSSMF is particularly well
suited when the entries of the input matrix $X$ belong to a given interval; for
example when the rows of $X$ represent images, or $X$ is a rating matrix such
as in the Netflix and MovieLens data sets where the entries of $X$ belong to
the interval $[1,5]$. The simplex-structured matrix $H$ not only leads to an
easily understandable decomposition providing a soft clustering of the columns
of $X$, but implies that the entries of each column of $WH$ belong to the same
intervals as the columns of $W$. In this paper, we first propose a fast
algorithm for BSSMF, even in the presence of missing data in $X$. Then we
provide identifiability conditions for BSSMF, that is, we provide conditions
under which BSSMF admits a unique decomposition, up to trivial ambiguities.
Finally, we illustrate the effectiveness of BSSMF on two applications:
extraction of features in a set of images, and the matrix completion problem
for recommender systems.
中文翻译:
有界单纯形结构矩阵分解
在本文中,我们提出了一种新的低秩矩阵分解模型,称为有界单纯形结构矩阵分解(BSSMF)。给定一个输入矩阵 $X$ 和一个分解秩 $r$,BSSMF 查找具有 $r$ 列的矩阵 $W$ 和具有 $r$ 行的矩阵 $H$,使得$W$的每一列都是有界的,即它们属于给定的区间,$H$的列属于概率单纯形,即$H$是列随机的。BSSMF 概括了非负矩阵分解 (NMF) 和单纯形结构矩阵分解 (SSMF)。BSSMF 特别适用于输入矩阵 $X$ 的条目属于给定区间时;例如,当 $X$ 的行代表图像时,或者 $X$ 是一个评级矩阵,例如在 Netflix 和 MovieLens 数据集中,其中 $X$ 的条目属于区间 $[1,5]$。单纯形结构矩阵 $H$ 不仅导致易于理解的分解,提供 $X$ 列的软聚类,而且暗示 $WH$ 的每一列的条目与 $ 的列属于相同的区间美元。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。单纯形结构矩阵 $H$ 不仅导致易于理解的分解,提供 $X$ 列的软聚类,而且暗示 $WH$ 的每一列的条目与 $ 的列属于相同的区间美元。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。单纯形结构矩阵 $H$ 不仅导致易于理解的分解,提供 $X$ 列的软聚类,而且暗示 $WH$ 的每一列的条目与 $ 的列属于相同的区间美元。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。但暗示$WH$ 的每一列的条目与$W$ 的列属于相同的区间。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。但暗示$WH$ 的每一列的条目与$W$ 的列属于相同的区间。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。
更新日期:2022-09-27
中文翻译:
有界单纯形结构矩阵分解
在本文中,我们提出了一种新的低秩矩阵分解模型,称为有界单纯形结构矩阵分解(BSSMF)。给定一个输入矩阵 $X$ 和一个分解秩 $r$,BSSMF 查找具有 $r$ 列的矩阵 $W$ 和具有 $r$ 行的矩阵 $H$,使得$W$的每一列都是有界的,即它们属于给定的区间,$H$的列属于概率单纯形,即$H$是列随机的。BSSMF 概括了非负矩阵分解 (NMF) 和单纯形结构矩阵分解 (SSMF)。BSSMF 特别适用于输入矩阵 $X$ 的条目属于给定区间时;例如,当 $X$ 的行代表图像时,或者 $X$ 是一个评级矩阵,例如在 Netflix 和 MovieLens 数据集中,其中 $X$ 的条目属于区间 $[1,5]$。单纯形结构矩阵 $H$ 不仅导致易于理解的分解,提供 $X$ 列的软聚类,而且暗示 $WH$ 的每一列的条目与 $ 的列属于相同的区间美元。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。单纯形结构矩阵 $H$ 不仅导致易于理解的分解,提供 $X$ 列的软聚类,而且暗示 $WH$ 的每一列的条目与 $ 的列属于相同的区间美元。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。单纯形结构矩阵 $H$ 不仅导致易于理解的分解,提供 $X$ 列的软聚类,而且暗示 $WH$ 的每一列的条目与 $ 的列属于相同的区间美元。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。但暗示$WH$ 的每一列的条目与$W$ 的列属于相同的区间。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。但暗示$WH$ 的每一列的条目与$W$ 的列属于相同的区间。在本文中,我们首先提出了一种快速的 BSSMF 算法,即使在 $X$ 中存在缺失数据的情况下也是如此。然后我们为 BSSMF 提供可识别性条件,也就是说,我们提供 BSSMF 允许唯一分解的条件,直到微不足道的歧义。最后,我们说明了 BSSMF 在两个应用中的有效性:一组图像中的特征提取,以及推荐系统的矩阵补全问题。