当前位置: X-MOL 学术Mach. Learn. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Learning representations from dendrograms
Machine Learning ( IF 4.3 ) Pub Date : 2020-08-16 , DOI: 10.1007/s10994-020-05895-3
Morteza Haghir Chehreghani , Mostafa Haghir Chehreghani

We propose unsupervised representation learning and feature extraction from dendrograms. The commonly used Minimax distance measures correspond to building a dendrogram with single linkage criterion, with defining specific forms of a level function and a distance function over that. Therefore, we extend this method to arbitrary dendrograms. We develop a generalized framework wherein different distance measures and representations can be inferred from different types of dendrograms, level functions and distance functions. Via an appropriate embedding, we compute a vector-based representation of the inferred distances, in order to enable many numerical machine learning algorithms to employ such distances. Then, to address the model selection problem, we study the aggregation of different dendrogram-based distances respectively in solution space and in representation space in the spirit of deep representations. In the first approach, for example for the clustering problem, we build a graph with positive and negative edge weights according to the consistency of the clustering labels of different objects among different solutions, in the context of ensemble methods. Then, we use an efficient variant of correlation clustering to produce the final clusters. In the second approach, we investigate the combination of different distances and features sequentially in the spirit of multi-layered architectures to obtain the final features. Finally, we demonstrate the effectiveness of our approach via several numerical studies.

中文翻译:

从树状图中学习表示

我们提出了无监督表示学习和从树状图中提取特征。常用的 Minimax 距离度量对应于构建具有单一链接标准的树状图,并定义特定形式的水平函数和距离函数。因此,我们将此方法扩展到任意树状图。我们开发了一个通用框架,其中可以从不同类型的树状图、水平函数和距离函数中推断出不同的距离度量和表示。通过适当的嵌入,我们计算推断距离的基于向量的表示,以便使许多数值机器学习算法能够使用这样的距离。然后,为了解决模型选择问题,本着深度表示的精神,我们分别在解空间和表示空间中研究了不同的基于树状图的距离的聚合。在第一种方法中,例如对于聚类问题,我们在集成方法的上下文中,根据不同解决方案之间不同对象的聚类标签的一致性,构建具有正负边权重的图。然后,我们使用相关聚类的有效变体来生成最终聚类。在第二种方法中,我们本着多层架构的精神依次研究不同距离和特征的组合,以获得最终特征。最后,我们通过一些数值研究证明了我们方法的有效性。在第一种方法中,例如对于聚类问题,我们在集成方法的上下文中,根据不同解决方案之间不同对象的聚类标签的一致性,构建具有正负边权重的图。然后,我们使用相关聚类的有效变体来生成最终聚类。在第二种方法中,我们本着多层架构的精神依次研究不同距离和特征的组合以获得最终特征。最后,我们通过一些数值研究证明了我们方法的有效性。在第一种方法中,例如对于聚类问题,我们在集成方法的上下文中,根据不同解决方案之间不同对象的聚类标签的一致性,构建具有正负边权重的图。然后,我们使用相关聚类的有效变体来生成最终聚类。在第二种方法中,我们本着多层架构的精神依次研究不同距离和特征的组合以获得最终特征。最后,我们通过一些数值研究证明了我们方法的有效性。然后,我们使用相关聚类的有效变体来生成最终聚类。在第二种方法中,我们本着多层架构的精神依次研究不同距离和特征的组合以获得最终特征。最后,我们通过一些数值研究证明了我们方法的有效性。然后,我们使用相关聚类的有效变体来生成最终聚类。在第二种方法中,我们本着多层架构的精神依次研究不同距离和特征的组合以获得最终特征。最后,我们通过一些数值研究证明了我们方法的有效性。
更新日期:2020-08-16
down
wechat
bug