当前位置: X-MOL 学术Knowl. Based Syst. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Hybrid genetic model for clustering ensemble
Knowledge-Based Systems ( IF 7.2 ) Pub Date : 2021-09-02 , DOI: 10.1016/j.knosys.2021.107457
Wenlu Yang 1 , Yinghui Zhang 2 , Hongjun Wang 1 , Ping Deng 1 , Tianrui Li 1
Affiliation  

Clustering ensemble has received considerable research interest and led to a proliferation of studies, since it has great capabilities to combine multiple base clusters to generate a more robust and stable consensus result. Genetic algorithms are optimization methods which can search heuristically by simulating the natural evolution process with highly parallel and adaptive characteristics. However, to our knowledge, there are very few existing methods using a genetic model to solve clustering ensemble problems. In this paper, a novel hybrid genetic model for clustering ensemble (HGMCE) is proposed innovatively, and the corresponding objective function is designed. Each base clustering is regarded as a new attribute of data, and the result of clustering ensemble can be evaluated by the objective function. Then the proposed model can be inferred with the optimization, combination, and transcendence of base clustering results step by step, which makes it possible to maintain the diversity of the population and provides more possibilities to avoid falling into the local optimal solution. Furthermore, an algorithm named HGCEA corresponding to the proposed model is designed to solve the clustering ensemble problem. To evaluate the potential of HGCEA, extensive experiments are carried out on ten real datasets, including comparison with clustering groups and clustering ensemble groups. The results of accuracy and normalized mutual information demonstrate the superiority of the proposed algorithm in integrating effective clustering over the state-of-the-art.



中文翻译:

聚类集成的混合遗传模型

聚类集成已经引起了相当大的研究兴趣并导致了大量研究,因为它具有将多个基础聚类结合起来以产生更强大和更稳定的共识结果的强大能力。遗传算法是一种通过模拟自然进化过程进行启发式搜索的优化方法,具有高度并行和自适应的特点。然而,据我们所知,使用遗传模型来解决聚类集成问题的现有方法很少。本文创新性地提出了一种新的聚类集成混合遗传模型(HGMCE),并设计了相应的目标函数。每个基聚类被视为数据的一个新属性,聚类集成的结果可以通过目标函数进行评估。然后可以通过对基聚类结果的优化、组合和超越逐步推断出所提出的模型,从而可以保持种群的多样性,并为避免陷入局部最优解提供更多的可能性。此外,设计了与所提出的模型对应的名为 HGCEA 的算法来解决聚类集成问题。为了评估 HGCEA 的潜力,在十个真实数据集上进行了大量实验,包括与聚类组和聚类集成组的比较。准确性和归一化互信息的结果证明了所提出的算法在集成有效聚类方面优于现有技术。这使得保持种群的多样性成为可能,并为避免陷入局部最优解提供了更多的可能性。此外,设计了与所提出的模型对应的名为 HGCEA 的算法来解决聚类集成问题。为了评估 HGCEA 的潜力,在十个真实数据集上进行了大量实验,包括与聚类组和聚类集成组的比较。准确性和归一化互信息的结果证明了所提出的算法在集成有效聚类方面优于现有技术。这使得保持种群的多样性成为可能,并为避免陷入局部最优解提供了更多的可能性。此外,设计了与所提出的模型对应的名为 HGCEA 的算法来解决聚类集成问题。为了评估 HGCEA 的潜力,在十个真实数据集上进行了大量实验,包括与聚类组和聚类集成组的比较。准确性和归一化互信息的结果证明了所提出的算法在集成有效聚类方面优于现有技术。与所提出的模型对应的名为 HGCEA 的算法旨在解决聚类集成问题。为了评估 HGCEA 的潜力,在十个真实数据集上进行了大量实验,包括与聚类组和聚类集成组的比较。准确性和归一化互信息的结果证明了所提出的算法在集成有效聚类方面优于现有技术。与所提出的模型对应的名为 HGCEA 的算法旨在解决聚类集成问题。为了评估 HGCEA 的潜力,在十个真实数据集上进行了大量实验,包括与聚类组和聚类集成组的比较。准确性和归一化互信息的结果证明了所提出的算法在集成有效聚类方面优于现有技术。

更新日期:2021-09-08
down
wechat
bug