当前位置: X-MOL 学术Data Min. Knowl. Discov. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Credible seed identification for large-scale structural network alignment
Data Mining and Knowledge Discovery ( IF 4.8 ) Pub Date : 2020-07-03 , DOI: 10.1007/s10618-020-00699-4
Chenxu Wang , Yang Wang , Zhiyuan Zhao , Dong Qin , Xiapu Luo , Tao Qin

Structural network alignment utilizes the topological structure information to find correspondences between nodes of two networks. Researchers have proposed a line of useful algorithms which usually require a prior mapping of seeds acting as landmark points to align the rest nodes. Several seed-free algorithms are developed to solve the cold-start problem. However, existing approaches suffer high computational cost and low reliability, limiting their applications to large-scale network alignment. Moreover, there is a lack of useful metrics to quantify the credibility of seed mappings. To address these issues, we propose a credible seed identification framework and develop a metric to assess the reliability of a mapping. To tackle the cold-start problem, we employ graph embedding techniques to represent nodes by structural feature vectors in a latent space. We then leverage point set registration algorithms to match nodes algebraically and obtain an initial mapping of nodes. Besides, we propose a heuristic algorithm to improve the credibility of the initial mapping by filtering out mismatched node pairs. To tackle the computational problem in large-scale network alignment, we propose a divide-and-conquer scheme to divide large networks into smaller ones and then match them individually. It significantly improves the recall of mapping results. Finally, we conduct extensive experiments to evaluate the effectiveness and efficiency of our new approach. The results illustrate that the proposed method outperforms the state-of-the-art approaches in terms of both effectiveness and efficiency.



中文翻译:

可靠的种子识别,用于大规模结构网络对齐

结构网络对齐利用拓扑结构信息来查找两个网络的节点之间的对应关系。研究人员提出了一系列有用的算法,这些算法通常需要事先对充当界标点的种子进行映射以对齐其余节点。开发了几种无种子算法来解决冷启动问题。然而,现有方法遭受高计算成本和低可靠性,从而将其应用限制于大规模网络对准。此外,缺乏有用的指标来量化种子映射的可信度。为了解决这些问题,我们提出了一个可靠的种子识别框架并开发了一种评估制图可靠性的指标。为了解决冷启动问题,我们采用图嵌入技术通过潜在空间中的结构特征向量来表示节点。然后,我们利用点集注册算法以代数方式匹配节点并获得节点的初始映射。此外,我们提出了一种启发式算法,通过滤除不匹配的节点对来提高初始映射的可信度。为了解决大规模网络对准中的计算问题,我们提出了一种分而治之的方案,将大型网络分为较小的网络,然后分别进行匹配。它显着提高了映射结果的查全率。最后,我们进行了广泛的实验,以评估新方法的有效性和效率。结果表明,该方法在有效性和效率方面均优于最新方法。然后,我们利用点集注册算法以代数方式匹配节点并获得节点的初始映射。此外,我们提出了一种启发式算法,通过滤除不匹配的节点对来提高初始映射的可信度。为了解决大规模网络对准中的计算问题,我们提出了一种分而治之的方案,将大型网络分为较小的网络,然后分别进行匹配。它显着提高了映射结果的查全率。最后,我们进行了广泛的实验,以评估新方法的有效性和效率。结果表明,该方法在有效性和效率方面均优于最新方法。然后,我们利用点集注册算法以代数方式匹配节点并获得节点的初始映射。此外,我们提出了一种启发式算法,通过滤除不匹配的节点对来提高初始映射的可信度。为了解决大规模网络对准中的计算问题,我们提出了一种分而治之的方案,将大型网络分为较小的网络,然后分别进行匹配。它显着提高了映射结果的查全率。最后,我们进行了广泛的实验,以评估新方法的有效性和效率。结果表明,该方法在有效性和效率方面均优于最新方法。此外,我们提出了一种启发式算法,通过滤除不匹配的节点对来提高初始映射的可信度。为了解决大规模网络对准中的计算问题,我们提出了一种分而治之的方案,将大型网络分为较小的网络,然后分别进行匹配。它显着提高了映射结果的查全率。最后,我们进行了广泛的实验,以评估新方法的有效性和效率。结果表明,该方法在有效性和效率方面均优于最新方法。此外,我们提出了一种启发式算法,通过滤除不匹配的节点对来提高初始映射的可信度。为了解决大规模网络对准中的计算问题,我们提出了一种分而治之的方案,将大型网络分为较小的网络,然后分别进行匹配。它显着提高了映射结果的查全率。最后,我们进行了广泛的实验,以评估新方法的有效性和效率。结果表明,该方法在有效性和效率上都优于最新方法。我们提出了一种分而治之的方案,将大型网络分成较小的网络,然后分别进行匹配。它显着提高了映射结果的查全率。最后,我们进行了广泛的实验,以评估新方法的有效性和效率。结果表明,该方法在有效性和效率上都优于最新方法。我们提出了一种分而治之的方案,将大型网络分成较小的网络,然后分别进行匹配。它显着提高了映射结果的查全率。最后,我们进行了广泛的实验,以评估新方法的有效性和效率。结果表明,该方法在有效性和效率方面均优于最新方法。

更新日期:2020-07-03
down
wechat
bug