当前位置: X-MOL 学术Data Min. Knowl. Discov. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Mining full, inner and tail periodic patterns with perfect, imperfect and asynchronous periodicity simultaneously
Data Mining and Knowledge Discovery ( IF 4.8 ) Pub Date : 2021-04-05 , DOI: 10.1007/s10618-021-00753-9
Jen-Wei Huang , Bijay Prasad Jaysawal , Cheng-Chung Wang

Periodic pattern has been utilized in many real life applications, such as weather conditions in a particular season, transactions in a superstore, power consumption, computer network fault analysis, and analysis of DNA and protein sequences. Periodic pattern mining is a popular though challenging research field in data mining because periodic patterns are of different types (namely full, inner, and tail patterns) and varied periodicities (namely perfect, imperfect, and asynchronous periodicity). Previous periodic pattern mining methods have some disadvantages: (1) Previous methods have to find different patterns separately; (2) They require postprocessing such as level-by-level join strategies for mining complex periodic patterns which have wildcards between two items. They cannot mine full, tail, and inner periodic patterns with perfect, imperfect, and asynchronous periodicities simultaneously. Therefore, an effective and comprehensive approach capable of discovering the above specified kinds of periodic patterns is needed. We propose a novel suffix tree-based algorithm, Mining dIfferent kinds of Periodic Patterns Simultaneously, MIPPS, to address the above issues. MIPPS finds different kinds of periodic patterns with different periodicities simultaneously without level-by-level join techniques using a novel incremental propagation generator. In addition, MIPPS mines periodic patterns efficiently using some pruning strategies. For the performance evaluation, we use both synthetic and real data to confirm good performance and scalability with complex periodic patterns.



中文翻译:

同时以完美,不完美和异步周期挖掘完整,内部和尾部周期模式

周期性模式已用于许多现实生活中,例如特定季节的天气状况,大型商店中的交易,功耗,计算机网络故障分析以及DNA和蛋白质序列分析。周期性模式挖掘是数据挖掘中一个颇受欢迎但具有挑战性的研究领域,因为周期性模式具有不同的类型(即完全,内部和尾部模式)和变化的周期性(即完美,不完美和异步周期性)。先前的周期性模式挖掘方法具有一些缺点:(1)先前的方法必须分别查找不同的模式;(2)它们需要后处理,例如逐级联接策略,以挖掘在两个项目之间具有通配符的复杂周期模式。他们无法完美地挖掘完整的,尾部的和内部的周期性模式,不完美,并且异步周期同时发生。因此,需要一种能够发现上述指定种类的周期性模式的有效且全面的方法。我们提出了一种新颖的基于后缀树的算法,即同时挖掘不同种类的周期模式MIPPS,以解决上述问题。MIPPS无需使用新颖的增量传播生成器的逐级连接技术,即可同时找到具有不同周期性的不同类型的周期性模式。此外,MIPPS使用一些修剪策略可以有效地挖掘周期性模式。对于性能评估,我们使用综合数据和真实数据来确认具有复杂周期模式的良好性能和可伸缩性。需要一种能够发现上述指定种类的周期性模式的有效且全面的方法。我们提出了一种新颖的基于后缀树的算法,即同时挖掘不同种类的周期模式MIPPS,以解决上述问题。MIPPS无需使用新颖的增量传播生成器的逐级连接技术,即可同时找到具有不同周期性的不同类型的周期性模式。此外,MIPPS使用一些修剪策略可以有效地挖掘周期性模式。对于性能评估,我们使用综合数据和真实数据来确认具有复杂周期模式的良好性能和可伸缩性。需要一种能够发现上述指定种类的周期性模式的有效且全面的方法。我们提出了一种新颖的基于后缀树的算法,即同时挖掘不同种类的周期模式MIPPS,以解决上述问题。MIPPS无需使用新颖的增量传播生成器的逐级连接技术,即可同时找到具有不同周期性的不同类型的周期性模式。此外,MIPPS使用一些修剪策略可以有效地挖掘周期性模式。对于性能评估,我们使用综合数据和真实数据来确认具有复杂周期模式的良好性能和可伸缩性。解决以上问题。MIPPS无需使用新颖的增量传播生成器的逐级连接技术,即可同时找到具有不同周期性的不同类型的周期性模式。此外,MIPPS使用一些修剪策略可以有效地挖掘周期性模式。对于性能评估,我们使用综合数据和真实数据来确认具有复杂周期模式的良好性能和可伸缩性。解决以上问题。MIPPS无需使用新颖的增量传播生成器的逐级连接技术,即可同时找到具有不同周期性的不同类型的周期性模式。此外,MIPPS使用一些修剪策略可以有效地挖掘周期性模式。对于性能评估,我们使用综合数据和真实数据来确认具有复杂周期模式的良好性能和可伸缩性。

更新日期:2021-04-06
down
wechat
bug