当前位置: X-MOL 学术Eng. Appl. Artif. Intell. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Erasable pattern mining based on tree structures with damped window over data streams
Engineering Applications of Artificial Intelligence ( IF 7.5 ) Pub Date : 2020-06-12 , DOI: 10.1016/j.engappai.2020.103735
Yoonji Baek , Unil Yun , Heonho Kim , Hyoju Nam , Gangin Lee , Eunchul Yoon , Bay Vo , Jerry Chun-Wei Lin

Several pattern mining methods have been proposed to process dynamic data streams because the data generated in industrial fields is continually accumulated. Erasable pattern mining techniques for processing dynamic data streams are needed to discover erasable patterns from dynamic data streams. In previous erasable pattern mining approaches suggested for dynamic data streams, all data are considered to have the same importance regardless of its timestamp. However, dynamic data streams have the characteristic that the new data is relatively more significant than the old data. In erasable pattern mining, one of the desired techniques is an approach in consideration of such characteristic of data streams. For this reason, we propose an erasable pattern mining algorithm over dynamic data streams based on the damped window model. Since the suggested technique considers the new data more important than the previous data, it can find more useful erasable patterns. In addition, erasable pattern mining based on the damped window model is conducted efficiently by employing the tree and table structures. In performance test, we present that our pruning techniques remove unnecessary operations related to invalid erasable patterns efficiently from damped-window-based data streams. Performance evaluation results using real datasets and synthetic datasets show that the proposed approach has good performance with regard to as execution time, pattern generation, and scalability by comparing between the suggested technique and the state of the art algorithms.



中文翻译:

基于树结构的阻尼模式挖掘

已经提出了几种模式挖掘方法来处理动态数据流,因为在工业领域中产生的数据是不断累积的。需要用于处理动态数据流的可擦除模式挖掘技术,以从动态数据流中发现可擦除模式。在为动态数据流建议的以前的可擦除模式挖掘方法中,所有数据都被认为具有相同的重要性,而不考虑其时间戳。但是,动态数据流具有以下特征:新数据比旧数据重要。在可擦除模式挖掘中,期望的技术之一是考虑数据流的这种特性的方法。因此,我们提出了一种基于阻尼窗口模型的动态数据流可擦模式挖掘算法。由于建议的技术认为新数据比以前的数据更重要,因此可以找到更有用的可擦除模式。另外,通过采用树和表结构,可以有效地进行基于阻尼窗口模型的可擦除模式挖掘。在性能测试中,我们提出修剪技术可以有效地从基于阻尼窗口的数据流中删除与无效的可擦除模式相关的不必要操作。使用真实数据集和合成数据集的性能评估结果表明,通过比较建议的技术和最新算法,该方法在执行时间,模式生成和可伸缩性方面均具有良好的性能。通过使用树和表结构,可以有效地进行基于阻尼窗口模型的可擦模式挖掘。在性能测试中,我们提出修剪技术可以有效地从基于阻尼窗口的数据流中删除与无效的可擦除模式相关的不必要操作。使用真实数据集和合成数据集的性能评估结果表明,通过比较建议的技术和最新算法,该方法在执行时间,模式生成和可伸缩性方面均具有良好的性能。通过使用树和表结构,可以有效地进行基于阻尼窗口模型的可擦模式挖掘。在性能测试中,我们提出修剪技术可以有效地从基于阻尼窗口的数据流中删除与无效的可擦除模式相关的不必要操作。使用真实数据集和合成数据集的性能评估结果表明,通过比较建议的技术和最新算法,该方法在执行时间,模式生成和可伸缩性方面均具有良好的性能。我们提出,我们的修剪技术可以有效地从基于阻尼窗口的数据流中删除与无效的可擦除模式相关的不必要操作。使用真实数据集和合成数据集的性能评估结果表明,通过比较建议的技术和最新算法,该方法在执行时间,模式生成和可伸缩性方面均具有良好的性能。我们提出,我们的修剪技术可以有效地从基于阻尼窗口的数据流中删除与无效的可擦除模式相关的不必要操作。使用真实数据集和合成数据集的性能评估结果表明,通过比较建议的技术和最新算法,该方法在执行时间,模式生成和可伸缩性方面均具有良好的性能。

更新日期:2020-06-12
down
wechat
bug