当前位置: X-MOL 学术ACM Trans. Knowl. Discov. Data › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Reduced Network Traffic Method for IoT Data Clustering
ACM Transactions on Knowledge Discovery from Data ( IF 3.6 ) Pub Date : 2020-12-07 , DOI: 10.1145/3423139
Ricardo De Azevedo 1 , Gabriel Resende Machado 2 , Ronaldo Ribeiro Goldschmidt 2 , Ricardo Choren 2
Affiliation  

Internet of Things (IoT) systems usually involve interconnected, low processing capacity, and low memory sensor nodes (devices) that collect data in several sorts of applications that interconnect people and things. In this scenario, mining tasks, such as clustering, have been commonly deployed to detect behavioral patterns from the collected data. The centralized clustering of IoT data demands high network traffic to transmit the data from the devices to a central node, where a clustering algorithm must be applied. This approach does not scale as the number of devices increases, and the amount of data grows. However, distributing the clustering process through the devices may not be a feasible approach as well, since the devices are usually simple and may not have the ability to execute complex procedures. This work proposes a centralized IoT data clustering method that demands reduced network traffic and low processing power in the devices. The proposed method uses a data grid to summarize the information at the devices before transmitting it to the central node, reducing network traffic. After the data transfer, the proposed method applies a clustering algorithm that was developed to process data in the summarized representation. Tests with seven datasets provided experimental evidence that the proposed method reduces network traffic and produces results comparable to the ones generated by DBSCAN and HDBSCAN, two robust centralized clustering algorithms.

中文翻译:

一种减少网络流量的物联网数据聚类方法

物联网 (IoT) 系统通常涉及互连、低处理能力和低内存传感器节点(设备),这些传感器节点(设备)在将人和物互连的多种应用程序中收集数据。在这种情况下,通常会部署挖掘任务(例如聚类)来从收集的数据中检测行为模式。物联网数据的集中聚类需要高网络流量才能将数据从设备传输到中央节点,必须应用聚类算法。这种方法不会随着设备数量的增加和数据量的增长而扩展。然而,通过设备分布集群过程也可能不是一种可行的方法,因为设备通常很简单,可能不具备执行复杂过程的能力。这项工作提出了一种集中式物联网数据聚类方法,该方法需要减少网络流量和设备中的低处理能力。所提出的方法使用数据网格来汇总设备上的信息,然后再将其传输到中央节点,从而减少网络流量。在数据传输之后,所提出的方法应用了一种聚类算法,该算法是为处理汇总表示中的数据而开发的。七个数据集的测试提供了实验证据,表明所提出的方法减少了网络流量,并产生了与 DBSCAN 和 HDBSCAN 这两种强大的集中式聚类算法生成的结果相当的结果。所提出的方法使用数据网格来汇总设备上的信息,然后再将其传输到中央节点,从而减少网络流量。在数据传输之后,所提出的方法应用了一种聚类算法,该算法是为处理汇总表示中的数据而开发的。七个数据集的测试提供了实验证据,表明所提出的方法减少了网络流量,并产生了与 DBSCAN 和 HDBSCAN 这两种强大的集中式聚类算法生成的结果相当的结果。所提出的方法使用数据网格来汇总设备上的信息,然后再将其传输到中央节点,从而减少网络流量。在数据传输之后,所提出的方法应用了一种聚类算法,该算法是为处理汇总表示中的数据而开发的。七个数据集的测试提供了实验证据,表明所提出的方法减少了网络流量,并产生了与 DBSCAN 和 HDBSCAN 这两种强大的集中式聚类算法生成的结果相当的结果。
更新日期:2020-12-07
down
wechat
bug