当前位置: X-MOL 学术J. Intell. Inf. Syst. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Compact representations for efficient storage of semantic sensor data
Journal of Intelligent Information Systems ( IF 3.4 ) Pub Date : 2021-01-02 , DOI: 10.1007/s10844-020-00628-3
Farah Karim , Maria-Esther Vidal , Sören Auer

Nowadays, there is a rapid increase in the number of sensor data generated by a wide variety of sensors and devices. Data semantics facilitate information exchange, adaptability, and interoperability among several sensors and devices. Sensor data and their meaning can be described using ontologies, e.g., the Semantic Sensor Network (SSN) Ontology. Notwithstanding, semantically enriched, the size of semantic sensor data is substantially larger than raw sensor data. Moreover, some measurement values can be observed by sensors several times, and a huge number of repeated facts about sensor data can be produced. We propose a compact or factorized representation of semantic sensor data, where repeated measurement values are described only once. Furthermore, these compact representations are able to enhance the storage and processing of semantic sensor data. To scale up to large datasets, factorization based, tabular representations are exploited to store and manage factorized semantic sensor data using Big Data technologies. We empirically study the effectiveness of a semantic sensor’s proposed compact representations and their impact on query processing. Additionally, we evaluate the effects of storing the proposed representations on diverse RDF implementations. Results suggest that the proposed compact representations empower the storage and query processing of sensor data over diverse RDF implementations, and up to two orders of magnitude can reduce query execution time.

中文翻译:

用于有效存储语义传感器数据的紧凑表示

如今,由各种传感器和设备生成的传感器数据的数量迅速增加。数据语义促进了多个传感器和设备之间的信息交换、适应性和互操作性。传感器数据及其含义可以使用本体来描述,例如语义传感器网络(SSN)本体。尽管语义丰富,但语义传感器数据的大小远大于原始传感器数据。此外,一些测量值可以被传感器多次观察,并且可以产生大量关于传感器数据的重复事实。我们提出了语义传感器数据的紧凑或分解表示,其中重复的测量值仅描述一次。此外,这些紧凑的表示能够增强语义传感器数据的存储和处理。为了扩展到大型数据集,利用基于分解的表格表示来使用大数据技术存储和管理分解的语义传感器数据。我们凭经验研究语义传感器提出的紧凑表示的有效性及其对查询处理的影响。此外,我们评估了存储建议的表示对不同 RDF 实现的影响。结果表明,所提出的紧凑表示能够通过不同的 RDF 实现来存储和查询传感器数据,并且最多两个数量级可以减少查询执行时间。利用大数据技术,利用表格表示来存储和管理分解的语义传感器数据。我们凭经验研究语义传感器提出的紧凑表示的有效性及其对查询处理的影响。此外,我们评估了存储建议的表示对不同 RDF 实现的影响。结果表明,所提出的紧凑表示能够通过不同的 RDF 实现来存储和查询传感器数据,并且最多两个数量级可以减少查询执行时间。利用大数据技术,利用表格表示来存储和管理分解的语义传感器数据。我们凭经验研究语义传感器提出的紧凑表示的有效性及其对查询处理的影响。此外,我们评估了存储建议的表示对不同 RDF 实现的影响。结果表明,所提出的紧凑表示能够通过不同的 RDF 实现来存储和查询传感器数据,并且最多两个数量级可以减少查询执行时间。我们评估了存储提议的表示对不同 RDF 实现的影响。结果表明,所提出的紧凑表示能够通过不同的 RDF 实现来存储和查询传感器数据,并且最多两个数量级可以减少查询执行时间。我们评估了存储提议的表示对不同 RDF 实现的影响。结果表明,所提出的紧凑表示能够通过不同的 RDF 实现来存储和查询传感器数据,并且最多两个数量级可以减少查询执行时间。
更新日期:2021-01-02
down
wechat
bug