当前位置: X-MOL 学术J. Comput. Graph. Stat. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Visualizing Probability Distributions Across Bivariate Cyclic Temporal Granularities
Journal of Computational and Graphical Statistics ( IF 1.4 ) Pub Date : 2021-07-26 , DOI: 10.1080/10618600.2021.1938588
Sayani Gupta 1 , Rob J Hyndman 1 , Dianne Cook 1 , Antony Unwin 2
Affiliation  

Abstract

Deconstructing a time index into time granularities can assist in exploration and automated analysis of large temporal datasets. This article describes classes of time deconstructions using linear and cyclic time granularities. Linear granularities respect the linear progression of time such as hours, days, weeks and months. Cyclic granularities can be circular such as hour-of-the-day, quasi-circular such as day-of-the-month, and aperiodic such as public holidays. The hierarchical structure of granularities creates a nested ordering: hour-of-the-day and second-of-the-minute are single-order-up. Hour-of-the-week is multiple-order-up, because it passes over day-of-the-week. Methods are provided for creating all possible granularities for a time index. A recommendation algorithm provides an indication whether a pair of granularities can be meaningfully examined together (a “harmony”), or when they cannot (a “clash”). Time granularities can be used to create data visualizations to explore for periodicities, associations and anomalies. The granularities form categorical variables (ordered or unordered) which induce groupings of the observations. Assuming a numeric response variable, the resulting graphics are then displays of distributions compared across combinations of categorical variables. The methods implemented in the open source R package gravitas are consistent with a tidy workflow, with probability distributions examined using the range of graphics available in ggplot2. Supplementary files for this article are available online.



中文翻译:

可视化跨双变量循环时间粒度的概率分布

摘要

将时间索引解构为时间粒度有助于探索和自动分析大型时间数据集。本文描述了使用线性和循环时间粒度的时间解构类。线性粒度尊重时间的线性进展,例如小时、天、周和月。循环粒度可以是循环的(例如一天中的小时)、准循环(例如月中的某天)和非周期性的(例如公共假期)。粒度的层次结构创建了嵌套排序:一天中的一小时和一分钟的秒是单一排序。一周中的时间是多顺序的,因为它超过了一周中的一天。提供了用于为时间索引创建所有可能粒度的方法。推荐算法提供了一个指示,即是否可以有意义地检查一对粒度(“和谐”),或者何时不能(“冲突”)。时间粒度可用于创建数据可视化,以探索周期性、关联和异常。粒度形成分类变量(有序或无序),这些变量诱导观察分组。假设一个数字响应变量,则生成的图形显示了在分类变量组合之间进行比较的分布。开源 R 包 gravitas 中实现的方法与整洁的工作流程一致,使用 ggplot2 中可用的图形范围检查概率分布。本文的补充文件可在线获取。或者当他们不能(“冲突”)时。时间粒度可用于创建数据可视化,以探索周期性、关联和异常。粒度形成分类变量(有序或无序),这些变量诱导观察分组。假设一个数字响应变量,则生成的图形显示了在分类变量组合之间进行比较的分布。开源 R 包 gravitas 中实现的方法与整洁的工作流程一致,使用 ggplot2 中可用的图形范围检查概率分布。本文的补充文件可在线获取。或者当他们不能(“冲突”)时。时间粒度可用于创建数据可视化,以探索周期性、关联和异常。粒度形成分类变量(有序或无序),这些变量诱导观察分组。假设一个数字响应变量,则生成的图形显示了在分类变量组合之间进行比较的分布。开源 R 包 gravitas 中实现的方法与整洁的工作流程一致,使用 ggplot2 中可用的图形范围检查概率分布。本文的补充文件可在线获取。粒度形成分类变量(有序或无序),这些变量诱导观察分组。假设一个数字响应变量,则生成的图形显示了在分类变量组合之间进行比较的分布。开源 R 包 gravitas 中实现的方法与整洁的工作流程一致,使用 ggplot2 中可用的图形范围检查概率分布。本文的补充文件可在线获取。粒度形成分类变量(有序或无序),这些变量诱导观察分组。假设一个数字响应变量,则生成的图形显示了在分类变量组合之间进行比较的分布。开源 R 包 gravitas 中实现的方法与整洁的工作流程一致,使用 ggplot2 中可用的图形范围检查概率分布。本文的补充文件可在线获取。使用 ggplot2 中可用的图形范围检查概率分布。本文的补充文件可在线获取。使用 ggplot2 中可用的图形范围检查概率分布。本文的补充文件可在线获取。

更新日期:2021-07-26
down
wechat
bug