当前位置: X-MOL 学术arXiv.cs.DB › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Handling Inconsistencies in Tables with Nulls and Functional Dependencies
arXiv - CS - Databases Pub Date : 2021-08-05 , DOI: arxiv-2108.02581
Dominique Laurent, Nicolas Spyratos

In this paper we address the problem of handling inconsistencies in tables with missing values (or nulls) and functional dependencies. Although the traditional view is that table instances must respect all functional dependencies imposed on them, it is nevertheless relevant to develop theories about how to handle instances that violate some dependencies. The usual approach to alleviate the impact of inconsistent data on the answers to a query is to introduce the notion of repair: a repair is a minimally di?erent consistent instance and an answer is consistent if it is present in every repair. Our approach is fundamentally di?erent: we use set theoretic semantics for tuples and functional dependencies that allow us to associate each tuple with a truth value among the following: true, false, inconsistent or unknown. The users of the table can then query the set of true tuples as usual. Regarding missing values, we make no assumptions on their existence: a missing value exists only if it is inferred from the functional dependencies of the table. The main contributions of the paper are the following: (a) we introduce a new approach to handle inconsistencies in a table with nulls and functional dependencies, (b) we give algorithms for computing all true, inconsistent and false tuples, (c) we discuss how our approach relates to Belnap's four valued logic, (d) we de- scribe how our approach can be applied to the consolidation of two or more tables and (e) we discuss the relationship between our approach and that of table repairs.

中文翻译:

处理具有空值和函数依赖关系的表中的不一致

在本文中,我们解决了处理具有缺失值(或空值)和函数依赖关系的表中的不一致问题。尽管传统观点认为表实例必须尊重强加于它们的所有函数依赖关系,但开发关于如何处理违反某些依赖关系的实例的理论仍然是相关的。减轻不一致数据对查询答案的影响的常用方法是引入修复的概念:修复是一个最小差异的一致实例,如果它出现在每次修复中,则答案是一致的。我们的方法根本不同:我们对元组和函数依赖使用集合论语义,允许我们将每个元组与以下真值相关联:真、假、不一致或未知。然后表的用户可以像往常一样查询真正的元组集。关于缺失值,我们不对它们的存在做任何假设:仅当从表的函数依赖关系中推断出缺失值时才存在缺失值。该论文的主要贡献如下:(a)我们引入了一种新方法来处理具有空值和函数依赖关系的表中的不一致,(b)我们给出了计算所有真、不一致和假元组的算法,(c)我们讨论我们的方法如何与 Belnap 的四值逻辑相关联,(d) 我们描述我们的方法如何应用于两个或多个表的合并,以及 (e) 我们讨论我们的方法与表修复方法之间的关系。仅当从表的函数依赖关系中推断出缺失值时才存在缺失值。该论文的主要贡献如下:(a)我们引入了一种新方法来处理具有空值和函数依赖关系的表中的不一致,(b)我们给出了计算所有真、不一致和假元组的算法,(c)我们讨论我们的方法如何与 Belnap 的四值逻辑相关联,(d) 我们描述我们的方法如何应用于两个或多个表的合并,以及 (e) 我们讨论我们的方法与表修复方法之间的关系。仅当从表的函数依赖关系中推断出缺失值时才存在缺失值。该论文的主要贡献如下:(a)我们引入了一种新方法来处理具有空值和函数依赖关系的表中的不一致,(b)我们给出了计算所有真、不一致和假元组的算法,(c)我们讨论我们的方法如何与 Belnap 的四值逻辑相关联,(d) 我们描述我们的方法如何应用于两个或多个表的合并,以及 (e) 我们讨论我们的方法与表修复方法之间的关系。
更新日期:2021-08-07
down
wechat
bug