当前位置: X-MOL 学术arXiv.cs.DB › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Duoquest: A Dual-Specification System for Expressive SQL Queries
arXiv - CS - Databases Pub Date : 2020-03-16 , DOI: arxiv-2003.07438
Christopher Baik, Zhongjun Jin, Michael Cafarella, H. V. Jagadish

Querying a relational database is difficult because it requires users to know both the SQL language and be familiar with the schema. On the other hand, many users possess enough domain familiarity or expertise to describe their desired queries by alternative means. For such users, two major alternatives to writing SQL are natural language interfaces (NLIs) and programming-by-example (PBE). Both of these alternatives face certain pitfalls: natural language queries (NLQs) are often ambiguous, even for human interpreters, while current PBE approaches require either low-complexity queries, user schema knowledge, exact example tuples from the user, or a closed-world assumption to be tractable. Consequently, we propose dual-specification query synthesis, which consumes both a NLQ and an optional PBE-like table sketch query that enables users to express varied levels of domain-specific knowledge. We introduce the novel dual-specification Duoquest system, which leverages guided partial query enumeration to efficiently explore the space of possible queries. We present results from user studies in which Duoquest demonstrates a 62.5% absolute increase in query construction accuracy over a state-of-the-art NLI and comparable accuracy to a PBE system on a more limited workload supported by the PBE system. In a simulation study on the prominent Spider benchmark, Duoquest demonstrates a >2x increase in top-1 accuracy over both NLI and PBE.

中文翻译:

Duoquest:用于表达性 SQL 查询的双规范系统

查询关系数据库很困难,因为它要求用户既了解 SQL 语言又熟悉架构。另一方面,许多用户拥有足够的领域熟悉度或专业知识,可以通过其他方式描述他们想要的查询。对于此类用户,编写 SQL 的两种主要替代方法是自然语言接口 (NLI) 和示例编程 (PBE)。这两种替代方案都面临某些陷阱:自然语言查询 (NLQ) 通常是模棱两可的,即使对于人工解释器也是如此,而当前的 PBE 方法需要低复杂度查询、用户模式知识、来自用户的确切示例元组或封闭世界假设是可以处理的。因此,我们提出了双规范查询合成,它同时使用 NLQ 和可选的 PBE-like table sketch 查询,使用户能够表达不同级别的特定领域知识。我们引入了新颖的双规范 Duoquest 系统,它利用引导部分查询枚举来有效地探索可能查询的空间。我们展示了用户研究的结果,其中 Duoquest 展示了与最先进的 NLI 相比,查询构建准确度绝对提高了 62.5%,并且在 PBE 系统支持的更有限的工作负载下,其准确度与 PBE 系统相当。在对著名的 Spider 基准测试的模拟研究中,Duoquest 展示了与 NLI 和 PBE 相比,top-1 准确度提高了 2 倍以上。它利用引导部分查询枚举来有效地探索可能查询的空间。我们展示了用户研究的结果,其中 Duoquest 展示了与最先进的 NLI 相比,查询构建准确度绝对提高了 62.5%,并且在 PBE 系统支持的更有限的工作负载下,其准确度与 PBE 系统相当。在对著名的 Spider 基准测试的模拟研究中,Duoquest 展示了与 NLI 和 PBE 相比,top-1 准确度提高了 2 倍以上。它利用引导部分查询枚举来有效地探索可能查询的空间。我们展示了用户研究的结果,其中 Duoquest 展示了与最先进的 NLI 相比,查询构建准确度绝对提高了 62.5%,并且在 PBE 系统支持的更有限的工作负载下,其准确度与 PBE 系统相当。在对著名的 Spider 基准测试的模拟研究中,Duoquest 展示了与 NLI 和 PBE 相比,top-1 准确度提高了 2 倍以上。
更新日期:2020-03-25
down
wechat
bug