当前位置: X-MOL 学术arXiv.cs.DS › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
All-Purpose Hashing
arXiv - CS - Data Structures and Algorithms Pub Date : 2021-09-09 , DOI: arxiv-2109.04548
Michael A. Bender, Alex Conway, Martín Farach-Colton, William Kuszmaul, Guido Tagliavini

Despite being one of the oldest data structures in computer science, hash tables continue to be the focus of a great deal of both theoretical and empirical research. A central reason for this is that many of the fundamental properties that one desires from a hash table are difficult to achieve simultaneously; thus many variants offering different trade-offs have been proposed. This paper introduces Iceberg hashing, a hash table that simultaneously offers the strongest known guarantees on a large number of core properties. Iceberg hashing supports constant-time operations while improving on the state of the art for space efficiency, cache efficiency, and low failure probability. Iceberg hashing is also the first hash table to support a load factor of up to $1 - o(1)$ while being stable, meaning that the position where an element is stored only ever changes when resizes occur. In fact, in the setting where keys are $\Theta(\log n)$ bits, the space guarantees that Iceberg hashing offers, namely that is uses at most $\log \binom{|U|}{n} + O(n \log \log n)$ bits to store $n$ items from a universe $U$, matches a lower bound by Demaine et al. that applies to any stable hash table. Iceberg hashing introduces new general-purpose techniques for some of the most basic aspects of hash-table design. Notably, our indirection-free technique for dynamic resizing, which we call waterfall addressing, and our techniques for achieving stability and very-high probability guarantees, can be applied to any hash table that makes use of the front-yard/backyard paradigm for hash table design.

中文翻译:

通用哈希

尽管哈希表是计算机科学中最古老的数据结构之一,但它仍然是大量理论和实证研究的焦点。一个核心原因是人们希望从哈希表中获得的许多基本属性很难同时实现。因此已经提出了许多提供不同权衡的变体。本文介绍了 Iceberg 哈希,这是一种哈希表,可同时对大量核心属性提供最强的已知保证。Iceberg 散列支持恒定时间操作,同时改进了空间效率、缓存效率和低故障概率的最新技术。Iceberg hashing 也是第一个支持高达 $1 - o(1)$ 负载因子同时稳定的哈希表,这意味着存储元素的位置只有在调整大小时才会改变。事实上,在键为 $\Theta(\log n)$ 位的设置中,Iceberg 哈希提供的空间保证,即最多使用 $\log \binom{|U|}{n} + O( n \log \log n)$ 位用于存储来自宇宙 $U$ 的 $n$ 个项目,匹配 Demaine 等人的下限。这适用于任何稳定的哈希表。Iceberg 哈希为哈希表设计的一些最基本方面引入了新的通用技术。值得注意的是,我们用于动态调整大小的无间接技术,我们称之为瀑布寻址,以及我们实现稳定性和非常高概率保证的技术,可以应用于任何使用前院/后院范式进行哈希的哈希表表设计。在键为 $\Theta(\log n)$ 位的设置中,Iceberg 哈希提供的空间保证,即最多使用 $\log \binom{|U|}{n} + O(n \log \log n)$ 位来存储来自宇宙 $U$ 的 $n$ 个项目,匹配 Demaine 等人的下限。这适用于任何稳定的哈希表。Iceberg 哈希为哈希表设计的一些最基本方面引入了新的通用技术。值得注意的是,我们用于动态调整大小的无间接技术,我们称之为瀑布寻址,以及我们实现稳定性和非常高概率保证的技术,可以应用于任何使用前院/后院范式进行哈希的哈希表表设计。在键为 $\Theta(\log n)$ 位的设置中,Iceberg 哈希提供的空间保证,即最多使用 $\log \binom{|U|}{n} + O(n \log \log n)$ 位来存储来自宇宙 $U$ 的 $n$ 个项目,匹配 Demaine 等人的下限。这适用于任何稳定的哈希表。Iceberg 哈希为哈希表设计的一些最基本方面引入了新的通用技术。值得注意的是,我们用于动态调整大小的无间接技术,我们称之为瀑布寻址,以及我们实现稳定性和非常高概率保证的技术,可以应用于任何使用前院/后院范式进行哈希的哈希表表设计。即最多使用 $\log \binom{|U|}{n} + O(n \log \log n)$ 位来存储来自宇宙 $U$ 的 $n$ 项,匹配 Demaine 的下限等。这适用于任何稳定的哈希表。Iceberg 哈希为哈希表设计的一些最基本方面引入了新的通用技术。值得注意的是,我们用于动态调整大小的无间接技术,我们称之为瀑布寻址,以及我们实现稳定性和非常高概率保证的技术,可以应用于任何使用前院/后院范式进行哈希的哈希表表设计。即最多使用 $\log \binom{|U|}{n} + O(n \log \log n)$ 位来存储来自宇宙 $U$ 的 $n$ 项,匹配 Demaine 的下限等。这适用于任何稳定的哈希表。Iceberg 哈希为哈希表设计的一些最基本方面引入了新的通用技术。值得注意的是,我们用于动态调整大小的无间接技术,我们称之为瀑布寻址,以及我们实现稳定性和非常高概率保证的技术,可以应用于任何使用前院/后院范式进行哈希的哈希表表设计。
更新日期:2021-09-13
down
wechat
bug