当前位置: X-MOL 学术arXiv.cs.CG › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Approximate Maximum Halfspace Discrepancy
arXiv - CS - Computational Geometry Pub Date : 2021-06-25 , DOI: arxiv-2106.13851
Michael Matheny, Jeff M. Phillips

Consider the geometric range space $(X, \mathcal{H}_d)$ where $X \subset \mathbb{R}^d$ and $\mathcal{H}_d$ is the set of ranges defined by $d$-dimensional halfspaces. In this setting we consider that $X$ is the disjoint union of a red and blue set. For each halfspace $h \in \mathcal{H}_d$ define a function $\Phi(h)$ that measures the "difference" between the fraction of red and fraction of blue points which fall in the range $h$. In this context the maximum discrepancy problem is to find the $h^* = \arg \max_{h \in (X, \mathcal{H}_d)} \Phi(h)$. We aim to instead find an $\hat{h}$ such that $\Phi(h^*) - \Phi(\hat{h}) \le \varepsilon$. This is the central problem in linear classification for machine learning, in spatial scan statistics for spatial anomaly detection, and shows up in many other areas. We provide a solution for this problem in $O(|X| + (1/\varepsilon^d) \log^4 (1/\varepsilon))$ time, which improves polynomially over the previous best solutions. For $d=2$ we show that this is nearly tight through conditional lower bounds. For different classes of $\Phi$ we can either provide a $\Omega(|X|^{3/2 - o(1)})$ time lower bound for the exact solution with a reduction to APSP, or an $\Omega(|X| + 1/\varepsilon^{2-o(1)})$ lower bound for the approximate solution with a reduction to 3SUM. A key technical result is a $\varepsilon$-approximate halfspace range counting data structure of size $O(1/\varepsilon^d)$ with $O(\log (1/\varepsilon))$ query time, which we can build in $O(|X| + (1/\varepsilon^d) \log^4 (1/\varepsilon))$ time.

中文翻译:

近似最大半空间差异

考虑几何范围空间 $(X, \mathcal{H}_d)$ 其中 $X \subset \mathbb{R}^d$ 和 $\mathcal{H}_d$ 是由 $d$- 定义的范围集维半空间。在这个设置中,我们认为 $X$ 是红色和蓝色集合的不相交并集。对于每个半空间 $h \in \mathcal{H}_d$ 定义一个函数 $\Phi(h)$ 来测量落在 $h$ 范围内的红点分数和蓝点分数之间的“差异”。在这种情况下,最大差异问题是找到 $h^* = \arg \max_{h \in (X, \mathcal{H}_d)} \Phi(h)$。我们的目标是找到一个 $\hat{h}$ 使得 $\Phi(h^*) - \Phi(\hat{h}) \le \varepsilon$。这是机器学习线性分类、空间异常检测的空间扫描统计中的核心问题,并出现在许多其他领域。我们在 $O(|X| + (1/\varepsilon^d) \log^4 (1/\varepsilon))$ 时间内为这个问题提供了一个解决方案,这比以前的最佳解决方案在多项式上有所改进。对于 $d=2$,我们表明通过条件下限这几乎是紧的。对于不同类别的 $\Phi$,我们可以为精确解提供 $\Omega(|X|^{3/2 - o(1)})$ 时间下限,并减少到 APSP,或者 $\ Omega(|X| + 1/\varepsilon^{2-o(1)})$ 近似解的下限,减少到 3SUM。一个关键的技术结果是一个 $\varepsilon$-approximate halfspace range count data structure of size $O(1/\varepsilon^d)$ 和 $O(\log (1/\varepsilon))$ 查询时间,我们可以在 $O(|X| + (1/\varepsilon^d) \log^4 (1/\varepsilon))$ 时间内构建。这比以前的最佳解决方案以多项式方式改进。对于 $d=2$,我们表明通过条件下限这几乎是紧的。对于不同类别的 $\Phi$,我们可以为精确解提供 $\Omega(|X|^{3/2 - o(1)})$ 时间下限,并减少到 APSP,或者 $\ Omega(|X| + 1/\varepsilon^{2-o(1)})$ 近似解的下限,减少到 3SUM。一个关键的技术结果是一个 $\varepsilon$-approximate halfspace range count data structure of size $O(1/\varepsilon^d)$ 和 $O(\log (1/\varepsilon))$ 查询时间,我们可以在 $O(|X| + (1/\varepsilon^d) \log^4 (1/\varepsilon))$ 时间内构建。这比以前的最佳解决方案以多项式方式改进。对于 $d=2$,我们表明通过条件下限这几乎是紧的。对于不同类别的 $\Phi$,我们可以为精确解提供 $\Omega(|X|^{3/2 - o(1)})$ 时间下限,并减少到 APSP,或者 $\ Omega(|X| + 1/\varepsilon^{2-o(1)})$ 近似解的下限,减少到 3SUM。一个关键的技术结果是一个 $\varepsilon$-approximate halfspace range count data structure of size $O(1/\varepsilon^d)$ 和 $O(\log (1/\varepsilon))$ 查询时间,我们可以在 $O(|X| + (1/\varepsilon^d) \log^4 (1/\varepsilon))$ 时间内构建。对于不同类别的 $\Phi$,我们可以为精确解提供 $\Omega(|X|^{3/2 - o(1)})$ 时间下限,并减少到 APSP,或者 $\ Omega(|X| + 1/\varepsilon^{2-o(1)})$ 近似解的下限,减少到 3SUM。一个关键的技术结果是一个 $\varepsilon$-approximate halfspace range count data structure of size $O(1/\varepsilon^d)$ 和 $O(\log (1/\varepsilon))$ 查询时间,我们可以在 $O(|X| + (1/\varepsilon^d) \log^4 (1/\varepsilon))$ 时间内构建。对于不同类别的 $\Phi$,我们可以为精确解提供 $\Omega(|X|^{3/2 - o(1)})$ 时间下限,并减少到 APSP,或者 $\ Omega(|X| + 1/\varepsilon^{2-o(1)})$ 近似解的下限,减少到 3SUM。一个关键的技术结果是一个 $\varepsilon$-approximate halfspace range count data structure of size $O(1/\varepsilon^d)$ 和 $O(\log (1/\varepsilon))$ 查询时间,我们可以在 $O(|X| + (1/\varepsilon^d) \log^4 (1/\varepsilon))$ 时间内构建。
更新日期:2021-06-29
down
wechat
bug