当前位置: X-MOL 学术Biometrika › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Stratification and optimal resampling for sequential Monte Carlo
Biometrika ( IF 2.7 ) Pub Date : 2021-01-19 , DOI: 10.1093/biomet/asab004
Yichao Li 1 , Wenshuo Wang 2 , Ke Deng 1 , Jun S Liu 2
Affiliation  

Summary Sequential Monte Carlo algorithms are widely accepted as powerful computational tools for making inference with dynamical systems. A key step in sequential Monte Carlo is resampling, which plays the role of steering the algorithm towards the future dynamics. Several strategies have been used in practice, including multinomial resampling, residual resampling, optimal resampling, stratified resampling and optimal transport resampling. In one-dimensional cases, we show that optimal transport resampling is equivalent to stratified resampling on the sorted particles, and both strategies minimize the resampling variance as well as the expected squared energy distance between the original and resampled empirical distributions. For general $d$-dimensional cases, we show that if the particles are first sorted using the Hilbert curve, the variance of stratified resampling is $O(m^{-(1+2/d)})$, an improvement over the best previously known rate of $O(m^{-(1+1/d)})$, where $m$ is the number of resampled particles. We show that this improved rate is optimal for ordered stratified resampling schemes, as conjectured in Gerber et al. (2019). We also present an almost-sure bound on the Wasserstein distance between the original and Hilbert-curve-resampled empirical distributions. In light of these results, we show that for dimension $d>1$ the mean square error of sequential quasi-Monte Carlo with $n$ particles can be $O(n^{-1-4/\{d(d+4)\}})$ if Hilbert curve resampling is used and a specific low-discrepancy set is chosen. To our knowledge, this is the first known convergence rate lower than $o(n^{-1})$.

中文翻译:

顺序蒙特卡洛的分层和最优重采样

总结 Sequential Monte Carlo 算法被广泛认为是用于对动态系统进行推理的强大计算工具。顺序蒙特卡洛的一个关键步骤是重采样,它起到将算法导向未来动态的作用。在实践中已经使用了几种策略,包括多项重采样、残差重采样、最佳重采样、分层重采样和最佳传输重采样。在一维情况下,我们表明最优传输重采样等效于对排序粒子进行分层重采样,并且这两种策略都最小化了重采样方差以及原始和重采样经验分布之间的预期平方能量距离。对于一般的$d$维情况,我们证明如果粒子首先使用希尔伯特曲线排序,分层重采样的方差为 $O(m^{-(1+2/d)})$,比先前已知的最佳速率 $O(m^{-(1+1/d)})$ 有所改进,其中 $m$ 是重采样粒子的数量。正如 Gerber 等人所推测的,我们表明这种改进的速率对于有序分层重采样方案是最佳的。(2019)。我们还提出了原始和希尔伯特曲线重采样经验分布之间的 Wasserstein 距离的几乎确定的界限。根据这些结果,我们表明对于维度 $d>1$,具有 $n$ 个粒子的顺序准蒙特卡罗的均方误差可以是 $O(n^{-1-4/\{d(d+ 4)\}})$ 如果使用希尔伯特曲线重采样并且选择了特定的低差异集。据我们所知,这是第一个低于 $o(n^{-1})$ 的已知收敛速度。对先前已知的最佳速率 $O(m^{-(1+1/d)})$ 的改进,其中 $m$ 是重采样粒子的数量。正如 Gerber 等人所推测的,我们表明这种改进的速率对于有序分层重采样方案是最佳的。(2019)。我们还提出了原始和希尔伯特曲线重采样经验分布之间的 Wasserstein 距离的几乎确定的界限。根据这些结果,我们表明对于维度 $d>1$,具有 $n$ 个粒子的顺序准蒙特卡罗的均方误差可以是 $O(n^{-1-4/\{d(d+ 4)\}})$ 如果使用希尔伯特曲线重采样并且选择了特定的低差异集。据我们所知,这是第一个低于 $o(n^{-1})$ 的已知收敛速度。对先前已知的最佳速率 $O(m^{-(1+1/d)})$ 的改进,其中 $m$ 是重采样粒子的数量。正如 Gerber 等人所推测的,我们表明这种改进的速率对于有序分层重采样方案是最佳的。(2019)。我们还提出了原始和希尔伯特曲线重采样经验分布之间的 Wasserstein 距离的几乎确定的界限。根据这些结果,我们表明对于维度 $d>1$,具有 $n$ 个粒子的顺序准蒙特卡罗的均方误差可以是 $O(n^{-1-4/\{d(d+ 4)\}})$ 如果使用希尔伯特曲线重采样并且选择了特定的低差异集。据我们所知,这是第一个低于 $o(n^{-1})$ 的已知收敛速度。正如 Gerber 等人所推测的,我们表明这种改进的速率对于有序分层重采样方案是最佳的。(2019)。我们还提出了原始和希尔伯特曲线重采样经验分布之间的 Wasserstein 距离的几乎确定的界限。根据这些结果,我们表明对于维度 $d>1$,具有 $n$ 个粒子的顺序准蒙特卡罗的均方误差可以是 $O(n^{-1-4/\{d(d+ 4)\}})$ 如果使用希尔伯特曲线重采样并且选择了特定的低差异集。据我们所知,这是第一个低于 $o(n^{-1})$ 的已知收敛速度。正如 Gerber 等人所推测的,我们表明这种改进的速率对于有序分层重采样方案是最佳的。(2019)。我们还提出了原始和希尔伯特曲线重采样经验分布之间的 Wasserstein 距离的几乎确定的界限。根据这些结果,我们表明对于维度 $d>1$,具有 $n$ 个粒子的顺序准蒙特卡罗的均方误差可以是 $O(n^{-1-4/\{d(d+ 4)\}})$ 如果使用希尔伯特曲线重采样并且选择了特定的低差异集。据我们所知,这是第一个低于 $o(n^{-1})$ 的已知收敛速度。我们证明对于维度 $d>1$,具有 $n$ 个粒子的顺序准蒙特卡罗的均方误差可以是 $O(n^{-1-4/\{d(d+4)\}}) $ 如果使用希尔伯特曲线重采样并选择了特定的低差异集。据我们所知,这是第一个低于 $o(n^{-1})$ 的已知收敛速度。我们证明对于维度 $d>1$,具有 $n$ 个粒子的顺序准蒙特卡罗的均方误差可以是 $O(n^{-1-4/\{d(d+4)\}}) $ 如果使用希尔伯特曲线重采样并选择了特定的低差异集。据我们所知,这是第一个低于 $o(n^{-1})$ 的已知收敛速度。
更新日期:2021-01-19
down
wechat
bug