当前位置: X-MOL 学术EURASIP J. Audio Speech Music Proc. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Acoustic DOA estimation using space alternating sparse Bayesian learning
EURASIP Journal on Audio, Speech, and Music Processing ( IF 2.4 ) Pub Date : 2021-04-06 , DOI: 10.1186/s13636-021-00200-z
Zonglong Bai , Liming Shi , Jesper Rindom Jensen , Jinwei Sun , Mads Græsbøll Christensen

Estimating the direction-of-arrival (DOA) of multiple acoustic sources is one of the key technologies for humanoid robots and drones. However, it is a most challenging problem due to a number of factors, including the platform size which puts a constraint on the array aperture. To overcome this problem, a high-resolution DOA estimation algorithm based on sparse Bayesian learning is proposed in this paper. A group sparse prior based hierarchical Bayesian model is introduced to encourage spatial sparsity of acoustic sources. To obtain approximate posteriors of the hidden variables, a variational Bayesian approach is proposed. Moreover, to reduce the computational complexity, the space alternating approach is applied to push the variational Bayesian inference to the scalar level. Furthermore, an acoustic DOA estimator is proposed to jointly utilize the estimated source signals from all frequency bins. Compared to state-of-the-art approaches, the high-resolution performance of the proposed approach is demonstrated in experiments with both synthetic and real data. The experiments show that the proposed approach achieves lower root mean square error (RMSE), false alert (FA), and miss-detection (MD) than other methods. Therefore, the proposed approach can be applied to some applications such as humanoid robots and drones to improve the resolution performance for acoustic DOA estimation especially when the size of the array aperture is constrained by the platform, preventing the use of traditional methods to resolve multiple sources.

中文翻译:

使用空间交替稀疏贝叶斯学习的声音DOA估计

估计多个声源的到达方向(DOA)是类人机器人和无人机的关键技术之一。然而,由于许多因素,这是最具挑战性的问题,包括平台尺寸,该尺寸限制了阵列孔径。为了克服这个问题,提出了一种基于稀疏贝叶斯学习的高分辨率DOA估计算法。引入了基于稀疏先验的分层贝叶斯模型,以鼓励声源的空间稀疏性。为了获得隐藏变量的近似后验,提出了一种变分贝叶斯方法。此外,为了降低计算复杂度,使用空间交替方法将变分贝叶斯推论推到标量级别。此外,提出了一种声学DOA估计器,以联合利用来自所有频率仓的估计源信号。与最新方法相比,该方法的高分辨率性能在合成和真实数据的实验中得到了证明。实验表明,与其他方法相比,该方法具有更低的均方根误差(RMSE),虚警(FA)和漏检(MD)。因此,所提出的方法可以应用于某些应用,例如人形机器人和无人机,以提高声学DOA估计的分辨率性能,尤其是在平台限制阵列孔径大小的情况下,从而避免使用传统方法来解析多个源。在合成和真实数据实验中都证明了该方法的高分辨率性能。实验表明,与其他方法相比,该方法具有更低的均方根误差(RMSE),虚警(FA)和漏检(MD)。因此,所提出的方法可以应用于某些应用,例如人形机器人和无人机,以提高声学DOA估计的分辨率性能,尤其是在平台限制阵列孔径大小的情况下,从而避免使用传统方法来解析多个源。在合成和真实数据实验中都证明了该方法的高分辨率性能。实验表明,与其他方法相比,该方法具有更低的均方根误差(RMSE),虚警(FA)和漏检(MD)。因此,所提出的方法可以应用于某些应用,例如人形机器人和无人机,以提高声学DOA估计的分辨率性能,尤其是在平台限制阵列孔径大小的情况下,从而避免使用传统方法来解析多个源。以及比其他方法更容易发生的误检(MD)。因此,所提出的方法可以应用于某些应用,例如人形机器人和无人机,以提高声学DOA估计的分辨率性能,尤其是在平台限制阵列孔径大小的情况下,从而避免使用传统方法来解析多个源。以及比其他方法更容易发生的误检(MD)。因此,所提出的方法可以应用于某些应用,例如人形机器人和无人机,以提高声学DOA估计的分辨率性能,尤其是在平台限制阵列孔径大小的情况下,从而避免使用传统方法来解析多个源。
更新日期:2021-04-06
down
wechat
bug