当前位置: X-MOL 学术EURASIP J. Audio Speech Music Proc. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Motor data-regularized nonnegative matrix factorization for ego-noise suppression
EURASIP Journal on Audio, Speech, and Music Processing ( IF 1.7 ) Pub Date : 2020-07-31 , DOI: 10.1186/s13636-020-00178-0
Alexander Schmidt , Andreas Brendel , Thomas Haubner , Walter Kellermann

Ego-noise, i.e., the noise a robot causes by its own motions, significantly corrupts the microphone signal and severely impairs the robot’s capability to interact seamlessly with its environment. Therefore, suitable ego-noise suppression techniques are required. For this, it is intuitive to use also motor data collected by proprioceptors mounted to the joints of the robot since it describes the physical state of the robot and provides additional information about the ego-noise sources. In this paper, we use a dictionary-based approach for ego-noise suppression in a semi-supervised manner: first, an ego-noise dictionary is learned and subsequently used to estimate the ego-noise components of a mixture by computing a weighted sum of dictionary entries. The estimation of the weights is very sensitive against other signals beside ego-noise contained in the mixture. For increased robustness, we therefore propose to incorporate knowledge about the physical state of the robot to the estimation of the weights. This is achieved by introducing a motor data-based regularization term to the estimation problem which promotes similar weights for similar physical states. The regularization is derived by representing the motor data as a graph and imprints the intrinsic structure of the motor data space onto the dictionary model. We analyze the proposed method and evaluate its ego-noise suppression performance for a large variety of different movements and demonstrate the superiority of the proposed method compared to an approach without using motor data.

中文翻译:

用于抑制自我噪声的运动数据正则化非负矩阵分解

自我噪声,即机器人由其自身运动引起的噪声,会严重破坏麦克风信号并严重削弱机器人与其环境无缝交互的能力。因此,需要合适的自我噪声抑制技术。为此,使用安装在机器人关节上的本体感受器收集的运动数据是很直观的,因为它描述了机器人的物理状态并提供了关于自我噪声​​源的附加信息。在本文中,我们使用基于字典的方法以半监督的方式抑制自我噪声:首先,学习自我噪声字典,然后通过计算加权和来估计混合物的自我噪声分量的字典条目。除了包含在混合物中的自我噪声之外,权重的估计对其他信号非常敏感。为了提高鲁棒性,我们因此建议将有关机器人物理状态的知识结合到权重的估计中。这是通过在估计问题中引入基于运动数据的正则化项来实现的,该项促进了相似物理状态的相似权重。正则化是通过将电机数据表示为图形来导出的,并将电机数据空间的内在结构印在字典模型上。我们分析了所提出的方法并评估了其对各种不同运动的自我噪声抑制性能,并证明了所提出的方法与不使用运动数据的方法相比的优越性。因此,我们建议将有关机器人物理状态的知识结合到权重的估计中。这是通过在估计问题中引入基于运动数据的正则化项来实现的,该项促进了相似物理状态的相似权重。正则化是通过将电机数据表示为图形来导出的,并将电机数据空间的内在结构印在字典模型上。我们分析了所提出的方法并评估了其对各种不同运动的自我噪声抑制性能,并证明了所提出的方法与不使用运动数据的方法相比的优越性。因此,我们建议将有关机器人物理状态的知识结合到权重的估计中。这是通过在估计问题中引入基于运动数据的正则化项来实现的,该项促进了相似物理状态的相似权重。正则化是通过将电机数据表示为图形来导出的,并将电机数据空间的内在结构印在字典模型上。我们分析了所提出的方法并评估了其对各种不同运动的自我噪声抑制性能,并证明了所提出的方法与不使用运动数据的方法相比的优越性。这是通过在估计问题中引入基于运动数据的正则化项来实现的,该项促进了相似物理状态的相似权重。正则化是通过将电机数据表示为图形来导出的,并将电机数据空间的内在结构印在字典模型上。我们分析了所提出的方法并评估了其对各种不同运动的自我噪声抑制性能,并证明了所提出的方法与不使用运动数据的方法相比的优越性。这是通过在估计问题中引入基于运动数据的正则化项来实现的,该项促进了相似物理状态的相似权重。正则化是通过将电机数据表示为图形来导出的,并将电机数据空间的内在结构印在字典模型上。我们分析了所提出的方法并评估了其对各种不同运动的自我噪声抑制性能,并证明了所提出的方法与不使用运动数据的方法相比的优越性。
更新日期:2020-07-31
down
wechat
bug