当前位置: X-MOL 学术Circuits Syst. Signal Process. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Classification-Based Non-local Means Adaptive Filtering for Speech Enhancement and Its FPGA Prototype
Circuits, Systems, and Signal Processing ( IF 2.3 ) Pub Date : 2019-09-25 , DOI: 10.1007/s00034-019-01267-y
Nagapuri Srinivas , Gayadhar Pradhan , Puli Kishore Kumar

Non-local mean (NLM) adaptive filtering is a well-explored technique for the denoising of images and electrocardiogram signals. In NLM filtering, the signal value at a particular sample point is estimated by a weighted average of sample points over a search neighborhood. The NLM filter effectively removes the noise when there are similarities among the samples of the signal over the search neighborhood. Due to the time-varying nature of the vocal-tract system and excitation source, the magnitude and frequency of the speech signal vary over the time. Consequently, NLM filtering is not effective in removing the noise components from the speech signal. The similarity among the sample points can be improved by classifying the speech signal into different categories depending on the magnitude and frequency components. In a given speech signal, the vowel-like speech (VLS) are high-magnitude regions compared to the other non-VLS. The vowel, semivowel and diphthong sound units are collectively termed as VLS. In this work, at the first level, the noisy speech signal is classified into VLS and non-VLS for improving similarity. Next, the non-local similarity present within the VLS and the non-VLS is exploited separately for an effective speech enhancement through NLM filtering. The experimental results presented in this study show that the proposed approach provides better denoising performance when compared with the NLM filtering without speech classification as well as recently reported speech enhancement methods. The hardware architecture of the proposed approach is also designed and prototyped on FPGA.

中文翻译:

一种基于分类的非局部均值自适应语音增强滤波及其FPGA原型

非局部均值 (NLM) 自适应滤波是一种经过充分探索的用于图像和心电图信号去噪的技术。在 NLM 滤波中,特定样本点的信号值是通过搜索邻域上样本点的加权平均值来估计的。当搜索邻域上的信号样本之间存在相似性时,NLM 滤波器可以有效地去除噪声。由于声道系统和激励源的时变特性,语音信号的幅度和频率随时间变化。因此,NLM 滤波不能有效地从语音信号中去除噪声成分。通过根据幅度和频率分量将语音信号分为不同类别,可以提高样本点之间的相似性。在给定的语音信号中,与其他非 VLS 相比,类元音语音 (VLS) 是高幅度区域。元音、半元音和双元音单位统称为 VLS。在这项工作中,在第一级,有噪声的语音信号被分类为 VLS 和非 VLS,以提高相似度。接下来,VLS 和非 VLS 中存在的非局部相似性被分别利用,以通过 NLM 过滤进行有效的语音增强。本研究中提出的实验结果表明,与没有语音分类的 NLM 滤波以及最近报道的语音增强方法相比,所提出的方法提供了更好的去噪性能。所提出的方法的硬件架构也在FPGA上设计和原型化。半元音和双元音单位统称为 VLS。在这项工作中,在第一级,有噪声的语音信号被分类为 VLS 和非 VLS,以提高相似度。接下来,VLS 和非 VLS 中存在的非局部相似性被分别利用,以通过 NLM 过滤进行有效的语音增强。本研究中提出的实验结果表明,与没有语音分类的 NLM 滤波以及最近报道的语音增强方法相比,所提出的方法提供了更好的去噪性能。所提出的方法的硬件架构也在FPGA上设计和原型化。半元音和双元音单位统称为 VLS。在这项工作中,在第一级,有噪声的语音信号被分类为 VLS 和非 VLS,以提高相似度。接下来,VLS 和非 VLS 中存在的非局部相似性被分别利用,以通过 NLM 过滤进行有效的语音增强。本研究中提出的实验结果表明,与没有语音分类的 NLM 滤波以及最近报道的语音增强方法相比,所提出的方法提供了更好的去噪性能。所提出的方法的硬件架构也在FPGA上设计和原型化。为了提高相似度,将带噪语音信号分为 VLS 和非 VLS。接下来,VLS 和非 VLS 中存在的非局部相似性被分别利用,以通过 NLM 过滤进行有效的语音增强。本研究中提出的实验结果表明,与没有语音分类的 NLM 滤波以及最近报道的语音增强方法相比,所提出的方法提供了更好的去噪性能。所提出的方法的硬件架构也在FPGA上设计和原型化。为了提高相似度,将带噪语音信号分为 VLS 和非 VLS。接下来,VLS 和非 VLS 中存在的非局部相似性被单独利用,以通过 NLM 过滤进行有效的语音增强。本研究中提出的实验结果表明,与没有语音分类的 NLM 滤波以及最近报道的语音增强方法相比,所提出的方法提供了更好的去噪性能。所提出的方法的硬件架构也在FPGA上设计和原型化。本研究中提出的实验结果表明,与没有语音分类的 NLM 滤波以及最近报道的语音增强方法相比,所提出的方法提供了更好的去噪性能。所提出的方法的硬件架构也在FPGA上设计和原型化。本研究中提出的实验结果表明,与没有语音分类的 NLM 滤波以及最近报道的语音增强方法相比,所提出的方法提供了更好的去噪性能。所提出的方法的硬件架构也在FPGA上设计和原型化。
更新日期:2019-09-25
down
wechat
bug