当前位置: X-MOL 学术IEEE ACM Trans. Audio Speech Lang. Process. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Dynamic Compressive Gammachirp Auditory Filterbank.
IEEE/ACM Transactions on Audio, Speech, and Language Processing ( IF 5.4 ) Pub Date : 2006-11-01 , DOI: 10.1109/tasl.2006.874669
Toshio Irino 1 , Roy D Patterson
Affiliation  

It is now common to use knowledge about human auditory processing in the development of audio signal processors. Until recently, however, such systems were limited by their linearity. The auditory filter system is known to be level-dependent as evidenced by psychophysical data on masking, compression, and two-tone suppression. However, there were no analysis/synthesis schemes with nonlinear filterbanks. This paper describe18300060s such a scheme based on the compressive gammachirp (cGC) auditory filter. It was developed to extend the gammatone filter concept to accommodate the changes in psychophysical filter shape that are observed to occur with changes in stimulus level in simultaneous, tone-in-noise masking. In models of simultaneous noise masking, the temporal dynamics of the filtering can be ignored. Analysis/synthesis systems, however, are intended for use with speech sounds where the glottal cycle can be long with respect to auditory time constants, and so they require specification of the temporal dynamics of auditory filter. In this paper, we describe a fast-acting level control circuit for the cGC filter and show how psychophysical data involving two-tone suppression and compression can be used to estimate the parameter values for this dynamic version of the cGC filter (referred to as the "dcGC" filter). One important advantage of analysis/synthesis systems with a dcGC filterbank is that they can inherit previously refined signal processing algorithms developed with conventional short-time Fourier transforms (STFTs) and linear filterbanks.

中文翻译:

动态压缩 Gammachirp 听觉滤波器组。

现在在音频信号处理器的开发中使用有关人类听觉处理的知识是很常见的。然而,直到最近,此类系统还受到其线性度的限制。众所周知,听觉滤波器系统是与电平相关的,如掩蔽、压缩和双音抑制的心理物理数据所证明的那样。然而,没有非线性滤波器组的分析/综合方案。本文描述了 18300060 年代这样一种基于压缩伽马啁啾 (cGC) 听觉滤波器的方案。它的开发是为了扩展 gammatone 过滤器的概念,以适应在同步噪声掩蔽中随着刺激水平的变化而观察到的心理物理过滤器形状的变化。在同步噪声屏蔽模型中,可以忽略滤波的时间动态。然而,分析/综合系统,旨在用于声门周期相对于听觉时间常数可能很长的语音,因此它们需要指定听觉滤波器的时间动态。在本文中,我们描述了 cGC 滤波器的快速响应电平控制电路,并展示了如何使用涉及双音抑制和压缩的心理物理数据来估计该 cGC 滤波器动态版本的参数值(称为“dcGC”过滤器)。具有 dcGC 滤波器组的分析/合成系统的一项重要优势是,它们可以继承以前使用传统短时傅立叶变换 (STFT) 和线性滤波器组开发的精细信号处理算法。因此他们需要对听觉滤波器的时间动态进行规范。在本文中,我们描述了 cGC 滤波器的快速作用电平控制电路,并展示了如何使用涉及双音抑制和压缩的心理物理数据来估计 cGC 滤波器的这个动态版本的参数值(称为“dcGC”过滤器)。具有 dcGC 滤波器组的分析/合成系统的一项重要优势是,它们可以继承以前使用传统短时傅立叶变换 (STFT) 和线性滤波器组开发的精细信号处理算法。因此他们需要对听觉滤波器的时间动态进行规范。在本文中,我们描述了 cGC 滤波器的快速作用电平控制电路,并展示了如何使用涉及双音抑制和压缩的心理物理数据来估计 cGC 滤波器的这个动态版本的参数值(称为“dcGC”过滤器)。具有 dcGC 滤波器组的分析/合成系统的一项重要优势是,它们可以继承以前使用传统短时傅立叶变换 (STFT) 和线性滤波器组开发的精细信号处理算法。我们描述了 cGC 滤波器的快速作用电平控制电路,并展示了如何使用涉及双音抑制和压缩的心理物理数据来估计 cGC 滤波器的这个动态版本(称为“dcGC”滤波器)的参数值)。具有 dcGC 滤波器组的分析/合成系统的一项重要优势是,它们可以继承以前使用传统短时傅立叶变换 (STFT) 和线性滤波器组开发的精细信号处理算法。我们描述了 cGC 滤波器的快速作用电平控制电路,并展示了如何使用涉及双音抑制和压缩的心理物理数据来估计 cGC 滤波器的这个动态版本(称为“dcGC”滤波器)的参数值)。具有 dcGC 滤波器组的分析/合成系统的一项重要优势是,它们可以继承以前使用传统短时傅立叶变换 (STFT) 和线性滤波器组开发的精细信号处理算法。
更新日期:2019-11-01
down
wechat
bug