当前位置: X-MOL 学术Ecol. Inform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A hidden Markov model with selective time domain feature extraction to detect inshore Bryde's whale short pulse calls
Ecological Informatics ( IF 5.1 ) Pub Date : 2020-04-02 , DOI: 10.1016/j.ecoinf.2020.101087
O.O. Ogundile , A.M. Usman , O.P. Babalola , D.J.J. Versfeld

An Increase in the study of cetaceans' sounds has motivated the development of different automated sound detection and classification techniques. Passive acoustic monitoring (PAM) is extensively used to study these cetaceans' sounds over a period to understand their daily activities within their ecosystem. Using PAM, the gathered sound datasets are usually large and impractical to manually analyse and detect. Thus, hidden Markov models (HMM) is one of the popular tools used to automatically detect and classify these cetaceans' sounds. Nonetheless, HMM rely heavily on the employed feature extraction method such as Mel-scale frequency cepstral coefficients (MFCC) and linear predictive coding (LPC). In most cases, the more reliable the extracted feature vector from the known sound label, the higher the sensitivity of the HMM. Although these aforementioned feature extraction methods are widely used, their design is based on filters and requires windowing, fast Fourier transforms (FFT), and logarithm operations. Consequently, this increases the computational time complexity of the HMM. Here, we describe a selective time domain feature extraction method that can be easily adapted with the HMM. This proposed feature extraction method uses a combination of some simple but robust parameters such as the mean, relative amplitude and relative power/energy (MAP), which are selected based on empirical observations of the call to be detected. The performance of this proposed MAP-HMM was verified using the acoustic dataset of continuous recordings of an inshore Bryde's whale (Balaenoptera) short pulse calls collected in a single site in False bay, South-West of South Africa. Aside from exhibiting a low computational complexity, the proposed MAP-HMM offers superior sensitivity and false discovery rate performances in comparison to the LPC-HMM and MFCC-HMM.



中文翻译:

具有选择性时域特征提取的隐马尔可夫模型,用于检测近海布赖德的鲸鱼短脉冲呼叫

对鲸类动物声音的研究的增加推动了各种自动声音检测和分类技术的发展。被动声学监测(PAM)被广泛用于研究这些鲸类动物一段时间内的声音,以了解它们在生态系统中的日常活动。使用PAM,收集的声音数据集通常很大,并且手动分析和检测不切实际。因此,隐马尔可夫模型(HMM)是用于自动检测这些鲸类动物的声音并对其进行分类的流行工具之一。尽管如此,HMM严重依赖于所采用的特征提取方法,例如梅尔级频率倒谱系数(MFCC)和线性预测编码(LPC)。在大多数情况下,从已知声音标签中提取的特征向量越可靠,HMM的灵敏度就越高。尽管这些上述特征提取方法被广泛使用,但是它们的设计基于滤波器,并且需要加窗,快速傅立叶变换(FFT)和对数运算。因此,这增加了HMM的计算时间复杂度。在这里,我们描述了一种选择性时域特征提取方法,该方法可以轻松地与HMM配合使用。该提出的特征提取方法使用一些简单但健壮的参数(例如,平均值,相对幅度和相对功率/能量(MAP))的组合,这些参数是基于对要检测的呼叫的经验观察来选择的。这项建议的MAP-HMM的性能已通过连续记录近海Bryde鲸的声学数据集(它们的设计基于滤波器,并且需要加窗,快速傅立叶变换(FFT)和对数运算。因此,这增加了HMM的计算时间复杂度。在这里,我们描述了一种选择性时域特征提取方法,该方法可以轻松地与HMM配合使用。该提出的特征提取方法使用一些简单但健壮的参数(例如,平均值,相对幅度和相对功率/能量(MAP))的组合,这些参数是基于对要检测的呼叫的经验观察来选择的。这项建议的MAP-HMM的性能已通过近海布赖德鲸(它们的设计基于滤波器,并且需要加窗,快速傅立叶变换(FFT)和对数运算。因此,这增加了HMM的计算时间复杂度。在这里,我们描述了一种选择性时域特征提取方法,该方法可以轻松地与HMM配合使用。该提出的特征提取方法使用一些简单但健壮的参数(例如,平均值,相对幅度和相对功率/能量(MAP))的组合,这些参数是基于对要检测的呼叫的经验观察来选择的。这项建议的MAP-HMM的性能已通过连续记录近海Bryde鲸的声学数据集(我们描述了一种选择性时域特征提取方法,该方法可以轻松地与HMM配合使用。该提出的特征提取方法使用一些简单但健壮的参数(例如,平均值,相对幅度和相对功率/能量(MAP))的组合,这些参数是基于对要检测的呼叫的经验观察来选择的。这项建议的MAP-HMM的性能已通过近海布赖德鲸(我们描述了一种选择性时域特征提取方法,该方法可以轻松地与HMM配合使用。该提出的特征提取方法使用一些简单但健壮的参数(例如,平均值,相对幅度和相对功率/能量(MAP))的组合,这些参数是基于对要检测的呼叫的经验观察来选择的。这项建议的MAP-HMM的性能已通过连续记录近海Bryde鲸的声学数据集(Balaenoptera)在南非西南部的False湾的一个地点收集的短脉冲通话。除了具有较低的计算复杂度之外,与LPC-HMM和MFCC-HMM相比,提出的MAP-HMM还具有出色的灵敏度和错误发现率性能。

更新日期:2020-04-02
down
wechat
bug