当前位置: X-MOL 学术Aquat. Ecol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Out of the shadows: automatic fish detection from acoustic cameras
Aquatic Ecology ( IF 1.7 ) Pub Date : 2022-05-26 , DOI: 10.1007/s10452-022-09967-5
R. M. Connolly , K. I. Jinks , A. Shand , M. D. Taylor , T. F. Gaston , A. Becker , E. L. Jinks

Efficacious monitoring of fish stocks is critical for efficient management. Multibeam acoustic cameras, that use sound-reflectance to generate moving pictures, provide an important alternative to traditional video-based methods that are inoperable in turbid waters. However, acoustic cameras, like standard video monitoring methods, produce large volumes of imagery from which it is time consuming and costly to extract data manually. Deep learning, a form of machine learning, can be used to automate the processing and analysis of acoustic data. We used convolutional neural networks (CNNs) to detect and count fish in a publicly available dual-frequency identification sonar (DIDSON) dataset. We compared three types of detections, direct acoustic, acoustic shadows, and a combination of direct and shadows. The deep learning model was highly reliable at detecting fish to obtain abundance data using acoustic data. Model accuracy for counts-per-image was improved by the inclusion of shadows (F1 scores, a measure of the model accuracy: direct 0.79, shadow 0.88, combined 0.90). Model accuracy for MaxN per video was high for all three types of detections (F1 scores: direct 0.90, shadow 0.90, combined 0.91). Our results demonstrate that CNNs are a powerful tool for automating underwater acoustic data analysis. Given this promise, we suggest broadening the scope of testing to include a wider range of fish shapes, sizes, and abundances, with a view to automating species (or ‘morphospecies’) identification and counts.



中文翻译:

走出阴影:声学摄像机的自动鱼类检测

鱼类资源的有效监测对于有效管理至关重要。使用声音反射来生成运动图像的多波束声学相机为传统的基于视频的方法提供了一种重要的替代方案,这些方法在浑水中无法使用。然而,声学摄像机与标准视频监控方法一样,会产生大量图像,手动提取数据既耗时又昂贵。深度学习是机器学习的一种形式,可用于自动处理和分析声学数据。我们使用卷积神经网络 (CNN) 在公开可用的双频识别声纳 (DIDSON) 数据集中检测和计数鱼。我们比较了三种类型的检测,直接声学、声学阴影以及直接和阴影的组合。深度学习模型在检测鱼类以使用声学数据获取丰度数据方面非常可靠。通过包含阴影(F1 分数,模型准确度的衡量标准:直接 0.79,阴影 0.88,组合 0.90)提高了每张图像计数的模型准确性。对于所有三种类型的检测(F1 分数:直接 0.90、阴影 0.90、组合 0.91),每个视频的 MaxN 模型准确度都很高。我们的结果表明,CNN 是自动化水声数据分析的强大工具。鉴于这一承诺,我们建议扩大测试范围以包括更广泛的鱼类形状、大小和丰度,以实现物种(或“形态物种”)识别和计数的自动化。通过包含阴影(F1 分数,模型准确度的衡量标准:直接 0.79,阴影 0.88,组合 0.90)提高了每张图像计数的模型准确性。对于所有三种类型的检测(F1 分数:直接 0.90、阴影 0.90、组合 0.91),每个视频的 MaxN 模型准确度都很高。我们的结果表明,CNN 是自动化水声数据分析的强大工具。鉴于这一承诺,我们建议扩大测试范围以包括更广泛的鱼类形状、大小和丰度,以实现物种(或“形态物种”)识别和计数的自动化。通过包含阴影(F1 分数,模型准确度的衡量标准:直接 0.79,阴影 0.88,组合 0.90)提高了每张图像计数的模型准确性。对于所有三种类型的检测(F1 分数:直接 0.90、阴影 0.90、组合 0.91),每个视频的 MaxN 模型准确度都很高。我们的结果表明,CNN 是自动化水声数据分析的强大工具。鉴于这一承诺,我们建议扩大测试范围以包括更广泛的鱼类形状、大小和丰度,以实现物种(或“形态物种”)识别和计数的自动化。我们的结果表明,CNN 是自动化水声数据分析的强大工具。鉴于这一承诺,我们建议扩大测试范围以包括更广泛的鱼类形状、大小和丰度,以实现物种(或“形态物种”)识别和计数的自动化。我们的结果表明,CNN 是自动化水声数据分析的强大工具。鉴于这一承诺,我们建议扩大测试范围以包括更广泛的鱼类形状、大小和丰度,以实现物种(或“形态物种”)识别和计数的自动化。

更新日期:2022-05-27
down
wechat
bug