当前位置: X-MOL 学术Remote Sens. Environ. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Detecting mammals in UAV images: Best practices to address a substantially imbalanced dataset with deep learning
Remote Sensing of Environment ( IF 11.1 ) Pub Date : 2018-10-01 , DOI: 10.1016/j.rse.2018.06.028
Benjamin Kellenberger , Diego Marcos , Devis Tuia

Abstract Knowledge over the number of animals in large wildlife reserves is a vital necessity for park rangers in their efforts to protect endangered species. Manual animal censuses are dangerous and expensive, hence Unmanned Aerial Vehicles (UAVs) with consumer level digital cameras are becoming a popular alternative tool to estimate livestock. Several works have been proposed that semi-automatically process UAV images to detect animals, of which some employ Convolutional Neural Networks (CNNs), a recent family of deep learning algorithms that proved very effective in object detection in large datasets from computer vision. However, the majority of works related to wildlife focuses only on small datasets (typically subsets of UAV campaigns), which might be detrimental when presented with the sheer scale of real study areas for large mammal census. Methods may yield thousands of false alarms in such cases. In this paper, we study how to scale CNNs to large wildlife census tasks and present a number of recommendations to train a CNN on a large UAV dataset. We further introduce novel evaluation protocols that are tailored to censuses and model suitability for subsequent human verification of detections. Using our recommendations, we are able to train a CNN reducing the number of false positives by an order of magnitude compared to previous state-of-the-art. Setting the requirements at 90% recall, our CNN allows to reduce the amount of data required for manual verification by three times, thus making it possible for rangers to screen all the data acquired efficiently and to detect almost all animals in the reserve automatically.

中文翻译:

检测无人机图像中的哺乳动物:通过深度学习解决严重不平衡数据集的最佳实践

摘要 了解大型野生动物保护区中动物的数量对于公园管理员保护濒危物种至关重要。手动动物普查既危险又昂贵,因此配备消费级数码相机的无人驾驶飞行器 (UAV) 正成为估算牲畜的流行替代工具。已经提出了一些半自动处理无人机图像以检测动物的工作,其中一些使用卷积神经网络 (CNN),这是最近的一系列深度学习算法,在计算机视觉的大型数据集中的对象检测中证明非常有效。然而,大多数与野生动物相关的工作只关注小数据集(通常是无人机活动的子集),当以大型哺乳动物普查的真实研究区域的绝对规模呈现时,这可能是有害的。在这种情况下,方法可能会产生数以千计的误报。在本文中,我们研究了如何将 CNN 扩展到大型野生动物普查任务,并提出了一些建议,以在大型无人机数据集上训练 CNN。我们进一步介绍了针对人口普查和模型适用性量身定制的新颖评估协议,以供随后的人类检测验证。使用我们的建议,我们能够训练 CNN,与之前的最新技术相比,将误报数量减少一个数量级。将要求设置为 90% 召回率,我们的 CNN 允许将人工验证所需的数据量减少三倍,从而使护林员能够有效筛选所有获取的数据并自动检测保护区中的几乎所有动物。在本文中,我们研究了如何将 CNN 扩展到大型野生动物普查任务,并提出了一些建议,以在大型无人机数据集上训练 CNN。我们进一步介绍了针对人口普查和模型适用性量身定制的新颖评估协议,以供随后的人类检测验证。使用我们的建议,我们能够训练 CNN,与之前的最新技术相比,将误报数量减少一个数量级。将要求设置为 90% 召回率,我们的 CNN 允许将人工验证所需的数据量减少三倍,从而使护林员能够有效筛选所有获取的数据并自动检测保护区中的几乎所有动物。在本文中,我们研究了如何将 CNN 扩展到大型野生动物普查任务,并提出了一些建议,以在大型无人机数据集上训练 CNN。我们进一步介绍了针对人口普查和模型适用性量身定制的新颖评估协议,以供随后的人类检测验证。使用我们的建议,我们能够训练 CNN,与之前的最新技术相比,将误报数量减少一个数量级。将要求设置为 90% 召回率,我们的 CNN 允许将人工验证所需的数据量减少三倍,从而使护林员能够有效筛选所有获取的数据并自动检测保护区中的几乎所有动物。我们研究了如何将 CNN 扩展到大型野生动物普查任务,并提出了一些建议,以在大型无人机数据集上训练 CNN。我们进一步介绍了针对人口普查和模型适用性量身定制的新颖评估协议,以供随后的人类检测验证。使用我们的建议,我们能够训练 CNN,与之前的最新技术相比,将误报数量减少一个数量级。将要求设置为 90% 召回率,我们的 CNN 允许将人工验证所需的数据量减少三倍,从而使护林员能够有效筛选所有获取的数据并自动检测保护区中的几乎所有动物。我们研究了如何将 CNN 扩展到大型野生动物普查任务,并提出了一些建议,以在大型无人机数据集上训练 CNN。我们进一步介绍了针对人口普查和模型适用性量身定制的新颖评估协议,以供随后的人类检测验证。使用我们的建议,我们能够训练 CNN,与之前的最新技术相比,将误报数量减少一个数量级。将要求设置为 90% 召回率,我们的 CNN 允许将人工验证所需的数据量减少三倍,从而使护林员能够有效筛选所有获取的数据并自动检测保护区中的几乎所有动物。我们进一步介绍了针对人口普查和模型适用性量身定制的新颖评估协议,以供随后的人类检测验证。使用我们的建议,我们能够训练 CNN,与之前的最新技术相比,将误报数量减少一个数量级。将要求设置为 90% 召回率,我们的 CNN 允许将人工验证所需的数据量减少三倍,从而使护林员能够有效筛选所有获取的数据并自动检测保护区中的几乎所有动物。我们进一步介绍了针对人口普查和模型适用性量身定制的新颖评估协议,以供随后的人类检测验证。使用我们的建议,我们能够训练 CNN,与之前的最新技术相比,将误报数量减少一个数量级。将要求设置为 90% 召回率,我们的 CNN 允许将人工验证所需的数据量减少三倍,从而使护林员能够有效筛选所有获取的数据并自动检测保护区中的几乎所有动物。
更新日期:2018-10-01
down
wechat
bug