当前位置: X-MOL 学术Int. J. Micro. Air Veh. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Hear-and-avoid for unmanned air vehicles using convolutional neural networks
International Journal of Micro Air Vehicles ( IF 1.4 ) Pub Date : 2021-02-10 , DOI: 10.1177/1756829321992137
Dirk Wijnker 1 , Tom van Dijk 1 , Mirjam Snellen 2 , Guido de Croon 1 , Christophe De Wagter 1
Affiliation  

To investigate how an unmanned air vehicle can detect manned aircraft with a single microphone, an audio data set is created in which unmanned air vehicle ego-sound and recorded aircraft sound are mixed together. A convolutional neural network is used to perform air traffic detection. Due to restrictions on flying unmanned air vehicles close to aircraft, the data set has to be artificially produced, so the unmanned air vehicle sound is captured separately from the aircraft sound. They are then mixed with unmanned air vehicle recordings, during which labels are given indicating whether the mixed recording contains aircraft audio or not. The model is a convolutional neural network that uses the features Mel frequency cepstral coefficient, spectrogram or Mel spectrogram as input. For each feature, the effect of unmanned air vehicle/aircraft amplitude ratio, the type of labeling, the window length and the addition of third party aircraft sound database recordings are explored. The results show that the best performance is achieved using the Mel spectrogram feature. The performance increases when the unmanned air vehicle/aircraft amplitude ratio is decreased, when the time window is increased or when the data set is extended with aircraft audio recordings from a third party sound database. Although the currently presented approach has a number of false positives and false negatives that is still too high for real-world application, this study indicates multiple paths forward that can lead to an interesting performance. Finally, the data set is provided as open access.



中文翻译:

使用卷积神经网络进行无人驾驶飞机的听与回避

为了研究无人飞行器如何使用单个麦克风检测有人驾驶飞机,创建了一个音频数据集,其中无人飞行器的自我声音和记录的飞机声音混合在一起。卷积神经网络用于执行空中交通检测。由于在靠近飞机的地方飞行无人飞行器的限制,数据集必须人为产生,因此无人飞行器的声音与飞行器的声音分开捕获。然后将它们与无人飞行器记录混合,在此期间给出标签,指示混合记录是否包含飞机音频。该模型是一个卷积神经网络,使用梅尔频率倒谱系数,频谱图或梅尔频谱图作为输入。对于每个功能,探讨了无人飞行器/飞机振幅比,标签类型,窗口长度以及第三方飞机声音数据库记录的影响。结果表明,使用梅尔光谱图功能可获得最佳性能。当无人飞行器/飞机振幅比降低,时间窗口增加或数据集使用来自第三方声音数据库的飞机音频记录进行扩展时,性能会提高。尽管当前提出的方法存在许多误报和误报,但对于实际应用而言仍然过高,但这项研究表明,前进的多条路径可能会导致有趣的性能。最后,将数据集提供为开放访问。探讨了窗口长度和第三方飞机声音数据库记录的增加。结果表明,使用梅尔光谱图功能可获得最佳性能。当无人飞行器/飞机振幅比降低,时间窗口增加或数据集使用来自第三方声音数据库的飞机音频记录进行扩展时,性能会提高。尽管当前提出的方法存在许多误报和误报,但对于实际应用而言仍然过高,但这项研究表明,前进的多条路径可能会导致有趣的性能。最后,将数据集提供为开放访问。探讨了窗口长度和第三方飞机声音数据库记录的增加。结果表明,使用梅尔光谱图功能可获得最佳性能。当无人飞行器/飞机振幅比降低,时间窗口增加或数据集使用来自第三方声音数据库的飞机音频记录进行扩展时,性能会提高。尽管当前提出的方法存在许多误报和误报,但对于实际应用而言仍然过高,但这项研究表明,前进的多条路径可能会导致有趣的性能。最后,将数据集提供为开放访问。当无人飞行器/飞机振幅比降低,时间窗口增加或数据集使用来自第三方声音数据库的飞机音频记录进行扩展时,性能会提高。尽管当前提出的方法存在许多误报和误报,但对于实际应用而言仍然过高,但这项研究表明,前进的多条路径可能会导致有趣的性能。最后,将数据集提供为开放访问。当降低无人飞行器/飞机的振幅比,增加时间窗口或使用来自第三方声音数据库的飞机音频记录扩展数据集时,性能会提高。尽管当前提出的方法存在许多误报和误报,但对于实际应用而言仍然过高,但这项研究表明,前进的多条路径可能会导致有趣的性能。最后,将数据集提供为开放访问。尽管当前提出的方法存在许多误报和误报,但对于实际应用而言仍然过高,但这项研究表明,前进的多条路径可能会导致有趣的性能。最后,将数据集提供为开放访问。尽管当前提出的方法存在许多误报和误报,但对于实际应用而言仍然过高,但这项研究表明,前进的多条路径可能会导致有趣的性能。最后,将数据集提供为开放访问。

更新日期:2021-02-11
down
wechat
bug