当前位置: X-MOL 学术Neurocomputing › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Multi-attention Guided Feature Fusion Network for Salient Object Detection
Neurocomputing ( IF 6 ) Pub Date : 2020-10-01 , DOI: 10.1016/j.neucom.2020.06.021
Anni Li , JinQing Qi , Huchuan Lu

Abstract Though with the rapid development of deep learning, salient object detection methods have achieved increasingly better performance, how to get effective feature representation to predict more accurate saliency maps is still a burning problem we need to consider. To overcome this situation, most previous works tend to focus on skip-based architecture to integrate hierarchical information of different scales and layers. However, a simple concatenation of high-level features and low-level features is not all-powerful because cluttered and noisy information can cause negative consequences. Concerning the issue mentioned above, we propose a Multi-Attention guided Feature-fusion network (MAF) which can alleviate the problem from two aspects. For one thing, we use a novel Channel-wise Attention Block (CAB) to in charge of message passing layer by layer from a global view, which utilizes the semantic cues in the higher convolutional block to instruct the feature selection in the lower block. For another, a Position Attention Block (PAB) also works on integrated features to model pixel relationships and capture rich contextual dependencies. Under the guidance of multi-attention, discriminative features are selected to conduct a new end-to-end densely supervised encoder-decoder network which detects salient objects more uniformly and precisely. As the experimental results on five benchmark datasets show, our methods perform favorably against other state-of-the-art approaches.



摘要 尽管随着深度学习的快速发展,显着目标检测方法已经取得了越来越好的性能,但如何获得有效的特征表示来预测更准确的显着图仍然是我们需要考虑的一个亟待解决的问题。为了克服这种情况,以前的大多数工作都倾向于关注基于跳过的架构来集成不同尺度和层的层次信息。然而,高级特征和低级特征的简单串联并不是万能的,因为杂乱和嘈杂的信息会导致负面后果。针对上述问题,我们提出了一个多注意引导的特征融合网络(MAF),它可以从两个方面缓解这个问题。一方面,我们使用一种新颖的 Channel-wise Attention Block (CAB) 从全局角度负责逐层传递消息,它利用较高卷积块中的语义线索来指示较低块中的特征选择。另一方面,位置注意块 (PAB) 也可用于集成特征以模拟像素关系并捕获丰富的上下文依赖关系。在多注意力的指导下,选择判别特征来进行新的端到端密集监督的编码器 - 解码器网络,该网络可以更一致和精确地检测显着对象。正如五个基准数据集的实验结果所示,我们的方法与其他最先进的方法相比表现良好。它利用较高卷积块中的语义线索来指示较低块中的特征选择。另一方面,位置注意块 (PAB) 也可用于集成特征以模拟像素关系并捕获丰富的上下文依赖关系。在多注意力的指导下,选择判别特征来进行新的端到端密集监督的编码器 - 解码器网络,该网络可以更一致和精确地检测显着对象。正如五个基准数据集的实验结果所示,我们的方法与其他最先进的方法相比表现良好。它利用较高卷积块中的语义线索来指示较低块中的特征选择。另一方面,位置注意块 (PAB) 也可用于集成特征以模拟像素关系并捕获丰富的上下文依赖关系。在多注意力的指导下,选择判别特征来进行新的端到端密集监督的编码器 - 解码器网络,该网络更一致和精确地检测显着对象。正如五个基准数据集的实验结果所示,我们的方法与其他最先进的方法相比表现良好。选择判别特征来进行新的端到端密集监督的编码器 - 解码器网络,该网络可以更一致和精确地检测显着对象。正如五个基准数据集的实验结果所示,我们的方法与其他最先进的方法相比表现良好。选择判别特征来进行新的端到端密集监督的编码器 - 解码器网络,该网络可以更一致和精确地检测显着对象。正如五个基准数据集的实验结果所示,我们的方法与其他最先进的方法相比表现良好。