当前位置: X-MOL 学术Vis. Comput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
CGAN: closure-guided attention network for salient object detection
The Visual Computer ( IF 3.0 ) Pub Date : 2021-07-14 , DOI: 10.1007/s00371-021-02222-2
Dibyendu Kumar Das 1 , Sahadeb Shit 1 , Dip Narayan Ray 1, 2 , Somajyoti Majumder 2
Affiliation  

In recent years, salient object detection (SOD) has achieved significant progress with the help of convolution neural network (CNN). Most of the state-of-the-art methods segment the salient object by either aggregating the multilevel features from the CNN module or introducing the refinement module along with the baseline network. However, these models suffer from simplicity bias, where neural networks converge to global minima using the simple feature and remain invariant to complex predictive features. Very few methods concentrate on the neurophysiological behaviour of visual attention. As per Gestalt psychology, humans tend to perceive the objects as a whole rather than focus on the discrete elements of that object. The law of Closure (closed contour) is one of the Gestalt axioms that states that if there is a discontinuity in the object’s contour, we perceive the object as continuous in a smooth pattern. This paper proposes a two-way learning network, where Closure-guided Attention Network (CGAN) and the Coarse Saliency Networks (CSN) jointly supervise the feature-channel to mitigate the simplicity bias. Furthermore, a channel-wise attention residual network is incorporated in the Closure Guided module to alleviate the scale-space problem and generate smooth object contour. Finally, the closure map from CGAN fused with the coarse saliency map of the Coarse Saliency Network generates a salient object. Experimental result on five benchmark datasets demonstrates the significant improvements in our approach over the state-of-the-art method.



中文翻译:

CGAN:用于显着目标检测的闭包引导注意网络

近年来,显着目标检测(SOD)在卷积神经网络(CNN)的帮助下取得了重大进展。大多数最先进的方法通过聚合来自 CNN 模块的多级特征或引入细化模块以及基线网络来分割显着对象。然而,这些模型存在简单性偏差,其中神经网络使用简单特征收敛到全局最小值,并且对复杂的预测特征保持不变。很少有方法专注于视觉注意的神经生理行为。根据格式塔心理学,人类倾向于将对象视为一个整体,而不是关注该对象的离散元素。闭合定律(闭合轮廓)是格式塔公理之一,它指出,如果对象的轮廓存在不连续性,我们会认为该对象以平滑的模式连续。本文提出了一种双向学习网络,其中闭包引导注意网络 (CGAN) 和粗显着网络 (CSN) 共同监督特征通道以减轻简单性偏差。此外,Closure Guided 模块中加入了一个通道方向的注意力残差网络,以缓解尺度空间问题并生成平滑的对象轮廓。最后,来自 CGAN 的闭包图与粗显着网络的粗显着图融合生成一个显着对象。在五个基准数据集上的实验结果表明,我们的方法比最先进的方法有了显着的改进。我们认为物体以平滑的模式连续。本文提出了一种双向学习网络,其中闭包引导注意网络 (CGAN) 和粗显着网络 (CSN) 共同监督特征通道以减轻简单性偏差。此外,Closure Guided 模块中加入了一个通道方向的注意力残差网络,以缓解尺度空间问题并生成平滑的对象轮廓。最后,来自 CGAN 的闭包图与粗显着网络的粗显着图融合生成一个显着对象。在五个基准数据集上的实验结果表明,我们的方法比最先进的方法有了显着的改进。我们认为物体以平滑的模式连续。本文提出了一种双向学习网络,其中闭包引导注意网络 (CGAN) 和粗显着网络 (CSN) 共同监督特征通道以减轻简单性偏差。此外,Closure Guided 模块中加入了一个通道方向的注意力残差网络,以缓解尺度空间问题并生成平滑的对象轮廓。最后,来自 CGAN 的闭包图与粗显着网络的粗显着图融合生成一个显着对象。在五个基准数据集上的实验结果表明,我们的方法比最先进的方法有了显着的改进。其中闭合引导注意网络(CGAN)和粗显着网络(CSN)共同监督特征通道以减轻简单性偏差。此外,Closure Guided 模块中加入了一个通道方向的注意力残差网络,以缓解尺度空间问题并生成平滑的对象轮廓。最后,来自 CGAN 的闭包图与粗显着网络的粗显着图融合生成一个显着对象。在五个基准数据集上的实验结果表明,我们的方法比最先进的方法有了显着的改进。其中闭合引导注意网络(CGAN)和粗显着网络(CSN)共同监督特征通道以减轻简单性偏差。此外,Closure Guided 模块中加入了一个通道方向的注意力残差网络,以缓解尺度空间问题并生成平滑的对象轮廓。最后,来自 CGAN 的闭包图与粗显着网络的粗显着图融合生成一个显着对象。在五个基准数据集上的实验结果表明,我们的方法比最先进的方法有了显着的改进。最后,来自 CGAN 的闭包图与粗显着网络的粗显着图融合生成一个显着对象。在五个基准数据集上的实验结果表明,我们的方法比最先进的方法有了显着的改进。最后,来自 CGAN 的闭包图与粗显着网络的粗显着图融合生成一个显着对象。在五个基准数据集上的实验结果表明,我们的方法比最先进的方法有了显着的改进。

更新日期:2021-07-14
down
wechat
bug