当前位置: X-MOL 学术Pattern Recogn. Lett. › 论文详情
TrSeg: transformer for semantic segmentation
Pattern Recognition Letters ( IF 3.255 ) Pub Date : 2021-05-04 , DOI: 10.1016/j.patrec.2021.04.024
Youngsaeng Jin, David Han, Hanseok Ko

Recent efforts in semantic segmentation using deep learning frameworks have made notable advances. However, capturing the existence of objects in an image at multiple scales still remains a challenge. In this paper, we address the semantic segmentation task based on transformer architecture. Unlike existing methods that capture multi-scale contextual information through infusing every single-scale piece of information from parallel paths, we propose a novel semantic segmentation network incorporating a transformer (TrSeg) to adaptively capture multi-scale information with the dependencies on original contextual information. Given the original contextual information as keys and values, the multi-scale contextual information from the multi-scale pooling module as queries is transformed by the transformer decoder. The experimental results show that TrSeg outperforms the other methods of capturing multi-scale information by large margins.



中文翻译:

TrSeg:用于语义分段的转换器

使用深度学习框架进行语义分割的最新努力取得了显着进展。然而,以多个比例捕捉图像中对象的存在仍然是一个挑战。在本文中,我们解决了基于转换器架构的语义分割任务。与现有的通过从并行路径中注入每个单尺度信息来捕获多尺度上下文信息的现有方法不同,我们提出了一种新颖的语义分段网络,该网络结合了转换器(TrSeg)来自适应地捕获依赖于原始上下文信息的多尺度信息。给定原始上下文信息作为键和值,来自多尺度合并模块的多尺度上下文信息作为查询由变换器解码器转换。

更新日期:2021-05-04
全部期刊列表>>
欢迎新作者ACS
聚焦环境污染物
专攻离子通道生理学研究
中国作者高影响力研究精选
虚拟特刊
屿渡论文,编辑服务
浙大
上海中医药大学
苏州大学
江南大学
四川大学
灵长脑研究中心
毛凌玲
南开大学陈瑶
朱如意
中科院
南开大学
隐藏1h前已浏览文章
课题组网站
新版X-MOL期刊搜索和高级搜索功能介绍
ACS材料视界
华辉
天合科研
x-mol收录
试剂库存
down
wechat
bug