视觉问答：哪些调查过的应用程序？,arXiv - CS - Computer Vision and Pattern Recognition - X-MOL

当前位置： X-MOL 学术 › arXiv.cs.CV › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

视觉问答：哪些调查过的应用程序？
arXiv - CS - Computer Vision and Pattern Recognition Pub Date : 2021-03-04 , DOI: arxiv-2103.02937
Silvio Barra, Carmen Bisogni, Maria De Marsico, Stefano Ricciardi

视觉问答（VQA）是一个非常刺激和具有挑战性的研究领域，计算机视觉（CV）和自然语言过程（NLP）最近相遇了。在图像字幕和视频摘要中，语义信息完全包含在静态图像或视频动态信息中，并且只需以与人类一致的方式进行挖掘和表达即可。与此不同的是，在VQA中，必须将同一媒体中的语义信息与以自然语言表达的问题所隐含的语义进行比较，从而使与人工智能相关的工作加倍。最近有关VQA方法的一些调查集中在与图像相关的处理或与语言相关的处理基础的方法上，或集中于始终融合所传达信息的方法上。仅建议可能的应用，实际上，大多数被引用的著作都依赖于用于评估VQA系统构件的通用数据集。本文宁愿考虑针对实际应用程序的建议，也可能将绑定到应用程序域的合适数据用作基准。本文还报告了VQA研究中的一些近期挑战。

"点击查看英文标题和摘要"

更新日期：2021-03-05

点击分享查看原文

点击收藏

阅读更多本刊最新论文

相关文章参考文献引文

点击加载相关文章

全部期刊列表>>

阿拉丁

英语语言编辑翻译加编辑

专注于基础生命科学与临床研究的交叉领域

遥感数据采集

数字地球

开学添书香，满额有好礼

加速出版服务

编辑润色服务全线九折优惠

传播分子、细胞和发育生物学领域的重大发现

环境管理资源效率浪费最小化

先进材料生物材料

聚焦分子细胞和生物体生物学

“转化老年科学”.正在征稿

化学工程

wiley你是哪种学术人格

细胞生物学

100+材料学期刊

人工智能新刊

图书出版流程

征集眼内治疗给药新技术

英语语言编辑服务

快速找到合适的投稿机会

动态系统的数学与计算机建模

热点论文一站获取

定位全球科研英才

中国图象图形学学会合作刊

东北石油大学合作期刊

动物源性食品遗传学与育种

专业英语编辑服务

中科大

华盛顿

上海交大

中山大学

西湖大学

药物所

普渡大学

东方理工

ACS材料视界

客服邮箱：service@x-mol.com
官方微信：X-molTeam2
邮编：100098
地址：北京市海淀区知春路56号中航科技大厦

bug