使用语义信息的语音情感识别,arXiv - CS - Sound - X-MOL

当前位置： X-MOL 学术 › arXiv.cs.SD › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

使用语义信息的语音情感识别
arXiv - CS - Sound Pub Date : 2021-03-04 , DOI: arxiv-2103.02993
Panagiotis Tzirakis, Anh Nguyen, Stefanos Zafeiriou, Björn W. Schuller

语音情感识别是一个至关重要的问题，体现在诸如人机交互和教育之类的众多应用中。尽管近年来已经取得了一些进步，特别是随着深度神经网络（DNN）的出现，但是文献中的大多数研究都没有考虑语音信号中的语义信息。在本文中，我们提出了一种新颖的框架，该框架可以捕获信号中的语义信息和副语言信息。特别地，我们的框架由捕获语义信息的语义特征提取器和捕获副语言信息的副语言特征提取器组成。然后，使用新颖的注意力机制将语义特征和副语言特征都组合为一个统一的表示形式。在最终预测之前，统一的特征向量通过LSTM捕获信号中的时间动态。为了验证我们框架的有效性，我们使用了AVEC挑战系列的流行SEWA数据集，并与三篇获奖论文进行了比较。我们的模型在化合价和喜好维度上提供了最新的结果。

"点击查看英文标题和摘要"

更新日期：2021-03-05

点击分享查看原文

点击收藏

阅读更多本刊最新论文

全部期刊列表>>

阿拉丁

动态系统的数学与计算机建模

热点论文一站获取

购书送好礼

天然纤维材料

口腔微生物

英语语言编辑翻译加编辑

材料学领域约200份+SCI期刊

定位全球科研英才

中国图象图形学学会合作刊

东北石油大学合作期刊

动物源性食品遗传学与育种

专业英语编辑服务

左智伟--多次发布

多次发布---上海中医药

西安电子

中科院

南科大

ACS材料视界

客服邮箱：service@x-mol.com
官方微信：X-molTeam2
邮编：100098
地址：北京市海淀区知春路56号中航科技大厦

bug