当前位置: X-MOL 学术Inf. Process. Manag. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A three-level classification of French tweets in ecological crises
Information Processing & Management ( IF 8.6 ) Pub Date : 2020-05-26 , DOI: 10.1016/j.ipm.2020.102284
Diego Kozlowski , Elisa Lannelongue , Frédéric Saudemont , Farah Benamara , Alda Mari , Véronique Moriceau , Abdelmoumene Boumadane

The possibilities that emerge from micro-blogging generated content for crisis-related situations make automatic crisis management using natural language processing techniques a hot research topic. Our aim here is to contribute to this line of research focusing for the first time on French tweets related to ecological crises in order to support the French Civil Security and Crisis Management Department to provide immediate feedback on the expectations of the populations involved in the crisis. We propose a new dataset manually annotated according to three dimensions: relatedness, urgency and intentions to act. We then experiment with binary classification (useful vs. non useful), three-class (non useful vs. urgent vs. non urgent) and multiclass classification (i.e., intention to act categories) relying on traditional feature-based machine learning using both state of the art and new features. We also explore several deep learning models trained with pre-trained word embeddings as well as contextual embeddings. We then investigate three transfer learning strategies to adapt these models to the crisis domain. We finally experiment with multi-input architectures by incorporating different metadata extra-features to the network. Our deep models, evaluated in random sampling, out-of-event and out-of-type configurations, show very good performances outperforming several competitive baselines. Our results define the first contribution to the field of crisis management in French social media.



中文翻译:

生态危机中法国推文的三级分类

通过微博生成的与危机相关的情况的内容所产生的可能性使使用自然语言处理技术进行自动危机管理成为一个热门研究课题。我们的目的是为这条研究线做出贡献,这是首次将重点放在与生态危机有关的法国推文上,以支持法国民防和危机管理部就涉及危机的人们的期望提供即时反馈。我们提出了一个新的数据集,该数据集根据三个维度进行了手动注释:相关性,紧迫性和行动意图。然后,我们对二进制分类(有用与非有用),三类(无用与紧急与非紧急)和多类分类(即,意图行动类别),依靠使用最新技术和新功能的基于传统功能的机器学习。我们还探索了几种经过预训练的词嵌入以及上下文嵌入训练的深度学习模型。然后,我们研究了三种转移学习策略,以使这些模型适应危机领域。最后,我们通过将不同的元数据额外功能合并到网络中,对多输入体系结构进行了试验。我们的深度模型在随机抽样,事件外和类型过失的配置下进行了评估,显示出优于几个竞争基准的出色性能。我们的结果确定了法国社交媒体对危机管理领域的第一项贡献。我们还探索了几种经过预训练的词嵌入以及上下文嵌入训练的深度学习模型。然后,我们研究了三种转移学习策略,以使这些模型适应危机领域。最后,我们通过将不同的元数据额外功能合并到网络中,对多输入体系结构进行了试验。我们的深度模型在随机抽样,事件外和类型过失的配置下进行了评估,显示出优于几个竞争基准的出色性能。我们的结果确定了法国社交媒体对危机管理领域的第一项贡献。我们还探索了几种经过预训练的词嵌入以及上下文嵌入训练的深度学习模型。然后,我们研究了三种转移学习策略,以使这些模型适应危机领域。最后,我们通过将不同的元数据额外功能合并到网络中,对多输入体系结构进行了试验。我们的深度模型在随机抽样,事件外和类型过失的配置下进行了评估,显示出优于几个竞争基准的出色性能。我们的结果确定了法国社交媒体对危机管理领域的第一项贡献。最后,我们通过将不同的元数据额外功能合并到网络中,对多输入体系结构进行了试验。我们的深度模型在随机抽样,事件外和类型过失的配置下进行了评估,显示出优于几个竞争基准的出色性能。我们的结果确定了法国社交媒体对危机管理领域的第一项贡献。最后,我们通过将不同的元数据额外功能合并到网络中,对多输入体系结构进行了试验。我们的深度模型在随机抽样,事件外和类型过失的配置下进行了评估,显示出优于几个竞争基准的出色性能。我们的结果确定了法国社交媒体对危机管理领域的第一项贡献。

更新日期:2020-05-26
down
wechat
bug