Rating news claims: Feature selection and evaluation.,Mathematical Biosciences and Engineering

当前位置： X-MOL 学术 › Math. Biosci. Eng. › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

Rating news claims: Feature selection and evaluation.
Mathematical Biosciences and Engineering Pub Date : 2019-12-19 , DOI: 10.3934/mbe.2020101
Izzat Alsmadi ₁ , Michael J O'Brien ₂

Affiliation

News claims that travel the Internet and online social networks (OSNs) originate from different, sometimes unknown sources, which raises issues related to the credibility of those claims and the drivers behind them. Fact-checking websites such as Snopes, FactCheck, and Emergent use human evaluators to investigate and label news claims, but the process is labor- and time-intensive. Driven by the need to use data analytics and algorithms in assessing the credibility of news claims, we focus on what can be generalized about evaluating human-labeled claims. We developed tools to extract claims from Snopes and Emergent and used public datasets collected by and published on those websites. Claims extracted from those datasets were supervised or labeled with different claim ratings. We focus on claims with definite ratings-false, mostly false, true, and mostly true, with the goal of identifying distinctive features that can be used to distinguish true from false claims. Ultimately, those features can be used to predict future unsupervised or unlabeled claims. We evaluate different methods to extract features as well as different sets of features and their ability to predict the correct claim label. By far, we noticed that OSN websites report high rates of false claims in comparison with most of the other website categories. The rate of reported false claims is higher than the rate of true claims in fact-checking websites in most categories. At the content-analysis level, false claims tend to have more negative tones in sentiments and hence can provide supporting features to predict claim classification.

中文翻译：

评级新闻声明：功能选择和评估。

新闻声称互联网和在线社交网络（OSN）的旅行来自不同的，有时是未知的来源，这引发了与这些声明及其背后的驱动力的信誉有关的问题。事实检查网站（例如Snopes，FactCheck和Emergent）使用人工评估人员来调查和标记新闻声明，但过程耗时且费时。由于需要使用数据分析和算法来评估新闻声明的可信度，因此我们专注于可以对评估以人为标签的声明进行概括的内容。我们开发了从Snopes和Emergent中提取索赔的工具，并使用了由这些网站收集并发布在这些网站上的公共数据集。从这些数据集中提取的声明受到监督或标记有不同的声明等级。我们专注于具有明确等级的声明-虚假，大部分为虚假，真实，多数情况下是真实的，目的是识别可用于区分真实和虚假主张的独特特征。最终，这些功能可用于预测未来的无监督或无标签索赔。我们评估提取特征的不同方法以及特征的不同集合，以及它们预测正确索赔标签的能力。到目前为止，我们注意到OSN网站报告的虚假声明率高于其他大多数网站类别。在大多数类别的事实检查网站中，虚假声明的举报率高于真实声明的率。在内容分析级别，虚假声明往往会在情绪上带有更多负面色彩，因此可以提供支持特征来预测声明分类。目的是确定可用于区分真假主张的鲜明特征。最终，这些功能可用于预测未来的无监督或无标签的索赔。我们评估提取特征的不同方法以及不同的特征集及其预测正确索赔标签的能力。到目前为止，我们注意到OSN网站报告的虚假声明率高于其他大多数网站类别。在大多数类别的事实检查网站中，虚假声明的举报率高于真实声明的率。在内容分析级别，虚假声明往往会在情绪上带有更多负面色彩，因此可以提供支持特征来预测声明分类。目的是确定可用于区分真假主张的鲜明特征。最终，这些功能可用于预测未来的无监督或无标签索赔。我们评估提取特征的不同方法以及特征的不同集合，以及它们预测正确索赔标签的能力。到目前为止，我们注意到OSN网站报告的虚假声明率高于其他大多数网站类别。在大多数类别的事实检查网站中，虚假声明的举报率高于真实声明的率。在内容分析级别，虚假声明往往会在情绪上带有更多负面色彩，因此可以提供支持特征来预测声明分类。这些功能可用于预测未来的无监督或无标签的索赔。我们评估提取特征的不同方法以及特征的不同集合，以及它们预测正确索赔标签的能力。到目前为止，我们注意到OSN网站报告的虚假声明率高于其他大多数网站类别。在大多数类别的事实检查网站中，虚假声明的举报率高于真实声明的率。在内容分析级别，虚假声明往往会在情绪上带有更多负面色彩，因此可以提供支持特征来预测声明分类。这些功能可用于预测未来的无监督或无标签的索赔。我们评估提取特征的不同方法以及特征的不同集合，以及它们预测正确索赔标签的能力。到目前为止，我们注意到OSN网站报告的虚假声明率高于其他大多数网站类别。在大多数类别的事实检查网站中，虚假声明的举报率高于真实声明的率。在内容分析级别，虚假声明往往会在情绪上带有更多负面色彩，因此可以提供支持特征来预测声明分类。我们注意到，与其他大多数网站类别相比，OSN网站报告的虚假声明率很高。在大多数类别的事实检查网站中，虚假声明的举报率高于真实声明的率。在内容分析级别，虚假声明往往会在情绪上带有更多负面色彩，因此可以提供支持特征来预测声明分类。我们注意到，与其他大多数网站类别相比，OSN网站报告的虚假声明率很高。在大多数类别的事实检查网站中，虚假声明的举报率高于真实声明的率。在内容分析级别，虚假声明往往会在情绪上带有更多负面色彩，因此可以提供支持特征来预测声明分类。

更新日期：2019-12-19

点击分享查看原文

点击收藏

公开下载

阅读更多本刊最新论文本刊介绍/投稿指南11