当前位置: X-MOL 学术arXiv.cs.IR › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
365 Dots in 2019: Quantifying Attention of News Sources
arXiv - CS - Information Retrieval Pub Date : 2020-03-22 , DOI: arxiv-2003.09989
Alexander C. Nwala, Michele C. Weigle, Michael L. Nelson

We investigate the overlap of topics of online news articles from a variety of sources. To do this, we provide a platform for studying the news by measuring this overlap and scoring news stories according to the degree of attention in near-real time. This can enable multiple studies, including identifying topics that receive the most attention from news organizations and identifying slow news days versus major news days. Our application, StoryGraph, periodically (10-minute intervals) extracts the first five news articles from the RSS feeds of 17 US news media organizations across the partisanship spectrum (left, center, and right). From these articles, StoryGraph extracts named entities (PEOPLE, LOCATIONS, ORGANIZATIONS, etc.) and then represents each news article with its set of extracted named entities. Finally, StoryGraph generates a news similarity graph where the nodes represent news articles, and an edge between a pair of nodes represents a high degree of similarity between the nodes (similar news stories). Each news story within the news similarity graph is assigned an attention score which quantifies the amount of attention the topics in the news story receive collectively from the news media organizations. The StoryGraph service has been running since August 2017, and using this method, we determined that the top news story of 2018 was the "Kavanaugh hearings" with attention score of 25.85 on September 27, 2018. Similarly, the top news story for 2019 so far (2019-12-12) is "AG William Barr's release of his principal conclusions of the Mueller Report," with an attention score of 22.93 on March 24, 2019.

中文翻译:

2019年365点:量化新闻源关注度

我们调查了来自各种来源的在线新闻文章主题的重叠。为此,我们提供了一个研究新闻的平台,通过测量这种重叠并根据近乎实时的关注程度对新闻故事进行评分。这可以实现多项研究,包括确定最受新闻机构关注的主题,以及确定慢新闻日与重大新闻日。我们的应用程序 StoryGraph 会定期(每隔 10 分钟)从 17 个美国新闻媒体组织的 RSS 提要中提取前五篇新闻文章,涵盖党派范围(左、中和右)。从这些文章中,StoryGraph 提取命名实体(PEOPLE、LOCATIONS、ORGANIZATIONS 等),然后用其提取的命名实体集表示每篇新闻文章。最后,StoryGraph 生成一个新闻相似度图,其中节点代表新闻文章,一对节点之间的边代表节点之间的高度相似性(类似新闻报道)。新闻相似度图中的每个新闻故事都被分配了一个注意力分数,该分数量化了新闻故事中的主题从新闻媒体组织那里共同获得的关注量。StoryGraph 服务从 2017 年 8 月开始运行,使用这种方法,我们确定 2018 年的头条新闻是 2018 年 9 月 27 日注意力得分为 25.85 的“卡瓦诺听证会”。同样,2019 年的头条新闻所以far (2019-12-12) 是“AG William Barr 发布他对穆勒报告的主要结论”,2019 年 3 月 24 日的注意力得分为 22.93。一对节点之间的边代表节点之间的高度相似性(类似的新闻报道)。新闻相似度图中的每个新闻故事都被分配了一个注意力分数,该分数量化了新闻故事中的主题从新闻媒体组织那里共同获得的关注量。StoryGraph 服务从 2017 年 8 月开始运行,使用这种方法,我们确定 2018 年的头条新闻是 2018 年 9 月 27 日注意力得分为 25.85 的“卡瓦诺听证会”。同样,2019 年的头条新闻所以far (2019-12-12) 是“AG William Barr 发布他对穆勒报告的主要结论”,2019 年 3 月 24 日的注意力得分为 22.93。一对节点之间的边代表节点之间的高度相似性(类似的新闻报道)。新闻相似度图中的每个新闻故事都被分配了一个注意力分数,该分数量化了新闻故事中的主题从新闻媒体组织那里共同获得的关注量。StoryGraph 服务从 2017 年 8 月开始运行,使用这种方法,我们确定 2018 年的头条新闻是 2018 年 9 月 27 日注意力得分为 25.85 的“卡瓦诺听证会”。同样,2019 年的头条新闻所以far (2019-12-12) 是“AG William Barr 发布他对穆勒报告的主要结论”,2019 年 3 月 24 日的注意力得分为 22.93。新闻相似度图中的每个新闻故事都被分配了一个注意力分数,该分数量化了新闻故事中的主题从新闻媒体组织那里共同获得的关注量。StoryGraph 服务从 2017 年 8 月开始运行,使用这种方法,我们确定 2018 年的头条新闻是 2018 年 9 月 27 日注意力得分为 25.85 的“卡瓦诺听证会”。同样,2019 年的头条新闻所以far (2019-12-12) 是“AG William Barr 发布他对穆勒报告的主要结论”,2019 年 3 月 24 日的注意力得分为 22.93。新闻相似度图中的每个新闻故事都被分配了一个注意力分数,该分数量化了新闻故事中的主题从新闻媒体组织那里共同获得的关注量。StoryGraph 服务从 2017 年 8 月开始运行,使用这种方法,我们确定 2018 年的头条新闻是 2018 年 9 月 27 日注意力得分为 25.85 的“卡瓦诺听证会”。同样,2019 年的头条新闻所以far (2019-12-12) 是“AG William Barr 发布他对穆勒报告的主要结论”,2019 年 3 月 24 日的注意力得分为 22.93。
更新日期:2020-03-24
down
wechat
bug