当前位置: X-MOL 学术IEEJ Trans. Electr. Electron. Eng. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Fine-Grained Geolocalization Method for User Generated Short Text
IEEJ Transactions on Electrical and Electronic Engineering ( IF 1.0 ) Pub Date : 2022-06-24 , DOI: 10.1002/tee.23659
Yinyin Zhang 1 , Yongjun Li 1 , Wenli Ji 2 , Siqi Wang 1
Affiliation  

Recently, the fine-grained geolocalization of User-Generated Short Text (UGST) has been increasingly attracting much attention. Accurate geolocation can benefit many applications, especially for the location-based services. However, since the majority of UGSTs are short, noisy and not geotagged, existing methods still suffer from two issues. One is the heavy reliance on the manual features not fully exploiting the semantic information. Another is the free writing style of social media resulting in extremely few useful geo-indicative information. To address these issues, we propose a novel Fine-grained Geolocalization method for UGSTs with Preprocessing, location-entity consistency Replacing, Filtering, Convolutional neural network (FG-PRFC), which only relies on UGST itself. Compared to existing methods, FG-PRFC has four unique characteristics: (1) We present a UGST-oriented preprocessing method to obtain more semantic information. (2) To tackle the abbreviation issue, we develop a replacing method to allow geo-indicative words behaving in the same way. (3) Following the idea of TFIDF, we weight the words in UGST and then develop a location-free UGST filtering method. (4) We employ convolutional neural network to model the relationship between words and locations. Extensive experiments on three ground-truth datasets demonstrate that our method has a significant improvement compared to state-of-art methods. © 2022 Institute of Electrical Engineers of Japan. Published by Wiley Periodicals LLC.

中文翻译:

一种用户生成短文本的细粒度地理定位方法

最近,用户生成的短文本(UGST)的细粒度地理定位越来越受到关注。准确的地理位置可以使许多应用程序受益,特别是对于基于位置的服务。然而,由于大多数 UGST 都是短的、嘈杂的并且没有地理标记,现有的方法仍然存在两个问题。一是严重依赖没有充分利用语义信息的手动功能。另一个是社交媒体的自由写作风格,导致极少有用的地理指示信息。为了解决这些问题,我们提出了一种新颖的 UGST 细粒度地理定位方法,该方法具有预处理、位置实体一致性替换、过滤、卷积神经网络 (FG-PRFC),该方法仅依赖于 UGST 本身。与现有方法相比,FG-PRFC 具有四个独特的特点:(1)我们提出了一种面向UGST的预处理方法来获得更多的语义信息。(2) 为了解决缩写问题,我们开发了一种替换方法,以允许地理指示词以相同的方式表现。(3) 按照 TFIDF 的思想,我们对 UGST 中的词进行加权,然后开发了一种无位置的 UGST 过滤方法。(4) 我们采用卷积神经网络对单词和位置之间的关系进行建模。对三个真实数据集的广泛实验表明,与最先进的方法相比,我们的方法有显着的改进。© 2022 日本电气工程师学会。由 Wiley Periodicals LLC 出版。我们开发了一种替换方法,以允许地理指示词以相同的方式表现。(3) 按照 TFIDF 的思想,我们对 UGST 中的词进行加权,然后开发了一种无位置的 UGST 过滤方法。(4) 我们采用卷积神经网络对单词和位置之间的关系进行建模。对三个真实数据集的广泛实验表明,与最先进的方法相比,我们的方法有显着的改进。© 2022 日本电气工程师学会。由 Wiley Periodicals LLC 出版。我们开发了一种替换方法,以允许地理指示词以相同的方式表现。(3) 按照 TFIDF 的思想,我们对 UGST 中的词进行加权,然后开发了一种无位置的 UGST 过滤方法。(4) 我们采用卷积神经网络对单词和位置之间的关系进行建模。对三个真实数据集的广泛实验表明,与最先进的方法相比,我们的方法有显着的改进。© 2022 日本电气工程师学会。由 Wiley Periodicals LLC 出版。对三个真实数据集的广泛实验表明,与最先进的方法相比,我们的方法有显着的改进。© 2022 日本电气工程师学会。由 Wiley Periodicals LLC 出版。对三个真实数据集的广泛实验表明,与最先进的方法相比,我们的方法有显着的改进。© 2022 日本电气工程师学会。由 Wiley Periodicals LLC 出版。
更新日期:2022-06-24
down
wechat
bug