当前位置: X-MOL 学术PeerJ Comput. Sci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A supervised scheme for aspect extraction in sentiment analysis using the hybrid feature set of word dependency relations and lemmas
PeerJ Computer Science ( IF 3.8 ) Pub Date : 2021-02-05 , DOI: 10.7717/peerj-cs.347
Bhavana R. Bhamare 1 , Jeyanthi Prabhu 2
Affiliation  

Due to the massive progression of the Web, people post their reviews for any product, movies and places they visit on social media. The reviews available on social media are helpful to customers as well as the product owners to evaluate their products based on different reviews. Analyzing structured data is easy as compared to unstructured data. The reviews are available in an unstructured format. Aspect-Based Sentiment Analysis mines the aspects of a product from the reviews and further determines sentiment for each aspect. In this work, two methods for aspect extraction are proposed. The datasets used for this work are SemEval restaurant review dataset, Yelp and Kaggle datasets. In the first method a multivariate filter-based approach for feature selection is proposed. This method support to select significant features and reduces redundancy among selected features. It shows improvement in F1-score compared to a method that uses only relevant features selected using Term Frequency weight. In another method, selective dependency relations are used to extract features. This is done using Stanford NLP parser. The results gained using features extracted by selective dependency rules are better as compared to features extracted by using all dependency rules. In the hybrid approach, both lemma features and selective dependency relation based features are extracted. Using the hybrid feature set, 94.78% accuracy and 85.24% F1-score is achieved in the aspect category prediction task.

中文翻译:

使用词依赖关系和引理的混合特征集的情感分析方面提取的监督方案

由于Web的巨大发展,人们在社交媒体上发布了他们对任何产品,电影和访问地点的评论。社交媒体上可用的评论有助于客户以及产品所有者根据不同的评论评估其产品。与非结构化数据相比,分析结构化数据很容易。评论以非结构化格式提供。基于方面的情感分析从评论中挖掘产品的方面,并进一步确定每个方面的情感。在这项工作中,提出了两种提取方面的方法。用于这项工作的数据集是SemEval餐厅评论数据集,Yelp和Kaggle数据集。在第一种方法中,提出了一种基于多元过滤器的特征选择方法。此方法支持选择重要功能并减少所选功能之间的冗余。与仅使用通过“词频”权重选择的相关功能的方法相比,它显示出F1分数的提高。在另一种方法中,选择性依赖关系用于提取特征。这是使用Stanford NLP解析器完成的。与使用所有依赖性规则提取的特征相比,使用选择性依赖性规则提取的特征获得的结果更好。在混合方法中,提取了引理特征和基于选择性依赖关系的特征。使用混合功能集,在方面类别预测任务中可以达到94.78%的准确性和85.24%的F1分数。与仅使用通过“词频”权重选择的相关功能的方法相比,它显示出F1分数的提高。在另一种方法中,选择性依赖关系用于提取特征。这是使用Stanford NLP解析器完成的。与使用所有依赖性规则提取的特征相比,使用选择性依赖性规则提取的特征获得的结果更好。在混合方法中,提取了引理特征和基于选择性依赖关系的特征。使用混合功能集,在方面类别预测任务中可以达到94.78%的准确性和85.24%的F1分数。与仅使用通过“词频”权重选择的相关功能的方法相比,它显示出F1分数的提高。在另一种方法中,选择性依赖关系用于提取特征。这是使用Stanford NLP解析器完成的。与使用所有依赖性规则提取的特征相比,使用选择性依赖性规则提取的特征获得的结果更好。在混合方法中,提取了引理特征和基于选择性依赖关系的特征。使用混合功能集,在方面类别预测任务中可以达到94.78%的准确性和85.24%的F1分数。与使用所有依赖性规则提取的特征相比,使用选择性依赖性规则提取的特征获得的结果更好。在混合方法中,提取了引理特征和基于选择性依赖关系的特征。使用混合功能集,在方面类别预测任务中可以达到94.78%的准确性和85.24%的F1分数。与使用所有依赖性规则提取的特征相比,使用选择性依赖性规则提取的特征获得的结果更好。在混合方法中,提取了引理特征和基于选择性依赖关系的特征。使用混合功能集,在方面类别预测任务中可以达到94.78%的准确性和85.24%的F1分数。
更新日期:2021-02-05
down
wechat
bug