当前位置: X-MOL 学术Comput. Secur. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Semi-supervised recommendation attack detection based on Co-Forest
Computers & Security ( IF 5.6 ) Pub Date : 2021-07-01 , DOI: 10.1016/j.cose.2021.102390
Quanqiang Zhou , Liangliang Duan

In recommendation attack, malicious users attempt to bias the recommendation results by injecting fake profiles into the rating database. To detect such attack, three types of methods, i.e., unsupervised, supervised and semi-supervised, have been proposed. Among these works, the advantage of semi-supervised methods is that they can use the unlabeled user profiles to improve the detection performance. However, the existing semi-supervised methods suffer from low precision. Aiming at this problem, in this paper, we propose a semi-supervised detection approach named SSADR-CoF based on the Co-Forest algorithm. Being different from the existing semi-supervised methods which only use a few of features to train a single classifier for the detection, the proposed approach uses a series of features to train an ensemble of classifiers to detect the recommendation attack. We first use the window dividing and rating behavior statistical methods to extract a series of user rating behavior mode features for training the detection model. Then, we use a small number of labeled user profiles to initialize an ensemble of classifiers, and use the ensemble of classifiers to assign labels to the unlabeled user profiles. Finally, we use the labeled and the newly labeled user profiles to iteratively update the classifiers for the detection. Experiments conducted on three benchmark datasets MovieLens 10M, MovieLens 25M, and Amazon show that the proposed approach can effectively improve the precision of the semi-supervised methods under the condition of maintaining high recall and AUC.



中文翻译:

基于Co-Forest的半监督推荐攻击检测

在推荐攻击中,恶意用户试图通过将虚假配置文件注入评级数据库来偏向推荐结果。为了检测这种攻击,已经提出了三种类型的方法,即无监督、有监督和半监督。在这些工作中,半监督方法的优势在于它们可以使用未标记的用户配置文件来提高检测性能。然而,现有的半监督方法精度低。针对这一问题,本文提出了一种基于 Co-Forest 算法的半监督检测方法 SSADR-CoF。与现有的半监督方法不同,它只使用少数特征来训练单个分类器进行检测,所提出的方法使用一系列特征来训练一组分类器来检测推荐攻击。我们首先使用窗口划分和评分行为统计方法提取一系列用户评分行为模式特征用于训练检测模型。然后,我们使用少量标记的用户配置文件来初始化分类器的集合,并使用分类器的集合为未标记的用户配置文件分配标签。最后,我们使用标记的和新标记的用户配置文件来迭代更新用于检测的分类器。在 MovieLens 10M、MovieLens 25M 和 Amazon 三个基准数据集上进行的实验表明,所提出的方法可以在保持高召回率和 AUC 的情况下有效提高半监督方法的精度。我们首先使用窗口划分和评分行为统计方法提取一系列用户评分行为模式特征用于训练检测模型。然后,我们使用少量标记的用户配置文件来初始化分类器的集合,并使用分类器的集合为未标记的用户配置文件分配标签。最后,我们使用标记的和新标记的用户配置文件来迭代更新用于检测的分类器。在 MovieLens 10M、MovieLens 25M 和 Amazon 三个基准数据集上进行的实验表明,所提出的方法可以在保持高召回率和 AUC 的情况下有效提高半监督方法的精度。我们首先使用窗口划分和评分行为统计方法提取一系列用户评分行为模式特征用于训练检测模型。然后,我们使用少量标记的用户配置文件来初始化分类器的集合,并使用分类器的集合为未标记的用户配置文件分配标签。最后,我们使用标记的和新标记的用户配置文件来迭代更新用于检测的分类器。在 MovieLens 10M、MovieLens 25M 和 Amazon 三个基准数据集上进行的实验表明,所提出的方法可以在保持高召回率和 AUC 的情况下有效提高半监督方法的精度。

更新日期:2021-07-13
down
wechat
bug