当前位置:
X-MOL 学术
›
Sci. Program.
›
论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
FWHT-RF: A Novel Computational Approach to Predict Plant Protein-Protein Interactions via an Ensemble Learning Method
Scientific Programming ( IF 1.672 ) Pub Date : 2021-07-22 , DOI: 10.1155/2021/1607946 Jie Pan 1 , Li-Ping Li 1 , Chang-Qing Yu 1 , Zhu-Hong You 1 , Zhong-Hao Ren 1 , Jing-Yu Tang 1
Scientific Programming ( IF 1.672 ) Pub Date : 2021-07-22 , DOI: 10.1155/2021/1607946 Jie Pan 1 , Li-Ping Li 1 , Chang-Qing Yu 1 , Zhu-Hong You 1 , Zhong-Hao Ren 1 , Jing-Yu Tang 1
Affiliation
Protein-protein interactions (PPIs) in plants are crucial for understanding biological processes. Although high-throughput techniques produced valuable information to identify PPIs in plants, they are usually expensive, inefficient, and extremely time-consuming. Hence, there is an urgent need to develop novel computational methods to predict PPIs in plants. In this article, we proposed a novel approach to predict PPIs in plants only using the information of protein sequences. Specifically, plants’ protein sequences are first converted as position-specific scoring matrix (PSSM); then, the fast Walsh–Hadamard transform (FWHT) algorithm is used to extract feature vectors from PSSM to obtain evolutionary information of plant proteins. Lastly, the rotation forest (RF) classifier is trained for prediction and produced a series of evaluation results. In this work, we named this approach FWHT-RF because FWHT and RF are used for feature extraction and classification, respectively. When applying FWHT-RF on three plants’ PPI datasets Maize, Rice, and Arabidopsis thaliana (Arabidopsis), the average accuracies of FWHT-RF using 5-fold cross validation were achieved as high as 95.20%, 94.42%, and 83.85%, respectively. To further evaluate the predictive power of FWHT-RF, we compared it with the state-of-art support vector machine (SVM) and K-nearest neighbor (KNN) classifier in different aspects. The experimental results demonstrated that FWHT-RF can be a useful supplementary method to predict potential PPIs in plants.
中文翻译:
FWHT-RF:一种通过集成学习方法预测植物蛋白质-蛋白质相互作用的新计算方法
植物中的蛋白质-蛋白质相互作用 (PPI) 对于理解生物过程至关重要。虽然高通量技术产生了有价值的信息来识别植物中的 PPI,但它们通常昂贵、低效且极其耗时。因此,迫切需要开发新的计算方法来预测植物中的 PPI。在本文中,我们提出了一种仅使用蛋白质序列信息来预测植物 PPI 的新方法。具体来说,植物的蛋白质序列首先被转换为位置特异性评分矩阵(PSSM);然后,使用快速 Walsh-Hadamard 变换 (FWHT) 算法从 PSSM 中提取特征向量以获得植物蛋白质的进化信息。最后,训练旋转森林(RF)分类器进行预测并产生一系列评估结果。在这项工作中,我们将这种方法命名为 FWHT-RF,因为 FWHT 和 RF 分别用于特征提取和分类。在三个植物的 PPI 数据集上应用 FWHT-RF 时玉米、水稻和拟南芥(Arabidopsis),FWHT-RF 使用 5 倍交叉验证的平均准确率分别高达 95.20%、94.42% 和 83.85%。为了进一步评估 FWHT-RF 的预测能力,我们在不同方面将其与最先进的支持向量机 (SVM) 和K最近邻 (KNN) 分类器进行了比较。实验结果表明,FWHT-RF 可以作为一种有用的补充方法来预测植物中潜在的 PPI。
更新日期:2021-07-22
中文翻译:
FWHT-RF:一种通过集成学习方法预测植物蛋白质-蛋白质相互作用的新计算方法
植物中的蛋白质-蛋白质相互作用 (PPI) 对于理解生物过程至关重要。虽然高通量技术产生了有价值的信息来识别植物中的 PPI,但它们通常昂贵、低效且极其耗时。因此,迫切需要开发新的计算方法来预测植物中的 PPI。在本文中,我们提出了一种仅使用蛋白质序列信息来预测植物 PPI 的新方法。具体来说,植物的蛋白质序列首先被转换为位置特异性评分矩阵(PSSM);然后,使用快速 Walsh-Hadamard 变换 (FWHT) 算法从 PSSM 中提取特征向量以获得植物蛋白质的进化信息。最后,训练旋转森林(RF)分类器进行预测并产生一系列评估结果。在这项工作中,我们将这种方法命名为 FWHT-RF,因为 FWHT 和 RF 分别用于特征提取和分类。在三个植物的 PPI 数据集上应用 FWHT-RF 时玉米、水稻和拟南芥(Arabidopsis),FWHT-RF 使用 5 倍交叉验证的平均准确率分别高达 95.20%、94.42% 和 83.85%。为了进一步评估 FWHT-RF 的预测能力,我们在不同方面将其与最先进的支持向量机 (SVM) 和K最近邻 (KNN) 分类器进行了比较。实验结果表明,FWHT-RF 可以作为一种有用的补充方法来预测植物中潜在的 PPI。