当前位置: X-MOL 学术Methods › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
SDLDA: lncRNA–disease association prediction based on singular value decomposition and deep learning
Methods ( IF 4.2 ) Pub Date : 2020-07-01 , DOI: 10.1016/j.ymeth.2020.05.002
Min Zeng 1 , Chengqian Lu 1 , Fuhao Zhang 1 , Yiming Li 1 , Fang-Xiang Wu 2 , Yaohang Li 3 , Min Li 1
Affiliation  

In recent years, accumulating studies have shown that long non-coding RNAs (lncRNAs) not only play an important role in the regulation of various biological processes but also are the foundation for understanding mechanisms of human diseases. Due to the high cost of traditional biological experiments, the number of experimentally verified lncRNA-disease associations is very limited. Thus, many computational approaches have been proposed to discover the underlying associations between lncRNAs and diseases. However, the associations between lncRNAs and diseases are too complicated to model by using only traditional matrix factorization-based methods. In this study, we propose a hybrid computational framework (SDLDA) for the lncRNA-disease association prediction. In our computational framework, we use singular value decomposition and deep learning to extract linear and non-linear features of lncRNAs and diseases, respectively. Then we train SDLDA by combing the linear and non-linear features. Compared to previous computational methods, the combination of linear and non-linear features reinforces each other, which is better than using only either matrix factorization or deep learning. The computational results show that SDLDA has a better performance over existing methods in the leave-one-out cross-validation. Furthermore, the case studies show that 28 out of 30 cancer-related lncRNAs (10 for gastric cancer, 10 for colon cancer and 8 for renal cancer) are verified by mining recent biomedical literature. Code and data can be accessed at https://github.com/CSUBioGroup/SDLDA.

中文翻译:

SDLDA:基于奇异值分解和深度学习的lncRNA-疾病关联预测

近年来,越来越多的研究表明,长链非编码RNA(lncRNA)不仅在各种生物过程的调控中发挥着重要作用,而且是理解人类疾病机制的基础。由于传统生物实验的高成本,经实验验证的lncRNA-疾病关联的数量非常有限。因此,已经提出了许多计算方法来发现 lncRNA 与疾病之间的潜在关联。然而,lncRNA 与疾病之间的关联过于复杂,无法仅使用传统的基于矩阵分解的方法进行建模。在这项研究中,我们提出了一种用于 lncRNA 疾病关联预测的混合计算框架(SDLDA)。在我们的计算框架中,我们分别使用奇异值分解和深度学习来提取 lncRNA 和疾病的线性和非线性特征。然后我们通过组合线性和非线性特征来训练 SDLDA。与之前的计算方法相比,线性特征和非线性特征的组合相辅相成,比仅使用矩阵分解或深度学习更好。计算结果表明,SDLDA 在留一法交叉验证中比现有方法具有更好的性能。此外,案例研究表明,30 个与癌症相关的 lncRNA 中有 28 个(胃癌 10 个,结肠癌 10 个,肾癌 8 个)通过挖掘最近的生物医学文献得到验证。代码和数据可以在 https://github.com/CSUBioGroup/SDLDA 访问。分别。然后我们通过组合线性和非线性特征来训练 SDLDA。与之前的计算方法相比,线性特征和非线性特征的组合相辅相成,比仅使用矩阵分解或深度学习更好。计算结果表明,SDLDA 在留一法交叉验证中比现有方法具有更好的性能。此外,案例研究表明,30 个与癌症相关的 lncRNA 中有 28 个(胃癌 10 个,结肠癌 10 个,肾癌 8 个)通过挖掘最近的生物医学文献得到验证。代码和数据可以在 https://github.com/CSUBioGroup/SDLDA 访问。分别。然后我们通过组合线性和非线性特征来训练 SDLDA。与之前的计算方法相比,线性特征和非线性特征的组合相辅相成,比仅使用矩阵分解或深度学习更好。计算结果表明,SDLDA 在留一法交叉验证中比现有方法具有更好的性能。此外,案例研究表明,30 个与癌症相关的 lncRNA 中有 28 个(胃癌 10 个,结肠癌 10 个,肾癌 8 个)通过挖掘最近的生物医学文献得到验证。代码和数据可以在 https://github.com/CSUBioGroup/SDLDA 访问。线性和非线性特征的组合相互加强,这比仅使用矩阵分解或深度学习更好。计算结果表明,SDLDA 在留一法交叉验证中比现有方法具有更好的性能。此外,案例研究表明,30 个与癌症相关的 lncRNA 中有 28 个(胃癌 10 个,结肠癌 10 个,肾癌 8 个)通过挖掘最近的生物医学文献得到验证。代码和数据可以在 https://github.com/CSUBioGroup/SDLDA 访问。线性和非线性特征的组合相互加强,这比仅使用矩阵分解或深度学习更好。计算结果表明,SDLDA 在留一法交叉验证中比现有方法具有更好的性能。此外,案例研究表明,30 个与癌症相关的 lncRNA 中有 28 个(胃癌 10 个,结肠癌 10 个,肾癌 8 个)通过挖掘最近的生物医学文献得到验证。代码和数据可以在 https://github.com/CSUBioGroup/SDLDA 访问。10 个结肠癌和 8 个肾癌)通过挖掘最近的生物医学文献得到验证。代码和数据可以在 https://github.com/CSUBioGroup/SDLDA 访问。10 个结肠癌和 8 个肾癌)通过挖掘最近的生物医学文献得到验证。代码和数据可以在 https://github.com/CSUBioGroup/SDLDA 访问。
更新日期:2020-07-01
down
wechat
bug