当前位置: X-MOL 学术Gene Expr. Patterns › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Prediction of Future Gene Expression Profile By Analyzing Its Past Variation Pattern
Gene Expression Patterns ( IF 1.2 ) Pub Date : 2021-01-12 , DOI: 10.1016/j.gep.2021.119166
Parinaz Eskandarian 1 , Jamshid Bagherzadeh Mohasefi 2 , Habibollah Pirnejad 3 , Zahra Niazkhani 4
Affiliation  

A number of initial Hematopoietic Stem Cells (HSC) are considered in a container that are able to divide into HSCs or differentiate into various types of descendant cells. In this paper, a method is designed to predict an approximate gene expression profile (GEP) for future descendant cells resulted from HSC division/differentiation. First, the GEP prediction problem is modeled into a multivariate time series prediction problem. A novel method called EHSCP (Extended Hematopoietic Stem Cell Prediction) is introduced which is an artificial neural machine to solve the problem. EHSCP accepts the initial sequence of measured GEPs as input and predicts GEPs of future descendant cells. This prediction can be performed for multiple stages of cell division/differentiation. EHSCP considers the GEP sequence as time series and computes correlation between input time series. Two novel artificial neural units called PLSTM (Parametric Long Short Term Memory) and MILSTM (Multi-Input LSTM) are designed. PLSTM makes EHSCP able to consider this correlation in output prediction. Since there exist thousands of time series in GEP prediction, a hierarchical encoder is proposed that computes this correlation using 101 MILSTMs. EHSCP is trained using 155 datasets and is evaluated on 39 test datasets. These evaluations show that EHSCP surpasses existing methods in terms of prediction accuracy and number of correctly-predicted division/differentiation stages. In these evaluations, number of correctly-predicted stages in EHSCP was 128 when as many as 8 initial stages were given.



中文翻译:

通过分析过去的变异模式预测未来的基因表达谱

许多初始造血干细胞 (HSC) 被认为是在一个容器中,它们能够分裂成 HSC 或分化成各种类型的后代细胞。在本文中,设计了一种方法来预测由 HSC 分裂/分化产生的未来后代细胞的近似基因表达谱 (GEP)。首先,将 GEP 预测问题建模为多元时间序列预测问题。介绍了一种称为 EHSCP(扩展造血干细胞预测)的新方法,它是一种人工神经机器来解决该问题。EHSCP 接受测量 GEP 的初始序列作为输入并预测未来后代细胞的 GEP。该预测可以针对细胞分裂/分化的多个阶段进行。EHSCP 将 GEP 序列视为时间序列并计算输入时间序列之间的相关性。设计了两个新的人工神经单元,称为 PLSTM(参数长短期记忆)和 MILSTM(多输入 LSTM)。PLSTM 使 EHSCP 能够在输出预测中考虑这种相关性。由于 GEP 预测中存在数千个时间序列,因此提出了使用 101 个 MILSTM 计算这种相关性的分层编码器。EHSCP 使用 155 个数据集进行训练,并在 39 个测试数据集上进行评估。这些评估表明,EHSCP 在预测精度和正确预测分裂/分化阶段的数量方面优于现有方法。在这些评估中,当给出多达 8 个初始阶段时,EHSCP 中正确预测的阶段数为 128。设计了两个新的人工神经单元,称为 PLSTM(参数长短期记忆)和 MILSTM(多输入 LSTM)。PLSTM 使 EHSCP 能够在输出预测中考虑这种相关性。由于 GEP 预测中存在数千个时间序列,因此提出了使用 101 个 MILSTM 计算这种相关性的分层编码器。EHSCP 使用 155 个数据集进行训练,并在 39 个测试数据集上进行评估。这些评估表明,EHSCP 在预测精度和正确预测分裂/分化阶段的数量方面优于现有方法。在这些评估中,当给出多达 8 个初始阶段时,EHSCP 中正确预测的阶段数为 128。设计了两个新的人工神经单元,称为 PLSTM(参数长短期记忆)和 MILSTM(多输入 LSTM)。PLSTM 使 EHSCP 能够在输出预测中考虑这种相关性。由于 GEP 预测中存在数千个时间序列,因此提出了使用 101 个 MILSTM 计算这种相关性的分层编码器。EHSCP 使用 155 个数据集进行训练,并在 39 个测试数据集上进行评估。这些评估表明,EHSCP 在预测精度和正确预测分裂/分化阶段的数量方面优于现有方法。在这些评估中,当给出多达 8 个初始阶段时,EHSCP 中正确预测的阶段数为 128。PLSTM 使 EHSCP 能够在输出预测中考虑这种相关性。由于 GEP 预测中存在数千个时间序列,因此提出了使用 101 个 MILSTM 计算这种相关性的分层编码器。EHSCP 使用 155 个数据集进行训练,并在 39 个测试数据集上进行评估。这些评估表明,EHSCP 在预测精度和正确预测分裂/分化阶段的数量方面优于现有方法。在这些评估中,当给出多达 8 个初始阶段时,EHSCP 中正确预测的阶段数为 128。PLSTM 使 EHSCP 能够在输出预测中考虑这种相关性。由于 GEP 预测中存在数千个时间序列,因此提出了使用 101 个 MILSTM 计算这种相关性的分层编码器。EHSCP 使用 155 个数据集进行训练,并在 39 个测试数据集上进行评估。这些评估表明,EHSCP 在预测精度和正确预测分裂/分化阶段的数量方面优于现有方法。在这些评估中,当给出多达 8 个初始阶段时,EHSCP 中正确预测的阶段数为 128。这些评估表明,EHSCP 在预测精度和正确预测分裂/分化阶段的数量方面优于现有方法。在这些评估中,当给出多达 8 个初始阶段时,EHSCP 中正确预测的阶段数为 128。这些评估表明,EHSCP 在预测精度和正确预测分裂/分化阶段的数量方面优于现有方法。在这些评估中,当给出多达 8 个初始阶段时,EHSCP 中正确预测的阶段数为 128。

更新日期:2021-01-12
down
wechat
bug