当前位置: X-MOL 学术Mol. Biol. Evol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Depletion of Stop Codons in lincRNA is Owing to Transfer of Selective Constraint from Coding Sequences.
Molecular Biology and Evolution ( IF 11.0 ) Pub Date : 2019-12-16 , DOI: 10.1093/molbev/msz299
Liam Abrahams 1 , Laurence D Hurst 1
Affiliation  

While the constraints on a gene's sequence are often assumed to reflect the functioning of that gene, here we propose transfer selection, a constraint operating on one class of genes transferred to another, mediated by shared binding factors. We show that such transfer can explain an otherwise paradoxical depletion of stop codons in long intergenic noncoding RNAs (lincRNAs). Serine/arginine-rich (SR) proteins direct the splicing machinery by binding exonic splice enhancers (ESEs) in immature mRNA. As coding exons cannot contain stop codons in one reading frame, stop codons should be rare within ESEs. We confirm that the stop codon density (SCD) in ESE motifs is low, even accounting for nucleotide biases. Given that SR proteins binding ESEs also facilitate lincRNA splicing, a low SCD could transfer to lincRNAs. As predicted, multi-exon lincRNA exons are depleted in stop codons, a result not explained by open reading frame (ORF) contamination. Consistent with transfer selection, stop codon depletion in lincRNAs is most acute in exonic regions with the highest ESE density, disappears when ESEs are masked, is consistent with stop codon usage skews in ESEs and is diminished in both single-exon lincRNAs and introns. Owing to low SCD, the maximum lengths of pseudo-ORFs (pORFs) frequently exceed null expectations. This has implications for ORF annotation and the evolution of de novo protein-coding genes from lincRNAs. We conclude that not all constraints operating on genes need be explained by the functioning of the gene but may instead be transferred owing to shared binding factors.

中文翻译:

lincRNA中终止密码子的耗尽是由于编码序列中选择性约束的转移所致。

虽然通常假设对基因序列的限制反映了该基因的功能,但在此我们提出转移选择,这种转移对一类由共享结合因子介导的基因转移到另一类基因上起作用。我们表明这种转移可以解释长期基因间非编码RNA(lincRNAs)中终止密码子的否则自相矛盾的消耗。富含丝氨酸/精氨酸(SR)的蛋白质通过结合未成熟mRNA中的外显子剪接增强子(ESE)来指导剪接机制。由于编码外显子不能在一个阅读框中包含终止密码子,因此终止密码子在ESE中应该很少见。我们证实,ESE模体中的终止密码子密度(SCD)较低,即使考虑到核苷酸偏倚也是如此。鉴于结合ESE的SR蛋白也促进了lincRNA剪接,因此低SCD可能会转移至lincRNA。如预期的那样 多外显子lincRNA外显子的终止密码子耗尽,开放阅读框(ORF)污染无法解释这一结果。与转移选择一致,在具有最高ESE密度的外显子区域中,inclRNA中的终止密码子耗竭最严重,当ESE被掩盖时消失,这与ESE中的终止密码子使用偏斜相符,并且在单外显子lincRNA和内含子中均减少。由于SCD低,伪ORF(pORF)的最大长度经常超过零期望。这对ORF注释和lincRNA的从头蛋白质编码基因的进化具有影响。我们得出结论,并非所有对基因起作用的限制都需要通过基因的功能来解释,但是由于共有的结合因子而可能被转移。开放阅读框(ORF)污染无法解释这一结果。与转移选择一致,在具有最高ESE密度的外显子区域中,inclRNA中的终止密码子耗竭最严重,当ESE被掩盖时消失,这与ESE中的终止密码子使用偏斜相符,并且在单外显子lincRNA和内含子中均减少。由于SCD低,伪ORF(pORF)的最大长度经常超过零期望。这对ORF注释和lincRNA的从头蛋白质编码基因的进化具有重要意义。我们得出结论,并非所有对基因起作用的限制都需要通过基因的功能来解释,但是由于共有的结合因子而可能被转移。开放阅读框(ORF)污染无法解释这一结果。与转移选择一致,在具有最高ESE密度的外显子区域,lincRNA中的终止密码子耗竭最严重,当ESE被掩盖时消失,与ESE中的终止密码子使用偏斜相符,并且在单外显子lincRNA和内含子中都减少。由于SCD低,伪ORF(pORF)的最大长度经常超过零期望。这对ORF注释和lincRNA的从头蛋白质编码基因的进化具有重要意义。我们得出结论,并非所有对基因起作用的限制都需要通过基因的功能来解释,但是由于共有的结合因子而可能被转移。当ESE被掩盖时消失,这与ESE中的终止密码子使用偏斜一致,并且在单外显子lincRNA和内含子中都减少了。由于SCD低,伪ORF(pORF)的最大长度经常超过零期望。这对ORF注释和lincRNA的从头蛋白质编码基因的进化具有影响。我们得出结论,并非所有对基因起作用的限制都需要通过基因的功能来解释,但是由于共有的结合因子而可能被转移。当ESE被掩盖时消失,这与ESE中的终止密码子使用偏斜一致,并且在单外显子lincRNA和内含子中都减少了。由于SCD低,伪ORF(pORF)的最大长度经常超过零期望。这对ORF注释和lincRNA的从头蛋白质编码基因的进化具有重要意义。我们得出结论,并非所有对基因起作用的限制都需要通过基因的功能来解释,但是由于共有的结合因子而可能被转移。
更新日期:2020-04-17
down
wechat
bug