当前位置: X-MOL 学术Algorithms Mol. Biol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A better scoring model for de novo peptide sequencing: the symmetric difference between explained and measured masses.
Algorithms for Molecular Biology ( IF 1.5 ) Pub Date : 2017-06-13 , DOI: 10.1186/s13015-017-0104-1
Thomas Tschager 1 , Simon Rösch 1 , Ludovic Gillet 2 , Peter Widmayer 1
Affiliation  

BACKGROUND Given a peptide as a string of amino acids, the masses of all its prefixes and suffixes can be found by a trivial linear scan through the amino acid masses. The inverse problem is the idealde novopeptide sequencing problem: Given all prefix and suffix masses, determine the string of amino acids. In biological reality, the given masses are measured in a lab experiment, and measurements by necessity are noisy. The (real, noisy) de novo peptide sequencing problem therefore has a noisy input: a few of the prefix and suffix masses of the peptide are missing and a few other masses are given in addition. For this setting, we ask for an amino acid string that explains the given masses as accurately as possible. RESULTS Past approaches interpreted accuracy by searching for a string that explains as many masses as possible. We feel, however, that it is not only bad to not explain a mass that appears, but also to explain a mass that does not appear. We propose to minimize the symmetric difference between the set of given masses and the set of masses that the string explains. For this new optimization problem, we propose an efficient algorithm that computes both the best and the k best solutions. Proof-of-concept experiments on measurements of synthesized peptides show that our approach leads to better results compared to finding a string that explains as many given masses as possible. CONCLUSIONS We conclude that considering the symmetric difference as optimization goal can improve the identification rates for de novo peptide sequencing. A preliminary version of this work has been presented at WABI 2016.

中文翻译:

从头肽测序的更好评分模型:解释质量和测量质量之间的对称差异。

背景技术给定肽为一串氨基酸,可以通过对氨基酸质量的简单线性扫描来发现其所有前缀和后缀的质量。反问题是理想的新肽测序问题:给定所有前缀和后缀质量,确定氨基酸串。在生物现实中,给定的质量是在实验室实验中测量的,而根据需要进行的测量很嘈杂。因此,(真实的,嘈杂的)从头测序的问题有一个嘈杂的输入:缺少肽的一些前缀和后缀质量,另外还给出了其他一些质量。对于此设置,我们要求提供一个氨基酸串,以尽可能准确地解释给定的质量。结果过去的方法是通过搜索解释尽可能多的质量的字符串来解释精度。但是,我们觉得 不解释出现的质量不仅不好,而且解释没有出现的质量也很不好。我们建议最小化给定质量集合与弦所解释的质量集合之间的对称差异。对于这个新的优化问题,我们提出了一种有效的算法,该算法可以计算最佳解和k个最佳解。对合成肽段进行测量的概念验证实验表明,与找到可以解释尽可能多给定质量的字符串相比,我们的方法可获得更好的结果。结论我们得出结论,将对称差异作为优化目标可以提高从头肽测序的鉴定率。在WABI 2016上已经介绍了这项工作的初步版本。还要解释一个没有出现的质量。我们建议最小化给定质量集合与弦所解释的质量集合之间的对称差异。对于这个新的优化问题,我们提出了一种有效的算法,该算法可以计算最佳解和k个最佳解。对合成肽段进行测量的概念验证实验表明,与找到可以解释尽可能多给定质量的字符串相比,我们的方法可获得更好的结果。结论我们得出结论,将对称差异作为优化目标可以提高从头肽测序的鉴定率。这项工作的初步版本已在WABI 2016上发布。还要解释一个没有出现的质量。我们建议最小化给定质量集合与弦所解释的质量集合之间的对称差异。对于这个新的优化问题,我们提出了一种有效的算法,该算法可以计算最佳解和k个最佳解。对合成肽段进行测量的概念验证实验表明,与找到可以解释尽可能多给定质量的字符串相比,我们的方法可获得更好的结果。结论我们得出结论,将对称差异作为优化目标可以提高从头肽测序的鉴定率。这项工作的初步版本已在WABI 2016上发布。我们建议最小化给定质量集合与弦所解释的质量集合之间的对称差异。对于这个新的优化问题,我们提出了一种有效的算法,该算法可以计算最佳解和k个最佳解。对合成肽段进行测量的概念验证实验表明,与找到可以解释尽可能多给定质量的字符串相比,我们的方法可获得更好的结果。结论我们得出结论,将对称差异作为优化目标可以提高从头肽测序的鉴定率。这项工作的初步版本已在WABI 2016上发布。我们建议最小化给定质量集合与弦所解释的质量集合之间的对称差异。对于这个新的优化问题,我们提出了一种有效的算法,该算法可以计算最佳解和k个最佳解。测量合成肽的概念验证实验表明,与找到一个解释尽可能多的给定质量的字符串相比,我们的方法可获得更好的结果。结论我们得出结论,将对称差异作为优化目标可以提高从头肽测序的鉴定率。在WABI 2016上已经介绍了这项工作的初步版本。对合成肽段进行测量的概念验证实验表明,与找到可以解释尽可能多给定质量的字符串相比,我们的方法可获得更好的结果。结论我们得出结论,将对称差异作为优化目标可以提高从头肽测序的鉴定率。在WABI 2016上已经介绍了这项工作的初步版本。测量合成肽的概念验证实验表明,与找到一个解释尽可能多的给定质量的字符串相比,我们的方法可获得更好的结果。结论我们得出结论,将对称差异作为优化目标可以提高从头肽测序的鉴定率。在WABI 2016上已经介绍了这项工作的初步版本。
更新日期:2019-11-01
down
wechat
bug