当前位置: X-MOL 学术arXiv.cs.CC › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Complexity Issues of String to Graph Approximate Matching
arXiv - CS - Computational Complexity Pub Date : 2020-01-07 , DOI: arxiv-2001.01961
Riccardo Dondi, Giancarlo Mauri, Italo Zoppis

The problem of matching a query string to a directed graph, whose vertices are labeled by strings, has application in different fields, from data mining to computational biology. Several variants of the problem have been considered, depending on the fact that the match is exact or approximate and, in this latter case, which edit operations are considered and where are allowed. In this paper we present results on the complexity of the approximate matching problem, where edit operations are symbol substitutions and are allowed only on the graph labels or both on the graph labels and the query string. We introduce a variant of the problem that asks whether there exists a path in a graph that represents a query string with any number of edit operations and we show that is is NP-complete, even when labels have length one and in the case the alphabet is binary. Moreover, when it is parameterized by the length of the input string and graph labels have length one, we show that the problem is fixed-parameter tractable and it is unlikely to admit a polynomial kernel. The NP-completeness of this problem leads to the inapproximability (within any factor) of the approximate matching when edit operations are allowed only on the graph labels. Moreover, we show that the variants of approximate string matching to graph we consider are not fixed-parameter tractable, when the parameter is the number of edit operations, even for graphs that have distance one from a DAG. The reduction for this latter result allows us to prove the inapproximability of the variant where edit operations can be applied both on the query string and on graph labels.

中文翻译:

字符串到图近似匹配的复杂性问题

将查询字符串与有向图匹配的问题,其顶点由字符串标记,在不同领域都有应用,从数据挖掘到计算生物学。已经考虑了该问题的几种变体,这取决于匹配是精确的还是近似的,并且在后一种情况下,考虑了哪些编辑操作以及在何处被允许。在本文中,我们展示了近似匹配问题的复杂性的结果,其中编辑操作是符号替换,并且只允许在图标签上或同时在图标签和查询字符串上进行。我们引入了该问题的一个变体,该问题询问图中是否存在表示具有任意数量编辑操作的查询字符串的路径,并且我们证明它是 NP 完全的,即使标签长度为 1 并且字母表是二进制的。此外,当它由输入字符串的长度参数化并且图标签的长度为 1 时,我们表明该问题是固定参数可处理的,并且不太可能接纳多项式核。当仅允许在图形标签上进行编辑操作时,该问题的 NP 完整性导致近似匹配的不可近似性(在任何因素内)。此外,我们表明,当参数是编辑操作的数量时,我们考虑的图形的近似字符串匹配的变体不是固定参数可处理的,即使对于与 DAG 距离为 1 的图形也是如此。后一个结果的减少使我们能够证明变体的不可近似性,其中编辑操作可以应用于查询字符串和图形标签。当它由输入字符串的长度参数化并且图标签的长度为 1 时,我们表明该问题是固定参数可处理的,并且不太可能接纳多项式核。当仅允许在图形标签上进行编辑操作时,该问题的 NP 完整性导致近似匹配的不可近似性(在任何因素内)。此外,我们表明,当参数是编辑操作的数量时,我们考虑的图形的近似字符串匹配的变体不是固定参数可处理的,即使对于与 DAG 距离为 1 的图形也是如此。后一个结果的减少使我们能够证明变体的不可近似性,其中编辑操作可以应用于查询字符串和图形标签。当它由输入字符串的长度参数化并且图标签的长度为 1 时,我们表明该问题是固定参数可处理的,并且不太可能接纳多项式核。当仅允许在图形标签上进行编辑操作时,该问题的 NP 完整性导致近似匹配的不可近似性(在任何因素内)。此外,我们表明,当参数是编辑操作的数量时,我们考虑的图形的近似字符串匹配的变体不是固定参数可处理的,即使对于与 DAG 距离为 1 的图形也是如此。后一个结果的减少使我们能够证明变体的不可近似性,其中编辑操作可以应用于查询字符串和图形标签。我们表明该问题是固定参数易于处理的,并且不太可能承认多项式核。当仅允许在图形标签上进行编辑操作时,该问题的 NP 完整性导致近似匹配的不可近似性(在任何因素内)。此外,我们表明,当参数是编辑操作的数量时,我们考虑的图形的近似字符串匹配的变体不是固定参数可处理的,即使对于与 DAG 距离为 1 的图形也是如此。后一个结果的减少使我们能够证明变体的不可近似性,其中编辑操作可以应用于查询字符串和图形标签。我们表明该问题是固定参数易于处理的,并且不太可能承认多项式核。当仅允许在图形标签上进行编辑操作时,该问题的 NP 完整性导致近似匹配的不可近似性(在任何因素内)。此外,我们表明,当参数是编辑操作的数量时,我们考虑的图形的近似字符串匹配的变体不是固定参数可处理的,即使对于与 DAG 距离为 1 的图形也是如此。后一个结果的减少使我们能够证明变体的不可近似性,其中编辑操作可以应用于查询字符串和图形标签。当仅允许在图形标签上进行编辑操作时,该问题的 NP 完整性导致近似匹配的不可近似性(在任何因素内)。此外,我们表明,当参数是编辑操作的数量时,我们考虑的图形的近似字符串匹配的变体不是固定参数可处理的,即使对于与 DAG 距离为 1 的图形也是如此。后一个结果的减少使我们能够证明变体的不可近似性,其中编辑操作可以应用于查询字符串和图形标签。当仅允许在图形标签上进行编辑操作时,该问题的 NP 完整性导致近似匹配的不可近似性(在任何因素内)。此外,我们表明,当参数是编辑操作的数量时,我们考虑的图形的近似字符串匹配的变体不是固定参数可处理的,即使对于与 DAG 距离为 1 的图形也是如此。后一个结果的减少使我们能够证明变体的不可近似性,其中编辑操作可以应用于查询字符串和图形标签。
更新日期:2020-01-08
down
wechat
bug