当前位置: X-MOL 学术arXiv.cs.LO › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Myhill-Nerode Theorem for Register Automata and Symbolic Trace Languages
arXiv - CS - Logic in Computer Science Pub Date : 2020-07-07 , DOI: arxiv-2007.03540
Frits Vaandrager and Abhisek Midya

We propose a new symbolic trace semantics for register automata (extended finite state machines) which records both the sequence of input symbols that occur during a run as well as the constraints on input parameters that are imposed by this run. Our main result is a generalization of the classical Myhill-Nerode theorem to this symbolic setting. Our generalization requires the use of three relations to capture the additional structure of register automata. Location equivalence $\equiv_l$ captures that symbolic traces end in the same location, transition equivalence $\equiv_t$ captures that they share the same final transition, and a partial equivalence relation $\equiv_r$ captures that symbolic values $v$ and $v'$ are stored in the same register after symbolic traces $w$ and $w'$, respectively. A symbolic language is defined to be regular if relations $\equiv_l$, $\equiv_t$ and $\equiv_r$ exist that satisfy certain conditions, in particular, they all have finite index. We show that the symbolic language associated to a register automaton is regular, and we construct, for each regular symbolic language, a register automaton that accepts this language. Our result provides a foundation for grey-box learning algorithms in settings where the constraints on data parameters can be extracted from code using e.g. tools for symbolic/concolic execution or tainting. We believe that moving to a grey-box setting is essential to overcome the scalability problems of state-of-the-art black-box learning algorithms.

中文翻译:

用于注册自动机和符号跟踪语言的 Myhill-Nerode 定理

我们为寄存器自动机(扩展有限状态机)提出了一种新的符号跟踪语义,它记录了在运行期间发生的输入符号序列以及这次运行对输入参数的约束。我们的主要结果是将经典的 Myhill-Nerode 定理推广到这个符号设置。我们的概括需要使用三个关系来捕获寄存器自动机的附加结构。位置等价 $\equiv_l$ 捕获符号跟踪在同一位置结束,转换等价 $\equiv_t$ 捕获它们共享相同的最终转换,部分等价关系 $\equiv_r$ 捕获符号值 $v$ 和 $v '$ 分别在符号跟踪 $w$ 和 $w'$ 之后存储在同一寄存器中。如果关系$\equiv_l$、$\equiv_t$ 和$\equiv_r$ 存在满足一定条件,特别是它们都具有有限索引,则符号语言被定义为正则的。我们证明了与寄存器自动机相关联的符号语言是规则的,并且我们为每个规则符号语言构造了一个接受这种语言的寄存器自动机。我们的结果为在设置中的灰盒学习算法提供了基础,其中数据参数的约束可以使用例如符号/混合执行或污染的工具从代码中提取。我们相信,转向灰盒设置对于克服最先进的黑盒学习算法的可扩展性问题至关重要。我们证明了与寄存器自动机相关联的符号语言是规则的,并且我们为每个规则符号语言构造了一个接受这种语言的寄存器自动机。我们的结果为在设置中的灰盒学习算法提供了基础,其中数据参数的约束可以使用例如符号/混合执行或污染的工具从代码中提取。我们相信,转向灰盒设置对于克服最先进的黑盒学习算法的可扩展性问题至关重要。我们证明了与寄存器自动机相关联的符号语言是规则的,并且我们为每个规则符号语言构造了一个接受这种语言的寄存器自动机。我们的结果为在设置中的灰盒学习算法提供了基础,其中数据参数的约束可以使用例如符号/混合执行或污染的工具从代码中提取。我们相信,转向灰盒设置对于克服最先进的黑盒学习算法的可扩展性问题至关重要。我们的结果为在设置中的灰盒学习算法提供了基础,其中数据参数的约束可以使用例如符号/混合执行或污染的工具从代码中提取。我们相信,转向灰盒设置对于克服最先进的黑盒学习算法的可扩展性问题至关重要。我们的结果为在设置中的灰盒学习算法提供了基础,其中数据参数的约束可以使用例如符号/混合执行或污染的工具从代码中提取。我们相信,转向灰盒设置对于克服最先进的黑盒学习算法的可扩展性问题至关重要。
更新日期:2020-07-08
down
wechat
bug