当前位置: X-MOL 学术arXiv.cs.DL › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Discovering Mathematical Objects of Interest -- A Study of Mathematical Notations
arXiv - CS - Digital Libraries Pub Date : 2020-02-07 , DOI: arxiv-2002.02712
Andre Greiner-Petter, Moritz Schubotz, Fabian Mueller, Corinna Breitinger, Howard S. Cohl, Akiko Aizawa, Bela Gipp

Mathematical notation, i.e., the writing system used to communicate concepts in mathematics, encodes valuable information for a variety of information search and retrieval systems. Yet, mathematical notations remain mostly unutilized by today's systems. In this paper, we present the first in-depth study on the distributions of mathematical notation in two large scientific corpora: the open access arXiv (2.5B mathematical objects) and the mathematical reviewing service for pure and applied mathematics zbMATH (61M mathematical objects). Our study lays a foundation for future research projects on mathematical information retrieval for large scientific corpora. Further, we demonstrate the relevance of our results to a variety of use-cases. For example, to assist semantic extraction systems, to improve scientific search engines, and to facilitate specialized math recommendation systems. The contributions of our presented research are as follows: (1) we present the first distributional analysis of mathematical formulae on arXiv and zbMATH; (2) we retrieve relevant mathematical objects for given textual search queries (e.g., linking $P_{n}^{(\alpha, \beta)}\!\left(x\right)$ with `Jacobi polynomial'); (3) we extend zbMATH's search engine by providing relevant mathematical formulae; and (4) we exemplify the applicability of the results by presenting auto-completion for math inputs as the first contribution to math recommendation systems. To expedite future research projects, we have made available our source code and data.

中文翻译:

发现感兴趣的数学对象——数学符号研究

数学符号,即用于交流数学概念的书写系统,为各种信息搜索和检索系统编码有价值的信息。然而,当今的系统大多未使用数学符号。在本文中,我们首次深入研究了两个大型科学语料库中数学符号的分布:开放访问的 arXiv(2.5B 数学对象)和纯数学和应用数学的数学审查服务 zbMATH(61M 数学对象) . 我们的研究为未来大型科学语料库数学信息检索的研究项目奠定了基础。此外,我们证明了我们的结果与各种用例的相关性。例如,协助语义提取系统,改进科学搜索引擎,并促进专门的数学推荐系统。我们提出的研究的贡献如下:(1)我们在 arXiv 和 zbMATH 上提出了数学公式的第一个分布分析;(2) 我们为给定的文本搜索查询检索相关的数学对象(例如,将 $P_{n}^{(\alpha, \beta)}\!\left(x\right)$ 与 `Jacobi polynomial' 联系起来);(3) 我们通过提供相关的数学公式来扩展zbMATH的搜索引擎;(4) 我们通过将数学输入的自动完成作为对数学推荐系统的第一个贡献来举例说明结果的适用性。为了加快未来的研究项目,我们提供了源代码和数据。(1) 我们首次对 arXiv 和 zbMATH 上的数学公式进行分布分析;(2) 我们为给定的文本搜索查询检索相关的数学对象(例如,将 $P_{n}^{(\alpha, \beta)}\!\left(x\right)$ 与 `Jacobi polynomial' 联系起来);(3) 我们通过提供相关的数学公式来扩展zbMATH的搜索引擎;(4) 我们通过将数学输入的自动完成作为对数学推荐系统的第一个贡献来举例说明结果的适用性。为了加快未来的研究项目,我们提供了源代码和数据。(1) 我们首次对 arXiv 和 zbMATH 上的数学公式进行分布分析;(2) 我们为给定的文本搜索查询检索相关的数学对象(例如,将 $P_{n}^{(\alpha, \beta)}\!\left(x\right)$ 与 `Jacobi polynomial' 联系起来);(3) 我们通过提供相关的数学公式来扩展zbMATH的搜索引擎;(4) 我们通过将数学输入的自动完成作为对数学推荐系统的第一个贡献来举例说明结果的适用性。为了加快未来的研究项目,我们提供了源代码和数据。通过提供相关数学公式的搜索引擎;(4) 我们通过将数学输入的自动完成作为对数学推荐系统的第一个贡献来举例说明结果的适用性。为了加快未来的研究项目,我们提供了源代码和数据。通过提供相关数学公式的搜索引擎;(4) 我们通过将数学输入的自动完成作为对数学推荐系统的第一个贡献来举例说明结果的适用性。为了加快未来的研究项目,我们提供了源代码和数据。
更新日期:2020-02-20
down
wechat
bug