当前位置: X-MOL 学术arXiv.cs.SE › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
An Exploratory Study of Bot Commits
arXiv - CS - Software Engineering Pub Date : 2020-03-17 , DOI: arxiv-2003.07961
Tapajit Dey, Bogdan Vasilescu, Audris Mockus

Background: Bots help automate many of the tasks performed by software developers and are widely used to commit code in various social coding platforms. At present, it is not clear what types of activities these bots perform and understanding it may help design better bots, and find application areas which might benefit from bot adoption. Aim: We aim to categorize the Bot Commits by the type of change (files added, deleted, or modified), find the more commonly changed file types, and identify the groups of file types that tend to get updated together. Method: 12,326,137 commits made by 461 popular bots (that made at least 1000 commits) were examined to identify the frequency and the type of files added/ deleted/ modified by the commits, and association rule mining was used to identify the types of files modified together. Result: Majority of the bot commits modify an existing file, a few of them add new files, while deletion of a file is very rare. Commits involving more than one type of operation are even rarer. Files containing data, configuration, and documentation are most frequently updated, while HTML is the most common type in terms of the number of files added, deleted, and modified. Files of the type "Markdown", "Ignore List", "YAML", "JSON" were the types that are updated together with other types of files most frequently. Conclusion: We observe that majority of bot commits involve single file modifications, and bots primarily work with data, configuration, and documentation files. A better understanding if this is a limitation of the bots and, if overcome, would lead to different kinds of bots remains an open question.

中文翻译:

Bot 提交的探索性研究

背景:机器人有助于使软件开发人员执行的许多任务自动化,并被广泛用于在各种社交编码平台上提交代码。目前,尚不清楚这些机器人执行哪些类型的活动,了解它可能有助于设计更好的机器人,并找到可能从机器人采用中受益的应用领域。目标:我们的目标是按更改类型(添加、删除或修改的文件)对 Bot Commit 进行分类,找到更常更改的文件类型,并确定倾向于一起更新的文件类型组。方法:对 461 个流行机器人(至少提交 1000 次提交)的 12,326,137 次提交进行检查,以识别提交添加/删除/修改文件的频率和类型,并使用关联规则挖掘来识别修改的文件类型一起。结果:大多数 bot 提交修改现有文件,其中一些添加新文件,而删除文件非常罕见。涉及一种以上操作的提交甚至更少见。包含数据、配置和文档的文件最常更新,而就添加、删除和修改的文件数量而言,HTML 是最常见的类型。“Markdown”、“Ignore List”、“YAML”、“JSON”类型的文件是与其他类型文件一起更新最频繁的类型。结论:我们观察到大多数机器人提交都涉及单个文件修改,并且机器人主要处理数据、配置和文档文件。更好地理解这是否是机器人的限制,如果克服,会导致不同类型的机器人仍然是一个悬而未决的问题。其中一些会添加新文件,而删除文件则非常罕见。涉及一种以上操作的提交甚至更少见。包含数据、配置和文档的文件最常更新,而就添加、删除和修改的文件数量而言,HTML 是最常见的类型。“Markdown”、“Ignore List”、“YAML”、“JSON”类型的文件是与其他类型文件一起更新最频繁的类型。结论:我们观察到大多数机器人提交都涉及单个文件修改,并且机器人主要处理数据、配置和文档文件。更好地理解这是否是机器人的限制,如果克服,会导致不同类型的机器人仍然是一个悬而未决的问题。其中一些会添加新文件,而删除文件则非常罕见。涉及一种以上操作的提交甚至更少见。包含数据、配置和文档的文件最常更新,而就添加、删除和修改的文件数量而言,HTML 是最常见的类型。“Markdown”、“Ignore List”、“YAML”、“JSON”类型的文件是与其他类型文件一起更新最频繁的类型。结论:我们观察到大多数机器人提交都涉及单个文件修改,并且机器人主要处理数据、配置和文档文件。更好地理解这是否是机器人的限制,如果克服,会导致不同类型的机器人仍然是一个悬而未决的问题。而删除文件是非常罕见的。涉及一种以上操作的提交甚至更少见。包含数据、配置和文档的文件最常更新,而就添加、删除和修改的文件数量而言,HTML 是最常见的类型。“Markdown”、“Ignore List”、“YAML”、“JSON”类型的文件是与其他类型文件一起更新最频繁的类型。结论:我们观察到大多数机器人提交都涉及单个文件修改,并且机器人主要处理数据、配置和文档文件。更好地理解这是否是机器人的限制,如果克服,会导致不同类型的机器人仍然是一个悬而未决的问题。而删除文件是非常罕见的。涉及一种以上操作的提交甚至更少见。包含数据、配置和文档的文件最常更新,而就添加、删除和修改的文件数量而言,HTML 是最常见的类型。“Markdown”、“Ignore List”、“YAML”、“JSON”类型的文件是与其他类型文件一起更新最频繁的类型。结论:我们观察到大多数机器人提交都涉及单个文件修改,并且机器人主要处理数据、配置和文档文件。更好地理解这是否是机器人的限制,如果克服,会导致不同类型的机器人仍然是一个悬而未决的问题。包含数据、配置和文档的文件最常更新,而就添加、删除和修改的文件数量而言,HTML 是最常见的类型。“Markdown”、“Ignore List”、“YAML”、“JSON”类型的文件是与其他类型文件一起更新最频繁的类型。结论:我们观察到大多数机器人提交都涉及单个文件修改,并且机器人主要处理数据、配置和文档文件。更好地理解这是否是机器人的限制,如果克服,会导致不同类型的机器人仍然是一个悬而未决的问题。包含数据、配置和文档的文件最常更新,而就添加、删除和修改的文件数量而言,HTML 是最常见的类型。“Markdown”、“Ignore List”、“YAML”、“JSON”类型的文件是与其他类型文件一起更新最频繁的类型。结论:我们观察到大多数机器人提交都涉及单个文件修改,并且机器人主要处理数据、配置和文档文件。更好地理解这是否是机器人的限制,如果克服,会导致不同类型的机器人仍然是一个悬而未决的问题。
更新日期:2020-11-10
down
wechat
bug