当前位置: X-MOL 学术EPJ Data Sci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Gendered behavior as a disadvantage in open source software development
EPJ Data Science ( IF 3.0 ) Pub Date : 2019-07-06 , DOI: 10.1140/epjds/s13688-019-0202-z
Balazs Vedres , Orsolya Vasarhelyi

Women are severely marginalized in software development, especially in open source. In this article we argue that disadvantage is more due to gendered behavior than to categorical discrimination: women are at a disadvantage because of what they do, rather than because of who they are. Using data on entire careers of users from GitHub.com, we develop a measure to capture the gendered pattern of behavior: We use a random forest prediction of being female (as opposed to being male) by behavioral choices in the level of activity, specialization in programming languages, and choice of partners. We test differences in success and survival along both categorical gender and the gendered pattern of behavior. We find that 84.5% of women’s disadvantage (compared to men) in success and 34.8% of their disadvantage in survival are due to the female pattern of their behavior. Men are also disadvantaged along their interquartile range of the female pattern of their behavior, and users who don’t reveal their gender suffer an even more drastic disadvantage in survival probability. Moreover, we do not see evidence for any reduction of these inequalities in time. Our findings are robust to noise in gender recognition, and to taking into account particular programming languages, or decision tree classes of gendered behavior. Our results suggest that fighting categorical gender discrimination will have a limited impact on gender inequalities in open source software development, and that gender hiding is not a viable strategy for women.

中文翻译:

性别行为是开源软件开发中的不利条件

在软件开发中,特别是在开源中,女性被严重边缘化。在本文中,我们认为,劣势更多是由于性别行为而不是绝对的歧视:女性处于劣势是因为她们的所作所为,而不是因为她们是谁。使用来自GitHub.com的用户整个职业数据,我们开发了一种衡量行为性别模式的方法:我们根据活动,专业化程度上的行为选择,使用随机森林预测女性是女性(而不是男性)编程语言以及合作伙伴的选择。我们通过分类性别和行为的性别模式来检验成功和生存的差异。我们发现,女性的劣势(相对于男性)有84.5%的成功率是34%。他们的生存劣势的8%是由于他们的女性行为方式所致。男性在其行为的女性模式的四分位数范围内也处于不利地位,而未透露性别的用户则在生存概率上遭受更大的不利影响。而且,我们看不到有证据证明这些不平等现象在时间上有所减少。我们的发现对于抵制性别识别,考虑到特定的编程语言或性别行为的决策树类别具有鲁棒性。我们的结果表明,与绝对的性别歧视作斗争将对开源软件开发中的性别不平等产生有限的影响,并且性别隐藏对于女性而言不是可行的策略。男性在其行为的女性模式的四分位数范围内也处于不利地位,而未透露性别的用户则在生存概率上遭受更大的不利影响。此外,我们看不到有证据表明这些不平等现象在时间上有所减少。我们的发现对于抵制性别识别方面的噪音,以及考虑到特定的编程语言或性别行为的决策树类,都具有较强的鲁棒性。我们的结果表明,与绝对的性别歧视作斗争将对开源软件开发中的性别不平等产生有限的影响,并且性别隐藏对于女性而言不是可行的策略。男性在其行为的女性模式的四分位数范围内也处于不利地位,而未透露性别的使用者则在生存概率上遭受更大的不利影响。此外,我们看不到有证据表明这些不平等现象在时间上有所减少。我们的发现对于抵制性别识别方面的噪音,以及考虑到特定的编程语言或性别行为的决策树类,都具有较强的鲁棒性。我们的结果表明,与绝对的性别歧视作斗争将对开源软件开发中的性别不平等产生有限的影响,并且性别隐藏对于女性而言不是可行的策略。我们的发现对于抵制性别识别方面的噪音,以及考虑到特定的编程语言或性别行为的决策树类,都具有较强的鲁棒性。我们的结果表明,与绝对的性别歧视作斗争将对开源软件开发中的性别不平等产生有限的影响,并且性别隐藏对于女性而言不是可行的策略。我们的发现对于抵制性别识别方面的噪音,以及考虑到特定的编程语言或性别行为的决策树类,都具有较强的鲁棒性。我们的结果表明,与绝对的性别歧视作斗争将对开源软件开发中的性别不平等产生有限的影响,并且性别隐藏对于女性而言不是可行的策略。
更新日期:2019-07-06
down
wechat
bug