当前位置: X-MOL 学术Behav. Ecol. Sociobiol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Effective use of the McNemar test
Behavioral Ecology and Sociobiology ( IF 1.9 ) Pub Date : 2020-10-10 , DOI: 10.1007/s00265-020-02916-y
Matilda Q. R. Pembury Smith , Graeme D. Ruxton

It is not uncommon for researchers to want to interrogate paired binomial data. For example, researchers may want to compare an organism’s response (positive or negative) to two different stimuli. If they apply both stimuli to a sample of individuals, it would be natural to present the data in a 2 × 2 table. There would be two cells with concordant results (the frequency of individuals which responded positively or negatively to both stimuli) and two cells with discordant results (the frequency of individuals who responded positively to one stimulus, but negatively to the other). The key issue is whether the totals in the two discordant cells are sufficiently different to suggest that the stimuli trigger different reactions. In terms of the null hypothesis testing paradigm, this would translate as a P value which is the probability of seeing the observed difference in these two values or a more extreme difference if the two stimuli produced an identical reaction. The statistical test designed to provide this P value is the McNemar test. Here, we seek to promote greater and better use of the McNemar test. To achieve this, we fully describe a range of circumstances within biological research where it can be effectively applied, describe the different variants of the test that exist, explain how these variants can be accessed in R, and offer guidance on which of these variants to adopt. To support our arguments, we highlight key recent methodological advances and compare these with a novel survey of current usage of the test. When analysing paired binomial data, researchers appear to reflexively apply a chi-squared test, with the McNemar test being largely overlooked, despite it often being more appropriate. As these tests evaluate a different null hypothesis, selecting the appropriate test is essential for effective analysis. When using the McNemar test, there are four methods that can be applied. Recent advice has outlined clear guidelines on which method should be used. By conducting a survey, we provide support for these guidelines, but identify that the method chosen in publications is rarely specified or the most appropriate. Our study provides clear guidance on which method researchers should select and highlights examples of when this test should be used and how it can be implemented easily to improve future research.

中文翻译:

McNemar 测试的有效使用

研究人员想要查询成对的二项式数据的情况并不少见。例如,研究人员可能想要比较生物体对两种不同刺激的反应(正面或负面)。如果他们将两种刺激都应用于个人样本,则很自然地将数据呈现在 2 × 2 表格中。将有两个具有一致结果的细胞(对两种刺激做出积极或消极反应的个体的频率)和具有不一致结果的两个细胞(对一种刺激做出积极反应但对另一种刺激做出消极反应的个体的频率)。关键问题是两个不一致的细胞中的总数是否有足够的差异来表明刺激会触发不同的反应。就零假设检验范式而言,这将转化为 P 值,它是在这两个值中看到观察到的差异的概率,或者如果两个刺激产生相同的反应,则为更极端的差异。旨在提供此 P 值的统计检验是 McNemar 检验。在这里,我们寻求促进更多更好地使用 McNemar 测试。为了实现这一目标,我们全面描述了生物研究中可以有效应用的一系列情况,描述了现有测试的不同变体,解释了如何在 R 中访问这些变体,并就这些变体中的哪些变体提供指导采纳。为了支持我们的论点,我们强调了最近的关键方法学进展,并将这些进展与对当前测试使用情况的新调查进行了比较。在分析配对二项式数据时,研究人员似乎反射性地应用了卡方检验,而 McNemar 检验在很大程度上被忽视了,尽管它通常更合适。由于这些检验评估不同的零假设,因此选择合适的检验对于有效分析至关重要。使用 McNemar 检验时,可以应用四种方法。最近的建议概述了应使用哪种方法的明确指南。通过进行调查,我们为这些指南提供支持,但发现出版物中选择的方法很少被指定或最合适。我们的研究为研究人员应该选择哪种方法提供了明确的指导,并强调了何时应使用此测试以及如何轻松实施以改进未来研究的示例。尽管它通常更合适。由于这些检验评估不同的零假设,因此选择合适的检验对于有效分析至关重要。使用 McNemar 检验时,可以应用四种方法。最近的建议概述了应使用哪种方法的明确指南。通过进行调查,我们为这些指南提供支持,但发现出版物中选择的方法很少被指定或最合适。我们的研究为研究人员应该选择哪种方法提供了明确的指导,并强调了何时应使用此测试以及如何轻松实施以改进未来研究的示例。尽管它通常更合适。由于这些检验评估不同的零假设,因此选择合适的检验对于有效分析至关重要。使用 McNemar 检验时,可以应用四种方法。最近的建议概述了应使用哪种方法的明确指南。通过进行调查,我们为这些指南提供支持,但发现出版物中选择的方法很少被指定或最合适。我们的研究为研究人员应该选择哪种方法提供了明确的指导,并强调了何时应使用此测试以及如何轻松实施以改进未来研究的示例。有四种方法可以应用。最近的建议概述了应使用哪种方法的明确指南。通过进行调查,我们为这些指南提供支持,但发现出版物中选择的方法很少被指定或最合适。我们的研究为研究人员应该选择哪种方法提供了明确的指导,并强调了何时应使用此测试以及如何轻松实施以改进未来研究的示例。有四种方法可以应用。最近的建议概述了应使用哪种方法的明确指南。通过进行调查,我们为这些指南提供支持,但发现出版物中选择的方法很少被指定或最合适。我们的研究为研究人员应该选择哪种方法提供了明确的指导,并强调了何时应使用此测试以及如何轻松实施以改进未来研究的示例。
更新日期:2020-10-10
down
wechat
bug