scipy.stats.

boschloo_exact#

scipy.stats.boschloo_exact(table, alternative='two-sided', n=32)[原始碼]#

對 2x2 列聯表執行 Boschloo 精確檢定。

參數:
table整數的 array_like

一個 2x2 列聯表。元素應為非負整數。

alternative{‘two-sided’, ‘less’, ‘greater’}, 選用

定義虛無假設和對立假設。預設值為 ‘two-sided’。請參閱下方「註解」章節中的說明。

n整數, 選用

用於建構抽樣方法的取樣點數量。請注意,此引數將自動轉換為下一個更高的 2 的冪,因為 scipy.stats.qmc.Sobol 用於選擇取樣點。預設值為 32。必須為正數。在大多數情況下,32 個點已足夠達到良好的精確度。更多點會帶來效能成本。

回傳值:
berBoschlooExactResult

具有以下屬性的結果物件。

statisticfloat

Boschloo 檢定中使用的統計量;也就是 Fisher 精確檢定的 p 值。

pvaluefloat

P 值,在虛無假設為真的前提下,獲得至少與實際觀察到的分佈一樣極端的分佈的機率。

另請參閱

chi2_contingency

列聯表中變數獨立性的卡方檢定。

fisher_exact

2x2 列聯表上的 Fisher 精確檢定。

barnard_exact

Barnard 精確檢定,對於 2x2 列聯表而言,它是比 Fisher 精確檢定更強大的替代方案。

註解

Boschloo 檢定是一種用於分析列聯表的精確檢定。它檢驗兩個類別變數的關聯性,並且對於 2x2 列聯表而言,是比 Fisher 精確檢定更一致且更強大的替代方案。

Boschloo 精確檢定使用 Fisher 精確檢定的 p 值作為統計量,而 Boschloo 的 p 值是在虛無假設下觀察到如此極端統計值的機率。

讓我們定義 \(X_0\) 為代表觀察樣本的 2x2 矩陣,其中每列儲存二項式實驗,如下例所示。 讓我們也定義 \(p_1, p_2\)\(x_{11}\)\(x_{12}\) 的理論二項式機率。 當使用 Boschloo 精確檢定時,我們可以斷言三個不同的對立假設

  • \(H_0 : p_1=p_2\) versus \(H_1 : p_1 < p_2\),使用 alternative = “less”

  • \(H_0 : p_1=p_2\) versus \(H_1 : p_1 > p_2\),使用 alternative = “greater”

  • \(H_0 : p_1=p_2\) versus \(H_1 : p_1 \neq p_2\),使用 alternative = “two-sided” (預設)

當虛無分佈不對稱時,計算雙尾 p 值的慣例有很多種。 在此,我們應用雙尾檢定的 p 值是單尾檢定的 p 值的兩倍最小值(上限為 1.0)的慣例。 請注意,fisher_exact 遵循不同的慣例,因此對於給定的 tableboschloo_exact 報告的統計量可能與 fisher_exactalternative='two-sided' 時報告的 p 值不同。

在 1.7.0 版本中新增。

參考文獻

[1]

R.D. Boschloo. “Raised conditional level of significance for the 2 x 2-table when testing the equality of two probabilities”, Statistica Neerlandica, 24(1), 1970

[2]

“Boschloo’s test”, 維基百科, https://en.wikipedia.org/wiki/Boschloo%27s_test

[3]

Lise M. Saari et al. “Employee attitudes and job satisfaction”, Human Resource Management, 43(4), 395-407, 2004, DOI:10.1002/hrm.20032

範例

在以下範例中,我們考慮文章 “Employee attitudes and job satisfaction” [3],其中報告了 63 位科學家和 117 位大學教授的調查結果。 在 63 位科學家中,有 31 位表示他們對工作非常滿意,而 117 位大學教授中有 74 位對他們的工作非常滿意。 這是否是顯著的證據,表明大學教授比科學家對他們的工作更滿意? 下表總結了上述資料

                 college professors   scientists
Very Satisfied   74                     31
Dissatisfied     43                     32

當進行統計假設檢定時,我們通常使用臨界機率或顯著性水準,依此決定是否拒絕虛無假設 \(H_0\)。 假設我們選擇常見的 5% 顯著性水準。

我們的對立假設是大學教授對他們的工作確實比科學家更滿意。 因此,我們預期非常滿意的大學教授的比例 \(p_1\) 會大於非常滿意的科學家的比例 \(p_2\)。 因此,我們使用 alternative="greater" 選項呼叫 boschloo_exact

>>> import scipy.stats as stats
>>> res = stats.boschloo_exact([[74, 31], [43, 32]], alternative="greater")
>>> res.statistic
0.0483
>>> res.pvalue
0.0355

在科學家比大學教授對他們的工作更快樂的虛無假設下,獲得至少與觀察資料一樣極端的檢定結果的機率約為 3.55%。 由於此 p 值小於我們選擇的顯著性水準,因此我們有證據拒絕 \(H_0\) 而支持對立假設。