scipy.stats.

boschloo_exact#

scipy.stats.boschloo_exact(table, alternative='two-sided', n=32)[原始碼]#

對 2x2 列聯表執行 Boschloo 精確檢定。

參數:

table整數的 array_like: 一個 2x2 列聯表。元素應為非負整數。
alternative{‘two-sided’, ‘less’, ‘greater’}, 選用: 定義虛無假設和對立假設。預設值為 ‘two-sided’。請參閱下方「註解」章節中的說明。
n整數, 選用: 用於建構抽樣方法的取樣點數量。請注意，此引數將自動轉換為下一個更高的 2 的冪，因為 scipy.stats.qmc.Sobol 用於選擇取樣點。預設值為 32。必須為正數。在大多數情況下，32 個點已足夠達到良好的精確度。更多點會帶來效能成本。

回傳值:

berBoschlooExactResult

具有以下屬性的結果物件。

statisticfloat: Boschloo 檢定中使用的統計量；也就是 Fisher 精確檢定的 p 值。
pvaluefloat: P 值，在虛無假設為真的前提下，獲得至少與實際觀察到的分佈一樣極端的分佈的機率。

另請參閱

chi2_contingency: 列聯表中變數獨立性的卡方檢定。
fisher_exact: 2x2 列聯表上的 Fisher 精確檢定。
barnard_exact: Barnard 精確檢定，對於 2x2 列聯表而言，它是比 Fisher 精確檢定更強大的替代方案。

註解

Boschloo 檢定是一種用於分析列聯表的精確檢定。它檢驗兩個類別變數的關聯性，並且對於 2x2 列聯表而言，是比 Fisher 精確檢定更一致且更強大的替代方案。

Boschloo 精確檢定使用 Fisher 精確檢定的 p 值作為統計量，而 Boschloo 的 p 值是在虛無假設下觀察到如此極端統計值的機率。

讓我們定義 \(X_0\) 為代表觀察樣本的 2x2 矩陣，其中每列儲存二項式實驗，如下例所示。讓我們也定義 \(p_1, p_2\) 為 \(x_{11}\) 和 \(x_{12}\) 的理論二項式機率。當使用 Boschloo 精確檢定時，我們可以斷言三個不同的對立假設

\(H_0 : p_1=p_2\) versus \(H_1 : p_1 < p_2\)，使用 alternative = “less”
\(H_0 : p_1=p_2\) versus \(H_1 : p_1 > p_2\)，使用 alternative = “greater”
\(H_0 : p_1=p_2\) versus \(H_1 : p_1 \neq p_2\)，使用 alternative = “two-sided” (預設)

當虛無分佈不對稱時，計算雙尾 p 值的慣例有很多種。在此，我們應用雙尾檢定的 p 值是單尾檢定的 p 值的兩倍最小值（上限為 1.0）的慣例。請注意，fisher_exact 遵循不同的慣例，因此對於給定的 table，boschloo_exact 報告的統計量可能與 fisher_exact 在 alternative='two-sided' 時報告的 p 值不同。

在 1.7.0 版本中新增。

參考文獻

[1]

R.D. Boschloo. “Raised conditional level of significance for the 2 x 2-table when testing the equality of two probabilities”, Statistica Neerlandica, 24(1), 1970

[2]

“Boschloo’s test”, 維基百科, https://en.wikipedia.org/wiki/Boschloo%27s_test

[3]

Lise M. Saari et al. “Employee attitudes and job satisfaction”, Human Resource Management, 43(4), 395-407, 2004, DOI:10.1002/hrm.20032。

範例

在以下範例中，我們考慮文章 “Employee attitudes and job satisfaction” [3]，其中報告了 63 位科學家和 117 位大學教授的調查結果。在 63 位科學家中，有 31 位表示他們對工作非常滿意，而 117 位大學教授中有 74 位對他們的工作非常滿意。這是否是顯著的證據，表明大學教授比科學家對他們的工作更滿意？下表總結了上述資料

                 college professors   scientists
Very Satisfied   74                     31
Dissatisfied     43                     32

當進行統計假設檢定時，我們通常使用臨界機率或顯著性水準，依此決定是否拒絕虛無假設 \(H_0\)。假設我們選擇常見的 5% 顯著性水準。

我們的對立假設是大學教授對他們的工作確實比科學家更滿意。因此，我們預期非常滿意的大學教授的比例 \(p_1\) 會大於非常滿意的科學家的比例 \(p_2\)。因此，我們使用 alternative="greater" 選項呼叫 boschloo_exact

>>> import scipy.stats as stats
>>> res = stats.boschloo_exact([[74, 31], [43, 32]], alternative="greater")
>>> res.statistic
0.0483
>>> res.pvalue
0.0355

在科學家比大學教授對他們的工作更快樂的虛無假設下，獲得至少與觀察資料一樣極端的檢定結果的機率約為 3.55%。由於此 p 值小於我們選擇的顯著性水準，因此我們有證據拒絕 \(H_0\) 而支持對立假設。