boschloo_exact#
- scipy.stats.boschloo_exact(table, alternative='two-sided', n=32)[原始碼]#
對 2x2 列聯表執行 Boschloo 精確檢定。
- 參數:
- table整數的 array_like
一個 2x2 列聯表。元素應為非負整數。
- alternative{‘two-sided’, ‘less’, ‘greater’}, 選用
定義虛無假設和對立假設。預設值為 ‘two-sided’。請參閱下方「註解」章節中的說明。
- n整數, 選用
用於建構抽樣方法的取樣點數量。請注意,此引數將自動轉換為下一個更高的 2 的冪,因為
scipy.stats.qmc.Sobol
用於選擇取樣點。預設值為 32。必須為正數。在大多數情況下,32 個點已足夠達到良好的精確度。更多點會帶來效能成本。
- 回傳值:
- berBoschlooExactResult
具有以下屬性的結果物件。
- statisticfloat
Boschloo 檢定中使用的統計量;也就是 Fisher 精確檢定的 p 值。
- pvaluefloat
P 值,在虛無假設為真的前提下,獲得至少與實際觀察到的分佈一樣極端的分佈的機率。
另請參閱
chi2_contingency
列聯表中變數獨立性的卡方檢定。
fisher_exact
2x2 列聯表上的 Fisher 精確檢定。
barnard_exact
Barnard 精確檢定,對於 2x2 列聯表而言,它是比 Fisher 精確檢定更強大的替代方案。
註解
Boschloo 檢定是一種用於分析列聯表的精確檢定。它檢驗兩個類別變數的關聯性,並且對於 2x2 列聯表而言,是比 Fisher 精確檢定更一致且更強大的替代方案。
Boschloo 精確檢定使用 Fisher 精確檢定的 p 值作為統計量,而 Boschloo 的 p 值是在虛無假設下觀察到如此極端統計值的機率。
讓我們定義 \(X_0\) 為代表觀察樣本的 2x2 矩陣,其中每列儲存二項式實驗,如下例所示。 讓我們也定義 \(p_1, p_2\) 為 \(x_{11}\) 和 \(x_{12}\) 的理論二項式機率。 當使用 Boschloo 精確檢定時,我們可以斷言三個不同的對立假設
\(H_0 : p_1=p_2\) versus \(H_1 : p_1 < p_2\),使用 alternative = “less”
\(H_0 : p_1=p_2\) versus \(H_1 : p_1 > p_2\),使用 alternative = “greater”
\(H_0 : p_1=p_2\) versus \(H_1 : p_1 \neq p_2\),使用 alternative = “two-sided” (預設)
當虛無分佈不對稱時,計算雙尾 p 值的慣例有很多種。 在此,我們應用雙尾檢定的 p 值是單尾檢定的 p 值的兩倍最小值(上限為 1.0)的慣例。 請注意,
fisher_exact
遵循不同的慣例,因此對於給定的 table,boschloo_exact
報告的統計量可能與fisher_exact
在alternative='two-sided'
時報告的 p 值不同。在 1.7.0 版本中新增。
參考文獻
[1]R.D. Boschloo. “Raised conditional level of significance for the 2 x 2-table when testing the equality of two probabilities”, Statistica Neerlandica, 24(1), 1970
[2]“Boschloo’s test”, 維基百科, https://en.wikipedia.org/wiki/Boschloo%27s_test
[3]Lise M. Saari et al. “Employee attitudes and job satisfaction”, Human Resource Management, 43(4), 395-407, 2004, DOI:10.1002/hrm.20032。
範例
在以下範例中,我們考慮文章 “Employee attitudes and job satisfaction” [3],其中報告了 63 位科學家和 117 位大學教授的調查結果。 在 63 位科學家中,有 31 位表示他們對工作非常滿意,而 117 位大學教授中有 74 位對他們的工作非常滿意。 這是否是顯著的證據,表明大學教授比科學家對他們的工作更滿意? 下表總結了上述資料
college professors scientists Very Satisfied 74 31 Dissatisfied 43 32
當進行統計假設檢定時,我們通常使用臨界機率或顯著性水準,依此決定是否拒絕虛無假設 \(H_0\)。 假設我們選擇常見的 5% 顯著性水準。
我們的對立假設是大學教授對他們的工作確實比科學家更滿意。 因此,我們預期非常滿意的大學教授的比例 \(p_1\) 會大於非常滿意的科學家的比例 \(p_2\)。 因此,我們使用
alternative="greater"
選項呼叫boschloo_exact
>>> import scipy.stats as stats >>> res = stats.boschloo_exact([[74, 31], [43, 32]], alternative="greater") >>> res.statistic 0.0483 >>> res.pvalue 0.0355
在科學家比大學教授對他們的工作更快樂的虛無假設下,獲得至少與觀察資料一樣極端的檢定結果的機率約為 3.55%。 由於此 p 值小於我們選擇的顯著性水準,因此我們有證據拒絕 \(H_0\) 而支持對立假設。