scipy.stats.

alexandergovern#

scipy.stats.alexandergovern(*samples, nan_policy='propagate', axis=0, keepdims=False)[source]#

執行 Alexander Govern 檢定。

Alexander-Govern 近似檢定在變異數異質性的情況下,檢驗 k 個獨立平均數是否相等。此檢定應用於來自兩個或多個群體的樣本,這些群體的大小可能不同。

參數:
sample1, sample2, …array_like

每個群體的樣本測量值。必須至少有兩個樣本,且每個樣本必須包含至少兩個觀測值。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入的 NaN 值。

  • propagate: 如果在計算統計量的軸切片(例如,行)中存在 NaN,則輸出中對應的條目將為 NaN。

  • omit: 在執行計算時將省略 NaN。如果沿著計算統計量的軸切片中剩餘的數據不足,則輸出中對應的條目將為 NaN。

  • raise: 如果存在 NaN,將引發 ValueError

axisint 或 None,預設值: 0

如果為整數,則為沿著輸入計算統計量的軸。輸入的每個軸切片(例如,行)的統計量將出現在輸出的對應元素中。如果為 None,則在計算統計量之前將展平輸入。

keepdimsbool,預設值: False

如果設定為 True,則縮減的軸將保留在結果中,作為大小為一的維度。使用此選項,結果將針對輸入陣列正確廣播。

回傳值:
resAlexanderGovernResult

具有以下屬性的物件

statisticfloat

檢定的計算 A 統計量。

pvaluefloat

來自卡方分佈的相關 p 值。

警告:
ConstantInputWarning

如果輸入是常數陣列,則會引發此警告。在這種情況下,未定義統計量,因此會回傳 np.nan

另請參閱

f_oneway

單因子變異數分析

注意事項

此檢定的使用依賴於幾個假設。

  1. 樣本是獨立的。

  2. 每個樣本都來自常態分佈的母體。

  3. f_oneway 不同,此檢定不假設同質變異數,而是放寬了變異數相等的假設。

輸入樣本必須是有限的、一維的,且大小大於一。

從 SciPy 1.9 開始,np.matrix 輸入(不建議用於新程式碼)在執行計算之前會轉換為 np.ndarray。在這種情況下,輸出將是純量或具有適當形狀的 np.ndarray,而不是 2D np.matrix。同樣地,雖然會忽略遮罩陣列的遮罩元素,但輸出將是純量或 np.ndarray,而不是 mask=False 的遮罩陣列。

參考文獻

[1]

Alexander, Ralph A., and Diane M. Govern. “A New and Simpler Approximation for ANOVA under Variance Heterogeneity.” Journal of Educational Statistics, vol. 19, no. 2, 1994, pp. 91-101. JSTOR, www.jstor.org/stable/1165140. Accessed 12 Sept. 2020.

範例

>>> from scipy.stats import alexandergovern

以下是一些關於美國四個城市中九家最大銀行的新車貸款年利率數據,取自美國國家標準與技術研究院的 ANOVA 數據集。

我們使用 alexandergovern 來檢驗虛無假設:所有城市具有相同的平均 APR,對抗對立假設:城市並非都具有相同的平均 APR。我們決定需要 5% 的顯著性水平才能拒絕虛無假設,轉而支持對立假設。

>>> atlanta = [13.75, 13.75, 13.5, 13.5, 13.0, 13.0, 13.0, 12.75, 12.5]
>>> chicago = [14.25, 13.0, 12.75, 12.5, 12.5, 12.4, 12.3, 11.9, 11.9]
>>> houston = [14.0, 14.0, 13.51, 13.5, 13.5, 13.25, 13.0, 12.5, 12.5]
>>> memphis = [15.0, 14.0, 13.75, 13.59, 13.25, 12.97, 12.5, 12.25,
...           11.89]
>>> alexandergovern(atlanta, chicago, houston, memphis)
AlexanderGovernResult(statistic=4.65087071883494,
                      pvalue=0.19922132490385214)

p 值為 0.1992,表示在虛無假設下,觀察到如此極端檢定統計值的機率接近 20%。這超過 5%,因此我們不拒絕虛無假設,轉而支持對立假設。