scipy.stats.

mood#

scipy.stats.mood(x, y, axis=0, alternative='two-sided', *, nan_policy='propagate', keepdims=False)[source]#

執行 Mood 氏檢定以檢驗尺度參數是否相等。

Mood 氏雙樣本尺度參數檢定是一種非參數檢定，用於檢驗虛無假設：兩個樣本是否來自具有相同尺度參數的相同分佈。

參數:

x, yarray_like

樣本資料陣列。總共必須至少有三個觀察值。

axisint 或 None，預設值：0

若為整數，則為計算統計量的輸入軸。輸入的每個軸切片（例如，列）的統計量將出現在輸出的對應元素中。若為 None，則會在計算統計量之前將輸入展平。

alternative{‘two-sided’, ‘less’, ‘greater’}，選填

定義對立假設。預設值為 ‘two-sided’。以下選項可用

‘two-sided’：x 和 y 底層分佈的尺度不同。
‘less’：x 底層分佈的尺度小於 y 底層分佈的尺度。
‘greater’：x 底層分佈的尺度大於 y 底層分佈的尺度。

在版本 1.7.0 中新增。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入的 NaN 值。

propagate：若在計算統計量的軸切片（例如，列）中存在 NaN，則輸出的對應條目將為 NaN。
omit：在執行計算時將省略 NaN。若在計算統計量的軸切片中剩餘的資料不足，則輸出的對應條目將為 NaN。
raise：若存在 NaN，將引發 ValueError。

keepdimsbool，預設值：False

若設定為 True，則縮減的軸將保留在結果中，作為大小為一的維度。使用此選項，結果將正確地廣播到輸入陣列。

回傳值:

resSignificanceResult

包含屬性的物件

statistic純量或 ndarray: 假設檢定的 z 分數。對於 1 維輸入，將回傳純量。
pvalue純量 ndarray: 假設檢定的 p 值。

另請參閱

fligner: 用於檢驗 k 個變異數是否相等的非參數檢定
ansari: 用於檢驗 2 個變異數是否相等的非參數檢定
bartlett: 用於檢驗常態樣本中 k 個變異數是否相等的參數檢定
levene: 用於檢驗 k 個變異數是否相等的參數檢定

註解

假設資料分別取自機率分佈 f(x) 和 f(x/s) / s，其中 f 為某個機率密度函數。虛無假設為 s == 1。

對於多維陣列，若輸入的形狀為 (n0, n1, n2, n3) 和 (n0, m1, n2, n3)，則當 axis=1 時，產生的 z 值和 p 值將具有形狀 (n0, n2, n3)。請注意，n1 和 m1 不必相等，但其他維度必須相等。

從 SciPy 1.9 開始，np.matrix 輸入（不建議用於新程式碼）會在執行計算前轉換為 np.ndarray。在此情況下，輸出將為純量或具有適當形狀的 np.ndarray，而非 2D np.matrix。同樣地，雖然會忽略遮罩陣列的遮罩元素，但輸出將為純量或 np.ndarray，而非 mask=False 的遮罩陣列。

參考文獻

[1] Mielke, Paul W. “關於具有現有 ties 的一些平方秩檢定的註解。”: Technometrics，第 9 卷，第 2 期，1967 年，第 312-14 頁。JSTOR，https://doi.org/10.2307/1266427。存取於 2022 年 5 月 18 日。

範例

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> x2 = rng.standard_normal((2, 45, 6, 7))
>>> x1 = rng.standard_normal((2, 30, 6, 7))
>>> res = stats.mood(x1, x2, axis=1)
>>> res.pvalue.shape
(2, 6, 7)

找出尺度差異不顯著的點的數量

>>> (res.pvalue > 0.1).sum()
78

使用不同尺度執行檢定

>>> x1 = rng.standard_normal((2, 30))
>>> x2 = rng.standard_normal((2, 35)) * 10.0
>>> stats.mood(x1, x2, axis=1)
SignificanceResult(statistic=array([-5.76174136, -6.12650783]),
                   pvalue=array([8.32505043e-09, 8.98287869e-10]))