mood#
- scipy.stats.mood(x, y, axis=0, alternative='two-sided', *, nan_policy='propagate', keepdims=False)[source]#
執行 Mood 氏檢定以檢驗尺度參數是否相等。
Mood 氏雙樣本尺度參數檢定是一種非參數檢定,用於檢驗虛無假設:兩個樣本是否來自具有相同尺度參數的相同分佈。
- 參數:
- x, yarray_like
樣本資料陣列。總共必須至少有三個觀察值。
- axisint 或 None,預設值:0
若為整數,則為計算統計量的輸入軸。輸入的每個軸切片(例如,列)的統計量將出現在輸出的對應元素中。若為
None
,則會在計算統計量之前將輸入展平。- alternative{‘two-sided’, ‘less’, ‘greater’},選填
定義對立假設。預設值為 ‘two-sided’。以下選項可用
‘two-sided’:x 和 y 底層分佈的尺度不同。
‘less’:x 底層分佈的尺度小於 y 底層分佈的尺度。
‘greater’:x 底層分佈的尺度大於 y 底層分佈的尺度。
在版本 1.7.0 中新增。
- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定義如何處理輸入的 NaN 值。
propagate
:若在計算統計量的軸切片(例如,列)中存在 NaN,則輸出的對應條目將為 NaN。omit
:在執行計算時將省略 NaN。若在計算統計量的軸切片中剩餘的資料不足,則輸出的對應條目將為 NaN。raise
:若存在 NaN,將引發ValueError
。
- keepdimsbool,預設值:False
若設定為 True,則縮減的軸將保留在結果中,作為大小為一的維度。使用此選項,結果將正確地廣播到輸入陣列。
- 回傳值:
- resSignificanceResult
包含屬性的物件
- statistic純量或 ndarray
假設檢定的 z 分數。對於 1 維輸入,將回傳純量。
- pvalue純量 ndarray
假設檢定的 p 值。
另請參閱
註解
假設資料分別取自機率分佈
f(x)
和f(x/s) / s
,其中 f 為某個機率密度函數。虛無假設為s == 1
。對於多維陣列,若輸入的形狀為
(n0, n1, n2, n3)
和(n0, m1, n2, n3)
,則當axis=1
時,產生的 z 值和 p 值將具有形狀(n0, n2, n3)
。請注意,n1
和m1
不必相等,但其他維度必須相等。從 SciPy 1.9 開始,
np.matrix
輸入(不建議用於新程式碼)會在執行計算前轉換為np.ndarray
。在此情況下,輸出將為純量或具有適當形狀的np.ndarray
,而非 2Dnp.matrix
。同樣地,雖然會忽略遮罩陣列的遮罩元素,但輸出將為純量或np.ndarray
,而非mask=False
的遮罩陣列。參考文獻
- [1] Mielke, Paul W. “關於具有現有 ties 的一些平方秩檢定的註解。”
Technometrics,第 9 卷,第 2 期,1967 年,第 312-14 頁。JSTOR,https://doi.org/10.2307/1266427。存取於 2022 年 5 月 18 日。
範例
>>> import numpy as np >>> from scipy import stats >>> rng = np.random.default_rng() >>> x2 = rng.standard_normal((2, 45, 6, 7)) >>> x1 = rng.standard_normal((2, 30, 6, 7)) >>> res = stats.mood(x1, x2, axis=1) >>> res.pvalue.shape (2, 6, 7)
找出尺度差異不顯著的點的數量
>>> (res.pvalue > 0.1).sum() 78
使用不同尺度執行檢定
>>> x1 = rng.standard_normal((2, 30)) >>> x2 = rng.standard_normal((2, 35)) * 10.0 >>> stats.mood(x1, x2, axis=1) SignificanceResult(statistic=array([-5.76174136, -6.12650783]), pvalue=array([8.32505043e-09, 8.98287869e-10]))