ranksums#
- scipy.stats.ranksums(x, y, alternative='two-sided', *, axis=0, nan_policy='propagate', keepdims=False)[source]#
計算兩個樣本的 Wilcoxon 秩和統計量。
Wilcoxon 秩和檢定檢驗虛無假設,即兩組測量值來自相同的分佈。對立假設是,其中一個樣本中的值比另一個樣本中的值更有可能更大。
此檢定應用於比較來自連續分佈的兩個樣本。它不處理 x 和 y 中測量值之間的結。如需結處理和可選的連續性校正,請參閱
scipy.stats.mannwhitneyu
。- 參數:
- x,yarray_like
來自兩個樣本的資料。
- alternative{‘two-sided’, ‘less’, ‘greater’}, optional
定義對立假設。預設值為 ‘two-sided’。以下選項可用
‘two-sided’:其中一個分佈(底層 x 或 y)在隨機性上大於另一個。
‘less’:底層 x 的分佈在隨機性上小於底層 y 的分佈。
‘greater’:底層 x 的分佈在隨機性上大於底層 y 的分佈。
在 1.7.0 版本中新增。
- axisint 或 None,預設值:0
如果是整數,則為計算統計量的輸入軸。輸入的每個軸切片(例如,行)的統計量將出現在輸出的對應元素中。如果
None
,則輸入將在計算統計量之前被展平。- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定義如何處理輸入 NaN。
propagate
:如果 NaN 出現在計算統計量的軸切片(例如,行)中,則輸出的對應條目將為 NaN。omit
:在執行計算時將省略 NaN。如果沿著計算統計量的軸切片中剩餘的資料不足,則輸出的對應條目將為 NaN。raise
:如果存在 NaN,將引發ValueError
。
- keepdimsbool,預設值:False
如果設定為 True,則縮減的軸將保留在結果中,作為大小為一的維度。使用此選項,結果將針對輸入陣列正確廣播。
- 回傳值:
- statisticfloat
在大樣本近似下,秩和統計量呈常態分佈的檢定統計量。
- pvaluefloat
檢定的 p 值。
註解
從 SciPy 1.9 開始,
np.matrix
輸入(不建議用於新程式碼)在執行計算之前會轉換為np.ndarray
。在這種情況下,輸出將是純量或適當形狀的np.ndarray
,而不是 2Dnp.matrix
。同樣地,雖然會忽略遮罩陣列的遮罩元素,但輸出將是純量或np.ndarray
,而不是mask=False
的遮罩陣列。參考文獻
範例
我們可以透過計算 Wilcoxon 秩和統計量,檢定兩個獨立且大小不等的樣本是否來自相同分佈的假設。
>>> import numpy as np >>> from scipy.stats import ranksums >>> rng = np.random.default_rng() >>> sample1 = rng.uniform(-1, 1, 200) >>> sample2 = rng.uniform(-0.5, 1.5, 300) # a shifted distribution >>> ranksums(sample1, sample2) RanksumsResult(statistic=-7.887059, pvalue=3.09390448e-15) # may vary >>> ranksums(sample1, sample2, alternative='less') RanksumsResult(statistic=-7.750585297581713, pvalue=4.573497606342543e-15) # may vary >>> ranksums(sample1, sample2, alternative='greater') RanksumsResult(statistic=-7.750585297581713, pvalue=0.9999999999999954) # may vary
小於
0.05
的 p 值表示此檢定在 5% 顯著性水準下拒絕了假設。