scipy.stats.

ranksums#

scipy.stats.ranksums(x, y, alternative='two-sided', *, axis=0, nan_policy='propagate', keepdims=False)[source]#

計算兩個樣本的 Wilcoxon 秩和統計量。

Wilcoxon 秩和檢定檢驗虛無假設，即兩組測量值來自相同的分佈。對立假設是，其中一個樣本中的值比另一個樣本中的值更有可能更大。

此檢定應用於比較來自連續分佈的兩個樣本。它不處理 x 和 y 中測量值之間的結。如需結處理和可選的連續性校正，請參閱 scipy.stats.mannwhitneyu。

參數:

x,yarray_like

來自兩個樣本的資料。

alternative{‘two-sided’, ‘less’, ‘greater’}, optional

定義對立假設。預設值為 ‘two-sided’。以下選項可用

‘two-sided’：其中一個分佈（底層 x 或 y）在隨機性上大於另一個。
‘less’：底層 x 的分佈在隨機性上小於底層 y 的分佈。
‘greater’：底層 x 的分佈在隨機性上大於底層 y 的分佈。

在 1.7.0 版本中新增。

axisint 或 None，預設值：0

如果是整數，則為計算統計量的輸入軸。輸入的每個軸切片（例如，行）的統計量將出現在輸出的對應元素中。如果 None，則輸入將在計算統計量之前被展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入 NaN。

propagate：如果 NaN 出現在計算統計量的軸切片（例如，行）中，則輸出的對應條目將為 NaN。
omit：在執行計算時將省略 NaN。如果沿著計算統計量的軸切片中剩餘的資料不足，則輸出的對應條目將為 NaN。
raise：如果存在 NaN，將引發 ValueError。

keepdimsbool，預設值：False

如果設定為 True，則縮減的軸將保留在結果中，作為大小為一的維度。使用此選項，結果將針對輸入陣列正確廣播。

回傳值:

statisticfloat: 在大樣本近似下，秩和統計量呈常態分佈的檢定統計量。
pvaluefloat: 檢定的 p 值。

註解

從 SciPy 1.9 開始，np.matrix 輸入（不建議用於新程式碼）在執行計算之前會轉換為 np.ndarray。在這種情況下，輸出將是純量或適當形狀的 np.ndarray，而不是 2D np.matrix。同樣地，雖然會忽略遮罩陣列的遮罩元素，但輸出將是純量或 np.ndarray，而不是 mask=False 的遮罩陣列。

參考文獻

[1]

https://en.wikipedia.org/wiki/Wilcoxon_rank-sum_test

範例

我們可以透過計算 Wilcoxon 秩和統計量，檢定兩個獨立且大小不等的樣本是否來自相同分佈的假設。

>>> import numpy as np
>>> from scipy.stats import ranksums
>>> rng = np.random.default_rng()
>>> sample1 = rng.uniform(-1, 1, 200)
>>> sample2 = rng.uniform(-0.5, 1.5, 300) # a shifted distribution
>>> ranksums(sample1, sample2)
RanksumsResult(statistic=-7.887059,
               pvalue=3.09390448e-15) # may vary
>>> ranksums(sample1, sample2, alternative='less')
RanksumsResult(statistic=-7.750585297581713,
               pvalue=4.573497606342543e-15) # may vary
>>> ranksums(sample1, sample2, alternative='greater')
RanksumsResult(statistic=-7.750585297581713,
               pvalue=0.9999999999999954) # may vary

小於 0.05 的 p 值表示此檢定在 5% 顯著性水準下拒絕了假設。