scipy.stats.mstats.

spearmanr#

scipy.stats.mstats.spearmanr(x, y=None, use_ties=True, axis=None, nan_policy='propagate', alternative='two-sided')[source]#

計算 Spearman 等級順序相關係數以及檢定無相關性的 p 值。

Spearman 相關係數是一種衡量兩個資料集之間線性關係的非參數方法。與 Pearson 相關係數不同,Spearman 相關係數不假設兩個資料集都呈常態分佈。與其他相關係數一樣,此係數的變動範圍介於 -1 和 +1 之間,0 表示沒有相關性。相關係數為 -1 或 +1 表示單調關係。正相關表示當 x 增加時,y 也會增加。負相關表示當 x 增加時,y 會減少。

遺失值會成對捨棄:如果 x 中遺失值,則 y 中的對應值會被遮罩。

p 值大致表示不相關系統產生資料集的機率,而這些資料集的 Spearman 相關性至少與從這些資料集計算出的相關性一樣極端。p 值並非完全可靠,但對於大於 500 左右的資料集而言,可能尚屬合理。

參數:
x, y1D 或 2D 類陣列,y 為選用性參數

一個或兩個 1 維或 2 維陣列,包含多個變數和觀測值。當這些陣列為 1 維時,每個陣列代表單一變數的觀測值向量。關於 2 維情況下的行為,請參閱下方的 axis

use_tiesbool,選用性參數

請勿使用。沒有任何作用,保留此關鍵字僅是為了向後相容性考量。

axisint 或 None,選用性參數

如果 axis=0 (預設值),則每個欄代表一個變數,而列包含觀測值。如果 axis=1,則關係會轉置:每一列代表一個變數,而欄包含觀測值。如果 axis=None,則兩個陣列都會被展平。

nan_policy{‘propagate’, ‘raise’, ‘omit’},選用性參數

定義輸入包含 nan 時的處理方式。「propagate」傳回 nan,「raise」擲回錯誤,「omit」執行計算時忽略 nan 值。預設值為 ‘propagate’。

alternative{‘two-sided’, ‘less’, ‘greater’},選用性參數

定義對立假設。預設值為 ‘two-sided’。以下選項可用

  • ‘two-sided’:相關性為非零

  • ‘less’:相關性為負值 (小於零)

  • ‘greater’:相關性為正值 (大於零)

在 1.7.0 版本中新增。

回傳值:
resSignificanceResult

包含屬性的物件

statisticfloat 或 ndarray (2 維正方形)

Spearman 相關矩陣或相關係數 (如果僅提供 2 個變數作為參數)。相關矩陣為正方形,長度等於 ab 中變數 (欄或列) 的總數組合。

pvaluefloat

假設檢定的 p 值,其虛無假設是兩組資料呈線性不相關。請參閱上方的 alternative 以了解對立假設。pvalue 的形狀與 statistic 相同。

參考文獻

[CRCProbStat2000] 第 14.7 節