spearmanr#
- scipy.stats.mstats.spearmanr(x, y=None, use_ties=True, axis=None, nan_policy='propagate', alternative='two-sided')[source]#
計算 Spearman 等級順序相關係數以及檢定無相關性的 p 值。
Spearman 相關係數是一種衡量兩個資料集之間線性關係的非參數方法。與 Pearson 相關係數不同,Spearman 相關係數不假設兩個資料集都呈常態分佈。與其他相關係數一樣,此係數的變動範圍介於 -1 和 +1 之間,0 表示沒有相關性。相關係數為 -1 或 +1 表示單調關係。正相關表示當 x 增加時,y 也會增加。負相關表示當 x 增加時,y 會減少。
遺失值會成對捨棄:如果 x 中遺失值,則 y 中的對應值會被遮罩。
p 值大致表示不相關系統產生資料集的機率,而這些資料集的 Spearman 相關性至少與從這些資料集計算出的相關性一樣極端。p 值並非完全可靠,但對於大於 500 左右的資料集而言,可能尚屬合理。
- 參數:
- x, y1D 或 2D 類陣列,y 為選用性參數
一個或兩個 1 維或 2 維陣列,包含多個變數和觀測值。當這些陣列為 1 維時,每個陣列代表單一變數的觀測值向量。關於 2 維情況下的行為,請參閱下方的
axis
。- use_tiesbool,選用性參數
請勿使用。沒有任何作用,保留此關鍵字僅是為了向後相容性考量。
- axisint 或 None,選用性參數
如果 axis=0 (預設值),則每個欄代表一個變數,而列包含觀測值。如果 axis=1,則關係會轉置:每一列代表一個變數,而欄包含觀測值。如果 axis=None,則兩個陣列都會被展平。
- nan_policy{‘propagate’, ‘raise’, ‘omit’},選用性參數
定義輸入包含 nan 時的處理方式。「propagate」傳回 nan,「raise」擲回錯誤,「omit」執行計算時忽略 nan 值。預設值為 ‘propagate’。
- alternative{‘two-sided’, ‘less’, ‘greater’},選用性參數
定義對立假設。預設值為 ‘two-sided’。以下選項可用
‘two-sided’:相關性為非零
‘less’:相關性為負值 (小於零)
‘greater’:相關性為正值 (大於零)
在 1.7.0 版本中新增。
- 回傳值:
- resSignificanceResult
包含屬性的物件
- statisticfloat 或 ndarray (2 維正方形)
Spearman 相關矩陣或相關係數 (如果僅提供 2 個變數作為參數)。相關矩陣為正方形,長度等於
a
和b
中變數 (欄或列) 的總數組合。- pvaluefloat
假設檢定的 p 值,其虛無假設是兩組資料呈線性不相關。請參閱上方的 alternative 以了解對立假設。pvalue 的形狀與 statistic 相同。
參考文獻
[CRCProbStat2000] 第 14.7 節