關聯性#
- scipy.stats.contingency.association(observed, method='cramer', correction=False, lambda_=None)[source]#
計算兩個名義變數之間關聯性的程度。
此函數提供選項,可從 2d 列聯表中的資料計算兩個名義變數之間關聯性的三種度量之一:Tschuprow’s T、Pearson 關聯係數和 Cramer’s V。
- 參數:
- observed類陣列
觀測值的陣列
- method{“cramer”, “tschuprow”, “pearson”} (預設 = “cramer”)
關聯性檢定統計量。
- correctionbool,選用
繼承自 scipy.stats.contingency.chi2_contingency()
- lambda_float 或 str,選用
繼承自 scipy.stats.contingency.chi2_contingency()
- 回傳值:
- statisticfloat
檢定統計量的值
說明
Cramer’s V、Tschuprow’s T 和 Pearson 關聯係數都衡量兩個名義或序數變數相關的程度,或它們關聯性的程度。這與相關性不同,儘管許多人經常錯誤地認為它們是等效的。相關性衡量兩個變數以何種方式相關,而關聯性衡量變數的相關程度。因此,關聯性不包含獨立變數,而是一種獨立性檢定。值 1.0 表示完全關聯,而 0.0 表示變數之間沒有關聯。
Cramer’s V 和 Tschuprow’s T 都是 phi 係數的擴展。此外,由於 Cramer’s V 和 Tschuprow’s T 之間關係密切,回傳值通常會相似甚至相等。當陣列形狀偏離 2x2 時,它們可能會更發散。
參考文獻
[1]“Tschuprow’s T”,https://en.wikipedia.org/wiki/Tschuprow’s_T
[2]Tschuprow, A. A. (1939) Principles of the Mathematical Theory of Correlation; translated by M. Kantorowitsch. W. Hodge & Co.
[3]“Cramer’s V”,https://en.wikipedia.org/wiki/Cramer’s_V
[4]“Nominal Association: Phi and Cramer’s V”,http://www.people.vcu.edu/~pdattalo/702SuppRead/MeasAssoc/NominalAssoc.html
[5]Gingrich, Paul, “Association Between Variables”,http://uregina.ca/~gingrich/ch11a.pdf
範例
一個 4x2 列聯表的範例
>>> import numpy as np >>> from scipy.stats.contingency import association >>> obs4x2 = np.array([[100, 150], [203, 322], [420, 700], [320, 210]])
Pearson 關聯係數
>>> association(obs4x2, method="pearson") 0.18303298140595667
Cramer’s V
>>> association(obs4x2, method="cramer") 0.18617813077483678
Tschuprow’s T
>>> association(obs4x2, method="tschuprow") 0.14146478765062995