scipy.stats.contingency.

關聯性#

scipy.stats.contingency.association(observed, method='cramer', correction=False, lambda_=None)[source]#

計算兩個名義變數之間關聯性的程度。

此函數提供選項,可從 2d 列聯表中的資料計算兩個名義變數之間關聯性的三種度量之一:Tschuprow’s T、Pearson 關聯係數和 Cramer’s V。

參數:
observed類陣列

觀測值的陣列

method{“cramer”, “tschuprow”, “pearson”} (預設 = “cramer”)

關聯性檢定統計量。

correctionbool,選用

繼承自 scipy.stats.contingency.chi2_contingency()

lambda_float 或 str,選用

繼承自 scipy.stats.contingency.chi2_contingency()

回傳值:
statisticfloat

檢定統計量的值

說明

Cramer’s V、Tschuprow’s T 和 Pearson 關聯係數都衡量兩個名義或序數變數相關的程度,或它們關聯性的程度。這與相關性不同,儘管許多人經常錯誤地認為它們是等效的。相關性衡量兩個變數以何種方式相關,而關聯性衡量變數的相關程度。因此,關聯性不包含獨立變數,而是一種獨立性檢定。值 1.0 表示完全關聯,而 0.0 表示變數之間沒有關聯。

Cramer’s V 和 Tschuprow’s T 都是 phi 係數的擴展。此外,由於 Cramer’s V 和 Tschuprow’s T 之間關係密切,回傳值通常會相似甚至相等。當陣列形狀偏離 2x2 時,它們可能會更發散。

參考文獻

[1]

“Tschuprow’s T”,https://en.wikipedia.org/wiki/Tschuprow’s_T

[2]

Tschuprow, A. A. (1939) Principles of the Mathematical Theory of Correlation; translated by M. Kantorowitsch. W. Hodge & Co.

[4]

“Nominal Association: Phi and Cramer’s V”,http://www.people.vcu.edu/~pdattalo/702SuppRead/MeasAssoc/NominalAssoc.html

[5]

Gingrich, Paul, “Association Between Variables”,http://uregina.ca/~gingrich/ch11a.pdf

範例

一個 4x2 列聯表的範例

>>> import numpy as np
>>> from scipy.stats.contingency import association
>>> obs4x2 = np.array([[100, 150], [203, 322], [420, 700], [320, 210]])

Pearson 關聯係數

>>> association(obs4x2, method="pearson")
0.18303298140595667

Cramer’s V

>>> association(obs4x2, method="cramer")
0.18617813077483678

Tschuprow’s T

>>> association(obs4x2, method="tschuprow")
0.14146478765062995