列聯表中變數獨立性的卡方檢定#
在 [1] 中,研究了阿斯匹靈在預防女性和男性心血管事件中的應用。該研究顯著地得出結論:
…阿斯匹靈療法由於其降低女性缺血性中風風險的作用,降低了心血管事件綜合風險 […]
該文章列出了各種心血管事件的研究。讓我們關注女性的缺血性中風。
下表總結了實驗結果,參與者多年來定期服用阿斯匹靈或安慰劑。記錄了缺血性中風的病例:
阿斯匹靈 |
對照組/安慰劑 |
|
---|---|---|
缺血性中風 |
176 |
230 |
無中風 |
21035 |
21018 |
是否有證據表明阿斯匹靈降低了缺血性中風的風險? 我們首先制定虛無假設 \(H_0\)
阿斯匹靈的效果等同於安慰劑的效果。
讓我們使用 卡方檢定
和觀察到的列聯表作為我們的輸入,來評估此假設的合理性。
import numpy as np
from scipy.stats import chi2_contingency
table = np.array([[176, 230], [21035, 21018]])
res = chi2_contingency(table)
res.statistic
6.892569132546561
res.pvalue
0.008655478161175739
使用 5% 的顯著水準,我們將拒絕虛無假設,而支持替代假設:「阿斯匹靈的效果不等同於安慰劑的效果」。因為 scipy.stats.contingency.chi2_contingency
執行雙尾檢定,所以替代假設並未指出效果的方向。 我們可以使用 scipy.stats.contingency.odds_ratio
來支持阿斯匹靈降低缺血性中風風險的結論。