relative_risk#
- scipy.stats.contingency.relative_risk(exposed_cases, exposed_total, control_cases, control_total)[source]#
計算相對風險(也稱為風險比)。
此函數計算與 2x2 列聯表相關的相對風險 ([1],第 2.2.3 節;[2],第 3.1.2 節)。 它不是接受表格作為參數,而是將用於計算相對風險的個別數字作為單獨的參數給出。 這是為了避免列聯表的哪一行或哪一列對應於「暴露」病例,以及哪一行或哪一列對應於「對照」病例的歧義。 與勝算比不同,相對風險在行列互換下是不變的。
- 參數:
- exposed_cases非負整數 (nonnegative int)
「暴露」個體樣本中「病例」(即疾病或其他感興趣事件的發生)的數量。
- exposed_total正整數 (positive int)
樣本中「暴露」個體的總數。
- control_cases非負整數 (nonnegative int)
「對照」或未暴露個體樣本中「病例」的數量。
- control_total正整數 (positive int)
樣本中「對照」個體的總數。
- 返回:
- result
RelativeRiskResult
的實例 該物件具有浮點數屬性
relative_risk
,即rr = (exposed_cases/exposed_total) / (control_cases/control_total)
該物件還具有方法
confidence_interval
,用於計算給定信賴水準的相對風險的信賴區間。
- result
參見
註解
R 語言套件 epitools 具有函數 riskratio,它接受具有以下佈局的表格
disease=0 disease=1 exposed=0 (ref) n00 n01 exposed=1 n10 n11
對於上述格式的 2x2 表格,當給定參數 method="wald" 時,或使用函數 riskratio.wald 時,CI 的估計值由 riskratio 計算。
例如,在吸煙者和非吸煙者樣本中肺癌發病率的測試中,「暴露」類別對應於「是吸煙者」,而「疾病」類別對應於「患有或曾患有肺癌」。
要將相同的資料傳遞給
relative_risk
,請使用relative_risk(n11, n10 + n11, n01, n00 + n01)
在 1.7.0 版本中新增。
參考文獻
[1]Alan Agresti,《Categorical Data Analysis 導論》(第二版),Wiley,Hoboken,NJ,USA (2007)。
範例
>>> from scipy.stats.contingency import relative_risk
此範例來自 [2] 的範例 3.1。 心臟病研究的結果總結在下表中
High CAT Low CAT Total -------- ------- ----- CHD 27 44 71 No CHD 95 443 538 Total 122 487 609
CHD 是冠狀動脈心臟病,CAT 指的是循環兒茶酚胺的水平。 CAT 是「暴露」變數,而高 CAT 是「暴露」類別。 因此,要傳遞給
relative_risk
的表格資料是exposed_cases = 27 exposed_total = 122 control_cases = 44 control_total = 487
>>> result = relative_risk(27, 122, 44, 487) >>> result.relative_risk 2.4495156482861398
尋找相對風險的信賴區間。
>>> result.confidence_interval(confidence_level=0.95) ConfidenceInterval(low=1.5836990926700116, high=3.7886786315466354)
區間不包含 1,因此資料支持高 CAT 與較高 CHD 風險相關的陳述。