scipy.stats.contingency.

relative_risk#

scipy.stats.contingency.relative_risk(exposed_cases, exposed_total, control_cases, control_total)[source]#

計算相對風險（也稱為風險比）。

此函數計算與 2x2 列聯表相關的相對風險 ([1]，第 2.2.3 節；[2]，第 3.1.2 節)。它不是接受表格作為參數，而是將用於計算相對風險的個別數字作為單獨的參數給出。這是為了避免列聯表的哪一行或哪一列對應於「暴露」病例，以及哪一行或哪一列對應於「對照」病例的歧義。與勝算比不同，相對風險在行列互換下是不變的。

參數:

exposed_cases非負整數 (nonnegative int): 「暴露」個體樣本中「病例」（即疾病或其他感興趣事件的發生）的數量。
exposed_total正整數 (positive int): 樣本中「暴露」個體的總數。
control_cases非負整數 (nonnegative int): 「對照」或未暴露個體樣本中「病例」的數量。
control_total正整數 (positive int): 樣本中「對照」個體的總數。

返回:

resultRelativeRiskResult 的實例

該物件具有浮點數屬性 relative_risk，即

rr = (exposed_cases/exposed_total) / (control_cases/control_total)

該物件還具有方法 confidence_interval，用於計算給定信賴水準的相對風險的信賴區間。

參見

odds_ratio

註解

R 語言套件 epitools 具有函數 riskratio，它接受具有以下佈局的表格

                disease=0   disease=1
exposed=0 (ref)    n00         n01
exposed=1          n10         n11

對於上述格式的 2x2 表格，當給定參數 method="wald" 時，或使用函數 riskratio.wald 時，CI 的估計值由 riskratio 計算。

例如，在吸煙者和非吸煙者樣本中肺癌發病率的測試中，「暴露」類別對應於「是吸煙者」，而「疾病」類別對應於「患有或曾患有肺癌」。

要將相同的資料傳遞給 relative_risk，請使用

relative_risk(n11, n10 + n11, n01, n00 + n01)

在 1.7.0 版本中新增。

參考文獻

[1]

Alan Agresti，《Categorical Data Analysis 導論》（第二版），Wiley，Hoboken，NJ，USA (2007)。

[2] (1,2)

Hardeo Sahai 和 Anwer Khurshid，《流行病學統計學》，CRC Press LLC，Boca Raton，FL，USA (1996)。

範例

>>> from scipy.stats.contingency import relative_risk

此範例來自 [2] 的範例 3.1。心臟病研究的結果總結在下表中

         High CAT   Low CAT    Total
         --------   -------    -----
CHD         27         44        71
No CHD      95        443       538

Total      122        487       609

CHD 是冠狀動脈心臟病，CAT 指的是循環兒茶酚胺的水平。 CAT 是「暴露」變數，而高 CAT 是「暴露」類別。因此，要傳遞給 relative_risk 的表格資料是

exposed_cases = 27
exposed_total = 122
control_cases = 44
control_total = 487

>>> result = relative_risk(27, 122, 44, 487)
>>> result.relative_risk
2.4495156482861398

尋找相對風險的信賴區間。

>>> result.confidence_interval(confidence_level=0.95)
ConfidenceInterval(low=1.5836990926700116, high=3.7886786315466354)

區間不包含 1，因此資料支持高 CAT 與較高 CHD 風險相關的陳述。