卡方檢定#

chi-square test 檢定測試虛無假設:給定的一組類別資料具有給定的頻率。

[1] 中,研究了奧勒岡州原始森林中的鳥類覓食行為。在森林中,44% 的樹冠體積是花旗松,24% 是黃松,29% 是巨冷杉,3% 是西部落葉松。作者觀察了幾種鳥類的行為,其中一種是紅胸䴓。他們對該物種的覓食行為進行了 189 次觀察,記錄到花旗松 43 次(「23%」)、黃松 52 次(「28%」)、巨冷杉 54 次(「29%」)和西部落葉松 40 次(「21%」)。

使用卡方檢定,我們可以檢定虛無假設:覓食事件的比例等於樹冠體積的比例。該論文的作者認為 p 值小於 1% 即具有顯著性。

使用上述樹冠體積比例和觀察到的事件,我們可以推斷預期頻率。

import numpy as np
f_exp = np.array([44, 24, 29, 3]) / 100 * 189

觀察到的覓食頻率為

f_obs = np.array([43, 52, 54, 40])

我們現在可以將觀察到的頻率與預期頻率進行比較。

from scipy.stats import chisquare
chisquare(f_obs=f_obs, f_exp=f_exp)
Power_divergenceResult(statistic=228.23515947653874, pvalue=3.3295585338846486e-49)

p 值遠低於選擇的顯著性水平。因此,作者認為這種差異具有顯著性,並得出結論:覓食事件的相對比例與樹冠體積的相對比例並不相同。

參考文獻#