poisson_means_test#
- scipy.stats.poisson_means_test(k1, n1, k2, n2, *, diff=0, alternative='two-sided')[原始碼]#
執行 Poisson 均值檢定,又稱“E 檢定”。
此檢定用於檢驗虛無假設:兩個 Poisson 分佈的均值之差為 diff。樣本以事件數 k1 和 k2 提供,這些事件數是在大小為 n1 和 n2 的測量間隔(例如時間、空間、觀測次數)內觀察到的。
- 參數:
- k1int
從分佈 1 觀察到的事件數。
- n1: float
來自於分佈 1 的樣本大小。
- k2int
從分佈 2 觀察到的事件數。
- n2float
來自於分佈 2 的樣本大小。
- difffloat,預設值=0
假設樣本底層分佈的均值之差。
- alternative{‘two-sided’, ‘less’, ‘greater’},選填
定義對立假設。以下選項可用(預設為 ‘two-sided’)
‘two-sided’:分佈均值之差不等於 diff
‘less’:分佈均值之差小於 diff
‘greater’:分佈均值之差大於 diff
- 回傳值:
- statisticfloat
檢定統計量(請參閱 [1] 方程式 3.3)。
- pvaluefloat
在虛無假設下,獲得如此極端檢定統計量的機率。
註解
令
\[X_1 \sim \mbox{Poisson}(\mathtt{n1}\lambda_1)\]為獨立於以下的隨機變數
\[X_2 \sim \mbox{Poisson}(\mathtt{n2}\lambda_2)\]令
k1
和k2
分別為 \(X_1\) 和 \(X_2\) 的觀測值。然後poisson_means_test
使用來自大小分別為n1
和n2
的樣本的觀測事件數k1
和k2
,來檢驗虛無假設:\[H_0: \lambda_1 - \lambda_2 = \mathtt{diff}\]E 檢定的一個優點是,它對於小樣本量具有良好的檢定力,這可以降低抽樣成本 [1]。經評估,它比可比較的 C 檢定(有時稱為 Poisson 精確檢定)更有效。
參考文獻
[1] (1,2)Krishnamoorthy, K., & Thomson, J. (2004)。一種更強大的檢定方法,用於比較兩個 Poisson 均值。《Journal of Statistical Planning and Inference》,119(1),23-35。
[2]Przyborowski, J., & Wilenski, H. (1940)。Poisson 序列樣本檢定中結果的同質性:應用於檢測三葉草種子中的菟絲子。《Biometrika》,31(3/4),313-323。
範例
假設一位園丁想要測試從種子公司購買的一袋三葉草種子中菟絲子(雜草)種子的數量。先前已確定三葉草中菟絲子種子的數量服從 Poisson 分佈。
在運送給園丁之前,從袋子中抽取 100 克樣本。分析樣本後,發現不含菟絲子種子;也就是說,k1 為 0。然而,到達後,園丁從袋子中再次抽取 100 克樣本。這次在樣本中發現了三個菟絲子種子;也就是說,k2 為 3。園丁想知道差異是否顯著,而非僅僅是偶然。虛無假設是兩個樣本之間的差異僅僅是偶然,或者 \(\lambda_1 - \lambda_2 = \mathtt{diff}\) ,其中 \(\mathtt{diff} = 0\)。對立假設是差異並非偶然,或者 \(\lambda_1 - \lambda_2 \ne 0\)。園丁選擇 5% 的顯著性水平,以拒絕虛無假設,支持對立假設 [2]。
>>> import scipy.stats as stats >>> res = stats.poisson_means_test(0, 100, 3, 100) >>> res.statistic, res.pvalue (-1.7320508075688772, 0.08837900929018157)
p 值为 0.088,表示在虛無假設下,觀察到如此極端檢定統計量值的機率接近 9%。這超過了 5%,因此園丁不拒絕虛無假設,因為在這個水準上,差異不能被認為是顯著的。