scipy.stats.

poisson_means_test#

scipy.stats.poisson_means_test(k1, n1, k2, n2, *, diff=0, alternative='two-sided')[原始碼]#

執行 Poisson 均值檢定,又稱“E 檢定”。

此檢定用於檢驗虛無假設:兩個 Poisson 分佈的均值之差為 diff。樣本以事件數 k1k2 提供,這些事件數是在大小為 n1n2 的測量間隔(例如時間、空間、觀測次數)內觀察到的。

參數:
k1int

從分佈 1 觀察到的事件數。

n1: float

來自於分佈 1 的樣本大小。

k2int

從分佈 2 觀察到的事件數。

n2float

來自於分佈 2 的樣本大小。

difffloat,預設值=0

假設樣本底層分佈的均值之差。

alternative{‘two-sided’, ‘less’, ‘greater’},選填

定義對立假設。以下選項可用(預設為 ‘two-sided’)

  • ‘two-sided’:分佈均值之差不等於 diff

  • ‘less’:分佈均值之差小於 diff

  • ‘greater’:分佈均值之差大於 diff

回傳值:
statisticfloat

檢定統計量(請參閱 [1] 方程式 3.3)。

pvaluefloat

在虛無假設下,獲得如此極端檢定統計量的機率。

註解

\[X_1 \sim \mbox{Poisson}(\mathtt{n1}\lambda_1)\]

為獨立於以下的隨機變數

\[X_2 \sim \mbox{Poisson}(\mathtt{n2}\lambda_2)\]

k1k2 分別為 \(X_1\)\(X_2\) 的觀測值。然後 poisson_means_test 使用來自大小分別為 n1n2 的樣本的觀測事件數 k1k2,來檢驗虛無假設:

\[H_0: \lambda_1 - \lambda_2 = \mathtt{diff}\]

E 檢定的一個優點是,它對於小樣本量具有良好的檢定力,這可以降低抽樣成本 [1]。經評估,它比可比較的 C 檢定(有時稱為 Poisson 精確檢定)更有效。

參考文獻

[1] (1,2)

Krishnamoorthy, K., & Thomson, J. (2004)。一種更強大的檢定方法,用於比較兩個 Poisson 均值。《Journal of Statistical Planning and Inference》,119(1),23-35。

[2]

Przyborowski, J., & Wilenski, H. (1940)。Poisson 序列樣本檢定中結果的同質性:應用於檢測三葉草種子中的菟絲子。《Biometrika》,31(3/4),313-323。

範例

假設一位園丁想要測試從種子公司購買的一袋三葉草種子中菟絲子(雜草)種子的數量。先前已確定三葉草中菟絲子種子的數量服從 Poisson 分佈。

在運送給園丁之前,從袋子中抽取 100 克樣本。分析樣本後,發現不含菟絲子種子;也就是說,k1 為 0。然而,到達後,園丁從袋子中再次抽取 100 克樣本。這次在樣本中發現了三個菟絲子種子;也就是說,k2 為 3。園丁想知道差異是否顯著,而非僅僅是偶然。虛無假設是兩個樣本之間的差異僅僅是偶然,或者 \(\lambda_1 - \lambda_2 = \mathtt{diff}\) ,其中 \(\mathtt{diff} = 0\)。對立假設是差異並非偶然,或者 \(\lambda_1 - \lambda_2 \ne 0\)。園丁選擇 5% 的顯著性水平,以拒絕虛無假設,支持對立假設 [2]

>>> import scipy.stats as stats
>>> res = stats.poisson_means_test(0, 100, 3, 100)
>>> res.statistic, res.pvalue
(-1.7320508075688772, 0.08837900929018157)

p 值为 0.088,表示在虛無假設下,觀察到如此極端檢定統計量值的機率接近 9%。這超過了 5%,因此園丁不拒絕虛無假設,因為在這個水準上,差異不能被認為是顯著的。