scipy.stats.

poisson_means_test#

scipy.stats.poisson_means_test(k1, n1, k2, n2, *, diff=0, alternative='two-sided')[原始碼]#

執行 Poisson 均值檢定，又稱“E 檢定”。

此檢定用於檢驗虛無假設：兩個 Poisson 分佈的均值之差為 diff。樣本以事件數 k1 和 k2 提供，這些事件數是在大小為 n1 和 n2 的測量間隔（例如時間、空間、觀測次數）內觀察到的。

參數:

k1int

從分佈 1 觀察到的事件數。

n1: float

來自於分佈 1 的樣本大小。

k2int

從分佈 2 觀察到的事件數。

n2float

來自於分佈 2 的樣本大小。

difffloat，預設值=0

假設樣本底層分佈的均值之差。

alternative{‘two-sided’, ‘less’, ‘greater’}，選填

定義對立假設。以下選項可用（預設為 ‘two-sided’）

‘two-sided’：分佈均值之差不等於 diff

‘less’：分佈均值之差小於 diff

‘greater’：分佈均值之差大於 diff

回傳值:

statisticfloat: 檢定統計量（請參閱 [1] 方程式 3.3）。
pvaluefloat: 在虛無假設下，獲得如此極端檢定統計量的機率。

註解

令

\[X_1 \sim \mbox{Poisson}(\mathtt{n1}\lambda_1)\]

為獨立於以下的隨機變數

\[X_2 \sim \mbox{Poisson}(\mathtt{n2}\lambda_2)\]

令 k1 和 k2 分別為 \(X_1\) 和 \(X_2\) 的觀測值。然後 poisson_means_test 使用來自大小分別為 n1 和 n2 的樣本的觀測事件數 k1 和 k2，來檢驗虛無假設：

\[H_0: \lambda_1 - \lambda_2 = \mathtt{diff}\]

E 檢定的一個優點是，它對於小樣本量具有良好的檢定力，這可以降低抽樣成本 [1]。經評估，它比可比較的 C 檢定（有時稱為 Poisson 精確檢定）更有效。

參考文獻

[1] (1,2)

Krishnamoorthy, K., & Thomson, J. (2004)。一種更強大的檢定方法，用於比較兩個 Poisson 均值。《Journal of Statistical Planning and Inference》，119(1)，23-35。

[2]

Przyborowski, J., & Wilenski, H. (1940)。Poisson 序列樣本檢定中結果的同質性：應用於檢測三葉草種子中的菟絲子。《Biometrika》，31(3/4)，313-323。

範例

假設一位園丁想要測試從種子公司購買的一袋三葉草種子中菟絲子（雜草）種子的數量。先前已確定三葉草中菟絲子種子的數量服從 Poisson 分佈。

在運送給園丁之前，從袋子中抽取 100 克樣本。分析樣本後，發現不含菟絲子種子；也就是說，k1 為 0。然而，到達後，園丁從袋子中再次抽取 100 克樣本。這次在樣本中發現了三個菟絲子種子；也就是說，k2 為 3。園丁想知道差異是否顯著，而非僅僅是偶然。虛無假設是兩個樣本之間的差異僅僅是偶然，或者 \(\lambda_1 - \lambda_2 = \mathtt{diff}\) ，其中 \(\mathtt{diff} = 0\)。對立假設是差異並非偶然，或者 \(\lambda_1 - \lambda_2 \ne 0\)。園丁選擇 5% 的顯著性水平，以拒絕虛無假設，支持對立假設 [2]。

>>> import scipy.stats as stats
>>> res = stats.poisson_means_test(0, 100, 3, 100)
>>> res.statistic, res.pvalue
(-1.7320508075688772, 0.08837900929018157)

p 值为 0.088，表示在虛無假設下，觀察到如此極端檢定統計量值的機率接近 9%。這超過了 5%，因此園丁不拒絕虛無假設，因為在這個水準上，差異不能被認為是顯著的。