scipy.stats.

shapiro#

scipy.stats.shapiro(x, *, axis=None, nan_policy='propagate', keepdims=False)[原始碼]#

執行夏皮羅-威爾克常態性檢定。

夏皮羅-威爾克檢定用於檢驗虛無假設:資料來自常態分佈。

參數:
xarray_like

樣本資料陣列。必須包含至少三個觀測值。

axisint 或 None,預設值:None

若為整數,則為計算統計量的輸入軸。輸入的每個軸切片(例如,列)的統計量將出現在輸出的相應元素中。若為 None,則輸入將在計算統計量之前被展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入的 NaN 值。

  • propagate:若在計算統計量的軸切片(例如,列)中存在 NaN 值,則輸出的相應條目將為 NaN。

  • omit:在執行計算時將省略 NaN 值。若在計算統計量的軸切片中剩餘的資料不足,則輸出的相應條目將為 NaN。

  • raise:若存在 NaN 值,將引發 ValueError

keepdimsbool,預設值:False

若設定為 True,則縮減的軸將保留在結果中,作為大小為一的維度。使用此選項,結果將針對輸入陣列正確廣播。

回傳值:
statisticfloat

檢定統計量。

p-valuefloat

假設檢定的 p 值。

參見

anderson

安德森-達令常態性檢定

kstest

柯爾莫哥洛夫-史密諾夫適合度檢定。

夏皮羅-威爾克常態性檢定

擴展範例

註解

所使用的演算法描述於 [4],但未實作如描述的審查參數。對於 N > 5000,W 檢定統計量是準確的,但 p 值可能不準確。

從 SciPy 1.9 開始,np.matrix 輸入(不建議用於新程式碼)在執行計算之前會轉換為 np.ndarray。在這種情況下,輸出將是純量或形狀適當的 np.ndarray,而不是 2D np.matrix。同樣地,雖然遮罩陣列的遮罩元素會被忽略,但輸出將是純量或 np.ndarray,而不是 mask=False 的遮罩陣列。

參考文獻

[2]

Shapiro, S. S. & Wilk, M.B, “An analysis of variance test for normality (complete samples)”, Biometrika, 1965, Vol. 52, pp. 591-611, DOI:10.2307/2333709

[3]

Razali, N. M. & Wah, Y. B., “Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests”, Journal of Statistical Modeling and Analytics, 2011, Vol. 2, pp. 21-33.

[4]

Royston P., “Remark AS R94: A Remark on Algorithm AS 181: The W-test for Normality”, 1995, Applied Statistics, Vol. 44, DOI:10.2307/2986146

範例

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> x = stats.norm.rvs(loc=5, scale=3, size=100, random_state=rng)
>>> shapiro_test = stats.shapiro(x)
>>> shapiro_test
ShapiroResult(statistic=0.9813305735588074, pvalue=0.16855233907699585)
>>> shapiro_test.statistic
0.9813305735588074
>>> shapiro_test.pvalue
0.16855233907699585

如需更詳細的範例,請參閱 夏皮羅-威爾克常態性檢定