scipy.stats.

shapiro#

scipy.stats.shapiro(x, *, axis=None, nan_policy='propagate', keepdims=False)[原始碼]#

執行夏皮羅-威爾克常態性檢定。

夏皮羅-威爾克檢定用於檢驗虛無假設：資料來自常態分佈。

參數:

xarray_like

樣本資料陣列。必須包含至少三個觀測值。

axisint 或 None，預設值：None

若為整數，則為計算統計量的輸入軸。輸入的每個軸切片（例如，列）的統計量將出現在輸出的相應元素中。若為 None，則輸入將在計算統計量之前被展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入的 NaN 值。

propagate：若在計算統計量的軸切片（例如，列）中存在 NaN 值，則輸出的相應條目將為 NaN。
omit：在執行計算時將省略 NaN 值。若在計算統計量的軸切片中剩餘的資料不足，則輸出的相應條目將為 NaN。
raise：若存在 NaN 值，將引發 ValueError。

keepdimsbool，預設值：False

若設定為 True，則縮減的軸將保留在結果中，作為大小為一的維度。使用此選項，結果將針對輸入陣列正確廣播。

回傳值:

statisticfloat: 檢定統計量。
p-valuefloat: 假設檢定的 p 值。

參見

anderson: 安德森-達令常態性檢定
kstest: 柯爾莫哥洛夫-史密諾夫適合度檢定。
夏皮羅-威爾克常態性檢定: 擴展範例

註解

所使用的演算法描述於 [4]，但未實作如描述的審查參數。對於 N > 5000，W 檢定統計量是準確的，但 p 值可能不準確。

從 SciPy 1.9 開始，np.matrix 輸入（不建議用於新程式碼）在執行計算之前會轉換為 np.ndarray。在這種情況下，輸出將是純量或形狀適當的 np.ndarray，而不是 2D np.matrix。同樣地，雖然遮罩陣列的遮罩元素會被忽略，但輸出將是純量或 np.ndarray，而不是 mask=False 的遮罩陣列。

參考文獻

[1]

https://www.itl.nist.gov/div898/handbook/prc/section2/prc213.htm DOI:10.18434/M32189

[2]

Shapiro, S. S. & Wilk, M.B, “An analysis of variance test for normality (complete samples)”, Biometrika, 1965, Vol. 52, pp. 591-611, DOI:10.2307/2333709

[3]

Razali, N. M. & Wah, Y. B., “Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests”, Journal of Statistical Modeling and Analytics, 2011, Vol. 2, pp. 21-33.

[4]

Royston P., “Remark AS R94: A Remark on Algorithm AS 181: The W-test for Normality”, 1995, Applied Statistics, Vol. 44, DOI:10.2307/2986146

範例

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()
>>> x = stats.norm.rvs(loc=5, scale=3, size=100, random_state=rng)
>>> shapiro_test = stats.shapiro(x)
>>> shapiro_test
ShapiroResult(statistic=0.9813305735588074, pvalue=0.16855233907699585)
>>> shapiro_test.statistic
0.9813305735588074
>>> shapiro_test.pvalue
0.16855233907699585

如需更詳細的範例，請參閱夏皮羅-威爾克常態性檢定。