shapiro#
- scipy.stats.shapiro(x, *, axis=None, nan_policy='propagate', keepdims=False)[原始碼]#
執行夏皮羅-威爾克常態性檢定。
夏皮羅-威爾克檢定用於檢驗虛無假設:資料來自常態分佈。
- 參數:
- xarray_like
樣本資料陣列。必須包含至少三個觀測值。
- axisint 或 None,預設值:None
若為整數,則為計算統計量的輸入軸。輸入的每個軸切片(例如,列)的統計量將出現在輸出的相應元素中。若為
None
,則輸入將在計算統計量之前被展平。- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定義如何處理輸入的 NaN 值。
propagate
:若在計算統計量的軸切片(例如,列)中存在 NaN 值,則輸出的相應條目將為 NaN。omit
:在執行計算時將省略 NaN 值。若在計算統計量的軸切片中剩餘的資料不足,則輸出的相應條目將為 NaN。raise
:若存在 NaN 值,將引發ValueError
。
- keepdimsbool,預設值:False
若設定為 True,則縮減的軸將保留在結果中,作為大小為一的維度。使用此選項,結果將針對輸入陣列正確廣播。
- 回傳值:
- statisticfloat
檢定統計量。
- p-valuefloat
假設檢定的 p 值。
參見
anderson
安德森-達令常態性檢定
kstest
柯爾莫哥洛夫-史密諾夫適合度檢定。
- 夏皮羅-威爾克常態性檢定
擴展範例
註解
所使用的演算法描述於 [4],但未實作如描述的審查參數。對於 N > 5000,W 檢定統計量是準確的,但 p 值可能不準確。
從 SciPy 1.9 開始,
np.matrix
輸入(不建議用於新程式碼)在執行計算之前會轉換為np.ndarray
。在這種情況下,輸出將是純量或形狀適當的np.ndarray
,而不是 2Dnp.matrix
。同樣地,雖然遮罩陣列的遮罩元素會被忽略,但輸出將是純量或np.ndarray
,而不是mask=False
的遮罩陣列。參考文獻
[2]Shapiro, S. S. & Wilk, M.B, “An analysis of variance test for normality (complete samples)”, Biometrika, 1965, Vol. 52, pp. 591-611, DOI:10.2307/2333709
[3]Razali, N. M. & Wah, Y. B., “Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests”, Journal of Statistical Modeling and Analytics, 2011, Vol. 2, pp. 21-33.
[4]Royston P., “Remark AS R94: A Remark on Algorithm AS 181: The W-test for Normality”, 1995, Applied Statistics, Vol. 44, DOI:10.2307/2986146
範例
>>> import numpy as np >>> from scipy import stats >>> rng = np.random.default_rng() >>> x = stats.norm.rvs(loc=5, scale=3, size=100, random_state=rng) >>> shapiro_test = stats.shapiro(x) >>> shapiro_test ShapiroResult(statistic=0.9813305735588074, pvalue=0.16855233907699585) >>> shapiro_test.statistic 0.9813305735588074 >>> shapiro_test.pvalue 0.16855233907699585
如需更詳細的範例,請參閱 夏皮羅-威爾克常態性檢定。