scipy.stats.
describe#
- scipy.stats.describe(a, axis=0, ddof=1, bias=True, nan_policy='propagate')[source]#
計算傳入陣列的幾個描述性統計量。
- Parameters:
- aarray_like
輸入資料。
- axisint or None, optional
計算統計量的軸。預設值為 0。如果為 None,則計算整個陣列 a。
- ddofint, optional
自由度差值(僅適用於變異數)。預設值為 1。
- biasbool, optional
如果為 False,則會校正偏度和峰度計算中的統計偏差。
- nan_policy{‘propagate’, ‘raise’, ‘omit’}, optional
定義輸入包含 nan 時的處理方式。以下選項可用(預設值為 ‘propagate’)
‘propagate’: 傳回 nan
‘raise’: 拋出錯誤
‘omit’: 執行計算時忽略 nan 值
- Returns:
- nobsint or ndarray of ints
觀察次數(沿 axis 的資料長度)。當 nan_policy 選擇 ‘omit’ 時,將分別計算每個軸切片的長度。
- minmax: tuple of ndarrays or floats
沿給定軸的 a 最小值和最大值。
- meanndarray or float
沿給定軸的 a 算術平均數。
- variancendarray or float
沿給定軸的 a 無偏變異數;分母是觀察次數減一。
- skewnessndarray or float
沿給定軸的 a 偏度,基於動差計算,其分母等於觀察次數,即不進行自由度校正。
- kurtosisndarray or float
沿給定軸的 a 峰度 (Fisher)。峰度已標準化,因此常態分佈的峰度為零。未使用自由度。
- Raises:
- ValueError
如果 a 的大小為 0。
Examples
>>> import numpy as np >>> from scipy import stats >>> a = np.arange(10) >>> stats.describe(a) DescribeResult(nobs=10, minmax=(0, 9), mean=4.5, variance=9.166666666666666, skewness=0.0, kurtosis=-1.2242424242424244) >>> b = [[1, 2], [3, 4]] >>> stats.describe(b) DescribeResult(nobs=2, minmax=(array([1, 2]), array([3, 4])), mean=array([2., 3.]), variance=array([2., 2.]), skewness=array([0., 0.]), kurtosis=array([-2., -2.]))