用於遮罩陣列的統計函數 (scipy.stats.mstats)#

此模組包含大量可用於遮罩陣列的統計函數。

這些函數大多與 scipy.stats 中的函數相似,但在 API 或使用的演算法上可能略有差異。由於這是一個相對較新的套件,因此一些 API 變更仍然是可能的。

摘要統計#

describe(a[, axis, ddof, bias])

計算傳遞陣列的多個描述性統計量。

gmean(a[, axis, dtype, weights, nan_policy, ...])

沿指定軸計算加權幾何平均數。

hmean(a[, axis, dtype, weights, nan_policy, ...])

沿指定軸計算加權調和平均數。

kurtosis(a[, axis, fisher, bias])

計算資料集的峰度(費雪或皮爾森)。

mode(a[, axis])

傳回傳遞陣列中模態(最常見)值的陣列。

mquantiles(a[, prob, alphap, betap, axis, limit])

計算資料陣列的經驗分位數。

hdmedian(data[, axis, var])

傳回沿給定軸的 Harrell-Davis 中位數估計值。

hdquantiles(data[, prob, axis, var])

使用 Harrell-Davis 方法計算分位數估計值。

hdquantiles_sd(data[, prob, axis])

通過刀切法 (jackknife) 獲得 Harrell-Davis 分位數估計值的標準誤差。

idealfourths(data[, axis])

傳回下四分位數和上四分位數的估計值。

plotting_positions(data[, alpha, beta])

傳回資料的繪圖位置(或經驗百分位點)。

meppf(data[, alpha, beta])

傳回資料的繪圖位置(或經驗百分位點)。

moment(a[, moment, axis])

計算樣本平均值的第 n 個動差。

skew(a[, axis, bias])

計算資料集的偏度。

tmean(a[, limits, inclusive, axis])

計算截尾平均數。

tvar(a[, limits, inclusive, axis, ddof])

計算截尾變異數

tmin(a[, lowerlimit, axis, inclusive])

計算截尾最小值

tmax(a[, upperlimit, axis, inclusive])

計算截尾最大值

tsem(a[, limits, inclusive, axis, ddof])

計算截尾平均數的標準誤差。

variation(a[, axis, ddof])

計算變異係數。

find_repeats(arr)

在 arr 中尋找重複值,並傳回元組 (repeats, repeat_count)。

sem(a[, axis, ddof])

計算輸入陣列平均數的標準誤差。

trimmed_mean(a[, limits, inclusive, ...])

傳回沿給定軸的資料截尾平均數。

trimmed_mean_ci(data[, limits, inclusive, ...])

沿給定軸的截尾平均數的選定信賴區間。

trimmed_std(a[, limits, inclusive, ...])

傳回沿給定軸的資料截尾標準差。

trimmed_var(a[, limits, inclusive, ...])

傳回沿給定軸的資料截尾變異數。

頻率統計#

scoreatpercentile(data, per[, limit, ...])

計算序列 a 給定 'per' 百分位數的分數。

相關函數#

f_oneway(*args)

執行單因子變異數分析 (ANOVA),針對任意數量的群組傳回 F 值和機率。

pearsonr(x, y)

皮爾森相關係數和用於檢定非相關性的 p 值。

spearmanr(x[, y, use_ties, axis, ...])

計算 Spearman 等級順序相關係數和用於檢定非相關性的 p 值。

pointbiserialr(x, y)

計算點二系列相關係數及其 p 值。

kendalltau(x, y[, use_ties, use_missing, ...])

計算兩個變數 xy 的 Kendall 等級相關 tau 值。

kendalltau_seasonal(x)

計算季節性資料的多元 Kendall 等級相關 tau 值。

linregress(x[, y])

計算兩組測量的線性最小平方迴歸。

siegelslopes(y[, x, method])

計算一組點 (x, y) 的 Siegel 估計量。

theilslopes(y[, x, alpha, method])

計算一組點 (x, y) 的 Theil-Sen 估計量。

sen_seasonal_slopes(x)

計算季節性 Theil-Sen 和 Kendall 斜率估計量。

統計檢定#

ttest_1samp(a, popmean[, axis, alternative])

計算單組分數平均數的 T 檢定。

ttest_onesamp(a, popmean[, axis, alternative])

計算單組分數平均數的 T 檢定。

ttest_ind(a, b[, axis, equal_var, alternative])

計算兩組獨立樣本分數平均數的 T 檢定。

ttest_rel(a, b[, axis, alternative])

計算兩組相關樣本分數 a 和 b 的 T 檢定。

chisquare(f_obs[, f_exp, ddof, axis, sum_check])

執行皮爾森卡方檢定。

kstest(data1, data2[, args, alternative, method])

參數:

ks_2samp(data1, data2[, alternative, method])

計算兩個樣本的 Kolmogorov-Smirnov 檢定。

ks_1samp(x, cdf[, args, alternative, method])

計算單個遮罩值樣本的 Kolmogorov-Smirnov 檢定。

ks_twosamp(data1, data2[, alternative, method])

計算兩個樣本的 Kolmogorov-Smirnov 檢定。

mannwhitneyu(x, y[, use_continuity])

計算 Mann-Whitney 統計量

rankdata(data[, axis, use_missing])

傳回沿給定軸的每個資料點的等級(也稱為順序統計量)。

kruskal(*args)

計算獨立樣本的 Kruskal-Wallis H 檢定

kruskalwallis(*args)

計算獨立樣本的 Kruskal-Wallis H 檢定

friedmanchisquare(*args)

Friedman 卡方檢定是一種非參數、單因子受試者內變異數分析。

brunnermunzel(x, y[, alternative, distribution])

計算樣本 x 和 y 的 Brunner-Munzel 檢定。

skewtest(a[, axis, alternative])

檢定偏度是否與常態分佈不同。

kurtosistest(a[, axis, alternative])

檢定資料集是否具有常態峰度

normaltest(a[, axis])

檢定樣本是否與常態分佈不同。

轉換#

obrientransform(*args)

計算輸入資料(任意數量的欄)的轉換。

trim(a[, limits, inclusive, relative, axis])

通過遮罩給定限制之外的資料來修剪陣列。

trima(a[, limits, inclusive])

通過遮罩給定限制之外的資料來修剪陣列。

trimmed_stde(a[, limits, inclusive, axis])

傳回沿給定軸的截尾平均數的標準誤差。

trimr(a[, limits, inclusive, axis])

通過遮罩每端一定比例的資料來修剪陣列。

trimtail(data[, proportiontocut, tail, ...])

通過遮罩一尾端的值來修剪資料。

trimboth(data[, proportiontocut, inclusive, ...])

修剪最小和最大的資料值。

winsorize(a[, limits, inclusive, inplace, ...])

傳回輸入陣列的 Winsorized 版本。

zmap(scores, compare[, axis, ddof, nan_policy])

計算相對 z 分數。

zscore(a[, axis, ddof, nan_policy])

計算 z 分數。

其他#

argstoarray(*args)

從一組序列建構 2D 陣列。

count_tied_groups(x[, use_missing])

計算繫結值的數量。

msign(x)

傳回 x 的符號,如果 x 被遮罩則傳回 0。

compare_medians_ms(group_1, group_2[, axis])

沿給定軸比較兩個獨立群組的中位數。

median_cihs(data[, alpha, axis])

計算資料中位數的 alpha 水準信賴區間。

mjci(data[, prob, axis])

傳回資料的選定實驗分位數的 Maritz-Jarrett 標準誤差估計量。

mquantiles_cimj(data[, prob, alpha, axis])

使用 Maritz-Jarrett 估計量計算資料的選定分位數的 alpha 信賴區間。

rsh(data[, points])

評估每個資料點的 Rosenblatt 位移直方圖估計量。