用於遮罩陣列的統計函數 (`scipy.stats.mstats`)#

此模組包含大量可用於遮罩陣列的統計函數。

這些函數大多與 scipy.stats 中的函數相似，但在 API 或使用的演算法上可能略有差異。由於這是一個相對較新的套件，因此一些 API 變更仍然是可能的。

摘要統計#

`describe`(a[, axis, ddof, bias])	計算傳遞陣列的多個描述性統計量。
`gmean`(a[, axis, dtype, weights, nan_policy, ...])	沿指定軸計算加權幾何平均數。
`hmean`(a[, axis, dtype, weights, nan_policy, ...])	沿指定軸計算加權調和平均數。
`kurtosis`(a[, axis, fisher, bias])	計算資料集的峰度（費雪或皮爾森）。
`mode`(a[, axis])	傳回傳遞陣列中模態（最常見）值的陣列。
`mquantiles`(a[, prob, alphap, betap, axis, limit])	計算資料陣列的經驗分位數。
`hdmedian`(data[, axis, var])	傳回沿給定軸的 Harrell-Davis 中位數估計值。
`hdquantiles`(data[, prob, axis, var])	使用 Harrell-Davis 方法計算分位數估計值。
`hdquantiles_sd`(data[, prob, axis])	通過刀切法 (jackknife) 獲得 Harrell-Davis 分位數估計值的標準誤差。
`idealfourths`(data[, axis])	傳回下四分位數和上四分位數的估計值。
`plotting_positions`(data[, alpha, beta])	傳回資料的繪圖位置（或經驗百分位點）。
`meppf`(data[, alpha, beta])	傳回資料的繪圖位置（或經驗百分位點）。
`moment`(a[, moment, axis])	計算樣本平均值的第 n 個動差。
`skew`(a[, axis, bias])	計算資料集的偏度。
`tmean`(a[, limits, inclusive, axis])	計算截尾平均數。
`tvar`(a[, limits, inclusive, axis, ddof])	計算截尾變異數
`tmin`(a[, lowerlimit, axis, inclusive])	計算截尾最小值
`tmax`(a[, upperlimit, axis, inclusive])	計算截尾最大值
`tsem`(a[, limits, inclusive, axis, ddof])	計算截尾平均數的標準誤差。
`variation`(a[, axis, ddof])	計算變異係數。
`find_repeats`(arr)	在 arr 中尋找重複值，並傳回元組 (repeats, repeat_count)。
`sem`(a[, axis, ddof])	計算輸入陣列平均數的標準誤差。
`trimmed_mean`(a[, limits, inclusive, ...])	傳回沿給定軸的資料截尾平均數。
`trimmed_mean_ci`(data[, limits, inclusive, ...])	沿給定軸的截尾平均數的選定信賴區間。
`trimmed_std`(a[, limits, inclusive, ...])	傳回沿給定軸的資料截尾標準差。
`trimmed_var`(a[, limits, inclusive, ...])	傳回沿給定軸的資料截尾變異數。

頻率統計#

scoreatpercentile(data, per[, limit, ...])

計算序列 a 給定 'per' 百分位數的分數。

相關函數#

`f_oneway`(*args)	執行單因子變異數分析 (ANOVA)，針對任意數量的群組傳回 F 值和機率。
`pearsonr`(x, y)	皮爾森相關係數和用於檢定非相關性的 p 值。
`spearmanr`(x[, y, use_ties, axis, ...])	計算 Spearman 等級順序相關係數和用於檢定非相關性的 p 值。
`pointbiserialr`(x, y)	計算點二系列相關係數及其 p 值。
`kendalltau`(x, y[, use_ties, use_missing, ...])	計算兩個變數 x 和 y 的 Kendall 等級相關 tau 值。
`kendalltau_seasonal`(x)	計算季節性資料的多元 Kendall 等級相關 tau 值。
`linregress`(x[, y])	計算兩組測量的線性最小平方迴歸。
`siegelslopes`(y[, x, method])	計算一組點 (x, y) 的 Siegel 估計量。
`theilslopes`(y[, x, alpha, method])	計算一組點 (x, y) 的 Theil-Sen 估計量。
`sen_seasonal_slopes`(x)	計算季節性 Theil-Sen 和 Kendall 斜率估計量。

統計檢定#

`ttest_1samp`(a, popmean[, axis, alternative])	計算單組分數平均數的 T 檢定。
`ttest_onesamp`(a, popmean[, axis, alternative])	計算單組分數平均數的 T 檢定。
`ttest_ind`(a, b[, axis, equal_var, alternative])	計算兩組獨立樣本分數平均數的 T 檢定。
`ttest_rel`(a, b[, axis, alternative])	計算兩組相關樣本分數 a 和 b 的 T 檢定。
`chisquare`(f_obs[, f_exp, ddof, axis, sum_check])	執行皮爾森卡方檢定。
`kstest`(data1, data2[, args, alternative, method])	參數:
`ks_2samp`(data1, data2[, alternative, method])	計算兩個樣本的 Kolmogorov-Smirnov 檢定。
`ks_1samp`(x, cdf[, args, alternative, method])	計算單個遮罩值樣本的 Kolmogorov-Smirnov 檢定。
`ks_twosamp`(data1, data2[, alternative, method])	計算兩個樣本的 Kolmogorov-Smirnov 檢定。
`mannwhitneyu`(x, y[, use_continuity])	計算 Mann-Whitney 統計量
`rankdata`(data[, axis, use_missing])	傳回沿給定軸的每個資料點的等級（也稱為順序統計量）。
`kruskal`(*args)	計算獨立樣本的 Kruskal-Wallis H 檢定
`kruskalwallis`(*args)	計算獨立樣本的 Kruskal-Wallis H 檢定
`friedmanchisquare`(*args)	Friedman 卡方檢定是一種非參數、單因子受試者內變異數分析。
`brunnermunzel`(x, y[, alternative, distribution])	計算樣本 x 和 y 的 Brunner-Munzel 檢定。
`skewtest`(a[, axis, alternative])	檢定偏度是否與常態分佈不同。
`kurtosistest`(a[, axis, alternative])	檢定資料集是否具有常態峰度
`normaltest`(a[, axis])	檢定樣本是否與常態分佈不同。

轉換#

`obrientransform`(*args)	計算輸入資料（任意數量的欄）的轉換。
`trim`(a[, limits, inclusive, relative, axis])	通過遮罩給定限制之外的資料來修剪陣列。
`trima`(a[, limits, inclusive])	通過遮罩給定限制之外的資料來修剪陣列。
`trimmed_stde`(a[, limits, inclusive, axis])	傳回沿給定軸的截尾平均數的標準誤差。
`trimr`(a[, limits, inclusive, axis])	通過遮罩每端一定比例的資料來修剪陣列。
`trimtail`(data[, proportiontocut, tail, ...])	通過遮罩一尾端的值來修剪資料。
`trimboth`(data[, proportiontocut, inclusive, ...])	修剪最小和最大的資料值。
`winsorize`(a[, limits, inclusive, inplace, ...])	傳回輸入陣列的 Winsorized 版本。
`zmap`(scores, compare[, axis, ddof, nan_policy])	計算相對 z 分數。
`zscore`(a[, axis, ddof, nan_policy])	計算 z 分數。

其他#

`argstoarray`(*args)	從一組序列建構 2D 陣列。
`count_tied_groups`(x[, use_missing])	計算繫結值的數量。
`msign`(x)	傳回 x 的符號，如果 x 被遮罩則傳回 0。
`compare_medians_ms`(group_1, group_2[, axis])	沿給定軸比較兩個獨立群組的中位數。
`median_cihs`(data[, alpha, axis])	計算資料中位數的 alpha 水準信賴區間。
`mjci`(data[, prob, axis])	傳回資料的選定實驗分位數的 Maritz-Jarrett 標準誤差估計量。
`mquantiles_cimj`(data[, prob, alpha, axis])	使用 Maritz-Jarrett 估計量計算資料的選定分位數的 alpha 信賴區間。
`rsh`(data[, points])	評估每個資料點的 Rosenblatt 位移直方圖估計量。