統計函數 (scipy.stats
)#
此模組包含大量的機率分布、摘要和頻率統計、相關函數和統計檢定、遮罩統計、核密度估計、準蒙地卡羅功能等等。
統計學是一個非常廣泛的領域,有些主題超出 SciPy 的範圍,由其他套件涵蓋。其中一些最重要的套件是
statsmodels:迴歸、線性模型、時間序列分析,以及
scipy.stats
也涵蓋的主題的擴展。Pandas:表格資料、時間序列功能、與其他統計語言的介面。
PyMC:貝氏統計建模、機率機器學習。
scikit-learn:分類、迴歸、模型選擇。
Seaborn:統計資料視覺化。
rpy2:Python 到 R 的橋樑。
機率分布#
每個單變量分布都是 rv_continuous
的子類別的實例(離散分布為 rv_discrete
)
|
用於子類別化的通用連續隨機變數類別。 |
|
用於子類別化的通用離散隨機變數類別。 |
|
產生由直方圖給定的分布。 |
連續分布#
Alpha 連續隨機變數。 |
|
Anglit 連續隨機變數。 |
|
反正弦連續隨機變數。 |
|
Argus 分布 |
|
Beta 連續隨機變數。 |
|
Beta prime 連續隨機變數。 |
|
Bradford 連續隨機變數。 |
|
Burr (Type III) 連續隨機變數。 |
|
Burr (Type XII) 連續隨機變數。 |
|
柯西連續隨機變數。 |
|
卡方連續隨機變數。 |
|
卡方平方連續隨機變數。 |
|
餘弦連續隨機變數。 |
|
Crystalball 分布 |
|
雙伽瑪連續隨機變數。 |
|
雙帕雷托對數常態連續隨機變數。 |
|
雙 Weibull 連續隨機變數。 |
|
Erlang 連續隨機變數。 |
|
指數連續隨機變數。 |
|
指數修改常態連續隨機變數。 |
|
指數 Weibull 連續隨機變數。 |
|
指數冪連續隨機變數。 |
|
F 連續隨機變數。 |
|
疲勞壽命 (Birnbaum-Saunders) 連續隨機變數。 |
|
Fisk 連續隨機變數。 |
|
摺疊柯西連續隨機變數。 |
|
摺疊常態連續隨機變數。 |
|
廣義邏輯斯諦連續隨機變數。 |
|
廣義常態連續隨機變數。 |
|
廣義帕雷托連續隨機變數。 |
|
廣義指數連續隨機變數。 |
|
廣義極值連續隨機變數。 |
|
高斯超幾何連續隨機變數。 |
|
伽瑪連續隨機變數。 |
|
廣義伽瑪連續隨機變數。 |
|
廣義半邏輯斯諦連續隨機變數。 |
|
廣義雙曲連續隨機變數。 |
|
廣義反高斯連續隨機變數。 |
|
Gibrat 連續隨機變數。 |
|
Gompertz(或截斷 Gumbel)連續隨機變數。 |
|
右偏 Gumbel 連續隨機變數。 |
|
左偏 Gumbel 連續隨機變數。 |
|
半柯西連續隨機變數。 |
|
半邏輯斯諦連續隨機變數。 |
|
半常態連續隨機變數。 |
|
廣義常態連續隨機變數的上半部分。 |
|
雙曲正割連續隨機變數。 |
|
反伽瑪連續隨機變數。 |
|
反高斯連續隨機變數。 |
|
反 Weibull 連續隨機變數。 |
|
Irwin-Hall(均勻和)連續隨機變數。 |
|
Jones 和 Faddy 偏斜 t 分布。 |
|
Johnson SB 連續隨機變數。 |
|
Johnson SU 連續隨機變數。 |
|
Kappa 4 參數分布。 |
|
Kappa 3 參數分布。 |
|
Kolmogorov-Smirnov 單尾檢定統計量分布。 |
|
Kolmogorov-Smirnov 雙尾檢定統計量分布。 |
|
縮放 Kolmogorov-Smirnov 雙尾檢定統計量的極限分布。 |
|
Landau 連續隨機變數。 |
|
拉普拉斯連續隨機變數。 |
|
非對稱拉普拉斯連續隨機變數。 |
|
Levy 連續隨機變數。 |
|
左偏 Levy 連續隨機變數。 |
|
Levy-stable 連續隨機變數。 |
|
邏輯斯諦(或 Sech 平方)連續隨機變數。 |
|
對數伽瑪連續隨機變數。 |
|
對數拉普拉斯連續隨機變數。 |
|
對數常態連續隨機變數。 |
|
對數均勻或倒數連續隨機變數。 |
|
Lomax(第二類帕雷托)連續隨機變數。 |
|
麥克斯韋連續隨機變數。 |
|
Mielke Beta-Kappa / Dagum 連續隨機變數。 |
|
Moyal 連續隨機變數。 |
|
Nakagami 連續隨機變數。 |
|
非中心卡方連續隨機變數。 |
|
非中心 F 分布連續隨機變數。 |
|
非中心 Student's t 連續隨機變數。 |
|
常態連續隨機變數。 |
|
常態反高斯連續隨機變數。 |
|
帕雷托連續隨機變數。 |
|
皮爾森 III 型連續隨機變數。 |
|
冪函數連續隨機變數。 |
|
冪對數常態連續隨機變數。 |
|
冪常態連續隨機變數。 |
|
R 分布(對稱 beta)連續隨機變數。 |
|
Rayleigh 連續隨機變數。 |
|
相對論 Breit-Wigner 隨機變數。 |
|
Rice 連續隨機變數。 |
|
倒數反高斯連續隨機變數。 |
|
半圓形連續隨機變數。 |
|
偏斜柯西隨機變數。 |
|
偏斜常態隨機變數。 |
|
學生化範圍連續隨機變數。 |
|
Student's t 連續隨機變數。 |
|
梯形連續隨機變數。 |
|
三角形連續隨機變數。 |
|
截斷指數連續隨機變數。 |
|
截斷常態連續隨機變數。 |
|
上限截斷帕雷托連續隨機變數。 |
|
雙重截斷 Weibull 最小值連續隨機變數。 |
|
Tukey-Lamdba 連續隨機變數。 |
|
均勻連續隨機變數。 |
|
Von Mises 連續隨機變數。 |
|
Von Mises 連續隨機變數。 |
|
Wald 連續隨機變數。 |
|
Weibull 最小值連續隨機變數。 |
|
Weibull 最大值連續隨機變數。 |
|
包裹柯西連續隨機變數。 |
單變量連續分布的 fit
方法使用最大似然估計將分布擬合到資料集。fit
方法可以接受常規資料或受限資料。受限資料以 CensoredData
類別的實例表示。
|
此類別的實例表示受限資料。 |
多變量分布#
多變量常態隨機變數。 |
|
矩陣常態隨機變數。 |
|
Dirichlet 隨機變數。 |
|
Dirichlet 多項式隨機變數。 |
|
Wishart 隨機變數。 |
|
反 Wishart 隨機變數。 |
|
多項式隨機變數。 |
|
特殊正交矩陣 (SO(N)) 隨機變數。 |
|
正交矩陣 (O(N)) 隨機變數。 |
|
矩陣值 U(N) 隨機變數。 |
|
隨機相關矩陣。 |
|
多變量 t 分布隨機變數。 |
|
多變量超幾何隨機變數。 |
|
常態反伽瑪分布。 |
|
來自具有固定邊際總和的獨立樣本的列聯表。 |
|
向量值均勻方向。 |
|
von Mises-Fisher 變數。 |
scipy.stats.multivariate_normal
方法接受以下類別的實例來表示共變異數。
共變異數矩陣的表示 |
離散分布#
白努利離散隨機變數。 |
|
beta-二項式離散隨機變數。 |
|
beta-負二項式離散隨機變數。 |
|
二項式離散隨機變數。 |
|
Boltzmann(截斷離散指數)隨機變數。 |
|
拉普拉斯離散隨機變數。 |
|
幾何離散隨機變數。 |
|
超幾何離散隨機變數。 |
|
對數(對數級數、級數)離散隨機變數。 |
|
負二項式離散隨機變數。 |
|
Fisher 的非中心超幾何離散隨機變數。 |
|
Wallenius 的非中心超幾何離散隨機變數。 |
|
負超幾何離散隨機變數。 |
|
普朗克離散指數隨機變數。 |
|
Poisson 離散隨機變數。 |
|
Poisson 二項式離散隨機變數。 |
|
均勻離散隨機變數。 |
|
Skellam 離散隨機變數。 |
|
Yule-Simon 離散隨機變數。 |
|
Zipf (Zeta) 離散隨機變數。 |
|
Zipfian 離散隨機變數。 |
以下概述統計函數。其中許多函數在 scipy.stats.mstats
中有類似版本,適用於遮罩陣列。
摘要統計#
|
計算傳遞陣列的幾個描述性統計量。 |
|
計算沿指定軸的加權幾何平均數。 |
|
計算沿指定軸的加權調和平均數。 |
|
計算沿指定軸的加權冪平均數。 |
|
計算資料集的峰度(Fisher 或 Pearson)。 |
|
傳回傳遞陣列中模態(最常見)值的陣列。 |
|
計算樣本平均數的第 n 個動差。 |
|
計算來自連續分布的樣本的 L 動差 |
|
計算指定水平的期望值。 |
|
計算資料集的樣本偏度。 |
|
傳回第 n 個 k 統計量(目前為 |
|
傳回 k 統計量變異數的無偏估計量。 |
|
計算修剪平均數。 |
|
計算修剪變異數。 |
|
計算修剪最小值。 |
|
計算修剪最大值。 |
|
計算修剪樣本標準差。 |
|
計算修剪平均數的標準誤。 |
|
計算變異係數。 |
|
尋找重複項和重複計數。 |
|
為資料指定等級,適當地處理並列。 |
|
用於 Mann-Whitney U 和 Kruskal-Wallis H 檢定的並列校正因子。 |
|
在修剪指定比例的極端值後傳回陣列的平均值 |
|
計算陣列的幾何標準差。 |
|
計算沿指定軸的資料四分位距。 |
|
計算平均數的標準誤。 |
|
平均數、變異數和標準差的貝氏信賴區間。 |
|
資料的平均數、變異數和標準差的「凍結」分布。 |
|
計算給定分布的 Shannon 熵/相對熵。 |
|
給定分布的樣本,估計微分熵。 |
|
計算沿給定軸的資料中位數絕對偏差。 |
頻率統計#
|
傳回累積頻率直方圖,使用直方圖函數。 |
|
計算相對於分數列表的分數的百分等級。 |
|
計算輸入序列給定百分位數的分數。 |
|
傳回相對頻率直方圖,使用直方圖函數。 |
|
計算一組或多組資料的箱狀統計量。 |
|
計算一組或多組資料的二維箱狀統計量。 |
|
計算一組資料的多維箱狀統計量。 |
隨機變數#
|
從 |
|
具有指定平均值和標準差的常態分佈。 |
|
均勻分佈。 |
|
混合分佈的表示。 |
|
順序統計量的機率分佈 |
|
截斷隨機變數的支援。 |
|
隨機變數的絕對值 |
|
隨機變數的自然指數 |
|
非負隨機變數的自然對數 |
準蒙地卡羅法#
列聯表#
遮罩統計函數#
- 用於遮罩陣列的統計函數 (
scipy.stats.mstats
)- 摘要統計量
- 頻率統計量
- 相關函數
- 統計檢定
- 轉換
- 其他
其他統計功能#
轉換#
|
傳回透過 Box-Cox 冪次轉換轉換的資料集。 |
|
計算輸入資料的最佳 Box-Cox 轉換參數。 |
|
boxcox 對數概似函數。 |
|
傳回透過 Yeo-Johnson 冪次轉換轉換的資料集。 |
|
計算最佳 Yeo-Johnson 轉換參數。 |
|
yeojohnson 對數概似函數。 |
|
計算輸入資料(任意數量的陣列)的 O'Brien 轉換。 |
|
執行陣列元素的迭代 sigma 截取。 |
|
從陣列的兩端切除一定比例的項目。 |
|
從傳遞的陣列分佈的一端切除一定比例。 |
|
計算相對 z 分數。 |
|
計算 z 分數。 |
|
計算幾何標準分數。 |
統計距離#
|
計算兩個 1D 離散分佈之間的 Wasserstein-1 距離。 |
|
計算兩個 N-D 離散分佈之間的 Wasserstein-1 距離。 |
|
計算兩個 1D 分佈之間的能量距離。 |
抽樣#
擬合/存活分析#
|
將離散或連續分佈擬合到資料 |
|
樣本的經驗累積分布函數。 |
|
透過對數等級檢定比較兩個樣本的存活分佈。 |
方向統計函數#
|
計算方向資料的樣本統計量。 |
|
計算角度觀察值樣本的圓形平均值。 |
|
計算角度觀察值樣本的圓形變異數。 |
|
計算角度觀察值樣本的圓形標準差。 |
敏感度分析#
|
Sobol' 全域敏感度指標。 |
繪圖檢定#
|
計算使 PPCC 最大化的形狀參數。 |
|
計算並選擇性地繪製機率圖相關係數。 |
|
計算機率圖的分位數,並選擇性地顯示該圖。 |
|
計算 Box-Cox 常態機率圖的參數,並選擇性地顯示它。 |
|
計算 Yeo-Johnson 常態機率圖的參數,並選擇性地顯示它。 |
單變數和多變數核密度估計#
|
使用高斯核的核密度估計表示。 |
scipy.stats
中使用的警告/錯誤#
|
當資料退化且結果可能不可靠時發出警告。 |
|
當資料中的所有值完全相等時發出警告。 |
|
當資料中所有數值幾乎相等時發出警告。 |
|
表示將分布擬合到資料時的錯誤情況。 |
在 scipy.stats
中使用的結果類別#
警告
這些類別為私有,但由於其他統計函數會返回它們的實例,因此在此處包含它們。 不支援使用者匯入和實例化。