SciPy 1.5.0 發行說明#
SciPy 1.5.0 是 6 個月辛勤工作的成果。它包含許多新功能、大量的錯誤修復、改進的測試覆蓋率和更好的文檔。此版本中有許多棄用和 API 變更,如下文所述。鼓勵所有用戶升級到此版本,因為其中有大量的錯誤修復和優化。在升級之前,我們建議用戶檢查他們自己的程式碼是否使用了已棄用的 SciPy 功能(要做到這一點,請使用 python -Wd
執行您的程式碼,並檢查 DeprecationWarning
)。我們的開發重心現在將轉移到 1.5.x 分支上的錯誤修復版本,以及在主分支上添加新功能。
此版本需要 Python 3.6+ 和 NumPy 1.14.5 或更高版本。
對於在 PyPy 上運行,需要 PyPy3 6.0+ 和 NumPy 1.15.0。
例程的包裝器改進了對利用線性代數後端的 64 位元整數大小的支援
新增了雙尾單樣本 Kolmogorov-Smirnov 檢定的機率分佈
使用 minit="++"
初始化 scipy.cluster.vq.kmeans2
現在遵循 matplotlib
在這個模組的所有 FFT 函數中新增了一個新的僅限關鍵字參數 plan
。它保留用於從提供 FFT 後端的函式庫(例如 PyFFTW
和 mkl-fft
)傳入預先計算的計畫,目前在 SciPy 中未使用。
獲得了一個 simplify_cells
參數,如果設定為 True
,如果 .mat
Matrix Market I/O 函數中受到支援
已得到改進。現在可以隨意選擇各種 LAPACK
驅動程式,並且可以透過 subset_by_value
關鍵字請求特徵值的子集。引入了另一個關鍵字 subset_by_index
。關鍵字 turbo
和 eigvals
同樣,標準和廣義 Hermitian 特徵值 LAPACK
例程 ?<sy/he>evx
已新增,現有的例程現在具有完整的 _lwork
例程的包裝器已新增到 scipy.linalg.lapack
:計算具有完整的一般矩陣的 LU 分解樞軸
的 LU 分解的線性系統?gejsv
:計算具有一般矩陣的 QR 分解R 對角線上的非負元素
:計算三對角矩陣的 LU 分解?gttrs
的 LU 分解的線性系統?ptsvx
:計算對稱正定的 LU 分解三對角矩陣
的 LU 分解的線性系統?pteqr
廣義 QR 分解例程 (?geqrf
) 現在具有完整的 _lwork
已新增酉矩陣的 scipy.linalg.cossin
新增了計算 Khatri-Rao 乘積的函數 scipy.linalg.khatri_rao
新的函數 scipy.linalg.convolution_matrix
構造表示一維卷積的 Toeplitz 矩陣。
在各種使用梯度的 minimize
可以使用 2 點、3 點或複步有限差分。以前只有 2 步有限差分可用。
的method= 'powell'
對 scipy.optimize.linprog
當最佳化同時傳回值和梯度的函數時,值的快取已得到改進,避免了在使用 HessianApproximation
(例如 BFGS
現在可以使用現代 np.random.Generator
以及舊版 np.random.RandomState
在這個模組的 freqz
函數中新增了一個新的可選參數 include_nyquist
現在接受一個 window_size
當使用 2d 列向量選擇列索引時,外部索引現在更快。
scipy.sparse.lil.tocsr 更快
修復/改進了 pydata 稀疏陣列和稀疏矩陣之間的比較
BSR 格式稀疏乘法效能已得到改進。
已獲得新的 ndim
已新增 scipy.spatial.geometric_slerp
,以在 n 球體上實現幾何球面線性內插
現在支援計算 2D 和 3D 案例中的區域面積
使用的樹狀結構建構演算法已從二次最壞情況時間複雜度改進為對數線性。基準測試現在也可用於建構和查詢平衡/不平衡 kd 樹。
以下函數現在在 cython_special 中具有 Cython 介面
已新增 scipy.special.log_softmax
以計算 softmax 函數的對數。與 log(scipy.special.softmax(x))
相比,它可以為使 softmax 飽和的輸入提供更好的準確性。
已改進 scipy.stats.dlaplace
中產生隨機樣本的函數。新函數的速度大約快兩倍,並且記憶體佔用量減少了 25% 到 60% 之間(請參閱 gh-11069)。
接受種子以使用隨機數字產生(例如,來自分佈的隨機變量)進行可重現計算的函數現在可以使用現代 np.random.Generator
以及舊版 np.random.RandomState
已將 axis
參數新增到 scipy.stats.rankdata
已將 axis
參數新增到 scipy.stats.f_oneway
,使其能夠為儲存在 n 維陣列中的資料計算多個單向變異數分析檢定。f_oneway
的 PDF 和 CDF 方法現在顯著加快,因為計算 CDF 的數值積分使用了基於 Cython 的 LowLevelCallable
常態分佈 (scipy.stats.norm
) 的動差現在使用分析公式而不是數值積分計算,以提高速度和準確性
梯形分佈 (scipy.stats.trapz
) 的動差和熵現在使用分析公式而不是數值積分計算,以提高速度和準確性
截斷常態分佈 (scipy.stats.truncnorm
) 的方法,尤其是 _rvs
Laplace 分佈的 fit 方法 scipy.stats.laplace
現在,所有 SciPy 分佈的隨機變量產生都是執行緒安全的。第三方分佈可能需要修改 _rvs()
方法的簽章,以符合 _rvs(self, ..., size=None, random_state=None)
。(當使用不符合規範的分佈時,會發出一次 VisibleDeprecationWarning。)
新增了 Kolmogorov-Smirnov 雙尾檢定統計分佈 (scipy.stats.kstwo
)。使用精確和漸近演算法的混合,計算大小為 n 的樣本的 K-S 雙尾統計量 D_n
新函數 median_abs_deviation
取代了已棄用的 median_absolute_deviation
函數現在使用長度最大為 25 的輸入的精確分佈來計算 Wilcoxon 符號等級檢定的 p 值。該函數有一個新的 mode
參數,用於指定如何計算 p 值。預設值為 "auto"
,對於長度最大為 25 的輸入,它使用精確分佈,而對於較大的輸入,它使用常態近似。
新增了基於 Cython 的新實作來評估高斯核估計值,這應能提高 gaussian_kde
函數現在具有 nan_policy
參數,用於精細處理 nan
使用 statistic="std"
的 binned_statistic_dd
函數的效能提高了約 4 倍。
scipy.stats.kstest(rvs, cdf,...)
現在處理單樣本和雙樣本檢定。單樣本變體使用 scipy.stats.ksone
(或 scipy.stats.kstwo
,後退到 scipy.stats.kstwobign
)來計算 p 值。雙樣本變體(如果 cdf
是類陣列)使用 Hodges 描述的演算法直接計算機率,僅在溢位的情況下後退到 scipy.stats.kstwo
。在兩種情況下,結果都是更準確的 p 值,尤其是在較小(或非常不同)大小的雙樣本檢定中。
效能改進包括 fit()
速度提高 20%,pdf()
速度提高 5%
和 scipy.stats.jarque_bera
現在傳回一個具名元組,以提高與其他 stats
和 bdtri
函數正在棄用非負非整數 n
函式 median_absolute_deviation
已過時。請改用 median_abs_deviation
字串 "raw"
與 iqr
的 scale
參數搭配使用已過時。請改用 scale=1
的輸出簽名已從 w, v, info
變更為 w, v, m, isuppz, info
<sy/he>{gv, gvd, gvx}
的輸出引數 w
現在支援 domain
改善了在 SciPy 程式碼庫的多個部分中,利用來自線性代數後端的 64 位元整數大小的支援。
為確保 SciPy 與 Python 2.7 相容而設計的墊片 (shims) 現在已移除。
許多使用範例已新增至函式的文件字串 (docstrings) 中,並且在整個程式碼庫中新增了許多輸入驗證和直觀的例外訊息。
在程式碼庫的少數部分中,初步採用了類型註釋 (type annotations)。
