scipy.stats.genhyperbolic#
- scipy.stats.genhyperbolic = <scipy.stats._continuous_distns.genhyperbolic_gen object>[來源]#
廣義雙曲連續隨機變數。
作為
rv_continuous
類別的一個實例,genhyperbolic
物件繼承了它的一系列通用方法(完整列表請參見下方),並使用此特定分布的詳細資訊來完成它們。說明
genhyperbolic
的機率密度函數為\[f(x, p, a, b) = \frac{(a^2 - b^2)^{p/2}} {\sqrt{2\pi}a^{p-1/2} K_p\Big(\sqrt{a^2 - b^2}\Big)} e^{bx} \times \frac{K_{p - 1/2} (a \sqrt{1 + x^2})} {(\sqrt{1 + x^2})^{1/2 - p}}\]對於 \(x, p \in ( - \infty; \infty)\),如果 \(p \ge 0\) 則 \(|b| < a\),如果 \(p < 0\) 則 \(|b| \le a\)。\(K_{p}(.)\) 表示第二類和 \(p\) 階的修正貝索函數 (
scipy.special.kv
)genhyperbolic
採用p
作為尾部參數,a
作為形狀參數,b
作為偏度參數。上面的機率密度是以「標準化」形式定義的。若要平移和/或縮放分布,請使用
loc
和scale
參數。具體而言,genhyperbolic.pdf(x, p, a, b, loc, scale)
與genhyperbolic.pdf(y, p, a, b) / scale
完全等效,其中y = (x - loc) / scale
。請注意,移動分布的位置不會使其成為「非中心」分布;某些分布的非中心廣義化版本在單獨的類別中提供。廣義雙曲分布的原始參數化在 [1] 中找到,如下所示
\[f(x, \lambda, \alpha, \beta, \delta, \mu) = \frac{(\gamma/\delta)^\lambda}{\sqrt{2\pi}K_\lambda(\delta \gamma)} e^{\beta (x - \mu)} \times \frac{K_{\lambda - 1/2} (\alpha \sqrt{\delta^2 + (x - \mu)^2})} {(\sqrt{\delta^2 + (x - \mu)^2} / \alpha)^{1/2 - \lambda}}\]對於 \(x \in ( - \infty; \infty)\),\(\gamma := \sqrt{\alpha^2 - \beta^2}\),\(\lambda, \mu \in ( - \infty; \infty)\),如果 \(\lambda \ge 0\) 則 \(\delta \ge 0, |\beta| < \alpha\),如果 \(\lambda < 0\) 則 \(\delta > 0, |\beta| \le \alpha\)。
SciPy 中實作的基於位置-尺度的參數化基於 [2],其中 \(a = \alpha\delta\)、\(b = \beta\delta\)、\(p = \lambda\)、\(scale=\delta\) 和 \(loc=\mu\)
對於作為特殊情況的分布(例如 Student’s t),不建議依賴 genhyperbolic 的實作。為了避免潛在的數值問題並提高效能,應使用特定分布的方法。
參考文獻
[1]O. Barndorff-Nielsen, “Hyperbolic Distributions and Distributions on Hyperbolae”, Scandinavian Journal of Statistics, Vol. 5(3), pp. 151-157, 1978. https://www.jstor.org/stable/4615705
[2]Eberlein E., Prause K. (2002) The Generalized Hyperbolic Model: Financial Derivatives and Risk Measures. In: Geman H., Madan D., Pliska S.R., Vorst T. (eds) Mathematical Finance - Bachelier Congress 2000. Springer Finance. Springer, Berlin, Heidelberg. DOI:10.1007/978-3-662-12429-1_12
[3]Scott, David J, Würtz, Diethelm, Dong, Christine and Tran, Thanh Tam, (2009), Moments of the generalized hyperbolic distribution, MPRA Paper, University Library of Munich, Germany, https://EconPapers.repec.org/RePEc:pra:mprapa:19081。
[4]E. Eberlein and E. A. von Hammerstein. Generalized hyperbolic and inverse Gaussian distributions: Limiting cases and approximation of processes. FDM Preprint 80, April 2003. University of Freiburg. https://freidok.uni-freiburg.de/fedora/objects/freidok:7974/datastreams/FILE1/content
範例
>>> import numpy as np >>> from scipy.stats import genhyperbolic >>> import matplotlib.pyplot as plt >>> fig, ax = plt.subplots(1, 1)
計算前四個動差
>>> p, a, b = 0.5, 1.5, -0.5 >>> mean, var, skew, kurt = genhyperbolic.stats(p, a, b, moments='mvsk')
顯示機率密度函數 (
pdf
)>>> x = np.linspace(genhyperbolic.ppf(0.01, p, a, b), ... genhyperbolic.ppf(0.99, p, a, b), 100) >>> ax.plot(x, genhyperbolic.pdf(x, p, a, b), ... 'r-', lw=5, alpha=0.6, label='genhyperbolic pdf')
或者,可以呼叫分布物件(作為函數)來固定形狀、位置和尺度參數。這會傳回一個「凍結的」RV 物件,其中保存了給定的固定參數。
凍結分布並顯示凍結的
pdf
>>> rv = genhyperbolic(p, a, b) >>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')
檢查
cdf
和ppf
的準確性>>> vals = genhyperbolic.ppf([0.001, 0.5, 0.999], p, a, b) >>> np.allclose([0.001, 0.5, 0.999], genhyperbolic.cdf(vals, p, a, b)) True
產生隨機數字
>>> r = genhyperbolic.rvs(p, a, b, size=1000)
並比較直方圖
>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2) >>> ax.set_xlim([x[0], x[-1]]) >>> ax.legend(loc='best', frameon=False) >>> plt.show()
方法
rvs(p, a, b, loc=0, scale=1, size=1, random_state=None)
隨機變數。
pdf(x, p, a, b, loc=0, scale=1)
機率密度函數。
logpdf(x, p, a, b, loc=0, scale=1)
機率密度函數的對數。
cdf(x, p, a, b, loc=0, scale=1)
累積分布函數。
logcdf(x, p, a, b, loc=0, scale=1)
累積分布函數的對數。
sf(x, p, a, b, loc=0, scale=1)
存活函數(也定義為
1 - cdf
,但 sf 有時更準確)。logsf(x, p, a, b, loc=0, scale=1)
存活函數的對數。
ppf(q, p, a, b, loc=0, scale=1)
百分點函數(
cdf
的反函數 — 百分位數)。isf(q, p, a, b, loc=0, scale=1)
反向存活函數(
sf
的反函數)。moment(order, p, a, b, loc=0, scale=1)
指定階數的非中心動差。
stats(p, a, b, loc=0, scale=1, moments=’mv’)
平均值 ('m')、變異數 ('v')、偏度 ('s') 和/或峰度 ('k')。
entropy(p, a, b, loc=0, scale=1)
RV 的(微分)熵。
fit(data)
通用資料的參數估計。有關關鍵字引數的詳細文件,請參閱 scipy.stats.rv_continuous.fit。
expect(func, args=(p, a, b), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)
函數(一個引數)相對於分布的期望值。
median(p, a, b, loc=0, scale=1)
分布的中位數。
mean(p, a, b, loc=0, scale=1)
分布的平均值。
var(p, a, b, loc=0, scale=1)
分布的變異數。
std(p, a, b, loc=0, scale=1)
分布的標準差。
interval(confidence, p, a, b, loc=0, scale=1)
具有圍繞中位數的相等面積的信賴區間。