scipy.stats.genhyperbolic#

scipy.stats.genhyperbolic = <scipy.stats._continuous_distns.genhyperbolic_gen object>[來源]#

廣義雙曲連續隨機變數。

作為 rv_continuous 類別的一個實例,genhyperbolic 物件繼承了它的一系列通用方法(完整列表請參見下方),並使用此特定分布的詳細資訊來完成它們。

說明

genhyperbolic 的機率密度函數為

\[f(x, p, a, b) = \frac{(a^2 - b^2)^{p/2}} {\sqrt{2\pi}a^{p-1/2} K_p\Big(\sqrt{a^2 - b^2}\Big)} e^{bx} \times \frac{K_{p - 1/2} (a \sqrt{1 + x^2})} {(\sqrt{1 + x^2})^{1/2 - p}}\]

對於 \(x, p \in ( - \infty; \infty)\),如果 \(p \ge 0\)\(|b| < a\),如果 \(p < 0\)\(|b| \le a\)\(K_{p}(.)\) 表示第二類和 \(p\) 階的修正貝索函數 (scipy.special.kv)

genhyperbolic 採用 p 作為尾部參數,a 作為形狀參數,b 作為偏度參數。

上面的機率密度是以「標準化」形式定義的。若要平移和/或縮放分布,請使用 locscale 參數。具體而言,genhyperbolic.pdf(x, p, a, b, loc, scale)genhyperbolic.pdf(y, p, a, b) / scale 完全等效,其中 y = (x - loc) / scale。請注意,移動分布的位置不會使其成為「非中心」分布;某些分布的非中心廣義化版本在單獨的類別中提供。

廣義雙曲分布的原始參數化在 [1] 中找到,如下所示

\[f(x, \lambda, \alpha, \beta, \delta, \mu) = \frac{(\gamma/\delta)^\lambda}{\sqrt{2\pi}K_\lambda(\delta \gamma)} e^{\beta (x - \mu)} \times \frac{K_{\lambda - 1/2} (\alpha \sqrt{\delta^2 + (x - \mu)^2})} {(\sqrt{\delta^2 + (x - \mu)^2} / \alpha)^{1/2 - \lambda}}\]

對於 \(x \in ( - \infty; \infty)\)\(\gamma := \sqrt{\alpha^2 - \beta^2}\)\(\lambda, \mu \in ( - \infty; \infty)\),如果 \(\lambda \ge 0\)\(\delta \ge 0, |\beta| < \alpha\),如果 \(\lambda < 0\)\(\delta > 0, |\beta| \le \alpha\)

SciPy 中實作的基於位置-尺度的參數化基於 [2],其中 \(a = \alpha\delta\)\(b = \beta\delta\)\(p = \lambda\)\(scale=\delta\)\(loc=\mu\)

動差的實作基於 [3][4]

對於作為特殊情況的分布(例如 Student’s t),不建議依賴 genhyperbolic 的實作。為了避免潛在的數值問題並提高效能,應使用特定分布的方法。

參考文獻

[1]

O. Barndorff-Nielsen, “Hyperbolic Distributions and Distributions on Hyperbolae”, Scandinavian Journal of Statistics, Vol. 5(3), pp. 151-157, 1978. https://www.jstor.org/stable/4615705

[2]

Eberlein E., Prause K. (2002) The Generalized Hyperbolic Model: Financial Derivatives and Risk Measures. In: Geman H., Madan D., Pliska S.R., Vorst T. (eds) Mathematical Finance - Bachelier Congress 2000. Springer Finance. Springer, Berlin, Heidelberg. DOI:10.1007/978-3-662-12429-1_12

[3]

Scott, David J, Würtz, Diethelm, Dong, Christine and Tran, Thanh Tam, (2009), Moments of the generalized hyperbolic distribution, MPRA Paper, University Library of Munich, Germany, https://EconPapers.repec.org/RePEc:pra:mprapa:19081

[4]

E. Eberlein and E. A. von Hammerstein. Generalized hyperbolic and inverse Gaussian distributions: Limiting cases and approximation of processes. FDM Preprint 80, April 2003. University of Freiburg. https://freidok.uni-freiburg.de/fedora/objects/freidok:7974/datastreams/FILE1/content

範例

>>> import numpy as np
>>> from scipy.stats import genhyperbolic
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

計算前四個動差

>>> p, a, b = 0.5, 1.5, -0.5
>>> mean, var, skew, kurt = genhyperbolic.stats(p, a, b, moments='mvsk')

顯示機率密度函數 (pdf)

>>> x = np.linspace(genhyperbolic.ppf(0.01, p, a, b),
...                 genhyperbolic.ppf(0.99, p, a, b), 100)
>>> ax.plot(x, genhyperbolic.pdf(x, p, a, b),
...        'r-', lw=5, alpha=0.6, label='genhyperbolic pdf')

或者,可以呼叫分布物件(作為函數)來固定形狀、位置和尺度參數。這會傳回一個「凍結的」RV 物件,其中保存了給定的固定參數。

凍結分布並顯示凍結的 pdf

>>> rv = genhyperbolic(p, a, b)
>>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')

檢查 cdfppf 的準確性

>>> vals = genhyperbolic.ppf([0.001, 0.5, 0.999], p, a, b)
>>> np.allclose([0.001, 0.5, 0.999], genhyperbolic.cdf(vals, p, a, b))
True

產生隨機數字

>>> r = genhyperbolic.rvs(p, a, b, size=1000)

並比較直方圖

>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2)
>>> ax.set_xlim([x[0], x[-1]])
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-genhyperbolic-1.png

方法

rvs(p, a, b, loc=0, scale=1, size=1, random_state=None)

隨機變數。

pdf(x, p, a, b, loc=0, scale=1)

機率密度函數。

logpdf(x, p, a, b, loc=0, scale=1)

機率密度函數的對數。

cdf(x, p, a, b, loc=0, scale=1)

累積分布函數。

logcdf(x, p, a, b, loc=0, scale=1)

累積分布函數的對數。

sf(x, p, a, b, loc=0, scale=1)

存活函數(也定義為 1 - cdf,但 sf 有時更準確)。

logsf(x, p, a, b, loc=0, scale=1)

存活函數的對數。

ppf(q, p, a, b, loc=0, scale=1)

百分點函數(cdf 的反函數 — 百分位數)。

isf(q, p, a, b, loc=0, scale=1)

反向存活函數(sf 的反函數)。

moment(order, p, a, b, loc=0, scale=1)

指定階數的非中心動差。

stats(p, a, b, loc=0, scale=1, moments=’mv’)

平均值 ('m')、變異數 ('v')、偏度 ('s') 和/或峰度 ('k')。

entropy(p, a, b, loc=0, scale=1)

RV 的(微分)熵。

fit(data)

通用資料的參數估計。有關關鍵字引數的詳細文件,請參閱 scipy.stats.rv_continuous.fit

expect(func, args=(p, a, b), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)

函數(一個引數)相對於分布的期望值。

median(p, a, b, loc=0, scale=1)

分布的中位數。

mean(p, a, b, loc=0, scale=1)

分布的平均值。

var(p, a, b, loc=0, scale=1)

分布的變異數。

std(p, a, b, loc=0, scale=1)

分布的標準差。

interval(confidence, p, a, b, loc=0, scale=1)

具有圍繞中位數的相等面積的信賴區間。