scipy.stats.genhyperbolic#

scipy.stats.genhyperbolic = <scipy.stats._continuous_distns.genhyperbolic_gen object>[來源]#

廣義雙曲連續隨機變數。

作為 rv_continuous 類別的一個實例，genhyperbolic 物件繼承了它的一系列通用方法（完整列表請參見下方），並使用此特定分布的詳細資訊來完成它們。

參見

t、norminvgauss、geninvgauss、laplace、cauchy

說明

genhyperbolic 的機率密度函數為

\[f(x, p, a, b) = \frac{(a^2 - b^2)^{p/2}} {\sqrt{2\pi}a^{p-1/2} K_p\Big(\sqrt{a^2 - b^2}\Big)} e^{bx} \times \frac{K_{p - 1/2} (a \sqrt{1 + x^2})} {(\sqrt{1 + x^2})^{1/2 - p}}\]

對於 \(x, p \in ( - \infty; \infty)\)，如果 \(p \ge 0\) 則 \(|b| < a\)，如果 \(p < 0\) 則 \(|b| \le a\)。\(K_{p}(.)\) 表示第二類和 \(p\) 階的修正貝索函數 (scipy.special.kv)

genhyperbolic 採用 p 作為尾部參數，a 作為形狀參數，b 作為偏度參數。

上面的機率密度是以「標準化」形式定義的。若要平移和/或縮放分布，請使用 loc 和 scale 參數。具體而言，genhyperbolic.pdf(x, p, a, b, loc, scale) 與 genhyperbolic.pdf(y, p, a, b) / scale 完全等效，其中 y = (x - loc) / scale。請注意，移動分布的位置不會使其成為「非中心」分布；某些分布的非中心廣義化版本在單獨的類別中提供。

廣義雙曲分布的原始參數化在 [1] 中找到，如下所示

\[f(x, \lambda, \alpha, \beta, \delta, \mu) = \frac{(\gamma/\delta)^\lambda}{\sqrt{2\pi}K_\lambda(\delta \gamma)} e^{\beta (x - \mu)} \times \frac{K_{\lambda - 1/2} (\alpha \sqrt{\delta^2 + (x - \mu)^2})} {(\sqrt{\delta^2 + (x - \mu)^2} / \alpha)^{1/2 - \lambda}}\]

對於 \(x \in ( - \infty; \infty)\)，\(\gamma := \sqrt{\alpha^2 - \beta^2}\)，\(\lambda, \mu \in ( - \infty; \infty)\)，如果 \(\lambda \ge 0\) 則 \(\delta \ge 0, |\beta| < \alpha\)，如果 \(\lambda < 0\) 則 \(\delta > 0, |\beta| \le \alpha\)。

SciPy 中實作的基於位置-尺度的參數化基於 [2]，其中 \(a = \alpha\delta\)、\(b = \beta\delta\)、\(p = \lambda\)、\(scale=\delta\) 和 \(loc=\mu\)

動差的實作基於 [3] 和 [4]。

對於作為特殊情況的分布（例如 Student’s t），不建議依賴 genhyperbolic 的實作。為了避免潛在的數值問題並提高效能，應使用特定分布的方法。

參考文獻

[1]

O. Barndorff-Nielsen, “Hyperbolic Distributions and Distributions on Hyperbolae”, Scandinavian Journal of Statistics, Vol. 5(3), pp. 151-157, 1978. https://www.jstor.org/stable/4615705

[2]

Eberlein E., Prause K. (2002) The Generalized Hyperbolic Model: Financial Derivatives and Risk Measures. In: Geman H., Madan D., Pliska S.R., Vorst T. (eds) Mathematical Finance - Bachelier Congress 2000. Springer Finance. Springer, Berlin, Heidelberg. DOI:10.1007/978-3-662-12429-1_12

[3]

Scott, David J, Würtz, Diethelm, Dong, Christine and Tran, Thanh Tam, (2009), Moments of the generalized hyperbolic distribution, MPRA Paper, University Library of Munich, Germany, https://EconPapers.repec.org/RePEc:pra:mprapa:19081。

[4]

E. Eberlein and E. A. von Hammerstein. Generalized hyperbolic and inverse Gaussian distributions: Limiting cases and approximation of processes. FDM Preprint 80, April 2003. University of Freiburg. https://freidok.uni-freiburg.de/fedora/objects/freidok:7974/datastreams/FILE1/content

範例

>>> import numpy as np
>>> from scipy.stats import genhyperbolic
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

計算前四個動差

>>> p, a, b = 0.5, 1.5, -0.5
>>> mean, var, skew, kurt = genhyperbolic.stats(p, a, b, moments='mvsk')

顯示機率密度函數 (pdf)

>>> x = np.linspace(genhyperbolic.ppf(0.01, p, a, b),
...                 genhyperbolic.ppf(0.99, p, a, b), 100)
>>> ax.plot(x, genhyperbolic.pdf(x, p, a, b),
...        'r-', lw=5, alpha=0.6, label='genhyperbolic pdf')

或者，可以呼叫分布物件（作為函數）來固定形狀、位置和尺度參數。這會傳回一個「凍結的」RV 物件，其中保存了給定的固定參數。

凍結分布並顯示凍結的 pdf

>>> rv = genhyperbolic(p, a, b)
>>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')

檢查 cdf 和 ppf 的準確性

>>> vals = genhyperbolic.ppf([0.001, 0.5, 0.999], p, a, b)
>>> np.allclose([0.001, 0.5, 0.999], genhyperbolic.cdf(vals, p, a, b))
True

產生隨機數字

>>> r = genhyperbolic.rvs(p, a, b, size=1000)

並比較直方圖

>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2)
>>> ax.set_xlim([x[0], x[-1]])
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()

../../_images/scipy-stats-genhyperbolic-1.png

方法

rvs(p, a, b, loc=0, scale=1, size=1, random_state=None)	隨機變數。
pdf(x, p, a, b, loc=0, scale=1)	機率密度函數。
logpdf(x, p, a, b, loc=0, scale=1)	機率密度函數的對數。
cdf(x, p, a, b, loc=0, scale=1)	累積分布函數。
logcdf(x, p, a, b, loc=0, scale=1)	累積分布函數的對數。
sf(x, p, a, b, loc=0, scale=1)	存活函數（也定義為 `1 - cdf`，但 sf 有時更準確）。
logsf(x, p, a, b, loc=0, scale=1)	存活函數的對數。
ppf(q, p, a, b, loc=0, scale=1)	百分點函數（`cdf` 的反函數 — 百分位數）。
isf(q, p, a, b, loc=0, scale=1)	反向存活函數（`sf` 的反函數）。
moment(order, p, a, b, loc=0, scale=1)	指定階數的非中心動差。
stats(p, a, b, loc=0, scale=1, moments=’mv’)	平均值 ('m')、變異數 ('v')、偏度 ('s') 和/或峰度 ('k')。
entropy(p, a, b, loc=0, scale=1)	RV 的（微分）熵。
fit(data)	通用資料的參數估計。有關關鍵字引數的詳細文件，請參閱 scipy.stats.rv_continuous.fit。
expect(func, args=(p, a, b), loc=0, scale=1, lb=None, ub=None, conditional=False, kwds)**	函數（一個引數）相對於分布的期望值。
median(p, a, b, loc=0, scale=1)	分布的中位數。
mean(p, a, b, loc=0, scale=1)	分布的平均值。
var(p, a, b, loc=0, scale=1)	分布的變異數。
std(p, a, b, loc=0, scale=1)	分布的標準差。
interval(confidence, p, a, b, loc=0, scale=1)	具有圍繞中位數的相等面積的信賴區間。