scipy.stats.

boxcox_llf#

scipy.stats.boxcox_llf(lmb, data)[原始碼]#

boxcox 對數概似函數。

參數:
lmb純量

Box-Cox 轉換的參數。請參閱 boxcox 以了解詳細資訊。

dataarray_like

用於計算 Box-Cox 對數概似的資料。如果 data 是多維的,則沿著第一個軸計算對數概似。

返回:
llffloat 或 ndarray

給定 lmbdata 的 Box-Cox 對數概似。對於 1 維 data 為浮點數,否則為陣列。

註解

Box-Cox 對數概似函數在此定義為

\[llf = (\lambda - 1) \sum_i(\log(x_i)) - N/2 \log(\sum_i (y_i - \bar{y})^2 / N),\]

其中 y 是 Box-Cox 轉換後的輸入資料 x

範例

>>> import numpy as np
>>> from scipy import stats
>>> import matplotlib.pyplot as plt
>>> from mpl_toolkits.axes_grid1.inset_locator import inset_axes

產生一些隨機變數,並針對一系列的 lmbda 值計算它們的 Box-Cox 對數概似值

>>> rng = np.random.default_rng()
>>> x = stats.loggamma.rvs(5, loc=10, size=1000, random_state=rng)
>>> lmbdas = np.linspace(-2, 10)
>>> llf = np.zeros(lmbdas.shape, dtype=float)
>>> for ii, lmbda in enumerate(lmbdas):
...     llf[ii] = stats.boxcox_llf(lmbda, x)

也使用 boxcox 找出最佳 lmbda 值

>>> x_most_normal, lmbda_optimal = stats.boxcox(x)

繪製對數概似值作為 lmbda 的函數。新增最佳 lmbda 作為水平線,以檢查它是否真的是最佳值

>>> fig = plt.figure()
>>> ax = fig.add_subplot(111)
>>> ax.plot(lmbdas, llf, 'b.-')
>>> ax.axhline(stats.boxcox_llf(lmbda_optimal, x), color='r')
>>> ax.set_xlabel('lmbda parameter')
>>> ax.set_ylabel('Box-Cox log-likelihood')

現在新增一些機率圖,以顯示在對數概似值最大化的地方,使用 boxcox 轉換的資料看起來最接近常態分佈

>>> locs = [3, 10, 4]  # 'lower left', 'center', 'lower right'
>>> for lmbda, loc in zip([-1, lmbda_optimal, 9], locs):
...     xt = stats.boxcox(x, lmbda=lmbda)
...     (osm, osr), (slope, intercept, r_sq) = stats.probplot(xt)
...     ax_inset = inset_axes(ax, width="20%", height="20%", loc=loc)
...     ax_inset.plot(osm, osr, 'c.', osm, slope*osm + intercept, 'k-')
...     ax_inset.set_xticklabels([])
...     ax_inset.set_yticklabels([])
...     ax_inset.set_title(r'$\lambda=%1.2f$' % lmbda)
>>> plt.show()
../../_images/scipy-stats-boxcox_llf-1.png