scipy.stats.

ttest_rel#

scipy.stats.ttest_rel(a, b, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)[原始碼]#

計算**兩個相關**的評分樣本 a 和 b 的 t 檢定。

此檢定用於檢驗兩個相關或重複樣本是否具有相同的平均（期望）值的虛無假設。

參數:

a, barray_like

陣列必須具有相同的形狀。

axisint 或 None，預設值：0

若為整數，則為計算統計量的輸入軸。輸入的每個軸切片（例如，列）的統計量將會出現在輸出的對應元素中。若為 None，則輸入將在計算統計量之前被展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定義如何處理輸入的 NaN。

propagate：若在計算統計量的軸切片（例如，列）中存在 NaN，則輸出的對應條目將為 NaN。
omit：在執行計算時將省略 NaN。若在計算統計量的軸切片中剩餘的資料不足，則輸出的對應條目將為 NaN。
raise：若存在 NaN，將引發 ValueError。

alternative{‘two-sided’, ‘less’, ‘greater’}，選用

定義對立假設。以下選項可用（預設值為 ‘two-sided’）

‘two-sided’：樣本底層分佈的平均值不相等。
‘less’：第一個樣本底層分佈的平均值小於第二個樣本底層分佈的平均值。
‘greater’：第一個樣本底層分佈的平均值大於第二個樣本底層分佈的平均值。

在 1.6.0 版本中新增。

keepdimsbool，預設值：False

若設定為 True，則縮減的軸將保留在結果中，作為大小為 1 的維度。使用此選項，結果將正確地與輸入陣列進行廣播。

返回:

resultTtestResult

具有以下屬性的物件

statisticfloat 或 array: t 統計量。
pvaluefloat 或 array: 與給定的對立假設相關聯的 p 值。
dffloat 或 array: 用於計算 t 統計量的自由度數；這比樣本大小 (a.shape[axis]) 小 1。

在 1.10.0 版本中新增。

該物件還具有以下方法

confidence_interval(confidence_level=0.95): 計算給定信賴水準下母體平均值差異的信賴區間。信賴區間以具有欄位 low 和 high 的 namedtuple 形式返回。

在 1.10.0 版本中新增。

註解

使用範例為同一組學生在不同考試中的分數，或從相同單位重複取樣。該檢定衡量跨樣本（例如，考試）的平均分數是否顯著不同。若我們觀察到較大的 p 值，例如大於 0.05 或 0.1，則我們無法拒絕平均分數相同的虛無假設。若 p 值小於閾值，例如 1%、5% 或 10%，則我們拒絕平均值相等的虛無假設。小的 p 值與大的 t 統計量相關聯。

t 統計量計算為 np.mean(a - b)/se，其中 se 是標準誤差。因此，當 a - b 的樣本平均值大於零時，t 統計量將為正值；當 a - b 的樣本平均值小於零時，t 統計量將為負值。

從 SciPy 1.9 開始，np.matrix 輸入（不建議用於新程式碼）在執行計算之前會轉換為 np.ndarray。在這種情況下，輸出將為純量或 np.ndarray 的適當形狀，而不是 2D np.matrix。同樣地，雖然會忽略遮罩陣列的遮罩元素，但輸出將為純量或 np.ndarray，而不是具有 mask=False 的遮罩陣列。

參考文獻

https://en.wikipedia.org/wiki/T-test#Dependent_t-test_for_paired_samples

範例

>>> import numpy as np
>>> from scipy import stats
>>> rng = np.random.default_rng()

>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng)
>>> rvs2 = (stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng)
...         + stats.norm.rvs(scale=0.2, size=500, random_state=rng))
>>> stats.ttest_rel(rvs1, rvs2)
TtestResult(statistic=-0.4549717054410304, pvalue=0.6493274702088672, df=499)
>>> rvs3 = (stats.norm.rvs(loc=8, scale=10, size=500, random_state=rng)
...         + stats.norm.rvs(scale=0.2, size=500, random_state=rng))
>>> stats.ttest_rel(rvs1, rvs3)
TtestResult(statistic=-5.879467544540889, pvalue=7.540777129099917e-09, df=499)