ttest_rel#
- scipy.stats.ttest_rel(a, b, axis=0, nan_policy='propagate', alternative='two-sided', *, keepdims=False)[原始碼]#
計算**兩個相關**的評分樣本 a 和 b 的 t 檢定。
此檢定用於檢驗兩個相關或重複樣本是否具有相同的平均(期望)值的虛無假設。
- 參數:
- a, barray_like
陣列必須具有相同的形狀。
- axisint 或 None,預設值:0
若為整數,則為計算統計量的輸入軸。輸入的每個軸切片(例如,列)的統計量將會出現在輸出的對應元素中。若為
None
,則輸入將在計算統計量之前被展平。- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定義如何處理輸入的 NaN。
propagate
:若在計算統計量的軸切片(例如,列)中存在 NaN,則輸出的對應條目將為 NaN。omit
:在執行計算時將省略 NaN。若在計算統計量的軸切片中剩餘的資料不足,則輸出的對應條目將為 NaN。raise
:若存在 NaN,將引發ValueError
。
- alternative{‘two-sided’, ‘less’, ‘greater’},選用
定義對立假設。以下選項可用(預設值為 ‘two-sided’)
‘two-sided’:樣本底層分佈的平均值不相等。
‘less’:第一個樣本底層分佈的平均值小於第二個樣本底層分佈的平均值。
‘greater’:第一個樣本底層分佈的平均值大於第二個樣本底層分佈的平均值。
在 1.6.0 版本中新增。
- keepdimsbool,預設值:False
若設定為 True,則縮減的軸將保留在結果中,作為大小為 1 的維度。使用此選項,結果將正確地與輸入陣列進行廣播。
- 返回:
- result
TtestResult
具有以下屬性的物件
- statisticfloat 或 array
t 統計量。
- pvaluefloat 或 array
與給定的對立假設相關聯的 p 值。
- dffloat 或 array
用於計算 t 統計量的自由度數;這比樣本大小 (
a.shape[axis]
) 小 1。在 1.10.0 版本中新增。
該物件還具有以下方法
- confidence_interval(confidence_level=0.95)
計算給定信賴水準下母體平均值差異的信賴區間。信賴區間以具有欄位 low 和 high 的
namedtuple
形式返回。在 1.10.0 版本中新增。
- result
註解
使用範例為同一組學生在不同考試中的分數,或從相同單位重複取樣。該檢定衡量跨樣本(例如,考試)的平均分數是否顯著不同。若我們觀察到較大的 p 值,例如大於 0.05 或 0.1,則我們無法拒絕平均分數相同的虛無假設。若 p 值小於閾值,例如 1%、5% 或 10%,則我們拒絕平均值相等的虛無假設。小的 p 值與大的 t 統計量相關聯。
t 統計量計算為
np.mean(a - b)/se
,其中se
是標準誤差。因此,當a - b
的樣本平均值大於零時,t 統計量將為正值;當a - b
的樣本平均值小於零時,t 統計量將為負值。從 SciPy 1.9 開始,
np.matrix
輸入(不建議用於新程式碼)在執行計算之前會轉換為np.ndarray
。在這種情況下,輸出將為純量或np.ndarray
的適當形狀,而不是 2Dnp.matrix
。同樣地,雖然會忽略遮罩陣列的遮罩元素,但輸出將為純量或np.ndarray
,而不是具有mask=False
的遮罩陣列。參考文獻
https://en.wikipedia.org/wiki/T-test#Dependent_t-test_for_paired_samples
範例
>>> import numpy as np >>> from scipy import stats >>> rng = np.random.default_rng()
>>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng) >>> rvs2 = (stats.norm.rvs(loc=5, scale=10, size=500, random_state=rng) ... + stats.norm.rvs(scale=0.2, size=500, random_state=rng)) >>> stats.ttest_rel(rvs1, rvs2) TtestResult(statistic=-0.4549717054410304, pvalue=0.6493274702088672, df=499) >>> rvs3 = (stats.norm.rvs(loc=8, scale=10, size=500, random_state=rng) ... + stats.norm.rvs(scale=0.2, size=500, random_state=rng)) >>> stats.ttest_rel(rvs1, rvs3) TtestResult(statistic=-5.879467544540889, pvalue=7.540777129099917e-09, df=499)