T檢驗檢視原始碼討論檢視歷史
T檢驗 |
T檢驗,亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n<30),總體標準差σ未知的正態分布資料。
簡介
t檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。它與Z檢驗、卡方檢驗並列。
t檢驗是戈斯特為了觀測釀酒質量而發明的。戈斯特在位於都柏林的健力士釀酒廠擔任統計學家,基於Claude Guinness聘用從牛津大學和劍橋大學出來的最好的畢業生以將生物化學及統計學應用到健力士工業程序的創新政策。
戈斯特於1908年在Biometrika上公布t檢驗,但因其老闆認為其為商業機密而被迫使用筆名(學生)。實際上,戈斯特的真實身份不只是其它統計學家不知道,連其老闆也不知道。
評價
1、選用的檢驗方法必須符合其適用條件(注意:t檢驗的前提是資料服從正態分布) 。理論上,即使樣本量很小時,也可以進行t檢驗。(如樣本量為10,一些學者聲稱甚至更小的樣本也行),只要每組中變量呈正態分布,兩組方差不會明顯不同。如上所述,可以通過觀察數據的分布或進行正態性檢驗估計數據的正態假設。方差齊性的假設可進行F檢驗,或進行更有效的Levene's檢驗。如果不滿足這些條件,只好使用非參數檢驗代替t檢驗進行兩組間均值的比較。
2、區分單側檢驗和雙側檢驗。單側檢驗的界值小於雙側檢驗的界值,因此更容易拒絕,犯第Ⅰ錯誤的可能性大。t檢驗中的p值是接受兩均值存在差異這個假設可能犯錯的概率。在統計學上,當兩組觀察對象總體中的確不存在差別時,這個概率與我們拒絕了該假設有關。一些學者認為如果差異具有特定的方向性,我們只要考慮單側概率分布,將所得到t-檢驗的P值分為兩半。另一些學者則認為無論何種情況下都要報告標準的雙側t檢驗概率。
3、假設檢驗的結論不能絕對化。當一個統計量的值落在臨界域內,這個統計量是統計上顯著的,這時拒絕虛擬假設。當一個統計量的值落在接受域中,這個檢驗是統計上不顯著的,這是不拒絕虛擬假設H0。因為,其不顯著結果的原因有可能是樣本數量不夠拒絕H0 ,有可能犯第Ⅰ類錯誤。
4、正確理解P值與差別有無統計學意義。P越小,不是說明實際差別越大,而是說越有理由拒絕H0 ,越有理由說明兩者有差異,差別有無統計學意義和有無專業上的實際意義並不完全相同。
5、假設檢驗和可信區間的關係結論具有一致性差異:提供的信息不同區間估計給出總體均值可能取值範圍,但不給出確切的概率值,假設檢驗可以給出H0成立與否的概率。
6、涉及多組間比較時,慎用t檢驗。
科研實踐中,經常需要進行兩組以上比較,或含有多個自變量並控制各個自變量單獨效應後的各組間的比較,(如性別、藥物類型與劑量),此時,需要用方差分析進行數據分析,方差分析被認為是T檢驗的推廣。在較為複雜的設計時,方差分析具有許多t-檢驗所不具備的優點。(進行多次的T檢驗進行比較設計中不同格子均值時)。