t検定(ティーけんてい)とは、帰無仮説が正しいと仮定した場合に、統計量がt分布に従うことを利用する統計学的検定法の総称である。母集団が正規分布に従うと仮定するパラメトリック検定法であり、t分布が直接もとの平均や標準偏差にはよらない(ただし自由度による)ことを利用している。2組の標本について平均に有意差があるかどうかの検定などに用いられる。
スチューデントのt検定とも呼ばれるが、これは統計学者のウィリアム・ゴセットがStudent というペンネームで最初の論文を発表した(1908年)ためである。
種類
t検定は大きく次のように分けられる。
- 2つの母集団がいずれも正規分布に従うと仮定した上での、平均が等しいかどうかの検定。
- 標本が対になっている、つまり1組の標本のメンバー各々ともう1組の特定のメンバーとの間に特別な関係がある場合(たとえば、同じ人に前後2回調査する場合、夫と妻で比較する場合など)。
- 標本が独立で、比較する2つの群の分散が等しいと仮定できる場合(等分散性の仮定)。
- 標本が独立で、等分散性が仮定できない(異分散)場合。これは正確にはウェルチのt検定と呼ばれる。
- 正規分布に従う母集団の平均が、特定の値に等しいかどうかの検定。
- 回帰直線の勾配が0と有意に異なるかどうかの検定。
方法
前段階
t検定を行う前段階として、標本に関して次のような検定が必要な場合もある。
平均の検定:等分散の場合
比較する両群を
X1, ...,
Xmおよび
Y1, ...,
Xn(標本サイズはmおよびn)とする。両群から標本平均
および
、ならびに不偏分散
および
を求める。
両群を合わせた分散の推定値
を
-
により算出する。
これから検定統計量t0 を
-
により算出する。
両群の平均が等しい場合には「統計量
T は
自由度ν =
m +
n – 2 の
t分布に従う」ので、これを帰無仮説として両側検定を行う。
このt分布における
の上側の
p値を求め、有意水準
αと比較する(あるいは数表で比較を行う)。
p <
α ならば帰無仮説は棄却され、「両群の平均には有意差がある」といえる。
平均の検定:異分散の場合(ウェルチのt検定)
前と同じ標本(ただし分散が等しくない)を対象とする。
検定統計量t0 を
-
により算出する。
t分布の自由度
νは、
-
であるが、これは
整数になるとは限らないので、10未満の場合は
小数自由度のt分布表を利用する。10以上ならば小数部を切り捨て整数部のみを使用する。
対応のある場合のt検定
n 対のデータがあるとし、対応する2変数を
Xi と
Yi 、両者の差を
di =
Xi -
Yi とする(
i = 1, 2, ... ,
n)。
di の平均を
とする。
検定統計量 t0 を
-
により算出する。
t分布の自由度は
ν =
n -1となる。
t検定に対応するノン・パラメトリック検定
t検定は正規分布を仮定するパラメトリック検定である。この条件が満たされない場合には、対応するノン・パラメトリック検定として、
を用いる。
統計学
T-Test | Student's t-test | T-toets | T-критерий Стьюдента