仮説検定(かせつけんてい、正しくは統計学的仮説検定、あるいは単に検定法ともいう)とは、ある仮説が正しいといってよいかどうかを統計学的・確率論的に判断するためのアルゴリズムである。
仮説が正しいと仮定した上で、それに従う母集団から、実際に観察された標本が抽出される確率を求め、その値により判断を行う。その確率が十分に(予め決めておいた値より)小さければ、「仮説は成り立ちそうもない」と判断できる。(なお本項で述べるのは従来の頻度主義統計学の考え方であって、ベイズ主義では考え方が異なる)
「薬に対する反応の平均がプラセボに対する反応の平均と等しい。どちらの反応も正規分布に従うがその標準偏差は両者で等しく、平均を問題とする」
という仮説を立てる。この仮説は最終的に棄却されるべきものなので、帰無仮説(きむかせつNull hypothesis)と呼ばれ、普通 H0 と書く。また帰無仮説に対立する仮説(対立仮説: H1 )を立てることも多い。上の例では対立仮説は「薬に対する反応の平均がプラセボに対するそれと異なる」ということになる。
例で言えば、2つの標本平均の差m1 − m2が十分統計量である。
例では、標本平均の差は正規分布に従い、その標準偏差は母標準偏差に をかけたもの(ここで n1 と n2 は各標本のサイズ)である。
仮説が例のように「平均が等しい」と主張するタイプであれば、分布関数の裾として左右両側を用いる(両側検定)。また「・・・の方が平均が大きい(小さい)ということはない」と主張するタイプであれば、片側の裾だけを用いる(片側検定)。検定の種類によっては両側検定または片側検定のみということもある。
通常は統計量が仮定した分布の中で、算出した十分統計量と同じかそれよりも極端な(仮説に反する)値となる確率(これをp値という)を数表などにより求め、これとαとを比較し、p < αならば危険域の内部にあると判断する。 検定統計量が危険域内にあれば、結論は
一方、検定統計量が危険域の外側にあれば、
帰無仮説を棄却してはいけないのに棄却してしまうのを第1種の過誤(Type I error)という。第1種の過誤を犯す確率は危険率αである。
逆に帰無仮説を棄却すべきだったのに棄却しないのを第2種の過誤(Type II error)という。第2種の過誤を冒す確率はふつうβと表す。1 - βは検出力に等しい。
第1種の過誤を減らそうとすれば第2種の過誤が増える(あるいはその逆)という傾向がある(模式図 参照)。仮説検定では一般に、予め指定した十分小さいαに対し、βをなるべく小さく(検出力をなるべく大きく)するように棄却域を選ぶ方針がとられる(ネイマン・ピアソンの基準)。 StatisticTest.gif
ちなみに検定の実施自体は誤っていないが、検定法の適用を誤っている場合を第3種の過誤(Type III error)という。
Prawf rhagdybiaeth | Statistischer Test | Statistical hypothesis testing | Test d'hypothèse | Test di verifica d'ipotesi | Statistische toets