帰無仮説と対立仮説

研究

研究を始めたばかり(始める前)では、知らない用語がたくさん出てきます。ここで踵を返したくなる気持ちは非常にわかります。

今回は、「帰無仮説」と「対立仮説」について解説します。

統計学は、数学でいうところの確率というジャンルに該当します。

よく聞く「p<0.05(p値が0.05未満)なので有意差あり」という言葉も、「100回検証して差がないという結果になるのは5回未満」ということで、つまりは「100回中95回以上は差がある結果が得られる」ということを意味します。

前者の「差がないという仮説」を帰無仮説、「差がある」という仮説を対立仮説と言います。

実際には、差があるだろうと考えて統計をかけることが多いのですが、統計学の手順としては、まず差がないという帰無仮説を設定して、これを否定することで差があるという対立仮説を立証します。

二度手間のように感じますが、差があることを立証するよりも、差がないことを否定した方が手間がかからないとされています。

↓差の検定の場合

帰無仮説:群間に差がない。

対立仮説:群間に差がある。

よく、「p<0.001」と「p<0.05」という結果をみて、前者の方がより有意差がある!と思ってしまう方がいるのですが、実はそれは間違いです。前者は「100回中99回は差が出るだろう」、後者は「100回中95回に差が出るだろう」という意味なので、差の大きさには言及していません。あくまで確率の話なのです。

もっと言えば、同一の論文で「p<0.001」と「p<0.05」を使い分けている方も多いですが、どちらか一方で良いとされています。混合すると初学者には、効果量の違いとして映るかも知れませんね。

そもそも、p値のpは、「確率」という意味のprobabilityです。繰り返しになりますが「差の大きさ」には言及していません。間違った解釈をしないように注意してください。

上記の2つの仮説は「差の検定」の話ですが、データAとデータBの関係性をみる「相関」においては以下のようになります。

帰無仮説:関係はない。

対立仮説:関係はある。

帰無仮説は、差の検定においては「差がない」、相関の検定においては「関係はない」となり、対立仮説はこれらを否定するということですね。

3群以上を比較する多重比較の検定においても、「各群に差がない」のが帰無仮説で、「どれかの群に差がある」というのが対立仮説です。ここで注意しなければならないのは、どの群で差があるかは別の検定を行わなければならないということです。これについては別の機会に説明します

なお、別の記事パラメトリックとノンパラメトリックにある、データに正規性があるかを検証するシャピロウィルク検定においては、帰無仮説「正規分布しない」、対立仮説は「正規分布する」となります。

つまり、基本的には「〇〇しない」が帰無仮説で、それを否定するのが対立仮説という認識で良いかと思います。まさに「無に帰す」ですね。

タイトルとURLをコピーしました