パラメトリックとノンパラメトリック

研究

研究を始めたばかり(始める前)では、知らない用語がたくさん出てきます。ここで踵を返したくなる気持ちは非常にわかります。

今回はまず「パラメトリック」と「ノンパラメトリック」について解説します。

一言で言えば、データの集まりがどのような分布になるかを表す言葉です。

多くの臨床研究は、数人〜数百人の対象者から得たデータを、あたかも日本人もしくは世界中の人々に適応できると仮定して発表しています。

例)A病院で手術した腱板断裂患者500名は、肩関節外転の可動域を正常まで改善するのに4ヶ月を要した。

このようなデータがあった場合、「じゃあ他の患者でもそれくらいかかりそうだな」と考えて、患者に説明したり、目標を設定することができそうです。

では、この例文の腱板断裂患者が5名だったら?

「参考にするには心許ない気が…」となりそうです。

感覚的には、500名の方がパラメトリックデータ(上図)であり、5名の方がノンパラメトリックデータ(下図)です。

パラメトリックデータ
平均値など値の分布に一定の傾向が示されたデータ
ノンパラメトリックデータ
平均値など値の分布が一定ではないデータ

それぞれをグラフにするとこんな感じで、パラメトリックデータの特徴としては多くの人数から得たデータなので、平均値である真ん中が高くなります。これを釣鐘型の分布といいます。

身長や体重、握力なども調査する対象者を増やすほど釣鐘型に近づいていきます。

そうならないグラフはノンパラメトリックデータと言い換えることもでき、ほとんどの場合が対象者が少ないことが原因です。

言わずもがな、臨床研究を行う場合にはパラメトリックデータとなるように、たくさんのデータを収集するべきでしょう。理由は、「A病院と先行研究を比較する」、「A病院で他の手術と比較する」など、比較研究には平均値を使用する方がスマートだからです。

先ほどのパラメトリックとノンパラメトリックの中間は下記のオレンジの線のようなグラフになります。データを増やすとノンパラメトリックの歪な曲線がパラメトリックのような釣鐘型に近づいていくということです。調査するデータ数が多い方が平均値が突き抜けていくので、他のデータ群と比較しやすいことが直感的にわかると思います。

パラメトリックのようだがデータ数が少ない場合の分布(オレンジ)

では実際にはどれくらいのデータ数を集めれば良いのか?と思うでしょう。どのようなデータかによって分布をとり方も異なるので、明確にいくつ必要ということは言えません。

「握力」といっても、男性のみ→30歳代のみ→持病なしと条件を変えていけば分布のばらつきも減っていくわけですから。

この問題を解決する方法としては、シャピロウィルク検定があります。

この検定は、データの分布に正規性があるかをみる検定、つまりパラメトリックデータかを検定する統計手法です。

上記の例、「他の手術と比較する」という場合には、まず今回のデータに対してシャピロウィルク検定を行い、正規性が保たれていれば「平均値の差の検定」に進みます。

正規性が保たれていると言えない場合は、釣鐘型のグラフにならないので平均値は使えません。その場合は、「中央値」を用います。

臨床研究で最も行われている研究デザインは「差の検定」だと思うので、パラメトリックとノンパラメトリックの理解は、差の検定の手法を選択する上で非常に重要な考え方です。

補足ですが、ノンパラメトリックデータが悪というわけではありません。稀有な疾患、症例などは物理的にデータ数を集められませんし、少ないデータだからこそ情報が少ないという価値を持ちます。逆に、2つのパラメトリックデータを比較する際に双方のデータ数を極端に増やせば、平均値が少しでも異なれば「有意差あり」との結果が得られます。

大事なのは、「臨床的に意味のある有意差」です。データの数で検定結果が左右されるのは諸刃の剣です。惑わされないようにしっかり勉強しておきましょう。

タイトルとURLをコピーしました