とある研究フォーラムの報告駄文を書きながら,「ああ統計ってややこしい」と思った。でも正しくは「統計っていい加減だなぁ」。仮説の設定の仕方にもよるわけだが,これ,何でもかんでも有意水準が低いってなったら,あんまり意味がないんだもん。
アンケートを集計し,その結果を分析する。これは雑誌記事なんかでよくある内容だ。ものによっては,質問同士を掛け合わせて,2つの要素(因子)の間に関連があるかないかを分析するものもある。そういうときに出てくるのが「検定」。つまり複数の因子同士が本当に関連があるのかどうか,その仮説をテストすることだ。
検定という名前が付いているが,やっていることは「確率」計算。ところが,計算できる確率は「関連がある」って仮説の方ではなくて,「関連がない」という反対の仮説だけなのだ。これが摩訶不思議に思えるところかも知れないが,とにかく私たちにできることは,「関連がない可能性はこれくらいの確率」って事だけなのである。その確率と連動する水準のことを「有意水準」といって,この水準が低ければ低いほど,本来の仮説の方の可能性が高まる(かもしれない)という考え方なのだ。
おわかりのように,どんなに反対の仮説の確率が低くたって,本来の仮説の確率を明言できないのだから,実は結構いい加減なのだ。たとえば,「どう考えてもあの女性は僕に気がないはずがない」ということが明確になったとしよう。だって会うと笑顔を返してくれるし,時間があればよくおしゃべりをするし,映画に誘えば一緒に出かけてくれるし。確かに「気がない」という可能性は低いように思える。だからといって「あの女性は僕が好きなんだ」ということには絶対ならないのである。
ま,少々仮説の立て方が酷いのだが,つまりは仮説の立て方次第で検定が役立つこともあるし,下手な仮説の立て方をすると検定にほとんど意味がないことにもなる。
統計の話題は,書庫で文献紹介しながらまた取り上げてみよう。