超簡単・心理統計の基礎7 母集団とサンプル
超簡単・心理統計の基礎7 母集団とサンプル
母集団とサンプルの関係
一般的な,心理学の統計的仮説検定では,実際に分析対象にするデータをサンプル(あるいはサンプルデータ)と呼びます。
なぜかというと,私たちが「実験・調査の対象とするデータは,研究の興味そのものではない」からです。いやいや,興味あるよ,と思われるかもしれませんが,違うのです。心理学の研究では,ヒト一般,あるいそこまで行かなくても,大学生一般,女性一般など,もっと大規模な対象を想定しているのです。
たとえば,「指導法Aは指導法Bよりも効果があるのか?」という問いは,厳密には,「今回実験対象とした集団に限らず,同じような集団すべてに関して,指導法Aは指導法Bよりも効果があるのか?」という問いなのです。
もしこれが,「今回実験対象とした集団のみにおいて,指導法Aは指導法Bよりも効果があるのか?」という問いであれば,2群の平均値を比較すれば終わりです。t検定などの統計的仮説検定は必要ありません。だって,今回に限った話なので,データの解釈についての曖昧さはゼロなんです。
このような理屈のため,分析対象とするデータは,「どこか目に見えぬ大規模な集団から,サンプリング(抽出)してきた」と考えます。そして,どこか目に見えぬ大きな集団のことを,母集団と呼びます。
母集団を全部調べつくすことは現実的に無理なので,母集団からデータをサンプリングして,そのサンプルデータの結果パターンをもとに,母集団がどうなっているのかを推測するのが,推測統計です。さらに,その中でも特に,2群の平均値差や,要因の効果を調べるために用いられるある種の手法を,まとめて仮説的統計検定と呼ぶのです。
母集団のなかみ
ちなみに,母集団って概念はとっても抽象的です。母集団として仮定する対象は,実際に実在する物体(たとえば,世界中のヒト)に限りません。
たとえば,同じ人が右手で反応したときと,左手で反応したときの反応時間を比較する際には,大雑把に言うと「ヒトが右手で反応するときのデータ」や,「ヒトが左手で反応するときのデータ」が母集団として仮定できます。また,母集団には,現在だけでなく,過去や未来のヒトも含まれるかもしれません。
もっとややこしいことに,統計的仮説検定では,各水準のデータの背後に共通のひとつの母集団を仮定します(帰無仮説で設定する母集団です)。こうなってくると,もう現実世界との対応は,とても取りにくくなってしまいます。
このように母集団は,実際に存在するものと必ずしも対応しなくてもいいため,あまり厳密に考えすぎずに,「神様がいて,そこからデータを取り出してくるおっきな袋」くらいに捉えておけば良いでしょう。