超簡単・心理統計の基礎1 記述統計量
1.記述統計量
平均値 (Mean or Average) = (データを全部足したもの)÷サンプル数
分散 (Variance) = {(データ−平均値)^2を全部出したもの}÷サンプル数
標準偏差 (Standard deviation) = 分散の平方根 (√分散)
他にもたくさんありますが,これらが代表的な記述統計量です。統計には記述〜とm推測〜があります。記述統計量というのは,データ全体の性質を表すものであり,推測を含まない統計量を言います。
「推測を含まないってなによ!」と思われる方は,「母集団とサンプリング」を参照してください。
平均値はお馴染なので良いでしょう。分散と標準偏差は,二乗と平方根の関係であるため,意味としては同じです。つまり,両方とも,データのばらつきを表す値です。ただし,分散は計算の途中で二乗をしているため,元々のデータの単位と異なってしまいます。このままでは分かりにくい(たとえば平均値との比較ができない)ため,分散のルートを取ることによって,元々のデータと同じ単位に戻します。これが標準偏差です。
通常,データの性質を表す際には平均値と標準偏差を用います。
何故、平均値だけではダメなのかというと,たとえば以下のような場合,
A:【5, 5, 5, 6, 6, 6】mean = 5.5, SD =0.55
B:【1, 1, 1, 1, 1, 28】mean = 5.5, SD =11.02
平均値は同じでもデータの中身は大違いです。しかし,標準偏差(SD)が記述されていればデータのばらつき度合いが分かるため,データ全体の性質がある程度推測できます。
変なことをせずに,t検定や分散分析を行う限りは,記述統計量はこの3つのみを理解していれば十分です。受験生はちゃんと他の値も勉強しましょうね。
【NEXT 超簡単・心理統計の基礎】
psychology-ganbaru.hatenablog.com
初稿:2009年02月18日
改訂:2017年06月03日