平均値データの読み取り方

  • LINEで送る

先日、とあるデータをいただいた。

まずはこのデータをご覧ください。
2010_10_09_001.jpg
さて、この表を見て
「おーなるほど、やはり欧米人が日本でカネを落としてるなぁ。」
「彼らをこれからターゲットにしないとなぁ」
とか思います?
このデータの解析方法の詳細はわかりませんが、表を読み取ると
おそらく標本数の人数から金額を聞きだして算出したということかと
推測できます。
本来はこれらの平均値の差は、t検定という手法で
これらの平均値の差に意味があるのかどうかを探ることができます。
「差がある」と判断されれば、各市場に特徴があり、異なるマーケティング手法が
必要になるという判断をすることができます。
その辺はある程度つかんではおりますが…。
この手のデータ(平均値)を見るとき、まず考えてほしいのは
平均値だけで物事を判断してはいけないことです。
【ポイントその1 標準偏差を意識する】
平均をとるときに重要なのは、「標準偏差」という数値が
裏に隠れていることです。
たとえば、5人のテストの点数が
 1組 48 49 50 51 52
 2組 30 40 50 60 70
という2グループの平均点はいずれも 50点ですね。
しかし標準偏差が異なります。
標準偏差とは「数値のバラツキ具合」です。
 1組の標準偏差は1.41
 2組の標準偏差は14.14 です。 数字がでかければバラツイているわけ。
標準偏差を2倍した数の前後の数値に全体の数値の
95%が存在します。
2組の場合ですと
14.14×2=28.28  平均50±28.28= 21.72~78.28
この95%の数値のバラツキ度を見ると、1組と2組で特徴が
異なることがわかります。
今回のデータを見た場合、標準偏差が不明です。
となると、国別の標準偏差を持ってきて想像するしかありません。
国別の標準偏差とはなにか?それはジニ係数です。
ジニ係数は、所得格差をあらわす指数です。
係数そのものを標準偏差として使うことはできませんが
係数の値を確認して、皆が平均値に近いカネを使っているのか
それとも人によってバラつきがあるのか?を推測できます。
ちなみに日韓中ではジニ係数がもっとも低いのが韓国。
韓国の平均値は僕も結構納得できていますが、上位国は
かえってバラつきが高いと推測しています。
【ポイント2 分母・分子を見極める】
で。今回のデータのように平均値しかない数値を見た場合は、
自分なりに仮説を立てて読み取らなければなりません。
2010_10_09_002.jpg
今回の調査対象については、来日観光客数と人口という大きな母数を
知ることができます。そこから傾向を読み取ることしかないわけです。
想像に難くないですが、表の上の国の方々はさほど来日していない。
となると考えられるのは
「一部の金持ちだけが来ている」
「めったに来ないので、たくさん金を使った」
ということです。
単価で13位~15位になっている3地域は、来日数ではトップレベルの地域です。
つまり、国別の単価を出すことは非常に重要ですが、「順位に意味がない」ことが
想像できると思います。
政府や自治体が出す、この手の単価データで見落としてはいけないことは
「延べ人数」でしかないことです。グロスデータってことですね。
来日者数が多い地域に関しては「リピートする顧客」というネットを
見逃さないようにしなければなりません。
  • LINEで送る

コメントを残す

*