分散の基本
とか言って、何をテーマにするか。
このブログは、朝通勤中にインプットした統計の知識をどう使うかを私自身の優先順位で、かつ高々朝の通勤時間内で理解した程度の知識を晒すものです。
そのうち皆さんの役に立つかもしれませんし、同じテーマで勉強始めてる方なんかは、これをきっかけに交流できると嬉しいです。
ただ、今のところ、
備忘録
です。
前置きが少々言い訳がましくなってしまいましたね。
タイトルは
分散
でした。;^_^A
とっても簡単なパタンとしては、
職場の人の体重を並べて、偏ってるか見るとかですね。
つまり、一つの項目が測定母体でどんな偏り方、または偏ってないかを見る値です。
計算上は、二乗してしまうので、測定値が大きいと凄く大きな値になってしまいます。そこで平方根を求めます。元の体重データの偏り具合が身近な値になってきました。これを偏差といいます。字ずら通りですね。
分散だけじゃあんまり使う場面がない!
というのが結論です。
偏差はそこそこ使えそうな感じです。
一つの要素で見る場合は偏差でもよさそうですが、複数の要素で関係性を見つけて、
ああだ、こうだ言うのが、
データアナリスト
つまり分析屋という人達なので、
相関
の見つけ方をマスターする必要がありますね。
別の言い方をすると、
多変量解析
というらしいです。
なので、明日の朝の通勤は、多変量解析の導入編あたりですかね。
推定方法の習得までが今週のゴールかな。