猫好きな老体気味SEの備忘録

タイトル通り、不定期更新、基本猫の話題は奥さんのブログに他力本願

毎日大変だけど、徐々に

http://instagram.com/p/QgfuH_tZsp/


ようやく因子分析に戻ってきたんですが、
この辺から本格的に数学の知識が必要になってきますね。
用語だけでも、行列・転置行列、最小二乗法、重回帰分析(SMC法)、決定係数、2因子直行モデル

どっから話せば良いのやら

読んでる本の例だと、都道府県別の人口、旅券発行数、婚姻率という3つの変量を出してました。
この3変量の共通因子、因子負荷量、独自因子に分解して考えるアプローチをとります。

まず、3変量の標準化

3変量はお互い違うスケールのデータなので、標準化します。
標準化については、先日の記事参照。

次に分散共分散

標準化された値では、分散が1になるので、共分散がそのまま相関係数になります。

計算過程の説明は、週末対応として、
結果はこうなります。
もちろん、元の都道府県別の表の値が必要ですが、、、
ある都道府県の
  • 人口 = 0.875 × 共通因子 + 独自因子x
  • 旅券 = 0.864 × 共通因子 + 独自因子y
  • 婚姻 = 0.879 × 共通因子 + 独自因子z
という式に導けるはずです。

結果的に共通因子がかなり影響してます!

(≧∇≦)
0.875とか結構1に近い数字ですよね。
また、3つの式を見ても、共通因子の値が何であれ、3篇量がほぼ同じような値になりそうじゃないですか?
もちろん、標準化された値としてですけどね。

残った独自因子x、y.zは結構小さい値になりそうですね。

後は主観的に

共通因子に名前を付けると、古典的な因子分析としては終了です。これは探索的因子分析という名前がついてました。
ちなみに本では地域活性度とか書いてありました。さすが、本を書いてる人だけの事はありますね。納得してしまう名前です。

主観でものを判断する私に向いてるなぁ

感心している場合ではなく、更に進めないと。
最初から共通因子があると仮定して分析を進める確認的因子分析でないと、自己満足な分析になってしまいますね。
しかも、こんな綺麗に共通因子が見えるわけもなく、分析しやすい統計データを選べるばあいだけてすね。


つまり、

確認的因子分析に話を進めます。
なかなかこれが面白い。