猫好きな老体気味SEの備忘録

タイトル通り、不定期更新、基本猫の話題は奥さんのブログに他力本願

Analytics 2014 レポート その4

いよいよ、有名な統計家の登場です。
前にこの人の公演を聞く予定でしたが、体調が悪くきけなかったんです。

今回は、SASからのオーダーで、サッカーネタに分析手法を話してくれってことで、データ的には古いですが、2011年ベストイレブンを自分なりにセレクトして、実際どうかという検証してらっしゃいました。


本はだしたが、全く売れなかった。

サッカー分析

たぶんこちらかと思われます。

データ分析は、下記の必読書からは逸脱しない。


データ分析者の必読者

Research Design: Qualitative, Quantitative, and Mixed Methods Approaches

Research Design: Qualitative, Quantitative, and Mixed Methods Approaches

知識とはなんぞや?というところから書かれてるので、分野問わずに、定量的な分析と定性的な分析をmixさせる。

xxとはなんぞやをちゃんと叩き込まれてることが重要

例えば、研究とは何かを正しく叩き込まれてれば、、、STAP細胞のようなことは起きないはず。

仮説思考の限界①

検証する前に立てた仮説が採用されないことが良くある
データマイニングは、予測だけになっていた。

大事なのは洞察だ!

人間の頭を使って、検証する必要がある。

仮説ではなく、「問い」を!

  • 1番嬉しい状態をどうやったらできる?

解析単位のアウトカム

具体的に「望ましさ」を定義する!
解析単位は、比べる単位
説明変数は、左右しうる特徴

結局これは、どんな分析でも使えることを示してる。

この先は、本題のサッカーで勝てるチームを、、、

後で、資料見ながら補足します。
当日は、結構早回しだったのと、私自身がサッカー選手の名前だけでは着いていけなかったというのが、この中途半端さに至ってます。

あとがき

結果的に2011年のベストイレブンとほぼ同じ結果が導けたそうです。
見る人が見ると、おお、人気、実力共に選ばれしものだったかという納得感があったんでしょう。

ポイントは、アウトカム、つまり望ましさをちゃんと定義し、比べる単位とその値が変化するものをきめるということなんでしょう。
サッカーに限らずですね。