猫好きな老体気味SEの備忘録

タイトル通り、不定期更新、基本猫の話題は奥さんのブログに他力本願

Analytics 2014 レポート その4

いよいよ、有名な統計家の登場です。
前にこの人の公演を聞く予定でしたが、体調が悪くきけなかったんです。

今回は、SASからのオーダーで、サッカーネタに分析手法を話してくれってことで、データ的には古いですが、2011年ベストイレブンを自分なりにセレクトして、実際どうかという検証してらっしゃいました。


本はだしたが、全く売れなかった。

サッカー分析

たぶんこちらかと思われます。

データ分析は、下記の必読書からは逸脱しない。


データ分析者の必読者

Research Design: Qualitative, Quantitative, and Mixed Methods Approaches

Research Design: Qualitative, Quantitative, and Mixed Methods Approaches

知識とはなんぞや?というところから書かれてるので、分野問わずに、定量的な分析と定性的な分析をmixさせる。

xxとはなんぞやをちゃんと叩き込まれてることが重要

例えば、研究とは何かを正しく叩き込まれてれば、、、STAP細胞のようなことは起きないはず。

仮説思考の限界①

検証する前に立てた仮説が採用されないことが良くある
データマイニングは、予測だけになっていた。

大事なのは洞察だ!

人間の頭を使って、検証する必要がある。

仮説ではなく、「問い」を!

  • 1番嬉しい状態をどうやったらできる?

解析単位のアウトカム

具体的に「望ましさ」を定義する!
解析単位は、比べる単位
説明変数は、左右しうる特徴

結局これは、どんな分析でも使えることを示してる。

この先は、本題のサッカーで勝てるチームを、、、

後で、資料見ながら補足します。
当日は、結構早回しだったのと、私自身がサッカー選手の名前だけでは着いていけなかったというのが、この中途半端さに至ってます。

あとがき

結果的に2011年のベストイレブンとほぼ同じ結果が導けたそうです。
見る人が見ると、おお、人気、実力共に選ばれしものだったかという納得感があったんでしょう。

ポイントは、アウトカム、つまり望ましさをちゃんと定義し、比べる単位とその値が変化するものをきめるということなんでしょう。
サッカーに限らずですね。

Analytics 2014 レポートその3

午後のセッション2つ目のセッションは、情報システム部門の方です。


前回の記事と違って、この方がどれほどのメンバーでどんなレベルで分析してるかわかりませんでした。

資料は、かなり非公開らしく、報道関係者含めて撮影禁止!

Analytics 2014 レポートその2 - 猫好きな老体気味SEの備忘録


というわけて、これはちゃんと聞かないといけないな、とはいえ寝落ちリスクも高い時間、、、頑張りましょう。


情報資産をビジネスに生かすための取り組み


株式会社NTTドコモ
白川 貴久子 氏

情報システム部の情報戦略担当
関西でマーケティングの戦略とか、営業やってた
IT知識がない、、、おそらく統計手法やマーケティング手法には長けてて、プログラムを書けないというお話なんだと思います。話っぷりからEXCELで統計解析程度はご自身で対応できそうな、、、

docomoには、モバイル空間統計という研究成果がある!
ビジネスサイドにいた白川さんがデータを活かす目的を明確にしやすいはず

データマイニングは少しかじった
→無理に使うほどでは無かった。
Excelで処理できる程度

今は処理速度が格段に進化

その価値を知りビジネスに生かそうとする企業全体の風土

ドコモの分析組織とは

情報戦略担当は2003年4月に発足
情報資産を活かすための組織
  • 分析チーム
  • データ抽出チーム
  • セキュリティチーム、顧客データ

システム担当

  • データ構造知識
  • システム活用スキル

ビジネス部門

この2部門と連携

提供後に手戻り

本当に欲しいものだったのか?
ビジネス部門のバックボーンなしに作業
データ項目、データ定義など、何に活かすかを伝えないから。

解約でもいろいろ種類があるので、
分析したいことが伝わらないという問題
→縦組織でよくある話

ヒアリング手法

NGワード「とりあえず」
更に実作業はプロパーから言われるSEなので、言われたことを予想しながら、疑問も出せないままやって失敗

5年経過後、今は手戻り少なくできている

分析請負ではなく、データ活用のパートナー

期待以上のアウトプットが鍵

社内活用のための組織

電話での対応から、Q&Aボードへ
電話は1人しか対応できない。

名前をデータ分析お助けコーナーに変更

2年前の問い合わせが未回答だったので、活用されなかった。とりあえず、すぐに回答するようにプロセス改善
初動を迅速に!
  • 事例発信
  • 1人の悩みは全員で共有

分析力を高める取り組み

  • 分析事例発表会→4Q毎に地域持ち回り
  • 分析設計演習・マーケティングレクチャー
4年継続して、大分意味をなしてきた。
支社発信の内容が全国展開された事例にまで発展
地域の営業を巻き込むことで、化学反応が起こってきた。
繋ぎ役として、継続した。

回を重ねると、発表会だけでは飽きる

マーケティングマインドをもって

分析設計ができる演習を開催
  1. 戦略編
  2. 戦術編
  3. 実践編
ディスカッションさせる
自分がどういうことに偏りがちなのか?を気づかせる
演習させると、出来なくて、
フィードバックで、セオリーを語る
マーケティングセオリーなので、フィードバックの内容は理解できる。

変化を浮き彫りにする工夫

基準、区分、スパンの見方
先を見る
データが膨大だと見落とすので、何が見つけたいのかをちゃんと定義する

なんでそれが必要だったの?

とかの振り返りで迷いが出ないように。

データでわからないこと

  • 現場のリアリティを知ること
  • 声に耳を傾ける
  • 素直に観察する
  • 現場の感も大事にする
  • 声にならない気持ちを洞察→なりきって考え抜く

"なりきって考え抜く"

これを継続していく

「解約予兆モデル」

99年にやっていてなかなか良かった。
ただ、5ヶ月待たないと予兆が示せなかった。
3ヶ月だと解約予兆がない人も含まれる、という問題があった。

目的は喜んでもらうための分析だということ

施策の響き具合は、すぐに変わっていく

なので、モデルの精度が良くても施策が良ければ、そっちが採用される

故にライトに施策を実行し、繰り返し改善していくのだ!


あとがき

過去の事例でしだか、docomoさんも凄いマーケッティングの勉強をされてて、縦組織の壁も徐々に崩して行ってるのかも?と思わせるような発表でした。

途中でお話があったように、利用者が喜ぶという目的で、組織間の潤滑油としての活動内容をこれからも公開していって欲しいです。

SIerは、この視点が不足してますからね。技術屋全般かもしれないです。

f:id:inf12ty:20140412174305j:plain

Analytics 2014 レポートその2

昨日アップした基調講演に続き、各セッションのレポートです。

前回のレポートAnalytics 2014 レポートその1 - 猫好きな老体気味SEの備忘録

アクセンチュアという頭脳集団企業の人からの有難いお言葉でした。

率直な感想としては、数学での博士号やOSSのコミッターがいたところで、市場に訴求するまでの結果は出せない。

僕らみたいに各方面の専門家がチームを組んだら凄いんだよって話に聞こえた。

すごそうだけど、タイトルで受講した大半の人が期待していたであろう内容にはなってなかったのが残念でした。

有名コンサルファームの中で、IT業界にこれだけ名前が出てくるのはアクセンチュア以外居ない。IBMも手広いが、そもそもIT業界ですからね。

テーマ的には、マッキンゼーも顔出しそうだけど、あそこはこの手のセミナーには顔出したの見たことないからなぁ。


前置きはこれくらいで、レポートにいきます。

例によって、メモですが。


分析結果最適化プロジェクト成功の要諦とディシジョンサイエンスを支える人材の育成方法

アクセンチュア株式会社
工藤 卓哉 氏


どうしたら新たなプロジェクト・サービスを持続的に生み出せるか?
新たなアイデアを得る方法

今まではプロダクトアウト

マトリクスで、アナリティクスの進化過程と観点を示してました。
横軸
  • 古典的手法
  • リードユーザ型
  • ユーザ創造型
  • Analytics型、Deep Learnlng
縦軸

アナリティクス活用事例

データかけるアルゴリズムかける適用サービスイコール最適化
新規事業創造

試行速度の速さ

生鮮食品の需要予測は難しい
データに応じたアルゴリズムの最適化

アクセンチュアのサービス

PoC、センサーM2M、レコメンド
センサーログの解析の速さには自信がある。東京の人がメイン!

クロスプラットフォーム分析

例えば、ドコモのモバイル空間統計
アクセンチュアもデータ持ってる
  • 銀行とPOSデータから分析

銀行預金残高が高ければ、優良顧客とは限らない、とか。
私生活は、質素だったりすることが空間情報で見えてくる。プロファイリング。
なぜなら、外食が少ないとか、POSと結びつければスーパー利用頻度、利用額もわかってしまう。

脳波を分析して、

生産性の高い人と低い人を区分ける、みたいなこともやってる。
これを応用して、購買意欲を探ることもできるわけだ。。。理論的には!

相対性理論

数学だけやっててもダメ
ビジネスドメインに沿った仮説が立てられるか

データか仮説立案か?
経営の課題解決が目的なので、仮説が重要だ!

概念化と探索的

試行速度が早く、サイクルをたくさん回す
統計学者のJohn.W.Tukey
ClouderaのJeff Hammerbacher

なぜなら、統計は事実なので、自分の理論がいつか成立しなくなることがわかっていたから。

成功の要諦

アプローチ
発射台と標的設定
いろんな部門と協力して、現場把握と経営目標を設定する
部門のメンバ構成も試行

クロスインダストリーを成功させるためには、

経営幹部の協力が不可欠

無理に機械学習使ったりしないように!
最適なデータサイエンスモデルを使えること

在庫・補充管理の最適化をフルオートでできるようにした。

こ、、これは凄い!
小売業が1番頭を悩ますノウハウの塊かと思ってたことが、フルオートで実現してるわけですよ。

あとがき

詳しいことは、アクセンチュアの人に聞かないとわかりませんが、Oracleチューニングのような超人しか設定出来ないパラメータと機械学習が慣れる期間が必要なんだろうと思いました。
つまり、初期導入500万〜、年間保守100万〜、小売規模に比例みたいな費用体系が見えたような、、、

て、肝心の人材育成方法は?

以上になります。その3に続く。

Analytics 2014 レポートその1

昨年から、できるだげ計画して情報収集を兼ねてセミナー参加してますが、

メモが取れるスペースがあまりないので、スマホでざっとポイントを書いてしまうのが良いですね。


完全にメモのレベルです。

基調講演/特別講演|Analytics 2014 SAS FORUM JAPAN基調講演

オープニングノート
SAS Institute Inc. 副社長 北アジア地域統括 兼 SAS Institute Japan株式会社 代表取締役社長
吉田さんの講演

ビッグデータ・エコノミクス
2005 0.13ZB
2020 40ZB

世界中の砂浜の砂の数が1ゼタバイトらしい。

Open Data政府が公開
アメリカ、メキシコ、イギリスなど
日本も経産省が予算化

個人が持ってるデータ→My Data
政府、民間、個人のデータを一元管理の方向

機械が吐き出すデータ
これにより機械同士が会話している

ウェラブルデバイスの増加

2020年までにGlobal 1000企業の売り上げの5%になる予想

データ保全に金かかる

使えるデータは23%程度、タグ付けされて使える状態のデータは5%

3Vの加速

第4のVはValue

最適化による生産性のデータは向上
  • UPSの例
  • トラックに分析用のセンサーを導入
  • 運転状況、ドライバーの癖も分析して事故防止
  • 2011年の段階でやってる
  • ガソリン費を大幅に削減
予測に基づくプロアクティブな活動
  • 国連グローバルパルスの例
  • 先行指標;失業率が出た頃には、既に遅い
  • なので、過去のデータを活用して、失業率のピークが来る前の予兆を検知
イノベーティブなサービスの創出
  • WEVEの例
  • モバイル機器のネットワーク切断、冊族のタイミングを調べて、
  • 場所が変わったタイミングであることがわかったら、そのタイミングで最適な情報提供を行う

今まで出来なかったことが可能に!

Analyticsだ!


◾️アナリティクスの進化
  1. 1.0は、過去に起こったことを分析
  2. 2.0はビッグデータ時代、非構造化データ、データを活かす人材
  3. 3.0は、迅速なインサイトによるビジネスインパクト、アナリティクスを全てのデシジョンポイントで活用

アナリティクス3.0

スキル、リーダシップ、組織構造、テクノロジー、データ管理
何が分析したいかという目的が重要だ!
何に使うか

HIGH performance analytics






特別講演
ビッグデータの活用 ~事業価値創造に向けて~
ボストン コンサルティング グループ シニア・パートナー&マネージング・ディレクター
井上 潤吾 氏

キーワード
  • 専門性
  • 分析力
  • プロセス→自社で持つ
  • ツール→作らなくてもいいが、使えるようにする
  • ITサービス
  • データサービス

中長期では内製(専門性と分析力)

短期的には外部委託して、育成も同時に!

エコシステムの構築、連携

データ活用のネットワークに参加
データ活用のアライアンス

ビッグデータ活用の成功の鍵

成果志向
走りながら考える
スピード重視
競争優位性を確保
パラダイムシフト 相関みつけたらすぐに行動


アンケート回答への動線

図書館で見つけた、デザイン的に敷居が低そうな本

らくらく図解 アンケート分析教室

らくらく図解 アンケート分析教室

本の構成は

  1. 回答の取り方と回答データのタイプ
  2. 単純集計
  3. クロス集計
  4. 相関係数
  5. CSグラフと改善度指数
  6. 多変量解析
  7. 標本設計と統計的推定・検定
  8. 医療品評価分析
  9. 化粧品顧客満足度 分析
  10. 消費者 セグメンテーション分析
1〜5が基礎編、6〜7が解析手法編、8〜10が実践編です。

アンケートの作り方ということを期待して借りてきましたが、内容はご覧の通り統計解析。

期待していたのは

  • アンケートの作り方
  • アンケート回答への誘い方
  • 分析例
  • それを受けてのActionプラン
  • その後の効果測定
ストーリー仕立ての内容。
確かにチェーン店想定で、上記はそれなりに書いてあります。
ただ、アンケート回答への誘い方が書いてなかった。

アンケート回答への誘い方を求めるとは

  • アンケート回収ができていないか
  • アンケート回収を本気でやってない
わけなので、そこは自分でなんとかしようよって事なんでしょう。
しかも、アンケートを回収できないという原因分析もしないと、次のActionも決まらんという、そもそも進めない状況になる。

ここでは、オンラインショップでのアンケートのやり方を

帰りの電車で考えてみよう!

という企画にしました。

アンケートの設置場所

ざっくり下記のようなタイミングが考えられます。
  1. ショップサイトの訪問時
  2. 商品をカードに入れた時
  3. 商品をお気に入りに入れた時
  4. 商品購入を決定した時
  5. 商品が届いた時
  6. 商品を使った時
  7. リピートして来た時
  8. リピートを辞めたとき
その他、どっかと提携して収集した個人情報を利用してのアンケート依頼。
これは、さすがにモノで釣らないとやってもらえない。
自分がやらないので、それはわかります。
資金ショートなショップは、上記1〜8で回答してもらうように頑張るしかないでしょう。

私の場合、会社の展示会でアンケートをお願いする仕事もしてましたが、モノで釣るのが1番回答率が良いですね。
但し、有効な回答かというと、まともに回答してる人は1%未満。
有効回答のうち受注に繋がるのも100%ではないですが、目的が受注なら人脈の幅を増やしていくというアプローチに切り替えて、チャンスをモノにする事ができますね。

話が逸れましたが、
要するにアンケート回収が大変
ということです。
より確実により正確な回収をしたければ、母数稼ぎではなく、導線として最適なところに絞りたい。

確実なところは、4〜7だろう。
これは、購入を決めたわけだから、その人がなんで選んだかを正確に教えてもらえそう。

それ聞いてどうするか?

リピーターになってもらう

オンラインショップってのは
全国どこからでも買いに来れる
というメリットがあるので、立地とかあんまり関係ない。
要は、自分のショップで購入してくれたという理由を、更にその人向けに「あなただから」という特別な感動を得られるようにするとリピートに繋がると思われる。

マーケティング用語的には、レコメンド
ただ、Amazonとかみたいに機械学習では
おもてなし感がまったく無い

顧客数が少ない場合は、そういう地道なおもてなしが重要なんだろう。
あくまで、アンケート回答へのお礼の品物すら出せない場合。

母数がないので、傾向分析は諦めないといけないが、リピーターが口コミして、更にリピーターが増えてくれば、母体は指数関数的な増加になるだろう。

なぜなら、
オンラインショップで購入する人
=ネット環境に慣れてる
=ソーシャルネットでの活動が期待できる人
だから。

買った商品の感想やショップの対応について何かしらの感情が生まれ、誰かに話したくなるはずだ。

ゆえに、まずはリピーターのためのアンケート設置を考えていこう。

分析は母数揃う環境になってからだ!