2014-03-11

アンケート回答への動線

統計学つぶやき

図書館で見つけた、デザイン的に敷居が低そうな本

らくらく図解アンケート分析教室

作者: 菅民郎
出版社/メーカー: オーム社
発売日: 2007/09
メディア: 単行本
クリック: 15回
この商品を含むブログを見る

本の構成は

回答の取り方と回答データのタイプ
単純集計
クロス集計
相関係数
CSグラフと改善度指数
多変量解析
標本設計と統計的推定・検定
医療品評価分析
化粧品顧客満足度分析
消費者セグメンテーション分析

1〜5が基礎編、6〜7が解析手法編、8〜10が実践編です。

アンケートの作り方ということを期待して借りてきましたが、内容はご覧の通り統計解析。

期待していたのは

アンケートの作り方
アンケート回答への誘い方
分析例
それを受けてのActionプラン
その後の効果測定

ストーリー仕立ての内容。

確かにチェーン店想定で、上記はそれなりに書いてあります。

ただ、アンケート回答への誘い方が書いてなかった。

アンケート回答への誘い方を求めるとは

アンケート回収ができていないか
アンケート回収を本気でやってない

わけなので、そこは自分でなんとかしようよって事なんでしょう。

しかも、アンケートを回収できないという原因分析もしないと、次のActionも決まらんという、そもそも進めない状況になる。

ここでは、オンラインショップでのアンケートのやり方を

帰りの電車で考えてみよう！

という企画にしました。

アンケートの設置場所

ざっくり下記のようなタイミングが考えられます。

ショップサイトの訪問時
商品をカードに入れた時
商品をお気に入りに入れた時
商品購入を決定した時
商品が届いた時
商品を使った時
リピートして来た時
リピートを辞めたとき

その他、どっかと提携して収集した個人情報を利用してのアンケート依頼。

これは、さすがにモノで釣らないとやってもらえない。

自分がやらないので、それはわかります。

資金ショートなショップは、上記1〜8で回答してもらうように頑張るしかないでしょう。

私の場合、会社の展示会でアンケートをお願いする仕事もしてましたが、モノで釣るのが1番回答率が良いですね。

但し、有効な回答かというと、まともに回答してる人は1%未満。

有効回答のうち受注に繋がるのも100%ではないですが、目的が受注なら人脈の幅を増やしていくというアプローチに切り替えて、チャンスをモノにする事ができますね。

話が逸れましたが、

要するにアンケート回収が大変

ということです。

より確実により正確な回収をしたければ、母数稼ぎではなく、導線として最適なところに絞りたい。

確実なところは、4〜7だろう。

これは、購入を決めたわけだから、その人がなんで選んだかを正確に教えてもらえそう。

それ聞いてどうするか？

リピーターになってもらう

オンラインショップってのは

全国どこからでも買いに来れる

というメリットがあるので、立地とかあんまり関係ない。

要は、自分のショップで購入してくれたという理由を、更にその人向けに「あなただから」という特別な感動を得られるようにするとリピートに繋がると思われる。

マーケティング用語的には、レコメンド。

ただ、Amazonとかみたいに機械学習では

おもてなし感がまったく無い

顧客数が少ない場合は、そういう地道なおもてなしが重要なんだろう。

あくまで、アンケート回答へのお礼の品物すら出せない場合。

母数がないので、傾向分析は諦めないといけないが、リピーターが口コミして、更にリピーターが増えてくれば、母体は指数関数的な増加になるだろう。

なぜなら、

オンラインショップで購入する人

＝ネット環境に慣れてる

＝ソーシャルネットでの活動が期待できる人

だから。

買った商品の感想やショップの対応について何かしらの感情が生まれ、誰かに話したくなるはずだ。

ゆえに、まずはリピーターのためのアンケート設置を考えていこう。

分析は母数揃う環境になってからだ！

2014-03-10

久々のプログラミング

3月に入ってから寒い日が続いてますが、皆様お元気でしょうか？

そもそも読者いないんで、

この書き出しはおかしいんですが、使ってみたかった。

まあ、寒いので、休日も引きこもり隊気持ちがより一層強くなりました。

引きこもりついでに、奥さんのショップのお手伝いを兼ねて、4月の増税に向けた商品価格の変更を始めてます。

奥さんの地道な頑張りにより、

商品点数が意外に多い。

これを地道に一つ一つ更新するという手もあるわけですが、

そもそも5年くらいかけて

ラインナップしてきたので、そう簡単に更新できるわけがないと。

また、商品管理画面は、慣れないと結構手間がかかります。

慣れてきても、ページの見栄えとかを考えると、全くの新規登録の場合は軽く1〜2時間かかってしまいます。

今回は金額変更だけ、、、のはずなんですが、

商品説明の部分にも金額が書いてある

ので、結構面倒です。

どれくらい面倒かというと、

管理画面操作に慣れてる奥さんがやった場合で、1商品30分〜1時間。

更新ついでに画像とか説明も見直してたので、そこそこ時間がかかってました。

私がやると、もう少し遅いか、、、

開き直って、金額だけ変更

という作業にしてしまうかも。

まあ、これでは間に合いそうに無いし、相談してみました。

「商品金額が変更できるまで、期間不定の特別キャンペーン」ってことにしてはどうかと。

相談というよりは時間稼ぎなので、

「そんなことしたら、また更新しなくなるでしょ？！」

と言われ、更に

「そんな事考えてる間に一つでも多くの商品を更新すべき」と、ごもっともな話があり、まずは3月中にやり切ることになりました。

大方針

外税方式に変更
商品説明ページに直接書いた金額も、外税価格で更新する
フードはブランド毎に優先順位をつけて、売れてないものは一旦外す
商品の更新は、全て流用して新規登録、陳列開始を4/1の時限設定

1.外税

ショップ管理画面を私も時々見てるので、何ができるとか、それはどの辺のメニューにあるとか大分わかってきてます。

この管理画面もなかなか機能が豊富で、今日からショップを開設と決めても、商品をアップできるまでにいろいろ設定する必要があって、簡単設定でも1週間くらいかかるのではないかって量。

このメニューに慣れているおかげで、税率変更ができることを知ってました。

更に、ショップ運営会社からも、内税導入してるショップ向けに金額一括変更支援ツールみたいなのが提供されてました。

ツールは、単なるCSVファイルで、現在金額の横に新価格を入力してアップロードするものでしたが、うちのショップは、バリエーションをまとめて商品をアップしているので、そのツールの恩恵は受けられず。

2015年10月も増税だし、外税にしておいた方がメンテは楽そうだ

ということで、外税方式に決めました。

楽天みたいにバリエーション毎に1商品という変更も考えましたが、メーカーページに合わせて、バリエーション込みで1商品という現在の方式のままにしました。

手間はかかりますが、ちゃんと商品の説明を書くことで、商品知識も頭に入りますから、そちらを貫くことにしました。

話が飛んでしまったが、、、

価格表示は外税設定にすることにしました。

2.ここからプログラミング

といっても、EXCELのマクロ、VBAというやつです。

プログラミングなんて、まともにやったの久しぶりだったんで、なかなかバグがとれなかったです。

3.仕様

というか、ゴール

ショップ側からダウンロードしたCSVを読み、EXCELの指定セルに書き出す。
そのEXCELで、税率と当店独自の割引率で決めた金額が自動計算される。
商品説明にHTMLで記載した価格表も自動で更新される
ショップに一括登録できるCSVを出力する

とりあえず、1、2、4は土日で出来上がった、、、と思ったが

改行コードを含むフィールドがあると、

そこで1行と認識してしまうバグが就寝間近で発覚。

ググったら解決策はありそうなので、また週末対応しなきゃならない。

というわけで

写真は、、あんまり関係ないけど、自宅でHadoopでも作ってみようかと思ってubuntuいれただけのサーバ。

こいつもなんとかしたいんだけど、3月は無理ですね。OSもCentOSにしてみたりとか、そもそもSSDくらいは入れて多少ストレスなくしたいわけですが、まずは売上5倍くらいにしてからですね。

その時は、サーバー能力も5倍くらいにしたいですが、新しいの買えますね。

2014-01-19

今日は固い感じの「ビッグデータと統計科学の実践的利活用事例」

統計学ビッグデータセミナー報告

f:id:inf12ty:20140118231611j:plain

本日は、まじめにセミナー行ってきました。

しかも、有料です！(もちろん、自腹)

日本では、「技術士」という資格がありますが、私は持ってません。

今日は、技術士の方々が集う社団法人「日本技術士会」が開催した「１月度技術士CPD中央講座」ってのに行ってきました。

このイベントを知ったきっかけは、講師の一人であるUSP研究所からのメールでした。

通常スルーするところなんですが、USP研究所の人の話はどこかで聞きたいと思ってましたし、東京農工大の石井教授という人が「医療、農業、環境分野におけるビッグデータ分析」というタイトルだったので、青山ツインビル西館に行ってきました。

イベント案内ページは、こちらです。

1月度技術士CPD中央講座（第119回）｜公益社団法人日本技術士会

◆「医療、農業、環境分野におけるビッグデータ分析」
石井　一夫　氏（東京農工大学　特任教授（ゲノム科学）、技術士（生物工学部門）、博士（医学））

資料は、公開されてませんね。紙では配布されました。

この話は、今後勉強を進めようと思っている分野なので、導入編としては十分満足でした。もちろんDNAの配列の話はちんぷんかんぷんでしたが、種の系統をDNAの画像処理で昔とは比べ物にならないほど早く作ることができるようになってました。

ただし、使っているPCはそれなりでしたね。ランニングコストも数百万/Hour、DNA検査試薬も数十万/回とか、検査に失敗すると１千万弱のお金が無駄になるみたいな世界でした。

DNAを正しく識別する装置としては、その専門性、正確性が必要なので、しょうがないですね。ただ配列データになってしまえば、統計科学の世界になりますから、Hadoop(オンプレ)やAWSで投入できる予算に応じたデータ分析を行うことができる状況になっているので、石井教授以外のお３方は、研究者さんに活用してもらうように事例紹介という立場で発表されてました。

重要なのは、「一度集めてしまえば」というところです。

集め方は、専門の装置を使って、パターン認識させるとかで、できるだけ「生データ」を長期間貯めることさえしてしまえば、

分析手段はECOな方法がいくつもあるという時代なんですよ！

さて、イルミナ社の話です。

ここでは、「次世代シーケンサ」という装置を提供しているところのようです。これですかね・・・縁がなさそうですが・・・

システム – 次世代シーケンサー MiSeq – イルミナ株式会社

とにかく、この装置でDNAを画像処理して、テキストデータに変換させます。(→DNA塩基配列というらしい)

テキストデータになってしまえば、
一般家庭でよく転がっているPCで、解析できてしまいます。

「うちには転がってるPCなんて無いよ」って人は、後述のAWSの時間貸しで解析を楽しみましょう。

もう少し簡単にまとめると、

画像処理　⇒　DNA塩基配列取得
CASAVA
DNA塩基配列を連結、整列、編集
Velvet、SQAPdenovo、Trinity、など
Bowtie、BWA、など
統計処理、視覚化、データマイニング
S-PLUS/R

解析事例－Ⅰ
次世代シーケンサーデータの品質管理

こんな問題があるようです。

サンプル濃度の間違い
試薬濃度の間違い
操作の荒さ
電圧の不適
データ転送のコマ落ち

そもそもDNAってのは、数億の塩基断片を配列にしてるわけですが、、、(いや、私は全く知りませんので、興味がある人は自動的にできるリンクをクリックしてください)、次世代シーケンサーデータのクオリティが40段階に分類されるんだそうです。

このクオリティにばらつきがあると、せっかく処理した塩基配列の信頼性にかけてしまいますよね。

かといって、全部のデータを全てチェックするってのも無理がありますから、100等分したところから1,000個ずつリードする方法(モンテカルロ法)でサンプル抽出して、クオリティデータを作るそうです。

このサンプル抽出で、全体のデータクオリティが推定できることになります。

1,000個の選択には、Rの乱数を使って「無作為」にやっていましたね。

解析事例－Ⅱ
進化系統樹の最適化

(あとで書きます。ごめんなさい。)

解析事例－Ⅲ

学会発表前ということで、資料はあんまりありませんでしたが、

現代の５大疾患の一つである「精神疾患患者」の診断方法を客観的に、というかかなりの精度で行うことが可能になりそうだという発表になります。

発生率は、今やガンの２倍以上です。(診断が結構グレーですけどね・・・)

これもゲノム分析の応用で、DNAを統計的有意検定で「感度」と「特異度」という分類をすると、健常者と精神疾患患者を明確に分類できてしまうというものです。

資料や論文は近日公開らしいですが、これは今後のメンタル医療分野が大きく変化しそうな話だと思いました。楽しみです。

一旦、今日はここまで。

2014-01-11

書いてないな、気がつけば1ヶ月

つぶやき

というわけで、明けましておめでとうございます。

なんだか、あっという間の年明け一週間でした。

年末にかけては、それなりに帰りも遅く、少し残ってしまったのもあり、1/4に1度出勤して対応しました。

個人的に集中してやりたい事もあったため、家族の了解の元休日に職場に。

しかし、空調が効かないので、外より寒いんじゃないかくらいの部屋でしたよ。

人がいないせいもあったけど。

一応目的は果たせたので、

なかなかいいスタートになりそうだと思いきや、毎日未明帯の就寝。

こんな状態はしばらくなかったんだけど、

10年くらい前のISO監査とかを思い出す。

集中したい時に、ガンガン割り込みが入る。

未だにうまく振る舞えないのは、何かが不足してるんだろう。

冷静に考えれば、それ俺が今やらなきゃいけないの？って切り返せるはず。

こんな言葉を発すれば、

お互い冷静にならないかな？

まあ、ひとまず自分が落ち着けばいいんだが。

2013-12-10

先週末からダメテンション

SE定義つぶやき

先週のまとめもできず、

朝の読書も手が付かず、

寝てる時間以外は、仕事の事を考える日々

あんまり手を抜いたつもりもなかったのだが、昔の悪い癖が出てたようです。

私の脳は、右脳と左脳が半分ずつあるようで、、、

つまり、

論理的な話じゃないと理解しない

反面、

自分で話したり、書いたりする内容は、論理的でない。

インプットは左脳が、アウトプットは右脳という結構酷い状態。

自分の中ではもちろん論理が組み立てられてるが、アウトプットがその頭の中のイメージ前提になるので、みんなが理解できない。

実は、この手の人間は結構いるはずで、

同じ思考の人間と仕事することもありそうだ。

過去にそういう体験もしてるはずだ。

口癖は、「どうしてわかってくれないかなぁ」

いや、わかるわけないんだよね。

イメージは伝えてる方の頭にしか無いんだから。

私が、悪い癖が出たと思ったのは、

精神的に、特に時間的プレッシャーがかかった時です。

時間との戦いを強いられるため、

記憶の中でどんどん順不同でアウトプットしていきます。

後で見直せばいいんですが、もう遅いです。終電です。

という感じで、やった気になってしまう事ですね。

若い頃は、この特性を分析することもしませんしたから、自分がダメなんだ、こんな仕事もこなせないんだとかネガティブになり、行き着く先は逃避。

つまり、出社拒否ですよ。

逃げても仕事が進むわけでもないんですが、それしか思い当たらなかったですね。

で、今も同じストレスを抱えるわけですが、ネガティブはダメだと呪文をとく事で、まずは踏ん張る。

まあ、年齢的にもへこたれてる場合じゃないし、仕事も進まないんでね、とにかく順番にこなしていきます。

一旦、緊急タスクをやります。

それ以外を中身も気にせず、誰かにキラーパスです。

パスしたボールは最終的に受け取るかもしれませんが、そのままゴールしてくれるかもしれません。でも私の仕事は1人でやってるわけではないので、ギブアンドテイクです。

もちろん、こちらも余裕ができたら、全力でアシストなり、バスを受ける側、はたまた司令塔に戻れば、いいのです。

立て直しができるという事ですね。

とはいえ、

論理的でないアウトプットが出るバグは治したいですね。

ストレスかかった時にも、慌てないという日々の練習の積み重ねでしょうね。

短気なのも、原因の一つ。

今日から変化するわけではないですが、

焦ってるなあ

と思ったら、こんな風にブログ書いてみます。