アンケート回答への動線
図書館で見つけた、デザイン的に敷居が低そうな本
- 作者: 菅民郎
- 出版社/メーカー: オーム社
- 発売日: 2007/09
- メディア: 単行本
- クリック: 15回
- この商品を含むブログを見る
本の構成は
- 回答の取り方と回答データのタイプ
- 単純集計
- クロス集計
- 相関係数
- CSグラフと改善度指数
- 多変量解析
- 標本設計と統計的推定・検定
- 医療品評価分析
- 化粧品顧客満足度 分析
- 消費者 セグメンテーション分析
期待していたのは
- アンケートの作り方
- アンケート回答への誘い方
- 分析例
- それを受けてのActionプラン
- その後の効果測定
アンケート回答への誘い方を求めるとは
- アンケート回収ができていないか
- アンケート回収を本気でやってない
ここでは、オンラインショップでのアンケートのやり方を
帰りの電車で考えてみよう!
アンケートの設置場所
- ショップサイトの訪問時
- 商品をカードに入れた時
- 商品をお気に入りに入れた時
- 商品購入を決定した時
- 商品が届いた時
- 商品を使った時
- リピートして来た時
- リピートを辞めたとき
リピーターになってもらう
分析は母数揃う環境になってからだ!
久々のプログラミング
そもそも読者いないんで、
奥さんの地道な頑張りにより、
そもそも5年くらいかけて
商品説明の部分にも金額が書いてある
開き直って、金額だけ変更
「そんなことしたら、また更新しなくなるでしょ?!」
大方針
- 外税方式に変更
- 商品説明ページに直接書いた金額も、外税価格で更新する
- フードはブランド毎に優先順位をつけて、売れてないものは一旦外す
- 商品の更新は、全て流用して新規登録、陳列開始を4/1の時限設定
1.外税
2015年10月も増税だし、外税にしておいた方がメンテは楽そうだ
話が飛んでしまったが、、、
2.ここからプログラミング
3.仕様
改行コードを含むフィールドがあると、
というわけで
今日は固い感じの「ビッグデータと統計科学の実践的利活用事例」
本日は、まじめにセミナー行ってきました。
しかも、有料です!(もちろん、自腹)
日本では、「技術士」という資格がありますが、私は持ってません。
今日は、技術士の方々が集う社団法人「日本技術士会」が開催した「1月度技術士CPD中央講座」ってのに行ってきました。
このイベントを知ったきっかけは、講師の一人であるUSP研究所からのメールでした。
通常スルーするところなんですが、USP研究所の人の話はどこかで聞きたいと思ってましたし、東京農工大の石井教授という人が「医療、農業、環境分野におけるビッグデータ分析」というタイトルだったので、青山ツインビル西館に行ってきました。
イベント案内ページは、こちらです。
1月度技術士CPD中央講座(第119回)|公益社団法人 日本技術士会
◆「医療、農業、環境分野におけるビッグデータ分析」
石井 一夫 氏(東京農工大学 特任教授(ゲノム科学)、技術士(生物工学部門)、博士(医学) )
資料は、公開されてませんね。紙では配布されました。
この話は、今後勉強を進めようと思っている分野なので、導入編としては十分満足でした。もちろんDNAの配列の話はちんぷんかんぷんでしたが、種の系統をDNAの画像処理で昔とは比べ物にならないほど早く作ることができるようになってました。
ただし、使っているPCはそれなりでしたね。ランニングコストも数百万/Hour、DNA検査試薬も数十万/回とか、検査に失敗すると1千万弱のお金が無駄になるみたいな世界でした。
DNAを正しく識別する装置としては、その専門性、正確性が必要なので、しょうがないですね。ただ配列データになってしまえば、統計科学の世界になりますから、Hadoop(オンプレ)やAWSで投入できる予算に応じたデータ分析を行うことができる状況になっているので、石井教授以外のお3方は、研究者さんに活用してもらうように事例紹介という立場で発表されてました。
重要なのは、「一度集めてしまえば」というところです。
集め方は、専門の装置を使って、パターン認識させるとかで、できるだけ「生データ」を長期間貯めることさえしてしまえば、
分析手段はECOな方法がいくつもあるという時代なんですよ!
さて、イルミナ社の話です。
ここでは、「次世代シーケンサ」という装置を提供しているところのようです。これですかね・・・縁がなさそうですが・・・
システム – 次世代シーケンサー MiSeq – イルミナ株式会社
とにかく、この装置でDNAを画像処理して、テキストデータに変換させます。(→DNA塩基配列というらしい)
テキストデータになってしまえば、
一般家庭でよく転がっているPCで、解析できてしまいます。
「うちには転がってるPCなんて無いよ」って人は、後述のAWSの時間貸しで解析を楽しみましょう。
もう少し簡単にまとめると、
- 画像処理 ⇒ DNA塩基配列取得
CASAVA - DNA塩基配列を連結、整列、編集
Velvet、SQAPdenovo、Trinity、など
Bowtie、BWA、など - 統計処理、視覚化、データマイニング
S-PLUS/R
解析事例-Ⅰ
次世代シーケンサーデータの品質管理
こんな問題があるようです。
- サンプル濃度の間違い
- 試薬濃度の間違い
- 操作の荒さ
- 電圧の不適
- データ転送のコマ落ち
そもそもDNAってのは、数億の塩基断片を配列にしてるわけですが、、、(いや、私は全く知りませんので、興味がある人は自動的にできるリンクをクリックしてください)、次世代シーケンサーデータのクオリティが40段階に分類されるんだそうです。
このクオリティにばらつきがあると、せっかく処理した塩基配列の信頼性にかけてしまいますよね。
かといって、全部のデータを全てチェックするってのも無理がありますから、100等分したところから1,000個ずつリードする方法(モンテカルロ法)でサンプル抽出して、クオリティデータを作るそうです。
このサンプル抽出で、全体のデータクオリティが推定できることになります。
1,000個の選択には、Rの乱数を使って「無作為」にやっていましたね。
解析事例-Ⅱ
進化系統樹の最適化
(あとで書きます。ごめんなさい。)
解析事例-Ⅲ
学会発表前ということで、資料はあんまりありませんでしたが、
現代の5大疾患の一つである「精神疾患患者」の診断方法を客観的に、というかかなりの精度で行うことが可能になりそうだという発表になります。
発生率は、今やガンの2倍以上です。(診断が結構グレーですけどね・・・)
これもゲノム分析の応用で、DNAを統計的有意検定で「感度」と「特異度」という分類をすると、健常者と精神疾患患者を明確に分類できてしまうというものです。
資料や論文は近日公開らしいですが、これは今後のメンタル医療分野が大きく変化しそうな話だと思いました。楽しみです。
一旦、今日はここまで。
書いてないな、気がつけば1ヶ月
こんな状態はしばらくなかったんだけど、
お互い冷静にならないかな?
先週末からダメテンション
寝てる時間以外は、仕事の事を考える日々
論理的な話じゃないと理解しない
自分で話したり、書いたりする内容は、論理的でない。
いや、わかるわけないんだよね。
逃げても仕事が進むわけでもないんですが、それしか思い当たらなかったですね。