More Related Content
PPTX
PDF
PDF
20170411 ヒカラボ データを武器に変える PPTX
PPTX
PPTX
PPTX
【schoo WEB-campus】#49業務改善のためのデータサイエンス 先生:倉橋一成 PDF
Tokyo webmining発表資料 20111127 Similar to 20120326 zansa勉強会発表資料 (公開用) 02 04-38
PPT
99%の企業がやっていない "顧客データの整理"で 利益を50%増やす <5ステップ>活用法 PDF
PDF
分析のリアルがここに!現場で使えるデータ分析 PDF
ビジネス活用事例で学ぶデータサイエンス入門 #6 PDF
データウェアハウス入門 (マーケティングデータ分析基盤技術勉強会) PDF
PDF
PDF
PDF
Webマーケティングを通じたデータサイエンティストの価値発揮方法 PDF
『手を動かしながら学ぶ ビジネスに活かすデータマイニング』で目指したもの・学んでもらいたいもの PDF
PDF
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性 PPTX
PDF
業界での勝ち組になるためのビッグデータの取り組み~ここから始めよう!~ PPTX
Data-driven Design: 4つの技法InfoPathを用いたスケーラブルSharePointソリューション PPTX
PDF
PPTX
PDF
Icon imj conference2013 session1 リアルタイムでの意思決定によるマーケティング最適化 PDF
TECHTALK 20200715 分析データをセルフサービスで準備ーデータマネージャーでもっとできる More from tetsuro ito
PDF
PDF
20170912 data analyst meetup tokyo vol.5 PDF
PDF
20170207 bigdata analytics_tokyo講演資料 PDF
20161029 dots machine learning in money forward PDF
PDF
PDF
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis PDF
PDF
PDF
PDF
20140329 tokyo r lt 「カーネルとsvm」 PDF
PDF
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」 PDF
PDF
PDF
PDF
PDF
PDF
20120326 zansa勉強会発表資料 (公開用) 02 04-38
- 1.
- 2.
名前 バックボーン
伊藤 徹郎 経済・ファイナンス
twitter ID Age
@tetsuroito 26歳
所属
株式会社ALBERT データ分析部
データマイニングの理想と現実の間で悩み、
2ヶ月前に金融系の会社から転職しました。
データアナリスト見習いです。
2012年3月27日火曜日
- 3.
株式会社ALBERTについて
私たちは「分析力をコアとする情報最適化企業」です!
ALBERTの事業領域
CRMソリューションの開発・提供
レコメンドエンジンの開発・提供
行動ターゲティング広告システムの
開発・提供
2012年3月27日火曜日
- 4.
アジェンダ
1、なぜデータ分析が必要なのか?
2、データマイニングの理想と現実
3、分析事例紹介
2012年3月27日火曜日
- 5.
- 6.
なぜデータ分析が必要なのか?
Q.どちらの会社で働きたい?
A社 B社
平均年齢 30.8歳 平均年齢 31.8歳
平均年収 807万円 平均年収 620万円
2012年3月27日火曜日
- 7.
- 8.
平均に されてはいけない
2012年3月27日火曜日
- 9.
基本統計量をしっかり確認しましょう
平均 尖度
分散 歪度
中央値 範囲
最頻値 最大
標準偏差 最小
分析対象の標本数の確認
散布図やヒストグラムの確認も重要!
2012年3月27日火曜日
- 10.
- 11.
データ分析の心構え
1、分析する対象についての理解
2、分析手法についての理解
3、分析結果に対する的確な判断
2012年3月27日火曜日
- 12.
分析力の高い組織とは
出典:http://www.albert2005.co.jp/blog/archives/201203/05_140501.html
2012年3月27日火曜日
- 13.
- 14.
データマイニングの理想
購買データを用いて
バスケット分析を用いたら
おむつとビールの併売傾向がわかった!
売り場を併設して、売上UP!
2012年3月27日火曜日
- 15.
データマイニングの現実
購買データを用いて
バスケット分析を用いたら
おむつとビールの併売傾向がわかった!
そんなに簡単に
パターン発見などできません!
売り場を併設して、売上UP!
2012年3月27日火曜日
- 16.
データマイニングあるある
ケース1
コンビニの売上データを分析
思考錯誤の結果
天気データを用いて重回帰分析を行ったところ
雨の日に傘が売れていると判明した!
普通に考えて当たり前ですね。
2012年3月27日火曜日
- 17.
データマイニングあるある
ケース2
家電量販店の売上データと顧客データを分析
ABC分析で顧客を分類し、
アソシエーション分析を行った結果、
10代、20代→非優良顧客
30代以上→優良顧客
となることがわかった!
なんとなく予想つきますよね。
2012年3月27日火曜日
- 18.
- 19.
- 20.
データクレンジングの5ステップ
1、データ形式を統一する
2、欠損値を補う(補完する)
3、データの値を える(正規化)
4、異常値を処理する
5、特徴選択(変数の数を決定する)
2012年3月27日火曜日
- 21.
- 22.
顧客の分類手法 顧客のセグメント
デシル分析 RFM分析 クラスター分析
顧客を10グループに等分 顧客を3つの指標ごとに 類似した顧客を数グループに
(売上額の順位など) 数グループに分ける 分ける
R:最新購入日
各クラスタリング手法によって
顧客ごとの売上合計 F:購入頻度
様々
M:購入合計額
自由度が高い反面
現状の把握が大まかにわかる 小売業では効果的な手法 分類の意味づけなどを
行う必要がある
低 難易度 高
2012年3月27日火曜日
- 23.
K-means法
1.各点にランダムにクラスタを割り当てる
2.クラスタの重心を計算する。
3.点のクラスタを、一番近い重心のクラスタに変更する
4.変化がなければ終了。変化がある限りは 2に戻る。
2012年3月27日火曜日
- 24.
クラスタリング事例
出典:http://www.slideshare.net/hamadakoichi/mahout-canopy-clustering-tokyowebmining-9
2012年3月27日火曜日
- 25.
クラスタリング事例
出典:http://www.slideshare.net/hamadakoichi/mahout-canopy-clustering-tokyowebmining-9
2012年3月27日火曜日
- 26.