Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
第5回 Zansa勉強会                 データ                マイニング2012年3月27日火曜日
名前           バックボーン      伊藤 徹郎       経済・ファイナンス      twitter ID    Age      @tetsuroito   26歳      所属      株式会社ALBERT データ分析...
株式会社ALBERTについて      私たちは「分析力をコアとする情報最適化企業」です!                    ALBERTの事業領域                    CRMソリューションの開発・提供          ...
アジェンダ     1、なぜデータ分析が必要なのか?     2、データマイニングの理想と現実     3、分析事例紹介2012年3月27日火曜日
なぜデータ分析が必要なのか?2012年3月27日火曜日
なぜデータ分析が必要なのか?       Q.どちらの会社で働きたい?           A社                B社                平均年齢 30.8歳   平均年齢 31.8歳                平...
なぜデータ分析が必要なのか?             こういう分布があったらどうでしょう?2012年3月27日火曜日
平均に       されてはいけない2012年3月27日火曜日
基本統計量をしっかり確認しましょう         平均               尖度         分散               歪度         中央値              範囲         最頻値         ...
なぜデータ分析が必要なのか?      きちんとしたビジネス上の     意思決定を行うために、     データの分析が必要です。2012年3月27日火曜日
データ分析の心構え     1、分析する対象についての理解     2、分析手法についての理解     3、分析結果に対する的確な判断2012年3月27日火曜日
分析力の高い組織とは                   出典:http://www.albert2005.co.jp/blog/archives/201203/05_140501.html2012年3月27日火曜日
データマイニング理想と現実2012年3月27日火曜日
データマイニングの理想                 購買データを用いて                バスケット分析を用いたら            おむつとビールの併売傾向がわかった!                売り場を併設して、売上...
データマイニングの現実                 購買データを用いて                バスケット分析を用いたら            おむつとビールの併売傾向がわかった!                そんなに簡単に    ...
データマイニングあるある       ケース1       コンビニの売上データを分析                      思考錯誤の結果                天気データを用いて重回帰分析を行ったところ             ...
データマイニングあるある       ケース2       家電量販店の売上データと顧客データを分析                  ABC分析で顧客を分類し、                アソシエーション分析を行った結果、        ...
データマイニングの現実         データマイニングは試行錯誤の連続です。2012年3月27日火曜日
実務で重要なデータクレンジング                        データの前処理の有無が                         結果に大きく左右                そのまま統計解析できるデータは皆無2012年3...
データクレンジングの5ステップ      1、データ形式を統一する      2、欠損値を補う(補完する)      3、データの値を   える(正規化)      4、異常値を処理する      5、特徴選択(変数の数を決定する)2012年3...
分析事例紹介2012年3月27日火曜日
顧客の分類手法 顧客のセグメント                デシル分析        RFM分析        クラスター分析           顧客を10グループに等分     顧客を3つの指標ごとに   類似した顧客を数グループに  ...
K-means法       1.各点にランダムにクラスタを割り当てる       2.クラスタの重心を計算する。       3.点のクラスタを、一番近い重心のクラスタに変更する       4.変化がなければ終了。変化がある限りは 2に戻る...
クラスタリング事例                  出典:http://www.slideshare.net/hamadakoichi/mahout-canopy-clustering-tokyowebmining-92012年3月27日火曜日
クラスタリング事例                  出典:http://www.slideshare.net/hamadakoichi/mahout-canopy-clustering-tokyowebmining-92012年3月27日火曜日
分析事例紹介(会場のみ)2012年3月27日火曜日
Upcoming SlideShare
Loading in …5
×

20120326 zansa勉強会発表資料 (公開用) 02 04-38

1,556 views

Published on

20120326 zansa勉強会発表資料 (公開用) 02 04-38

  1. 1. 第5回 Zansa勉強会 データ マイニング2012年3月27日火曜日
  2. 2. 名前           バックボーン 伊藤 徹郎       経済・ファイナンス twitter ID Age @tetsuroito 26歳 所属 株式会社ALBERT データ分析部 データマイニングの理想と現実の間で悩み、 2ヶ月前に金融系の会社から転職しました。 データアナリスト見習いです。2012年3月27日火曜日
  3. 3. 株式会社ALBERTについて 私たちは「分析力をコアとする情報最適化企業」です! ALBERTの事業領域 CRMソリューションの開発・提供 レコメンドエンジンの開発・提供 行動ターゲティング広告システムの 開発・提供2012年3月27日火曜日
  4. 4. アジェンダ 1、なぜデータ分析が必要なのか? 2、データマイニングの理想と現実 3、分析事例紹介2012年3月27日火曜日
  5. 5. なぜデータ分析が必要なのか?2012年3月27日火曜日
  6. 6. なぜデータ分析が必要なのか?  Q.どちらの会社で働きたい? A社 B社 平均年齢 30.8歳 平均年齢 31.8歳 平均年収 807万円 平均年収 620万円2012年3月27日火曜日
  7. 7. なぜデータ分析が必要なのか?  こういう分布があったらどうでしょう?2012年3月27日火曜日
  8. 8. 平均に されてはいけない2012年3月27日火曜日
  9. 9. 基本統計量をしっかり確認しましょう 平均 尖度 分散 歪度 中央値 範囲 最頻値 最大 標準偏差 最小 分析対象の標本数の確認 散布図やヒストグラムの確認も重要!2012年3月27日火曜日
  10. 10. なぜデータ分析が必要なのか?  きちんとしたビジネス上の 意思決定を行うために、 データの分析が必要です。2012年3月27日火曜日
  11. 11. データ分析の心構え 1、分析する対象についての理解 2、分析手法についての理解 3、分析結果に対する的確な判断2012年3月27日火曜日
  12. 12. 分析力の高い組織とは 出典:http://www.albert2005.co.jp/blog/archives/201203/05_140501.html2012年3月27日火曜日
  13. 13. データマイニング理想と現実2012年3月27日火曜日
  14. 14. データマイニングの理想 購買データを用いて バスケット分析を用いたら おむつとビールの併売傾向がわかった! 売り場を併設して、売上UP!2012年3月27日火曜日
  15. 15. データマイニングの現実 購買データを用いて バスケット分析を用いたら おむつとビールの併売傾向がわかった! そんなに簡単に パターン発見などできません! 売り場を併設して、売上UP!2012年3月27日火曜日
  16. 16. データマイニングあるある ケース1 コンビニの売上データを分析 思考錯誤の結果 天気データを用いて重回帰分析を行ったところ 雨の日に傘が売れていると判明した! 普通に考えて当たり前ですね。2012年3月27日火曜日
  17. 17. データマイニングあるある ケース2 家電量販店の売上データと顧客データを分析 ABC分析で顧客を分類し、 アソシエーション分析を行った結果、 10代、20代→非優良顧客 30代以上→優良顧客 となることがわかった! なんとなく予想つきますよね。2012年3月27日火曜日
  18. 18. データマイニングの現実 データマイニングは試行錯誤の連続です。2012年3月27日火曜日
  19. 19. 実務で重要なデータクレンジング データの前処理の有無が 結果に大きく左右 そのまま統計解析できるデータは皆無2012年3月27日火曜日
  20. 20. データクレンジングの5ステップ 1、データ形式を統一する 2、欠損値を補う(補完する) 3、データの値を える(正規化) 4、異常値を処理する 5、特徴選択(変数の数を決定する)2012年3月27日火曜日
  21. 21. 分析事例紹介2012年3月27日火曜日
  22. 22. 顧客の分類手法 顧客のセグメント デシル分析 RFM分析 クラスター分析 顧客を10グループに等分 顧客を3つの指標ごとに 類似した顧客を数グループに (売上額の順位など) 数グループに分ける 分ける R:最新購入日 各クラスタリング手法によって 顧客ごとの売上合計 F:購入頻度 様々 M:購入合計額 自由度が高い反面 現状の把握が大まかにわかる 小売業では効果的な手法 分類の意味づけなどを 行う必要がある 低 難易度 高2012年3月27日火曜日
  23. 23. K-means法 1.各点にランダムにクラスタを割り当てる 2.クラスタの重心を計算する。 3.点のクラスタを、一番近い重心のクラスタに変更する 4.変化がなければ終了。変化がある限りは 2に戻る。2012年3月27日火曜日
  24. 24. クラスタリング事例 出典:http://www.slideshare.net/hamadakoichi/mahout-canopy-clustering-tokyowebmining-92012年3月27日火曜日
  25. 25. クラスタリング事例 出典:http://www.slideshare.net/hamadakoichi/mahout-canopy-clustering-tokyowebmining-92012年3月27日火曜日
  26. 26. 分析事例紹介(会場のみ)2012年3月27日火曜日

×