Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

ユーザー分析における特徴量の作り方

4,259 views

Published on

第37回東京WEBマイニングのアンカンファレンス用資料です。

Published in: Data & Analytics

ユーザー分析における特徴量の作り方

  1. 1. 0 ユーザ分析における特徴量の作り方 How to provide feature quantities 第37回 TokyoWebmining
  2. 2. アジェンダ - 1 - 1. 自己紹介 2. 議論したいこと
  3. 3. 自己紹介の前に… - 2 - 本日の発表は、全て発表者の私見であり、所属する団体等とは一切関係ありません。
  4. 4. 自己紹介 - 3 - Twitter :obnym 本名 :尾花山 和哉 (四股名ではない) 略歴 :”尾花山和哉”もしくは”kazuya obanayama”でググった感じです。 最近は共通ポイントデータを相手にPPDMとかやってます。 ちょっと宣伝ですが、最近、購買情報や個人情報を直接取得せずに、 レコメンドやクラスタリングを行う技術を開発しました。(特許申請中) この領域に興味のある方、情報交換しましょう!
  5. 5. 分析屋の日常 顧客だったり、企業だったりしますが、大抵『何か』の分析を依頼されます。 - 4 - ××の分析ヨロシクー データはいっぱいあるから、 イイ感じの奴お願いねー 上司の声
  6. 6. 分析屋の日常 割と良く分からない依頼でも、空気を読んでイイ感じに目標設定して頑張ります。 - 5 - ・・・はーい。 (この前言ってた奴かな…)
  7. 7. 分析屋の日常 目標に併せてデータ準備に勤しみます。 - 6 - さて、データの準備しないと… 購買情報 閲覧情報
  8. 8. 分析屋の日常 - 7 - そんな時…困ることありませんか?
  9. 9. 分析屋の日常 対象の特徴を表現するデータが割りと無尽蔵に作れてしまう - 8 - あ、アレ…キリが無い… (;´Д`) 購買情報 閲覧情報 ・売上総額 ・来店回数 ・商品別購買金額 ・商品別購買回数 ・商品別購買金額構成比 ・曜日別… ・累計訪問回数 ・訪問時間 ・ページ別滞在時間 ・ページ別訪問回数構成比 ・時間帯別閲覧数 ・時間帯別…
  10. 10. 分析屋の苦悩 - 9 - しかも…
  11. 11. 分析屋の苦悩 頑張って作ってると処理が遅くなってきて、加速度的に作業がしんどくなる。 - 10 - 特徴量って言っても 同じような物が沢山出てくるし、 処理も遅くなって来る…orz
  12. 12. 分析屋の苦悩 更に難しいこと言い始める人もいたりして… - 11 - 特徴量って言っても 同じような物が沢山出てくるし、 処理も遅くなって来る…orz タジュウキョウセンセイ にも注意しろよー! 専門家な感じの声
  13. 13. 本日のアンカンファレンス内容 - 12 - そんな時、皆さん如何されてますか?
  14. 14. 本日のアンカンファレンス内容 - 13 - ぜひ、皆さんで議論しましょう! • 特徴量の作り方 比率? 絶対値? ヒューリスティクス? • 特徴量の捨て方/まとめ方 変数選択法? 主成分?

×