Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Katsuhiro Takata
5,359 views
レコメンデーション(協調フィルタリング)の基礎
TokyoWebMining, 2010/05/16
Technology
◦
Read more
6
Save
Share
Embed
Embed presentation
Download
Downloaded 42 times
1
/ 28
2
/ 28
3
/ 28
4
/ 28
5
/ 28
6
/ 28
7
/ 28
8
/ 28
9
/ 28
10
/ 28
11
/ 28
12
/ 28
13
/ 28
14
/ 28
15
/ 28
16
/ 28
17
/ 28
18
/ 28
19
/ 28
20
/ 28
21
/ 28
22
/ 28
23
/ 28
24
/ 28
25
/ 28
26
/ 28
27
/ 28
28
/ 28
More Related Content
PPTX
Sano web広告最適化20131018v3
by
Masakazu Sano
PPTX
パーソナル広告配信徹底入門
by
yskn67
PPTX
人工知能Xファッション最前線
by
Kazuki Baba
PPTX
Masakazu Sano Tokyowebmining 37 20140621
by
Masakazu Sano
PPTX
Sano tokyowebmining 36_20140526
by
Masakazu Sano
PPTX
Mlct 20150430v2
by
Masakazu Sano
PDF
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
by
Koichi Hamada
PPTX
高速な広告配信サーバの作り方のコツ
by
Innami Satoshi
Sano web広告最適化20131018v3
by
Masakazu Sano
パーソナル広告配信徹底入門
by
yskn67
人工知能Xファッション最前線
by
Kazuki Baba
Masakazu Sano Tokyowebmining 37 20140621
by
Masakazu Sano
Sano tokyowebmining 36_20140526
by
Masakazu Sano
Mlct 20150430v2
by
Masakazu Sano
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
by
Koichi Hamada
高速な広告配信サーバの作り方のコツ
by
Innami Satoshi
What's hot
PPT
楽天ad4U 行動スキミング広告
by
rakuten
PDF
フルスクラッチで書いたアドサーバの開発運用史
by
Innami Satoshi
PPTX
食べログデータから見る東新宿と西早稲田のランチ事情
by
Jun Ishitsuka
PPT
Big data解析ビジネス
by
Mie Mori
PDF
Prophet入門【R編】Facebookの時系列予測ツール
by
hoxo_m
PDF
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
by
Koichi Hamada
PDF
EC-CUBEとAWSの美味しい関係?
by
義隆 川路
楽天ad4U 行動スキミング広告
by
rakuten
フルスクラッチで書いたアドサーバの開発運用史
by
Innami Satoshi
食べログデータから見る東新宿と西早稲田のランチ事情
by
Jun Ishitsuka
Big data解析ビジネス
by
Mie Mori
Prophet入門【R編】Facebookの時系列予測ツール
by
hoxo_m
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
by
Koichi Hamada
EC-CUBEとAWSの美味しい関係?
by
義隆 川路
Viewers also liked
PDF
集合知プログラミング 第6章 ドキュメントとフィルタリング~draft
by
Kenji Koshikawa
PDF
HTML5時代の技術の恩恵を受けるには
by
Sho Ito
PDF
Photoshopで学ぶ、一生使える色調補正 先生:藤本 圭先生
by
schoowebcampus
PDF
WebフォントとSVGフォント
by
Jun Fujisawa
PDF
CSSにもオブジェクト指向を - OOCSSことはじめ
by
Nisei Kimura
PDF
テスト環境から本番環境へ、URLが異なる環境にWordPressを移行する方法
by
Ryujiro Yamamoto
PDF
ディレクターからみたMovable Type + PowerCMSの優位性
by
Renji Yoneda
PPTX
シロクマ本に学ぶエクスペリエンスのための手技法 by 篠原 稔和 - presentation from IA CAMP 2015
by
Sociomedia
PDF
Webアクセシビリティの標準規格「JIS X 8341-3:2010」準拠のための試験方法(最新版)
by
Web Accessibility Infrastructure Committee (WAIC)
PDF
Chromeでjavascriptデバッグ!まず半歩♪
by
Yuji Nojima
PDF
Photoshopで効率よくデザインしよう!
by
Marie Suenaga
PDF
-入門- enchant.js でゲームを作ろう
by
nico0927
PDF
.htaccessによるリダイレクト徹底解説
by
Cherry Pie Web
PDF
悩まないコーディングをしよう! OOCSS,SMACSSを用いた、読みやすくてメンテナブルなCSS設計(Sass対応)
by
Horiguchi Seito
PDF
ウェブデザインの本質と、構成要素
by
vanillate cocoa
PDF
今必要なCSSアーキテクチャ
by
Mayu Kimura
KEY
コーディングが上達するコツ
by
evol-ni
PPTX
Webアプリケーション負荷試験実践入門
by
樽八 仲川
KEY
WordPressプラグイン作成入門
by
Yuji Nojima
PDF
ノンプログラマーのためのjQuery入門
by
Hayato Mizuno
集合知プログラミング 第6章 ドキュメントとフィルタリング~draft
by
Kenji Koshikawa
HTML5時代の技術の恩恵を受けるには
by
Sho Ito
Photoshopで学ぶ、一生使える色調補正 先生:藤本 圭先生
by
schoowebcampus
WebフォントとSVGフォント
by
Jun Fujisawa
CSSにもオブジェクト指向を - OOCSSことはじめ
by
Nisei Kimura
テスト環境から本番環境へ、URLが異なる環境にWordPressを移行する方法
by
Ryujiro Yamamoto
ディレクターからみたMovable Type + PowerCMSの優位性
by
Renji Yoneda
シロクマ本に学ぶエクスペリエンスのための手技法 by 篠原 稔和 - presentation from IA CAMP 2015
by
Sociomedia
Webアクセシビリティの標準規格「JIS X 8341-3:2010」準拠のための試験方法(最新版)
by
Web Accessibility Infrastructure Committee (WAIC)
Chromeでjavascriptデバッグ!まず半歩♪
by
Yuji Nojima
Photoshopで効率よくデザインしよう!
by
Marie Suenaga
-入門- enchant.js でゲームを作ろう
by
nico0927
.htaccessによるリダイレクト徹底解説
by
Cherry Pie Web
悩まないコーディングをしよう! OOCSS,SMACSSを用いた、読みやすくてメンテナブルなCSS設計(Sass対応)
by
Horiguchi Seito
ウェブデザインの本質と、構成要素
by
vanillate cocoa
今必要なCSSアーキテクチャ
by
Mayu Kimura
コーディングが上達するコツ
by
evol-ni
Webアプリケーション負荷試験実践入門
by
樽八 仲川
WordPressプラグイン作成入門
by
Yuji Nojima
ノンプログラマーのためのjQuery入門
by
Hayato Mizuno
Similar to レコメンデーション(協調フィルタリング)の基礎
PDF
協調フィルタリング with Mahout
by
Katsuhiro Takata
PDF
マイニング探検会#09 情報レコメンデーションとは
by
Yoji Kiyota
PPTX
World ia day
by
Yoshifumi Seki
PDF
tut_pfi_2012
by
Preferred Networks
PDF
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
by
Yoichi Motomura
PDF
Developers Summit 2012 16-E-1
by
Kohei Kumazawa
PDF
ビックデータとシリコンバレースタートアップ事情
by
Osaka University
PDF
ビッグデータ革命 クラウドがコモデティ化する「奇跡」
by
Atsushi Nakada
PPTX
20140711 evf2014 hadoop_recommendmachinelearning
by
Takumi Yoshida
PDF
ソーシャルデザインパターン -評判と情報収集-
by
Koichi Hamada
PDF
情報推薦システム入門:講義スライド
by
Kenta Oku
PDF
Webマイニングと情報論的学習理論
by
Hiroshi Ono
PDF
Webマイニングと情報論的学習理論
by
Hiroshi Ono
PDF
jubatus pressrelease
by
JubatusOfficial
PPTX
ビッグデータ活用支援フォーラム
by
Recruit Technologies
PDF
ソーシャルウェブ と レコメンデーション -第4回データマイニング+WEB勉強会@東京
by
Koichi Hamada
PDF
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
by
Preferred Networks
PDF
Introduction to Recommender Systems 2012.1.30 Zansa #3
by
Atsushi KOMIYA
PDF
ビッグデータ時代にむけて/濱田 正彦
by
Takumi Kurosawa
PDF
Hadoopによるリクルートでの技術調査とその活用
by
Chiaki Hatanaka
協調フィルタリング with Mahout
by
Katsuhiro Takata
マイニング探検会#09 情報レコメンデーションとは
by
Yoji Kiyota
World ia day
by
Yoshifumi Seki
tut_pfi_2012
by
Preferred Networks
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
by
Yoichi Motomura
Developers Summit 2012 16-E-1
by
Kohei Kumazawa
ビックデータとシリコンバレースタートアップ事情
by
Osaka University
ビッグデータ革命 クラウドがコモデティ化する「奇跡」
by
Atsushi Nakada
20140711 evf2014 hadoop_recommendmachinelearning
by
Takumi Yoshida
ソーシャルデザインパターン -評判と情報収集-
by
Koichi Hamada
情報推薦システム入門:講義スライド
by
Kenta Oku
Webマイニングと情報論的学習理論
by
Hiroshi Ono
Webマイニングと情報論的学習理論
by
Hiroshi Ono
jubatus pressrelease
by
JubatusOfficial
ビッグデータ活用支援フォーラム
by
Recruit Technologies
ソーシャルウェブ と レコメンデーション -第4回データマイニング+WEB勉強会@東京
by
Koichi Hamada
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
by
Preferred Networks
Introduction to Recommender Systems 2012.1.30 Zansa #3
by
Atsushi KOMIYA
ビッグデータ時代にむけて/濱田 正彦
by
Takumi Kurosawa
Hadoopによるリクルートでの技術調査とその活用
by
Chiaki Hatanaka
More from Katsuhiro Takata
PDF
自然言語処理 with NLTK
by
Katsuhiro Takata
PDF
高次元データ処理,手書き編(Dimension Reduction)
by
Katsuhiro Takata
PDF
広告ログの解析システム
by
Katsuhiro Takata
PDF
Frequency Pattern Mining
by
Katsuhiro Takata
PDF
相関マイニング(バスケット分析)
by
Katsuhiro Takata
PDF
ネットワークマイニング(グラフ構造分析)
by
Katsuhiro Takata
自然言語処理 with NLTK
by
Katsuhiro Takata
高次元データ処理,手書き編(Dimension Reduction)
by
Katsuhiro Takata
広告ログの解析システム
by
Katsuhiro Takata
Frequency Pattern Mining
by
Katsuhiro Takata
相関マイニング(バスケット分析)
by
Katsuhiro Takata
ネットワークマイニング(グラフ構造分析)
by
Katsuhiro Takata
レコメンデーション(協調フィルタリング)の基礎
1.
レコメンデーション活用編 --- 開発者より
--- Karubi Namuru May 16, 2010
2.
自己紹介 ●
Karubi Namuru – 詳しくは名刺交換で ● Ph.D. in CS, RD Engineer ● Twitter : @karubi ● facebook : http://facebook.com/karubi ● 出身:広島,居住:東京 , Seongnam
3.
学生時代の話
● 在学中の研究 ● 統計的手法による日常行動分析 – 実世界:ライフログ – ウェブ:閲覧, clicks 200 200 180 180 160 160 140 140 120 120 100 100 80 80 60 60 40 40 20 20 0 0
4.
現在使っている知識 ●
膨大な情報の処理 ● 疎な分散処理 ● 時系列情報を参照する情報推薦 ● コンテクスト抽出 ● 状況変化型の情報推薦 – いつも一緒ではない,時間は刻々と進む
5.
今日の基本スタンス ●
開発者としての LT ● 統計処理など大規模計算をインターネットの サービスでつかう – 計算開始から終了まで3日かかるとかだめ! – インフラコストが馬鹿にならない! – 運用,とにかく止めちゃだめ! ● もちろんビジネス – できれば金儲けしたいよ
6.
お話をする応用について (1) ●
おさらい ● 大きく分類して3つの方法論がある – コンテンツベースフィルタリング – ルールベースフィルタリング – 協調フィルタリング
7.
お話をする応用について (2) ●
画像を利用する推薦サービス ● 画像特徴量を利用する ● 疎結合な分散処理 – 当時流行のクラウドコンピューティング, Amazon EC2 – 分散処理, Apache Hadoop ● 知財化 ● Amazon WebServices エバンジェリストに紹介 – ApacheCon US 2008, Nov.
8.
お話をする応用について (3) ●
広告配信サービス ● コンテンツ連動広告 – 現在サービス中のため,話せるレベルで ... ● 大規模なログ処理の例,機械学習 – Apache Hadoop – Apache Mahout (たぶん世界最初の商用で利用 ● 閲覧者の需要をどのようにして見つけるのか?
9.
軽めにおさらい ●
レコメンドのアプローチ ● コンテンツベース ● ルールベース ● 協調フィルタリング ● Hamadakoichi さんが詳解している!(はず – おさらい程度でー
10.
コンテンツベースフィルタリング ●
内容に合わせた見合うアイテムを見つける方法 ● Content-based filtering ● 好きな監督・俳優・ジャンルなどを決める ● その組み合わせに即して,アイテムを決める – 映画「プリティ・ウーマン」を選択すると ● ラブロマンス ● ジュリア・ロバーツ → 「ノッティングヒル」を推薦 ● ラブロマンス ● ジュリア・ロバーツ
11.
ルールベースフィルタリング ●
エキスパートシステム ● AI の研究分野 ● 専門家の知識をルールのようにプロセスにする – 映画「プリティ・ウーマン」を選択すると ● 「元となった映画がある場合は併せて推薦する」ルール → 「マイ・フェア・レディ」を推薦
12.
協調フィルタリング ●
似た人が与えた評価を利用して,アイテムの評 価を予測する ● 多くの利用者の嗜好情報を蓄積すること ● ある人と嗜好の類似する他の人の情報 ● クチコミの原理と例えられる – 趣味の似た人からの意見を参考にする
13.
考え方 ●
ユーザ A がアイテム X を好む ● アイテム X を好む別のユーザ B が好むアイテム Y が存在する ● ユーザ A もアイテム Y を好むのではないか ● 実装で利用するのはユーザ同士の類似度 – たとえば,同じアイテムにつけた評価の相関係数
14.
対象する情報 ●
明示的な情報源 ● ユーザの評価がついているもの – レビュー ● 明示的に選択したもの – 評価ポイント ● 暗示的な情報源 ● システムの操作履歴 – ブラウザの閲覧履歴
15.
明示的な情報の具体例 ●
評価の内容 ● 例えば映画の場合 – この映画は面白かった,つまらなかった – ◯◯ 点 – 評価を与えた映画の組み合わせ ● レビューリスト
16.
画像を利用する推薦サービス ●
概要 ● 画像を特徴量にする(色,形など) ● それぞれの特徴量に対して閲覧者が評価を与えてい るとする ● 閲覧者の嗜好を協調フィルタリング
17.
画像を利用した動機 ●
協調フィルタリングでは対応しづらい世界もあ る ● データが集まるまでマトモに機能しない → プロダクトライフサイクルの短い商材に向かない ● コンテンツベースフィルタリング ● なにの情報を対象にするのか ● 収集もしなければならない ● できるだけ汎化したい
18.
どのような情報を利用するのか ●
色 ● 色空間系 ● 質感 ● 素材感 ● 形 ● 境界 ● モデルと背景の問題
19.
どのような開発をするのか ●
計算量が多い ● 画像を特徴化 ● 協調フィルタリング ● 更新頻度が早い – 商品の入れ替えが早い(こまめな商品追加 – 在庫も薄い(洋服の場合 ● 止めてはならない
20.
具体的な対策 ●
Apache Hadoop ● 分散して計算 ● Map Reduce できるようにデータ構造に注意する ● Amazon EC2 ● インスタンスを API で増やせる – 危機の予感がしたときに作ればいい ● 従量課金 – 止めれば料金が掛からないのでベンチャーでも安心
21.
適用結果
現地で ApacheCon のために Amazon WebServices のエヴァンジェリストに紹介した動画 http://www.youtube.com/watch?v=SkI_2bznyk0
22.
広告配信サービス ●
概要 ● コンテンツ連動広告 – ウェブページの内容に沿った広告
23.
広告に推薦は有効に働くか ●
クリック保証型広告の場合 ● 成果が「広告のクリック」 ● 閲覧者のニーズ通りの広告が出れば利得が最大 – 最もクリックされるために配信会社は儲かる – 広告主のサイトに商材に興味のある閲覧者が集まるため に,広告主のビジネスも成功して儲かる ● インプレッション保証型広告 ● 成果が「広告の閲覧」 ● 今回は対象外
24.
どのような情報を利用するのか ●
ウェブページの情報 ● 特徴語? ● 閲覧者の情報 ● 過去の履歴? ● などなど色々な情報があります ※ 実サービスでは複数の情報をきちんと調理することが一番良いと思います.
25.
どのような開発をするのか (1) ●
膨大な配信量 ● たとえば一般的な新聞社 – 配信規模:約 2 億 PV / month – 閲覧者:約 2000 万 UU / month ● 広告配信の場合 – 配信規模も閲覧者も新聞社より多い
26.
どのような開発をするのか (2) ●
配信速度 ● 止めてはいけない ● 金が絡みますので ● 計算量を気にしなくてはならない ● 配信ログ
27.
ログの調理の具体例 ●
Apache Hadoop ● 前と同様 ● Apache Mahout ● 高度な機械学習
28.
まとめ ●
インターネットでサービスするのは大変 ● 技術屋に求められるスキル ● 計算ロジックの説明を求められる ● 配信量が増えるサービスの場合は,突然増えても問 題ないように考えておく ● 運用の手間は少ない方がいい ● 質問あればこちらまで gogokarubi@gmail.com まで
Download