More Related Content Similar to ユーザーサイド情報検索システム (20) ユーザーサイド情報検索システム2. 2 / 28 KYOTO UNIVERSITY
京大で最適輸送・GNN・推薦システムを研究しています
佐藤 竜馬(さとう りょうま)
京都大学 鹿島・山田研究室 博士一年
研究分野:
グラフニューラルネットワーク
Approximation Ratios of Graph Neural Networks for Combinatorial Problems. NeurIPS 2019.
Random Features Strengthen Graph Neural Networks. SDM 2021.
Constant Time Graph Neural Networks. TKDD 2022.
最適輸送(宣伝: 機械学習プロフェッショナルシリーズより本が出ます)
Fast Unbalanced Optimal Transport on a Tree. NeurIPS 2020.
Supervised Tree-Wasserstein Distance. ICML 2021. (共著)
Fixed Support Tree-Sliced Wasserstein Barycenter. AISTATS 2022.(共著)
推薦システム・情報検索システム(本日のテーマ)
Private Recommender Systems: How Can Users Build Their Own Fair Recommender Systems without
Log Data? SDM 2022.
Retrieving Black-box Optimal Images from External Databases. WSDM 2022.
Enumerating Fair Packages for Group Recommendations. WSDM 2022.
講演者近影
3. 3 KYOTO UNIVERSITY
推薦・検索システムに不満を持ったことはないですか
IMDb 「トイ・ストーリー」への推薦。
推薦されるまでもなく知ってる情報。
アメリカ映画・ディズニー映画ばかりだけど、
トイ・ストーリーに似た邦画も知りたい。
たった数件しか推薦がない。
もっと長い推薦リストが欲しい。
「社長」の Google 画像検索結果。
男性の画像しか出てこない。
https://www.google.com/search?q=%E7%A4%BE%E9%95%B7&tbm=isch
https://www.imdb.com/title/tt0114709/
flickr の検索フォーム。
テキスト検索しかできないけど、
類似画像検索もしたい。
https://www.flickr.com/
10. 10 KYOTO UNIVERSITY
今回は二つのユーザーサイドシステムを紹介する
具体的なユーザーサイドの推薦・検索システムを二つ紹介
1. Private Recommender Systems: How Can Users Build Their Own Fair
Recommender Systems without Log Data? (SDM 2022)
アイテムからアイテムへの推薦(「トイ・ストーリー」へのおすすめの映画)において、
ユーザーサイドの推薦システムを構築方法を提案
ユーザーサイドの推薦システムをプライベート推薦システムと命名
ユーザーサイドシステムをはじめてやった研究
2. Retrieving Black-box Optimal Images from External Databases
(WSDM 2022)
画像共有サービスのユーザーが独自の画像検索システム(類似画像検索・自分の
好みに沿った画像検索)を構築する方法を提案
11. 11 KYOTO UNIVERSITY
Private Recommender Systems: How Can Users Build Their Own Fair
Recommender Systems without Log Data? (SDM 2022)
12. 12 KYOTO UNIVERSITY
アイテム-アイテム推薦を考える
問題設定:
アイテム to アイテムの推薦を考える
映画の推薦 @IMDb
アイテム: 映画
トイ・ストーリーを見ている人は
こちらも見ています
ユーザーの推薦 @Twitter
アイテム: ユーザー
広瀬すずをフォローしている人は
こちらもフォローしています
商品の推薦 @Amazon
アイテム: 商品
解析概論を買った人は
こちらも買っています
https://www.imdb.com/title/tt0114709/
https://twitter.com/Suzu_Mg
https://www.amazon.co.jp/dp/4000052098
16. 16 KYOTO UNIVERSITY
提案法は推薦グラフ上で類似度高い順に推薦
提案法1: PrivateRank
推薦を生成したいソースアイテムに対して
推薦グラフの他ノードの personalized PageRank (PPR,
グラフノードの近接性の指標) を計算
アイテムを PPR の順にソートし、各センシティブ属性が均等に
含まれるように上から取っていく
提案法2: PrivateWalk
推薦を生成したいソースアイテムから推薦グラフ上で
ランダムウォークを実行し、各センシティブ属性が均等に
含まれるように訪れた順にアイテムを追加していく
パフォーマンス高
計算効率低
パフォーマンス低
計算効率高
17. 17 KYOTO UNIVERSITY
実験により提案法の効果を確認
実験:
Adult, MovieLens, Amazon, LastFM データセットなどで
定量的に効果を確認
IMDb と Twitter 上で実際に PrivateWalk を動かした
ケーススタディ(下表)
実際の IMDb 推薦 PrivateWalk
トイ・ストーリー3(米) トイ・ストーリー3(米)
トイ・ストーリー2(米) リメンバーミー(米)
ファインディングニモ(米) ミスターインクレディブル(米)
モンスターズインク(米) 千と千尋の神隠し(日)
カールじいさんの空飛ぶ家(米) 天空の城ラピュタ(日)
ウォーリー(米) ハウルの動く城(日)
実際の Twitter 推薦 PrivateWalk
ジム・キャリー(男) ジム・キャリー(男)
ヒュー・ジャックマン(男) サラ・シルヴァーマン(女)
サミュエル・ジャクソン(男) ヒュー・ジャックマン(男)
ドゥウェイン・ジョンソン(男) サミュエル・ジャクソン(男)
セス・マクファーレン(男) エマ・ワトソン(女)
サラ・シルヴァーマン(女) アリッサ・ミラノ(女)
IMDb 上でトイ・ストーリーに対する推薦
日米映画が同数になるよう変換
Twitter 上でトム・ハンクスに対する推薦
男女が同数になるよう変換
21. 21 KYOTO UNIVERSITY
ナイーブな手法は効率が悪く実行できない
ごくナイーブな手法は Flickr から画像を大量にクローリング
してきて、一つ一つ f を評価し、最もスコアの高かった手法を返す
しかし...
1. 通信コストが非常に高い
2. 計算コストが非常に高い
3. 大量アクセスにより API or アクセス 制限に引っかかる
たとえば Flickr では 3600 クエリ / hour 制限あり
一介のユーザーは高コストのクローリングや関数評価を気軽にできない
通信コスト・計算コスト・API クエリ発行回数の観点で効率的な
手法が望ましい
22. 22 KYOTO UNIVERSITY
適応的に検索クエリを発行して良い画像を探す
アイデア1: 検索クエリ or 検索 API を利用する
Flickr の場合は flickr.photos.search API など
アイデア2: がむしゃらに画像を取ってくるのではなく、
f(X) が高い画像がありそうな場所にアタリを付けつつ、
適応的に検索クエリを発行する
(1) 検索クエリ発行
(2) 検索結果画像 X を観測
(3) f(X) を評価
(4) モデルを更新
検索クエリ
(q = cat)
画像
ユーザー
サーバー
25. 25 KYOTO UNIVERSITY
Flickr の実環境で有効性を確認した
実際の Flickr API を使って提案法 Tiara を検証:
200 クエリほどで良い画像を取得できた
Flickr には類似画像検索機能がないが、提案法により
(Flickr 社員でない私が)Flickr 上に実装できた
f(X) ≡ ImageNet モデルの
``Black Swan” クラスロジット
f(X) ≡ PretrainedResNet
cos(X, )
t = 10 t = 100 t = 200
t = 50 t = 300 t = 400 t = 500
類似画像検索
28. 28 KYOTO UNIVERSITY
文献
Ryoma Sato. Private Recommender Systems: How Can Users Build
Their Own Fair Recommender Systems without Log Data? SDM 2022.
arXiv: https://arxiv.org/abs/2105.12353
GitHub: https://github.com/joisino/private-recsys
Ryoma Sato. Retrieving Black-box Optimal Images from External
Databases. WSDM 2022.
arXiv: https://arxiv.org/abs/2112.14921
GitHub: https://github.com/joisino/tiara