スケジュール
5/13, 14
Workshop →9個くらい並列
W4A(Web for All) (テーマはPersonalisation(Security, Accessibility))
BIG ビッグデータ系の招待講演
5/15〜17
Keynote
ResearchTrack → 5個くらい並列
W3C
Web of Health 健康・医療分野の発表
The Future of the Open Web
Poster & Demo
The Web Conference(旧WWW) 2019: 5/13〜17
3.
ResearchTrack
● Crowdsourcing andHuman Computation
● Economics, Monetization, and Online Markets
● Health on the Web
● Intelligent Systems and Infrastructure
● Search
● Security, Privacy, and Trust
● Semantics and Knowledge
● Social Network Analysis and Graph Algorithms
● User Modeling, Personalization, and Experience
● Web and Society
● Web Mining and Content Analysis
● Web of Things, Ubiquitous, and Mobile Computing
紹介する研究
5/13, 14
Workshop
W4A(Web forAll)
BIG ビッグデータ系
5/15〜17
Keynote
ResearchTrack
W3C
Web of Health 健康・医療分野
The Future of the Open Web
Poster & Demo
ここから
5つの研究を紹介
8.
❏ BIG
・検索ランキング
“Machine Learning-PoweredSearch Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
9.
❏ BIG
・検索ランキング
“Machine Learning-PoweredSearch Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
❏ BIG
・検索ランキング
“Machine Learning-PoweredSearch Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
Dual Neural PersonalizedRanking
(Seunghyeon Kim Jongwuk Lee Hyunjung Shim)
実験(Dual Representation)
ユーザ側とアイテム側のベクトルを使った方がいい
特に(a)と(b)のデータセットで顕著→ スパースなデータの場合に効いてる
ユーザ側・アイテム側の両方を使った場合と使わない場合の比較
50.
Dual Neural PersonalizedRanking
(Seunghyeon Kim Jongwuk Lee Hyunjung Shim)
実験(Dynamic Negative Sampling)
ランダムサンプリングに比べていい
ランダムサンプリングとdynamicの比較
51.
Dual Neural PersonalizedRanking
(Seunghyeon Kim Jongwuk Lee Hyunjung Shim)
まとめ
ユーザ側とアイテム側の両方のベクトルを使ったことで精度改善した
Dynamic Negative Samplingも効果的
future work
過学習を防ぐ方法
→ 少しずつモデルの複雑度を上げていく みたいなのは必ずしも効果的
ではないので、、
52.
❏ BIG
・検索ランキング
“Machine Learning-PoweredSearch Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
53.
Dynamic Ensemble ofContextual Bandits to Satisfy Users' Changing Interests
(Qingyun Wu Huazheng Wang Yanen Li Hongning Wang)
環境の変化に対応したContextual Banditsの提案
→ ユーザの好みの変化など
たいていの既存のcontextual banditアルゴリズムは
環境が定常であることを前提としている。
54.
Dynamic Ensemble ofContextual Bandits to Satisfy Users' Changing Interests
(Qingyun Wu Huazheng Wang Yanen Li Hongning Wang)
環境の変化に対応したContextual Banditsの提案
例、ニュースサイトのレコメンドにて
選挙が終わると
政治系のニュースの
報酬は急落
→ 変化に敏感なアーム
スポーツ系のニュースは
選挙とか関係ない
→ 不変なアーム
Dynamic Ensemble ofContextual Bandits to Satisfy Users' Changing Interests
(Qingyun Wu Huazheng Wang Yanen Li Hongning Wang)
実験
使ったデータ
・Last FM Dataset
異なるユーザ群を途中で入れて環境の変化をシミュレートしてみた
こちらも提案手法の
CTRが一番高い
64.
Dynamic Ensemble ofContextual Bandits to Satisfy Users' Changing Interests
(Qingyun Wu Huazheng Wang Yanen Li Hongning Wang)
まとめ
非定常な環境でのバンディットの提案
- 環境の変化に対してコンテキスト依存な性質の活用
- Expert/Auditorによるアンサンブルなバンディット
Future Work
- ユーザたちの関心の変化の影響を考慮する
- 変化し続ける環境、定期的な変動への対応
参考: BanditLib
65.
❏ BIG
・検索ランキング
“Machine Learning-PoweredSearch Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
❏ BIG
・検索ランキング
“Machine Learning-PoweredSearch Ranking of Airbnb Experiences.”
❏ [Personalization] In ResearchTrack
・ユーザ側・アイテム側両方の情報を使った推薦
“Dual Neural Personalized Ranking”
・環境の変化に対応したバンディット
“Dynamic Ensemble of Contextual Bandits to Satisfy Users' Changing Interests”
❏ W4A
・旅行先の推薦
“Location Embeddings for Next Trip Recommendation.”
・Webページの画像の代替テキストの評価
“Combining Semantic Tools for Automatic Evaluation of Alternative Texts”
紹介する研究
76.
自動的にWebページのアクセシビリティを評価することは重要
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
すぐに結果がわかるし、コスト削減もできて、ページの一貫性を保つことができる
が、
コンテンツのセマンティックスは解釈できないので、その妥当性までは確認できない。
(例えば、画像のalt属性があってるかどうか)
研究の背景について
77.
Simply Accessible 2015reportによると
Combining Semantic Tools for Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
● 66.36% → 有益な画像だが代替テキストがない
● 20.33% → 代替テキストが役立たず
● 10.35% → 代替テキスト付きの飾り付け画像
● 2.96% → 代替テキストが他のコンテンツの使い回し
Webページ中の画像と代替テキストにありがちな問題点
78.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
● 情報伝達
→ 代替テキストはその内容を記述するべき
● 飾り付け画像
→ 情報はない。null。だから代替テキストもいらない。
● 機能画像(ナビゲーション的な??)
→ 代替テキストはその行動を記述するべき(「詳細ページへ」的な??)
Webページ中の画像の目的とは
代替テキストは、125文字未満の簡易な文言にすべし
Webページの文脈を考慮して情報欠損しないように
"image of"とか"graphic of"とか付けるな
79.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
画像と代替テキストの対応が大事で、
画像に対して代替テキストの質がどの程度のものか評価できるシステムが
あれば嬉しい
(目的が「情報伝達」である画像に限るが、、)
提案する内容
80.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
以下のような点について調べるアルゴリズムを提案
・画像と代替テキストの概念やドメインの関係
・画像のメタデータと代替テキストの関係
・記述の長さ
提案する内容
具体的には、
画像から概念を抽出し、代替テキストとの類似度を計算する。
抽出した概念からドメイン(人物画像ならPerson)を判定して、代替テキストとの類似度計算
81.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
提案する内容
使ったツール
・Clarifai: 画像の概念とドメイン抽出
・Swoogle: 概念と代替テキストのセマンティックな関連性
・spaCy: 代替テキストから固有表現
・Sematch: 固有表現と画像の概念を結びつける
82.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
提案する内容
・画像と代替テキストの概念やドメインの関係
CONCEPTS
portrait
one
people
adult
politician
woman
face
business
festival
leader
代替テキスト
Theresa May delivers a
major speech on Brexit today
概念の抽出 画像の概念と代替テキスト
の類似度を計算Clarifai
Swoogle
83.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
提案する内容
・画像と代替テキストの概念やドメインの関係
CONCEPTS
portrait
one
people
adult
politician
woman
face
business
festival
leader
代替テキスト
Theresa May delivers a
major speech on Brexit today
画像から抽出した概念
画像の概念と代替テキストのドメイン
との類似度を計算
ドメイン
Person
84.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
提案する内容
・画像と代替テキストの概念やドメインの関係
CONCEPTS
portrait
one
people
adult
politician
woman
face
business
festival
leader
代替テキスト
Theresa May delivers a
major speech on Brexit today
画像から抽出した概念
画像の概念と代替テキストのドメイン
との類似度を計算
ドメイン
Person
spaCy
固有表現の抽出
85.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
実験
訓練データ:収集した画像と代替テキスト45個
(代替テキストの質を “very bad”, “bad”, “good”, “very good”の4段階に分類)
テストデータ:149個の画像と代替テキスト
→ badとgoodの二値分類したときの精度評価
86.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
実験
Accuracy: 0.832
Precision: 0.853
Recall: 0.795
F-measure: 0.823
なかなかいい
→ 提案したアルゴリズムで自動的に代替テキストの評価ができそう
87.
Combining Semantic Toolsfor Automatic Evaluation of Alternative Texts
(Carlos Duarte, Carlos M. Duarte, Luís Carriço)
実験
できていない点
・使ったセマンティックサービスの性能に依存する
・英語のみ対応
・ページの文脈は使っていない
・画像の目的が情報伝達かそれ以外かは考慮していない
参考ページ
マッシュアップなのでわかりやすいw