SIGMOD2013勉強会:Social Media
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

SIGMOD2013勉強会:Social Media

on

  • 592 views

dbreadingのSIGMOD2013勉強会の資料です。

dbreadingのSIGMOD2013勉強会の資料です。

Statistics

Views

Total Views
592
Views on SlideShare
358
Embed Views
234

Actions

Likes
0
Downloads
0
Comments
0

3 Embeds 234

http://yamaguchiyuto.hatenablog.com 226
http://blog.hatena.ne.jp 7
http://feedly.com 1

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

SIGMOD2013勉強会:Social Media Presentation Transcript

  • 1. SIGMOD2013 勉強会 Session 8: Social Media 筑波大 山口 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 1
  • 2. session 8: social media ü  Efficient sentiment correlation for large-scale demographics ü  Tsytsarau et al. (Univ. of Trento) ü  EBM - An Entropy-Based Model to Infer Social Strength from Spatiotemporal Data ü  Pham et al. (Univ. of Southern California) ü  Online Search of Overlapping Communities ü  Cui et al. (Fudan Univ.) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 2
  • 3. Efficient Sentiment Correlation for Large-scale Demographics 13/09/07 3 SIGMOD勉強会 - Yuto Yamaguchi Problem: Sentiment Analysis
  • 4. Problem グループごとのsentiment analysisをする研究は少ない ü  例) イタリアの学生の意見、ヨーロッパの10代の意見 扱う問題 ü  ある期間において あるトピックに対するsentimentが似ているグループを探す ü  例) 小学生女子「プリキュア大好き!」    理系大学生男子「プリキュア大好き!」 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 4
  • 5. Data 扱うデータは次のタプルの集合 ü  x = (u, t, s, p) ü  u: ユーザ ü  t: トピック ü  s: センチメント s∈[-1, 1] (1に近いほどプラスの感情) ü  p: 期間 (2013年9月の一ヶ月間とか) ü  x = (誰がいつ何に対してどんな感情を示した) ü  例) x1 = (‘Alice’, ‘Politics’, 0.8, p1) x2 = (‘Bob’, ‘Drama’, -0.5, p2) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 5
  • 6. Demographics それぞれのユーザは Demographic Criteria d をもつ ü  例) d = {age: Young, location: Italy, occupation: Student} Demographicは階層構造を持つ ü  例) Europe = {Italy, France}, Academic = {Prof., Student} Demographic Criteria d は階層構造に従ってLatticeになる 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 6
  • 7. Sentiment Series Demographic Group Ud ü  同じ Demographic Criteria d を持つユーザの集合 Group Sentiment si ü  あるトピック t 、ある時刻 p におけるグループのsentimentの平均 Sentiment Series ü  si の列 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 7
  • 8. Correlated Sentiment Sentiment Correlation (ピアソンの積率相関係数) ü  二つのSentiment seriesがどれだけ似ているか Correlated Sentiment(本論文の問題) ü  あるトピック t 、ある期間 p に対して 相関係数が閾値以上となるDemographic Groupのペアを返す 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 8
  • 9. EBM - An Entropy-Based Model to Infer Social Strength from Spatiotemporal Data 13/09/07 9 SIGMOD勉強会 - Yuto Yamaguchi Problem: Link Prediction
  • 10. Problem LBSN(Location-based social network) ü  Foursquare, Facebook, Twitter, … 問題 ü  チェックイン履歴を用いて友人関係の強さを推定 仮説 ü  同じ場所に同時にチェックイン(共起)する二人は友達っぽい ü  共起の回数が多ければより可能性が高い ü  いろいろな場所で共起すればより可能性が高い ü  人が少ない場所で共起すればより可能性が高い 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 10
  • 11. Social Strength 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 11 sij =αDij + βFij +γ ユーザ i と j のsocial strength ü  大きいほど友達っぽい ü  これを推定したい i と j のdiversity(後述) ü  いろいろな場所で 共起しているかを評価 i と j のweighted frequency(後述) ü  人が少ない場所で 共起しているかを評価 D,Fを説明変数、sを応答変数とする線形回帰で 係数α、β、γを求める
  • 12. Diversity D ユーザ i と j がいろいろな場所で共起しているかどうかを評価 例) ü  友達! → 東京駅で1回、つくば駅で1回、大宮駅で1回共起した二人 ü  友達? → 東京駅で3回共起した二人 エントロピーを用いて評価 ü  共起した場所のベクトルのエントロピーが高いほど友達っぽい ü  例) ü  (1, 1, 1) -> エントロピー大 ü  (3, 0, 0) -> エントロピー小 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 12
  • 13. Weighted Frequency F ユーザ i と j が人の少ない場所で共起しているかどうかを評価 例) ü  友達! → 東京駅のマックと渋谷駅のマックで共起した二人 ü  友達? → 東京駅と渋谷駅で共起した二人 場所のエントロピーを用いて評価 ü  多くの人がチェックインする場所はエントロピーが大きい ü  F = Σk(k での共起回数)×(場所 k のエントロピー) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 13
  • 14. Online Search of Overlapping Communities 13/09/07 14 SIGMOD勉強会 - Yuto Yamaguchi Problem: Community Detection
  • 15. Problem ü  クエリノードv0が与えられた時、v0を含むコミュニティを全て返す ü  Note ü  コミュニティの全列挙ではない ü  オンラインクエリ ü  すぐ結果を返す ü  コミュニティの重複を許す 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 15 ABCDE BFGH v0 = B
  • 16. γ-quasi-k-clique 以下を満たすサブグラフ ü  ノード数がk ü    ü  13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 16 k = 5 γ = 0.9 ≥γ k(k −1) 2 (密度) 0 ≤γ ≤1 完全グラフの 密度 満たさない 満たす
  • 17. Clique Graph 元のグラフから抽出されたクリークを ノードとするグラフ ü  α-adjacency ü  二つのγ-quasi-k-clique(kは同じ)は 少なくともα個のノードを共有する時隣接 ü  Clique component ü  Clique graphにおける連結成分に含まれる クリークの和集合 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 17 Clique graph Original graph k = 4 γ = 1 α = 3
  • 18. (α, γ)-OCS OCS: Overlapping Community Search 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 18 グラフG パラメータk, α, γ クエリノードv0 v0を含む全てのclique componentを見つける が与えられた時
  • 19. Exact Algorithm ü  next_clique() ü  v0を含む、まだ訪れていないγ-quasi-k-cliqueを返す ü  expand() ü  与えたγ-quasi-k-cliqueを含む最大のclique componentを返す 1.  next_clique(v0 = B) 1.  -> ABCE 2.  expand(ABCE) 1.  -> ABCDE 3.  next_clique(v0 = B) 1.  -> BFGH 4.  expand(BFGH) 1.  -> BFGH 5.  終了 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 19 詳細は論文… (近似アルゴリズムもあるよ!)