Your SlideShare is downloading. ×
  • Like
SIGMOD2013勉強会:Social Media
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Now you can save presentations on your phone or tablet

Available for both IPhone and Android

Text the download link to your phone

Standard text messaging rates apply

SIGMOD2013勉強会:Social Media

  • 458 views
Published

dbreadingのSIGMOD2013勉強会の資料です。

dbreadingのSIGMOD2013勉強会の資料です。

Published in Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
458
On SlideShare
0
From Embeds
0
Number of Embeds
3

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. SIGMOD2013 勉強会 Session 8: Social Media 筑波大 山口 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 1
  • 2. session 8: social media ü  Efficient sentiment correlation for large-scale demographics ü  Tsytsarau et al. (Univ. of Trento) ü  EBM - An Entropy-Based Model to Infer Social Strength from Spatiotemporal Data ü  Pham et al. (Univ. of Southern California) ü  Online Search of Overlapping Communities ü  Cui et al. (Fudan Univ.) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 2
  • 3. Efficient Sentiment Correlation for Large-scale Demographics 13/09/07 3 SIGMOD勉強会 - Yuto Yamaguchi Problem: Sentiment Analysis
  • 4. Problem グループごとのsentiment analysisをする研究は少ない ü  例) イタリアの学生の意見、ヨーロッパの10代の意見 扱う問題 ü  ある期間において あるトピックに対するsentimentが似ているグループを探す ü  例) 小学生女子「プリキュア大好き!」    理系大学生男子「プリキュア大好き!」 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 4
  • 5. Data 扱うデータは次のタプルの集合 ü  x = (u, t, s, p) ü  u: ユーザ ü  t: トピック ü  s: センチメント s∈[-1, 1] (1に近いほどプラスの感情) ü  p: 期間 (2013年9月の一ヶ月間とか) ü  x = (誰がいつ何に対してどんな感情を示した) ü  例) x1 = (‘Alice’, ‘Politics’, 0.8, p1) x2 = (‘Bob’, ‘Drama’, -0.5, p2) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 5
  • 6. Demographics それぞれのユーザは Demographic Criteria d をもつ ü  例) d = {age: Young, location: Italy, occupation: Student} Demographicは階層構造を持つ ü  例) Europe = {Italy, France}, Academic = {Prof., Student} Demographic Criteria d は階層構造に従ってLatticeになる 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 6
  • 7. Sentiment Series Demographic Group Ud ü  同じ Demographic Criteria d を持つユーザの集合 Group Sentiment si ü  あるトピック t 、ある時刻 p におけるグループのsentimentの平均 Sentiment Series ü  si の列 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 7
  • 8. Correlated Sentiment Sentiment Correlation (ピアソンの積率相関係数) ü  二つのSentiment seriesがどれだけ似ているか Correlated Sentiment(本論文の問題) ü  あるトピック t 、ある期間 p に対して 相関係数が閾値以上となるDemographic Groupのペアを返す 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 8
  • 9. EBM - An Entropy-Based Model to Infer Social Strength from Spatiotemporal Data 13/09/07 9 SIGMOD勉強会 - Yuto Yamaguchi Problem: Link Prediction
  • 10. Problem LBSN(Location-based social network) ü  Foursquare, Facebook, Twitter, … 問題 ü  チェックイン履歴を用いて友人関係の強さを推定 仮説 ü  同じ場所に同時にチェックイン(共起)する二人は友達っぽい ü  共起の回数が多ければより可能性が高い ü  いろいろな場所で共起すればより可能性が高い ü  人が少ない場所で共起すればより可能性が高い 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 10
  • 11. Social Strength 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 11 sij =αDij + βFij +γ ユーザ i と j のsocial strength ü  大きいほど友達っぽい ü  これを推定したい i と j のdiversity(後述) ü  いろいろな場所で 共起しているかを評価 i と j のweighted frequency(後述) ü  人が少ない場所で 共起しているかを評価 D,Fを説明変数、sを応答変数とする線形回帰で 係数α、β、γを求める
  • 12. Diversity D ユーザ i と j がいろいろな場所で共起しているかどうかを評価 例) ü  友達! → 東京駅で1回、つくば駅で1回、大宮駅で1回共起した二人 ü  友達? → 東京駅で3回共起した二人 エントロピーを用いて評価 ü  共起した場所のベクトルのエントロピーが高いほど友達っぽい ü  例) ü  (1, 1, 1) -> エントロピー大 ü  (3, 0, 0) -> エントロピー小 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 12
  • 13. Weighted Frequency F ユーザ i と j が人の少ない場所で共起しているかどうかを評価 例) ü  友達! → 東京駅のマックと渋谷駅のマックで共起した二人 ü  友達? → 東京駅と渋谷駅で共起した二人 場所のエントロピーを用いて評価 ü  多くの人がチェックインする場所はエントロピーが大きい ü  F = Σk(k での共起回数)×(場所 k のエントロピー) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 13
  • 14. Online Search of Overlapping Communities 13/09/07 14 SIGMOD勉強会 - Yuto Yamaguchi Problem: Community Detection
  • 15. Problem ü  クエリノードv0が与えられた時、v0を含むコミュニティを全て返す ü  Note ü  コミュニティの全列挙ではない ü  オンラインクエリ ü  すぐ結果を返す ü  コミュニティの重複を許す 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 15 ABCDE BFGH v0 = B
  • 16. γ-quasi-k-clique 以下を満たすサブグラフ ü  ノード数がk ü    ü  13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 16 k = 5 γ = 0.9 ≥γ k(k −1) 2 (密度) 0 ≤γ ≤1 完全グラフの 密度 満たさない 満たす
  • 17. Clique Graph 元のグラフから抽出されたクリークを ノードとするグラフ ü  α-adjacency ü  二つのγ-quasi-k-clique(kは同じ)は 少なくともα個のノードを共有する時隣接 ü  Clique component ü  Clique graphにおける連結成分に含まれる クリークの和集合 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 17 Clique graph Original graph k = 4 γ = 1 α = 3
  • 18. (α, γ)-OCS OCS: Overlapping Community Search 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 18 グラフG パラメータk, α, γ クエリノードv0 v0を含む全てのclique componentを見つける が与えられた時
  • 19. Exact Algorithm ü  next_clique() ü  v0を含む、まだ訪れていないγ-quasi-k-cliqueを返す ü  expand() ü  与えたγ-quasi-k-cliqueを含む最大のclique componentを返す 1.  next_clique(v0 = B) 1.  -> ABCE 2.  expand(ABCE) 1.  -> ABCDE 3.  next_clique(v0 = B) 1.  -> BFGH 4.  expand(BFGH) 1.  -> BFGH 5.  終了 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 19 詳細は論文… (近似アルゴリズムもあるよ!)