SlideShare a Scribd company logo
1 of 22
A measure of polarization on social
media networks based on
community boundaries.
04/21 2014
D3 大知 正直@東大 松尾研
1
Pedro H. Calais Guerra, Wagner Meira Jr.
Dept. of Computer Science
Universidade Federal de Minas Gerais (UFMG)
Belo Horizonte, MG, Brazil
Claire Cardie, Robert Kleinberg
Dept. of Computer Science
Cornell University
Ithaca, NY 14853 USA
• Propose a polarization metric
– Focus on the boundary node of communities
• Demonstrate the usefulness of the proposal metric
– Tweet network on the gun control issue in the U.S.
• Show the difference between the polarized and non-
polarized network structure.
2
A proposal for a measure of polarization on Social Media Networks
Abstract
Polarized social networkNon-polarized social network
Simple idea:
The “Modularity” metric can’t distinguish the polarization from these
networks
• 「対立」指標の提案
– コミュニティの境界となるノードに注目することが特徴
• 提案した指標の有効性の検証
– 銃規制のTweetのネットワークを利用
• 「対立」の構造を示す.
3
ネットワークの「対立」の程度を計測する手法の提案する論文.
Abstract
「対立」のあるネットワーク「対立」の無いネットワーク
直感的なイメージ:
モジュラリティでは以下の2つのネットワークに違いをつけること
はできない
1. 差別や政治的対立を引き起こし,より極端な対
立を産む(Paul DiMaggio 1996, Mouw and
Sobel 2001).
2. 意見解析の重要な情報になる可能性.
– 偏った意見を持つ人は,別の議論でも偏った意見を
持ちやすいので,別の議論での偏りを検出するのに
役立つ(Calais 2011, Tan 2011).
3. ディベートの場合,意見の変更を検出できる.
(Walton 1991)
4
ネットワーク内の議論の偏りを検出することの重要性
1. Introduction
• モジュラリティ(Modularity)はコミュニティの分
割の「質」を定量化するが,コミュニティ間の
関係性を定量化していない.
• 本論文の目的
1. コミュニティ間の対立を計測する指標の提案
2. 対立のあるコミュニティと無いコミュニティの構造
的な違いを明らかにすること.
3. 銃規制に関するTwitterのネットワークを利用して,
提案した指標の有効性を示すこと.
5
モジュラリティでは計測できない意見の偏りを検出する.
1. Introduction
(参考)モジュラリティの式
同じクラスタ内のエッジの割合と(別のクラ
スタへのエッジの割合)^2の差の合計
• 意見の対立の研究:同じエッセイを読ませたあ
とに死刑に関する対立がより明確になった事例
(Lord, Ross, and Lepper 1979).
• モジュラリティを意見対立の指標とする研究
(Zhang 2008, Waugh 2009, Adamic and Glance
2005, Conover 2011, Livne 2011)
– 政治に関するブログ,議会の政党間の関係など元々
対立があるデータを利用している.
– 意見の対立の無いのネットワークでは用いられてな
いので,モジュラリティが適切な指標か不明
6
意見の対立に関する研究
2. 関連研究
• 使用データ
1. University Friendships’ Network:
– Facebook上でのブラジルの大学の先生,生徒の友達
関係
2. Brazilian Soccer Supporters:
– CruzeiroとAtleico Mineiroという有名なライバル関係
にあるサッカーチームに関するTweetのリツイート
ネットワーク.
– ノードはユーザ,エッジがリツイート.
– リツイートは基本的に「支持」を意味する行為らし
い(Calais 2011)
7
使用データは対立関係がある場合,無い場合含めて6種類
3. モジュラリティで様々なソーシャルネットワークを比較してみる
• 使用データ
3. New York City Sports Teams:
– 異なるスポーツのチーム,Giants(football)と
Knicks(basketball)に関するリツイートネットワーク.
– ノードがユーザ,エッジがリツイート
– ユーザは「両方のチーム」についてリツイートした
ことのあるユーザに限定する.
4. Karate’s Club:
– 1970年代のUSの大学の空手部34人の友達関係.
– 管理者とコーチに対立があって,最終的にメンバー
の半分を連れてコーチが新しいクラブを作った
(Zachary 1977).
8
使用データは対立関係がある場合,無い場合含めて6種類
3. モジュラリティで様々なソーシャルネットワークを比較してみる
• 使用データ
5. 2004 U.S. Political Blogosphere:
– リベラルと保守の立場を取ったUSの政治に関するブ
ログ群(Adamic and Glance 2005)
– ノードはブログ,エッジはリンク関係
6. Gun Control: 2012年12月にあったコネチカッ
ト州の銃撃事件に関するリツイート関係.
– “gun control”, “guns”, “mass shootings”, “NRA”とい
うキーワードを含むツイートを対象.
9
使用データは対立関係がある場合,無い場合含めて6種類
3. モジュラリティで様々なソーシャルネットワークを比較してみる
• データ概要
• コミュニティ検出
– 2-University, 4-Brazilian Soccer Teams, 6-Gun Control
• モジュラリティ最大化アルゴリズム(Blondel 2008): Gephiで
パッケージ化されているものを利用
– 1-NYC Teams: ユーザのリツイートを数え,ハッシュ
タグの数が多かった方のチームに所属させる.
– 3-Karate’s Club: データセット内で提供されたものを
使用 10
使用データまとめ
3. モジュラリティで様々なソーシャルネットワークを比較してみる
対立無し
対立有り
• データ概要
• モジュラリティでも対立関係のあるネットワークでは高
い値を示しているが・・・
1. 1,2でも正の値を示しているので,1,2でも対立関係があるかの
ような値になってしまっている.
2. 対立が強化されてもモジュラリティの変化が少なかった事例が
報告されている.(Zhang 2008, Conover 2011)
3. グラフの大きさが異なる場合,モジュラリティで比較すること
は実用的ではない(Fortunato and Bathelemy 2007).
11
モジュラリティを対立の指標として使用することの問題点
3. モジュラリティで様々なソーシャルネットワークを比較してみる
対立無し
対立有り
• モジュラリティでコミュニティの対立を検出で
きるかはっきりしない.
12
モジュラリティでは対立の閾値がよくわからない例
3. モジュラリティで様々なソーシャルネットワークを比較してみる
対立無し 対立有り
• 境界ノードの定義
– モジュラリティは,homophily(同類性)と
antagonism(対立)をまとめて定量化してしまっている
– 「対立」部分にだけ注目したい→境界ノードに注目
1. ノードv ∈ 𝐺𝑖が別のコミュニティ𝐺𝑗に1つ以上のエッ
ジを持っている.
2. ノードv ∈ 𝐺𝑖が別のコミュニティ𝐺𝑗にエッジを持っ
ていない同じコミュニティ𝐺𝑖のノードに1つ以上の
エッジを持っている.
13
境界ノードを定義することで対立を検出する.
4. コミュニティ境界上での対立(polarization)の計測(提案手法).
式で表したもの
• 内部ノードの定義
• 図で説明
– 境界ノード
• {b,d},{1,2}
– 内部ノード
• {a,c},{3,4}
• 境界エッジ({(b,1), (d,2)})
• 内部エッジ({(a,b),(c,d),(1,3),(2,4)})
• {(b,d),(a,c),(1,2),(3,4)}はどちらのエッジでも無い. 14
境界ノードを定義することで対立を検出する.
4. コミュニティ境界上での対立(polarization)の計測(提案手法).
※ この定義だとノードeも内部
ノードに含まれるので間違ってい
る気がする.
• 定義:内部エッジの割合が多いほど対立してい
る.
– |B|: 境界ノードの数
– 𝑑 𝑏:そのノードの境界エッジの数
– 𝑑𝑖:そのノードの内部エッジの数
• 計算結果:
15
対立を計測する指標の提案
4. コミュニティ境界上での対立(polarization)の計測(提案手法).
• 各ノードの値の分布
– ブラジルのサッカーチーム
• 内部エッジを多く持つ境界
ノードが多い.
– NYのチーム
• 外部エッジを多く持つ境界
ノードも同じくらい多い.
16
対立を計測する指標の提案
4. コミュニティ境界上での対立(polarization)の計測(提案手法).
• GC2-3に対立は無さそう
17
2つより多いコミュニティでの有効性の検証
5. 銃規制に関する議論の意見分析
• GC1 銃規制反対派,GC2,3は銃規制派でうまく
分かれている.
• 同じ事件(中国のナイフによる殺傷事件)を自
分の立場を守るようにしてツイートしている.
18
実際のツイート内容で確認
5. 銃規制に関する議論の意見分析
• スピアマンの順位相関係数による評価
– 境界ノードのみを対象
– 𝑟:次数の大きい順にソート
– 𝑟𝑏:境界エッジの次数の大きい順にソート
• ブラジルの大学の友達関係の場合
– ρ=0.84
– 対立が存在しないことの良
い指標になりそう.
19
「対立」の幾何的な構造の調査
6. 境界上の次数の高いノード
• 銃規制のデータに適用
– GC2-3ではρが高いが他は低い結果.
– 「対立」の無いネットワークでは,境界ノードに高
次数のノードが集中する傾向がありそう.
20
「対立」の幾何的な構造の調査
6. 境界上の次数の高いノード
必ずそうとは限らな
いらしい
• 結論
– 「対立」を計測する指標の提案
• 特にモジュラリティが同類性(homophily)と対立(antagonism)
を同時に計算してしまっている部分から,対立の部分のみを
取り出すようにした点.
– 様々なネットワークデータ上で評価
– 「対立」しているネットワークの場合,次数の大き
いノードは境界上には集中しないことを示した.
• 今後の課題
– 「無関心」状態を取り入れた多極性のモデリング
– 態度の変化点(支持→反対)の検出
21
7. 結論と今後の課題
22

More Related Content

Viewers also liked (6)

A Unifying Review of Gaussian Linear Models (Roweis 1999)
A Unifying Review of Gaussian Linear Models (Roweis 1999)A Unifying Review of Gaussian Linear Models (Roweis 1999)
A Unifying Review of Gaussian Linear Models (Roweis 1999)
 
ACL2014読み会@小町研 “Identifying Real-Life Complex Task Names with Task-Intrinsic ...
ACL2014読み会@小町研 “Identifying Real-Life Complex Task Names with Task-Intrinsic ...ACL2014読み会@小町研 “Identifying Real-Life Complex Task Names with Task-Intrinsic ...
ACL2014読み会@小町研 “Identifying Real-Life Complex Task Names with Task-Intrinsic ...
 
Real time bidding algorithms for performance-based display ad allocation
Real time bidding algorithms for performance-based display ad allocationReal time bidding algorithms for performance-based display ad allocation
Real time bidding algorithms for performance-based display ad allocation
 
Simple Introduction to AutoEncoder
Simple Introduction to AutoEncoderSimple Introduction to AutoEncoder
Simple Introduction to AutoEncoder
 
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
 
Real time bid optimization with smooth budget delivery in online advertising
Real time bid optimization with smooth budget delivery in online advertisingReal time bid optimization with smooth budget delivery in online advertising
Real time bid optimization with smooth budget delivery in online advertising
 

A measureofpolarizationonsocialmedianetworksbasedoncommunityboundaries

  • 1. A measure of polarization on social media networks based on community boundaries. 04/21 2014 D3 大知 正直@東大 松尾研 1 Pedro H. Calais Guerra, Wagner Meira Jr. Dept. of Computer Science Universidade Federal de Minas Gerais (UFMG) Belo Horizonte, MG, Brazil Claire Cardie, Robert Kleinberg Dept. of Computer Science Cornell University Ithaca, NY 14853 USA
  • 2. • Propose a polarization metric – Focus on the boundary node of communities • Demonstrate the usefulness of the proposal metric – Tweet network on the gun control issue in the U.S. • Show the difference between the polarized and non- polarized network structure. 2 A proposal for a measure of polarization on Social Media Networks Abstract Polarized social networkNon-polarized social network Simple idea: The “Modularity” metric can’t distinguish the polarization from these networks
  • 3. • 「対立」指標の提案 – コミュニティの境界となるノードに注目することが特徴 • 提案した指標の有効性の検証 – 銃規制のTweetのネットワークを利用 • 「対立」の構造を示す. 3 ネットワークの「対立」の程度を計測する手法の提案する論文. Abstract 「対立」のあるネットワーク「対立」の無いネットワーク 直感的なイメージ: モジュラリティでは以下の2つのネットワークに違いをつけること はできない
  • 4. 1. 差別や政治的対立を引き起こし,より極端な対 立を産む(Paul DiMaggio 1996, Mouw and Sobel 2001). 2. 意見解析の重要な情報になる可能性. – 偏った意見を持つ人は,別の議論でも偏った意見を 持ちやすいので,別の議論での偏りを検出するのに 役立つ(Calais 2011, Tan 2011). 3. ディベートの場合,意見の変更を検出できる. (Walton 1991) 4 ネットワーク内の議論の偏りを検出することの重要性 1. Introduction
  • 5. • モジュラリティ(Modularity)はコミュニティの分 割の「質」を定量化するが,コミュニティ間の 関係性を定量化していない. • 本論文の目的 1. コミュニティ間の対立を計測する指標の提案 2. 対立のあるコミュニティと無いコミュニティの構造 的な違いを明らかにすること. 3. 銃規制に関するTwitterのネットワークを利用して, 提案した指標の有効性を示すこと. 5 モジュラリティでは計測できない意見の偏りを検出する. 1. Introduction (参考)モジュラリティの式 同じクラスタ内のエッジの割合と(別のクラ スタへのエッジの割合)^2の差の合計
  • 6. • 意見の対立の研究:同じエッセイを読ませたあ とに死刑に関する対立がより明確になった事例 (Lord, Ross, and Lepper 1979). • モジュラリティを意見対立の指標とする研究 (Zhang 2008, Waugh 2009, Adamic and Glance 2005, Conover 2011, Livne 2011) – 政治に関するブログ,議会の政党間の関係など元々 対立があるデータを利用している. – 意見の対立の無いのネットワークでは用いられてな いので,モジュラリティが適切な指標か不明 6 意見の対立に関する研究 2. 関連研究
  • 7. • 使用データ 1. University Friendships’ Network: – Facebook上でのブラジルの大学の先生,生徒の友達 関係 2. Brazilian Soccer Supporters: – CruzeiroとAtleico Mineiroという有名なライバル関係 にあるサッカーチームに関するTweetのリツイート ネットワーク. – ノードはユーザ,エッジがリツイート. – リツイートは基本的に「支持」を意味する行為らし い(Calais 2011) 7 使用データは対立関係がある場合,無い場合含めて6種類 3. モジュラリティで様々なソーシャルネットワークを比較してみる
  • 8. • 使用データ 3. New York City Sports Teams: – 異なるスポーツのチーム,Giants(football)と Knicks(basketball)に関するリツイートネットワーク. – ノードがユーザ,エッジがリツイート – ユーザは「両方のチーム」についてリツイートした ことのあるユーザに限定する. 4. Karate’s Club: – 1970年代のUSの大学の空手部34人の友達関係. – 管理者とコーチに対立があって,最終的にメンバー の半分を連れてコーチが新しいクラブを作った (Zachary 1977). 8 使用データは対立関係がある場合,無い場合含めて6種類 3. モジュラリティで様々なソーシャルネットワークを比較してみる
  • 9. • 使用データ 5. 2004 U.S. Political Blogosphere: – リベラルと保守の立場を取ったUSの政治に関するブ ログ群(Adamic and Glance 2005) – ノードはブログ,エッジはリンク関係 6. Gun Control: 2012年12月にあったコネチカッ ト州の銃撃事件に関するリツイート関係. – “gun control”, “guns”, “mass shootings”, “NRA”とい うキーワードを含むツイートを対象. 9 使用データは対立関係がある場合,無い場合含めて6種類 3. モジュラリティで様々なソーシャルネットワークを比較してみる
  • 10. • データ概要 • コミュニティ検出 – 2-University, 4-Brazilian Soccer Teams, 6-Gun Control • モジュラリティ最大化アルゴリズム(Blondel 2008): Gephiで パッケージ化されているものを利用 – 1-NYC Teams: ユーザのリツイートを数え,ハッシュ タグの数が多かった方のチームに所属させる. – 3-Karate’s Club: データセット内で提供されたものを 使用 10 使用データまとめ 3. モジュラリティで様々なソーシャルネットワークを比較してみる 対立無し 対立有り
  • 11. • データ概要 • モジュラリティでも対立関係のあるネットワークでは高 い値を示しているが・・・ 1. 1,2でも正の値を示しているので,1,2でも対立関係があるかの ような値になってしまっている. 2. 対立が強化されてもモジュラリティの変化が少なかった事例が 報告されている.(Zhang 2008, Conover 2011) 3. グラフの大きさが異なる場合,モジュラリティで比較すること は実用的ではない(Fortunato and Bathelemy 2007). 11 モジュラリティを対立の指標として使用することの問題点 3. モジュラリティで様々なソーシャルネットワークを比較してみる 対立無し 対立有り
  • 13. • 境界ノードの定義 – モジュラリティは,homophily(同類性)と antagonism(対立)をまとめて定量化してしまっている – 「対立」部分にだけ注目したい→境界ノードに注目 1. ノードv ∈ 𝐺𝑖が別のコミュニティ𝐺𝑗に1つ以上のエッ ジを持っている. 2. ノードv ∈ 𝐺𝑖が別のコミュニティ𝐺𝑗にエッジを持っ ていない同じコミュニティ𝐺𝑖のノードに1つ以上の エッジを持っている. 13 境界ノードを定義することで対立を検出する. 4. コミュニティ境界上での対立(polarization)の計測(提案手法). 式で表したもの
  • 14. • 内部ノードの定義 • 図で説明 – 境界ノード • {b,d},{1,2} – 内部ノード • {a,c},{3,4} • 境界エッジ({(b,1), (d,2)}) • 内部エッジ({(a,b),(c,d),(1,3),(2,4)}) • {(b,d),(a,c),(1,2),(3,4)}はどちらのエッジでも無い. 14 境界ノードを定義することで対立を検出する. 4. コミュニティ境界上での対立(polarization)の計測(提案手法). ※ この定義だとノードeも内部 ノードに含まれるので間違ってい る気がする.
  • 15. • 定義:内部エッジの割合が多いほど対立してい る. – |B|: 境界ノードの数 – 𝑑 𝑏:そのノードの境界エッジの数 – 𝑑𝑖:そのノードの内部エッジの数 • 計算結果: 15 対立を計測する指標の提案 4. コミュニティ境界上での対立(polarization)の計測(提案手法).
  • 16. • 各ノードの値の分布 – ブラジルのサッカーチーム • 内部エッジを多く持つ境界 ノードが多い. – NYのチーム • 外部エッジを多く持つ境界 ノードも同じくらい多い. 16 対立を計測する指標の提案 4. コミュニティ境界上での対立(polarization)の計測(提案手法).
  • 18. • GC1 銃規制反対派,GC2,3は銃規制派でうまく 分かれている. • 同じ事件(中国のナイフによる殺傷事件)を自 分の立場を守るようにしてツイートしている. 18 実際のツイート内容で確認 5. 銃規制に関する議論の意見分析
  • 19. • スピアマンの順位相関係数による評価 – 境界ノードのみを対象 – 𝑟:次数の大きい順にソート – 𝑟𝑏:境界エッジの次数の大きい順にソート • ブラジルの大学の友達関係の場合 – ρ=0.84 – 対立が存在しないことの良 い指標になりそう. 19 「対立」の幾何的な構造の調査 6. 境界上の次数の高いノード
  • 20. • 銃規制のデータに適用 – GC2-3ではρが高いが他は低い結果. – 「対立」の無いネットワークでは,境界ノードに高 次数のノードが集中する傾向がありそう. 20 「対立」の幾何的な構造の調査 6. 境界上の次数の高いノード 必ずそうとは限らな いらしい
  • 21. • 結論 – 「対立」を計測する指標の提案 • 特にモジュラリティが同類性(homophily)と対立(antagonism) を同時に計算してしまっている部分から,対立の部分のみを 取り出すようにした点. – 様々なネットワークデータ上で評価 – 「対立」しているネットワークの場合,次数の大き いノードは境界上には集中しないことを示した. • 今後の課題 – 「無関心」状態を取り入れた多極性のモデリング – 態度の変化点(支持→反対)の検出 21 7. 結論と今後の課題
  • 22. 22