ソーシャルビッグデータ・オー
プンデータによる社会構造変化
の発⾒
2017/11/24 – 第3回ウェブサイエンス研究会
CyberAgent, Inc. All Rights Reserved
株式会社サイバーエージェント
技術本部 秋葉原ラボ
⾼野雅典
1
2
⾼野 雅典(データマイニングエンジニア/@mtknnktm)
●仕事: サイバーエージェントの⾃社メディア・ゲームの
データ分析関連もろもろ + 研究
その前はシステムエンジニア@前職SIer、JavaScriptエンジニア@CyberAgent
学⽣時代の専⾨は 複雑系・⼈⼯⽣命。博⼠(情報科学)
●研究の興味: 協調⾏動・社会的知性
●所属 秋葉原ラボ: メディアサービスのデータ関連R&D組織
- Publication List: https://www.cyberagent.co.jp/techinfo/labo/research_list/
3
会社で社会科学
の研究をしてい
る動機
4
• ⾮常に多くの⼈がWebを利⽤
・Facebookの⽉間アクティブユーザは20億⼈
(全⼈類の30%弱!)
• Webでは様々な社会現象が発⽣
・時空間制約の弱い社会関係
・情報カスケード、バースト、炎上
・未成年事犯
etc.
• “Web社会” の現象を科学する必要性
Web社会の科学
5
• コミュニケーション・交流
・アメーバピグ、タップル、ソーシャルゲーム
• 情報メディア
・AbemaTV、アメーバブログ、新R25
サイバーエージェントのメディア・ゲーム事業
6
サイバーエージェントはWebという世界で
ビジネスをしている会社
・弊社のサービスが社会に与える影響
・弊社/他社のサービス上での社会問題
・Web社会の課題解決・健全性維持
→ Web社会、Webと社会の理解が必要
直近で役⽴つというより、今後のWebの世界が良くなるための知
⾒発⾒を⽬標としています(主な成果は知⾒の共有(i.e. 論⽂出版))
Web社会の研究が活発になればWeb系企業もうれしい
サイバーエージェントと社会科学
7
これまでの研究
1. ゲームプレイヤーの協調⾏動
- Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Lightweight Interactions for Reciprocal Cooperation in a Social Network Game",
The 8th International Conference on Social Informatics (SocInfo), 2016.
- Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Reciprocal Altruism-based Cooperation in a Social Network Game",
New Generation Computing, Vol. 34, No. 3, pp. 257-271, 2016.
- Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Environmentally Driven Migration in a Social Network Game",
Scientific Reports, 5, 12481; doi: 10.1038/srep12481 (2015).
2. コミュニケーション⽅法と
社会構造
- Masanori Takano, "Two Types of Social Grooming discovered in Primitive and Modern Communication Data-Sets", 2017 (under review).
- Masanori Takano and Ichiro Fukuda, “Limitations of Time Resources in Human Relationships Determine Social Structures”,
Palgrave Communications, Vol. 3, 17014, 2017.
3. 仮想社会でのいじめ悩み相談
- ⾼野雅典, ⾓⽥孝昭, "仮想社会におけるソーシャルサポート効果の検証 〜 ピグパーティにおけるいじめ相談 〜", 教育⼯学研究会, 2017.
8
本⽇お話する内容
1. ゲームプレイヤーの協調⾏動
- Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Lightweight Interactions for Reciprocal Cooperation in a Social Network Game",
The 8th International Conference on Social Informatics (SocInfo), 2016.
- Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Reciprocal Altruism-based Cooperation in a Social Network Game",
New Generation Computing, Vol. 34, No. 3, pp. 257-271, 2016.
- Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Environmentally Driven Migration in a Social Network Game",
Scientific Reports, 5, 12481; doi: 10.1038/srep12481 (2015).
2. コミュニケーション⽅法と
社会構造
- Masanori Takano, "Two Types of Social Grooming discovered in Primitive and Modern Communication Data-Sets", 2017 (under review).
- Masanori Takano and Ichiro Fukuda, “Limitations of Time Resources in Human Relationships Determine Social Structures”,
Palgrave Communications, Vol. 3, 17014, 2017.
3. 仮想社会でのいじめ悩み相談
- ⾼野雅典, ⾓⽥孝昭, "仮想社会におけるソーシャルサポート効果の検証 〜 ピグパーティにおけるいじめ相談 〜", 教育⼯学研究会, 2017.
9
アプローチ:
ビッグデータ分析で
社会科学
Webビッグデータは社会現象の
”科学” 研究を促進
科学的理解の枠組み
10
観察: 不思議な現象・
パターンの発⾒
理論: 現象を説明可能な
理論の構築
実験: シンプルな環境
で再現・詳細を調査
ヒト・社会現象を扱う場合の困難
11
観察: 不思議な現象・
パターンの発⾒
理論: 現象を説明可能な
理論の構築
実験: シンプルな環境
で再現・詳細を調査
“実験室” のヒトは
普段のヒトとは異なる
ヒトや社会の⾏動を詳
細に観察・記録するの
は難しい
調査観測・実験研究の困難の緩和
12
観察: 不思議な現象・
パターンの発⾒
理論: 現象を説明可能な
理論の構築
実験: シンプルな環境
で再現・詳細を調査
“実験室” のヒトは
普段のヒトとは異なる
ヒトや社会の⾏動を詳
細に観察・記録するの
は難しい
Webサービスは
詳細な記録が残り、
ヒトが(⽐較的)⾃由
に⾏動できる場所
ソーシャルビッグデータ・
オープンデータによる社会
構造変化の発⾒
2017/11/24 – 第3回ウェブサイエンス研究会
CyberAgent, Inc. All Rights Reserved
株式会社サイバーエージェント
技術本部 秋葉原ラボ
⾼野雅典
13
Preprint: https://arxiv.org/abs/1707.08517
14
• Webサービスのデータは⼊⼿しやすい
・運営企業が公開(e.g. github)
・APIで取得できる(e.g. Twitter)
・研究者がクロールして公開
• Web以外のデータでも論⽂出版時に公開さ
れていることも少なくない
・アンケートや実験など(e.g. Dryad, figshare)
→ 詳細な⽐較は難しくても、
マクロなレベルであれば⽐較できるかも
本研究では13個の公開データを⽐較
多様なビッグデータ
15
• 社会関係を構築するコミュニケーション
・社会的グルーミング
• グルーミング
・サル(⾮ヒト霊⻑類)の⽑づくろい
・サルは⽑づくろいで社会関係を構築
→ ヒトの社会関係構築のための⾏動も
社会的グルーミングと呼ばれるように
・⽬配せ、会話、チャット、会釈、⼿紙、etc.
焦点を当てるヒトの⾏動
16
• 社会的グルーミング⽅法
・⼈の社会関係構築の⾏動
・それによってできる社会構造
を変えるか?
• 変えるならば、
・なぜ変わるのか?
・どのように変わるのか?
知りたいこと
社会関係の多様性と役割の違い
• 強い社会関係(親密)
・相⼿からの協調 [Harrison 11, Haan 06, Takano 16]
• 弱い社会関係(弱い靭帯)
・情報の収集 [Granovetter 73, Eagle 10]
・弱い社会関係は共通する知⼈が少ない
(共有する情報が少ない)ので、情報共有の⾯で
は強い社会関係よりも重要
17
社会的グルーミングの多様性と受け取り⽅
• 満⾜度の違い [Vlahovic 13]
・対⾯・テレビ電話 > 電話・メール・SNS
• 幸福度の違い at Facebook [Burke 16]
・個⼈宛メッセージ > いいね・普通の投稿
・強い社会関係の相⼿から > 弱い社会関係の相⼿から
• ⼿の込んだ社会的グルーミングのほうが好ま
れる(履歴書は⼿書きのほうが⼼がこもっている?)
• 親密な相⼿にほど⼿の込んだ⽅法を使う傾向
[Burke 14]
18
社会的グルーミングのコストとグループサイズ
社会的グルーミングの⾏使には時間や
コストがかかる
→ 社会的グループサイズに制約[Dunbar 98]
19
視線・会話
150⼈
⽑づくろい
数⼗個体
社会的グルーミングのコスト低下
ネット(電話も?)の普及による制約の緩和
→ 社会的グループサイズは
⼤きくなった?
20
視線・会話 + 電話・ネット
もっと⼤⼈数?
視線・会話
150⼈
⽑づくろい
数⼗個体
ネットによってどのように増⼤したのか?
• コアな社会関係の数は変わってない[Dunbar, 16]
• 弱い社会関係は増えた[Arnaboldi, 13][Dunbar, 12]
21
知りたいこと
• SNSや電話の登場で、広く薄い社会関係が作りやすくなった
・社会的グルーミングと社会構造の関係
を知りたい
• ミクロなダイナミクス
・社会的グルーミング
• マクロなパターン
・社会構造
→ SNSなどの発明はヒトにどのような影響を与えたか?
良し悪しはともかく、インターネットも対⼈コミュニケーショ
ンも、⼈類は当⾯やめることはない。理論的なモデルが必要。
22
+ 社会的グルーミング⽅法の性質
13個のコミュニケーションのデータセットを⽐較。
それらの類似・差異を説明するモデルを構築する。
・Twitter、755(x2)、ピグ、対⾯の会話、電話、メール、
携帯電話・SMS(他⼈同⼠)、携帯電話・SMS(⾎縁・友⼈)、
バブーンの群れx2
・これらはすべて公開データ(ピグと755は我々が以前の研究で公開したデータ)
・詳細は「https://arxiv.org/abs/1707.08517」の付録参照
アプローチ
23
• 社会的グルーミングは⽅法によってコストが違う
・直接話す V.S. Twitterでリプライする
• コストが増えると…
・維持可能な社会関係の数 N
・社会関係の強さ m(2者間のコミュニケーション頻度の平均)
は減少するはず
• N と m はトレードオフ関係
→ 社会的グルーミング⽅法によってトレードオフ関係
は異なるか?
注⽬する社会的グルーミング⽅法の違い
24
社会的グルーミングのトレードオフ
Nullモデルの仮定:
1⽇あたりの社会的グルーミングコストは、
社会関係の強さに依存しない
• 相⼿ j にグルーミングした⽇数を dj とすると総コスト C は
• つまり、総コストがユーザ共通とすると、
- グルーミングした相⼿数 N(社会関係の多さ)
- 平均グルーミング⽇数 m(平均的な社会関係の強さ)
は反⽐例する(はず)
N: グルーミングした相⼿数
m: グルーミング相⼿における
平均グルーミング⽇数(Σdj/N)
25
0.0
0.5
1.0
1.5
0.0 0.5 1.0 1.5
log10(m)/log10(C)
log10(N)/log10(C)
0.0
0.5
1.0
1.5
0.0 0.5 1.0 1.5
log10(m)/log10(C)
log10(N)/log10(C)
26
社会関係の数 N と強さ m の a乗に
反⽐例(C=Nma)
NULLモデル(a=1)には従わない
• Twitter: a > 1
・強いトレードオフ関係
・狭くて深い関係(m⼤, N⼩)が
NULLモデルより少ない
• 対⾯の会話: a < 1
・弱いトレードオフ関係
・狭くて深い関係が(m⼤, N⼩)が
NULLモデルより多い
a=1
実データに対する
回帰直線 a>1
発⾒: トレードオフと2つの社会的グルーミング
a=1
実データに対する
回帰直線 a<1
a=1を閾値とした2種類の社会的グルーミング
27
a > 1: 現代的で⼿軽な⽅法
a < 1: 原初的で⼿間のかかる⽅法
a=1を閾値とした2種類の社会的グルーミング
28
a > 1: 現代的で⼿軽な⽅法
a < 1: 原初的で⼿間のかかる⽅法
SNS
他人同士の
コミュニティ
メール
友人・家族の
コミュニティ
対面 電話 バブーン
トレードオフ(制約)の影響
• 仮説: 社会的グルーミング⽅法の制約 a によって
ヒトは社会的振舞いを変える
• 社会関係強化の社会的グルーミングの量 G
- T: 期間, α: 社会的グルーミング⽅法の性質
• 利⽤頻度Cと平均的な社会関係の強さ m
によって1⽇の社会的グルーミング量が決まる
・a=1を閾値にピークが変わる
• 新規の社会関係に充てる社会的グルーミング量
・G0≒N
で a に依存しない
29
0.0001
0.0010
0.0100
10 1000
Mean of Social Relationship Strengths (m)
AmountofSocialGrooming(G)
a>1
a<1
a=1
30
個体ベースシミュレーションによる確認
データにフィット
仮説に⽭盾はなさそう
31
トレードオフa が変わると社会構造はどう変わるか?
• a が⼤きくなる(制約がきつくなる)ほど、
社会構造は薄く広く
• a=1を閾値に、その勾配が変化
1.5
2.0
2.5
3.0
3.5
4.0
0.5 1.0 1.5 2.0
a
PowerLawCoefficientphi
0.0001
0.0100
1.0000
10 1000
Social Relationship Strength (d)
CumulativeFrequencyTwitterデータをもとにした個体ベースシミュレーションで、aを段階的に変えて検証
結果まとめ: 2種類の社会的グルーミングと社会構造
32
軽量な社会的グルーミング
ネット越し・他⼈同⼠の
社会的グルーミングと社会関係
(ごくごく最近の社会関係)
⼿の込んだ社会的グルーミング
対⾯・⾎縁/友⼈同⼠の
社会的グルーミングと社会関係
バブーンも。
(i.e. 3000万年前からの社会関係?)
結果まとめ: 2種類の社会的グルーミングと社会構造
33
Lightweight Social Groomingの登場は
人の弱い社会関係を拡大
Elaborate Social Grooming に
よる社会関係は変わらず
社会的グルーミングの役割と使い分け
• ⼿の込んだ社会的グルーミング
→ 狭く深い社会を形成
・協⼒を得やすい強い社会関係を作る
・データセット: 対⾯の会話、電話、親密な間柄、バブーン
→ ⾮ヒト霊⻑類・原初的なヒト・現代の親密な関係
• 軽量な社会的グルーミング
→ 広く浅い社会を形成
・情報を得やすい広く薄い社会関係を作る
・データセット: SNS、他⼈同⼠、メール
34
おわりに
• Webサービスによって⼈の⾏動が詳細に記録されている
• それらや論⽂で使われたデータは公開されることが多い
→ それらを利⽤してバブーンからTwitterまでを横断的に⽐較
35
観察: 不思議な現象・
パターンの発⾒
理論: 現象を説明可能な
理論の構築
実験: シンプルな環境で
再現・詳細を調査
① フィールドのデータから
パターンを発⾒
② パターンを説明する
モデルの構築

ソーシャルビッグデータ・オープンデータによる社会構造変化の発見