Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

ソーシャルビッグデータ・オープンデータによる社会構造変化の発見

970 views

Published on

第3回ウェブサイエンス研究会 招待講演資料
http://sigwebsci.tumblr.com/post/166061452488/%E7%AC%AC3%E5%9B%9E%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%82%B9%E7%A0%94%E7%A9%B6%E4%BC%9A%E3%81%94%E6%A1%88%E5%86%85

Published in: Science
  • Be the first to comment

ソーシャルビッグデータ・オープンデータによる社会構造変化の発見

  1. 1. ソーシャルビッグデータ・オー プンデータによる社会構造変化 の発⾒ 2017/11/24 – 第3回ウェブサイエンス研究会 CyberAgent, Inc. All Rights Reserved 株式会社サイバーエージェント 技術本部 秋葉原ラボ ⾼野雅典 1
  2. 2. 2 ⾼野 雅典(データマイニングエンジニア/@mtknnktm) ●仕事: サイバーエージェントの⾃社メディア・ゲームの データ分析関連もろもろ + 研究 その前はシステムエンジニア@前職SIer、JavaScriptエンジニア@CyberAgent 学⽣時代の専⾨は 複雑系・⼈⼯⽣命。博⼠(情報科学) ●研究の興味: 協調⾏動・社会的知性 ●所属 秋葉原ラボ: メディアサービスのデータ関連R&D組織 - Publication List: https://www.cyberagent.co.jp/techinfo/labo/research_list/
  3. 3. 3 会社で社会科学 の研究をしてい る動機
  4. 4. 4 • ⾮常に多くの⼈がWebを利⽤ ・Facebookの⽉間アクティブユーザは20億⼈ (全⼈類の30%弱!) • Webでは様々な社会現象が発⽣ ・時空間制約の弱い社会関係 ・情報カスケード、バースト、炎上 ・未成年事犯 etc. • “Web社会” の現象を科学する必要性 Web社会の科学
  5. 5. 5 • コミュニケーション・交流 ・アメーバピグ、タップル、ソーシャルゲーム • 情報メディア ・AbemaTV、アメーバブログ、新R25 サイバーエージェントのメディア・ゲーム事業
  6. 6. 6 サイバーエージェントはWebという世界で ビジネスをしている会社 ・弊社のサービスが社会に与える影響 ・弊社/他社のサービス上での社会問題 ・Web社会の課題解決・健全性維持 → Web社会、Webと社会の理解が必要 直近で役⽴つというより、今後のWebの世界が良くなるための知 ⾒発⾒を⽬標としています(主な成果は知⾒の共有(i.e. 論⽂出版)) Web社会の研究が活発になればWeb系企業もうれしい サイバーエージェントと社会科学
  7. 7. 7 これまでの研究 1. ゲームプレイヤーの協調⾏動 - Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Lightweight Interactions for Reciprocal Cooperation in a Social Network Game", The 8th International Conference on Social Informatics (SocInfo), 2016. - Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Reciprocal Altruism-based Cooperation in a Social Network Game", New Generation Computing, Vol. 34, No. 3, pp. 257-271, 2016. - Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Environmentally Driven Migration in a Social Network Game", Scientific Reports, 5, 12481; doi: 10.1038/srep12481 (2015). 2. コミュニケーション⽅法と 社会構造 - Masanori Takano, "Two Types of Social Grooming discovered in Primitive and Modern Communication Data-Sets", 2017 (under review). - Masanori Takano and Ichiro Fukuda, “Limitations of Time Resources in Human Relationships Determine Social Structures”, Palgrave Communications, Vol. 3, 17014, 2017. 3. 仮想社会でのいじめ悩み相談 - ⾼野雅典, ⾓⽥孝昭, "仮想社会におけるソーシャルサポート効果の検証 〜 ピグパーティにおけるいじめ相談 〜", 教育⼯学研究会, 2017.
  8. 8. 8 本⽇お話する内容 1. ゲームプレイヤーの協調⾏動 - Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Lightweight Interactions for Reciprocal Cooperation in a Social Network Game", The 8th International Conference on Social Informatics (SocInfo), 2016. - Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Reciprocal Altruism-based Cooperation in a Social Network Game", New Generation Computing, Vol. 34, No. 3, pp. 257-271, 2016. - Masanori Takano, Kazuya Wada, and Ichiro Fukuda, "Environmentally Driven Migration in a Social Network Game", Scientific Reports, 5, 12481; doi: 10.1038/srep12481 (2015). 2. コミュニケーション⽅法と 社会構造 - Masanori Takano, "Two Types of Social Grooming discovered in Primitive and Modern Communication Data-Sets", 2017 (under review). - Masanori Takano and Ichiro Fukuda, “Limitations of Time Resources in Human Relationships Determine Social Structures”, Palgrave Communications, Vol. 3, 17014, 2017. 3. 仮想社会でのいじめ悩み相談 - ⾼野雅典, ⾓⽥孝昭, "仮想社会におけるソーシャルサポート効果の検証 〜 ピグパーティにおけるいじめ相談 〜", 教育⼯学研究会, 2017.
  9. 9. 9 アプローチ: ビッグデータ分析で 社会科学 Webビッグデータは社会現象の ”科学” 研究を促進
  10. 10. 科学的理解の枠組み 10 観察: 不思議な現象・ パターンの発⾒ 理論: 現象を説明可能な 理論の構築 実験: シンプルな環境 で再現・詳細を調査
  11. 11. ヒト・社会現象を扱う場合の困難 11 観察: 不思議な現象・ パターンの発⾒ 理論: 現象を説明可能な 理論の構築 実験: シンプルな環境 で再現・詳細を調査 “実験室” のヒトは 普段のヒトとは異なる ヒトや社会の⾏動を詳 細に観察・記録するの は難しい
  12. 12. 調査観測・実験研究の困難の緩和 12 観察: 不思議な現象・ パターンの発⾒ 理論: 現象を説明可能な 理論の構築 実験: シンプルな環境 で再現・詳細を調査 “実験室” のヒトは 普段のヒトとは異なる ヒトや社会の⾏動を詳 細に観察・記録するの は難しい Webサービスは 詳細な記録が残り、 ヒトが(⽐較的)⾃由 に⾏動できる場所
  13. 13. ソーシャルビッグデータ・ オープンデータによる社会 構造変化の発⾒ 2017/11/24 – 第3回ウェブサイエンス研究会 CyberAgent, Inc. All Rights Reserved 株式会社サイバーエージェント 技術本部 秋葉原ラボ ⾼野雅典 13 Preprint: https://arxiv.org/abs/1707.08517
  14. 14. 14 • Webサービスのデータは⼊⼿しやすい ・運営企業が公開(e.g. github) ・APIで取得できる(e.g. Twitter) ・研究者がクロールして公開 • Web以外のデータでも論⽂出版時に公開さ れていることも少なくない ・アンケートや実験など(e.g. Dryad, figshare) → 詳細な⽐較は難しくても、 マクロなレベルであれば⽐較できるかも 本研究では13個の公開データを⽐較 多様なビッグデータ
  15. 15. 15 • 社会関係を構築するコミュニケーション ・社会的グルーミング • グルーミング ・サル(⾮ヒト霊⻑類)の⽑づくろい ・サルは⽑づくろいで社会関係を構築 → ヒトの社会関係構築のための⾏動も 社会的グルーミングと呼ばれるように ・⽬配せ、会話、チャット、会釈、⼿紙、etc. 焦点を当てるヒトの⾏動
  16. 16. 16 • 社会的グルーミング⽅法 ・⼈の社会関係構築の⾏動 ・それによってできる社会構造 を変えるか? • 変えるならば、 ・なぜ変わるのか? ・どのように変わるのか? 知りたいこと
  17. 17. 社会関係の多様性と役割の違い • 強い社会関係(親密) ・相⼿からの協調 [Harrison 11, Haan 06, Takano 16] • 弱い社会関係(弱い靭帯) ・情報の収集 [Granovetter 73, Eagle 10] ・弱い社会関係は共通する知⼈が少ない (共有する情報が少ない)ので、情報共有の⾯で は強い社会関係よりも重要 17
  18. 18. 社会的グルーミングの多様性と受け取り⽅ • 満⾜度の違い [Vlahovic 13] ・対⾯・テレビ電話 > 電話・メール・SNS • 幸福度の違い at Facebook [Burke 16] ・個⼈宛メッセージ > いいね・普通の投稿 ・強い社会関係の相⼿から > 弱い社会関係の相⼿から • ⼿の込んだ社会的グルーミングのほうが好ま れる(履歴書は⼿書きのほうが⼼がこもっている?) • 親密な相⼿にほど⼿の込んだ⽅法を使う傾向 [Burke 14] 18
  19. 19. 社会的グルーミングのコストとグループサイズ 社会的グルーミングの⾏使には時間や コストがかかる → 社会的グループサイズに制約[Dunbar 98] 19 視線・会話 150⼈ ⽑づくろい 数⼗個体
  20. 20. 社会的グルーミングのコスト低下 ネット(電話も?)の普及による制約の緩和 → 社会的グループサイズは ⼤きくなった? 20 視線・会話 + 電話・ネット もっと⼤⼈数? 視線・会話 150⼈ ⽑づくろい 数⼗個体
  21. 21. ネットによってどのように増⼤したのか? • コアな社会関係の数は変わってない[Dunbar, 16] • 弱い社会関係は増えた[Arnaboldi, 13][Dunbar, 12] 21
  22. 22. 知りたいこと • SNSや電話の登場で、広く薄い社会関係が作りやすくなった ・社会的グルーミングと社会構造の関係 を知りたい • ミクロなダイナミクス ・社会的グルーミング • マクロなパターン ・社会構造 → SNSなどの発明はヒトにどのような影響を与えたか? 良し悪しはともかく、インターネットも対⼈コミュニケーショ ンも、⼈類は当⾯やめることはない。理論的なモデルが必要。 22 + 社会的グルーミング⽅法の性質
  23. 23. 13個のコミュニケーションのデータセットを⽐較。 それらの類似・差異を説明するモデルを構築する。 ・Twitter、755(x2)、ピグ、対⾯の会話、電話、メール、 携帯電話・SMS(他⼈同⼠)、携帯電話・SMS(⾎縁・友⼈)、 バブーンの群れx2 ・これらはすべて公開データ(ピグと755は我々が以前の研究で公開したデータ) ・詳細は「https://arxiv.org/abs/1707.08517」の付録参照 アプローチ 23
  24. 24. • 社会的グルーミングは⽅法によってコストが違う ・直接話す V.S. Twitterでリプライする • コストが増えると… ・維持可能な社会関係の数 N ・社会関係の強さ m(2者間のコミュニケーション頻度の平均) は減少するはず • N と m はトレードオフ関係 → 社会的グルーミング⽅法によってトレードオフ関係 は異なるか? 注⽬する社会的グルーミング⽅法の違い 24
  25. 25. 社会的グルーミングのトレードオフ Nullモデルの仮定: 1⽇あたりの社会的グルーミングコストは、 社会関係の強さに依存しない • 相⼿ j にグルーミングした⽇数を dj とすると総コスト C は • つまり、総コストがユーザ共通とすると、 - グルーミングした相⼿数 N(社会関係の多さ) - 平均グルーミング⽇数 m(平均的な社会関係の強さ) は反⽐例する(はず) N: グルーミングした相⼿数 m: グルーミング相⼿における 平均グルーミング⽇数(Σdj/N) 25
  26. 26. 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 log10(m)/log10(C) log10(N)/log10(C) 0.0 0.5 1.0 1.5 0.0 0.5 1.0 1.5 log10(m)/log10(C) log10(N)/log10(C) 26 社会関係の数 N と強さ m の a乗に 反⽐例(C=Nma) NULLモデル(a=1)には従わない • Twitter: a > 1 ・強いトレードオフ関係 ・狭くて深い関係(m⼤, N⼩)が NULLモデルより少ない • 対⾯の会話: a < 1 ・弱いトレードオフ関係 ・狭くて深い関係が(m⼤, N⼩)が NULLモデルより多い a=1 実データに対する 回帰直線 a>1 発⾒: トレードオフと2つの社会的グルーミング a=1 実データに対する 回帰直線 a<1
  27. 27. a=1を閾値とした2種類の社会的グルーミング 27 a > 1: 現代的で⼿軽な⽅法 a < 1: 原初的で⼿間のかかる⽅法
  28. 28. a=1を閾値とした2種類の社会的グルーミング 28 a > 1: 現代的で⼿軽な⽅法 a < 1: 原初的で⼿間のかかる⽅法 SNS 他人同士の コミュニティ メール 友人・家族の コミュニティ 対面 電話 バブーン
  29. 29. トレードオフ(制約)の影響 • 仮説: 社会的グルーミング⽅法の制約 a によって ヒトは社会的振舞いを変える • 社会関係強化の社会的グルーミングの量 G - T: 期間, α: 社会的グルーミング⽅法の性質 • 利⽤頻度Cと平均的な社会関係の強さ m によって1⽇の社会的グルーミング量が決まる ・a=1を閾値にピークが変わる • 新規の社会関係に充てる社会的グルーミング量 ・G0≒N で a に依存しない 29 0.0001 0.0010 0.0100 10 1000 Mean of Social Relationship Strengths (m) AmountofSocialGrooming(G) a>1 a<1 a=1
  30. 30. 30 個体ベースシミュレーションによる確認 データにフィット 仮説に⽭盾はなさそう
  31. 31. 31 トレードオフa が変わると社会構造はどう変わるか? • a が⼤きくなる(制約がきつくなる)ほど、 社会構造は薄く広く • a=1を閾値に、その勾配が変化 1.5 2.0 2.5 3.0 3.5 4.0 0.5 1.0 1.5 2.0 a PowerLawCoefficientphi 0.0001 0.0100 1.0000 10 1000 Social Relationship Strength (d) CumulativeFrequencyTwitterデータをもとにした個体ベースシミュレーションで、aを段階的に変えて検証
  32. 32. 結果まとめ: 2種類の社会的グルーミングと社会構造 32 軽量な社会的グルーミング ネット越し・他⼈同⼠の 社会的グルーミングと社会関係 (ごくごく最近の社会関係) ⼿の込んだ社会的グルーミング 対⾯・⾎縁/友⼈同⼠の 社会的グルーミングと社会関係 バブーンも。 (i.e. 3000万年前からの社会関係?)
  33. 33. 結果まとめ: 2種類の社会的グルーミングと社会構造 33 Lightweight Social Groomingの登場は 人の弱い社会関係を拡大 Elaborate Social Grooming に よる社会関係は変わらず
  34. 34. 社会的グルーミングの役割と使い分け • ⼿の込んだ社会的グルーミング → 狭く深い社会を形成 ・協⼒を得やすい強い社会関係を作る ・データセット: 対⾯の会話、電話、親密な間柄、バブーン → ⾮ヒト霊⻑類・原初的なヒト・現代の親密な関係 • 軽量な社会的グルーミング → 広く浅い社会を形成 ・情報を得やすい広く薄い社会関係を作る ・データセット: SNS、他⼈同⼠、メール 34
  35. 35. おわりに • Webサービスによって⼈の⾏動が詳細に記録されている • それらや論⽂で使われたデータは公開されることが多い → それらを利⽤してバブーンからTwitterまでを横断的に⽐較 35 観察: 不思議な現象・ パターンの発⾒ 理論: 現象を説明可能な 理論の構築 実験: シンプルな環境で 再現・詳細を調査 ① フィールドのデータから パターンを発⾒ ② パターンを説明する モデルの構築

×