Successfully reported this slideshow.

計算社会科学とは

6

Share

1 of 42
1 of 42

More Related Content

Related Books

Free with a 14 day trial from Scribd

See all

Related Audiobooks

Free with a 14 day trial from Scribd

See all

計算社会科学とは

  1. 1. 計算社会科学入門 第1章 計算社会科学とは 笹原 和俊 東京工業大学 環境・社会理工学院 イノベーション科学系
  2. 2. 講義内容 1. はじめに 2. 計算社会科学の誕生 3. 計算社会科学の方法論 4. ビッグデータ分析 5. デジタル調査と実験 6. 計算モデルとシミュレーション 7. おわりに 2
  3. 3. 講義内容 1. はじめに 2. 計算社会科学の誕生 3. 計算社会科学の方法論 4. ビッグデータ分析 5. デジタル調査と実験 6. 計算モデルとシミュレーション 7. おわりに 3
  4. 4. 計算社会科学とは ビッグデータやコンピュータの活用が可能にするデジタル時代の 社会科学 • Data-driven 新たに利用可能になったデータと情報技術を駆使し、個人・集団、社会・ 経済をこれまでにない解像度とスケールで定量的かつ学際的に研究 • Solution-oriented 社会規模の問題に対してインパクトある解決策を創出 • Transformative 社会科学の「わかり方」を変革 4
  5. 5. 5 投稿数 492 参加者 >400
  6. 6. IC2S2 2015のキーワード 6 Courtesy of Prof. Fortunato
  7. 7. IC2S22020における研究者人口 7 圧倒的に米国 日本
  8. 8. 講義内容 1. はじめに 2. 計算社会科学の誕生 3. 計算社会科学の方法論 4. ビッグデータ分析 5. デジタル調査と実験 6. 計算モデルとシミュレーション 7. おわりに 8
  9. 9. ビッグデータの登場 • 電子化される行動 • 携帯電話、電子メール、 ブログ、バイオセンサー • 時間、位置、属性情報、 社会的つながり • 社会現象の要素の測定 ↓ データ駆動型社会科学 9 Lazer et al. Science (2009)
  10. 10. ネットワーク科学の発展 10 We must start asking how the technological revolution of the Internet can lead to a revolution in social science as well.
  11. 11. 「計算社会科学」の変遷 かつて • 社会シミュレーションと同義語 2000年末 • 「社会科学×コンピュータ科学」な研究を緩く束ねるアンブレラターム • ビッグデータ、SNS、クラウド、ネットワーク科学、機械学習 2015年以降 • デジタル時代の社会科学へと成長中 • IC2S2、SICSS、Bit by Bit、J. Comp Soc Sci 11
  12. 12. 講義内容 1. はじめに 2. 計算社会科学の誕生 3. 計算社会科学の方法論 4. ビッグデータ分析 5. デジタル調査と実験 6. 計算モデルとシミュレーション 7. おわりに 12
  13. 13. 計算社会科学の方法論 1. デジタルトレース(ビッグデータ)の観察・分析 2. デジタルツールを使った実験・調査 3. 計算モデルとシミュレーション 13
  14. 14. 講義内容 1. はじめに 2. 計算社会科学の誕生 3. 計算社会科学の方法論 4. ビッグデータ分析 5. デジタル調査と実験 6. 計算モデルとシミュレーション 7. おわりに 14
  15. 15. 行動が化石になる時代 • 「行動は化石に残らない」 • 人間行動や社会現象の定量的研究を妨げる理由だった • 行動のデジタル化(ビッグデータ) • 個人レベルから地球規模のデータ(行動、社会、経済) • ICT ・IoT の発達、データ取得・蓄積のコスト低下 • オープン運動(オープンソース、オープンデータ) 15
  16. 16. ビッグデータの特徴 研究にとってメリット 1. 大規模性 (Big) • ランダム要因の影響小 2. 常時オン (Always-on) • ナウ・フォーキャスト 3. 非反応性 (Nonreactive) • 自然行動 研究にとってデメリット 4. 不完全性 (Incomplete) 5. アクセス不能性 (Inaccessible) 6. 非代表性 (Nonrepresentative) 7. ドリフト (Drifting) 8. アルゴリズムによる交絡 (Algorithmically confounded) 9. 汚染 (Dirty) 10.センシティブ (Sensitive) 16 Salganik, Bit by Bit (2017)
  17. 17. ビッグデータから学ぶためのレシピ 1. 測定する • 優れた問いとビッグデータがあれば、単純な測定でも興味深い結果が が得られる • 機械学習の発展によって、測定できる量と精度が劇的に向上 2. 予測する • 未来予測 (Forecasting) と現在予測 (Nowcasting) 3. 実験に近づける • 自然実験 = ランダムなばらつき + 「常時オン」データ 17 Salganik, Bit by Bit (2017)
  18. 18. 正直信号の計測 ウェアラブルセンサーによる正直信号(無意識・非言語)の測定 を組織活性化やWell-being向上に活用 • ソシオメーター (Pentland 2010) • 表情や声、体の動きなどを計測し、 相手の態度や意図などを推定 • ビジネス顕微鏡 (矢野 2014) • 組織内コミュニケーションの量や質 を測定 18 https://hd.media.mit.edu/badges/
  19. 19. ソシオスコープによる行動観察・分析 気分の概日リズム • 84カ国2,400万人の過去2年間のツイート計5億900万件を分析 • ツイートの投稿から気分の日内変動、週内変動、季節変動がわかる Golder and Macy, Science (2011) 19
  20. 20. ナウキャスト Google Flu Trends • CDCのインフルエンザ感染者 数と45の検索クエリが関連 • GFTは、医学的な知識なし、 にCDCよりも早くインフルエ ンザの流行を予測できた 21 Ginsberg et al. Nature (2009)
  21. 21. 不可視の可視化 著名人の2600年に渡る移動パターンに文化史がコードされている 22 Schich et al. Science (2014) 青:生誕地 赤:死没地 (∼文化の中心)
  22. 22. 歴史を再構成する 古英語の完了形ではBe+PPとHave+PPが共存していたが、 多くの動詞では、Have+PPへ選択的に進化 23 verb FIT p-value creep 0.003 fall 0.003 come 0.013 stay 0.017 arrive 0.024 vanish 0.029 expire 0.046 rise 0.073 tumble 0.213 look 0.242 insist 0.277 bound 0.310 degenerate 0.391 confer 0.612 9/14動詞で進化駆動力を確認 Hosaka, Okuda, and Sasahara, EVOLANG13 (2020)
  23. 23. フェイクニュースの拡散 • 偽ニュースは速く遠くま でたくさん伝わる • 拡散されやすい話題 • 政治 • 都市伝説 • ビジネス • テロ・戦争 • 科学 • エンタメ • 自然災害 24 Vosoughi et al. Science (2018)
  24. 24. ビッグデータの教訓 • GFTの予測性能は単純な統計モデルよりも優れているわけでは ないことが判明 (Lazer et al. Science 2013) • GFTの予測性能はドリフトとアルゴリズムの交絡により、 短期的には失敗しやすく、長期的には減衰しやすい • Googleの検索アルゴリズムの変更 • Googleサジェストの影響 25
  25. 25. 講義内容 1. はじめに 2. 計算社会科学の誕生 3. 計算社会科学の方法論 4. ビッグデータ分析 5. デジタル調査と実験 6. 計算モデルとシミュレーション 7. おわりに 26
  26. 26. 社会調査(これまで) • インタビュー • 少数にインタビューし、会話を通じて定性的で詳細な記述を得る • サーベイ • (全数調査以外では)限られた人数のサンプルを対象として、質問票 や電話による質問に回答してもらい、それを統計的に分析する • ボトルネック • 結果の一般性の担保 • 社会的関係性を調べるのが困難 • 時間的コスト、金銭的コスト 27
  27. 27. 実験室実験(これまで) • (少数の)参加者を募集して実験室で課題を遂行してもらい、 データを取得・分析する • 環境を統制し、特定の行動が生じる要因を分析 • ボトルネック • 参加者は(主に)学生やWEIRED • 社会から切り離された環境での行動(≠自然環境下の行動) • 時間的コスト、金銭的コスト 28
  28. 28. デジタル調査・実験 • デジタルプラットフォームを活用 • 調査・実験の準備、実行、分析が効率化 • 調査・実験のスケールが容易になる • クラウドソーシングの活用 • ネットを通じて不特定多数の人にタスクを依頼 (MTurk, ランサーズ) • ビッグデータ(観察データ)と組み合わせる • 調査・実験データと相補的になり研究の価値が上がる 29
  29. 29. 人工音楽市場実験 • 参加者14000人 • 独立条件 • 曲名がランダムな順番で表示される • 社会条件 • 曲名がダウンロードされた回数の多 い順に表示される • 結果 • 社会条件の時、ダウンロードされる 曲ますますダウンロードされるよう になった 30 0 0.1 0.2 0.3 0.4 0.5 0.6 社会的条件 独立条件 ジニ係数 社会条件 Salganik et al. Science (2006)を元に作成
  30. 30. モラルマシン実験 31 Awad et al. Nature (2018)
  31. 31. 個人特徴の推定 32 個 ⼈ 属 性 Yo and Sasahara (in prep.) オンラインアンケートの回答を正解として、 ツイートで分類器を学習
  32. 32. 講義内容 1. はじめに 2. 計算社会科学の誕生 3. 計算社会科学の方法論 4. ビッグデータ分析 5. デジタル調査と実験 6. 計算モデルとシミュレーション 7. おわりに 33
  33. 33. 人間社会は複雑系 • 複雑系とは • 多数の要素が非線形な相互作用をし合い、動的にネットワークを形成 し、全体として複雑な振る舞いを創発させるようなシステム • 例:社会的交流や分断、協力や信頼、集団行動や社会運動、 交通渋滞やデマの拡散 • 要素還元論が通用しない • 複雑系は部分に分解すると構成要素間の動的関係性が失われてしまう 34
  34. 34. 創発 (Emergence) 35 大域的な秩序 構成要素の相互作用によって 大域的な秩序が生み出される 構成要素 局所的な相互作用 (非線形) 大域的な秩序が拘束条件と なって、構成要素の相互作用 が変化する
  35. 35. 社会シミュレーション • 自律的な主体とそれらの相互作用をシミュレートする • 発見と形式化のためのツール • 説明モデルはシンプルさが、予測モデルは精度が重要 36 モデル シミュレートされたデータ 対象 集められたデータ シミュレーション データ収集 抽象化 類似
  36. 36. 社会シミュレーションに使われるモデル • システムダイナミクス • 対象の系全体の振る舞いを数式(差分方程式や微分方程式)でモデル化 • 決定論的なマクロモデル • ミクロシミュレーション • 個々人に別々に適用されるルール(別々の属性と遷移行列)によって集 団がどのような影響を受けるのかを予測 • 確率論的なミクロモデル 37
  37. 37. 社会シミュレーションに使われるモデル (続) • セルオートマトン • 格子状に配置された個人のシンプルな局所的相互作用からマクロな パターンが創発するようなモデル • エージェント・ベース・モデル(ABM) • 意思決定をおこなうもの(エージェント)が複数存在し、相互作用す するモデル(マルチエージェント) • 学習・進化モデル • 人工ニューラルネットワーク • 遺伝的アルゴリズム 38
  38. 38. シェリングの住み分けモデル 米国などの都市において、 なぜ人種ごとに分かれて居 住する社会的分断が生じる のかを説明するモデル ルール • 自分の上下左右斜めの8近傍に、 同種のエージェントが1/3未満 の場合、空白の場所にランダム に移動 • それ以外は、移動しない 39 https://ncase.me/polygons/
  39. 39. 40 SNSを模した意見形成モデル Sasahara et al. J Comp Soc Sci (2020)
  40. 40. 講義内容 1. はじめに 2. 計算社会科学の誕生 3. 計算社会科学の方法論 4. ビッグデータ分析 5. デジタル調査と実験 6. 計算モデルとシミュレーション 7. おわりに 41
  41. 41. 社会科学のこれまでとこれから 42 IC2S2 2015のMacyの基調講演をもとに作成
  42. 42. 計算社会科学の課題 • 人材育成・研究環境 • CSスキルを持った社会科学者、社会科学の知識を持ったCS研究者 • 学際的チーム型研究 • データ環境 • GAFAの独占 • 個人情報とプライバシー • Big DataからBig Questionへ • まずデータを取得し、探索的分析によって経験的事実やパターンを積 み重ね、新しい理論を作る(cf. ケプラーの法則) 43

×