SlideShare a Scribd company logo
3バン※
カバン
❖ データ: 議員別 選挙運動費用
❖ ソース: 参議院議員通常選挙結果調 [1]
地盤
❖ データ: 当選回数, TwitterのFollow/Follower
❖ ソース: 朝日新聞参院選候補者データ [2], Twitter[3]
看板
❖ データ: Google検索数
❖ ソース: Google Trend [4]
選挙区予測のアプローチ : 4つのバン
事前情報 + 情勢情報 = 3バン + 序, 終盤情勢調査
[1] 参議院議員通常選挙結果調(一覧), https://www.e-stat.go.jp/stat-search/files?page=1&toukei=00200236
[2] 2019参議院選挙(参院選):朝日新聞デジタル, https://www.asahi.com/senkyo/senkyo2019/
[3] Twitter, https://twitter.com/
[4] Google Trend, https://trends.google.com/trends/
[5] 朝日新聞記事データベース聞蔵II, http://database.asahi.com/index.shtml
序, 終盤情勢調査
❖ データ: 朝日新聞序盤, 終盤情勢調査 記事テキスト
❖ ソース: 朝日新聞記事データベース 聞蔵II [5]
1
選挙区予測のアプローチ: 4つのバン
チーム おいしいカレー
※3バン: カバン=選挙資金, 地盤=支持, 看板=知名度からなる、選挙に勝つために必要と言われている三つの要素の俗称。
看板
❖ Google Trendsより候補者の選挙前一年間にわたるGoogle検索数の総和を取得
❖ Google検索数を特徴量 ‘google_search’ として使用した。 (pytrends)
地盤
カバン
❖ 参議院議員通常選挙結果調より過去の候補者の 選挙運動費を取得 (pdf)
❖ 2019の候補者に関して
➢ 2019以前に立候補経験/現職議員はその際の選挙運動費を仮定
➢ 立候補経験のない議員は所属政党の過去の平均値で埋める
❖ 選挙運動費を特徴量 ‘expense’ として使用した。[6]より着想
3バン
2
選挙区予測のアプローチ: 4つのバン
チーム おいしいカレー
リアル地盤
❖ 朝日新聞デジタルより候補者の基本情報 , 特に当選回数を取得 (importxml)
❖ 当選回数>0を1, 当選回数0を0に変換し、特徴量 ‘previous’ として使用した。
ネット地盤
❖ Twitterより候補者のfollower数を取得 (importxml)
❖ 特徴量 ‘follower’ として使用した。[7]より着想
[6] 浅野 正彦, 矢内 勇生, Rによる計量政治学, ISBN: 978-4274223132, 2018.
[7] 那須野 薫, 奥山 晶二郎, 中西鏡子, 松尾 豊, Twitterにおける候補者の選挙地盤に着目した国政選挙の当選者予測,
  情報処理学会論文誌56(10), 2044-2053, 2015.
朝日新聞 序盤/終盤情勢調査
概要
❖ 無作為3段抽出法で電話をかけるRDD方式
❖ 朝日新聞社による総合的な分析
期間
❖ 序盤情勢調査: 7/3 - 7/4
❖ 終盤情勢調査: 7/15 - 7/16
手順
❖ 序盤/終盤情勢調査の記事テキストを取得する
❖ それぞれのテキストについて候補者名の 出現順でランクづけ
❖ ランク上位改選数分の候補者を 1, 改選数以下より下位のランクの候補者を 0とする
❖ それぞれ特徴量 early_seat, late_seat として予測に使用した
序盤/終盤情勢調査
> 朝日新聞社は4、5の両日、参院選道選挙区(改選数3)について、有権者を対象に電話による調査を実施
し、取材で得た情報を加味して総合的に序盤の情勢を探った。自民の高橋はるみ(65)、立憲民主の勝部賢志
(59)の2氏がほかを引き離し、リードしている。自民の岩本剛人氏(54)が先行、共産の畠山和也氏(47)は懸命
に追っており、国民民主の原谷那美氏(35)らは厳しい戦いだ。ただ、半数近い有権者が態度を明らかにしてお
らず、終盤にかけて情勢が変わる可能性がある。
→ 改選数は3なので 高橋はるみ, 勝部賢志, 岩本剛人
北海道選挙区における序盤情勢調査テキスト
3
選挙区予測のアプローチ: 4つのバン
チーム おいしいカレー
予測手法と評価
予測手法
4
選挙区予測のアプローチ: 4つのバン
チーム おいしいカレー
[8] Cox, DR (1958). “The regression analysis of binary sequences (with discussion)”. J Roy Stat Soc B 20: 215–242.
評価
2013-2016
2016の参院選において同様のコンペを想定
71 / 73点
アルゴリズム : Logistic Regression [8]
まとめ
3バンと情勢を考慮した選挙区予測方法を提案した。
➢ 3バン ... 選挙期間前から入手可能な公開情報を用い汎用性を担保した。公職選挙における一種の定石を実デー
タに落とし込み、予測に用いたところに新規性がある。
➢ 情勢 ... 上記の3バンとともに実際の選挙情勢を考慮することで精度向上をはかり、情勢情報を予測に用いること
に一定の効果があることを確認した。
5チーム おいしいカレー
比例区予測のアプローチ : 政党の4分類
各党派について、過去 3回の選挙での「全体得票率」「個人票のみの得票率 」「政党名票のみの得票率 」の開票結果および朝
日新聞社世論調査による「支持する政党」「比例区で投票したい政党 」の回答を正解データとして相関をとり、どの変数の組み
合わせによる相関係数が最も高いかによって、大きく 4つに分類した。そして、党派ごとに議席数予測アルゴリズムを決定し
た。
支持層の影響が強い
無党派層の影響が強い
個の力が強い個の力が弱い
政党票得票率および全体得票率の推
測に使う調査支持率は、議席予測を
載せている「参院選情勢調査」ではな
く、あえて「世論調査」のデータを使用
した。世論調査は、地域を限定した調
査を行う必要がないため、携帯電話を
含めたRDD調査を行っている。よっ
て、より世相を反映した政党支持率
データが取れていると判断した。
立憲・国民は、ともに旧民進党および
民主党を過去データとした。
比例区予測のアプローチ: 政党の4分類
支持率データ
6チーム おいしいカレー
政党ごとの得票数推測アルゴリズム
「個の力」が弱ければ、メディアの調査支持率から党派の得票率 全体を予想できる。
「個の力」が強ければ、「組織票」など、個人票による得票率を 別建てで推測する必要がある。
「支持政党率」との相関が強いのは、支持層が 強固かつ正直に答えてくれる党派。
「投票政党率」との相関が強いのは、得票の多くが 流動的な層によるものである党派。
● 自民党:「支持政党率」から政党票のみ推測。
● 立憲・国民・社民:「投票政党率」から政党票のみ推測。
● 共産党:「投票政党率」から全体得票率を推測。
● 維新:いずれの相関も低い上、個人票得票数が多くないため、「支持政党率」から全体得票率を推測したものと、政党得
票率を推測し係数をかけることで全体得票率としたものの平均から推測。
● 公明党:支持層が固定的かつ調査支持率からの推測が困難と判断したため、過去 3回の平均とした。
● 「残余」として、れいわ新選組の得票数を、山本太郎が所属していた 2016年当時の生活の党の得票数を使用して推測し
た。
比例区予測のアプローチ: 政党の4分類
4分類の特徴
決定したアルゴリズム
7チーム おいしいカレー
個人票をタイプ別に予測する
● 組織票(業界団体政治連盟系 )
会員数は非公開だが、会員数に対して圧倒的かつ安定的な数の集票力を誇る。汚職事件を起こ
さない限り。これらの組織内候補の得票数は、過去 3回の選挙の平均とした。
● 組織票(連合系)
日本最大の労働団体で、傘下の産別が組織内候補を擁立している。組
合員数は毎年公表されている。過去 2回の選挙の組合員数と得票数の
割合の平均をとり、去年の組合員数から得票数を推測した。
● ベテラン議員・現職タレント候補
組織はないが、得票率が安定している。これも過去の平均とした。
● 新人タレント候補
得票数は出馬政党によらず、個人の知名度によると推測。前回選挙のタレント候補
と、選挙期間中のGoogle Trendsによる検索数を比較し、得票数を推定した。
● 社民党
唯一の有力候補と目される吉田忠智の得票数を、過去 3回の選挙の福島瑞穂を除く上位 2名の
得票数の合計を平均から推測。
比例区予測のアプローチ: 政党の4分類
8チーム おいしいカレー
得票率推測結果
党派 個人票得票数 政党票得票数 合計得票数 得票率 獲得議席
自民党 4608691 16307150 20915841 40.004% 21
立憲民主党 1763030 6219312 7982342 15.267% 8
国民民主党 1285312 1036552 2321864 4.441% 2
公明党 7593492 14.523% 7
共産党 4645150 8.884% 4
日本維新の会 5739742 10.978% 5
社民党 210526 1807923 2018449 3.861% 2
残余 1067301 2.041% 1
参考文献
朝日新聞社世論調査 (2019年07月15日、2016年07月04日、2013年07月15日掲載分) - 聞蔵IIより
総務省参議院議員通常選挙選挙資料 (第22,23,24回)
http://www.soumu.go.jp/senkyo/senkyo_s/data/sangiin/ichiran.html
厚労省労働組合基礎調査 (平成25~30年)
https://www.mhlw.go.jp/toukei/list/13-23c.html
比例区予測のアプローチ: 政党の4分類

More Related Content

Featured

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
Erica Santiago
 

Featured (20)

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 

第一回早大DSコンペ-おいしいカレー

  • 1. 3バン※ カバン ❖ データ: 議員別 選挙運動費用 ❖ ソース: 参議院議員通常選挙結果調 [1] 地盤 ❖ データ: 当選回数, TwitterのFollow/Follower ❖ ソース: 朝日新聞参院選候補者データ [2], Twitter[3] 看板 ❖ データ: Google検索数 ❖ ソース: Google Trend [4] 選挙区予測のアプローチ : 4つのバン 事前情報 + 情勢情報 = 3バン + 序, 終盤情勢調査 [1] 参議院議員通常選挙結果調(一覧), https://www.e-stat.go.jp/stat-search/files?page=1&toukei=00200236 [2] 2019参議院選挙(参院選):朝日新聞デジタル, https://www.asahi.com/senkyo/senkyo2019/ [3] Twitter, https://twitter.com/ [4] Google Trend, https://trends.google.com/trends/ [5] 朝日新聞記事データベース聞蔵II, http://database.asahi.com/index.shtml 序, 終盤情勢調査 ❖ データ: 朝日新聞序盤, 終盤情勢調査 記事テキスト ❖ ソース: 朝日新聞記事データベース 聞蔵II [5] 1 選挙区予測のアプローチ: 4つのバン チーム おいしいカレー ※3バン: カバン=選挙資金, 地盤=支持, 看板=知名度からなる、選挙に勝つために必要と言われている三つの要素の俗称。
  • 2. 看板 ❖ Google Trendsより候補者の選挙前一年間にわたるGoogle検索数の総和を取得 ❖ Google検索数を特徴量 ‘google_search’ として使用した。 (pytrends) 地盤 カバン ❖ 参議院議員通常選挙結果調より過去の候補者の 選挙運動費を取得 (pdf) ❖ 2019の候補者に関して ➢ 2019以前に立候補経験/現職議員はその際の選挙運動費を仮定 ➢ 立候補経験のない議員は所属政党の過去の平均値で埋める ❖ 選挙運動費を特徴量 ‘expense’ として使用した。[6]より着想 3バン 2 選挙区予測のアプローチ: 4つのバン チーム おいしいカレー リアル地盤 ❖ 朝日新聞デジタルより候補者の基本情報 , 特に当選回数を取得 (importxml) ❖ 当選回数>0を1, 当選回数0を0に変換し、特徴量 ‘previous’ として使用した。 ネット地盤 ❖ Twitterより候補者のfollower数を取得 (importxml) ❖ 特徴量 ‘follower’ として使用した。[7]より着想 [6] 浅野 正彦, 矢内 勇生, Rによる計量政治学, ISBN: 978-4274223132, 2018. [7] 那須野 薫, 奥山 晶二郎, 中西鏡子, 松尾 豊, Twitterにおける候補者の選挙地盤に着目した国政選挙の当選者予測,   情報処理学会論文誌56(10), 2044-2053, 2015.
  • 3. 朝日新聞 序盤/終盤情勢調査 概要 ❖ 無作為3段抽出法で電話をかけるRDD方式 ❖ 朝日新聞社による総合的な分析 期間 ❖ 序盤情勢調査: 7/3 - 7/4 ❖ 終盤情勢調査: 7/15 - 7/16 手順 ❖ 序盤/終盤情勢調査の記事テキストを取得する ❖ それぞれのテキストについて候補者名の 出現順でランクづけ ❖ ランク上位改選数分の候補者を 1, 改選数以下より下位のランクの候補者を 0とする ❖ それぞれ特徴量 early_seat, late_seat として予測に使用した 序盤/終盤情勢調査 > 朝日新聞社は4、5の両日、参院選道選挙区(改選数3)について、有権者を対象に電話による調査を実施 し、取材で得た情報を加味して総合的に序盤の情勢を探った。自民の高橋はるみ(65)、立憲民主の勝部賢志 (59)の2氏がほかを引き離し、リードしている。自民の岩本剛人氏(54)が先行、共産の畠山和也氏(47)は懸命 に追っており、国民民主の原谷那美氏(35)らは厳しい戦いだ。ただ、半数近い有権者が態度を明らかにしてお らず、終盤にかけて情勢が変わる可能性がある。 → 改選数は3なので 高橋はるみ, 勝部賢志, 岩本剛人 北海道選挙区における序盤情勢調査テキスト 3 選挙区予測のアプローチ: 4つのバン チーム おいしいカレー
  • 4. 予測手法と評価 予測手法 4 選挙区予測のアプローチ: 4つのバン チーム おいしいカレー [8] Cox, DR (1958). “The regression analysis of binary sequences (with discussion)”. J Roy Stat Soc B 20: 215–242. 評価 2013-2016 2016の参院選において同様のコンペを想定 71 / 73点 アルゴリズム : Logistic Regression [8] まとめ 3バンと情勢を考慮した選挙区予測方法を提案した。 ➢ 3バン ... 選挙期間前から入手可能な公開情報を用い汎用性を担保した。公職選挙における一種の定石を実デー タに落とし込み、予測に用いたところに新規性がある。 ➢ 情勢 ... 上記の3バンとともに実際の選挙情勢を考慮することで精度向上をはかり、情勢情報を予測に用いること に一定の効果があることを確認した。
  • 5. 5チーム おいしいカレー 比例区予測のアプローチ : 政党の4分類 各党派について、過去 3回の選挙での「全体得票率」「個人票のみの得票率 」「政党名票のみの得票率 」の開票結果および朝 日新聞社世論調査による「支持する政党」「比例区で投票したい政党 」の回答を正解データとして相関をとり、どの変数の組み 合わせによる相関係数が最も高いかによって、大きく 4つに分類した。そして、党派ごとに議席数予測アルゴリズムを決定し た。 支持層の影響が強い 無党派層の影響が強い 個の力が強い個の力が弱い 政党票得票率および全体得票率の推 測に使う調査支持率は、議席予測を 載せている「参院選情勢調査」ではな く、あえて「世論調査」のデータを使用 した。世論調査は、地域を限定した調 査を行う必要がないため、携帯電話を 含めたRDD調査を行っている。よっ て、より世相を反映した政党支持率 データが取れていると判断した。 立憲・国民は、ともに旧民進党および 民主党を過去データとした。 比例区予測のアプローチ: 政党の4分類 支持率データ
  • 6. 6チーム おいしいカレー 政党ごとの得票数推測アルゴリズム 「個の力」が弱ければ、メディアの調査支持率から党派の得票率 全体を予想できる。 「個の力」が強ければ、「組織票」など、個人票による得票率を 別建てで推測する必要がある。 「支持政党率」との相関が強いのは、支持層が 強固かつ正直に答えてくれる党派。 「投票政党率」との相関が強いのは、得票の多くが 流動的な層によるものである党派。 ● 自民党:「支持政党率」から政党票のみ推測。 ● 立憲・国民・社民:「投票政党率」から政党票のみ推測。 ● 共産党:「投票政党率」から全体得票率を推測。 ● 維新:いずれの相関も低い上、個人票得票数が多くないため、「支持政党率」から全体得票率を推測したものと、政党得 票率を推測し係数をかけることで全体得票率としたものの平均から推測。 ● 公明党:支持層が固定的かつ調査支持率からの推測が困難と判断したため、過去 3回の平均とした。 ● 「残余」として、れいわ新選組の得票数を、山本太郎が所属していた 2016年当時の生活の党の得票数を使用して推測し た。 比例区予測のアプローチ: 政党の4分類 4分類の特徴 決定したアルゴリズム
  • 7. 7チーム おいしいカレー 個人票をタイプ別に予測する ● 組織票(業界団体政治連盟系 ) 会員数は非公開だが、会員数に対して圧倒的かつ安定的な数の集票力を誇る。汚職事件を起こ さない限り。これらの組織内候補の得票数は、過去 3回の選挙の平均とした。 ● 組織票(連合系) 日本最大の労働団体で、傘下の産別が組織内候補を擁立している。組 合員数は毎年公表されている。過去 2回の選挙の組合員数と得票数の 割合の平均をとり、去年の組合員数から得票数を推測した。 ● ベテラン議員・現職タレント候補 組織はないが、得票率が安定している。これも過去の平均とした。 ● 新人タレント候補 得票数は出馬政党によらず、個人の知名度によると推測。前回選挙のタレント候補 と、選挙期間中のGoogle Trendsによる検索数を比較し、得票数を推定した。 ● 社民党 唯一の有力候補と目される吉田忠智の得票数を、過去 3回の選挙の福島瑞穂を除く上位 2名の 得票数の合計を平均から推測。 比例区予測のアプローチ: 政党の4分類
  • 8. 8チーム おいしいカレー 得票率推測結果 党派 個人票得票数 政党票得票数 合計得票数 得票率 獲得議席 自民党 4608691 16307150 20915841 40.004% 21 立憲民主党 1763030 6219312 7982342 15.267% 8 国民民主党 1285312 1036552 2321864 4.441% 2 公明党 7593492 14.523% 7 共産党 4645150 8.884% 4 日本維新の会 5739742 10.978% 5 社民党 210526 1807923 2018449 3.861% 2 残余 1067301 2.041% 1 参考文献 朝日新聞社世論調査 (2019年07月15日、2016年07月04日、2013年07月15日掲載分) - 聞蔵IIより 総務省参議院議員通常選挙選挙資料 (第22,23,24回) http://www.soumu.go.jp/senkyo/senkyo_s/data/sangiin/ichiran.html 厚労省労働組合基礎調査 (平成25~30年) https://www.mhlw.go.jp/toukei/list/13-23c.html 比例区予測のアプローチ: 政党の4分類