g0v summit 2014 - How we open the National Assembly in South Korea
2011-02-26 More ideas for POPONG
1. POPONG (Public Open Politics & engineeriNG)
Data Mining in Politics
•Date : 2011-02-26
•Eunjeong Park, Jooseong Park
2. Introduction
•목표
데이터 가공 및 활용 방안 리서치
기간: 2011-02-13(일) ~ 2011-02-26(토)
•고려 사항
회의록이 아닌, 정치인 인물 DB + α가 있음을 가정
모바일 환경에서 손쉽게 활용 가능한 것은?
주변 검색 기능 활용
직관성, 대중성, 객관성
2
3. Voter DB
•유권자들의 특성
질문. 지난 총선에서 누구에게 투표했는가?
기억이 나지 않거나,
기억하지만 “그 인간에게 투표했단 말이야?”와 같은 반응이 두렵거나, ...
정치에 관심이 있고, 정치인들과 같은 시각으로 세상을 바라보는 사람들은 어
느 나라에서나 소수임
전화 설문에 응답하는 것은 미국인의 12퍼센트에 불과
•유권자 DB의 특성
쇼핑과 달리 누구에게 투표했는지가 비밀이다
투표 패턴을 바탕으로 판단하기 어려움
3
4. Voter DB
•따라서, 유권자들의 특성을 파악하기 위해서는 ‘다른’ 데이터를 수집
어디 사는지, 어디서 일하는지, 무엇을 좋아하는지, 무엇을 두려워하는지, 공
동체나 국가 같은 주제에 대해 어떤 느낌을 가지고 있는지, ...
→ 가치관
•가치관 파악의 방법론
예. 같은 단어라도 대상에 따라 완전히 다른 반응을 불러온다
‘정의’ : 살인자를 처형하는 것, 가난한 어린이들에게 균등한 기회를 주는 것, ...
같은 반응을 일으키는 사람들끼리 그룹을 지을 수 있다면 정치인들은 각각의
유권자가 정부의 역할을 어떻게 바라보는지를 파악할 수 있을 것이다
4
5. Voter DB
•유권자의 가치관 파악을 위해 필요한 원료 (The Numerati, 2009)
조사 대상자에 대한 기본적인 자료
법원의 판결, 세금, 부동산 거래, 출생신고 및 사망신고 자료
Ex: 초이스포인트(ChoicePoint)
쇼핑 및 라이프스타일 관련 데이터
Ex: 액시엄(Acxiom)
사람들의 성향 데이터
Ex: 양켈로비치(Yankelovich)의 ‘모니터(Monitor)’
• ‘미래는 어떤 모습인가?’ : 낙관적, 무서움, 신남, 어두움, ...
• ‘어떤 것을 성공이라고 생각하는가?’ : 건강한 가족공동체, 돈, 출세, 존경, ...
• ‘성공을 하려면 향후 갖추어야 할 역량과 자산은 무엇인가?’
누구에게 투표했는지, 투표할 것인지가 아닌 가치관에 대한 질문
“사람들은 자신에 대해 이야기하기를 좋아한다”
: 정치 질문이 아닌 개인적 가치를 묻는 질문에는 시간을 내서 대답을 한다
5
6. Politician DB
•정치인들의 특성
정치인들은 마치 다른 사람들도 모두 자신들만큼이나 열정과 관심을 갖고 정
치를 바라본다는 전제하에 정치 현황을 분석
유권자들을 이해하지 못함
•정치인 DB의 특성
수치화하기 어려운 정보 위주
Categorical 변수로 변환
Ex: 학력 (초졸:1, 중졸:2, 고졸:3,…)
6
7. •정치인들을 n개의 그룹으로 세분화
7
정치인들의 demographic 정보
(나이, 성별, 정치적 성향,…)
8. References
•관련 사이트
Muckety - Map relationships among people and organizations
http://www.muckety.com/Joshua-Gotbaum/14742.muckety
벌통 – Sentiment Analysis Tool based on Twitter
http://www.beoltong.wo.tc/search.php?mytext=%EC%9D%B4%EB%AA%85%EB%
B0%95
Presidential Demographics
http://chandoo.org/wp/2008/10/07/red-vs-blue-35-cool-visualizations-on-2008-
us-presidential-election/
Data mining and politics
http://www.stat.columbia.edu/~cook/movabletype/archives/2006/03/data_
mining_and.html
http://www.stat.columbia.edu/~jakulin/Politics/
http://datamining.typepad.com/data_mining/politics/
The GovTrack Blog: Numerical methods for determining leadership and
ideology in Congress
• http://www.govtrack.us/blog/2010/12/26/repstats/
8