Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

뉴스알고리즘, 저널리즘, 민주주의

538 views

Published on

국민대 언론정보학부 강의용으로 정리해봤습니다.

Published in: Social Media
  • Hi there! Get Your Professional Job-Winning Resume Here - Check our website! http://bit.ly/resumpro
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Be the first to like this

뉴스알고리즘, 저널리즘, 민주주의

  1. 1. 뉴스 알고리즘 저널리즘 민주주의 생산, 유통, 수익을 통제하다 이성규 메디아티 미디어테크랩장 dangun76@mediati.kr
  2. 2. 기자는 알고리즘을 알아야 할까
  3. 3. 뉴스 알고리즘의 유형 생산 유통 수익 알고리즘 저널리즘 뉴스 배열 알고리즘 프로그래머틱 바잉 알고리즘 텍스트 영상 전환 알고리즘 번역 알고리즘 CMS(콘텐츠 관리) 알고리즘 뉴스 검색 클러스터링 문서 요약
  4. 4. 뉴스 생산과 알고리즘
  5. 5. News(Natural Language) Generating Algorithm
  6. 6. CMS 구성하는 알고리즘들 • Recommendation/Filtering Algorithm • Tag 추천, 관련 이미지 및 영상 추천 • 주목 효과 높이는 시퀀스 추천 • Fact-Checking algorithm • Automated Content Generating Algorithm • Automated Stories, Automated Video Creation
  7. 7. ­리사 깁스. AP 글로벌 사업 에디터 “자동화로 인해 그동안 주목받지 못했던 영세 사업 자를 포함해서 3700개가 넘는 기업의 실적 보고서 를 고객들에게 제공할 수 있게 되었습니다. 이는 이 전에 비해서 12배가 넘는 수치입니다.” “시간이 생기면서 AP의 언론인들은 모두 UGC에 관여하거나 멀티미디어 기사를 개발할 수 있게 됐으 며, 탐사 분석이나 좀 더 복잡한 이야기에 집중할 수 있게 됐습니다.”
  8. 8. [AP] 시장 영향력 증대
  9. 9. The analysis conducted by professors Elizabeth Blankespoor and Ed deHaan, along with PhD student Christina Zhu, found compelling evidence that automated articles increase firms’ trading volume and liquidity. - AP, Francesco Marconi
  10. 10. 뉴스 유통과 알고리즘
  11. 11. Airs = CF + RNN
  12. 12. RUBICS = Multi Armed Bandit
  13. 13. 지도, 비지도, 강화 학습 • 비지도 학습(Unsupervised Learning) • 알고 있는 지식이 없을 때 주어진 정보로부터 행동을 찾아가면서 업데이트 • 클러스터링(K-means 등) • 지도 학습(Supervised Learning) • 이미 알고 있는 지식을 바탕으로 원하지 않는 행동을 수정하면서 업데이트 • 서포트벡터머신, 회귀분석, 회귀분석 • 강화 학습(Reinforcement Learning) • 이미 알고 있는 지식과 아직 조사되지 않은 영역을 탐험하는 것 사이의 균형을 잡는 방식 • 멀티암드반디트,
  14. 14. K-means Clustering
  15. 15. k-means 특성 • 작동 방식 • K 값 임의(분석 뒤) 설정 • 무작위로 찍은 대표점을 한 가운데로 옮기기 위해 반복적으로 데이터 트레이닝 • 데이터와 대표점의 거리를 계산하는 방식으로 대표점을 다시 찾아가게 되는 방 식 • 한계 • 더 많은 클러스터로 분류할 경우 처음 대표점을 어떻게 잡았는지에 따라 결과가 달라질 수 있다 • k 값을 몇 개로 설정할지, 설정한 뒤 무작위 대표점을 어떻게 잡을지 설계자나 기획자가 관여
  16. 16. 추천 알고리즘의 작동원리 • Content Based Filtering Algorithm • 콘텐츠의 특성을 추출해 추천을 구현하는 방식 • 클러스터링 분석, 인공신경망(RNN), tf-idf • CF는 Collaborative Filtering Algorithm • Item-Item Based CF • User-User Based CF
  17. 17. CF 알고리즘의 한계 • Cold Start Problem • Item Cold Start, User Cold Start, System Cold Start • 계산 효율성의 문제 • 계산량이 많아 사용자수가 많을 경우 효율성이 낮아진다 • 롱테일 문제 • 사용자들의 관심이 적은 다수의 항목은 추천을 위한 충 분한 정보를 제공하지 못한다.
  18. 18. 과거의 나는 미래의 나를 예측(규정)할 수 있는가
  19. 19. 광고와 알고리즘
  20. 20. Multi Armed Bandit의 원리 • 강화학습(Reinforcement Learning) 알고리즘의 일종 • 탐색(Exploration)-추출 (exploitation)의 교환(trade off)를 해결하기 위한 방법론 • 웹 사이트의 A/B 테스트, 구글 애널리틱스와 같은 원리 • 탐색 : 여러 개의 시안 • 추출 : CTR
  21. 21. 왜 알고리즘을 뉴스에 접목하는가
  22. 22. 생산-소비의 관계 측면 • Mass Customization • 공급자 중심에서 수요자 중심으로 • 뉴스의 공급과잉과 희소성의 붕괴 • 뉴스 소비자의 관심사 다양화 • Datalization(데이터화) • Machine Readable Data의 증가(ex, 선관위, 스포츠, 공공기관) • Word2Vec과 같은 언어의 벡터화 소프트웨어 등장(NLP 향상) • 사물이 데이터 생산자로 전환 • Open Data의 활성화
  23. 23. 저널리즘 측면 • 데이터 처리 엄밀성에 대한 압력 • (인간) 기자 실수에 의한 오보 가능성 하락 • 팩트체크 등의 효율성과 엄밀성 증대 기대 • 정치적 중립성에 대한 사회적 압력 • 기계에 의한 배열로 정치적 편향성 회피 • 뉴스 수용자의 다양한 취향 동시적 만족 • 취향과 선호, 관심사에 따른 동시적 뉴스 생산 기대
  24. 24. 조직 및 산업적 측면 • 기자의 생산성 증대 • 더 적은 인력으로 현재 이상의 뉴스 생산 • 기자의 심층 보도 뉴스 생산 집중 • 지속적인 광고 수익 하락과 수익모델 부재 • 수익 하락으로 인건비 절감 경제적 압력 증대
  25. 25. Saving journalist news production time
  26. 26. 알고리즘과 민주주의
  27. 27. Machine Clustered Society • 페이스북 등에서 시민의 상호작용 범위가 관계와 관심 사에 따라 클러스터링 • 연결되면서 동시에 단절되는 흐름 • 이질 클러스터 간 교류 부재로 집단 극화(Group polarization) • 필터버블(Filter Bubble)의 일상화
  28. 28. 탈진실(Post-Truth) “객관적 사실이 공중의 의견을 형성하는데 개인적 신념과 감 정에 호소하는 것보다 영향력을 덜 끼치는 환경을 의미하는 것”
  29. 29. ­ Katherine Viner(가디언 편집국장). How Technology disrupted the truth. “팩트는 독자들의 선택의 여지가 없었던 활자 시대 의 유물.(they are a relic from the age of the printing press)”
  30. 30. 알고리즘 통제 시대 기자의 역할
  31. 31. ­ 페드로 도밍고스.(2016). ‘마스터 알고리즘’. 비즈니스북스. p.95 “컴퓨터가 배울 수 있다는 사실이 컴퓨터가 스스로 의지를 획득한다는 것을 의미하지 않는다. 머신러닝 알고리즘은 우리가 정해 준 목표를 달성하는 법을 배운다. 그들은 목표를 바꾸는 일에 착수하지 않는 다.”
  32. 32. 저널리스트로서 • [대상으로서 알고리즘] 알고리즘 역공학(reverse- engineering)을 통한 권력관계의 이해와 비판 • 플랫폼 등 알고리즘 통제 권력에 대한 비판 • [동료로서 알고리즘] 단순 반복형 기사의 기계 외주화 로 고품질 저널리즘 집중 • 알고리즘과 협업을 통한 고품질 뉴스 생산
  33. 33. 기자는 알고리즘을 알아야 할까
  34. 34. 참고문헌 • 박승택, 성인재, 서상원, 황지수, 노지성, & 김대원. (2017). 기계학습 기반의 뉴스 추천 서비스 구조와 그 효과에 대한 고찰. 사이버커뮤니케이션학보, 34(1), 5-48. • 서봉원. (2016). 콘텐츠 추천 알고리즘의 진화. 방송 트렌드&인사이트. Vol.05. 19~24. 한국 콘텐츠진흥원. • 이성규. (2016.9.12). 언론사가 알아야 할 알고리즘② 협업 필터링 추천. 블로터. • 이성규. (2016). 프로그래머틱 광고의 가치 증식 기제. academia.edu • 네이버 다이어리. (2017.2.16). 인공지능 기반 추천 시스템 AiRS를 소개합니다. 네이버 블로 그. • 카카오. (2017.5). Kakao AI Report. Vol.03. • Marconi 등. (2017.2). a guide for newsroom in the age of smart machine. AP Insight. • Schmit, Thomas. (2017.5.16). Smarter Journalism: Artificial Intelligence in the Newsroom. European Journalism Observatory.

×