Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Criticisms of big data

51 views

Published on

2017 Data Science class in Korea Univ
What is Big Data?
Criticisms of big data

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

Criticisms of big data

  1. 1. 고려대학교 이상근 교수 http://dilab.korea.ac.kr 데이터 과학 Data Science
  2. 2. 과제03 (Due: 4월09일(일) 23시59분) (How: PPT파일, 블랙보드에 upload)
  3. 3. 목차 1. 빅 데이터(Big Data)란 무엇인가? 2. 빅 데이터와 한국의 생태계 1) 데이터의 범위가 확장되는 문제 2) 빅 브라더의 가능성 3) 통계는 과연 믿을 만할까? 4) 불평등 : 전자 수저와 종이 수저 3. 결론
  4. 4. 빅 데이터(Big Data)란 무엇인가? 빅 데이터 : 많은 양의 데이터로부터 가치를 추출하고 결과를 분석하는 것. 그런데 중요한 것은, 이 데이터의 범위와 크기가 엄청나게 넓어졌다. 인공 언어뿐만 아니라 자연어를 처리할 수 있게 되었기 때문이다. ML, NLP 등의 기술과 함께 쓰이며 다보스 포럼에서 4차 산업혁명을 선포하 며 빅 데이터의 중요성은 더욱 커졌다. 모든 기업에서 이와 관련된 인력을 공 격적으로 유치하고 있는데 이는 단순히 ‘한국형 OOO’와 같은 유행이라고 보 기는 힘들다. 세계 경제학자들은 이를 거센 파도가 아니라 거부할 수 없는 거 대한 물결이라고 여기고 있다.
  5. 5. 빅데이터와 한국의 생태계 - 한국의 제조업은 생산력 극대화에 초점을 맞추어 3차 산업혁명의 최정점 에 와있다. 주로 ‘패스트 팔로워'전략을 가지고 있었지만 단순히 쫓아가 기에는 새로운 상품과 서비스가 너무나 많고, 공정 기술력으로 승부하는 시장이 쇠퇴하고 있다. - 대기업의 오너가 자녀에게 상속되면서 혁신을 꾀하기보다 일정 수준 이상 의 성과에 만족하고 물려받은 것을 잘 지켜내겠다는 생각을 가지고 있다. 기존 인력들의 위험 부담을 보상해주는 시스템이 없다. - 인더스트리 4.0에서 주장하는 대기업과 중소기업의 상호 네트워크를 기대 할 수 없다. 혁신에 유리한 구조인 중소기업은 인력과 자본이 부족한데다 납품단가 후려치기나 아이디어 가로채기가 관행처럼 시행되고 있기 때문 이다. - 정부가 바뀔 때마다 국가 R&D 기조가 바뀐다. - 과거에는 큰 물고기가 작은 물고기를 잡아먹었지만 이제는 빠른 물고기가 느린 물고기를 잡아먹는 시대가 온다.
  6. 6. 빅데이터와 한국의 생태계 한 마디로 한국은 위험하다고 볼 수 있다. 앞으로 3~5년 사이를 4차 산업혁 명을 따라갈 마지막 기회로 보기도 한다. 한편, 빅데이터의 부정적인 측면에 집중하고자 한다.
  7. 7. 1. 데이터의 범위가 확장되는 문제 마이클 센델의 <돈으로 살 수 없는 것들>이 던지는 화두 “팔기 시작하는 순간 그 대상은 그 만큼의 가치를 지니게 된다. 시장경제가 돈 으로 거래될 수 없다고 여겨졌던 도덕적인 영역으로 확대되고 있다. 윤리적인 행동은 이제 도덕적 판단이 배제된 단순한 가격으로 생각될 수 있다.” 이제는 일상적인 대화, 개인의 거래 내역, 소비 패턴, 위치 정보, 신체 정보, 일기, 감정적인 표현 등 일반적으 로 생각하는 것보다 더 많은 것들을 수집하고 처리한다. 사람의 모든 데이터가 거래되기 시작한 것이다. 사람의 속성 중 데이터로 활용하기 좋은 것은 더 높은 가치로, 그렇지 않은 것들은 더 낮은 가치로 생각될 수 있다. 결국, 빅데이터는 도덕 논리가 될 수 있어야 한다. 도덕 적으로 데이터를 사용해야 한다.
  8. 8. 2. 빅 브라더의 가능성 빅 브라더에 대한 논의는 이전부터 다뤄졌지만 빅 데이터로 인해 위험성은 훨씬 커졌다. 단순히 감시할 뿐만 아니라 이제 는 분석하고 구체적으로 개인의 행동을 예측하기 때문이다. 자동 사찰 시스템이 개발될 지도 모른다.
  9. 9. 3. 통계적 분석은 과연 믿을 만할까? 수많은 데이터에 대해 통계적 분석을 많이 사용한다. 그러나 통계적인 방법이 항상 유익할까? 통계적 분석은 과연 믿을 만할까? 그렇지 않다. 통계적인 방법으로 가치를 생산 할 때 사회의 편견, 인종 차별, 비도덕적인 문 제를 고착화 할 가능성이 있기 때문이다. 통계는 데이터가 가지는 윤리적인 부분을 고 려하지 않기 때문이다. 다수가 사용하는 단어 임에도 지양해야 할 때가 있다.
  10. 10. 4. 불평등 : 전자 수저와 종이 수저 데이터가 불충분한 특정 취약 계층에 대해 불이익도 고착화 될 수 있다. 또한 의도적인 데이터를 대량 생산할 수 있다. 가지고 있는 정보의 양에 따라 발생하는 차이는 더 커졌다. 충분 한 양의 데이터로 만들어진 기술을 뛰어넘기는 더 어려워졌다. http://sseryuni.blog.me/150130003027
  11. 11. 결론 빅 데이터로 인해 본격적으로 정보 기술이 도덕적인 영역으로 침투했다. 빅 데이터를 다룰 때 도덕 논리가 필요하다.

×