SlideShare a Scribd company logo
1 of 14
뭐?

작은 빅데이터 이야기
12장으로 보는 빅데이터의

과
일반인의 생각
그러니까
데이터를 모아

뭔지 모르겠지만 복잡한 분석을 하면

헛소문을 잡아 낼 수 있다

…과연 그럴까?
아무리 생각해도 뭐가 이상해서 찾아 봤습니다
http://mia.kaist.ac.kr/publications/rumor/
1. 트위터에 오고가는 많은 이야기가 있는데
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 내용이 있는 것처럼 만
들기는 해야겠는데 귀찮네 지금 시간이 몇 신데 이걸 써야하는거 아 그런다고 내가 이걸
진짜 올릴지 아닌지도 모르겠는데 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬
나

2. 그 중에서 루머는 이런 특징이 있어서
•

잊을만 하면 한 번씩 터져나온다!

•

평소엔 잘 모르는 사람들끼리도 이야기를 돌린다!

•

추측이나 감정적인 표현이 들어간다!
샘플 데이터를 바탕으로 약 85~90% 가량의 분류 정확도…

3. 어떤 트윗이 루머에 속하는지 분류할 수 있다

@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 내용
이 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 몇 신데 이걸
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가
이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸
있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가
이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸
있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 내용
프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나
이 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 몇 신데 이걸
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 내용
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데
이 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 몇 신데 이걸
프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가
이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸
있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가
이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸
있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가
이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸
있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용
@소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가
이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸
있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이
써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데
프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나
그런데 중요한게 하나 있다

확실한 사실은,

글쓴이는 글을 쓴 시점에

진위를 확인하지 못했다는 것
뿐!
컴퓨터가 전지전능한 신도 아니고,

진실은 저 너머에

그 누가 알리오…
비유하자면 이런 얘기다
어린 아이는 사람의 성별구분을 어떻게 익혀갈까?
• 스타일 특징: 옷(치마/바지), 악세서리
• 그 중에서도 특히, 머리카락 길이
• 목소리 톤
• 행동 특징

• 소지품
• 기타등등 기타등등…

확실히 구분하고 있습니다
인간의 뇌는 패턴 인식, 분류를 워낙 잘 해서
치마를 입었지만 남자

싸움 잘 하지만 여자

프로필 사진은 여자이지만 남자

수 많은 경험을 쌓고 쌓아가다 보면, 직관적으로 구분한다
그러나 실수도 끊이지 않는다…
여성 측으로 구분했지
만, 실제론 남성

여성

남성

 ‘개체 속성’을 통해 집단을 ‘분류‘하는 방법.
최근 빅데이터 기술의 한 축으로 주목받는
ML(=기계학습, Machine Learning)의 주요 테마.
뭐 그냥 그렇다구요…

애니웨이,
뭔 소린진 알겠는데, 굳이 빅데이터일 필욘 없지 않나?

데이터(=경험)가 많을수록 판단이 향상되고,

과거엔 엄두도 못 내던 대용량 데이터 처리를
실전 배치할 수 있게 되었다는게 포인트!
왜 이런 오해가 생길까?

어렵기 때문이다

보통, 관심이 없기 때문이다
그리고 – 많이 팔아야 하기 때문이다
정리!
원 논문은, 빅데이터 분석을 통한 루머(뜬소문) 분류 문제에서
‘잊혀질만 하면 또 반복되는 특성’을 추가로 고려하면

 그렇다고 루머가 진실인지 거짓인지까지
판단할 수 있다는건 아니다…

정확도를 향상시킬 수 있음을 확인했다.

ML 뿐만 아니라, 오늘날 빅데이터 기술로, 종전엔 불가능했던
분석, 해석이 가능해졌다.

 그렇다고 SF를 만들면 곤란하다…

빅데이터는 어렵고 복잡하기 때문에 쉽게 오해받고,

…때론 이해관계 때문에 과장해서 오해를 유도하기도 한다
 그렇다고 무시하면……

- 소셜경험전략
첨부 이미지 링크
2 페이지
http://mlbpark.donga.com/mbs/articleV.php?mbsC=bullpen&mbsIdx=3249562&cpage=&mbsW=&select=&opt=&keyword=
3 페이지
http://igcs.khcu.ac.kr/board/view.jsp?m=50026&BRD_NO=738098
http://jinto.pe.kr/2231
6페이지
http://lunatree.tistory.com/36
7 페이지
http://blog.daum.net/chefchef80/32
http://blog.daum.net/arwda/3361
8페이지
http://peterkoon.egloos.com/v/1208814
http://isplus.joins.com/article/524/13595524.html
http://531style.tistory.com/entry/netkama
9페이지
http://marchbest.tistory.com/112
10 페이지
http://www.sas.com/offices/asiapacific/korea/data-quality/index.html
http://blog.naver.com/PostView.nhn?blogId=sosacha&logNo=120153708318
11 페이지
http://acornpub.co.kr/blog/426
http://uncyclopedia.kr/wiki/%EA%B0%9C%EA%B7%B8%EB%A7%8C%ED%99%94_%EB%B3%B4%EA%B8%B0_%EC%A2%8B%EC%9D%80_%EB%82%A0

12페이지
http://luv4.us/archives/1824

사용에 문제가 있을 경우 연락 부탁드립니다.
Facebook/social.experience.strategy

More Related Content

Viewers also liked

데이터 분석 실무 3강 (실습 2차)
데이터 분석 실무 3강 (실습 2차)데이터 분석 실무 3강 (실습 2차)
데이터 분석 실무 3강 (실습 2차)YongGeun Song
 
데이터 분석 실무 8강
데이터 분석 실무 8강데이터 분석 실무 8강
데이터 분석 실무 8강YongGeun Song
 
데이터 분석 실무 1강
데이터 분석 실무 1강데이터 분석 실무 1강
데이터 분석 실무 1강YongGeun Song
 
[소셜스쿨 21기 1일차] 디지털 마케팅이란 무엇인가_160404
[소셜스쿨 21기 1일차] 디지털 마케팅이란 무엇인가_160404[소셜스쿨 21기 1일차] 디지털 마케팅이란 무엇인가_160404
[소셜스쿨 21기 1일차] 디지털 마케팅이란 무엇인가_160404규문 최
 
검색엔진을 이해하고, Ga 태그매니저 활용을 통해 데이터로 마케팅을 논하는 마케터, 아이엠뮤직 정민규
검색엔진을 이해하고, Ga 태그매니저 활용을 통해 데이터로 마케팅을 논하는 마케터, 아이엠뮤직 정민규검색엔진을 이해하고, Ga 태그매니저 활용을 통해 데이터로 마케팅을 논하는 마케터, 아이엠뮤직 정민규
검색엔진을 이해하고, Ga 태그매니저 활용을 통해 데이터로 마케팅을 논하는 마케터, 아이엠뮤직 정민규FAST CAMPUS
 
Google analytics 데이터를 통해 체계적인 마케팅 실험을 진행하는 퍼포먼스 마케터 장형범
Google analytics 데이터를 통해 체계적인 마케팅 실험을 진행하는 퍼포먼스 마케터 장형범Google analytics 데이터를 통해 체계적인 마케팅 실험을 진행하는 퍼포먼스 마케터 장형범
Google analytics 데이터를 통해 체계적인 마케팅 실험을 진행하는 퍼포먼스 마케터 장형범FAST CAMPUS
 

Viewers also liked (6)

데이터 분석 실무 3강 (실습 2차)
데이터 분석 실무 3강 (실습 2차)데이터 분석 실무 3강 (실습 2차)
데이터 분석 실무 3강 (실습 2차)
 
데이터 분석 실무 8강
데이터 분석 실무 8강데이터 분석 실무 8강
데이터 분석 실무 8강
 
데이터 분석 실무 1강
데이터 분석 실무 1강데이터 분석 실무 1강
데이터 분석 실무 1강
 
[소셜스쿨 21기 1일차] 디지털 마케팅이란 무엇인가_160404
[소셜스쿨 21기 1일차] 디지털 마케팅이란 무엇인가_160404[소셜스쿨 21기 1일차] 디지털 마케팅이란 무엇인가_160404
[소셜스쿨 21기 1일차] 디지털 마케팅이란 무엇인가_160404
 
검색엔진을 이해하고, Ga 태그매니저 활용을 통해 데이터로 마케팅을 논하는 마케터, 아이엠뮤직 정민규
검색엔진을 이해하고, Ga 태그매니저 활용을 통해 데이터로 마케팅을 논하는 마케터, 아이엠뮤직 정민규검색엔진을 이해하고, Ga 태그매니저 활용을 통해 데이터로 마케팅을 논하는 마케터, 아이엠뮤직 정민규
검색엔진을 이해하고, Ga 태그매니저 활용을 통해 데이터로 마케팅을 논하는 마케터, 아이엠뮤직 정민규
 
Google analytics 데이터를 통해 체계적인 마케팅 실험을 진행하는 퍼포먼스 마케터 장형범
Google analytics 데이터를 통해 체계적인 마케팅 실험을 진행하는 퍼포먼스 마케터 장형범Google analytics 데이터를 통해 체계적인 마케팅 실험을 진행하는 퍼포먼스 마케터 장형범
Google analytics 데이터를 통해 체계적인 마케팅 실험을 진행하는 퍼포먼스 마케터 장형범
 

Similar to 작은 빅데이터 이야기: 12장으로 보는 빅데이터의 빛과 그림자

2016 kcd 세미나 발표자료. 구글포토로 바라본 인공지능과 머신러닝
2016 kcd 세미나 발표자료. 구글포토로 바라본 인공지능과 머신러닝2016 kcd 세미나 발표자료. 구글포토로 바라본 인공지능과 머신러닝
2016 kcd 세미나 발표자료. 구글포토로 바라본 인공지능과 머신러닝JungGeun Lee
 
텀블러 유저빌리티 보고서
텀블러 유저빌리티 보고서텀블러 유저빌리티 보고서
텀블러 유저빌리티 보고서Leonardo Kim
 
블로그와 트위터, 어떻게 시작할까
블로그와 트위터, 어떻게 시작할까블로그와 트위터, 어떻게 시작할까
블로그와 트위터, 어떻게 시작할까Sori Sori Jeonju
 
Edu startup 스마트미디어산업협회_대구경북디자인센터_151216_pdf
Edu startup 스마트미디어산업협회_대구경북디자인센터_151216_pdfEdu startup 스마트미디어산업협회_대구경북디자인센터_151216_pdf
Edu startup 스마트미디어산업협회_대구경북디자인센터_151216_pdfseho Kim
 
[Dev rookie] 어디로 가야 하나요(13.10.05)
[Dev rookie] 어디로 가야 하나요(13.10.05)[Dev rookie] 어디로 가야 하나요(13.10.05)
[Dev rookie] 어디로 가야 하나요(13.10.05)해강
 
[NDC18] 나는 테스트 정책대로 살기로 했다.(코멘터리)
[NDC18] 나는 테스트 정책대로 살기로 했다.(코멘터리)[NDC18] 나는 테스트 정책대로 살기로 했다.(코멘터리)
[NDC18] 나는 테스트 정책대로 살기로 했다.(코멘터리)Wooram Hwang
 
바라는 대로 라이터가 쓰게 만드는 시나리오 디렉팅 기법
바라는 대로 라이터가 쓰게 만드는 시나리오 디렉팅 기법바라는 대로 라이터가 쓰게 만드는 시나리오 디렉팅 기법
바라는 대로 라이터가 쓰게 만드는 시나리오 디렉팅 기법Lee Sangkyoon (Kay)
 
100310 타임라인의 노예 @Nomad0115
100310 타임라인의 노예 @Nomad0115100310 타임라인의 노예 @Nomad0115
100310 타임라인의 노예 @Nomad0115JUNGEUN KANG
 

Similar to 작은 빅데이터 이야기: 12장으로 보는 빅데이터의 빛과 그림자 (9)

2016 kcd 세미나 발표자료. 구글포토로 바라본 인공지능과 머신러닝
2016 kcd 세미나 발표자료. 구글포토로 바라본 인공지능과 머신러닝2016 kcd 세미나 발표자료. 구글포토로 바라본 인공지능과 머신러닝
2016 kcd 세미나 발표자료. 구글포토로 바라본 인공지능과 머신러닝
 
텀블러 유저빌리티 보고서
텀블러 유저빌리티 보고서텀블러 유저빌리티 보고서
텀블러 유저빌리티 보고서
 
블로그와 트위터, 어떻게 시작할까
블로그와 트위터, 어떻게 시작할까블로그와 트위터, 어떻게 시작할까
블로그와 트위터, 어떻게 시작할까
 
Edu startup 스마트미디어산업협회_대구경북디자인센터_151216_pdf
Edu startup 스마트미디어산업협회_대구경북디자인센터_151216_pdfEdu startup 스마트미디어산업협회_대구경북디자인센터_151216_pdf
Edu startup 스마트미디어산업협회_대구경북디자인센터_151216_pdf
 
[Dev rookie] 어디로 가야 하나요(13.10.05)
[Dev rookie] 어디로 가야 하나요(13.10.05)[Dev rookie] 어디로 가야 하나요(13.10.05)
[Dev rookie] 어디로 가야 하나요(13.10.05)
 
[NDC18] 나는 테스트 정책대로 살기로 했다.(코멘터리)
[NDC18] 나는 테스트 정책대로 살기로 했다.(코멘터리)[NDC18] 나는 테스트 정책대로 살기로 했다.(코멘터리)
[NDC18] 나는 테스트 정책대로 살기로 했다.(코멘터리)
 
농촌과트위터 01
농촌과트위터 01농촌과트위터 01
농촌과트위터 01
 
바라는 대로 라이터가 쓰게 만드는 시나리오 디렉팅 기법
바라는 대로 라이터가 쓰게 만드는 시나리오 디렉팅 기법바라는 대로 라이터가 쓰게 만드는 시나리오 디렉팅 기법
바라는 대로 라이터가 쓰게 만드는 시나리오 디렉팅 기법
 
100310 타임라인의 노예 @Nomad0115
100310 타임라인의 노예 @Nomad0115100310 타임라인의 노예 @Nomad0115
100310 타임라인의 노예 @Nomad0115
 

More from YongGeun Song

데이터 분석 실무 9강
데이터 분석 실무 9강데이터 분석 실무 9강
데이터 분석 실무 9강YongGeun Song
 
데이터 분석 실무 7강 (실습 4차)
데이터 분석 실무 7강 (실습 4차)데이터 분석 실무 7강 (실습 4차)
데이터 분석 실무 7강 (실습 4차)YongGeun Song
 
데이터 분석 실무 6강
데이터 분석 실무 6강데이터 분석 실무 6강
데이터 분석 실무 6강YongGeun Song
 
데이터 분석 실무 4강
데이터 분석 실무 4강데이터 분석 실무 4강
데이터 분석 실무 4강YongGeun Song
 
데이터 분석 실무 2강 (실습 1차)
데이터 분석 실무 2강 (실습 1차)데이터 분석 실무 2강 (실습 1차)
데이터 분석 실무 2강 (실습 1차)YongGeun Song
 
Uxcamp2014 - 소셜경험전략
Uxcamp2014 - 소셜경험전략Uxcamp2014 - 소셜경험전략
Uxcamp2014 - 소셜경험전략YongGeun Song
 

More from YongGeun Song (6)

데이터 분석 실무 9강
데이터 분석 실무 9강데이터 분석 실무 9강
데이터 분석 실무 9강
 
데이터 분석 실무 7강 (실습 4차)
데이터 분석 실무 7강 (실습 4차)데이터 분석 실무 7강 (실습 4차)
데이터 분석 실무 7강 (실습 4차)
 
데이터 분석 실무 6강
데이터 분석 실무 6강데이터 분석 실무 6강
데이터 분석 실무 6강
 
데이터 분석 실무 4강
데이터 분석 실무 4강데이터 분석 실무 4강
데이터 분석 실무 4강
 
데이터 분석 실무 2강 (실습 1차)
데이터 분석 실무 2강 (실습 1차)데이터 분석 실무 2강 (실습 1차)
데이터 분석 실무 2강 (실습 1차)
 
Uxcamp2014 - 소셜경험전략
Uxcamp2014 - 소셜경험전략Uxcamp2014 - 소셜경험전략
Uxcamp2014 - 소셜경험전략
 

작은 빅데이터 이야기: 12장으로 보는 빅데이터의 빛과 그림자

  • 3. 그러니까 데이터를 모아 뭔지 모르겠지만 복잡한 분석을 하면 헛소문을 잡아 낼 수 있다 …과연 그럴까?
  • 4. 아무리 생각해도 뭐가 이상해서 찾아 봤습니다 http://mia.kaist.ac.kr/publications/rumor/ 1. 트위터에 오고가는 많은 이야기가 있는데 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 내용이 있는 것처럼 만 들기는 해야겠는데 귀찮네 지금 시간이 몇 신데 이걸 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬 나 2. 그 중에서 루머는 이런 특징이 있어서 • 잊을만 하면 한 번씩 터져나온다! • 평소엔 잘 모르는 사람들끼리도 이야기를 돌린다! • 추측이나 감정적인 표현이 들어간다! 샘플 데이터를 바탕으로 약 85~90% 가량의 분류 정확도… 3. 어떤 트윗이 루머에 속하는지 분류할 수 있다 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 내용 이 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 몇 신데 이걸 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 내용 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 이 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 몇 신데 이걸 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 내용 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 이 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 몇 신데 이걸 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 내용 @소셜경험전략 이걸 트위터 타임라인 피드라고 해야되나 뭔가 이 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나 몇 신데 이걸 있는 것처럼 만들기는 해야겠는데 귀찮네 지금 시간이 써야하는거 아 그런다고 내가 이걸 진짜 올릴지 아닌지도 모르겠는데 프로필 사진이라도 넣고 좀 공간이라도 줄일걸 그랬나
  • 5. 그런데 중요한게 하나 있다 확실한 사실은, 글쓴이는 글을 쓴 시점에 진위를 확인하지 못했다는 것 뿐!
  • 6. 컴퓨터가 전지전능한 신도 아니고, 진실은 저 너머에 그 누가 알리오…
  • 7. 비유하자면 이런 얘기다 어린 아이는 사람의 성별구분을 어떻게 익혀갈까? • 스타일 특징: 옷(치마/바지), 악세서리 • 그 중에서도 특히, 머리카락 길이 • 목소리 톤 • 행동 특징 • 소지품 • 기타등등 기타등등… 확실히 구분하고 있습니다
  • 8. 인간의 뇌는 패턴 인식, 분류를 워낙 잘 해서 치마를 입었지만 남자 싸움 잘 하지만 여자 프로필 사진은 여자이지만 남자 수 많은 경험을 쌓고 쌓아가다 보면, 직관적으로 구분한다
  • 9. 그러나 실수도 끊이지 않는다… 여성 측으로 구분했지 만, 실제론 남성 여성 남성  ‘개체 속성’을 통해 집단을 ‘분류‘하는 방법. 최근 빅데이터 기술의 한 축으로 주목받는 ML(=기계학습, Machine Learning)의 주요 테마. 뭐 그냥 그렇다구요… 애니웨이,
  • 10. 뭔 소린진 알겠는데, 굳이 빅데이터일 필욘 없지 않나? 데이터(=경험)가 많을수록 판단이 향상되고, 과거엔 엄두도 못 내던 대용량 데이터 처리를 실전 배치할 수 있게 되었다는게 포인트!
  • 11. 왜 이런 오해가 생길까? 어렵기 때문이다 보통, 관심이 없기 때문이다
  • 12. 그리고 – 많이 팔아야 하기 때문이다
  • 13. 정리! 원 논문은, 빅데이터 분석을 통한 루머(뜬소문) 분류 문제에서 ‘잊혀질만 하면 또 반복되는 특성’을 추가로 고려하면  그렇다고 루머가 진실인지 거짓인지까지 판단할 수 있다는건 아니다… 정확도를 향상시킬 수 있음을 확인했다. ML 뿐만 아니라, 오늘날 빅데이터 기술로, 종전엔 불가능했던 분석, 해석이 가능해졌다.  그렇다고 SF를 만들면 곤란하다… 빅데이터는 어렵고 복잡하기 때문에 쉽게 오해받고, …때론 이해관계 때문에 과장해서 오해를 유도하기도 한다  그렇다고 무시하면…… - 소셜경험전략
  • 14. 첨부 이미지 링크 2 페이지 http://mlbpark.donga.com/mbs/articleV.php?mbsC=bullpen&mbsIdx=3249562&cpage=&mbsW=&select=&opt=&keyword= 3 페이지 http://igcs.khcu.ac.kr/board/view.jsp?m=50026&BRD_NO=738098 http://jinto.pe.kr/2231 6페이지 http://lunatree.tistory.com/36 7 페이지 http://blog.daum.net/chefchef80/32 http://blog.daum.net/arwda/3361 8페이지 http://peterkoon.egloos.com/v/1208814 http://isplus.joins.com/article/524/13595524.html http://531style.tistory.com/entry/netkama 9페이지 http://marchbest.tistory.com/112 10 페이지 http://www.sas.com/offices/asiapacific/korea/data-quality/index.html http://blog.naver.com/PostView.nhn?blogId=sosacha&logNo=120153708318 11 페이지 http://acornpub.co.kr/blog/426 http://uncyclopedia.kr/wiki/%EA%B0%9C%EA%B7%B8%EB%A7%8C%ED%99%94_%EB%B3%B4%EA%B8%B0_%EC%A2%8B%EC%9D%80_%EB%82%A0 12페이지 http://luv4.us/archives/1824 사용에 문제가 있을 경우 연락 부탁드립니다. Facebook/social.experience.strategy