1. NodeXL Chapter 10: Twitter 노드엑셀을 이용한 트위터 네트워크 분석 * 이 슬라이드는 Marc Smith, Analyzing Social Media Networks with NodeXL 의 10 장을 기초로 한국 이용자들이 노드 엑셀을 쉽게 사용할 수 있도록 만든 매뉴얼임 . 노드엑셀 최근 버전을 사용했으며 사례 또한 원제와 상이함 . * This slide was made by Han Woo Park and his students to help Koreans to use the NodeXL
2.
3. 2007 년 3 월과 2009 년 4 월 사이에 트위터는 급격한 성장을 보이는데 , 이는 2009 년 SXSW 페스티벌 기간중 트위터를 통해 새로운 제품정보를 공유했기 때문이다 . 또한 오프라 윈프리 및 셀러브리티들의 트위터 유입의 영향이 크다 . *Twitter * 다양한 트위터 클라이언트
4.
5. *Twitter Retweet 다른 사람의 트윗에 동의하거나 또 다른 사람 ( 나의 팔로워 ) 에게 알려 주고 싶은 트윗을 전할때 사용 . tweet starts off with “ RT @ASAnews .” RT stands for “retweet,” and is followed by an @mention of the ASAnews account * 모든 RT 는 모든 @reply 를 포함하지만 , 모든 @reply 가 모든 RT 를 포함하지는 않음 . @replies and@mentions 트위터에서 서로간에 나누는 대화의 방식 . 트윗의 시작을 @user`s name 하면 reply 로 인식 . 트윗 사이에 @user`s name 이 들어가면 mention 으로 인식함 . - @ebertchicago : I was just reading in John Waters' new book "Role Models“ - I was just reading in John Waters' new book "Role Models“ @ebertchicago how about it? * 모든 @replies 는 모든 @mentions, 그러나 모든 @mentions 은 모든 @replies 가 아님 . #Hashtag 한 가지 주제로 이야기할 때 검색하기 쉽게 해주는 트위터 고유의 태그 . 사람들의 공통의 관심사를 표현한다 . #robotpickuplines “If I could rearrange the qwerty keyboard, I'd put u and i .. oh, wait, nevermind”
6.
7.
8.
9.
10. “ Search Keyword” 따옴표 안의 내용이 포함된 트윗만을 수집한다 . ‘ Follows relationship’ 만 체크할 경우 , 검색 키워드를 언급한 사용자들간의 follow 관계만을 수집한다 . 즉 , 검색 키워드가 포함된 reply, mention 트윗 사용자들간의 관계는 제외시키므로 모두 체크하는 것이 좋다 . 그러나 , 세 박스를 모두 체크했음에도 , follow 관계만 수집되는 경우가 존재한다 . 즉 , 각각의 사용자들간의 reply, menton 관계가 없는 경우이다 . *Twitter _search network
11. 한명의 트윗 유저의 데이터를 수집하는데 대략 10-30 초가 소요되므로 , 검색 키워드가 포함된 트윗 양에 따라 몇시간에서 하루이상의 시간이 소요될 수 있다 . 그러므로 , ‘Limit to’ 를 체크해 샘플수를 줄이기를 권하지만 , 이 경우 적은 데이터를 수집하는 한계점을 지닌다 . “ Search Keyword” 따옴표 안의 내용이 포함된 트윗만을 수집한다 . *Twitter _search network
12. Twitter 계정이 있을 경우 인증을 받고 , 계정이 없어도 사용이 가능하다 . 하지만 , Twitter 홈페이지에서 계정 인증을 받으면 더 많은 데이터를 수집할 수 있다 . *Twitter _search network
13. 소수의 그룹과 수많은 고립된 노드들이 나타남 . *Twitter _search network The raw output from the search
14.
15. *Twitter _search network ‘ star’ 형을 가지는 세 개의 중심적인 노드가 나타남 . @snsd_news, @tangpa and @dc_taeyeon
16. Relationship 에서 관계들 , 즉 Follower, Following, Mention, Reply 을 각각 분류해서 확인 할 수 있다 . @tanga 의 follower 만 분류함 . *Twitter _search network
17.
18. *Twitter _search network @tangpa, @snsd_news, dc_taeyeon, @lylinot 은 ‘소녀시대’ 네트워크의 “ seed” 로 나타남 .
19.
20.
21.
22. 한명의 트윗 유저의 데이터를 수집하는데 대략 10-30 초가 소요되므로 , 검색 키워드가 포함된 트윗 양에 따라 몇시간에서 하루이상의 시간이 소요될 수 있다 . 그러므로 , ‘Limit to’ 를 체크해 샘플수를 줄이기를 권하지만 , 이 경우 적은 데이터를 수집하는 한계점을 지닌다 . Ego network 를 찾고자 하는 사용자 아이디와 , 관계를 체크한다 . Following, Follower 관계중 하나만 선택하거나 둘 다 선택할 수 있다 . *Twitter _ego network
23. *Twitter _ego network 기본 데이터 수집시 화면 . 네트워크 형태가 드러나지 않음 . Graph Metrics > degree 값을 구함 . In-degree & out-degree 값을 구한후 , 두 값을 더해서 1 이하의 값은 가시화시키지 않음 ( 일방적인 관계를 맺고 있으므로 , egocentric network 에서 의미가 없음 )
24. *Twitter _ego network Groups > Finding clusters @heytree 의 경우 11 개의 그룹으로 egocentric network 가 나타남 . 핑크 – 진보성향의 대화를 자주 나누는 이들 노랑 , 주황 – 친구 및 지인들 그린 – 음악관련자들 파랑 – 사회 이슈를 자주 나누는 이들 !! 그룹을 찾고 난 후에는 autofill 을 통한 노드 색 변경이 되지 않으므로 , Graph Element > Group 을 비활성화 시켜준다