Korean manual for nodexl fb, flickr, twitter, youtube, wiki

6,631 views

Published on

4 Comments
32 Likes
Statistics
Notes
No Downloads
Views
Total views
6,631
On SlideShare
0
From Embeds
0
Number of Embeds
77
Actions
Shares
0
Downloads
9
Comments
4
Likes
32
Embeds 0
No embeds

No notes for slide

Korean manual for nodexl fb, flickr, twitter, youtube, wiki

  1. 1. * This slide was made by Han Woo Park and his students to helpKorean users use the NodeXL이 슬라이드는 Marc Smith, Analyzing Social Media Networks withNodeXL의 3,4장을 기초로 한국 이용자들이 NodeXL을 쉽게 사용할수 있도록 만든 매뉴얼임. NodeXL 최근 버전을 사용했으며 사례 또한 원제와 상이함. - 작성일: 2011년 07월 28일
  2. 2. 주요 네트워크 분석 프로그램의 종류와 비교목적과 용도 프로그램 특징수집된 데이터를 이용한 네트 UciNet 가장 대중적이며 여러 통계적 분석을 제공함워크 시각화와 통계적 분석 Pajek 분석 대상이 많은 연구의 시각화에 유용함 NetMiner 한국어 지원이 뛰어나며 통합 분석이 가능함네트워크분석을 위한 웹사이 LexiURL 여러 종류의 동시링크 분석에 특화됨트 링크 데이터의 수집과parsing SocSciBot 웹사이트에 포함된 아웃링크 분석에 초점 IssueCrawler 동시아웃링크를 이용한 온라인 이슈 파악 Mozdeh 블로그 RSS 피드의 수집과 분석 출처: 박한우(2010), LexiURL을 이용한 동시링크분석-정치웹진,정치포럼사이트, p.1098
  3. 3. 순환적 그래프데이터 구조를 표현할 수 있는 기존의 도구들은 각각한계를 가졌다.네트워크 분석은 학술, 상업과 인터넷 Social Media 등 분야에중요한 연구영역이고 빠른 성장을 보이고 있다.현재 사용하고 있던 도구는 명령을 입력 등의 방식으로 네트워크를분석하기 때문에 도구에 대한 많은 지식이 필요하다.많은 네트워크 데이터들은 파일로 저장하고 있다.
  4. 4. NodeXL는 Microsoft Excel 2007에 네트워크 분석도구를 추가한 새로운 기능 툴이다. NodeXL는 NET Framework 3.5 소스를 통해 다른 네트워크분석 소프트웨어를이용한 분석결과나 기초데이터도 처리할 수 있다.
  5. 5. 광범위하게 사용되고 있는 Excel에 네트워크 분석 툴을 결합하여연구의 시너지효과를 실현SNA 초보자도 쉽게 접근할 수 있음.NodeXL은 앞서 나열된 SNA도구들의 가장 발전되고 간편한 도구중의 하나라 할 수 있음
  6. 6. 사이트 주소: http://www.codeplex.com/NodeXLNodeXL 사이트 첫 페이지 오른쪽 상단에서 아래의 왼쪽 그림과 같은 다운로드메뉴를 볼 수 있다. 초록색 다운로드 링크를 클릭하면 아래의 왼쪽 그림과 같은창이 뜨고 NodelXL 최신버전(2011.7월 기준) 압축파일을 무료로 다운받을 수있다. 또한 간단한 사용법도 배울 수 있다.
  7. 7. Data 데이터 입력(직접입력, Excel데이터 입력, 다른 도구 결과입력 등 )Graph 도표 도출(선 스타일, 도표형식)Visual Properties 도표 시각화 (Node의 색깔, 크기,투명도, 형태; 선의 굵기 등)Analysis 데이터 분석 (데이터 속성 분석, 계산 등 )Show/Hide 데이터 창구에 항목 추가Help 도움
  8. 8. NodeXL 메뉴창NodeXL 데이터 입력창 NodeXL 네트워크그래프 효과창
  9. 9. Edges 링크(연결선):links, ties & connectionsVertices 노드(개체):Nodes, entities& itemsImages 이미지Clusters 하위 그룹Cluster Vertices 하위 그룹의 노드Overall Metrics 전체 데이터 계산
  10. 10. NodeXL에서 개체(vertices)는 색, 모양, 크기, 투명도의 성질로 표현될 수 있다
  11. 11. Autofill Columns을 이용하여 연결선(Edge), 개체(vertex)의 크기와 각각의 중심도및 특정 값에 따라 표현할 수 있다.
  12. 12. Show Graph 그래프 그리기Lay Out Again 그래프를 레이아웃 유형별로 다시 꾸미기Dynamic Filters 필터(데이터 일부분 표시)Options 도표 디자인 설정Zoom 확대Scale 비율
  13. 13. ▶▶▶
  14. 14. ▶▶
  15. 15. 동영상 내용-Keyword
  16. 16. 매트릭스로 나타낸 네트워크 Edge list로 나타낸 네트워크 지영 왕정 현진 Vertex 1 Vertex 2지영 0 1 1 지영 왕정왕정 0 0 0 지영 현진현진 1 0 0 현진 지영① 위의 두 매트릭스와 Edge list는 다르게 표현된 같은 네트워 크② Edge list는 Vertex1에서 Vertex2로의 방향성을 나타냄③ 다른 속성을 첨가하지 않는다면 Vertex1에서 vertex2 로 향 하는(directed) 이진법(binary)적인 네트워크라 할 수 있음④ NodeXL은 Edge list로 네트워크로 분석함⑤ 네트워크 지표들은 이진(binary)매트릭스에 기초해 계산 되 지만, Edge weight를 넣어서 관계의 강도(valued)를 시각 적으로 표현 할 수 있음
  17. 17. 네트워크분석을 하는 Matrix 파일을 edge list로 바꾸기 2 31 노드엑셀 창에 매트릭스 시트를 함께열어둔다
  18. 18. Graph Metrics를 이용하여 각 개체들의 Degree, In-degree, Out Degree,Betweenness and Closeness centrality, Eigenvector centrality, Page Rank,Clustering Coefficient, Group Metrics 등을 구할 수 있음.
  19. 19. Degree CentralityBetweenness Centralities: Bridge Scores for Boundary SpannersCloseness Centrality: Distance Scores for Broadly Connected PeopleEigenvector Centrality : Influence Scores for Strategically ConnectedPeople
  20. 20. Category column : sex
  21. 21. 코멘트 수와 비디오의 순위에 따라 개체의 색과 크기를 나타낸YouTube의 건강보험에 관련된 비디오 네트워크
  22. 22. * This slide was made by Han Woo Park and his students to help Koreanusers use the NodeXL NodeXL Chapter 11: FaceBook 노드엑셀을 이용한 페이스북 네트워크 분석 * 이 슬라이드는 Marc Smith, Analyzing Social Media Networks with NodeXL의 11장을 기초로 한국 이용자들이 노드 엑셀을 쉽게 사용할 수 있도록 만든 매뉴얼임. 노드엑셀 최근 버전을 사용했으며 사례 또한 원 제와 상이함. •이 매뉴얼을 이용할 때에는 다음과 같이 밝혀 주기바람. 이현진, 김지영, 박한우 (2010). 노드엑셀을 이용한 페이스북 네트워크 분석. •경산: 영남대학교.
  23. 23. Facebook>> Facebook 의 역사• 하버드대 학생들 사이에서 시작• 교내 학생들끼리 관계를 넓힘• 타 대학 학생들과 연결• 그 밖에 일반인들과 연결>> Facebook 의 강점• 시작단계에서 이미 밀집도가 높은 네트워크를 가지고 있기 때문에 네트워크 효과를 볼 수 있음.• 파랑과 흰색의 조화는 정통, 정당성 을 나타내기 때문에 나이가 많거나 의심이 많은 사용자들도 좋아할 수 있는 강점
  24. 24. Facebook• 2006년에 „News feed‟ 추가  친구들의 최근 활동을 사용자의 홈페이지에 서 한꺼번에 볼 수 있게 함….New speed!
  25. 25. 왜 Facebook 네트워크 맵을 만드는가?- 누가 너와 연결되어 있는지 알 수 있고, 개인정보 설정을 미세하게 조절할 수 있다.- 더 전문적으로 „네트워킹‟을 위해 페이스북을 하는 사용이라면 몇몇 사람들은 자신들의 최근 스타일을 찾아낼 수 있다.  team players : 내 친구들 중 둘이 연결이 안돼 있다면 이들을 소개 시켜서 close to triad 하게 한다.  brokers : 내친구들 중 둘이 연결이 안돼 있으면 안된 그대로 를 유지하게 한다. 왜? 내가 중심에 있으면 내 가치가 높아지니 까 !! 이걸 brokerage라고 한다(Burt, 2006)
  26. 26. Facebook 은 어떤 종류의 Friendship network일까?• Egocentric network(자기 중심적 네트워크)a 1.0 degree network a 1.5 degree network a 2.0 degree network
  27. 27. Getting your data into NodeXL• 트위터, 프리커, 유튜브 등과 달리 노드엑셀에서 제공하는 페이스북 크롤러가 없기 때문에 Bernie Hogan이 만든 어 플리케이션을 이용.• 개인의 네트워크를 얻기 위한 것임으로 로그인이 필요함• 네트워크가 클 수록 시간이 많이 걸림. (200명/1분)• http://apps.facebook.com/namegenweb
  28. 28. Click 오른 쪽마우스 클릭 후로그인 된 본인의 페이스 북 정보가 다른 이름으로 저장GraphML 형식의 파일로 저장 됨.
  29. 29. NodeXL로 데이터 불러 오기• 노드 엑셀을 엽니다. (시작모든 프로그램  Microsoft Nodexl  Excel Template)• 왼쪽상단 Import  From GraphML file…  저장된 파일 선택• 왼쪽상단 Prepare data  Merge Duplicate Edges ; 중복항목이 있을 경우, 정리를 해 줍니다.
  30. 30. Visualizing(시각화)• 그래프에는 me(ego)가 빠짐 ->왜냐하면 이미 모든 너의 친구와 연결 되 어있는 중심(ego)를 빼면 주면 친구들의 관 계를 더 잘 나타내 주기 때문.
  31. 31. Networky Look• 목적에 맞는 레이아웃 방법 선택 - Harel-Koren Fast Multiscaling - Fruchterman-Reingold : Layout options.. 에서 아래 두가지 항목을 조절할 수 있다. * Iterations (반복) * Repulsion (노드 사이의 저항 값)• Ex) 100 Iterations and a Repulsion of 3.
  32. 32. Ordered and Nonordered Data• Ordered Data: 위계적 의미를 가지고 분류된 서열 데이터 ex) 나이, 등수• Nonordered Data: 서열 없이 분류된 데이터 ex) 종교, 성별, 좋아하는 스포츠 팀• 클러스터는 대부분 Nonordered Data.
  33. 33. Visualizing Nonordered Data : Clusters and Categories• 클러스터 찾기 Dynamic Filters -> Groups -> Find cluster
  34. 34. Visualizing Nonordered Data : Clusters and Categories
  35. 35. Visualizing Nonordered Data : Clusters and Categories• 카테고리 별로 구분하려면 „Scheme‟을 이용하세요 Category column : sex
  36. 36. Visualizing Nonordered Data : Clusters and Categories카테고리 시트 만들기 !!• 카테고리를 나눈 후, 모양이나 색깔을 설정하려면, 새로운 시트를 만들어서 그룹화 시키면 된다.• 엑셀에서 제공하는 vlookup 함수를 이용해 불러오기를 한 후, 이미지를 변형시킬 수 있다.
  37. 37. Visualizing Ordered Data• „graph metrics‟ 선택
  38. 38. Visualizing Ordered Data• Degree : ego와 alter사이의 상호 연결된 친구 수를 의미.-> JiyoungKim‟s degree는 7.김지영이 나(ego)와 연결된사람들 중 7명과연결돼 있다는 뜻!
  39. 39. Visualizing Ordered Data• Betweenness : 서로 다른 친구들을 얼마나 잘 연결하는가를 보여주는 척도
  40. 40. Visualizing Ordered Data• 종종 너무 많은 값을 가지거나 너무 적은 값 을 가진 사람들(outliers) 때문에 betweenness가 왜곡되는 경우가 있다.• 그럴 땐 , 아래와 같이 설정 - Autofill columns -> vertex size options -> at the bottom are two check boxes. Click. -> refresh graph.
  41. 41. Visualizing Ordered Data 10보다 작은 수를 쓰는 게 좋 다. 아님 vertices 의 크기가 너무 커져서 보기 싫어 !!중심값(betweenness)이왜곡되는 것을 막기 위해두 가지를 선택할 수 있다
  42. 42.  •그룹 – 색깔 • degree – 크기 • Betweenness (connector) – 크기• Eigenvector centrality – 투명도• Cluster - 색깔
  43. 43. Visualizing Ordered Data• 노드의 Betweenness 값의 차이가 클 경우에 로그 변환 (큰 값들도 표준화 하는 효과가 있음)• 그러나, 종종 Betweenness 가 0일 때가 있다. 로그 값이 0이라는 것은 0으로 나누기를 시도하는 것과 같이 정의되지 않는 것을 의미한다. 고로 포함되지 않을 것이다.• 또한 종종 outlier 들은 흥미로운 개체이기도 하기 때문에 ignore outliers box 를 체크하는 것만이 해결책은 아님
  44. 44. Friendwheel to Pinwheel : A Facebook Visualization the NodeXL way• Thomas Fletcher 가 만든 Facebook 에서 제공하는 어플리케이션 : Friend-wheel (http://apps.facebook.com/friendwheel/); 사용자의 친구들을 모아서 바퀴모양의 그룹으로 보여준다.
  45. 45. Friendwheel to Pinwheel : A Facebook Vizualization the NodeXL way• NodeXL에서 Friendwheel 만들기 1. layout 은 circle 을 선택 2. Find Cluster 버튼을 눌러 3. Refresh graphFriendwheel을 통해서로 다른 클러스터간의전반적인 연결을 알 수 있다.
  46. 46. 예시1한국어로 표시된 몇몇 이름이 나타나지 않음 .
  47. 47. 예시2색은 각각의 클러스터를 나타내고, Degree에 의한 순서로 놓여졌으며 각각의 그룹끼리의 연결 망을 볼 수 있음.
  48. 48. Friendwheel to Pinwheel : A Facebook Visualization the NodeXL way• Workbook Columns -> Layout 클릭 vertices sheet 에서 layout 이하 6개의 새 로운 열을 볼 수 있다. layout order에 들어갈 옳은 정보를 찾으려 면 „group vertices‟ sheet 를 봐야 된다.
  49. 49. Friendwheel to Pinwheel : A Facebook Visualization the NodeXL way• Friendwheel 을 fireball 로 만들어 보자!• Friendwheel 은 좋은 레이아웃이다. 예쁘고 기본적인 네트워크 구조에 관한 약간의 정 보도 얻을 수 있다. 그러나 이 레이아웃으로 할 수 있는 것은 더 많다. 물론, 목표는 제멋 대로인 차트 잡동사니 등을 그래프에 부담 하지 않고, 기본적인 구조를 눈에 띄게 해서 그래프를 더 보기 쉽게 만드는 것이다.
  50. 50. Friendwheel to Pinwheel : A Facebook Visualization the NodeXL way• 1단계 ; Reorder vertices within the clusters.• 2단계 ; convert a circle layout to a polar layout.• 3단계 ; Turn a ring into a series of flames.
  51. 51. Facebook importer download• Thats really surprising. For the social net importer, you should be able to place the two files from http://socialnetimporter.codeplex.com/ in the plug- ins directory under C:program files (x86)Social media research and then restart nodeXL. After this is done, load the nodexl template and it should automatically detect and present to you "Import from Facebook users network" under the import menu. There could be an issue with Korean characersets, but I doubt it, since they are unicode and we have unicode all sorted out. The latest version is on codeplex and is pretty stable. If you get it working, you wil be impressed by the speed and accuracy.•• As for namegenweb, that has also been tested. As long as you start from• https://apps.facebook.com/namegenweb it should work fine.•
  52. 52. Import form facebook Personal Network(v.1.2) 설치 후 확인
  53. 53. Import from Facebook Fan Page Network (v.1.2) Network ① co-commenters ② Co-likers Options ① 현재 상태 ② 담벼락 글
  54. 54. 한나라당 페이지(Smarthannara) 테스트Name/ID: Smarthannara① Co-commenters Network - 2 as Defalt② Get wall posts③ Co-likers networks④ Co-commenters network -10 as max : defalt(2)랑 차이가 없음.???
  55. 55. 위키트리 페이지(wikitree.page) 테스트
  56. 56. • Name Generation Map Test https://apps.facebook.com/namegenweb 친구 200명 데이터는 수집 성공 Q : 어떻게 저장 ??
  57. 57. Bernie Hogan‟s Name Generation Web Testhttps://apps.facebook.com/namegenweb/• ID aria@daegu.go.kr :: 에러창은 뜨지 않지만 데이터가 모아지지 않음 Q : 2000 명 친구가 넘는 ID는 다음과 같은 화면이 지속됨. 모아지지 않음?
  58. 58. Import form facebook Personal Network(v.1.2) : 개인계정 세가지 옵션 ① 네트워크에 “나” 를 포함 ② 현재상태 정보 포 함 ③ 담벼락글 포함Q : wall posts limit??
  59. 59. 3000명이 넘는 개인개정 오류 :대구시청 test • Is there anyway to get the data of account that have many friends?
  60. 60. Chapter 11Copyright © 2011, Elsevier Inc. All rights Reserved
  61. 61. This slide was made by Han Woo Park and his students to help Koreans to use the NodeXL 노드엑셀을 이용한 플리커 네트워크 분석 이 슬라이드는 Marc Smith, Analyzing Social Media Networks with NodeXL의 13장을 기초로 한국 이용자들이 노드엑셀을 쉽게 사용할 수 있도록 만든 매뉴 얼임. 노드엑셀 최근 버전을 사용했으며 사례 또한 원제와 상이함. •이 매뉴얼을 이용할 때에는 다음과 같이 밝혀 주기바람. 왕정, 박한우(2010). 노드엑셀을 이용한 플리커 네트워크 분석 •경산: 영남대학교
  62. 62. Flickr 소개:●플리커(Flickr)는 2004년 2월부터 서비스하고 있는 온라인 사진 공유 커뮤니티 사이트이다.●웹 2.0의 대표적인 프로그램 중 하나로 거론되곤 한다. 캐나다 밴쿠버의 회사인 루디코프에서 개발했다.●이 서비스는 개인 사진을 교환하는 목적 이외에도 블로그들이 사진을 올려 저장하는 용도로 쓰이기도 한다. 처음 이 서비스의 획기성은 자체 분류법적 방식을 이용하여 사진에 태그를 붙일 수 있도록 한 것에 기인한다.●현재 전세계에서 플리커를 사용한 사람은 8400만 명이 되고 4억장 넘은 사진을 소유한다(Yahoo! Quick View Metrics–2009년6월).
  63. 63. Flickr 소개: 월별 분류 카테고리 분류 플리커 추천 이미지일년 전 이날 올린 사진 세트 그룹
  64. 64. Flickr 소개: 구체적인 사진 촬영지 검색 가능 플리커에서 태그는 중요한 공유 역할을 수행한다.
  65. 65. Flickr 소개: 새로운 플레이스 사진 분류 검색 플레이스에 관련 사진들 모임
  66. 66. Flickr 소개: Flickr에서 뭐가 할 수 있을까?업로드 개인 사진 업로드 사진 및 동영상 수집(컴퓨터/메일/카메라 폰)작업 편집 Flicker 제공한 Picnik 기능을 이용해 사진을 작업 편집 가능(ex:사진 자르기, 문자 추가, 사진 효과 조정 등)조직화 사진은 업로드/수집/태그 등 통해 조직화공유 그룹 만들기, 다른 사람한테 사진 및 동영상 공유지도화 촬영지 부여해서 사진 지도화 사진을 이용해 카드나 앨범 등 제품 만들기제품 만들기 동영상-DVD만들기커뮤니케이션 친구 및 가족들의 업로드 사진을 받기
  67. 67. Flickr 소개: 검색 기능 사진/그룹/사용자 사진 구체적은 검색 분류 사용자 검색 사람->모든 Flickr 회원->검색 검색된 사용자의 사진은 항상 최근 업로드 한 사진을 먼저 보여줌
  68. 68. Flickr 소개: 그룹 보기 사진 앨범 앨범 사진 보기
  69. 69. Flickr 소개: 사용자 정보 사진 촬영지 정보즐겨찾기 추가 가능사진 공유 사진 속한 앨범 사진 속한 그룹사진 작업 사진 사진에 대한 설명 태그/태그 추가 사진에 대한 평가-댓글
  70. 70. Flickr 네트워크Flickr 사용자 간의 연결, 사진에 대한 평가, Flickr 그룹 만들기 및 그룹 활동 등 통해 사용자가 자신의 네트워크 형성할 수 있다.소설네트워크 분석을 통해 사용자가 네트워크 속에 존재하는 속성 및 그들이 이 네트워크의 변화에 대한 역할 등 알 수 있다.태그는 사진 및 앨범에 대한 설명이고 사진 보기 및 검색에 중요한 역할을 수행한다. 사회 관계 네트워크 콘텐츠 구조 네트워크
  71. 71. Flickr 네트워크
  72. 72. Flickr 네트워크●태그 네트워크사용자가 사진을 업로드 때 사진을 설명할 수 있는 태그를 부여한다. Flickr는 태그를 의해 사진을 분류한다. 한 사진에 대한 몇 개 태그 부여하는 것은 대부분이다. 이런 여러 태그가 한 사진을 묘사하는 것이 태그 간의 연관성을 형성된다.●사용자 네트워크Flickr에서 사용자가 다른 사용자와 관계를 맞길 수 있다(서로 연결된 쌍방향 관계).사용자 네트워크 분석을 통해 사용자가 사회 네트워크 안에 존재한 위치 및 사용자 연결 관계를 알아볼 수 있다.사용자가 한 사진에 대한 평가할 때 이 사진의 평가 네트워크가 형성된다.
  73. 73. Flickr 네트워크 Flickr 네트워크 답할 수 있는 문제 공유의 다양성 ● 개인 영역 친구 관계, 연결 관계의 대등성(비 대등성 ex:팬, 멀리 있는 친구, 소통 적은 사 람) 사진의 경우: 태그 및 설명 네트워크, 내용주제 군집, 콘텐츠에 대한 해석 ● 사회 영역 특정한 사용자 및 특정한 사진 태그가 친구 맺기에 대한 영향 ● 응용 영역 전자 사무, 서비스 및 기초 시설, 지리 표기 응용
  74. 74. Flickr 네트워크-데이터 불어오기 NodeXL 열기 Import 선택 ▶From Flickr Related Tags Network-태그 네트워크 ▶From Flickr User’s Network-사용자 네트워크 다음 예를 통해 NodeXL사용한 사용자 네트워크 및 동영상 네트워크 분석을 설명하도록 하겠습니다.
  75. 75. Flickr 네트워크-태그 네트워크 네트워크 수집 범위 선택 네트워크 범위=1.5 API Key 꼭 필요함 네트워크 범위=1.0 네트워크 범위=2.0 샘플 사진 수집 여부(시간 소 유) API Key 입력 예: China
  76. 76. Flickr 네트워크-태그 네트워크 수집된 데이터 파일 태그 상황 태그 연결 상황 (sheet-Vertices) (sheet-Edges)
  77. 77. Flickr 네트워크-태그 네트워크 네트워 크 가시 화▶데이터 수집 과정 중에 사용자 ID 중복한 경우가 있어서데이터의 정확성 높이 기 위해중복한 노드 삭제한 작업을 해야함▶중복한 노드 삭제한 작업 끝나면 Relationship 옆에 EdgeWeight 수치 나옴
  78. 78. Flickr 네트워크-태그 네트워크 네트워크 기본 수치 계산
  79. 79. Flickr 네트워크-태그 네트워크
  80. 80. Flickr 네트워크-태그 네트워크 sheet-Vertices에서 사용자 ID 선택한 후 에 노드 형태는 이미 지로 바꿈. 이미지= 사용자 Youtube에서 사용한 프로필 이미 지
  81. 81. Flickr 네트워크-태그 네트워크태그의 군집 분류 계산
  82. 82. Flickr 네트워크-태그 네트워크 China 태그 네트워크
  83. 83. Flickr 네트워크-태그 네트워크 China 태그 네트워크
  84. 84. Flickr 네트워크-태그 네트워크 China 태그 네트워크 필터를 통해 네트워크 가시화 Betweenness>20.000
  85. 85. Flickr 네트워크-사용자 네트워크 필요한 데이터 선택: 친구 네트워크/사진 평가 네트워크 /Both API Key 꼭 필요함 ▶사용자 정보 추가(시간이 소유) ▶데이터 수집 제한 인수-100~1000명 API Key 입력 1.0 1.5 2.0 예: Adele Claire
  86. 86. Flickr 네트워크-사용자 네트워크 수집된 데이터 파일 사용자 상황 (sheet-Vertices) 사용자 연결 상황 사용자의 이름, 사진 수 등 정보를 볼 (sheet-Edges) 수 있음 사용자 관 계
  87. 87. Flickr 네트워크-사용자 네트워크 Contact 네트워크 노드->Vertex Shape->Image
  88. 88. Flickr 네트워크-사용자 네트워크 API Key 입력 수집된 데이터 파일
  89. 89. Flickr 네트워크-사용자 네트워크Comment 네트워크 노드->Vertex Shape->Image Comment 복잡한 예시
  90. 90. Flickr 네트워크-사용자 네트워크 X,Y설정 X=Total Photos Y=PageRank Comment 복잡한 예시
  91. 91. 이 슬라이드는 Marc Smith, Analyzing Social Media Networks with NodeXL의13장을 기초로 한국 이용자들이 노드엑셀을 쉽게 사용할 수 있도록 만든 매뉴얼임. 노드엑셀 최근 버전을 사용했으며 사례 또한 원제와 상이함. tammywt6@gmail.com•이 매뉴얼을 이용할 때에는 다음과 같이 밝혀 주기바람.왕정, 박한우(2010). 노드엑셀을 이용한 플리커 네트워크 분석•경산: 영남대학교
  92. 92. * This slide was made by Han Woo Park and his students to help Koreansto use the NodeXL NodeXL Chapter 10: Twitter노드엑셀을 이용한 트위터 네트워크 분석 * 이 슬라이드는 Marc Smith, Analyzing Social Media Networks with NodeXL의 10장을 기초로 한국 이용자들이 노드 엑셀을 쉽게 사용할 수 있도록 만든 매뉴얼임. 노드엑셀 최근 버전을 사용했으 며 사례 또한 원제와 상이함.
  93. 93. *Twitter• 2006년 샌프란시스코, Odeo사의 Podcasting의 서브 프 로젝트로 시작함.• API를 공개함으로써 다양한 3rd party 서비스를 확보하 고, 이를 통해 많은 개발자들과 사용자들이 유입됨.• 트위터는 지난 몇 년 사이 가장 유명하고, 논란의 중심에 있으며, 다재다능한 소셜미디어 플랫폼중의 하나임.
  94. 94. *Twitter 2007년 3월과 2009년 4월 사이에 트 위터는 급격한 성장을 보이는데, 이는 2009년 SXSW 페스티벌 기간 중 트위터를 통해 새로운 제품정보 를 공유했기 때문이다. 또한 오프라 윈프리 및 셀러브리티들의 트위터 유입의 영향이 크다.*다양한 트위터 클라이언트
  95. 95. *Twitter• 트위터는 모바일폰에 최 적화된 형태로 디자인되 어, 140자로 글자수가 제 한된 마이크로 블로깅서 비스.블로그와의 차이점 Weblogs Twitter Subscribers Followers Subscriptions Friends = Following Posts Tweets source: http://dioceseoftrenton.typepad.com
  96. 96. *Twitter@replies and@mentions Retweet트위터에서 서로간에 나누는 대화의 다른 사람의 트윗에 동의하거나 또방식. 트윗의 시작을 @user`s name 하 다른 사람(나의 팔로워)에게 알려면 reply로 인식. 트윗 사이에 @user`s 주고 싶은 트윗을 전할때 사용.name이 들어가면 mention으로 인식함. tweet starts off with “RT @ASAnews.” RT- @ebertchicago: I was just reading in John stands for “retweet,” and is followed by anWaters new book "Role Models“ @mention of the ASAnews account- I was just reading in John Waters new book"Role Models“ @ebertchicago how about it? *모든 RT는 모든 @reply 를 포함하지만, 모 든 @reply가 모든 RT를 포함하지는 않음.*모든 @replies는 모든 @mentions, 그러나 모든 @mentions은 모든 @replies가 아님. #robotpickuplines “If I could rearrange the#Hashtag qwerty keyboard, Id put u and i ..한 가지 주제로 이야기할 때 검색하기 쉽게 해주는 oh, wait, nevermind”트위터 고유의 태그. 사람들의 공통의 관심사를표현한다.
  97. 97. *Twitter트위터의 Following, Follower 관계 분석 네트워 크의 두 종류.<Attention Network (Following)>Attention, Importance and Eigenvector Centralityattention network 는 웹과 비슷한 형태를 지닌다. 트위터에서 어떤 유저를 팔로잉하는것은 웹 페이지가 다른 페이지를 링크하는것과 비슷하다.Eigenvector Centrality는 네트워크내에서 특정 요소가 얼마나 중요한 위치를 차지하는 지 측정한다. (이는 구글의 PageRank 알고리즘에서 „중요한‟ 웹페이지를 측정하는 방 식과 같다)즉, 트위터의 경우, 어떤 ‘영향력있는’ 사용자가 다른 많은 사용자들로부터 주목받는지를 측정한다. Eigenvector Centrality는 스패머를 찾아내기에 유용하다. 스패머는 자신의 정보를 퍼트리기 위해 많은 팔로워를 확보하려고 많은 팔로잉을 한다. 스패머 의 많은 팔로잉을 보고 그가 영향력있는 유저라고 착각할 수 있다. 하지만 Eigenvector Centrality를 확인하면, 스패머를 팔로잉하는 많은 사람들이 „영향 력 없는‟ 유저이거나, 소수의 팔로워를 가진 사람들이란 사실을 확인할 수 있 다.
  98. 98. *Twitter트위터의 Following, Follower 관계 분석 네트워크의 두 종류.<Information Network (Follower)>Information, Advantage and Betweenness Centrality Information Network는 네트워크내에서 중요한 정보를 얻기에 얼마나 가까운 거리에 있는가를 측정한다. 즉, 아래 그림에서 E는 두 그룹 1(A-B-C-D) & 2(F-G-H-J)의 다리 역할을 하며, 둘 사이의 정보를 가장 빨리 얻고, E를 통해서만 두 그룹간의 정보가 전해질 수 있다. A,B,D의 경우는 정보가 자신들의 공간에서만 머무른다.반면에, Eigenvector Centrality의 경우, E는 가장 낮은 수치를 나타내며, C & G가 가장 높다. Red : eigenvector centrality Blue : betweenness centrality
  99. 99. *Twitter 네트워크 • NodeXL 에서 제공하 는 트위터 네트워크 수집 옵션은 2가지임. • - Search Network • - User`s Network
  100. 100. *Twitter _search network• Trending Topic - 트위터상에 언급되는 엄청나게 많은 메시지들중 가장 많이 언급되는 주제어들을 분류해서 제공해준다. 트위 터는 이를 검색할 수 있는 인터페이스를 제공하며 이를 trending topic이라 한다. - 우리는 “소녀시대”를 검색어로 사용하여 트위터상에 서 이루어지는 대화의 흐름을 분석하였다.
  101. 101. *Twitter _search network “Search Keyword” 따옴표 안의 내용이 포함된 트윗 만을 수집한다. „Follows relationship‟만 체크할 경 우, 검색 키워드를 언급한 사용자 들간의 follow 관계만을 수집한다. 즉, 검색 키워드가 포함된 reply, mention 트윗 사용자들간의 관계는 제외시키므로 모두 체크하 는 것이 좋다. 그러나, 세 박스를 모두 체크했음 에도, follow 관계만 수집되는 경우 가 존재한다. 즉, 각각의 사용자들 간의 reply, menton관계가 없는 경 우이다.
  102. 102. *Twitter _search network “Search Keyword” 따옴표 안의 내용이 포함된 트윗 만을 수집한다. 한명의 트윗 유저의 데이터를 수 집하는데 대략 10-30초가 소요되 므로, 검색 키워드가 포함된 트윗 양에 따라 몇시간에서 하루이상의 시간이 소요될 수 있다. 그러므로, „Limit to‟ 를 체크해 샘플 수를 줄이기를 권하지만, 이 경우 적은 데이터를 수집하는 한계점을 지닌다.
  103. 103. *Twitter _search network Twitter 계정이 있을 경우 인증을 받고, 계정이 없어도 사용이 가능 하다. 하지만, Twitter 홈페이지에서 계 정 인증을 받으면 더 많은 데이터 를 수집할 수 있다.
  104. 104. *Twitter _search network 소수의 그룹과 수많은 고립The raw output from the search 된 노드들이 나타남.
  105. 105. *Twitter _search network 31 2 1. Automate 을 이용하면, 다양한 분석을 한꺼번에 할 수 있다. 2. 자신이 원하는 스타일에 맞게 그래픽을 조정할 수 있다. 3. Autofill > Edges, Vertex들 즉, 노드와 선들을 자신이 원하는 스타일에 맞게 조정할 수 있다.
  106. 106. *Twitter _search network  „star‟형을 가지는 세 개의 중심적인 노드가 나타남. @snsd_news, @ta ngpa and @dc_taeyeon
  107. 107. *Twitter _search network  Relationship에 서 관계들, 즉 Follower, Following, Mention, Reply 을 각각 분류해 서 확인 할 수 있다. @tanga의 follower만 분류 함.
  108. 108. *Twitter _search network @tangpa의 follower 들이 Retweet한 메시 지들을 분류해서 볼 수 있다. ↓ @tangpa의 follower 관계만을 분류한 그래프Example>Becomingkim: RT RT @Tangpa: [TangPaData] [101016-7] 소녀시대 1st Asia TourInto The New World in Taiwanhttp://tangpa.com/667334 #SNSDJapan#sone_
  109. 109. *Twitter _search network@tangpa, @snsd_news, dc_taeyeon, @lylinot 은„소녀시대‟ 네트워크의“seed”로 나타남.
  110. 110. *Twitter _search network Estimate the reach • AutoFill > - 녹색일수록 많은 트윗 - 노드가 클수록 많은 팔로워를 가짐 - @tangpa는 „소녀시대‟ 트렌딩토픽에서 중심적인 위치를 차지하지 만, 그러나 트위터상에서 인기있는 유저는 아님. 즉 많은 팔로워를 가지지 않음
  111. 111. *Twitter _ego network @tangpa and @snsd_news 의 트위터 비교Captured on Nov 29th 2010
  112. 112. *Twitter _ego network• Ego Network• 트위터 사용자들은 트위터상에서 가족, 직장동료 및 지인 들과 개인적인 네트워크뿐만 아니라 전혀 모르는 사람들 과도 네트워크관계를 맺는다.• 특정 트위터 사용자의 following, follower 네트워크를 분 석을 통해 트위터상에서 실제 그를 둘러싼 네트워크환경 을 분석할 수 있다. 많은 egocentric network가 강한 연결 과 약한 연결의 중첩적인 형태를 띈다.
  113. 113. *Twitter _ego network Ego network를 찾고자 하는 사용 자 아이디와, 관계를 체크한다. Following, Follower 관계중 하나 만 선택하거나 둘 다 선택할 수 있 다. 한명의 트윗 유저의 데이터를 수 집하는데 대략 10-30초가 소요되 므로, 검색 키워드가 포함된 트윗 양에 따라 몇시간에서 하루이상의 시간이 소요될 수 있다. 그러므로, „Limit to‟ 를 체크해 샘플 수를 줄이기를 권하지만, 이 경우 적은 데이터를 수집하는 한계점을 지닌다.
  114. 114. *Twitter _ego network 기본 데이터 수집시 화면. 네트워크 형 태가 드러나지 않음.  Graph Metrics > degree 값 을 구함.  In-degree & out-degree 값 을 구한후, 두 값을 더해서 1 이하의 값은 가시화시키지 않 음 ( 일방적인 관계를 맺고 있 으므로, egocentric network에 서 의미가 없음)
  115. 115. *Twitter _ego network Groups > Finding clusters @heytree의 경우 11개의 그룹으로 egocentric network가 나타남. 핑크 – 진보성향의 대화를 자주 나누는 이들 노랑, 주황 – 친구 및 지인들 그린 – 음악관련자들 파랑 – 사회 이슈를 자주 나누는 이들 !!그룹을 찾고 난 후에는 autofill을 통한 노드 색 변경이 되지 않으므로, Graph Element > Group 을 비활성화 시 켜준다
  116. 116. *Twitter _ego network  Graph Metrics > Betweeness and closeness centralities, Eigenvector centrality 값 구함.  녹색일수록 높은 eigenvector centrality값을 가짐  노드가 클수록 높은 betweenness centrality 값을 가짐  선의 굵기는 @reply 관계를 가진 사람을 굵게 나타냄. 즉, @heytree의 ego network는 진보성향 및 사회 이슈를 자 주 나누는 사람들이 영향력을 가지는것으로 나타나지만, 실 질적으로 관계(reply)를 맺는 이는 트위터상에서 영향력있는 이들이 아님.
  117. 117. *Twitter REST API and Whitelisting an account• Representational State Transfer (REST) Application Programming Interface (API) are used by Twitter to provide data in XML or JSON to third party clients like TweetDeck, Twhirl, and also NodeXL• Regular account is limited to 150 queries per hour.• For data intensive tasks, one might need to whitelisting his/her account.
  118. 118. *Twitter Whitelisting an account• To do this visit: – http://twitter.com/help/request_whitelisting – Fill in the form and once whitelisted use the ID into NodeXL Twitter import interface.
  119. 119. This slide was made by Han Woo Park and his students to help Korean users use the NodeXL 노드엑셀을 이용한 유튜브 네트워크 분석 이 슬라이드는 Marc Smith, Analyzing Social Media Networks with NodeXL의 14장을 기초로 한국 이용자들이 노드엑셀을 쉽게 사용할 수 있도록 만든 매뉴 얼임. 노드엑셀 최근 버전을 사용했으며 사례 또한 원제와 상이함. •이 매뉴얼을 이용할 때에는 다음과 같이 밝혀 주기바람. 왕정, 박한우(2010). 노드엑셀을 이용한 유튜브 네트워크 분석 •경산: 영남대학교
  120. 120. Youtube 소개:●Youtube는 무료 동여상 공유 사이트로, 사용자가 영상클립을 업로드하거나, 보거나 공유할 수 있다. YouTube는 온라인 동영상 업계의 선두주자로서 전세계 사람들이 웹을 통해 독창적인 동영상을 감상하고 공유하려고 제일 먼저 찾는 사이트입니다.●2005년 2월에 페이팔 직원이었던 채드 헐리(Chad Meredith Hurley, 현재 유튜브CEO), 스티브 첸(Steve Shih Chen), 자웨드 카림(Jawed Karim, 퇴사)이 공동으로창립하였다. 사이트 콘텐츠의 대부분은 영화와 텔레빚전 클립, 뮤직 비디오고 아마추어들이 만든 것도 있다.●2006년 11월에 Google은 Youtube를 주식 교환을 통해 16억 5천만 달러에 인수하기로 결정하였다. Google의 YouTube 인수는 지금까지 세간의 관심을 가장 많이 받은 기업 인수라 해도 과언이 아닐 것입니다.●구글은 2007년 6월 19일 프랑스 파리에서 열린 ‘구글 프레스데이 2007’ 행사에서국가별 현지화 서비스를 시작한다고 발표하고, 먼저 네덜란드, 브라질, 프랑스, 폴란드, 아일랜드, 이탈리아, 일본, 스페인, 영국 사용자를 위한 페이지를 공개했다.●한국어 서비스는 2008년 1월 23일에 시작했다.
  121. 121. Youtube 소개: 동영상 검색 메인 화면최근 본 동영상을 기준으로 동영상을 선택함 핫이 슈동인기 동영상 카 영상테고리 분류
  122. 122. Youtube 소개: 동영상에 대 한 평가-좋음 /나쁨 동영상에 대 한 시청자의 평가 대기열-재생 리스트
  123. 123. Youtube 소개:여러 소설네트워크 사이트에 연결 시켜 편리한 동영상 공유 서비스 제공 Youtube 성공의 중요 한 원인은 쉬운 업로드 및 공유이다. 그 중에 동영상의 소스코드를 제공하여 임베드 (embed) 방식으로 공 유 가능한 것은 중요한 원인이다.
  124. 124. Youtube 소개:동영상 공유 네트워크 유형: ●동영상 콘텐츠 네트워크: 공동이익 및 공동 취미를 반응 -Youtube 정의된 분류 ex: 음악, 오락, 정치, 뉴스 등 -사용자가 Youtube 분류 밑에 정의된 세부적인 분류 ex: 오바마 지지자, 메이크업 애호가 노드=동영상 노드간의 관계=공유한 태그 등 ●사용자 커뮤니케이션 네트워크: 친구맺기 및 구독 노드=사용자 노드간의 관계=친구관계 혹은 구독관계
  125. 125. Youtube의 구조:Youtube는 동영상 콘텐츠 배포기능을 제공하는 동시에 동영상 사용자의 커뮤니케이션 관계망도 창조했다. 즉, Youtube의 구조는 동영상 콘텐츠 네트워크및 사용자 네트워크로 구성했다. 서로 밀접한 관계를 맺고 있다.하지만 네트워크 분석의 차원에서 동영상 콘텐츠 네트워크 및 사용자 네트워크 나눠서 분석하는 것은 대부분이다.주의 사항:Youtube 네트워크도 상항 변화하고 있는 네트워크이다. 특히 Youtube 제공한새로운 서비스 및 기능을 계속 나오기 때문에 연구자가 최신의 기능 변화를 파악해서 연구하는 것이 더 편하다.
  126. 126. Youtube의 구조-동영상●동영상 업로드자 정보: 현재업로드자의 아이디만 클릭하면 볼 수 있음●동영상 시청횟수●동영상 시청 통계●동영상에 대한 평가-댓글●관련 동영상 제시●동영상 태그●동영상 카테고리 분류
  127. 127. Youtube의 구조-사용자 채널●사용자 정보●구독자/친구●채널 댓글●사용자 최근 활동●사용자 구독 정보 ●Youtube 상장
  128. 128. Youtube Network-동영상 콘텐츠 네트워크Youtube 동영상 네트워크의 관계 분류 동영상동영상에 대한 평가 원본 동영상에 대한 동영상 콘텐츠에 대 관련 기타 동영상 (댓글) 반응 한 묘사/태그NodeXL 아직 “관련 기타 동영상”의 데이터 수집 및 네트워크 분석 불가
  129. 129. Youtube Network-동영상 콘텐츠 네트워크Youtube 사용자 네트워크의 관계 분류서로 허락 받고 친구 맺기Two way communication 사용자 허락 없이 구독 가능 One way communication 친구 구독 프라이버시 문제: ▶비공개 친구 관계 및 구독 관계의 경우 데이터를 수집 할 수 없는 제한이 있 음 ▶ 사용자가 비공개 설치하지 않은 경우에 사용자의 개인 정보, 민감한 정보 등 유출할 수 있게 때문에 연구자가 사용자의 프라이버시를 존중하고 책임 감 있게 조사하시기 바람
  130. 130. Youtube Network 분류 동영상 네트워크 사용자 네트워크평가 동영상 및 댓글에 대한 댓글에 대한 반응(Comments) 평가/반응친구 - 정보 공개의 경우 수집 가능(Friends)구독 - 정보 공개의 경우 수집 가능(Subscriptions)비슷한 묘사 동영상의 제목, 태그, 설 시청자 정의한 스타일 및 카테(Similar descriptors) 명, 카테고리에 바탕으 고리 네트워크 로 형성된 네트워크관련 동영상 Youtube 알고리즘 바탕, -(Related videos) NodeXL 수집 불가
  131. 131. Youtube Network-분석 가능한 문제 동영상 네트워크 사용자 네트워크중심성: ex-카테고리별 중심에 있는 동 중심성: ex-누가 사용자 네트워크의 중영상 심에 있는가?집단: ex-같은 태그로 모이는 동영상들 집단: ex-사용자가 어떻게 연결되어 새 로운 집단을 형성하는가?시간 비교: ex-시간의 추이에 따라 동 시간 비교: ex-시간의 추이에 따라 사영상 네트워크 어떻게 변화하는가? 용자 네트워크 어떻게 변화하는가? - 친구 및 구독관계 비교Youtube 네트워크 데이터의 문제점:▶NodeXL는 API를 이용해 Youtube에 있는 데이터를 불어오기 때문에 얻은 데이터가 전부 데이터의 일부이다. 이에 따라 같은 내용을 검색해도 똑 같은 데이터를 나오지 않다.▶ 사용자 비공개 설정된 내용을 수집할 수 없다.▶ 사용자가 임의대로 동영상을 삭제가능하기 때문에 수집한 데이터 중 이미 삭제되는 데이터가 포함할 수도 있다. 즉, 데이터가 Youtube의 일부분만 대표할수 있는 것이다.
  132. 132. Youtube Network-데이터 불러오기 NodeXL 열기 Import 선택 ▶From YouTube User’s Network-사용자 네트워크 ▶From YouTube Video Network-동영상 네트워크 다음 예를 통해 NodeXL사용한 사용자 네트워크 및 동영상 네트워크 분석을 설명하도록 하겠습니다.
  133. 133. Youtube Network-사용자 네트워크 분석 예: http://www.youtube.com/user/KPOPMV02 0 필요한 데이터 선택: 사용자 ID 친구 네트워크/구독 네트워크/Both ▶통계 열 및 사용자 이미지 추가(시간이 소 유) ▶데이터 수집 제한 인수-100~1000명 예시네트워크 데이터 수집 범위:1.0/1.5/2.0 1.0 1.5 2.0
  134. 134. Youtube Network-사용자 네트워크 분석 수집된 데이터 파일 사용자 연결 상황 사용자 상황 (sheet-Edges) (sheet-Vertices) 사용자의 친구 수, 구독자 수, 동영상 관 람횟수 등 정보를 볼 수 있음 사용자 관 계
  135. 135. Youtube Network-사용자 네트워크 분석네트워크 가시화 친구 네트워크 구 독 네트워크 한 개 만 표시 가능이 네트워크는 친구관계와 구독관계 모두 보여주는 네트워크이다.
  136. 136. Youtube Network-사용자 네트워크 분석▶데이터 수집 과정 중에 사용 sheet-Vertices에서 사용자 ID 선택한 후자 ID 중복한 경우가 있어서 에 노드 형태는 이미데이터의 정확성 높이 기 위해 지로 바꿈. 이미지=중복한 노드 삭제한 작업을 해 사용자 Youtube에서야함 사용한 프로필 이미 지▶중복한 노드 삭제한 작업 끝나면 Relationship 옆에 EdgeWeight 수치 나옴
  137. 137. Youtube Network-사용자 네트워크 분석 Autofill Columns->Vertex Label->Vertex 사용자 ID 라벨로 표시됨
  138. 138. Youtube Network-사용자 네트워크 분석 필터를 통해 네트워크 가시화 네트워크 기본 수치 계산
  139. 139. Youtube Network-사용자 네트워크 분석 PageRank>2.000 Eigenvector Centrality>0.003 Clustering Coefficient>0.300
  140. 140. Youtube Network-동영상 네트워크 분석 예: BEAST ▶keyword와 같은 태그 동영상 수집 동영상 내용-Keyword ▶동영상에 대한 평가 ▶원본 동영상에 대한 반응 예시동영상 데이터 수집 제한 수액 100~1000
  141. 141. Youtube Network-동영상 네트워크 분석 수집된 데이터 파일 동영상 상황 동영상 연결 상황 (sheet-Vertices) (sheet-Edges) 동영상의 제목, Rating, 동영상 관람횟수, Favorited 수, 평가 수 등 정보를 볼 수 있 음 동영상 관 계
  142. 142. Youtube Network-동영상 네트워크 분석네트워크 가시화 기타 네트워크 선 택 가능이 네트워크는 태그, 평가 및 반응 네트워크 모두 보여주는 네트워크이다.
  143. 143. Youtube Network-동영상 네트워크 분석▶데이터 수집 과정 중에 사용 sheet-Vertices에서 동영상 선택한 후에자 ID 중복한 경우가 있어서 노드 형태는 이미지데이터의 정확성 높이 기 위해 로 바꿈. 이미지중복한 노드 삭제한 작업을 해 =Youtube에서 동영야함 상의 이미지▶중복한 노드 삭제한 작업 끝나면 Relationship 옆에 EdgeWeight 수치 나옴
  144. 144. Youtube Network-동영상 네트워크 분석 Autofill Columns->Vertex Label->Vertex 사용자 ID 라벨로 표시됨
  145. 145. Youtube Network-동영상 네트워크 분석 네트워크 기본 수치 계산
  146. 146. Youtube Network-동영상 네트워크 분석 노드 크기=동영상 관람횟수 빨간색----파랑색 Favorite의 횟수
  147. 147. Youtube Network-동영상 네트워크 분석 Betweenness Centrality>35.000 Comments>35.000 PageRank>35.000
  148. 148. 이 슬라이드는 Marc Smith, Analyzing Social Media Networks with NodeXL의14장을 기초로 한국 이용자들이 노드엑셀을 쉽게 사용할 수 있도록 만든 매뉴얼임. 노드엑셀 최근 버전을 사용했으며 사례 또한 원제와 상이함. tammywt6@gmail.com•이 매뉴얼을 이용할 때에는 다음과 같이 밝혀 주기바람.왕정, 박한우(2010). 노드엑셀을 이용한 유튜브 네트워크 분석•경산: 영남대학교
  149. 149. Wiki NetworksConnections of Creativity and Collaboration Presented by Jiyoung Kim Nov.1.2010
  150. 150. Contents1.Key Features of Wiki Systems2.Wiki Networks from Edit Activity3.Identifying Different Types of Editors within a Wiki Project4.NodeXL Visualization Strategies for Revealing Distinct User Types5.Identifying High-Quality Contributors in Article Talk Pages6.Navigating Lostpedia: Using NodeXL to Reveal the Large-Scale Collaborative Structure of Wiki systems
  151. 151. “wiki” means “Quick” in HawaiianWard Cunningham invented WikiWikiWeb 1995 to allow a group to easily and quickly edit a set of web pages without having to know HTML or deal with moving files back and forth to a web server.--knowledge repositories
  152. 152. Tree different types of questions from NodeXL1.Study a set of wiki pages at the Empire Wiki that are related by the Castle Project, and it seeks to identify different types of contributors to that project based on both their network attributes and key variables related to the types of pages they do, and do not, edit. ?2.The quality of online discussion on the “talk”3. Revealing Large-scale structure of editing patterns in wikis, drawing on data from Lostpedia(http://en. wikipedia.org/wiki/Lostpedia).Lostpedia
  153. 153. KEY FEATURES OF WIKI Chapter 15 SYSTEMSThis article page from the English-language Wikipedia displays contentand illustrates discussion, edit, and history tabs. These tabs are standardto most wiki systems and they provide access to edit records from whichedge relationships and attributes can be measured. Copyright © 2011, Elsevier Inc. All rights Reserved
  154. 154. Chapter 15Wiki pages have a related history page that depicts the timing of everyedit, indicates the editor or IP address responsible for the edit, providesspace for a brief description of the edit, and displays links to the state ofthe page before and after the edit. History pages are important sources ofnetwork and attribute data in wiki systems. Copyright © 2011, Elsevier Inc. All rights Reserved
  155. 155. KEY FEATURES OF WIKI Chapter 15 SYSTEMSThis article talk page is used to coordinate decisions about the bestcontents for the article page. The edits to this page are made by peoplewho have an interest in the content page and are often made by peoplewho actively edit the article page. This page shows evidence both ofcontent-based discussion and the implementation of templates toencourage compliance with community editing norms. Copyright © 2011, Elsevier Inc. All rights Reserved
  156. 156. KEY FEATURES OF WIKI Chapter 15 SYSTEMSThis page reports a partial history of edits made by a wiki user. Thesecontribution pages are an important source of information about editors.This image also shows a drop-down menu with a range of page types or“namespaces” in Wikipedia and typical to many wikis. The tendency ofeditors to edit pages in certain namespaces and not others providesimportant clues about the roles they play in the wiki community. Copyright © 2011, Elsevier Inc. All rights Reserved
  157. 157. http://en.wikipedia.org/wiki/Beer_in_Korea
  158. 158. Chapter 15History of the Project Castle pageThis study of wiki social networks used the full revision history of theProject Castle page in the Empire Wiki as both a definition of thecommunity of interest and as a source of user IDs. We were interested inthe roles played within the community of contributors to these pages.Therefore, when we scraped all of these history pages, we were sure toget all active contributors to this project. Starting from a list of URLs forProject history pages, the web scraping software returns an Excel sheetpopulated with all text that occurs after the edit date and prior to the (talk &Contribs) link. Copyright © 2011, Elsevier Inc. All rights Reserved
  159. 159. WIKI NETWORKS FROM EDIT ACTIVITY• Many interesting ways to analyze Wikipedia based on the history of activity and interaction of its users• Carter Butts raised several foundational issues related to the challenge of interpreting activity data into a network representation Networks are composed of vertices or entities that are connected through edges that represent the relationships between them. Both vertices and relationships can have attributes, such as the strength of a tie between vertices or the length of time a vertex has been part of the network.
  160. 160. WIKI NETWORKS FROM EDIT ACTIVITY• vertex =Each distinct user account• An edge= one of many activities that display some type of interaction between two users
  161. 161. Identifying different types of editors within a wiki project Network Vertices Edges Weighted Directed Page Link Network Pages Hyperlinks Yes or No Yes User Talk Page(ig, Users Comments on another user‟s Yes Yes profile)Network profile page(eg,user talk page) User Discussion Users Comments posted in reply to Yes Yes Network each other on an Article Discussion page User to Page Pages and User edits per page Yes No Affiliation Network users Page Co-editor Pages Co-editors Yes No Network User Co-edit Users Co-edited pages Yes No Network Category network Categories Shared pages Yes No Project Network Projects Shared pages or shared Yes No membersSeveral Primary Types of Wiki Networks That Can be Derived from Edit Records
  162. 162. Wiki Social Network Sampling Frame and Data Collection1. Constructed a list of URLs of history pages for every article related to “project Castel,” as tagged by users.2. A commercial web scraping program was used to generate an Excel spreadsheet containing a list of each user making an edit to each respective article during the sample period(about 7months)
  163. 163. Defining Edges and Attributes in Wiki Social networks• One editor wanted to contact another editor outside the context of the specific project pagesex)a directed edge form vertex A to vertex B represents user A making an edit on the talk page of user BTwo types of vertex attributes1) A set of attributes describing the structural position of each vertex2) A set of attributes generated from measures of participation in the Empire Wiki community and participation in Wiki Network Data Collection
  164. 164. Wiki Network Data Collection• To obtain these data, we started with the list of sampled users in Excel.We then used the Web scraper to go through the history page of each sampled user and build an Excel spreadsheet with the name of the user whose page was being scraped. The name of each user making an edit and the time stamp for each edit.
  165. 165. NODEXL VISUALIZTION STRATEGIESFOR REVEALING DISTINCT USER TYPESillustrate how NodeXL can be used to analyze larger chunks of network data from wiki sites1) Construct a graph of the overall network2) Visually represent different vertex attributes3) Search for structural similarities among individuals exhibiting similar behaviors or occupying similar roles.
  166. 166. Chapter 15NodeXL uses spreadsheet columns to store attributes of each vertex andcan be transformed using standard Excel formulas. In this case, we see asample of some Empire Wiki editors‟ overall activity and the proportion ofpages that they edited that were related to Project Castle. Copyright © 2011, Elsevier Inc. All rights Reserved
  167. 167. Chapter 15NodeXL allows you to assign gradients of vertex colors that correspondwith data attributes in the spreadsheet. This helps make the resultinggraph easier to read and analyze and highlights key features of interest. Copyright © 2011, Elsevier Inc. All rights Reserved
  168. 168. Chapter 15This NodeXL wiki network graph shows a well defined outer ring of usersand a strong inner core. Only a handful of vertices connect the outer ringto the inner core. Without these nodes, the population would be highlyfragmented. Copyright © 2011, Elsevier Inc. All rights Reserved
  169. 169. Chapter 15The NodeXL wiki network on the left displays the relative proportions of Project Castleedits among users sampled. Dark green indicates the lowest proportion of edits, and lightgreen is the highest. The figure on the right displays the volume of edits to the users‟respective user pages. Dark blue indicates the lowest edit volume, and light bluerepresents the highest edit volume. Users who connect the outer ring to the inner core inthe previous visualization have few Project Castle edits, and those users who display ahigh volume of edits are relatively isolated in the previous visualization. This indicates thatProject Castle is not strongly connected to the larger Empire Wiki community. Copyright © 2011, Elsevier Inc. All rights Reserved
  170. 170. Chapter 15This figure compares the degree 1.5 ego network graphs of four different exemplarytypes of Project Castle contributors. Ego network graphs with automated layouts aregood ways to identify potential structural signatures of online roles. In this instance, wesee evidence that system administrators tend to have more connection to othersinvolved in the project than do the actual substantive experts. Interestingly, for bothsysops and substantive contributors, the higher-level contributors tend to have fewerconnections. Copyright © 2011, Elsevier Inc. All rights Reserved
  171. 171. 1)Making Top Wiki editors Stand Out by Visually Formatting the Network Graph2)Interpreting Wiki Network Graphs for Evidence of Distinctive Social Roles3) Using Subgraph Images to Distinguish between User types4) Seeing the trees and Forest with Wiki Network Analysis
  172. 172. IDENTIFYING High-quality contributors in article talk pages1) Tasks and Strategies for Identifying Types of Contributors by Visualizing Article Discussion Page Networks2) Searching for Structural Signatures of Confrontation and Deliberation in Wiki Article Talk Page Networks
  173. 173. Chapter 15NodeXL can make use of the full range of Excel 2007 features, forexample, using an “if-statement” to assign vertex color according to acategorical defi nition of low, medium, and high. A categorical assignmentlike this one is used to highlight large differences in the measuredattribute. In this case, we can concentrate on the difference betweencontributors who are actively improving the quality of the discussion(green) from those who are actively undermining it (red). Copyright © 2011, Elsevier Inc. All rights Reserved
  174. 174. Chapter 15This NodeXL network graph depicts user-to-user talk page connections from aWikipedia policy article. The graph illustrates one way that styles of contribution aretied to structural attributes. Note that the red nodes (most confrontational) areinvolved in the strongest dyadic ties, and they tend to have the highest outdegree. Incontrast, the most deliberative contributors tend to have fewer partners and do notnecessarily involve themselves in intense dyadic interactions. Observations likethese can provide direction for further research that statistically tests the strength ofthese observer relations. Ultimately, if those measures are robust predictors, theycould be used in automated systems for identifying more or less collaborativecontributors, assessing community health, and deciding where interventions orsupport might be most helpful. Copyright © 2011, Elsevier Inc. All rights Reserved
  175. 175. NAVIGATING LOSTPEDIA: USING NODEXL TOREVEAL THE LARGE-SCALE COLLABORATIVE STRUCTURE OF WIKI SYSTEMS1)Creating an Overview Network Map of Lostpedia Content in Node XL2)Creating an Overview Map of Lostpedia Users3)Moralizing Data to Infer Stronger Connections
  176. 176. Chapter 15Lostpedia‟s article about the Statue of Taweret with links to its associatedDiscussion and Theory pages. Similar to other wiki systems, Lostpedia includelinks to History pages and an Edit page. The Theory page is an additional typeof page for contributor interpretations of what is happening and why, whereasthe articles are more descriptive of what occurred in the show. Copyright © 2011, Elsevier Inc. All rights Reserved
  177. 177. Chapter 15NodeXL Lostpedia wiki page-to-page co-edit network visualization andVertex worksheet showing only those pages with more than 50 co-editors.All types of pages were considered, but only Article pages(maroon), Discussion pages (orange), Theory pages (green), and UserTalk pages (deep pink) were co-edited enough to show up. The Harel-Koren Fast Multiscale Layout identifies natural groupings such as the maincluster of articles and the cluster of interrelated Theory pages. Size isbased on total user edits of a page, and opacity is based on degree.Subgraph images show small dense clusters for the displayed vertices. Copyright © 2011, Elsevier Inc. All rights Reserved
  178. 178. Chapter 15NodeXL visualization of Lostpedia wiki user-to-user affiliation networkconnecting users (vertices) based on the number of unique pages theyhave both edited (weighted edges). Two types of edges are included:those connecting users based on co-edits of 20 or more Theory pages(green) and those connecting users based on co-edits of 150 or morearticles (maroon). Vertex size is based on total wiki edits, and color isbased on the percentage of pages that are Theory pages (green verticesedit mostly Theory pages and maroon vertices edit mostly Article pages).Boundary spanners and important individuals are easily identified. Copyright © 2011, Elsevier Inc. All rights Reserved
  179. 179. Chapter 15NodeXL Edges worksheet and visualization of a Lostpedia wiki user-to-user affiliation network graph with edges filtered based on the number ofpages that users share as a percentage of the total number of editedpages. The number of edges for frequent editors like Santa (highlighted inred) are significantly reduced in the graph, but size indicates that they existwith those filtered out of the graph. Copyright © 2011, Elsevier Inc. All rights Reserved
  180. 180. DATA COLLECTION FROM WIKI SYSTEMS• Data collection from wikis is not automatic.• Data collection from wikis requires a combination of technical skill and effort from the Empire wiki• Second example extracted data directly from Wikipedia and required no special tools
  181. 181. PRACTITIONER‟S SUMMARY• Wikis are complex social media systems that give rise to many types of relationships• The complexity inherent in wiki systems is the source of both challenge and opportunity for practitioners.• Wikis can provide valuable insights because they are places where collaboration happens and value is created through informal organization
  182. 182. RESEARCHER‟S AGENDA• Node XL as well as browser-based network visualization tools like Touch Graph are helping expand participation in social network analysis .• Wikis are rich settings in which to study the dynamics of diffusion
  183. 183. Analyzing Social Media Networks with NodeXL Insights from a Connected World Chapter 15 Wiki Networks Connections of Creativity and Colla boration Thank you Copyright © 2011, Elsevier Inc. All rights Reserved 192

×