영남대학교 문과대학 언론정보학과
교수박한우
영남대학교 문과대학 언론정보학과
교수 박한우
13주차 : 소셜미디어 네트워크 분석의 절차와 기법
1차시: 소셜미디어 네트워크 분석(Social Media Network
Analysis)
의 절차와 기법
2차시: 마이크로블로킹
2.
1. 네트워크 연구의개요
2. 분석 문제의 제기
3. 네트워크 데이터의 조사
4. 네트워크의 생성
5. 네트워크의 시각화
6. 네트워크의 분석기법
7. NodeXL
SNA, NodeXL키워드
학습순서
학습목표
하이퍼링크 네트워크 분석(Hyperlink Network Analysis)의 유형을 살펴보고
실제 적용해볼 수 있다.
3.
1. 네트워크 연구의개요
• 일반적으로 사물이나 현상을 네트워크로 모델링하여 분석하는 네트워크 연
구는 대체적으로 다음과 같은 과정으로 진행
가. 개요
연구대상이나
현상에 대한 네
트워크 데이터
를 수집
네트워크 데이
터로 적절한 네
트워크를 표현
표현된 네트워
크의 기본적인
구조나 형태의
특징을 도출
국지적/전역적,
개별 노드와 링
크, 부분 집단,
에고와 타자들
등에 나타나는
관계성의 특성
을 파악
네트워크로 구
성되어 배태되
는 다양한 사물
이나 현상에 미
시적/거시적 특
성을 분석하여
설명.
• 네트워크 거버넌스 접근/네트워크 구조 접근
4.
1. 네트워크 연구의개요
• 네트워크 분석의 중요한 의의: 세상을 구조와 행위라는 두 가지 요인의 상호역동
성으로 설명하기 때문.
• 네트워크에서 행위자의 역할: 그들이 연결되는 관계에 배태되므로, 행위자들 간
의 연결 관계의 구조적 특성들을 파악하면 네트워크로 표현되는 세상은 분석되
고 설명됨.
나. 네트워크 분석의 목적과 유형
미시적 분석 거시적 분석
노드 간의 연결관계에 나타나는 특성
을 분석하는 것으로, 노드와 링크의
수준에서 형성되는 다양한 역할과 행
위를 분석하는 기법들이 포함.
네트워크 전체적 수준에서 네트워크
에 배태된 다양한 특성들을 분석하는
기법들을 말함.
5.
1. 네트워크 연구의개요
네트워크 분석방법론의 세가지 유형
연결의 연구방법 네트워크 안에 있는 구성원들 간의 근접성에 기초하여 네트워
크 군집들을 발견하는 것에 목적
위치 연구방법 구성원들 간의 유사성에 기초하여 네트워크의 군집들을 발견
하는 것에 목적을 두고 있음.
네트워크 구조 자체가 다양한 사회현상들에 미치는 영향을 분석
나. 네트워크 분석의 목적과 유형
6.
1. 네트워크 연구의개요
다. 네트워크 분석의 특성
• 네트워크 분석 방법을 적용할 경우 고려할 특성
첫째, 사물이나 현상을 네트워크로 표현하고 분석하는 것은 어렵지 않음.
둘째, 분석의 결과를 해석하는 것은 상당히 어려움.
셋째, 네트워크의 분석결과를 토대로 어떤 일정한 패턴을 찾아내고, 이후의 행동
을
예측하는 일은 매우 어려운 영역.
7.
1. 네트워크 연구의개요
라. 네트워크 분석의 단계
단계 내 용
분석 문제의 제기
• 분석 문제의 설정
-특정한 노드의 영향 분석
-특정한 현상의 해석
-특정한 문제의 풀이 및 예측
• 분석 대상의 설정
-노드 데이터의 설정
-관계 데이터의 설정
8.
1. 네트워크 연구의개요
라. 네트워크 분석의 단계
단계 내 용
네트워크
데이터의 조사
• 노드 데이터의 조사
-인구통계학적 방법(전체 네트워크 방법)
-눈덩이 굴리기 방법(에고중심 네트워크 방법)등
• 관계 데이터의 조사
-사회조사 방법: 설문조사, 면담조사, 관찰조사
-마이닝 조사 방법: 데이터 마이닝, 텍스트 마이닝
-실험조사 방법 등
네트워크의 생성
• 데이터 코딩
• 데이터 변환(유사성 측정 포함)
• 네트워크 시각화
9.
1. 네트워크 연구의개요
라. 네트워크 분석의 단계
단계 내 용
네트워크 분석의
실행
• 분석작업의 수행
-네트워크 수준의 분석
-노드 수준의 분석
-네트워크의 내재적 속성 분석
-집단 수준 분석
-에고 네트워크 분석
• 분석결과의 해석(영향 분석,현상 해석,문제풀이 및 예측)
10.
2. 분석 문제의제기
• 네트워크로 모델링하여 분석하고자 하는 문제는 분석의 대상 또는 현상을 네
트워크로 표현할 수 있는 것이라면 무엇이든지 가능
• 네트워크 분석을 필요로 하는 문제는 크게 영향분석, 해석, 문제풀이나 예측
을 필요로 하는 것으로 유형을 구분
가. 네트워크 분석의 단계
11.
2. 분석 문제의제기
1) 노드 데이터의 설정
분석문제에 따른 대상의 노드는 크게 일원모드와 이원모드로 구분.
나. 분석 대상의 설정
노드의 크기 관점에서 노드 데이터 규모는 크게 네가지로 구분
소규모 노드 100 노드 이내에 해당되며, 간략한 소규모 네트워크를 구
성
중규모 노드 100 노드에서 1,000노드 이내에 해당되며, 적절한 분석이
가능
대규모 노드 1,000노드에서 10,000노드 이내의 규모이며, 전체로서의
네트워크에 대한 다양한 분석보다 군집으로 나누어 분석
초대규모 노드 10,000노드 이상
12.
2. 분석 문제의제기
1) 노드 데이터의 설정
분석문제에 따른 대상의 노드는 크게 일원모드와 이원모드로 구분.
나. 분석 대상의 설정
노드의 변화 가능성에 따라
고정데이터 노드의 표본을 선정할 때, 한 학급의 학생들과 같이 고
정된 크기로 한정
가변 데이터 문헌 간의 인용, 도시 간 항공 노선등과 같이 노드가 주
기적으로 증가하는 경우.
13.
2. 분석 문제의제기
1) 관계의 유형
• 사회적 관계와 비사회적 관계로 크게 구분
다. 관계 데이터의 설정
단일형 관계 관계가 단일의 속성인 경우
(대부분 네트워크 분석에서 사용)
다중형 관계 다양한 유형의 관계를 측정하는 경우
(예: 특정 집단내 사람들 중에서 친구 관계, 동호회 소속 관
계, 친척관계 등을 구분하여 관계를 파악하는 경우)
14.
2. 분석 문제의제기
2) 관계의 강도
다. 관계 데이터의 설정
이진데이터 ‘1’과 ‘0’으로 코딩하여 나타냄
가중데이터 관계에 강도라는 가중치가 있는 경우
15.
2. 분석 문제의제기
3) 관계의 방향
다. 관계 데이터의 설정
무방향 관
계
상호 방향성이 없음
송신 관계 전달을 하는 관계- 의사의 전달, 전염병 전염, 기업간 기술이
전, 개인 간 지식이전, 국가 간 원조, 조언 등)
수신 관계 전달을 받는 관계-송신관계의 역에 해당)
양방향 관
계
상호 상호적이며 동등한 역할과 위치를 가지는 관계- 친구
관계, 연인 관계, 친족 관계, 동문 관계, 거래 관계, 유사 관계
등
16.
3. 네트워크 데이터의조사
1) 네트워크 분석 수준에 따른 네트워크 샘플링의 선정
가. 노드 데이터의 조사방법
인구통계학적
방법
• 모집단의 경계가 명확하게 정해져 있을 경우는 모집단을
인구통계학적 방법으로 결정.
• 분석의 목적이 되는 특정 지역 또는 특정 조직의 구성원들
을 인위적으로 설정하는 경우
눈덩이 굴리
기 방법
• 초기의 특정한 개체를 선택.
• 초기 개체들에 질문하여 관계가 있는 다를 개체들을 조사,
이러한 방식을 반복하여 개체들을 증가시킴
명목적 접근
법
• 분석자 자신의 분석목적에따라 노두의 크기를 결정하는
방식.
• 분석자에 의해 노드의 집단을 주관적으로 결정하기에 부
넉 결과가 현실과 반드시 일치하지 않을 수 있음.
실제적 접근
법
• 노드들의 주관적으로 인지하는 대상을 선택하는 방법.
• 즉 분석자는 분석대상의 노드들에게 질문을 통해 적합한
노드들을 추천하도록 하여 노드의 집단을 선택.
17.
3. 네트워크 데이터의조사
2) 네트워크 샘플링의 또 다른 방법
• 사회적 지위와 사회적 명성에 의한 샘플링: 특정한 사회적 지위를 가진 사람들
이나 집단 구성원들에 한정하여 네트워크의 노드로 선정하는 것.
가. 노드 데이터의 조사방법
권력 엘리트
추출 방법
• 특정 지역 내 권력 엘리트(오피니언 리더)를 선정하는
방법
공간과 시간에
따른 노드 개
체의 선정 방
법
• 공간에 따른 선정은 특정한 공간 내에서 관계 범위(회사
와 같은 조직내에서의 관계나 특정 지역 내에 존재하는
관계)에 해당하는 노드들을 선정하는 방법.
• 시간에 따른 선정은 적절한 관계 데이터의 획득을 위하
여 특정한 시간 내에 해당되는 관계범위(예:최근 6개월
내)에서 노드들을 선정하는 방법
나.관계데이터 조사 방법
• 설문지 방법, 직접 관찰 방법, 실험방법, 문헌정보 방법
18.
4. 네트워크의 생성
가.데이터 코딩
• 조사된 노드와 관계
데이터는 그래프, 인
접행렬, 노드 리스트
(인접리스트), 에지
리스트 등으로 표현
가능.
나. 데이터 변환
• 행렬로 표현된 네트워
크 데이터는 다양한 용
도에 의해 변환됨.
• 가중 행렬에서 이진 행
렬 변환, 방향 행렬에
서 무방향 행렬 변환,
이원모드 행렬에서 일
원모드 행렬변환, 행렬
분할, 행렬 전환 등
다. 유사성 측정
• 유사성: 일반적으로 어
떤 개체들을 유사한 집
단으로 분류하고자 하
는 경우, 개체들이 얼
마나 유사한지 또는 유
사하지 않은지를 측정
하는 개념.
• 상이성: 두 개체가 서
로 얼마나 다른지를 측
정하는 것으로 주로 거
리 계수로 측정.
19.
5.네트워크의 시각화
• 그래프표현의 주요 원칙은 평면상에 그래프를 그렸을 때 노드간의 링크가
교차하지 않도록 하는 평면그래프를 그려야 함.
평면그래프를
그리기 위해서는
첫째, 링크들이 연결되는 길이를 최소화.
둘째, 링크의 길이를 균등하게 함
셋째, 링크는 가능한 굴곡선이 없도록 함
20.
5.네트워크의 시각화
가) 트리표현 계층형트리와 방사형트리표현방식이 있음
나) 다차원 척도법 노드들의 거리를 토대로 유사성과 상이성을 구한 다음,
다차원 공간에 기하학적으로 표현하는 방식
다) 대규모 네트워크
의
시각화
1) 최소 신장트리:
• 신장트리는 해당 그래프의 부분 그래프이면서 모든
노드들을 연결하는 트리.
• 따라서 최소 신장트리는 최소 비용의 신장트리.(그래
프의 각 링크에 비용이 주어질 경우 신장트리들 중에
서 비용이 가장 최소인 것을 말함)
2) 패스파인더 네트워크
• 그래프를 이용하여 네트워크의 척도를 표현하는 방
법.
• 지식의 구조화를 분석하는 도구로서 유용.
• 노드는 키워드를 나타내고, 링크는 키워드 사이에 존
재하는 근접성의 패턴.
• 키워드를 나타내는 노드와 노드 사이의 유사성이 높
으면 링크가 생성.
21.
6.네트워크의 분석기법
1) 범용SNA 도구 • NetMiner:한국에서 개발된 분석 도구 및 시각화 도구
• UCINET:종합적인 네트워크 분석 도구
• ORA:동적 네트워크 분석 도구
• Pajek:다양한 분석이 가능한 분석 및 시각화 프로그램
• Sentinel Visualizer: 데이터 시각화, 분석 및 지식관리 등
이 가능한 윈도우 기반의 프로그램
• Statenet:SNA를 위한 R프로그램
• tnet: 가중 네트워크, 이원모드 네트워크 등의 SNA 패키
지
2) 시각화 도구 • NetDraw: 가장 유명하며, UCINET에서 연동하여 사용
• NodeXL: Excel 템플릿을 이용하여 네트워크의 그래프를
편리하게 그릴 수 있는 도구
• KrackPlot:SNA에 적합한 네트워크 시각화 프로그램
• Graphviz:그래프 시각화를 위한 공개 S/W
• VisuaLyzer:사회 네트워크 데이터의 입력, 시각화, 분석
이 가능한 대화형 도구
가. 분석도구
22.
6.네트워크의 분석기법
3) 대규모네트워크
분석용
• etwork Workbenck:인디애나 대학에서 개발하였으며, 다
양한 네트워크 분석 및 계량서지 분석 전용의 공개 S/W
• NetworkX:그래프 생성,처리,분석,시각화 등이 복잡계 네
트워크 분석을 위한 도구 세트
• Cytoscape:대규모 사회 네트워크뿐만 아니라 분자, 유전
자, 단백질 등과 같은생의학 분야 복잡계 네트워크 분석
과 시각화를 위한 공개 S/W
4) 동시단어
분석도구
• LEXIMAPPE: 동시단어 데이터 구조를 표현, 분석, 시각
화를 위한 프로그램
• TI.exe:학술적 목적으로 무료로 사용하는 동시단어 분석
을 위한 프로그램
가. 분석도구
23.
6.네트워크의 분석기법
5) 링크분석도
구
• LexiURL:웹사이트의 동시링크 분석을 ndl한 도구
• Visual Links:다양한 데이터 유형으로부터 패턴, 트렌드, 숨
겨진 네트워크의 특성 등을 발견하는 데 사용하는 그래프 분
석 도구
6) 네트워크
조사 도구
• Network Genie:다양한 설문을 이용한 네트워크 설계, 사회
네트워크 프로젝트 관리, 온라인에 의한 사회 네트워크 데이
터 수집, SNA 프로그램과 데이터 연동 등을 가능하게 하는
프로그램
• ONA Surveys: 조직 네트워크 분석을 위한 조사 도구
7) 기타 • EgoNet:에고 네트워크 전용 분석 도구
• AutoMap:텍스트로부터 관계 데이터를 추출하는 텍스트 마
이닝 도구
• MetaSight:이메일 분석 및 시각화 도구
• SPSS/SAS의 관련 분석도구(다차원척도법 등)
가. 분석도구
24.
7. NodeXL
가. SNA도구
•Social Network Analysis 는 Social Network 구조, Social Media와 기타
Network 구조 등에 대한 연구를 지원하는 툴
<주요 네트워크 분석 프로그램의 종류와 비교>
출처: 박한우(2010), LexiURL을 이용한 시링크분석-정치웹진,정치포럼사이트, p.1098
25.
7. NodeXL
나. 왜노드엑셀(NodeXL) 인가?
• 순환적 그래프데이터 구조를 표현할 수 있는 기존의 도구들은 각각의 한계를
지님
• 네트워크 분석은 학술, 상업과 인터넷 Social Media 등 분야에 중요한 연구영
역이고 빠른 성장을 보임
• 현재 사용하고 있던 도구는 명령을 입력 등의 방식으로 네트워크를 분석하기
때문에 도구에 대한 많은 지식이 필요
• 많은 네트워크 데이터들은 Excel파일로 저장하고 있음
26.
7. NodeXL
다. NodeXL
•NodeXL는 Microsoft Excel 2007에 네트워크 분석도구를 추가한 새로운 기능 툴.
• NodeXL는 NET Framework 3.5 소스를 통해 다른 네트워크 분석 소프트웨어를
이용한 분석결과나 기초데이터도 처리할 수 있음.
라. NodeXL의 장점
• 광범위하게 사용되고 있는 Excel에 네트워크 분석 툴을 결합하여 연구의 시
너지 효과 실현
• SNA 초보자도 쉽게 접근할 수 있음
• NodeXL은 앞서 나열된 SNA도구들의 가장 발전되고 간편한 도구중 하나라
할 수 있음
27.
7. NodeXL
마. NodeXL의사례
<코멘트 수와 비디오의 순위에 따라 개체의 색과 크기를 나타낸 YouTube의 건강보험에 관련된 비디오
네트워크>
28.
네트워크 분석의 시각화도구로 Excel 템플릿을 이용하여 네트워
크의 그래프를 편리하게 그릴 수 있는 도구는 NodeXL이다.
QUIZ
O X
29.
네트워크 분석의 절차와기법과 소셜 미디어 분석도구인 NodeXL에 대해
살펴 봄.
학습정리