이 슬라이드는
박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색
프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가
시성 분석과 신종플루 관련단어의 연관성 분석. J...
1. Webonaver
WeboNaver 프로그램 다운
[Hanpark.net] 접속 – 카테고리 중 [Software] 클릭
- [naver]로 글 검색 후, Webonaver OpenAPI 글에 있는
첨부파일 다운로...
웹보네이버 활용동의서
• 안녕하세요.
• Hanpark.net 의 Software 코너에 소개된 웹보메트릭스 툴들에 대해서 많은 관심을 보여주셔서
감사합니다. 저희 쪽에서 개발된 툴의 사용을 위해서 Authenticat...
1. Webonaver
WeboNaver 동의서 작성
URL :
https://docs.google.com/forms/d/
1NyLAnXg3mFbFQPSQNLkTtF_5Iir
BGqTsdPzyEkUiEu0/viewfor...
WeboNaver 관련 논문
• WeboNaver을 이용할 때에는 아래 참고문
헌을 반드시 적기 바랍니다. 저도 모르는
사이에 상업적 이용으로 보이는 분석사례
가 많아지고 있습니다.
• 사이버감성연구소는 지식의 사회적 ...
WeboNaver 관련 논문
• 박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색 프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가시성 분석
과 신종플루 관련단어의...
WeboNaver 관련 발표
* 박한우 (2014.4.10.). 사이버 소셜여론 조사도구로서의 네이버-웹보메
트릭스와 빅데이터 분석. 한국사이버커뮤니케이션 ‘네이버와 포털’ 특
별세미나. http://www.slides...
1. Webonaver
WeboNaver 프로그램 소개 (ver.2014.05.07)
Save Data Type
-> 기록 방식을 선택
Data Sources
-> 검색이 되는 카테고리를 선택
OutPut Format
...
1. Webonaver
WeboNaver 프로그램 소개 (ver.2014.05.07)
NaverSearch의 limit 버전 특징
: 총 사용횟수를 20회로 제한
1. Webonaver
API key 얻기
URL : http://dev.naver.com/openapi/register
웹보네이버 프로그램 사용을 위해서는
위의 주소로 들어가 개인 API 키를 발급 받아
야 함
1. Webonaver
API Key
하루에 검색 가능 쿼리: 25,000건
API key 얻기
1. Webonaver
Query File 만들기
메모장에 쿼리를 입력한 후
[다른 이름으로 저장]한다.
만약, 띄어쓰기가 포함된 쿼리를
입력할 경우, 큰따옴표(“,”)를
사용하여 단어를 한정해준다.
• 저장 시
‘인코...
1. Webonaver
Query File 만들기
1. [Query File]에 ‘text’ 파일을 불
러옴
2. [Naver API Key]와
[Authorification Key]를 입력함
3. 원하는 [Data S...
1. Webonaver
Output
1. ‘Done’ 이라는 창이 뜨면 실행 완료된 것
2. ‘Text’를 저장한 폴더에 들어가 보면
체크했던 Data Sources에 따라
많은 Output 파일 생성된 것을 볼 수 있음
1. Webonaver
Output - Count
각각의 count 파일
: 각각 쿼리가 가지고 있는 검색량(게시글) 수
: 가장 끝에 있는 값이 실제 네이버에서 검색결과를 갖고 있는 값
: 쿼리 뒤에 나열된 숫자들이 ...
1. Webonaver
Output - Records
각각의 Records 파일
: 실제 검색된 글과 URL 주소 확인 가능
: URL 주소는 ‘www~’형식이 아닌 ‘OpenAPI’ 형식으로 나옴.
 Webonave...
1. Webonaver
Manipulate
원래 URL 얻기
1. Records 파일을 엑셀로 연다
2. OpenAPI 형식으로 된 주소
(C열)을 복사하여 메모장에
복사
3. 메모장을 [다른 이름으로 저장]
* 저장할...
1. Webonaver
Manipulate
WeboNaver API
1. [Parsed Records]
 OpenAPI만 따로 저장한 파일을 불러옴
2. [Run] 눌러서 프로그램 실행
KrKwic 연결하기
3. KrKwic
KrKwic이란?
1. Korean Key Words In Context
2. 커뮤니케이션 메시지의 의미가 ‘자주 사용되는 단어’
에 있다고 판단하여, 특정 텍스트에서 자주 사용되
는 단어를 찾기 위해...
3. KrKwic
KrKwic 구성
1. KrKwic/KrWords: 단어 빈도 분석을 통해 내용의 핵
심어, 주요 이미지, 중요 이슈를 파악함
2. KrTitle: 논문, 웹사이트, 기사, 특허, 법조문 등의
제목과 ...
3. KrKwic
KrKwic 다운받기
3. KrKwic
KrKwic 주의
1. KrKwic 프로그램 설치 시, 오류 최소화를 위해
C드라이브에 바로 설치
- 혹은 ‘dev’라는 폴더를 새로 생성하여
‘dev’ 폴더 안에서 작업을 하는 것이 좋음
2. KrK...
3. KrKwic
KrKwic 사용 전 동의서 작성
URL:
https://docs.google.com/forms/d/1zJ
cFVQEF0JZML0bq-
gnQNNyzc1LfD_rzbzE2nEjCh_Y/viewf
orm...
3. KrKwic
KrKwic
1. ‘Webonaver’를 통해 Records 중, 단어 빈도를 알고자 하는 파일을
엑셀 프로그램으로 연다
2. D열(내용)부분을 복사한 후, 메모장에 붙여넣기
3. KrKwic
KrKwic
1. 연구자가 판단하여 타당성과 신뢰성
이 문제되는 단어 없애는 정제 과정
을 거친 후
2. [다른 이름으로 저장]
3. 저장 시!
: 파일 이름은 반드시 ‘text’로
: 인코딩은 반드시...
3. KrKwic
KrWords
‘KrWords’ 프로그램을 열어,
‘Enter’ 두 번 치면 아래와 같
이 자동으로 실행 됨
3. KrKwic
KrWords
폴더로 돌아가면
프로그램 실행 후 얻어진
파일들을 확인할 수 있다
3. KrKwic
KrWords
엑셀을 이용해 ‘wrdfrq.dbf’ 파일을 열면
각각 단어의 빈도수를 알 수 있음
단어 빈도 목록을 이용하여 메시지의
핵심어를 파악할 수 있음
실제 조사에서는 정제 과정을 거쳐
무의미한...
3. KrKwic
KrTitle
각 단어들 사이의 관계를 분석
하고 의미망을 작성하기 위해
필요한 단어(유의미하다고 판단
되는 단어)를 선정
3. KrKwic
KrTitle
선정한 단어를 메모장에 붙여 넣고 [다른 이름으로 저장]
저장 시, 파일 이름은 반드시 ‘words’로, 인코딩은 반드시 ‘ANSI’로!
3. KrKwic
KrTitle
‘KrTitle’ 프로그램을 열어,
‘Enter’ 두 번 치면 아래와 같
이 자동으로 실행 됨
3. KrKwic
KrTitle
폴더로 돌아가면 프로그램 실행 후 얻어
진 파일들을 확인할 수 있다
matrix.dbf
: 메시지(사례) X 단어(변인) 행렬로,
각 칸의 값은 단어가 메시지에서
출현한 빈도 나타냄
co...
네트워크 그리기
1. UCINET 6 (Net Draw)
2. Pajek
4-1. 네트워크
그리기
네트워크 그리기 – UCINET 6
1. [Data] – [Import text file] – [DL…]로 들어간다
저장된 자료를 UCINet6에서
자료를 불러와서 UCINet6에
사용되는 포맷...
4-1. 네트워크
그리기
네트워크 그리기 – UCINET 6
2. ‘Import DL text file’ 창이 열리면
‘coocc.dat’ 파일을 불러온다
4-1. 네트워크
그리기
네트워크 그리기 – UCINET 6
3. 이런 창이 뜨면 닫아준다.
4. 폴더로 돌아가면 아래와 같이 UCINET system file 이라는
유형으로 Coocc파일이 만들어진 것을 확인할 수 ...
4-1. 네트워크
그리기
네트워크 그리기 – UCINET 6
5. [File] – [Open] – [Ucinet DL text file]
– [Network(1-mode)] 클릭
4-1. 네트워크
그리기
네트워크 그리기 – UCINET 6
6. [Name of file to open]에
‘coocc’(UCINET 유형으로 된 것)파일 불러옴
4-1. 네트워크
그리기
네트워크 그리기 – UCINET 6
유의미하다고 선정했던 단어들의 네트워크 완성
각종 옵션을 사용해 라인 굵기 등 설정 가능
4-1. 네트워크
그리기
네트워크 그리기 – Pajek
1. [Networks] 부분에서 파일 열기 아이콘 클릭
2. Coocc.dat 파일 열기
4-1. 네트워크
그리기
네트워크 그리기 – Pajek
2. [Report] 창이 뜨면 완성된 것.
3. [Report] 창을 끈 후 ‘Draw Network’ 아이콘 클릭
4-1. 네트워크
그리기
네트워크 그리기 – Pajek
4. 네트워크 완성
5. 각종 옵션으로 선 굵기 등 네트워크 설정 가능
두 검색어의 관계
두 가지 단어를 동시에 검색하여 두 단어간의 관계 알 수 있음
Webonaver로 쿼리 검색 후 바로 네트워크 그릴 수 있음
두 검색어의 관계
1. 두 가지 검색어를 함께
Webonaver(최신ver)로
분석해 각종 records와
count 파일을 얻어냄
- 이는 두 브랜드의 연관관계를
알기 위함이며
- 검색어 간의 그루핑(Grouping)...
2. 추출한 Count 파일을
엑셀로 연다
1) 카운트 된 숫자들 중
첫 번째 숫자들만 놔두고 지움
2) 그리고 다시 저장
(저장할 때 형식은 ‘Excel통합문서’로!!!,
이름은 상관없음)
4-2. 두 검색어의
관계
...
3. 저장된 자료를 UCINET6에서 불러옴
- [Data] – [Import Excel] – [DL Type Format] 클릭 후
‘DL Editor’ 창이 뜨면 [File] – [Open Excel File] 클릭...
4. 열린 창의 우측에 있는
‘Data format’을
‘Edgelist1’로 설정
1) 또, ‘Output Options’에서
‘Force Symmetry’를 체크해줌
(방향성이 없는 경우에만 해당함)
5. 설정을 마...
6. Visual Network Map을 그리기 위해
UCINET6에 있는 [Netdraw]를 열어줌
4-2. 두 검색어의
관계
두 검색어의 관계
7. 위의 단축 아이콘을 차례로 눌러,
금방 저장했던 UCINET 포맷의 파일을
열어줌
4-2. 두 검색어의
관계
두 검색어의 관계
각 검색어 간의 네트워크를 나타낸 Map 확인할 수 있음
* 여러 옵션을 통해 네트워크 선의 굵기 등 설정 가능
4-2. 두 검색어의
관계
두 검색어의 관계
단어구름
1. 연합뉴스 사이트
2. Tagxedo
연합뉴스 데이터 사이트
http://data.yonhapnews.co.kr/graph/proc/gr_graph_home.aspx
단어구름 - 연합뉴스
1. 위의 사이트에 회원가입
2. 로그인 후
[데이터 올리기] 클릭
...
단어구름 - 연합뉴스
5. 네트워크
그리기
KrKwic 프로그램으로 얻은
‘wrdfrq.dbf’ 파일을 열어
자료 복사
단어구름 - 연합뉴스
5. 네트워크
그리기
연합뉴스 사이트의
‘02 자료 붙이기’에
붙여넣기
단어구름 - 연합뉴스
5. 네트워크
그리기
‘03 자료확인’을 보면
붙여 넣은 자료가
자동적으로 표로 만들어짐
단어구름 - 연합뉴스
5. 네트워크
그리기
‘04 자료정보보기’ 칸을
모두 채워 넣은 후 [등록] 클릭
단어구름 - 연합뉴스
5. 네트워크
그리기
본인이 등록한 데이터를 찾아 우측에 [작성하기] 클릭
단어구름 - 연합뉴스
5. 네트워크
그리기
활성화된 그래프 클릭
단어구름 - 연합뉴스
5. 네트워크
그리기
[그래프 그리기] 클릭하면
그래프 완성
단어구름 - Tagxedo
5. 네트워크
그리기
KrKwic 프로그램으로 얻은
‘wrdfrq.dbf’ 파일을 열어
자료 복사
단어구름 - Tagxedo
5. 네트워크
그리기
Tagxedo – Creator
http://www.tagxedo.com/app.html
‘Load’를 클릭하여
‘Enter Text’에 자료 붙여 넣은 후
‘Submit...
단어구름 - Tagxedo
5. 네트워크
그리기
단어구름 완성!
좌측에 있는
Respins와 Options를
이용해 단어 구름의
모양, 색깔 설정 가능
이 슬라이드는 Thelwall, Webometric Analyst Manual 을 기초로
한국 이용자들이 Webometric Analyst 를 쉽게 사용할 수 있도록
만든 매뉴얼입니다. Webometric Analyst...
Manipulate
1. 맨 처음, Webonaver를 통해 수집한
records 자료를 엑셀로 불러온다.
6-1. Manipulate
6-1. Manipulate
복사한 OpenAPI 주소를
메모장에 붙여넣기 후
[다른 이름으로 저장]함
* 저장 시,
파일명은 상관없으나
인코딩은 반드시 ANSI
Manipulate
6-1. Manipulate
저장한 메모파일을 불러와서
[Webo Analysis Format]을 체크 후
[Run] 버튼 클릭
Manipulate
6-1. Manipulate
그림과 같이 ‘Finished adding real URLs’ 라는
창이 뜨면 컨버팅 완료!
Manipulate
6-1. Manipulate
OpenAPI 주소를 저장한 폴더로 돌아가면
‘(저장이름)_RealURL’ 이라는 파일이 생성된
것을 알 수 있음
‘(저장이름)_RealURL’ 파일을 열면
실제 URL 주소 나옴
Manip...
6-1. Manipulate
Manipulate
‘(저장이름)_RealURL’ 파일을 엑셀로 열어
오류가 난 부분은 삭제해 줌
(정제과정을 거치지 않으면 제대로 된
결과를 얻을 수 없음)
6-1. Manipulate
Manipulate
정제과정을 거친 파일을 [다른 이름으로 저장]함
* 저장 시, 파일형식은 반드시 ‘탭으로 분리’로 저장
6-1. Manipulate
Manipulate
정제하여 저장한 파일을 다시 메모장으로 열어준다.
그리고 인코딩을 ‘UTF-8’로 바꾸어 다시 저장한다.
또 다른 방법
6-2. 또다른 방법
Query를 저장한 파일을 이
용해 Data Sources를 추출
하는 과정에서부터 원래의
URL을 함께 얻을 수 있는
방식
1. 초반에 만들었던 Query 파일
(‘text’라고 저...
6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
폴더로 돌아가면 records 파일이
생성된 것을 알 수 있음
6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
Records 파일을 엑셀로 열어 오류가 난 부분은 삭제해 줌
(정제과정을 거치지 않으면 제대로 된 결과를 얻을 수 없음)
6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
정제과정을 거친 파일을 [다른 이름으로 저장]함
* 저장 시, 파일형식은 반드시 ‘탭으로 분리’로 저장
정제하여 저장한 파일을 다시 메모장으로 열어준다.
그리고 인코딩을 ‘UTF-8’로 바꾸어 다시 저장한다.
원래의 URL 얻기 / 또 다른 방법
6-2. 또다른 방법
7-1. Webometric
Analyst
Webometric Analyst
: Webomatric Analyst를 사용하면 특정 검색어가
어떤 도메인에서, 얼마나 검색되었는지 알 수 있음
1. 이와 같은 창이 나오면
...
7-1. Webometric
Analyst
Webometric Analyst
2. 프로그램 상단에 [Reports] 클릭 후,
맨 처음에 있는 [Make a set ~ splitting ma] 선택
3. UTF-8 형식...
7-1. Webometric
Analyst
Webometric Analyst
4. ‘(저장된 파일 이름)으로 새로운 폴더를 만들겠냐’는
경고 창이 뜨면 ‘예(Y)’를 누름
7-1. Webometric
Analyst
Webometric Analyst
5. 그러면, UTF-8 형식으로 저장한 파일과
같은 이름으로 폴더가 생성된 것을
확인할 수 있음
7-1. Webometric
Analyst
Webometric Analyst
6. 폴더 생성이 완료되면,
'Search Engine Results Report‘라는 창이 뜬다
->이것이 결과 보고서이며, 생성된 폴더 안...
7. 결과를 분석할 때 일반적으로 Domain(도메인)을
많이 연구하는데, Domain은 생성된 폴더 안의
‘Overview’ 파일에서 확인 가능하다.
7-2. Webometric
Analyst
Webometric An...
8. Query가 언급된
Domain이 몇 개인지,
그리고 어느 Domain이
가장 많은지 확인 가능
7-2. Webometric
Analyst
Webometric Analyst
86
웹보메트릭스, 소셜네트워크, 의미망 분석 매뉴얼
- 반드시 인용바람!!
Webometrics Analyst 매뉴얼
http://www.slideshare.net/hanpark/webomatric-analyst-08...
Prof. Han Woo PARK
CyberEmotions Research Center
Department of Media and Communincation,
YeungNam University, Korea
hanpar...
Webonaver(2012-09-02)
Upcoming SlideShare
Loading in...5
×

Webonaver(2012-09-02)

1,945

Published on

Webonaver(2012-09-02)

  1. 1. 이 슬라이드는 박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색 프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가 시성 분석과 신종플루 관련단어의 연관성 분석. Journal of the Korean Data Analysis Society. 11권 6호 (B). 3427-3440. 을 기초로 연구자들이 학술적 목적으로 Naver-API 서비스를 쉽게 사용할 수 있도록 만든 매뉴얼임. * This slide was made by Han Woo Park and his students to help researchers and students use the WeboNaver. Please cite Park’s works using the WeboNaver. •이 매뉴얼을 이용할 때에는 다음과 같이 밝혀 주기바람. 박한우 편 (2014). 웹보네이버를 이용한 웹보메트릭스 네트워크 분석. •경산: 영남대학교. http://www.slideshare.net/hanpark/webo-naver2012-0902
  2. 2. 1. Webonaver WeboNaver 프로그램 다운 [Hanpark.net] 접속 – 카테고리 중 [Software] 클릭 - [naver]로 글 검색 후, Webonaver OpenAPI 글에 있는 첨부파일 다운로드. 확장자를 exe로 변경 후 사용가능 1. 컴퓨터프로그램 개요 가. 프로그램 명칭 : 웹보네이버2.0 나. 접수번호(접수일) : 2014-011159-1 (2014.05.19) 다. 개발자 : 박한우 라. 저작자 : 영남대학교 산학협력단 마. 등록일 : 2014.05.20 바. 등록번호 : 제C-2014-011480호
  3. 3. 웹보네이버 활용동의서 • 안녕하세요. • Hanpark.net 의 Software 코너에 소개된 웹보메트릭스 툴들에 대해서 많은 관심을 보여주셔서 감사합니다. 저희 쪽에서 개발된 툴의 사용을 위해서 Authentication Key가 반드시 필요합니다. 인증키를 모두 공개하고 싶지만, 저희도 테스트를 하면서 사용중인지라 불가피하게 비공개하고 있습니다. 설상가상으로, 풀타임 프로그래머가 사직한 관계로 어려움이 많으니 양해바랍니다. • 오프라인 모임에 참석하여 인증키를 받으신 분들 가운데, 동의서를 작성하지 않은 분은 아래 링크에서 작성하여 제출해 주기 바랍니다. http://bit.ly/1i7jQAs • 인증키를 주변인에게 전달하는 행위를 금지합니다! 연구실에서는 해당 사용자와 웹보메트릭스툴에 관해서 앞으로 어떠한 협력도 하지 않을 것입니다. 신중하게 사용해 주시기 바랍니다. • 학술논문 이외의 기업 컨셜팅, 용역/계약 연구 (한국연구재단 포함) 등 상업적 분석사례가 많아지고 있습니다. 프로그래머를 고용하여 개발하기 바랍니다. 소프트웨어 산업이 죽고 있습니다 • Limit 버전은 20회 사용제한이 있습니다. Professional 버전은 구매해야 합니다. 구매를 원하시면 아래 주소로 연락바랍니다. 가격은 사용용도와 데이터 처리량에 따라 다릅니다. hanpark@ynu.ac.kr parkhanwoo@hotmail.com
  4. 4. 1. Webonaver WeboNaver 동의서 작성 URL : https://docs.google.com/forms/d/ 1NyLAnXg3mFbFQPSQNLkTtF_5Iir BGqTsdPzyEkUiEu0/viewform WeboNaver 사용 전 반드시 위의 URL에 방문하여 웹보매트릭스툴 사용동의서 작성
  5. 5. WeboNaver 관련 논문 • WeboNaver을 이용할 때에는 아래 참고문 헌을 반드시 적기 바랍니다. 저도 모르는 사이에 상업적 이용으로 보이는 분석사례 가 많아지고 있습니다. • 사이버감성연구소는 지식의 사회적 확산 을 위해서 비상업적으로 사용하는 이용자 를 위해서 배포하고 있습니다.
  6. 6. WeboNaver 관련 논문 • 박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색 프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가시성 분석 과 신종플루 관련단어의 연관성 분석. Journal of the Korean Data Analysis Society. 11권 6호 (B). 3427-3440. • 박한우 (2010년 12월). e-사이언스 시대의 인문사회학 연구하기-인터넷 연구방법을 중심으로. 사회과학연구. 30권, 2호, 195-211. • 임연수, 박한우 (2010년 2월). 10.28 재보궐 선거의 블로그 캠페인에 대한 웹계량화 분석. Journal of the Korean Data Analysis Society, 12권, 1호 (B), 539-551. • Khan, G. F., & Park, H. W. @ (2011). Measuring the Triple Helix on the Web: Longitudinal Trends in the University-Industry- Government Relationship in Korea. Journal of the American Society for Information Science and Technology*.16 (12), 2443-2455. • Khan, G.F., Cho, S.E., & Park, H. W. @ (2012). A Comparison of the Daegu and Edinburgh Musical Industries: A Triple Helix Approach. Scientometrics*. 90 (1), 85-99. • Lim, Y. S., & Park, H. W. @ (2011). How Do Congressional Members Appear on the Web?: Tracking the Web Visibility of South Korean Politicians. Government Information Quarterly*. 28 (4), 514-521. • Lim, Y. S., & Park, H. W. @ (2011). How Do Congressional Members Appear on the Web?: Tracking the Web Visibility of South Korean Politicians. Government Information Quarterly*. 28 (4), 514-521. • Lim, Y. S., & Park, H.W. @ (2013 forthcoming). The Structural Relationship between Politicians' Web Visibility and Political Finance Networks: A Case Study of South Korea's National Assembly Members. New Media & Society*. • Lim, Y. S., & Park, H.W. @ (2013). The Structural Relationship between Politicians' Web Visibility and Political Finance Networks: A Case Study of South Korea's National Assembly Members. New Media & Society*. 15(1), 93-108. • Nam, Y., Lee, Y.-O., Park, H.W. @ (2013). Can web ecology provide a clearer understanding of people’s information behavior during election campaigns?. Social Science Information*. 52(1), 91-109. • Nam, Y., Lee, Y., & Park, H.W.@ (2014 Accepted). Measuring web ecology by Facebook, Twitter, Blog and online news: 2012 general election in South Korea. Quality & Quantity*. DOI: 10.1007/s11135-014-0016-9. • Ozel, B., & Park, H. W. @ (2012). Examining Korean political figures using co-word analysis in agreement with facial expressions in posted self-images. COLLNET JOURNAL OF SCIENTOMETRICS & INFORMATION MANAGEMEN, 6 (1), 43-60. • Ozel, B., & Park, H. W. @ (2012). Online Image Content Analysis of Political Figures: An Exploratory Study, Quality & Quantity*. 46 (4), 1013–1024. DOI 10.1007/s11135-011-9445-x • Sams, S., Lim, Y. S., & Park, H. W. @ (2011). E-research applications for tracking online socio-political capital in the Asia-Pacific region. Asian Journal of Communication*. 21 (5), 450-466. • Vergeer, M., Lim, Y. S., & Park, H. W. (2011). Mediated relations: New methods to study online social capital. Asian Journal of Communication*. 21 (5), 430-449.
  7. 7. WeboNaver 관련 발표 * 박한우 (2014.4.10.). 사이버 소셜여론 조사도구로서의 네이버-웹보메 트릭스와 빅데이터 분석. 한국사이버커뮤니케이션 ‘네이버와 포털’ 특 별세미나. http://www.slideshare.net/hanpark/4march2014 * Park, H.W.(2014.4.4). The coming of shadows in big data research? Widening and narrowing scholarly divide. International Workshop on Social Media and Culture, KAIST. http://www.slideshare.net/hanpark/big-data- divided-24-march2014
  8. 8. 1. Webonaver WeboNaver 프로그램 소개 (ver.2014.05.07) Save Data Type -> 기록 방식을 선택 Data Sources -> 검색이 되는 카테고리를 선택 OutPut Format -> 자료가 저장될 때에 포맷을 선택 Query File -> 검색할 단어가 들어있는 TXT를 선택 Naver API, Authentication Key -> 가지고 있는 키를 적어 넣는다. Run Queries -> 검색을 실시
  9. 9. 1. Webonaver WeboNaver 프로그램 소개 (ver.2014.05.07) NaverSearch의 limit 버전 특징 : 총 사용횟수를 20회로 제한
  10. 10. 1. Webonaver API key 얻기 URL : http://dev.naver.com/openapi/register 웹보네이버 프로그램 사용을 위해서는 위의 주소로 들어가 개인 API 키를 발급 받아 야 함
  11. 11. 1. Webonaver API Key 하루에 검색 가능 쿼리: 25,000건 API key 얻기
  12. 12. 1. Webonaver Query File 만들기 메모장에 쿼리를 입력한 후 [다른 이름으로 저장]한다. 만약, 띄어쓰기가 포함된 쿼리를 입력할 경우, 큰따옴표(“,”)를 사용하여 단어를 한정해준다. • 저장 시 ‘인코딩’은 반드시 ‘UTF-8’ 파일 제목은 ‘text’로 저장함
  13. 13. 1. Webonaver Query File 만들기 1. [Query File]에 ‘text’ 파일을 불 러옴 2. [Naver API Key]와 [Authorification Key]를 입력함 3. 원하는 [Data Sources] 체크 4. 하단에 [Run Queries] 클릭하 여 프로그램 실행
  14. 14. 1. Webonaver Output 1. ‘Done’ 이라는 창이 뜨면 실행 완료된 것 2. ‘Text’를 저장한 폴더에 들어가 보면 체크했던 Data Sources에 따라 많은 Output 파일 생성된 것을 볼 수 있음
  15. 15. 1. Webonaver Output - Count 각각의 count 파일 : 각각 쿼리가 가지고 있는 검색량(게시글) 수 : 가장 끝에 있는 값이 실제 네이버에서 검색결과를 갖고 있는 값 : 쿼리 뒤에 나열된 숫자들이 차이가 난다면 이는 프로그램의 오류가 아니라 첫 숫자는 존재할 수 있는 검색량의 가능성이며, 점차 숫자가 줄어드는 것은 실제 네이버에 저장된 검색량의 오차를 줄여가는 과정임.
  16. 16. 1. Webonaver Output - Records 각각의 Records 파일 : 실제 검색된 글과 URL 주소 확인 가능 : URL 주소는 ‘www~’형식이 아닌 ‘OpenAPI’ 형식으로 나옴.  Webonaver 프로그램의 [Manipulate] 가능을 활용해 원래의 URL 주소(www~)를 얻을 수 있다. : 각 쿼리 당 최대 1,000개까지 저장 가능
  17. 17. 1. Webonaver Manipulate 원래 URL 얻기 1. Records 파일을 엑셀로 연다 2. OpenAPI 형식으로 된 주소 (C열)을 복사하여 메모장에 복사 3. 메모장을 [다른 이름으로 저장] * 저장할 때! : 파일명은 무엇이든 상관 없음 : 인코딩은 ‘ANSI’로
  18. 18. 1. Webonaver Manipulate WeboNaver API 1. [Parsed Records]  OpenAPI만 따로 저장한 파일을 불러옴 2. [Run] 눌러서 프로그램 실행
  19. 19. KrKwic 연결하기
  20. 20. 3. KrKwic KrKwic이란? 1. Korean Key Words In Context 2. 커뮤니케이션 메시지의 의미가 ‘자주 사용되는 단어’ 에 있다고 판단하여, 특정 텍스트에서 자주 사용되 는 단어를 찾기 위해 사용 3. 오픈 사이언스 정신에 입각한 유일한 한글 Semantic Network Analysis 4. KrKwic/KrWords, KrTitle, KrText로 나뉘어져 있음
  21. 21. 3. KrKwic KrKwic 구성 1. KrKwic/KrWords: 단어 빈도 분석을 통해 내용의 핵 심어, 주요 이미지, 중요 이슈를 파악함 2. KrTitle: 논문, 웹사이트, 기사, 특허, 법조문 등의 제목과 요약문 또는 주관식 응답, 드라마나 영화의 대사, 조직 목표, 광고 카피, 일상 대화 같이 비교적 짧은 메시지 3. KrText: KrTitle로 처리하기에 분량이 비교적 많은 메시지를 독립적인 파일로서 취급하여 분석
  22. 22. 3. KrKwic KrKwic 다운받기
  23. 23. 3. KrKwic KrKwic 주의 1. KrKwic 프로그램 설치 시, 오류 최소화를 위해 C드라이브에 바로 설치 - 혹은 ‘dev’라는 폴더를 새로 생성하여 ‘dev’ 폴더 안에서 작업을 하는 것이 좋음 2. KrKwic는 도스버전과 윈도우버전이 존재하나 비교적 안전한 도스버전 사용 권장 * 윈도우 버전은 현재 버그 수정 중이며, 소프트웨어 등 록 후에 판매함
  24. 24. 3. KrKwic KrKwic 사용 전 동의서 작성 URL: https://docs.google.com/forms/d/1zJ cFVQEF0JZML0bq- gnQNNyzc1LfD_rzbzE2nEjCh_Y/viewf orm KrKwic 프로그램 사용 전에 반드시 위의 URL에 접속하여 KrKwic 사용 동의서 작성해야 함
  25. 25. 3. KrKwic KrKwic 1. ‘Webonaver’를 통해 Records 중, 단어 빈도를 알고자 하는 파일을 엑셀 프로그램으로 연다 2. D열(내용)부분을 복사한 후, 메모장에 붙여넣기
  26. 26. 3. KrKwic KrKwic 1. 연구자가 판단하여 타당성과 신뢰성 이 문제되는 단어 없애는 정제 과정 을 거친 후 2. [다른 이름으로 저장] 3. 저장 시! : 파일 이름은 반드시 ‘text’로 : 인코딩은 반드시 ‘ANSI’로 한다
  27. 27. 3. KrKwic KrWords ‘KrWords’ 프로그램을 열어, ‘Enter’ 두 번 치면 아래와 같 이 자동으로 실행 됨
  28. 28. 3. KrKwic KrWords 폴더로 돌아가면 프로그램 실행 후 얻어진 파일들을 확인할 수 있다
  29. 29. 3. KrKwic KrWords 엑셀을 이용해 ‘wrdfrq.dbf’ 파일을 열면 각각 단어의 빈도수를 알 수 있음 단어 빈도 목록을 이용하여 메시지의 핵심어를 파악할 수 있음 실제 조사에서는 정제 과정을 거쳐 무의미한 단어를 최대한으로 걸러주는 작업을 거쳐야 함
  30. 30. 3. KrKwic KrTitle 각 단어들 사이의 관계를 분석 하고 의미망을 작성하기 위해 필요한 단어(유의미하다고 판단 되는 단어)를 선정
  31. 31. 3. KrKwic KrTitle 선정한 단어를 메모장에 붙여 넣고 [다른 이름으로 저장] 저장 시, 파일 이름은 반드시 ‘words’로, 인코딩은 반드시 ‘ANSI’로!
  32. 32. 3. KrKwic KrTitle ‘KrTitle’ 프로그램을 열어, ‘Enter’ 두 번 치면 아래와 같 이 자동으로 실행 됨
  33. 33. 3. KrKwic KrTitle 폴더로 돌아가면 프로그램 실행 후 얻어 진 파일들을 확인할 수 있다 matrix.dbf : 메시지(사례) X 단어(변인) 행렬로, 각 칸의 값은 단어가 메시지에서 출현한 빈도 나타냄 coocc.dat와 coocc.dbf : 단어 X 단어 공출현 빈도 행렬로, 각 칸의 값은 단어들이 메시지에서 동시에 출현한 빈도를 나타냄 cosine.dat와 cosine.dbf : 단어 X 단어 코사인 행렬로, 각 칸의 값은 단어 간 거리를 나타냄
  34. 34. 네트워크 그리기 1. UCINET 6 (Net Draw) 2. Pajek
  35. 35. 4-1. 네트워크 그리기 네트워크 그리기 – UCINET 6 1. [Data] – [Import text file] – [DL…]로 들어간다 저장된 자료를 UCINet6에서 자료를 불러와서 UCINet6에 사용되는 포맷으로 변경한다 Download UCINet 6 : http://www.analytictech.com/ucinet/
  36. 36. 4-1. 네트워크 그리기 네트워크 그리기 – UCINET 6 2. ‘Import DL text file’ 창이 열리면 ‘coocc.dat’ 파일을 불러온다
  37. 37. 4-1. 네트워크 그리기 네트워크 그리기 – UCINET 6 3. 이런 창이 뜨면 닫아준다. 4. 폴더로 돌아가면 아래와 같이 UCINET system file 이라는 유형으로 Coocc파일이 만들어진 것을 확인할 수 있다
  38. 38. 4-1. 네트워크 그리기 네트워크 그리기 – UCINET 6 5. [File] – [Open] – [Ucinet DL text file] – [Network(1-mode)] 클릭
  39. 39. 4-1. 네트워크 그리기 네트워크 그리기 – UCINET 6 6. [Name of file to open]에 ‘coocc’(UCINET 유형으로 된 것)파일 불러옴
  40. 40. 4-1. 네트워크 그리기 네트워크 그리기 – UCINET 6 유의미하다고 선정했던 단어들의 네트워크 완성 각종 옵션을 사용해 라인 굵기 등 설정 가능
  41. 41. 4-1. 네트워크 그리기 네트워크 그리기 – Pajek 1. [Networks] 부분에서 파일 열기 아이콘 클릭 2. Coocc.dat 파일 열기
  42. 42. 4-1. 네트워크 그리기 네트워크 그리기 – Pajek 2. [Report] 창이 뜨면 완성된 것. 3. [Report] 창을 끈 후 ‘Draw Network’ 아이콘 클릭
  43. 43. 4-1. 네트워크 그리기 네트워크 그리기 – Pajek 4. 네트워크 완성 5. 각종 옵션으로 선 굵기 등 네트워크 설정 가능
  44. 44. 두 검색어의 관계 두 가지 단어를 동시에 검색하여 두 단어간의 관계 알 수 있음 Webonaver로 쿼리 검색 후 바로 네트워크 그릴 수 있음
  45. 45. 두 검색어의 관계 1. 두 가지 검색어를 함께 Webonaver(최신ver)로 분석해 각종 records와 count 파일을 얻어냄 - 이는 두 브랜드의 연관관계를 알기 위함이며 - 검색어 간의 그루핑(Grouping) 가능 ** 유의사항 검색어를 메모장으로 저장할 때, 인코딩은 반드시 ‘UTF-8'로!!!! 4-2. 두 검색어의 관계
  46. 46. 2. 추출한 Count 파일을 엑셀로 연다 1) 카운트 된 숫자들 중 첫 번째 숫자들만 놔두고 지움 2) 그리고 다시 저장 (저장할 때 형식은 ‘Excel통합문서’로!!!, 이름은 상관없음) 4-2. 두 검색어의 관계 두 검색어의 관계
  47. 47. 3. 저장된 자료를 UCINET6에서 불러옴 - [Data] – [Import Excel] – [DL Type Format] 클릭 후 ‘DL Editor’ 창이 뜨면 [File] – [Open Excel File] 클릭하여 저장한 파일 불러오기 (혹은 위의 이미지에 표시된 단축 아이콘들을 눌러서 불러오기) 4-2. 두 검색어의 관계 두 검색어의 관계
  48. 48. 4. 열린 창의 우측에 있는 ‘Data format’을 ‘Edgelist1’로 설정 1) 또, ‘Output Options’에서 ‘Force Symmetry’를 체크해줌 (방향성이 없는 경우에만 해당함) 5. 설정을 마친 후, 파일 저장 -> 그러면 UCINET6에 사용되는 포맷으로 저장된 것임 4-2. 두 검색어의 관계 두 검색어의 관계
  49. 49. 6. Visual Network Map을 그리기 위해 UCINET6에 있는 [Netdraw]를 열어줌 4-2. 두 검색어의 관계 두 검색어의 관계
  50. 50. 7. 위의 단축 아이콘을 차례로 눌러, 금방 저장했던 UCINET 포맷의 파일을 열어줌 4-2. 두 검색어의 관계 두 검색어의 관계
  51. 51. 각 검색어 간의 네트워크를 나타낸 Map 확인할 수 있음 * 여러 옵션을 통해 네트워크 선의 굵기 등 설정 가능 4-2. 두 검색어의 관계 두 검색어의 관계
  52. 52. 단어구름 1. 연합뉴스 사이트 2. Tagxedo
  53. 53. 연합뉴스 데이터 사이트 http://data.yonhapnews.co.kr/graph/proc/gr_graph_home.aspx 단어구름 - 연합뉴스 1. 위의 사이트에 회원가입 2. 로그인 후 [데이터 올리기] 클릭 5. 네트워크 그리기
  54. 54. 단어구름 - 연합뉴스 5. 네트워크 그리기 KrKwic 프로그램으로 얻은 ‘wrdfrq.dbf’ 파일을 열어 자료 복사
  55. 55. 단어구름 - 연합뉴스 5. 네트워크 그리기 연합뉴스 사이트의 ‘02 자료 붙이기’에 붙여넣기
  56. 56. 단어구름 - 연합뉴스 5. 네트워크 그리기 ‘03 자료확인’을 보면 붙여 넣은 자료가 자동적으로 표로 만들어짐
  57. 57. 단어구름 - 연합뉴스 5. 네트워크 그리기 ‘04 자료정보보기’ 칸을 모두 채워 넣은 후 [등록] 클릭
  58. 58. 단어구름 - 연합뉴스 5. 네트워크 그리기 본인이 등록한 데이터를 찾아 우측에 [작성하기] 클릭
  59. 59. 단어구름 - 연합뉴스 5. 네트워크 그리기 활성화된 그래프 클릭
  60. 60. 단어구름 - 연합뉴스 5. 네트워크 그리기 [그래프 그리기] 클릭하면 그래프 완성
  61. 61. 단어구름 - Tagxedo 5. 네트워크 그리기 KrKwic 프로그램으로 얻은 ‘wrdfrq.dbf’ 파일을 열어 자료 복사
  62. 62. 단어구름 - Tagxedo 5. 네트워크 그리기 Tagxedo – Creator http://www.tagxedo.com/app.html ‘Load’를 클릭하여 ‘Enter Text’에 자료 붙여 넣은 후 ‘Submit’를 누른다.
  63. 63. 단어구름 - Tagxedo 5. 네트워크 그리기 단어구름 완성! 좌측에 있는 Respins와 Options를 이용해 단어 구름의 모양, 색깔 설정 가능
  64. 64. 이 슬라이드는 Thelwall, Webometric Analyst Manual 을 기초로 한국 이용자들이 Webometric Analyst 를 쉽게 사용할 수 있도록 만든 매뉴얼입니다. Webometric Analyst 최근 버전을 사용했으며, 사례 또한 원제와 상이합니다. * This slide was made by Han Woo Park and his students to help Korean users use the Webometric Analyst WeboNaver와 Webometrics Analyst와 연결하기
  65. 65. Manipulate 1. 맨 처음, Webonaver를 통해 수집한 records 자료를 엑셀로 불러온다. 6-1. Manipulate
  66. 66. 6-1. Manipulate 복사한 OpenAPI 주소를 메모장에 붙여넣기 후 [다른 이름으로 저장]함 * 저장 시, 파일명은 상관없으나 인코딩은 반드시 ANSI Manipulate
  67. 67. 6-1. Manipulate 저장한 메모파일을 불러와서 [Webo Analysis Format]을 체크 후 [Run] 버튼 클릭 Manipulate
  68. 68. 6-1. Manipulate 그림과 같이 ‘Finished adding real URLs’ 라는 창이 뜨면 컨버팅 완료! Manipulate
  69. 69. 6-1. Manipulate OpenAPI 주소를 저장한 폴더로 돌아가면 ‘(저장이름)_RealURL’ 이라는 파일이 생성된 것을 알 수 있음 ‘(저장이름)_RealURL’ 파일을 열면 실제 URL 주소 나옴 Manipulate
  70. 70. 6-1. Manipulate Manipulate ‘(저장이름)_RealURL’ 파일을 엑셀로 열어 오류가 난 부분은 삭제해 줌 (정제과정을 거치지 않으면 제대로 된 결과를 얻을 수 없음)
  71. 71. 6-1. Manipulate Manipulate 정제과정을 거친 파일을 [다른 이름으로 저장]함 * 저장 시, 파일형식은 반드시 ‘탭으로 분리’로 저장
  72. 72. 6-1. Manipulate Manipulate 정제하여 저장한 파일을 다시 메모장으로 열어준다. 그리고 인코딩을 ‘UTF-8’로 바꾸어 다시 저장한다.
  73. 73. 또 다른 방법 6-2. 또다른 방법 Query를 저장한 파일을 이 용해 Data Sources를 추출 하는 과정에서부터 원래의 URL을 함께 얻을 수 있는 방식 1. 초반에 만들었던 Query 파일 (‘text’라고 저장한 파일)을 [Query File]에 불러옴 2. [Naver API Key]와 [Auth. Key] 를 입력함 3. 원하는 [Data Sources] 체크 4. Output Format에서 [Webometric Analyst 2.0] 체크 5. 하단에 [RunQueries] 클릭하여 프로그램 실행
  74. 74. 6-2. 원래의 URL 얻기 / 또다른 방법 6-2. 또다른 방법 폴더로 돌아가면 records 파일이 생성된 것을 알 수 있음
  75. 75. 6-2. 원래의 URL 얻기 / 또다른 방법 6-2. 또다른 방법 Records 파일을 엑셀로 열어 오류가 난 부분은 삭제해 줌 (정제과정을 거치지 않으면 제대로 된 결과를 얻을 수 없음)
  76. 76. 6-2. 원래의 URL 얻기 / 또다른 방법 6-2. 또다른 방법 정제과정을 거친 파일을 [다른 이름으로 저장]함 * 저장 시, 파일형식은 반드시 ‘탭으로 분리’로 저장
  77. 77. 정제하여 저장한 파일을 다시 메모장으로 열어준다. 그리고 인코딩을 ‘UTF-8’로 바꾸어 다시 저장한다. 원래의 URL 얻기 / 또 다른 방법 6-2. 또다른 방법
  78. 78. 7-1. Webometric Analyst Webometric Analyst : Webomatric Analyst를 사용하면 특정 검색어가 어떤 도메인에서, 얼마나 검색되었는지 알 수 있음 1. 이와 같은 창이 나오면 ‘Classic interface’ 체크 후 ‘OK’ 버튼 눌러 줌
  79. 79. 7-1. Webometric Analyst Webometric Analyst 2. 프로그램 상단에 [Reports] 클릭 후, 맨 처음에 있는 [Make a set ~ splitting ma] 선택 3. UTF-8 형식으로 저장한 메모장 파일을 불러옴
  80. 80. 7-1. Webometric Analyst Webometric Analyst 4. ‘(저장된 파일 이름)으로 새로운 폴더를 만들겠냐’는 경고 창이 뜨면 ‘예(Y)’를 누름
  81. 81. 7-1. Webometric Analyst Webometric Analyst 5. 그러면, UTF-8 형식으로 저장한 파일과 같은 이름으로 폴더가 생성된 것을 확인할 수 있음
  82. 82. 7-1. Webometric Analyst Webometric Analyst 6. 폴더 생성이 완료되면, 'Search Engine Results Report‘라는 창이 뜬다 ->이것이 결과 보고서이며, 생성된 폴더 안에 ‘index’라는 이름으로도 저장되어 있음)
  83. 83. 7. 결과를 분석할 때 일반적으로 Domain(도메인)을 많이 연구하는데, Domain은 생성된 폴더 안의 ‘Overview’ 파일에서 확인 가능하다. 7-2. Webometric Analyst Webometric Analyst
  84. 84. 8. Query가 언급된 Domain이 몇 개인지, 그리고 어느 Domain이 가장 많은지 확인 가능 7-2. Webometric Analyst Webometric Analyst
  85. 85. 86 웹보메트릭스, 소셜네트워크, 의미망 분석 매뉴얼 - 반드시 인용바람!! Webometrics Analyst 매뉴얼 http://www.slideshare.net/hanpark/webomatric-analyst-08oct2012 NodeXL 매뉴얼 http://www.slideshare.net/hanpark/korean-manual-for-nodexl-fb-flickr-twitter-youtube-wiki KrKwic 매뉴얼 http://www.slideshare.net/hanpark/krkwicnovember2006 WeboNaver 매뉴얼 http://www.slideshare.net/hanpark/webo-naver2012-0902
  86. 86. Prof. Han Woo PARK CyberEmotions Research Center Department of Media and Communincation, YeungNam University, Korea hanpark@ynu.ac.kr http://www.hanpark.net Formerly, World Class University Webometrics Institute WCU WEBOMETRICS INSTITUTE INVESTIGATING INTERNET-BASED POLITIC WITH E-RESEARCH TOOLS

×