• Save
Soc Sci Bot(01 Mar2010)-Korean Manual
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,023
On Slideshare
1,023
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • http://people.oii.ox.ac.uk/escher/wp-content/uploads/2007/09/socscibot2pajek_v1.0.zip SocSciBot2Pajek is a Perl script that converts link structure files collected with the SocSciBot crawler of Mike Thelwall into .net files for analysis with the social network analysis application Pajek. It also does some other useful stuff like creating a partition indicating the file types as well as producing a Pajek syntax file that will automatically compute some basic network statistics. You can download it here and let me know if you encounter any problems.
  • You can rearrange the network by clicking on nodes and dragging them around. This and also try the options in the tab on the right hand side of the screen to make the nodes and arrows bigger and smaller. Also, select some nodes by clicking and dragging across them and then right click to activate a menu of properties that can be changed. Change the colour of the selected nodes to yellow and try out some other changes.

Transcript

  • 1. SocsciBot 4 Link crawler for the social sciences 본 매뉴얼은 SocSciBot 3 (http://socscibot.wlv.ac.uk/) 한글버전입니다 . 박한우 ( 영남대학교 언론정보학과 , http://www.hanpark.net) SocSciBot 는 링크 분석 연구 목적으로 만들어진 웹 사이트 crawler 입니다 . 하나 혹은 여러 개의 사이트를 대상으로 한 링크 분석을 처리하는데 사용될 수 있거나 , 여러 개의 사이트를 대상으로 하여 검색 엔진을 실행하는데 사용될 수 있습니다 . 또한 링크 분석과 검색 엔진이 어떻게 작동하는 지 설명하는데 사용할 수 있습니다 .
  • 2.
    • 소프트웨어는 비상업적 목적으로 사용됩니다 . 우린 SocSciBot 의 사용에 의해 나타나는 어떤 손해에 대해
    • 책임을 지지 않습니다 . 그리고 다운로드 된 프로그램의 작동에 의해 발생한 다른 프로그램이나 데이터의
    • 손실에 대해서 역시 책임지지 않습니다 .
    • 사용자는 프로그램에서 요구되는 정확한 e-mail 주소를 기입합니다 . 그리고 사용자의 웹 crawling 에 대해
    • 웹 마스터가 불만을 나타낼 경우에 대비해서 crawling 이 되는 기간 동안 e-mail 을 확인한다 . SocSciBot 은
    • 자동적으로 웹 마스터에게 사용자가 crawling 하고 있는 사실을 알리고 , 원하지 않을 경우 crawling 을
    • 중지하기 위해 웹 마스터가 사용자에게 언제든지 얘기할 수 있도록 e-mail 을 기입하는 것을 권장합니다 .
    • 사용자는 사용하고 있는 대역폭의 여유가 없는 기관의 웹사이트를 crawl 하기 위하여 SocSciBot4 을
    • 사용하지 않습니다 ( 예 . 후진국들 ) .
    • 사용자는 웹 서버들을 반복해서 crawling 함으로 인해 웹 서버 부하를 일으키지 않아야 합니다 ( 예 . 메일 ).
    • 사용자는 SocSciBot4 이 가끔 경고 없이 연결이 끊어질 수 있는 것을 알아야 합니다 . 예를 들면 , 만약
    • SocSciBot4 의 사용에 웹 마스트로부터 어떤 불만을 느껴 연결을 끊는 경우가 있습니다 .
    • 사용자는 SocSciBot4 의 사용이 가끔 느려질 수있다는 것을 알아야 합니다 . 이것은 비윤리적 방식으로
    • 사용되는지 불만의 원인을 확인하기 위한 것입니다 . 비윤리적인 사용의 경우를 제외하고 , 이 정보는
    • 제 3 자에게 나타나지 않을 것입니다 .
    SocSciBot and associated software : 사용 조건
  • 3. SocSciBot, ScoSciBot Tools and Cyclist 설치 및 사용 웹사이트 Crawl 하기 조사한 결과에 대한 기초적인 보고서 보기 ……………… . 4 ……………… .................................................................. 4 ……………………………………… 15 ……………………………………………………… . 22 SocsciBot 4 LIST 보길 원하는 부분을 클릭하면 바로 넘어갑니다 . 네트워크 다이어그램 보기 사이트 네트워크 보기 …………………………………………………… ....……. 28 EXIT
  • 4. SocSciBot, ScoSciBot Tools and Cyclist 설치 및 사용 ① ─ 웹사이트 Crawl 하기 이 설명서 소개는 링크 데이터를 Crawl 하는 것에서부터 분석하는 것까지 매우 소규모 SocSciBot 프로젝트의 모든 단계들을 다루고 있습니다 . 이 설명서를 통해서 SocSciBot 이 할 수 있는 일이 무엇인지를 쉽게 알 수 있습니다 . LIST EXIT
  • 5.
    • SocSciBot 4 홈페이지 ( http://socscibot.wlv.ac.uk ) 에 가서 , 사용 조건에 동의를 한다면 , Socscibot 4 를
    • 다운로드 할 링크를 클릭합니다 . 데이터를 저장할 충분한 여유가 있는 공간에 Socscibot4 를 저장합니다 .
    • 이 공간은 일반적으로 C 드라이브와 같은 컴퓨터 하드드라이브 입니다 .
    단계 01
  • 6.
    • SocSciBot 4 홈페이지 ( http://socscibot.wlv.ac.uk ) 에 가서 , 사용 조건에 동의를 한다면 , Socscibot 4 를
    • 다운로드 할 링크를 클릭합니다 . 데이터를 저장할 충분한 여유가 있는 공간에 Socscibot4 를 저장합니다 .
    • 이 공간은 일반적으로 C 드라이브와 같은 컴퓨터 하드드라이브 입니다 .
    단계 01
  • 7.
    • SocSciBot 4 홈페이지 ( http://socscibot.wlv.ac.uk ) 에 가서 , 사용 조건에 동의를 한다면 , Socscibot 4 를
    • 다운로드 할 링크를 클릭합니다 . 데이터를 저장할 충분한 여유가 있는 공간에 Socscibot4 를 저장합니다 .
    • 이 공간은 일반적으로 C 드라이브와 같은 컴퓨터 하드드라이브 입니다 .
    단계 01
  • 8.
    • 만약 SocSciBot 데이터와 함께 네트워크 다이어그램을 생성하기를 원한다면 , 사용자는 Pajek
    • ( http://vlado.fmf.uni-lj.si/pub/networks/pajek ) 을 설치하여야 합니 . 그리고 SocSciBot 은 프로그램이 시작될
    • 때 Pajek 을 찾기 때문에 , SocSciBot 을 처음 시작하기 전에 Pajek 을 설치하는 것을 추천합니다 .
    단계 02
  • 9. ① ②
    • SocSciBot 과 나중에 사용할 SocSciBot Tools 의 데이터 저장 폴더 (crawler_data) 의 위치는 동일하게 설정 해주어야 합니다 . 왜냐하면 SocSciBot 의 프로젝트를 SocSciBot Tools 에서 자동적으로 불러 들이기 위해서입니다 . 만약 다른 폴더를 사용하게 되면 , 사용자가 나중에 경로를 다시 지정해줘야 하는 번거로움이 있습니다 .
    • 설치 작업이 끝난 후 , SocSciBot 을 실행시키면 다음과 같은 창이 뜬다 . ① 번란에는 데이터를 저장하기 위한
    • 폴더를 지정해 준다 . 그리고 ②번란에는 이메일 주소를 입력한다 . 이것은 윤리적인 수행임과 동시에 , 만약
    • 웹마스터가 당신의 Crawl 행위를 불만족스럽게 느껴 당신이 위험에 처해진다면 , 당신을 구할 수단일 수도 있다 .
    단계 03 주의점
  • 10.
    • 앞 단계를 완료하고 OK 버튼을 누루면 Pajek 과 Excel 을 확인하는 창이 뜹니다 . 만약 프로그램을 가지고 있다면
    • 예 (Y) 를 누룬 뒤 Pajek 과 Excel 의 exe 파일을 찾아 지정해 줍니다 . 참고로 , 일반적으로 , Pajek 의 경로는
    • C:PajekPajekPajek.exe, Excel 은 C:Program FilesMicrosoft OfficeOffice10EXCEL.exe 입니다 .
    단계 04
  • 11.
    • 다음 다이아로그 박스 , Wizard Step 1 에 새로운 프로젝트를 만드십시오 . 우선 small test 라고 입력한 뒤
    • Start new project 버튼을 클릭하십시오 .
    단계 05
  • 12. ① ②
    • Wizard Step 2 다이아로그 박스에서 ①번란에 http://linkanalysis.wlv.ac.uk/ 를 입력하십시오 .
    • 그리고 ②번 , Crawl Site with SocSciBot 버튼을 클릭하십시오 .
    단계 06
  • 13.
    • Crawl 를 할 모든 준비가 완료되었다 . Crawl Site 버튼을 클릭하십시오 .
    • 사이트 규모에 따라서 crawl 을 하는 시간이 길수도 있고 짧을 수도 있다는 것을 유념하십시오 .
    • 사용자는 crawl 하는 동안 윗부분의 타이틀 바에서 crawl 에 대한 정보를 읽을 수 있습니다 .
    단계 07
  • 14.
    • Crawl 이 완료 되었을 때 SocSciBot 을 끝내기 위해 확인을 클릭하십시오 . 사용자는 이제
    • http://linkanalysis.wlv.ac.uk 사이트의 모든 페이지를 crawl 했습니다 . 간단한 분석을 시행하기 전에 ,
    • 2 개 이상의 사이트를 더 crawl 해보십시오 .
    단계 08
  • 15.
    • SocScibot 을 다시 시작한다 . Crawl 할 다른 사이트를 추가하기 위하여 동일 프로젝트를 선택하기 위해 ,
    • 프로젝트 리스트에 있는 small test 를 클릭하십시오 .
    단계 09
  • 16.
    • Crawl 을 위해 두 번째 사이트의 URL(http://cybermetrics.wlv.ac.uk/) 을 입력하십시오 . 그리고 Crawl Site with
    • SocScibot 버튼을 클릭하십시오 . 다음 화면에서 Crawl Site 버튼을 클릭하고 작업이 완료될 때까지
    • 기다리십시오 . 이와 같은 방법으로 세 번째 사이트 (http://socscibot.wlv.ac.uk/) 를 crawl 합니다 .
    단계 10
  • 17. SocSciBot, ScoSciBot Tools and Cyclist 설치 및 사용 ② ─ 조사한 결과에 대한 기초 보고서 보기 LIST EXIT 이 설명서 소개는 링크 데이터를 Crawl 하는 것에서부터 분석하는 것까지 매우 소규모 SocSciBot 프로젝트의 모든 단계들을 다루고 있습니다 . 이 설명서를 통해서 SocSciBot 이 할 수 있는 일이 무엇인지를 쉽게 알 수 있습니다 .
  • 18.
    • crawl 하여 얻은 데이터를 분석하기 위해 SocSciBot Tools 를 시작하십시오 . 그러면 프로젝트를 선택하는 창이
    • 뜨게 되는데 , 전 단계에서 이미 만들었던 small test 클릭하십시오 . 링크분석과정을 시작하기 위해서 ,
    • Wizard Step 2 에서 Analyse LINKS in Project with SocScibot Tools 를 선택하십시오 .
    단계 01
  • 19.
    • 링크분석 보고서를 작성하길 원하느냐의 질문을 받을 것입니다 . 질문에 예라고 답하십시오 .
    • 그리고 다음 , 홈페이지 파일 이름들을 표준화할 것이냐는 질문에 예라고 답하십시오 . 보고서가 작성될 때까지
    • 기다리십시오 .
    단계 02
  • 20.
    • 사용자는 화면의 중앙에 메뉴를 따라 내려가면서 보고서들을 볼 수 있습니다 . All external links 를 클릭하십시오 .
    • 더 많은 정보가 화면의 오른쪽에 표시됩니다 . 그리고 crawl 대상이 된 사이트에 포함된 외부 URL 페이지들의
    • 리스트를 보려면 View report 를 클릭하라 ( 아웃링크 사이트 ). 그리고 ①과 같이 http:// 와 www 는 저장할 때
    • 잘려서 저장됨으로 정상적으로 URL 이 주어지지 않는다는 점을 기억하십시오 .
    단계 03
  • 21.
    • 주요 보고서는 ADM count summary 이다 . Excel 을 가지고 있다면 View in Excel, 없다면 View report 버튼을 클릭하라 . 이는
    • 프로젝트의 모든 사이트로부터 한 사이트로 향하는 링크의 수와 , 한 사이트로부터 다른 사이트로 향하는 링크의 수를 보여준다 .
    • 대다수의 사람들은 인링크와 아웃링크를 나타내는 ADM 파일만 필요로 할 것이다 . 예를들면 linkanalysis.wlv.ac.uk 줄의 2 단을 보면 ,
    • 다른 2 사이트에서 linkanalysis 로 향하는 27 개의 링크가 있고 , linkanalysis.wlv.ac.uk 에서 다른 2 사이트로 향하는 8 개의 링크가 있다 .
    단계 04
  • 22. SocSciBot, ScoSciBot Tools and Cyclist 설치 및 사용 ③ ─ 네트워크 다이어그램 보기 LIST EXIT 이 설명서 소개는 링크 데이터를 Crawl 하는 것에서부터 분석하는 것까지 매우 소규모 SocSciBot 프로젝트의 모든 단계들을 다루고 있습니다 . 이 설명서를 통해서 SocSciBot 이 할 수 있는 일이 무엇인지를 쉽게 알 수 있습니다 .
  • 23.
    • Network Diagram for Whole Project 탭을 선택하십시오 . 만약 스크린의 왼쪽에 어떤 파일도 나타나지 않는다면 ,
    • Re/Calculate Network 버튼을 클릭하십시오 . Single.combined.full 이 나타나면 , SocSciBot Network 에서
    • Network 를 보기 위해 이것을 클릭하십시오 .
    단계 01
  • 24. 개선 전 개선 후
    • 처음 네트위크는 임의로 정열이 되었습니다 . 더 보기 좋은 네트워크 정열을 위하여 Layout 메뉴에서
    • Fruchterman Reingold ( 네트워크 정열 알로리즘 ) 을 선택하십시오 .
    단계 02
  • 25.
    • Pajek 에서 사이트 네트워크를 보기 위해 , Load Network in Pajek 버튼을 누르고 single.combined.full 을 클릭
    • 하십시오 . 그러면 Pajek 창이 뜹니다 .
    단계 03
  • 26.
    • 네트워크를 보려면 Draw 메뉴에서 Draw 를 선택하십시오 . 그러면 네트워크 다이어그램을 볼 수 있습니다 .
    • 만약 라벨 ( 사이트 도메인 이름 ) 이 붙어있지 않다면 Options 메뉴에서 Mark Vertices Using – Labels 를 선택
    • 하십시오 . 나타난 다이어그램은 internal site 링크를 제외한 inter-site 링크의 네트워크를 보여줍니다 .
    단계 04
  • 27. 개선 전 개선 후
    • 네트워크 다이어그램에 대한 개선된 레이아웃을 얻기 위해선 Layout 메뉴에서 Energy – Kamada_Kawai – Free
    • 의 Kamada-Kawai 포지셔닝 알로리즘을 선택하고 결과를 확인하십시오 .
    단계 05
  • 28. SocSciBot, ScoSciBot Tools and Cyclist 설치 및 사용 ④ ─ 사이트 네트워크 보기 LIST EXIT 이 설명서 소개는 링크 데이터를 Crawl 하는 것에서부터 분석하는 것까지 매우 소규모 SocSciBot 프로젝트의 모든 단계들을 다루고 있습니다 . 이 설명서를 통해서 SocSciBot 이 할 수 있는 일이 무엇인지를 쉽게 알 수 있습니다 .
  • 29.
    • 각 사이트의 네트워크를 보고 싶다면 , Network Diagrams for Individual Sites 탭을 선택하십시오 . 이것을 하기
    • 전 , SocSciBot 에게 internal site links 를 원한다고 알려야 합니다 . 그것을 위해서 Link Type Options 메뉴에서
    • Select Types of Links to Include in Reports 를 선택합니다 . 그리고 Options 메뉴에서 Site self-links 상자만
    • 체크하고 OK 버튼을 누릅니다 . ( 역시 파일을 보기 위해 Re/Calculate Networks 버튼을 누릅니다 .)
    단계 01
  • 30. 개선 전 개선 후
    • 다음과 같은 개별 사이트 링크들을 볼 수가 있습니다 . 이 역시 더 보기 좋은 네트워크 정열을 위하여
    • Layout 메뉴에서 Fruchterman Reingold ( 네트워크 정열 프로그램 ) 을 선택하십시오 .
    단계 02