Web Archiving<br />2010.  6.  3<br />최 명 석<br />
Way Back (1)<br />2<br />(이규철, 아카이빙TF 2차세미나, 2010. 04. 07)<br />
Way Back (2)<br />3<br />(박진호, 아카이빙TF 2차세미나, 2010. 04. 07)<br />
Way Back (3)<br />4<br />(박진호, 아카이빙TF 2차세미나, 2010. 04. 07)<br />
Way Back (4)<br />5<br />(노경란, 아카이빙TF 이슈토론 3차, 2010. 05. 26)<br />
Web (1)<br />6<br />지속적인 수정과 삭제가 발생하는 휘발성<br />하이퍼링크 기반의 불연속적인 연결로 이루어진 불연속성<br />복제와 전송이 용이하여 여러 가지 형태로 증가하는 증식성<br />텍스트...
Web (2)<br />7<br />정적 웹사이트와 웹자원<br />서식에 기반한 상호작용이 있는 정적 웹사이트와 웹자원<br />동적 데이터 접근에 기반한 웹사이트와 웹자원<br />동적으로 생성된 웹사이트와 웹자원<...
Web (3)<br />8<br />표면웹(Surface Web)은 현재 15억 개의 웹페이지 정도이지만,<br />중요한 내용을 담고 있지만 접근이 불가한 심층웹(Deep Web*)은<br />무려 5500억 개에달한...
9<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
Web (4)<br />10<br />일반적인 웹페이지의 수명은 평균 75일이고<br />30%가 조금 넘는 URL들만이 1년 이상 유지되는 것으로<br />조사된 바 있다. (Lawrence 2001; Koehler ...
11<br />
(표면) 웹 아카이빙의 어려움<br />자바스크립트 또는 플래쉬와의 관계<br />크롤러의제약사항<br />로그인 후 가져와야 하는 데이터들<br />데이터베이스로부터 생성된 동적인 페이지 정보<br />접근이 되지 않...
웹 아카이빙의 유형<br />13<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
웹 아카이빙의 특성 비교<br />14<br />Kulturarw<br />Internet Archive<br />프랑스 국립도서관<br />노르웨이<br />Minerva<br />(김유승, 복합적 웹 아카이빙 정책에...
프랑스 국립도서관 사례<br />15<br />(김유승, 복합적 웹 아카이빙 정책에 관한 고찰, 2008)<br />
국회도서관 사례<br />입법관련 304개 기관(325개 웹사이트) 대상<br />평균 3 depth<br />구성포맷: html, jpeg, gif 등<br />콘텐츠유형: flash, pdf, MS office, j...
웹 아카이빙 도구<br />Remote Harvesting<br />Hertrix: Internet Archive<br />NEDLIB Harvester(유럽 도서관), HTTrack, Wget<br />On-deman...
저작권<br />미국의 1998년 디지털 밀레니엄 저작권법(Digital Millennium Copyright Act)과<br />유럽연합의 2001년 저작권 지침(Copyright Directive 2001/29/EC...
웹 정보자원의 납본 법제화<br />캐나다, 덴마크, 프랑스, 독일, 노르웨이, 남아프리카공화국, 스웨덴, 영국, 아이슬란드등<br />납본의 대상을 기존의 오프라인 매체에서 온라인 정보자원으로 확대<br />그 권한과...
아카이빙 대상<br />웹기록물<br />기록의 속성(내용, 구조, 맥락)을 통한 증거능력을 확보할 수 있는 특징을 가진웹사이트<br />공공기관의 특성상진본성 제공이 중요<br />20<br />
21<br />1. Twitter feeds—all of them<br />2. National Election Candidates’<br />     Internet Presences<br />3. Facebook P...
22<br />
23<br />
24<br />
25<br />
시사점<br />대상 분석을 통한 설득력 있는 실례 발굴 필요<br />공공기관의 웹 기록물 아카이빙<br />납본 (법제화) 필요<br />Deep Web에 중점을 둔 복합적 웹 아카이빙<br />저작권 및 개인정보에...
Upcoming SlideShare
Loading in...5
×

2010 0603 최명석_웹 아카이빙-글꼴포함-20100602

1,037

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,037
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
18
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

2010 0603 최명석_웹 아카이빙-글꼴포함-20100602

  1. 1. Web Archiving<br />2010. 6. 3<br />최 명 석<br />
  2. 2. Way Back (1)<br />2<br />(이규철, 아카이빙TF 2차세미나, 2010. 04. 07)<br />
  3. 3. Way Back (2)<br />3<br />(박진호, 아카이빙TF 2차세미나, 2010. 04. 07)<br />
  4. 4. Way Back (3)<br />4<br />(박진호, 아카이빙TF 2차세미나, 2010. 04. 07)<br />
  5. 5. Way Back (4)<br />5<br />(노경란, 아카이빙TF 이슈토론 3차, 2010. 05. 26)<br />
  6. 6. Web (1)<br />6<br />지속적인 수정과 삭제가 발생하는 휘발성<br />하이퍼링크 기반의 불연속적인 연결로 이루어진 불연속성<br />복제와 전송이 용이하여 여러 가지 형태로 증가하는 증식성<br />텍스트/이미지/오디오 등 동시에 존재할 수 있는 다양성<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
  7. 7. Web (2)<br />7<br />정적 웹사이트와 웹자원<br />서식에 기반한 상호작용이 있는 정적 웹사이트와 웹자원<br />동적 데이터 접근에 기반한 웹사이트와 웹자원<br />동적으로 생성된 웹사이트와 웹자원<br />(호주 국립기록보존소)<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
  8. 8. Web (3)<br />8<br />표면웹(Surface Web)은 현재 15억 개의 웹페이지 정도이지만,<br />중요한 내용을 담고 있지만 접근이 불가한 심층웹(Deep Web*)은<br />무려 5500억 개에달한다고 한다.<br />* Invisible Web, Dr. Jill Ellsworth(1994)<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
  9. 9. 9<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
  10. 10. Web (4)<br />10<br />일반적인 웹페이지의 수명은 평균 75일이고<br />30%가 조금 넘는 URL들만이 1년 이상 유지되는 것으로<br />조사된 바 있다. (Lawrence 2001; Koehler 2004)<br />단행본 책의 경우 한 장에서 인용된 웹문서의약 65%는<br />1년 안에 사라지거나 URL이 변경되며,<br />한 학술지 논문이 인용된 웹 문서의 50%는 논문이 발행되기도 전에<br />원래의 위치에 변동이 생긴다 (Charlesworth 2003b)<br />
  11. 11. 11<br />
  12. 12. (표면) 웹 아카이빙의 어려움<br />자바스크립트 또는 플래쉬와의 관계<br />크롤러의제약사항<br />로그인 후 가져와야 하는 데이터들<br />데이터베이스로부터 생성된 동적인 페이지 정보<br />접근이 되지 않는 페이지들의 존재<br />12<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
  13. 13. 웹 아카이빙의 유형<br />13<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
  14. 14. 웹 아카이빙의 특성 비교<br />14<br />Kulturarw<br />Internet Archive<br />프랑스 국립도서관<br />노르웨이<br />Minerva<br />(김유승, 복합적 웹 아카이빙 정책에 관한 고찰, 2008)<br />
  15. 15. 프랑스 국립도서관 사례<br />15<br />(김유승, 복합적 웹 아카이빙 정책에 관한 고찰, 2008)<br />
  16. 16. 국회도서관 사례<br />입법관련 304개 기관(325개 웹사이트) 대상<br />평균 3 depth<br />구성포맷: html, jpeg, gif 등<br />콘텐츠유형: flash, pdf, MS office, java applets, php, jsp, asp, 스트리밍 미디어 등<br />정보유형: 게시형/웹보드/등록/검색 등<br />원격 하베스팅 방식<br />수집주기<br />입법활동기관과 입법활동 지원 기관 : 기본 1년<br />국회의원 웹사이트: 기본 2년<br />16<br />(정은진, 국회 각 기관 웹사이트 아카이빙 방안 연구, 2009)<br />
  17. 17. 웹 아카이빙 도구<br />Remote Harvesting<br />Hertrix: Internet Archive<br />NEDLIB Harvester(유럽 도서관), HTTrack, Wget<br />On-demand<br />WebCite, Archive-It, Hanzo Archives, BackupURL.com, freezePAGE snapshots, Website-Archive.com, Iterasi<br />Datebase Archiving<br />DeepArc(프랑스 국립도서관), Xinq(호주 국립도서관)<br />Transactional Archiving<br />PageVault, Vignette WebCapture<br />(Web Archiving in Wikipedia)<br />17<br />
  18. 18. 저작권<br />미국의 1998년 디지털 밀레니엄 저작권법(Digital Millennium Copyright Act)과<br />유럽연합의 2001년 저작권 지침(Copyright Directive 2001/29/EC)은<br />저작권자의 허가 없이 디지털 저작물을 복제하는 것을<br />불법으로 규정하고 있는 것뿐만 아니라,<br />저작권자가 복제 방지를 위해 저작물에 설치한<br />어떠한 기술적 통제를 제거하거나 우회하는 것조차도<br />범죄 행위로 규정하고 있다.<br />18<br />
  19. 19. 웹 정보자원의 납본 법제화<br />캐나다, 덴마크, 프랑스, 독일, 노르웨이, 남아프리카공화국, 스웨덴, 영국, 아이슬란드등<br />납본의 대상을 기존의 오프라인 매체에서 온라인 정보자원으로 확대<br />그 권한과 책임을 국립도서관에 위임<br />19<br />(차승준, 공공기관 심층 웹기록물아카이빙을 위한 메타데이터 설계, 2009)<br />
  20. 20. 아카이빙 대상<br />웹기록물<br />기록의 속성(내용, 구조, 맥락)을 통한 증거능력을 확보할 수 있는 특징을 가진웹사이트<br />공공기관의 특성상진본성 제공이 중요<br />20<br />
  21. 21. 21<br />1. Twitter feeds—all of them<br />2. National Election Candidates’<br /> Internet Presences<br />3. Facebook Pages—A Selective Few<br />4. Notable Historical Events<br />5. News Sites That Give Permission<br />
  22. 22. 22<br />
  23. 23. 23<br />
  24. 24. 24<br />
  25. 25. 25<br />
  26. 26. 시사점<br />대상 분석을 통한 설득력 있는 실례 발굴 필요<br />공공기관의 웹 기록물 아카이빙<br />납본 (법제화) 필요<br />Deep Web에 중점을 둔 복합적 웹 아카이빙<br />저작권 및 개인정보에 대한 고려<br />기초기술연구회를 통한 대상기관과의 협약 체결<br />26<br />
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×