National digitallibaryofkorea series_3_dgitalcontnetmanagementsystem

1,969 views
1,804 views

Published on

국립중앙도서관 디지털도서관 총서 시리즈3.
디지털장서관리 및 연구개발

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,969
On SlideShare
0
From Embeds
0
Number of Embeds
13
Actions
Shares
0
Downloads
19
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

National digitallibaryofkorea series_3_dgitalcontnetmanagementsystem

  1. 1. 디브러리 총서 3디지털장서 관리 및 연구 개발 국립중앙도서관
  2. 2. 제3권 디지털 장서 관리 및 연구 개발목 차 제 5 장 장서수집 수준 정의 제 1 부 장서개발정책 기본모형 연구·개발 및 수립 1. 컨스펙터스(Conspectus)의 개념 | 46 1 제 장 서론 2. 컨스펙터스의 구성요소 및 유형 | 48 3. 컨스펙터스 수정 | 53 1. 연구의 배경 및 목적 | 16 제 6 장 디지털장서개발정책 구성요소 2. 연구의 내용 | 17 제 2 장 디지털장서개발정책 개발 사례 1. 구성요소 도출 | 64 2. NDL 장서개발정책 기본모형 | 74 1. 장서개발정책 가이드라인 | 18 2. 국내외 디지털장서개발정책 개발 사례 | 19 제 3 장 이용자 커뮤니티 정의 1. 이용자 정의 | 20 2. 이용자 정의 사례 | 21 제 4 장 디지털장서의 수집대상과 범위 분석 1. 디지털 포맷의 유형 | 23 2. 디지털 매체의 식별 | 29 3. 디지털 매체 유형 선정 기준 | 30 4. NDL의 디지털 매체 선정 모형 및 수집 범주 선택 지침 | 36 5. 디지털 컬렉션 구축방향 | 43
  3. 3. 제3권 디지털 장서 관리 및 연구 개발목 차 제 2 부 NDL 장서관리시스템 개발 지침 및 기능 표준화 제 3 부 표준 메타데이터 모델 및 Semantic Language 연구 개발 1 제 장 장서관리 원칙 1. 디지털 장서 | 90 1 제 장 서론 | 148 2. 국립디지털도서관의 장서관리 원칙 | 93 3. 국립디지털도서관 장서관리시스템의 기능 | 97 제 2 장 표준 메타데이터 모델 및 적용 제 2 장 장서수집기 1. FRBR 모델 | 152 2. KORMARC의 FRBR 변환 | 157 1. 개요 | 102 2. 장서수집기의 역할과 기능 | 106 제 3 장 시맨틱 온톨로지 언어 1. 온톨로지 언어 장단점 비교 | 179 제 3 장 장서등록기 1. 개요 | 112 제 4 장 국립중앙도서관FRBR모델기반온톨로지설계 2. 장서등록기의 역할과 기능 | 114 1. 국립중앙도서관 KORMARC의 FRBR모델 기반 온톨로지 설계 | 188 2. 국립중앙도서관 FRBR모델 기반 프로토타입 구현 | 200 제 4 장 콘텐트관리기 1. 개요 | 116 제 5 장 국립중앙도서관의 시맨틱 DL 서비스 2. 콘텐트관리기의 역할과 기능 | 121 1. 시맨틱 DL 구성요소 | 222 2. 시맨틱 DL 기반 국립중앙도서관 서비스 제안 | 224 제 5 장 표준화와 요소기술 1. 국립디지털도서관 장서관리시스템 표준화 | 126 제 6 장 결론 | 228 2. 표준화 및 요소기술 명세 | 129
  4. 4. 제3권 디지털 장서 관리 및 연구 개발표 목차 [표 Ⅵ-3] 미국의회도서관의 디지털장서개발정책 구성 | 67 제 1부 장서개발정책 기본모형 연구·개발 및 수립 [표 Ⅵ-4] 호주국가도서관의 디지털장서개발정책 구성 | 67 [표 Ⅵ-5] 미국국립의학도서관의 디지털장서개발정책 구성 | 68 [표 Ⅱ-1] 장서개발정책 사례 | 19 [표 Ⅵ-6] 미국국립농학도서관의 디지털장서개발정책 구성 | 68 [표 Ⅲ-1] KORMARC과 MARC21에서의 이용자 정의 | 20 [표 Ⅵ-7] 인터넷공공도서관의 장서개발정책 구성 | 69 [표 Ⅲ-2] 이용자정의 사례 | 21 [표 Ⅵ-8] Demas의 인터넷 자원에 대한 장서개발정책 요소 | 70 [표 Ⅳ-1] 디지털 매체 유형 구분 사례 | 24 [표 Ⅵ-9] White & Crawford의 전자자원 선정 시 고려사항 | 71 [표 Ⅳ-2] 문서 유형별 선정 특성 분석 | 38 [표 Ⅵ-10] Johnson의 전자자원 선정 시 고려사항 | 72 [표 Ⅳ-3] 문서 유형별 적정 포맷 | 38 [표 Ⅵ-11] Pitschmann의 전자자원 선정 시 고려사항 | 73 [표 Ⅳ-4] 그림 유형별 선정 특성 분석 | 39 [표 Ⅵ-12] 구성요소 종합 | 74 [표 Ⅳ-5] 그림 유형별 적정 포맷 | 40 [표 Ⅵ-13] 구성요소 중요도 | 75 [표 Ⅵ-14] NDL 컨스펙터스(안) | 85 [표 Ⅳ-6] 음성 유형별 선정 특성 분석 | 40 [표 Ⅳ-7] 음성 유형별 적정 포맷 | 41 [표 Ⅳ-8] 동영상 유형별 선정 특성 분석 | 42 제 2부 NDL 장서관리시스템 개발 지침 및 기능 표준화 [표 Ⅳ-9] 동영상 유형별 적정 포맷 | 43 [표 Ⅱ-1] 디지털 장서의 유형 구분 | 91 [표 Ⅳ-10] 세계 주요 국가 도서관의 전자자원 범위 | 44 [표 Ⅱ-2] 국립디지털도서관 장서관리시스템의 기능 구성도 (V 1.0) | 97 [표 Ⅴ-1] 컨스펙터스 구성요소 | 49 [표 Ⅱ-3] 전자자원 선정 시의 고려사항 | 103 [표 Ⅴ-2] RLG 컨스펙터스 장서수준기호 | 50 [표 Ⅱ-4] 장서수집 업무 구성 | 104 [표 Ⅴ-3] WLN 컨스펙터스 장서수준기호 | 52 [표 Ⅱ-5] 국립디지털도서관 장서관리시스템의 주요 표준화 및 요소기술 | 129 [표 Ⅴ-4] PNWCP 컨스펙터스 장서수준기호 | 53 [표 Ⅴ-5] 컨스펙터스 장서수준기호 | 53 제 3부 표준 메타데이터 모델 및 Semantic [표 Ⅴ-6] 수정된 컨스펙터스 장서수준기호 #1 | 56 Language 연구 개발 [표 Ⅴ-7] 수정된 컨스펙터스 장서수준기호 #2 | 58 [표 Ⅴ-8] SunSITE 전자자원 유지수준 | 60 [표 Ⅱ-1] 메타데이터 요소 간 매핑 | 162 [표 Ⅴ-9] 장서수준 | 60 [표 Ⅱ-2] FRBR 모델의 속성(Attribute)과 KORMARC의 매핑 | 174 [표 Ⅴ-10] 유지수준 | 61 [표 Ⅳ-1] 토픽타입의 정의 | 190 [표 Ⅴ-11] 장서수준과 유지수준 통합 Matrix | 61 [표 Ⅳ-2] KORMARC 메타데이터 요소에서 추출한 어커런스 타입 | 191 [표 Ⅳ-3] 토픽 타입별 어커런스 정의 | 191 [표 Ⅴ-12] NDL 컨스펙터스 (안) | 62 [표 Ⅳ-4] 토픽간 상호연관성 정의 | 195 [표 Ⅵ-1] 구성요소 도출 대상 | 65 [표 Ⅵ-2] ALA의 디지털 장서개발정책 핵심요소와 기준 | 66
  5. 5. 제3권 디지털 장서 관리 및 연구 개발그림 목차 제 1부 장서개발정책 기본모형 연구·개발 및 수립 제 3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 [그림 Ⅲ-1] 이용자 정의 | 20 [그림 Ⅳ-1] 디지털포맷의 유형 구분 | 23 [그림 II-1] KORMARC 변환 알고리즘 | 173 [그림 Ⅳ-2] 디지털포맷 선정 요인 도출 | 34 [그림 II-2] FRBR 모델개체(entity)에 따른 KORMARC요소 매핑 | 173 [그림 Ⅳ-3] NDL의 디지털매체 선정 모형 | 37 [그림 III-1] 토픽맵과 RDF의 연대기 | 180 [그림 Ⅴ-1] 컨스펙터스 적용 사례(안)-1 | 63 [그림 III-2] 토픽맵 규격 군과 RDF 규격 군 | 182 [그림 Ⅴ-2] 컨스펙터스 적용 사례(안)-2 | 63 [그림 IV-1] 토픽타입의 구성 | 189 [그림 IV-2] FRBR모델 개체간의 관계 | 192 [그림 IV-3] 온톨로지 요소의 관계 정의도 | 193 [그림 IV-4] KORMARC 의 토픽맵 온톨로지 디자인 | 196 [그림 IV-5] 온토폴리 토픽타입 구성의 예 | 197 [그림 IV-6] 온토폴리 연계타입의 구성 예 | 199 제 2부 NDL 장서관리시스템 개발 지침 및 기능 표준화 [그림 IV-7] Fiction Finder의 FRBR모델 구현 사례 | 201 [그림 IV-8] 프로토타입 구축 과정 및 구조 | 206 [그림 Ⅱ-1] 장서 수집기 구성도 | 102 [그림 IV-9] XSL 변환 문서 | 207 [그림 Ⅱ-2] 전자자원의 생명주기 | 103 [그림 IV-10] OCLC FictionFinder의 프로토타입 시작 화면 | 208 [그림 Ⅱ-3] 장서수집기 업무 흐름도 | 105 [그림 IV-11] 국립중앙도서관의 프로토타입 메인화면 | 208 [그림 Ⅱ-4] 제작 업무 흐름도 | 106 [그림 IV-12] 문학작품의 화면 예시 | 209 [그림 Ⅱ-5] 구입/구독/재구독 업무 흐름도 | 108 [그림 IV-13] 저자의 화면 예시 | 210 [그림 Ⅱ-6] 협력 업무 흐름도 | 109 [그림 IV-14] 프로토타입 상세화면 예시 | 211 [그림 Ⅱ-7] 납본 업무프로세스 | 111 [그림 IV-15] 국립중앙도서관 한국 현대소설 검색결과 화면 | 213 [그림 Ⅳ-8] 디지털 콘텐트의 수명주기 | 120 [그림 IV-16] 국립중앙도서관“안도현”저자 검색결과 | 214 [그림 Ⅴ-1] 국립디지털도서관 장서관리시스템의 구성도 | 127 [그림 IV-17] 프로토타입의“안도현”검색 결과 | 215 [그림 IV-18] 프로토타입 장르별 서비스 예시 | 216
  6. 6. 총서 제 3권의 내용은 각 연구결과물에 대한 축약본입니다. 3개 연구결과물의 내용 중 아래 부분은 본 축약본에 배제하였습니다. 제 1부 장서개발정책 기본모형 연구·개발 및 수립 Ⅱ. 디지털장서개발정책 개발 사례 - 국내외 디지털장서개발정책 개발 사례 Ⅲ. 이용자 커뮤니티 정의 - 이용자 정의 사례 <부록 1> 디지털장서의 수집대상 규정 사례 <부록 2> 주요 디지털 포맷 관계 기술 제 2부 NDL 장서관리시스템 개발 지침 및 기능 표준화 Ⅵ. 사례연구 - 장서수집기 사례연구 - 장서등록기 사례연구 - 콘텐트관리기 사례연구 <메타데이터 적용지침> - 국립디지털도서관 메타데이터 원칙 - 국립디지털도서관 장서 메타데이터 적용지침 - 국립디지털도서관 콘텐트 메타데이터 적용지침 제 3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 Ⅲ. 시맨틱 온톨로지 언어 - RDF/OWL - Topic Map10 제1부 장서개발정책 기본모형 연구·개발 및 수립
  7. 7. 디브러리 포털사이트 모형개발 디지털장서 관리 및 연구개발 총서 발간사 국립디지털도서관은 시대적 흐름에 발맞춰 디지털 정보자원 이러한 국립디지털도서관 건립을 성공적으로 추진하기 위하여 2007년도“국립디지털도서관 의 수집 · 정리 · 보존 및 이용에 대한 새로운 도서관 혁신모 운영 시범사업” 수행하였으며, 도서관 학계와 업계, 도서관 실무진 등 유수의 인력들이 참가하 을 델로서 국내외 디지털정보서비스 게이트웨이 역할을 수행하려 고 수차례의 자문을 거쳐 수행 결과를 도출하였습니다. 고 합니다. 본 총서에는 2007년 수행결과를 5권(디브러리 포털사이트 모형개발, 이용자 시나리오 연구개 국립디지털도서관은 언제 어디서 누구나 디지털정보에 쉽게 발, 디지털장서 관리 및 연구개발, 디브러리 이용자서비스 공간구축, 정보소외계층 서비스)으로 접근하고 쌍방향 참여로 원하는 디지털정보를 이용할 수 있는 편찬하였습니다. 디브러리 총서는 2007년도 결과물 발간을 시작으로 계속적인 연구결과를 편찬 전문 지식포털 디브러리를 준비하고 있습니다. 할 것이며, 도서관 학계 및 현장에 배포하여 디지털도서관을 선도하는 모범적인 모델이 될 것으 로 기대합니다. 또한 최첨단 시설로 정보 열람과 활용에 새로운 혁신을 더해 주며, 자연과 사람 그리고 정보를 접목한 친환경 도서관을 짓 2009년 개관될 국립디지털도서관은 새로운 정보서비스의 혁신과 창조적인 지식 생산으로 대 고 있습니다. 민국을 지력강국(知力强國)으로 거듭나게 하기위한 도약점이 되도록 노력하겠습니다. 권 경 상12 총서 발간사 13
  8. 8. 제1부장서개발정책 기본모형 연구·개발 및 수립 1. 서론 2. 디지털장서개발정책 개발 사례 3. 이용자 커뮤니티 정 4. 디지털장서의 수집대상과 범위 분석 5. 장서수집 수준 정의 6. 디지털장서개발정책 구성요소
  9. 9. 디지털장서 관리 및 연구 개발 제1장 서론 준’등을 바탕으로 하고 있으며 일관된 장서개발정책이 미비하여 장서개발 업무의 효율성과 안정 성을 충분히 확보하지 못하고 있다. 이러한 상황에서 NDL은 개관을 앞두고 있으며, 이에 따라 기존 국립중앙도서관의 장서개발정 책과는 별도로 독립적인‘NDL 장서개발정책’ 입안, 제도화하고 적용하고 이를 각급 디지털도 을 서관에 확대하기 위한 기초연구의 수행이 필요하게 되었다. 2. 연구의 내용 ● 국내외의 전자자원개발정책 사례들을 조사·분석하여 NDL에 적합한 독립형 장서개발정책 1. 연구의 배경 및 목적 의 설정을 제안한다. ● NDL이 수집 대상으로 하는 정보자원의 유형과 범위, 수집의 우선순위를 제시하고, 구입 수 장서개발정책(Collection Development Policy: CDP)은 도서관 및 정보센터에 있어서의 장서 준, 라이선스, 벤더 등에 관한 내용, 그리고 컨소시엄 관련 사항에 대한 원칙을 수립할 수 있 개발의 특징과 범주, 우선순위 등을 규정하는 장서관리 업무의 마스터플랜이다. CDP를 통하여 는 여지를 제공한다. 도서관 및 정보센터는 현재 구성되어 있는 장서의 특성과 강점 및 약점을 파악하고, 장서구성 ● 현재 국립중앙도서관의 장서개발은 일반적 지침 이외의 도구가 미비하여 컨스펙터스 (Collection Building)의 우선순위를 정하며, 예산분배(Allocation)의 정통성과 효율을 기하고, (Conspectus)와 같이 주제분야에 대한 설명과 수집단계를 제시하는 도구가 없으므로, 기존 도서관간의 협력을 진작하며, 도서관 조직 내부와 도서관 외부 커뮤니티 사이의 커뮤니케이션을 의 5단계로 구분하는 컨스펙터스의 Collection Magnitude를 NDL에 맞게 전개하여 NDL 원활히 하고, 지적 자유 보호와 검열(Censorship) 등에 관한 도서관의 입장을 천명한다. 에 적합한 수정된 컨스펙터스 모델을 제시한다. 이러한 맥락에서 볼 때 국립디지털도서관(National Digital Library, 이하 NDL)은 CDP를 통 ● 국가적 디지털 정보자원 개발의 체계적 수행을 위한 필수요소들을 도출하고 NDL CDP의 하여 수집대상 장서의 범위, 수집의 우선순위 및 구입 수준(magnitude) 등에 대한 명확한 원칙 기본모형을 제안한다. 을 설정하여야 한다. 본 연구에서는 이러한 NDL 장서개발정책 수립의 전단계로서 NDL 장서개 발정책의 기본모형을 연구하여, 국가적 디지털장서개발정책의 필수 요소들을 도출하고 향후 NDL 장서개발정책의 일반적 지침을 정립하고자 한다. 세계 주요국의 국가도서관들은 오랜 세월동안 종합적이고 체계화된 장서개발정책에 입각하여 국가차원의 장서개발 활동을 강화하고 있다. 국가도서관뿐만 아니라 각급의 연구도서관과 공공 도서관들이 장서개발정책을 수립하고 이를 인터넷 홈페이지 등을 통하여 공개하고 있는 것이다. 특히, 최근에는 디지털 자원의 급속한 증가에 따라 전자자원에 대한 장서개발정책의 필요성이 대 두되면서 기존의 인쇄형 장서개발정책에 전자자원개발정책을 통합하여 운영하거나 혹은 별도의 독립된 전자자원(장서)개발정책을 수립하여 운영하는 것이 일반적이다. 반면, 현재 국립중앙도서관의 장서개발은 납본관련 법제와‘자료수집원칙’ ,‘구입자료선정기16 제1부 장서개발정책 기본모형 연구·개발 및 수립 제1장 서론 17
  10. 10. 디지털장서 관리 및 연구 개발 제2장 디지털장서개발정책개발사례 ● 소프트웨어 설명서와 기타 기술적 지원 산업 표준에 대한 충족 설명서와 기타 기술적 지원 ● 비용: 소프트웨어, 하드웨어, 유지보수 계약에 대한 자금은 어디서 나오는가? 누가 편성 및 조정하는가? ● 직원: 부서별/기관별/컨소시엄 책임은 어떻게 구분하는가? 2. 국내외 디지털장서개발정책 개발 사례 1. 장서개발정책 가이드라인 구 분 특 징 디지털 컬렉션별 장서개발정책 제시 The British Library 납본에 의한 디지털자원관리정책 별도 설정 미국도서관협회(American Library Association: ALA)는 산하의 RUSA (Reference and 디지털화(digitisation)에 관한 별도정책 제시 User Services Association)1)을 통하여 전자자원개발정책 수립을 위한 핵심 요소(Core 별도 전자자원개발정책 제시 Elements of Electronic Resource Collection Policies)를 제시하고 있으며, 그 골자는 아래와 - 소개 : 수집범주에 대한 소개 같다.2) - 정의 : Electronic resources / Acquire / Collect / Link / Archive에 대한 용어 정의 Library of Congress - 일반적 가이드라인 : 전자자원 수집기준 명시 - 구체적인 가이드라인 : 전자자원 선정시 고려사항 명시 ● 용어 정의 디지털화를 통한 보존(preservation reformatting) 정책 별도 제시 ● 정책 개정에 대한 일정 별도 전자자원개발정책 제시 ● 전반적인 도서관 정책과의 관계 - 정의 : 물리적 포맷 전자자원 / 온라인 자원 / 디지털화한 자원에 대한 용어 정의 National Library of Australia - 수집 : 물리적 포맷 전자자원 / 온라인 자원 / 디지털화한 자원 / 전자자원의 보존에 대한 수 ● 인쇄 자원과 기타 전자 자원과의 관계: 현재 자원을 대체하거나 보강하는 것 집기준 및 고려사항 명시 ● 선정 디지털 보존정책 별도 제시 서비스 대상이 되는 이용자 National Science Digital Science, Technology, Engineering, Mathematics 별로 디지털장서 구축 누가 소프트웨어를 선정하고 제적하는가?; 누가 하드웨어를 선정하는가?; 누가 전체적인 Library 미션, 장서소개, 주제범위, 대상 이용자집단, 선정기준 등의 서술식 제시 책임을 지는가? 별도 전자자원개발정책 제시 ● 정보의 기준 - 정의 : Electronic resources / Bibliographic files / Full text, numeric, graphic files / National Library of Instructional or modeling software / Applications software에 대한 용어 정의 범위 Medicine - 선정절차에 있어서 고려사항, 책임사항, 벤더, 라이선스 등 선정시 고려사항 명시 정확함/최신성 - 이행 : 전자자원에 대한 접근과 복본, 폐기와 유지 등 정책을 이행하는 것과 관련한 사항 명시 ● 하드웨어 고려사항 컬렉션 구분 별 정책 산업 표준에 대한 충족 - 선정을 위한 구체적인 원칙 : 내용, 기능, 저작권 등 명시 Internet Public Library - 링크점검 : 링크점검을 위한 방법 명시 1) ALA는 RUSA의 장서개발 및 평가섹션(CODES: Collection Development and Evaluation Section)에서 장서개발정책에 대하 - 이용자의 제안 : 새로운 사이트를 추가하는데 있어서 이용자의 제안을 평가하는 방법과 제 여 다루고 있다. 안 방법 명시 2) Core Elements of Electronic Resource Collection Policies: http://www.ala.org/ala/rusa/rusaourassoc/rusasections/codes/codessection/codescomm/colldevpolicies/coreele- [표 II-1] 장서개발정책 사례 ments/core.htm18 제1부 장서개발정책 기본모형 연구·개발 및 수립 제2장 디지털장서 개발정책 개발 사례 19
  11. 11. 디지털장서 관리 및 연구 개발 제3장 이용자커뮤니티정의 2. 이용자 정의 사례 사 례 내 용 어린이, 가족 / 사서 / 출판업자 / 연구자 / 교사 / 방문객으로 구분 Library of Congress 1. 이용자 정의 NDL 이용자 대한민국 국민 어린이/청소년 작업별 이용자그룹 분화 어린이와 청소년을 위한 KidsSpace와 TeenSpace 제공 성인 노인 한국표준직업분류 기준 [그림 III-1] 이용자 정의 ● 한국표준직업분류 - 통계청 고시 제2000-2호 Internet Public Library 총 11개의 대분류, 46개의 중분류, 162개의 소분류, 447개의 세분류, 1,404개의 세세분류로 구 성되어 있음 ● KORMARC과 MARC21에서의 이용자 정의 KORMARC MARC21 22 이용대상자 수준 22 - Target audience [표 III-2] 이용자정의 사례 b 일반이용자용 # - Unknown or not specified a 취학전 아동 a - Preschool b 초등학생 b - Primary c 중학생 c - Pre-adolescent d 고등학생 d - Adolescent e 성인용 e - Adult f 특수계층 f - Specialized j 아동용 g - General z 미상 또는 세분하지 않는 경우 j - Juvenile | 부호화하지 않음 | - No attempt to code [표 III-1] KORMARC과 MARC21에서의 이용자 정의20 제1부 장서개발정책 기본모형 연구·개발 및 수립 제3장 이용자 커뮤니티 정의 21
  12. 12. 디지털장서 관리 및 연구 개발 제4장 장서의수집대상과범위분석 기 위한 제일의 수단이 됨에 따라 정보의 포괄성과 신뢰성(integration and trust)이 디지털 장 서 개발의 중요한 기준으로 떠오르게 되었다. 이는 웹 표준과 기술은 이제 이종 정보의 광범위한 통합을 지원하며, 이용자들의 원스톱 정보 이용 요구가 급증하고 있기 때문이며, 동시에 수많은 가용 정보량은 이용자로 하여금 신뢰할 수 있는 정보를 찾기 어렵게 만들기 때문이다. 이에 따라 세계 주요국의 도서관들은 디지털자원의 수집범주를 아래에 예시한 바와 같이 제시 하고 있다. 1. 디지털 포맷의 유형 도서관의 수집 대상이 되는 자료의 범위를 검토하기 위해서 여러 가지 기준을 설정할 수 있다. 가. 디지털 포맷의 기본 유형 예컨대, 자료의 유형, 주제 분야, 발간 매체 형식, 사용 언어, 발행 국가 등이 이러한 기준을 구성 하는 요소가 될 것이다. 또한 이러한 요소들은 급속하게 변화하는 전자 환경을 반영하여야 하는 디지털 포맷은 콘텐트 스트림(Content Stream: Physical Medium- independent)과 물리적 데, 예를 들어 발간 매체의 경우 과거 도서관이 종이매체를 중심으로 자원을 개발하던 시기에는 매체(Physical Media: Physical Medium-dependent)로 구분할 수 있다. Content Stream은 종이매체를 기본으로 설정하고 기타 매체 유형을 고려하였으나, 최근 컴퓨터 및 인터넷 기술의 Physical Media와 독립적으로 나타내어 질 수 있는 포맷인 반면, Physical Media는 어떤 물리 발달로 발간 매체가 급속히 전자화됨과 동시에 복합매체(multi-media)화됨에 따라 점차 CDP의 적 저장 구조상에서 감지되는 형태로 나타나는 콘텐트 스트림을 위한 것이다. Content Stream 구성요소로서 중요성이 약해지고 있다. 또한 구독 및 입수를 위한 도입 가격 체계의 경우, 정보자 은 매체 유형에 따라서 문자(논리, 수치), 영상, 음성, 기타 등으로 나누어지고, 물리적 매체는 저 원의 가격 상승이 소비자물가지수(CPI)를 훨씬 능가하고 구입/구독조건 또한 점차 복잡한 양상을 장 기술에 따라서 자기 방식과 광학 방식으로 나누어진다.5) 3) 띠게 됨에 따라 CDP에서 전략적인 고려사항 등을 명문화해야 할 필요성도 대두되고 있다. Digital format 약 30년 전에 음성 카세트테이프가 등장한 이래 비디오 카세트, CD-ROM, DVD, 플레이스테 이션 게임 등의 연이은 등장은 도서관의 장서개발의 문제를 복잡하게 만들었다. 정보검색 부문에 Content stream Physical media 서는 온라인 데이터베이스 및 인터넷의 등장으로 다양한 유형의 정보 매체가 속속 등장하고 있기 Text Magnetic 도 하다. Still image Optical NDL은 국가 단위의 디지털 정보 유통기관으로서 모든 디지털 매체의 수집의 주체가 되어야 하 는 입장에 있다. 따라서, 각 정보의 유형에 따라 적절한 디지털 매체 유형(digital format)을 선택 Sound 하여야만 한다. 이와 관련하여 미국의 NISO(National Information Standard Organization) Moving image 는 우수한 디지털 장서(good digital collection)의 기준으로 사용성, 접근성, 예상되는 이용자 그 Others 룹에 대한 이용 적합성 등을 제시하고 있다.4) [그림 Ⅳ-1] 디지털 포맷의 유형 구분 디지털 장서개발에서 이제는 단지 친숙한 이용자에게 정보를 효과적으로 서비스하는 것만으로 3) 2004 Information Format Trends. OCLC Library & Information Center Report 는 불충분하게 되었다. 디지털 환경 자체가 성숙한 결과 절대 다수의 국민들에게 정보를 보급하 http://www5.oclc.org/downloads/community/2004infotrends_content.pdf 4) NISO, A Framework of Guidance for Building Good Digital Collection, 2nd Ed., Marylanf, USA, 2004. 5) Stephen L. Abrams. 2005. Establishing a Global Digital Format Registry, Library trends, 54(1), pp. 125-143.22 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 23
  13. 13. 디지털장서 관리 및 연구 개발 이중에서 content stream 유형의 디지털 매체는 [그림 Ⅳ-1]처럼 다양하게 구분될 수 있으나, Language)과 전자책을 위한 OEBPS(Open eBook Forum Publication Structure)이 있고, 기 문자(text), 음성(audio), 그림(still image), 동영상(moving image), 복합 매체(hyper media), 타 DTB(Digital Talking Book), NCBIArch(NCBI/NLM Journal Archiving and 기타 유형(software, database, CAD file 등) 등으로 구분하는 것이 일반적이다. 각 유형들은 뷰 Interchange DTD), NITF(News Industry Text Format) 등이 있다. 어(viewer) 또는 재생기(player)에 따라서 다양한 파일 포맷(file format)으로 세분화 되고 최신 PDF는 원래 Postscript에 기초해서 그것을 다양한 컴퓨터와 프린터로 프린트할 수 있게 하기 화된다. 이러한 세분화된 포맷은 기술의 발달과 함께 새로운 포맷이 등장하고 있어서 지속적으로 위해 만들어진 것으로서 종이 문서와 같은 느낌과 외관을 갖는다. 이중 PDF/A는 장기 보존을 위 관찰하고 그에 따른 수집 정책을 수립하여야 할 것이다. 해서 ISO에서 표준화 한 유형이다. XML은 각 항목의 의미의 마크업과 정보의 표현을 모두 수용 본 장에서는 디지털 매체 중 문서, 그림, 음성, 동영상 등의 content stream 유형을 중심으로 할 수 있는 태그를 포함하는 포맷으로 상호운용성 면에서 가장 유리하다. 살펴보았다. DTB: Digital Talking Book OEBPS: Open eBook Forum Publication Structure 분야 DCMI1) Type Vocabulary MIME2) Media Types GDFR3) format category 국가지식 포털4) NCBIArch: NCBI/NLM Journal Archiving and Interchange DTD Collection Dataset application Logical 원문(full-text) NITF: News Industry Text Format Event audio Numerical 메타데이터(text) Image example Text 이미지(image) PDF: Portable Document Format InteractiveResource image Image(still) 녹음자료(audio) XML: Extensible Markup Language MovingImage message Image(motion) 동영상(video) 매체 PhysicalObject model Audio 멀티미디어(multipart) 다. 그림(still image) 유형 구분 Service multipart 소프트웨어(application) Software text 기타 그림 유형의 파일 포맷에는 픽셀에 기반한 것으로 JPEG(Joint Photographic Experts Sound video Still Image Group), TIFF(Tagged Image File Format), GIF(Graphics Interchange Format), Text PNG(Portable Network Graphics) 등이 대표적이며, 벡터 방식으로는 SVG(Scalable Vector Graphics)가 있다. 1) DCMI: Dublin Core Metadta Initiative JPEG은 모든 디지털 카메라에서 지원하는 포맷으로 손실(lossy) 압축 알고리즘을 채택하기 때 2) MIME: Multipurpose Internet Mail Extensions 3) GDFR: Global Digital Format Registry 문에 비교적 작은 파일 크기를 갖는다6). 그래서 PDF에서는 JPEG이 이미지 압축 알고리즘으로 4) 국가지식포털 (http://www.knowledge.go.kr/) 사용되고 있다. TIFF는 LZW라는 손실없는(lossless) 압축 알고리즘을 채택하기 때문에 비교적 [표 Ⅳ-1] 디지털 매체 유형 구분 사례 큰 파일 크기를 갖는다. 그래서 웹브라우저에서는 TIFF를 지원하지 않는다. GIF는 256 색으로 한정되어서 적은 색의 그림 파일에 적합하다. GIF는 애니메이션을 지원하기 때문에 이미지를 이 나. 문자(text) 유형 용한 애니메이션 효과를 내는 데 널리 활용된다. PNG는 GIF의 후속으로 나온 최신의 오픈 소스 파일 포맷으로 GIF와는 달리 트루 컬러(true color)를 지원하며, Internet Explorer 7부터 지원 문자 유형은 도서관을 위한 가장 보편적인 디지털 매체로서 PDF(Portable Document 이 된다. 벡터 방식인 SGV는 스크립팅이라는 장점을 이용해서 상호작용 웹(interactive web)에 Format)가 가장 대표적이라고 할 수 있다. 그 외에 마크업 문서인 XML(Extensible Markup 6) http://en.wikipedia.org/wiki/Image_file_formats24 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 25
  14. 14. 디지털장서 관리 및 연구 개발 중요한 요소로 사용된다. AC-3_A, AC-3 Compressed Audio (Dolby Digital), Revision A AES3, Digital Audio Interface Format BIIF, Basic Image Interchange Format AIFF, Audio Interchange File Format CAM_RAW, Camera Raw Formats (Group Description) A-Law, A-Law Compressed Sound Format CPC, Cartesian Perceptual Compression Encoding (CPC) AMR, Adaptive Multi-Rate Speech Codec DNG_1_1, Adobe Digital Negative (DNG), Version 1.1 ASF, ASF (Advanced Systems Format) GIF_89a, Graphics Interchange Format, Version 89a AudCom, Audible.Com File Format ITU_G4, ITU-T Group 4 FAX Compression DLS, Downloadable Sounds Format JFIF, JPEG File Interchange Format DSD, One-bit Delta Sigma Audio Encoding J2K_C, JPEG 2000 Part 1, Core Coding System DTS, Digital Theater Systems Audio Formats JP2_FF, JPEG 2000 Part 1 (Core) jp2 File Format FLAC_1_1_2, FLAC (Free Lossless Audio Codec), Version 1.1.2 JP2_J2K_C_LL, JP2 File Format with JPEG 2000 Core Coding, Lossless ID3, ID3 Metadata for MP3 MrSID, MrSID Image Format IFF,Electronic Arts Interchange File Format 1985 PNG, Portable Network Graphics LPCM, Linear Pulse Code Modulated Audio SPIFF, Still Picture Interchange Format MIDI_SD, MIDI Sequence Data SVG, Scalable Vector Graphics MODS, Module Music Format (Mods) TGA, Truevision TGA, version MP3 TIFF, Revision 6.0 and earlier μ -Law, μ -Law (Mu-Law) Compressed Sound Format WMP, Windows Media Photo Ogg, Ogg File Format PCM, Pulse Code Modulated Audio 라. 음성(audio) 유형 Quicktime RealAudio 음성 저장 매체는 LP에서 카세트 테이프, DAT(digital audio tape), 음성 CD, 미니 디스크, 플 RMID, RIFF-based MIDI File Format 로피 디스크, 하드 디스크 등으로 변천해 왔다. 이중에서 디지털 매체에 저장되는 음성 포맷으로 SHN, Shorten Lossless Audio Format 는 MPEG 계열의 MP3(MPEG-1 Level 3) 파일이 현재 가장 보편적으로 활용되고 있고, 플러그 SMF, Standard MIDI File Format 인에 따라서 RealAudio와 MIDI, WAVE, QTA(QuickTime Audio), WMA(Windows Media Vorbis, Vorbis Audio Codec Audio) 등이 대표적이다. WAVE, WAVE Audio File Format WMA, Windows Media Audio AAC, Advanced Audio Coding XMF, eXtensible Music Format26 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 27
  15. 15. 디지털장서 관리 및 연구 개발 마. 동영상(moving image) 유형 RealVideo Sorenson, Sorenson Video Codec 동영상 저장 매체는 16밀리 필름에서 카세트형 비디오 테이프를 거쳐 음성 유형과 마찬가지로 SWF, Macromedia Flash SWF File Format CD, 미니 디스크, 하드 디스크 등으로 변천해 왔다. 이중에서 디지털 매체에 저장되는 동영상 포 WMV, Windows Media Video 맷으로는 MPEG 계열과, 플러그인에 따른 RealVideo, AVI, DivX, QT(QuickTime), WMV(Windows Media Video) 등이 대표적이다. 2. 디지털 매체의 식별 AAF, Advanced Authoring Format (AAF) 디지털 매체는 열러가지 유형이 있을 뿐만 아니라 같은 유형 내에서도 버전(version)이 다를 수 AC-3_A, AC-3 Compressed Audio (Dolby Digital), Revision A 있고, 특정한 목적을 위해서 일부 변형한 하부 유형(subtype)이 있을 수 있으며, 여러 개의 포맷 ASF, Advanced Systems Format 을 포괄(wrapper or bundle)하는 유형도 있다. 그래서 단지 매체 유형 이름만으로는 정확하게 AVI, Audio Video Interleaved 구분하기 어려운 경우도 있다. 그래서 미국의 NDIIPP(National Digital Information Cinepak, Cinepak Video Codec Infrastructure and Preservation Program)의 디지털 포맷 홈페이지7) 에서는 주변 포맷들 간 DCDM, Digital Cinema Initiative Distribution Master (DCDM) 의 관계를 표시하는 기술 형식으로 각 포맷을 기술하고 있다. 본 보고서에서는 <부록 2>에 주요 DivX, DivX Video Codec 포맷을 아래와 같은 형식으로 기술하여 놓았다. DPX_2, Digital Moving-Picture Exchange (DPX), Version 2.0 DTS, Digital Theater Systems Audio Formats <디지털 매체의 관계 기술 사례> DV, Digital Video Encoding (DV, DVCAM, DVCPRO) PDF/A: ISO 19005-1. Document management - Electronic document file format for SWF, Macromedia Flash SWF File Format long-term preservation - Part 1: Use of PDF Indeo, Indeo Video Codec - 설명 : PDF/A-1 is a constrained form of Adobe PDF version 1.4 intended to be suitable for long- J2K_C, JPEG 2000 Part 1, Core Coding term preservation of page-oriented documents for which PDF is already being used in MJP2_FF, Motion JPEG 2000 File Format practice. The ISO standard [ISO 19005-1:2005] was developed by a working group with representatives from government, industry, and academia and active support from Adobe MPEG-1, MPEG-1 Video Coding (H.261) Systems Incorporated. Part 2 of ISO 19005 will be a version of PDF/A based on a more MPEG-2, MPEG-2 Video Coding (H.262) recent version of PDF. - 상태 : A final-state format for delivery to end users and long-term preservation of the docu- MPEG-4_V, MPEG-4, Visual Coding (Part 2) (H.263) ment as disseminated to users. AAC, Advanced Audio Coding - 관계 : * Subtype of PDF MP4_FF, MPEG-4 File Format * Subtype of PDF_1_4 * Has subtype PDF/A-1a MP4_XMT, MPEG-4 eXtensible MPEG-4 Textual Format (XMT) * Has subtype PDF/A-1b MXF, Material Exchange Format (MXF) QuickTime 7) http://www.digitalpreservation.gov/formats/28 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 29
  16. 16. 디지털장서 관리 및 연구 개발 3. 디지털 매체의 유형 선정 기준 나. Library of Congress: 저장을 위한 디지털 포맷 선정 요인 매체 유형 선정 기준은 목적에 따라 달라질 수 있을 것이다. 이와 관련된 프로젝트가 세계 각국 미국의 의회 도서관(LC: Library of Congress)에서는 디지털 자원의 장기적 저장(archiving) 에서 이루어지고 있는데 여기서는 그 중 일부를 소개하고 NDL에서 어떻게 반영할 것인가에 대 을 위해서 디지털 포맷 관련 프레임워크와 전략을 수립하였다. 여기서는 디지털 포맷을 평가할 해서 생각해 보고자 한다. 때 고려해야 할 요인(factors)을 유지관리 요인(sustainability factor)과 품질 및 기능성 요인 (factors reflecting quality and functionality)로 구분하여 제시하고 있다.9) 가. NISO: 디지털 객체 선정 지침 1) 유지관리 요인 미국의 NISO에서는 지난 2004년 디지털 컬렉션 구축 지침 프레임워크 보고서를 발간하였다. 이 보고서에서 디지털 객체(digital object)란 하나의 파일(file) 또는 여러 개의 연결된 파일로 구 ● 공개 정도(disclosure): 이것은 기술적 완결성(integrity)을 검증할 수 있는 명세와 도구가 성되거나, 여러 개의 파일과 그것들을 묶는데 필요한 구조적 메타데이터로 구성된다고 보고 있 완비되었고 디지털 콘텐츠로의 접근 가능한 정도를 말한다. 즉, 정보가 어떻게 비트(bit)와 다. 이런 의미에서 객체는 도서관의 소장 품목(item)과 개념적으로 유사하다. 또한 디지털 객체는 바이트(byte)로 부호화 되었느냐를 이해할 수 있어야 한다는 것이다. 독점 포맷보다는 비독 컬렉션(collection)의 구성 요소가 된다.8) 점의 공개 표준이 더 문서화가 잘 되어 있고 검증 도구가 더 잘 지원되는 것이 일반적이다. 디지털 객체는 소장을 위한 원본(master copy)과 이용을 위한 임시적 복사본으로 구분하여 관 ● 채택 정도(adoption): 이것은 그 포맷이 정보원의 일차 생산자, 보급자 또는 이용자에 의해 리하기도 한다. 예컨대, 그림 파일 원본은 압축이 없는 TIFF 포맷으로 이용을 위한 것은 압축 방 서 이미 이용되고 있는 정도를 말한다. 어떤 포맷이 널리 이용된다는 것은 그만큼 폐기될 가 식의 JPEG 포맷으로 관리함으로써 웹 이용자들이 빠른 시간에 다운로드할 수 있도록 할 수 있다. 능성이 낮고 에뮬레이션 도구를 쉽게 얻을 수 있다는 것을 의미한다. ● 투명성(transparency): 이것은 디지털 표현이 문자 에디터를 이용하여 사람이 읽을 수 있는 ● 디지털 객체는 상호호환성(interoperability)과 재사용성(reusability)을 유지하기 위한 설 것을 포함해서 기본도구로 직접 분석할 수 있도록 공개된 정도를 말한다. 중요한 정보가 쉬 명이 잘 되어 있어야 한다. 우면서도 직접적으로 표현되어 있는 디지털 포맷이 아무래도 새 포맷으로의 변환이 쉬울 것 ● 디지털 객체는 오랜 시간이 지나도 지속적(persistent)으로 사용할 수 있어야 한다. 이다. 음성, 동영상, 그림 등과 같은 많은 포맷들이 압축되어 있거나 암호화 되어 있는데, 이 ● 디지털 객체는 플랫폼에 대하여 독립적이어야 하고, 어떤 환경에서도 접근이 가능해야 경우는 널리 사용되고 공개되어 있으며 손실 없는(lossless) 형식의 경우는 무리가 없을 것 (broadly accessible) 한다. 이다. ● 디지털 객체는 지속적이고 유일한 식별자로 명명되어야 한다. ● 기록의 자체 보유(self-documentation): 해당 디지털 포맷을 설명하고 그것의 생성과 초기 ● 디지털 객체는 출처, 구조, 이력, 용도, 품질 등이 인증될 수 있어야 한다. 단계와 관련된 기술적 및 관리적 사항이 포함된 메타데이터가 매체 자체에 포함되어 있으면 ● 디지털 객체는 관련 메타데이터가 있어야 한다. 그렇지 않은 경우보다 더 유리할 것이다. OAIS(Open Archival Information System) 참 조 모델은 메타데이터에 포함되어야 할 몇 가지 사항을 제시하고 있다. 1) 표현(represen- tation): 데이터가 정보로서 사용될 수 있게 하는 표현 정보, 2) 참조(reference): 해당 콘텐 8) NISO Framework Advisory Group. 2004. A Framework of Guidance for Building Good Digital Collection. 2nd Ed. NISO. Maryland. USA. Available from: 9) Arms, C. R. and Fleischhauer, C. 2003. Digital Formats for Library of Congress Collections: Factors To Consider http://www.niso.org/framework/framework2.pdf When Choosing Digital Formats. Library of Congress. USA.30 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 31
  17. 17. 디지털장서 관리 및 연구 개발 트를 식별하고 설명할 수 있는 참조 정보, 3) 상황(context): 예를 들어 콘텐트 생성과 관련 - 음장(sound field): 다채널 음 지원 된 기록, 4) 불변성(fixity): 콘텐트 데이터의 완결성의 검사를 허락하는 불변성 정보, 5) 기 - 정상음 표현 범위를 넘는 기능성: 부호화 애니메이션, 프레임 정밀 편집, 추가 음 궤적) 원(provenance): 콘텐트가 생성된 이후의 변화 및 보관 이력 기록. ● 외부 의존성(external dependencies): 이것은 특정 포맷이 특정 하드웨어, 소프트웨어, 운 다. 덴마크 국립/왕립 도서관: 파일 포맷 평가 기준 영 시스템 등과 관련된 정도와 미래의 기술적 환경에서 그러한 의존성을 다루기 위해 예측 되는 복잡성을 말한다. 덴마크에서는 국립 도서관(The State Library)과 왕립 도서관(The Royal Library)이 공동 프 ● 기술적 보호 장치(technical protection mechanisms): 콘텐트에 암호화 되었거나, 패스워 로젝트를 수행하였으며, 그 일환으로 파일 포맷 관리 전략을 수립하였다10). 이 자료에서는 개방성 드를 걸었거나, 특허권 보호를 위한 이용 제한 등과 같은 기술적인 보호 장치가 없어야 미래 (openness), 이식성(portability), 품질(quality) 등의 세 부류의 기준을 제안하고 있다. 의 기술 환경에서도 쉽게 이용하게 될 것이다. 1) 개방성 2) 품질 및 기능성 요인 제품 정보가 공개되어 있을 것 특허나 저작권에 얽매이지 않을 것 품질 및 기능성 요인은 표현 장르와 형태에 따라 달라진다. 뷰어 소스가 무료일 것 뷰어 소스가 GPL 라이선스를 가질 것 ① 음성 녹음 자료 암호화 되지 않을 것 - 충실도(fidelity): 고음 해상도를 지원 - 음장(sound field): 다채널 음 지원 2) 이식성 - 정상음 표현 범위를 넘는 기능성: 주해에 의한 표현(예, MIDI) 하드웨어에 독립적일 것 ② 정지 영상 자료 운영 시스템에 독립적일 것 - 청명도(clarity): 화질의 고해상도를 지원 타 소프트웨어와 독립적일 것 - 색상 유지(color maintenance) 특정 기관, 단체 또는 사건과 독립적일 것 - 정상 그림 표현을 넘는 기능성: 벡터 그래픽스, 삼차원 모델 등 널리 이용되고 있을 것 ③ 문자 자료 내장 기능성이 최소일 것 - 문서 구조와 내비게이션의 완결성 버전이 하나이거나 잘 정의되어 있을 것 - 배치, 폰트, 디자인 특성 등의 완결성 - 수학, 화학식, 도식 등의 표현 완결성 3) 품질 ④ 동영상 자료 공간 비용이 적을 것 - 청명도(clarity): 화질의 고해상도를 지원 추가적 관리가 필요한 유관 포맷이 적을 것 - 충실도(fidelity): 고음 해상도를 지원 10) Clausen, L. R. 2004. Handling file formats. The State and University Library, Denmark.32 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 33
  18. 18. 디지털장서 관리 및 연구 개발 견실성 - 포맷의 기술적인 특성을 쉽게 이해할 수 있는 메타데이터를 가지고 있어야 한다. 단순성 검증이 많이 되어 있을 것 ● 독립성(independency) 손실이 없을 것 - 비독점적이어야 한다. 메타데이터가 지원될 것 - 암호화 되지 말아야 한다. - 압축되어 있지 말아야 한다. 라. NDL의 디지털 포맷 선정 기준 제안 - 지적재산권 제한이 없어야 한다. - 특정 하드웨어나 운영 시스템에 독립적이어야 한다. 앞의 3 기관의 사례를 분석·종합했을 때 NDL의 경우는 [그림 Ⅳ-2]와 같은 5가지 요인(설명 - 특정 소프트웨어에 독립적이어야 한다. 성, 독립성, 일관성, 범용성, 품질)을 가지고 디지털 포맷의 선정에 활용하는 것이 바람직할 것이 - 특정 기관 또는 사건과 무관해야 한다. 다. 5가지 선정 기준 가운데 마지막의 품질의 경우는 공통적 품질 기준과 매체별 품질 기준으로 나눌 수 있다. 품질 기준은 미국 의회도서관의 품질 기능성 요인을 그대로 활용한다. ● 일관성(consistency) - 기술이 변해도 계속해서 사용할 수 있어야 한다. NISO LC Denmark NDL - 버전관리가 잘 되어야 한다. Descriptive Descriptive Descriptive Descriptive - 포맷 이름이 변동되지 않고 유일 식별되어야 한다. Independency Independency Independency Independency ● 범용성(widely adopted) Consistency Consistency - 표준적인 매체여야 한다. Widely Widely Widely Widely - 널리 사용되고 있는 것이어야 한다. adopted adopted adopted adopted - 좋은 이용 사례가 있어야 한다. Quality Quality Quality ● 품질(quality) [그림 Ⅳ-2] 디지털 포맷 선정 요인 도출 - 공간 비용이 적어야 한다. - 추가적 관리가 필요한 유관 포맷이 적어야 한다. 1) 일반적 선정 요인 - 견실성 - 단순성 ● 설명성(descriptive) - 변환 시 손실이 없을 것 - 상호 호환과 재사용을 할 수 있도록 포맷의 생성, 이력, 용도 등과 관련된 문서가 마련되 - 매체별 품질 요인(별도 설명) 어 있어야 한다.34 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 35
  19. 19. 디지털장서 관리 및 연구 개발 2) 매체별 품질 선정 요인 <1st : quality and functionality factors> <2nd : sustainability factors> ● 문서 - 문서 구조와 내비게이션의 완결성 - 배치, 폰트, 디자인 특성 등의 완결성 - 수학, 화학식, 도식 등을 표현 완결성 ● 그림 - 해상도(clarity): 화질의 고해상도를 지원 - 색상 유지(color maintenance) - 정상 그림 표현을 넘는 기능성: 벡터 그래픽스, 삼차원 모델 등 ● 음성 [그림 Ⅳ-3] NDL의 디지털 매체 선정 모형 - 해상도(fidelity): 고음 해상도를 지원 - 음장(sound field): 다채널 음 지원 다음에서는 미국의 NDIIPP 프로젝트에서 디지털 매체별 선정 특성에 따라서 평가한 결과를 - 정상음 표현 범위를 넘는 기능성: 주해에 의한 표현(예, MIDI) 소개한다. 각 매체 내에서는 또 다시 문서 유형별로 특성이 달라지기 때문에 매우 복잡한 양상을 보이고 있다. ● 동영상 - 청명도(clarity): 화질의 고해상도를 지원 가. 문서 - 충실도(fidelity): 고음 해상도를 지원 - 음장(sound field): 다채널 음 지원 문서 유형의 디지털 매체에서 고려하여야 할 품질 및 기능성 요인으로는 1) 문서 구조와 내비게 - 정상음 표현 범위를 넘는 기능성: 부호화 애니메이션, 프레임 정밀 편집, 추가 음 궤적) 이션의 완결성, 2) 배치, 폰트, 디자인 특성 등의 완결성, 3) 수학, 화학식, 도식 등을 표현 완결성 등이 대표적으로 거론될 수 있다. [표 Ⅳ-2]와 [표 Ⅳ-3]에 이러한 기준을 따라서 각 유형에 맞는 선정 특성 분석과 적정 포맷을 예시하였다.11) 4. NDL의 디지털 매체 선정 모형 및 수집 범주 선택 지침 디지털 매체의 선정은 [그림 Ⅳ-3]과 같이 우선적으로 품질과 기능성 요인을 만족시킨 후에 유 지관리 요인을 반영하는 순서로 하여야 할 것이다. 왜냐하면 유지관리 요인에 대한 평가가 아무 리 좋다고 하여도 요구되는 품질이나 기능을 구비하지 못한다면 유용성이 떨어지기 때문이다. 11) http://www.digitalpreservation.gov/formats/content/text_curator.shtml36 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 37
  20. 20. 디지털장서 관리 및 연구 개발 유형 구분 유형 구분 색상 정상이상 보관 이용 보호 문서구조 배치 수식표현 해상도 의 순번 유형설명 예 순번 유형설명 예 유지 기능성 요구 요구 효과 문서 구조와 내비게이션을 중요시 해상도에 1 사전, 단행본, 보고서, 극본 등 ◎ △ × 미세 단순 하는 문서 1 고도의 예술적 그림 전문사진, 광고, 예술 작품 등 ◎ ○ 영향주지 표현 가공 말아야 함 2 단순 문서구조를 가지는 짧은 문서 기사, 수필, 연설문 등 ○ △ × 해상도에 미세 단순 2 공간 해상도를 중요시 하는 그림 지도, 그래프, 도형 등 ◎ 영향주지 표현 가공 말아야 함 브로셔, 포스터, 광고물, 어린이 3 배치와 디자인을 중요시 하는 문서 △ ◎ × 도서 등 해상도에 3 작품성이 낮은 그림 ○~△ 영향주지 말아야 함 비문자형 시각요소(수식, 도형 등) 4 학술논문, 연구보고서 등 ○ ○ ◎ 내의 정보 내용을 중요시 하는 문서 4 부수적 그림 또는 애니메이션 웹용 이미지 △ × (범례) ◎: 매우중요, ○: 중요, △: 보통, ×: 중요하지 않음 원본의 원본의 원본의 기능에 [표 Ⅳ-2] 문서 유형별 선정 특성 분석 특정 SW 5 벡터 그래픽스 CAD 도면 정밀도 기능성 기능성 영향주지 활용 유지 유지 유지 말아야 함 유형 구분 정적 삼차원 객체용 가상현실 선호 매체 유형 허용 매체 유형 6 순번 유형설명 묘사 XML+DTD HTML (범례) ◎: 매우중요, ○: 중요, △: 보통, ×: 중요하지 않음 1 문서 구조와 내비게이션을 중요시 하는 문서 SGML+DTD PDF [표 Ⅳ-4] 그림 유형별 선정 특성 분석 XML+DTD 2 단순 문서구조를 가지는 짧은 문서 SGML+DTD HTML 유형 구분 PDF 선호 매체 유형 허용 매체 유형 순번 유형설명 HTML XML+DTD+XSL 3 배치와 디자인을 중요시 하는 문서 비트맵, PDF 리치컬러, ·TIFF UNC(RGB, 24bit 이상) 비문자형 시각요소(수식, 도형 등) 내의 정보 내용을 중요시 PDF XML+DTD+수식표현기능 비압축 4 하는 문서 ·TIFF/EP 디지털 ·TIFF_UNC_EXIF 또는 TIFF ·TIFF LZW 맹인을 위한 말하는 책 XML+ANSI/NISO 카메라 5 1 고도의 예술적 그림 UNC(RGB, 24bit 이상) ·JP2_J2K_C_LL in JPX J2K Z39.86 ·JP2_J2K_C_LL in JP2 J2K ·TIFF/IT 6 이메일 내용 RFC 2822 인쇄 원본 ·PDF/X 7 일러스트레이션을 중요시 하는 문서 그림 유형 선정 기준 활용 ·TIFF_UNC 다광 데이터 [표 Ⅳ-3] 문서 유형별 적정 포맷 비트맵, 고품질 또는 ·JP2_J2K_C_LSY in 나. 그림 JPX_FF or JP2_FF 컬러, ·TIFF_UNC 인덱스된 공간 해상도를 중요시 하는 ·GIF 2 비압축 컬러 ·BMP 그림 벡터 ·PDF/A 그림 유형의 디지털 매체에서 고려하여야 할 품질 및 기능성 요인으로는 1) 해상도(화질의 고해 delivery ·PDF/X 상도를 지원), 2) 색상 유지, 3) 정상 그림 표현을 넘는 기능성(벡터 그래픽스, 삼차원 모델 등) 등 ·JP2_J2K_C_LSY in JPX_FF or JP2_FF 3 작품성이 낮은 그림 ·JPEG_DCT in JFIF 또는 JPEG_EXIF ·GIF 이 대표적으로 거론될 수 있다. [표 Ⅳ-4]와 [표 Ⅳ-5]에 이러한 기준을 따라서 각 유형에 맞는 ·GIF 선정 특성 분석과 적정 포맷을 예시하였다.12) 12) http://www.digitalpreservation.gov/formats/content/still_curator.shtml38 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 39
  21. 21. 디지털장서 관리 및 연구 개발 유형 구분 4 부수적 그림 또는 애니메이션 선호 매체 유형 허용 매체 유형 순번 유형설명 5 벡터 그래픽스 ·AAC_M4A 1 서라운드 음향 ·AAC_ADIF ·QTA_AAC 정적 삼차원 객체용 가상현실 ·WMA_WMA9_PRO 6 묘사 ·MP3+ID3 ·AAC_ADIF [표 Ⅳ-5] 그림 유형별 적정 포맷 ·WAVE_LPCM-BWF ·AAC_M4A 2 모노 또는 스테레오 음향 ·WAVE_LPCM ·QTA_AAC 다. 음성 ·AIFF-LPCM ·WMA_WMA9_PRO ·WMA_WMA9 ·MP3 음성 유형의 디지털 매체에서 고려하여야 할 품질 및 기능성 요인으로는 1) 해상도(고음 해상도 ·AAC_ADIF 를 지원), 2) 음장(다채널 음 지원), 3) 정상음 표현 범위를 넘는 기능성(악보에 의한 표현) 등이 대 3 보통의 음향 ·AAC_M4A ·QTA_AAC 표적으로 거론될 수 있다. [표 Ⅳ-6]과 [표 Ⅳ-7]에 이러한 기준을 따라서 각 유형에 맞는 선정 특 ·WMA_WMA9 4 부수적인 음향 모든 형식 가능 성 분석과 적정 포맷을 예시하였다.13) ·SMF 5 악보기반 표현 ·XMF ·MODS 유형 구분 정상이상 ·RMID 보관 이용 보호 해상도 음장 의 순번 유형설명 예 기능성 요구 요구 효과 6 음향 효과 해상도에 7 오디오북 ·DTB 최소변화 복수 단순 1 서라운드 음향 ◎ 영향주지 유지 스피커 가공 말아야 함 [표 Ⅳ-7] 음성 유형별 적정 포맷 해상도에 단순 2 모노 또는 스테레오 음향 ◎~○ 영향주지 가공 말아야 함 라. 동영상 정상표현에 3 보통의 음향 스트림, 웹캐스트 등 △ 영향주지 말아야 함 동영상 유형의 디지털 매체에서 고려하여야 할 품질 및 기능성 요인으로는 1) 해상도(화질의 고 4 부수적인 음향 배경 음악 × × 해상도를 지원), 2) 충실도(고음 해상도를 지원), 3) 음장(다채널 음 지원), 4) 정상 동영상 표현 범 원본의 특정 성능 원본의 원본의 기능에 5 악보기반 표현 MIDI 정밀도 n/a SW 성능 성능 영향주지 위를 넘는 기능성(부호화 애니메이션, 프레임 정밀 편집, 추가 음 궤적) 등이 대표적으로 거론될 유지 활용 유지 유지 말아야 함 수 있다. [표 Ⅳ-8]와 [표 Ⅳ9]에 이러한 기준을 따라서 각 유형에 맞는 선정 특성 분석과 적정 포 6 음향 효과 맷을 예시하였다.14) 7 오디오북 다양함 (범례) ◎: 매우중요, ○: 중요, △: 보통, ×: 중요하지 않음. [표 Ⅳ-6] 음성 유형별 선정 특성 분석 13) http://www.digitalpreservation.gov/formats/content/sound_curator.shtml 14) (http://www.digitalpreservation.gov/formats/content/video_curator.shtml)40 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 41

×