National digitallibaryofkorea series_3_dgitalcontnetmanagementsystem
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

National digitallibaryofkorea series_3_dgitalcontnetmanagementsystem

  • 1,742 views
Uploaded on

국립중앙도서관 디지털도서관 총서 시리즈3. ...

국립중앙도서관 디지털도서관 총서 시리즈3.
디지털장서관리 및 연구개발

More in: Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,742
On Slideshare
1,742
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
12
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 디브러리 총서 3디지털장서 관리 및 연구 개발 국립중앙도서관
  • 2. 제3권 디지털 장서 관리 및 연구 개발목 차 제 5 장 장서수집 수준 정의 제 1 부 장서개발정책 기본모형 연구·개발 및 수립 1. 컨스펙터스(Conspectus)의 개념 | 46 1 제 장 서론 2. 컨스펙터스의 구성요소 및 유형 | 48 3. 컨스펙터스 수정 | 53 1. 연구의 배경 및 목적 | 16 제 6 장 디지털장서개발정책 구성요소 2. 연구의 내용 | 17 제 2 장 디지털장서개발정책 개발 사례 1. 구성요소 도출 | 64 2. NDL 장서개발정책 기본모형 | 74 1. 장서개발정책 가이드라인 | 18 2. 국내외 디지털장서개발정책 개발 사례 | 19 제 3 장 이용자 커뮤니티 정의 1. 이용자 정의 | 20 2. 이용자 정의 사례 | 21 제 4 장 디지털장서의 수집대상과 범위 분석 1. 디지털 포맷의 유형 | 23 2. 디지털 매체의 식별 | 29 3. 디지털 매체 유형 선정 기준 | 30 4. NDL의 디지털 매체 선정 모형 및 수집 범주 선택 지침 | 36 5. 디지털 컬렉션 구축방향 | 43
  • 3. 제3권 디지털 장서 관리 및 연구 개발목 차 제 2 부 NDL 장서관리시스템 개발 지침 및 기능 표준화 제 3 부 표준 메타데이터 모델 및 Semantic Language 연구 개발 1 제 장 장서관리 원칙 1. 디지털 장서 | 90 1 제 장 서론 | 148 2. 국립디지털도서관의 장서관리 원칙 | 93 3. 국립디지털도서관 장서관리시스템의 기능 | 97 제 2 장 표준 메타데이터 모델 및 적용 제 2 장 장서수집기 1. FRBR 모델 | 152 2. KORMARC의 FRBR 변환 | 157 1. 개요 | 102 2. 장서수집기의 역할과 기능 | 106 제 3 장 시맨틱 온톨로지 언어 1. 온톨로지 언어 장단점 비교 | 179 제 3 장 장서등록기 1. 개요 | 112 제 4 장 국립중앙도서관FRBR모델기반온톨로지설계 2. 장서등록기의 역할과 기능 | 114 1. 국립중앙도서관 KORMARC의 FRBR모델 기반 온톨로지 설계 | 188 2. 국립중앙도서관 FRBR모델 기반 프로토타입 구현 | 200 제 4 장 콘텐트관리기 1. 개요 | 116 제 5 장 국립중앙도서관의 시맨틱 DL 서비스 2. 콘텐트관리기의 역할과 기능 | 121 1. 시맨틱 DL 구성요소 | 222 2. 시맨틱 DL 기반 국립중앙도서관 서비스 제안 | 224 제 5 장 표준화와 요소기술 1. 국립디지털도서관 장서관리시스템 표준화 | 126 제 6 장 결론 | 228 2. 표준화 및 요소기술 명세 | 129
  • 4. 제3권 디지털 장서 관리 및 연구 개발표 목차 [표 Ⅵ-3] 미국의회도서관의 디지털장서개발정책 구성 | 67 제 1부 장서개발정책 기본모형 연구·개발 및 수립 [표 Ⅵ-4] 호주국가도서관의 디지털장서개발정책 구성 | 67 [표 Ⅵ-5] 미국국립의학도서관의 디지털장서개발정책 구성 | 68 [표 Ⅱ-1] 장서개발정책 사례 | 19 [표 Ⅵ-6] 미국국립농학도서관의 디지털장서개발정책 구성 | 68 [표 Ⅲ-1] KORMARC과 MARC21에서의 이용자 정의 | 20 [표 Ⅵ-7] 인터넷공공도서관의 장서개발정책 구성 | 69 [표 Ⅲ-2] 이용자정의 사례 | 21 [표 Ⅵ-8] Demas의 인터넷 자원에 대한 장서개발정책 요소 | 70 [표 Ⅳ-1] 디지털 매체 유형 구분 사례 | 24 [표 Ⅵ-9] White & Crawford의 전자자원 선정 시 고려사항 | 71 [표 Ⅳ-2] 문서 유형별 선정 특성 분석 | 38 [표 Ⅵ-10] Johnson의 전자자원 선정 시 고려사항 | 72 [표 Ⅳ-3] 문서 유형별 적정 포맷 | 38 [표 Ⅵ-11] Pitschmann의 전자자원 선정 시 고려사항 | 73 [표 Ⅳ-4] 그림 유형별 선정 특성 분석 | 39 [표 Ⅵ-12] 구성요소 종합 | 74 [표 Ⅳ-5] 그림 유형별 적정 포맷 | 40 [표 Ⅵ-13] 구성요소 중요도 | 75 [표 Ⅵ-14] NDL 컨스펙터스(안) | 85 [표 Ⅳ-6] 음성 유형별 선정 특성 분석 | 40 [표 Ⅳ-7] 음성 유형별 적정 포맷 | 41 [표 Ⅳ-8] 동영상 유형별 선정 특성 분석 | 42 제 2부 NDL 장서관리시스템 개발 지침 및 기능 표준화 [표 Ⅳ-9] 동영상 유형별 적정 포맷 | 43 [표 Ⅱ-1] 디지털 장서의 유형 구분 | 91 [표 Ⅳ-10] 세계 주요 국가 도서관의 전자자원 범위 | 44 [표 Ⅱ-2] 국립디지털도서관 장서관리시스템의 기능 구성도 (V 1.0) | 97 [표 Ⅴ-1] 컨스펙터스 구성요소 | 49 [표 Ⅱ-3] 전자자원 선정 시의 고려사항 | 103 [표 Ⅴ-2] RLG 컨스펙터스 장서수준기호 | 50 [표 Ⅱ-4] 장서수집 업무 구성 | 104 [표 Ⅴ-3] WLN 컨스펙터스 장서수준기호 | 52 [표 Ⅱ-5] 국립디지털도서관 장서관리시스템의 주요 표준화 및 요소기술 | 129 [표 Ⅴ-4] PNWCP 컨스펙터스 장서수준기호 | 53 [표 Ⅴ-5] 컨스펙터스 장서수준기호 | 53 제 3부 표준 메타데이터 모델 및 Semantic [표 Ⅴ-6] 수정된 컨스펙터스 장서수준기호 #1 | 56 Language 연구 개발 [표 Ⅴ-7] 수정된 컨스펙터스 장서수준기호 #2 | 58 [표 Ⅴ-8] SunSITE 전자자원 유지수준 | 60 [표 Ⅱ-1] 메타데이터 요소 간 매핑 | 162 [표 Ⅴ-9] 장서수준 | 60 [표 Ⅱ-2] FRBR 모델의 속성(Attribute)과 KORMARC의 매핑 | 174 [표 Ⅴ-10] 유지수준 | 61 [표 Ⅳ-1] 토픽타입의 정의 | 190 [표 Ⅴ-11] 장서수준과 유지수준 통합 Matrix | 61 [표 Ⅳ-2] KORMARC 메타데이터 요소에서 추출한 어커런스 타입 | 191 [표 Ⅳ-3] 토픽 타입별 어커런스 정의 | 191 [표 Ⅴ-12] NDL 컨스펙터스 (안) | 62 [표 Ⅳ-4] 토픽간 상호연관성 정의 | 195 [표 Ⅵ-1] 구성요소 도출 대상 | 65 [표 Ⅵ-2] ALA의 디지털 장서개발정책 핵심요소와 기준 | 66
  • 5. 제3권 디지털 장서 관리 및 연구 개발그림 목차 제 1부 장서개발정책 기본모형 연구·개발 및 수립 제 3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 [그림 Ⅲ-1] 이용자 정의 | 20 [그림 Ⅳ-1] 디지털포맷의 유형 구분 | 23 [그림 II-1] KORMARC 변환 알고리즘 | 173 [그림 Ⅳ-2] 디지털포맷 선정 요인 도출 | 34 [그림 II-2] FRBR 모델개체(entity)에 따른 KORMARC요소 매핑 | 173 [그림 Ⅳ-3] NDL의 디지털매체 선정 모형 | 37 [그림 III-1] 토픽맵과 RDF의 연대기 | 180 [그림 Ⅴ-1] 컨스펙터스 적용 사례(안)-1 | 63 [그림 III-2] 토픽맵 규격 군과 RDF 규격 군 | 182 [그림 Ⅴ-2] 컨스펙터스 적용 사례(안)-2 | 63 [그림 IV-1] 토픽타입의 구성 | 189 [그림 IV-2] FRBR모델 개체간의 관계 | 192 [그림 IV-3] 온톨로지 요소의 관계 정의도 | 193 [그림 IV-4] KORMARC 의 토픽맵 온톨로지 디자인 | 196 [그림 IV-5] 온토폴리 토픽타입 구성의 예 | 197 [그림 IV-6] 온토폴리 연계타입의 구성 예 | 199 제 2부 NDL 장서관리시스템 개발 지침 및 기능 표준화 [그림 IV-7] Fiction Finder의 FRBR모델 구현 사례 | 201 [그림 IV-8] 프로토타입 구축 과정 및 구조 | 206 [그림 Ⅱ-1] 장서 수집기 구성도 | 102 [그림 IV-9] XSL 변환 문서 | 207 [그림 Ⅱ-2] 전자자원의 생명주기 | 103 [그림 IV-10] OCLC FictionFinder의 프로토타입 시작 화면 | 208 [그림 Ⅱ-3] 장서수집기 업무 흐름도 | 105 [그림 IV-11] 국립중앙도서관의 프로토타입 메인화면 | 208 [그림 Ⅱ-4] 제작 업무 흐름도 | 106 [그림 IV-12] 문학작품의 화면 예시 | 209 [그림 Ⅱ-5] 구입/구독/재구독 업무 흐름도 | 108 [그림 IV-13] 저자의 화면 예시 | 210 [그림 Ⅱ-6] 협력 업무 흐름도 | 109 [그림 IV-14] 프로토타입 상세화면 예시 | 211 [그림 Ⅱ-7] 납본 업무프로세스 | 111 [그림 IV-15] 국립중앙도서관 한국 현대소설 검색결과 화면 | 213 [그림 Ⅳ-8] 디지털 콘텐트의 수명주기 | 120 [그림 IV-16] 국립중앙도서관“안도현”저자 검색결과 | 214 [그림 Ⅴ-1] 국립디지털도서관 장서관리시스템의 구성도 | 127 [그림 IV-17] 프로토타입의“안도현”검색 결과 | 215 [그림 IV-18] 프로토타입 장르별 서비스 예시 | 216
  • 6. 총서 제 3권의 내용은 각 연구결과물에 대한 축약본입니다. 3개 연구결과물의 내용 중 아래 부분은 본 축약본에 배제하였습니다. 제 1부 장서개발정책 기본모형 연구·개발 및 수립 Ⅱ. 디지털장서개발정책 개발 사례 - 국내외 디지털장서개발정책 개발 사례 Ⅲ. 이용자 커뮤니티 정의 - 이용자 정의 사례 <부록 1> 디지털장서의 수집대상 규정 사례 <부록 2> 주요 디지털 포맷 관계 기술 제 2부 NDL 장서관리시스템 개발 지침 및 기능 표준화 Ⅵ. 사례연구 - 장서수집기 사례연구 - 장서등록기 사례연구 - 콘텐트관리기 사례연구 <메타데이터 적용지침> - 국립디지털도서관 메타데이터 원칙 - 국립디지털도서관 장서 메타데이터 적용지침 - 국립디지털도서관 콘텐트 메타데이터 적용지침 제 3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 Ⅲ. 시맨틱 온톨로지 언어 - RDF/OWL - Topic Map10 제1부 장서개발정책 기본모형 연구·개발 및 수립
  • 7. 디브러리 포털사이트 모형개발 디지털장서 관리 및 연구개발 총서 발간사 국립디지털도서관은 시대적 흐름에 발맞춰 디지털 정보자원 이러한 국립디지털도서관 건립을 성공적으로 추진하기 위하여 2007년도“국립디지털도서관 의 수집 · 정리 · 보존 및 이용에 대한 새로운 도서관 혁신모 운영 시범사업” 수행하였으며, 도서관 학계와 업계, 도서관 실무진 등 유수의 인력들이 참가하 을 델로서 국내외 디지털정보서비스 게이트웨이 역할을 수행하려 고 수차례의 자문을 거쳐 수행 결과를 도출하였습니다. 고 합니다. 본 총서에는 2007년 수행결과를 5권(디브러리 포털사이트 모형개발, 이용자 시나리오 연구개 국립디지털도서관은 언제 어디서 누구나 디지털정보에 쉽게 발, 디지털장서 관리 및 연구개발, 디브러리 이용자서비스 공간구축, 정보소외계층 서비스)으로 접근하고 쌍방향 참여로 원하는 디지털정보를 이용할 수 있는 편찬하였습니다. 디브러리 총서는 2007년도 결과물 발간을 시작으로 계속적인 연구결과를 편찬 전문 지식포털 디브러리를 준비하고 있습니다. 할 것이며, 도서관 학계 및 현장에 배포하여 디지털도서관을 선도하는 모범적인 모델이 될 것으 로 기대합니다. 또한 최첨단 시설로 정보 열람과 활용에 새로운 혁신을 더해 주며, 자연과 사람 그리고 정보를 접목한 친환경 도서관을 짓 2009년 개관될 국립디지털도서관은 새로운 정보서비스의 혁신과 창조적인 지식 생산으로 대 고 있습니다. 민국을 지력강국(知力强國)으로 거듭나게 하기위한 도약점이 되도록 노력하겠습니다. 권 경 상12 총서 발간사 13
  • 8. 제1부장서개발정책 기본모형 연구·개발 및 수립 1. 서론 2. 디지털장서개발정책 개발 사례 3. 이용자 커뮤니티 정 4. 디지털장서의 수집대상과 범위 분석 5. 장서수집 수준 정의 6. 디지털장서개발정책 구성요소
  • 9. 디지털장서 관리 및 연구 개발 제1장 서론 준’등을 바탕으로 하고 있으며 일관된 장서개발정책이 미비하여 장서개발 업무의 효율성과 안정 성을 충분히 확보하지 못하고 있다. 이러한 상황에서 NDL은 개관을 앞두고 있으며, 이에 따라 기존 국립중앙도서관의 장서개발정 책과는 별도로 독립적인‘NDL 장서개발정책’ 입안, 제도화하고 적용하고 이를 각급 디지털도 을 서관에 확대하기 위한 기초연구의 수행이 필요하게 되었다. 2. 연구의 내용 ● 국내외의 전자자원개발정책 사례들을 조사·분석하여 NDL에 적합한 독립형 장서개발정책 1. 연구의 배경 및 목적 의 설정을 제안한다. ● NDL이 수집 대상으로 하는 정보자원의 유형과 범위, 수집의 우선순위를 제시하고, 구입 수 장서개발정책(Collection Development Policy: CDP)은 도서관 및 정보센터에 있어서의 장서 준, 라이선스, 벤더 등에 관한 내용, 그리고 컨소시엄 관련 사항에 대한 원칙을 수립할 수 있 개발의 특징과 범주, 우선순위 등을 규정하는 장서관리 업무의 마스터플랜이다. CDP를 통하여 는 여지를 제공한다. 도서관 및 정보센터는 현재 구성되어 있는 장서의 특성과 강점 및 약점을 파악하고, 장서구성 ● 현재 국립중앙도서관의 장서개발은 일반적 지침 이외의 도구가 미비하여 컨스펙터스 (Collection Building)의 우선순위를 정하며, 예산분배(Allocation)의 정통성과 효율을 기하고, (Conspectus)와 같이 주제분야에 대한 설명과 수집단계를 제시하는 도구가 없으므로, 기존 도서관간의 협력을 진작하며, 도서관 조직 내부와 도서관 외부 커뮤니티 사이의 커뮤니케이션을 의 5단계로 구분하는 컨스펙터스의 Collection Magnitude를 NDL에 맞게 전개하여 NDL 원활히 하고, 지적 자유 보호와 검열(Censorship) 등에 관한 도서관의 입장을 천명한다. 에 적합한 수정된 컨스펙터스 모델을 제시한다. 이러한 맥락에서 볼 때 국립디지털도서관(National Digital Library, 이하 NDL)은 CDP를 통 ● 국가적 디지털 정보자원 개발의 체계적 수행을 위한 필수요소들을 도출하고 NDL CDP의 하여 수집대상 장서의 범위, 수집의 우선순위 및 구입 수준(magnitude) 등에 대한 명확한 원칙 기본모형을 제안한다. 을 설정하여야 한다. 본 연구에서는 이러한 NDL 장서개발정책 수립의 전단계로서 NDL 장서개 발정책의 기본모형을 연구하여, 국가적 디지털장서개발정책의 필수 요소들을 도출하고 향후 NDL 장서개발정책의 일반적 지침을 정립하고자 한다. 세계 주요국의 국가도서관들은 오랜 세월동안 종합적이고 체계화된 장서개발정책에 입각하여 국가차원의 장서개발 활동을 강화하고 있다. 국가도서관뿐만 아니라 각급의 연구도서관과 공공 도서관들이 장서개발정책을 수립하고 이를 인터넷 홈페이지 등을 통하여 공개하고 있는 것이다. 특히, 최근에는 디지털 자원의 급속한 증가에 따라 전자자원에 대한 장서개발정책의 필요성이 대 두되면서 기존의 인쇄형 장서개발정책에 전자자원개발정책을 통합하여 운영하거나 혹은 별도의 독립된 전자자원(장서)개발정책을 수립하여 운영하는 것이 일반적이다. 반면, 현재 국립중앙도서관의 장서개발은 납본관련 법제와‘자료수집원칙’ ,‘구입자료선정기16 제1부 장서개발정책 기본모형 연구·개발 및 수립 제1장 서론 17
  • 10. 디지털장서 관리 및 연구 개발 제2장 디지털장서개발정책개발사례 ● 소프트웨어 설명서와 기타 기술적 지원 산업 표준에 대한 충족 설명서와 기타 기술적 지원 ● 비용: 소프트웨어, 하드웨어, 유지보수 계약에 대한 자금은 어디서 나오는가? 누가 편성 및 조정하는가? ● 직원: 부서별/기관별/컨소시엄 책임은 어떻게 구분하는가? 2. 국내외 디지털장서개발정책 개발 사례 1. 장서개발정책 가이드라인 구 분 특 징 디지털 컬렉션별 장서개발정책 제시 The British Library 납본에 의한 디지털자원관리정책 별도 설정 미국도서관협회(American Library Association: ALA)는 산하의 RUSA (Reference and 디지털화(digitisation)에 관한 별도정책 제시 User Services Association)1)을 통하여 전자자원개발정책 수립을 위한 핵심 요소(Core 별도 전자자원개발정책 제시 Elements of Electronic Resource Collection Policies)를 제시하고 있으며, 그 골자는 아래와 - 소개 : 수집범주에 대한 소개 같다.2) - 정의 : Electronic resources / Acquire / Collect / Link / Archive에 대한 용어 정의 Library of Congress - 일반적 가이드라인 : 전자자원 수집기준 명시 - 구체적인 가이드라인 : 전자자원 선정시 고려사항 명시 ● 용어 정의 디지털화를 통한 보존(preservation reformatting) 정책 별도 제시 ● 정책 개정에 대한 일정 별도 전자자원개발정책 제시 ● 전반적인 도서관 정책과의 관계 - 정의 : 물리적 포맷 전자자원 / 온라인 자원 / 디지털화한 자원에 대한 용어 정의 National Library of Australia - 수집 : 물리적 포맷 전자자원 / 온라인 자원 / 디지털화한 자원 / 전자자원의 보존에 대한 수 ● 인쇄 자원과 기타 전자 자원과의 관계: 현재 자원을 대체하거나 보강하는 것 집기준 및 고려사항 명시 ● 선정 디지털 보존정책 별도 제시 서비스 대상이 되는 이용자 National Science Digital Science, Technology, Engineering, Mathematics 별로 디지털장서 구축 누가 소프트웨어를 선정하고 제적하는가?; 누가 하드웨어를 선정하는가?; 누가 전체적인 Library 미션, 장서소개, 주제범위, 대상 이용자집단, 선정기준 등의 서술식 제시 책임을 지는가? 별도 전자자원개발정책 제시 ● 정보의 기준 - 정의 : Electronic resources / Bibliographic files / Full text, numeric, graphic files / National Library of Instructional or modeling software / Applications software에 대한 용어 정의 범위 Medicine - 선정절차에 있어서 고려사항, 책임사항, 벤더, 라이선스 등 선정시 고려사항 명시 정확함/최신성 - 이행 : 전자자원에 대한 접근과 복본, 폐기와 유지 등 정책을 이행하는 것과 관련한 사항 명시 ● 하드웨어 고려사항 컬렉션 구분 별 정책 산업 표준에 대한 충족 - 선정을 위한 구체적인 원칙 : 내용, 기능, 저작권 등 명시 Internet Public Library - 링크점검 : 링크점검을 위한 방법 명시 1) ALA는 RUSA의 장서개발 및 평가섹션(CODES: Collection Development and Evaluation Section)에서 장서개발정책에 대하 - 이용자의 제안 : 새로운 사이트를 추가하는데 있어서 이용자의 제안을 평가하는 방법과 제 여 다루고 있다. 안 방법 명시 2) Core Elements of Electronic Resource Collection Policies: http://www.ala.org/ala/rusa/rusaourassoc/rusasections/codes/codessection/codescomm/colldevpolicies/coreele- [표 II-1] 장서개발정책 사례 ments/core.htm18 제1부 장서개발정책 기본모형 연구·개발 및 수립 제2장 디지털장서 개발정책 개발 사례 19
  • 11. 디지털장서 관리 및 연구 개발 제3장 이용자커뮤니티정의 2. 이용자 정의 사례 사 례 내 용 어린이, 가족 / 사서 / 출판업자 / 연구자 / 교사 / 방문객으로 구분 Library of Congress 1. 이용자 정의 NDL 이용자 대한민국 국민 어린이/청소년 작업별 이용자그룹 분화 어린이와 청소년을 위한 KidsSpace와 TeenSpace 제공 성인 노인 한국표준직업분류 기준 [그림 III-1] 이용자 정의 ● 한국표준직업분류 - 통계청 고시 제2000-2호 Internet Public Library 총 11개의 대분류, 46개의 중분류, 162개의 소분류, 447개의 세분류, 1,404개의 세세분류로 구 성되어 있음 ● KORMARC과 MARC21에서의 이용자 정의 KORMARC MARC21 22 이용대상자 수준 22 - Target audience [표 III-2] 이용자정의 사례 b 일반이용자용 # - Unknown or not specified a 취학전 아동 a - Preschool b 초등학생 b - Primary c 중학생 c - Pre-adolescent d 고등학생 d - Adolescent e 성인용 e - Adult f 특수계층 f - Specialized j 아동용 g - General z 미상 또는 세분하지 않는 경우 j - Juvenile | 부호화하지 않음 | - No attempt to code [표 III-1] KORMARC과 MARC21에서의 이용자 정의20 제1부 장서개발정책 기본모형 연구·개발 및 수립 제3장 이용자 커뮤니티 정의 21
  • 12. 디지털장서 관리 및 연구 개발 제4장 장서의수집대상과범위분석 기 위한 제일의 수단이 됨에 따라 정보의 포괄성과 신뢰성(integration and trust)이 디지털 장 서 개발의 중요한 기준으로 떠오르게 되었다. 이는 웹 표준과 기술은 이제 이종 정보의 광범위한 통합을 지원하며, 이용자들의 원스톱 정보 이용 요구가 급증하고 있기 때문이며, 동시에 수많은 가용 정보량은 이용자로 하여금 신뢰할 수 있는 정보를 찾기 어렵게 만들기 때문이다. 이에 따라 세계 주요국의 도서관들은 디지털자원의 수집범주를 아래에 예시한 바와 같이 제시 하고 있다. 1. 디지털 포맷의 유형 도서관의 수집 대상이 되는 자료의 범위를 검토하기 위해서 여러 가지 기준을 설정할 수 있다. 가. 디지털 포맷의 기본 유형 예컨대, 자료의 유형, 주제 분야, 발간 매체 형식, 사용 언어, 발행 국가 등이 이러한 기준을 구성 하는 요소가 될 것이다. 또한 이러한 요소들은 급속하게 변화하는 전자 환경을 반영하여야 하는 디지털 포맷은 콘텐트 스트림(Content Stream: Physical Medium- independent)과 물리적 데, 예를 들어 발간 매체의 경우 과거 도서관이 종이매체를 중심으로 자원을 개발하던 시기에는 매체(Physical Media: Physical Medium-dependent)로 구분할 수 있다. Content Stream은 종이매체를 기본으로 설정하고 기타 매체 유형을 고려하였으나, 최근 컴퓨터 및 인터넷 기술의 Physical Media와 독립적으로 나타내어 질 수 있는 포맷인 반면, Physical Media는 어떤 물리 발달로 발간 매체가 급속히 전자화됨과 동시에 복합매체(multi-media)화됨에 따라 점차 CDP의 적 저장 구조상에서 감지되는 형태로 나타나는 콘텐트 스트림을 위한 것이다. Content Stream 구성요소로서 중요성이 약해지고 있다. 또한 구독 및 입수를 위한 도입 가격 체계의 경우, 정보자 은 매체 유형에 따라서 문자(논리, 수치), 영상, 음성, 기타 등으로 나누어지고, 물리적 매체는 저 원의 가격 상승이 소비자물가지수(CPI)를 훨씬 능가하고 구입/구독조건 또한 점차 복잡한 양상을 장 기술에 따라서 자기 방식과 광학 방식으로 나누어진다.5) 3) 띠게 됨에 따라 CDP에서 전략적인 고려사항 등을 명문화해야 할 필요성도 대두되고 있다. Digital format 약 30년 전에 음성 카세트테이프가 등장한 이래 비디오 카세트, CD-ROM, DVD, 플레이스테 이션 게임 등의 연이은 등장은 도서관의 장서개발의 문제를 복잡하게 만들었다. 정보검색 부문에 Content stream Physical media 서는 온라인 데이터베이스 및 인터넷의 등장으로 다양한 유형의 정보 매체가 속속 등장하고 있기 Text Magnetic 도 하다. Still image Optical NDL은 국가 단위의 디지털 정보 유통기관으로서 모든 디지털 매체의 수집의 주체가 되어야 하 는 입장에 있다. 따라서, 각 정보의 유형에 따라 적절한 디지털 매체 유형(digital format)을 선택 Sound 하여야만 한다. 이와 관련하여 미국의 NISO(National Information Standard Organization) Moving image 는 우수한 디지털 장서(good digital collection)의 기준으로 사용성, 접근성, 예상되는 이용자 그 Others 룹에 대한 이용 적합성 등을 제시하고 있다.4) [그림 Ⅳ-1] 디지털 포맷의 유형 구분 디지털 장서개발에서 이제는 단지 친숙한 이용자에게 정보를 효과적으로 서비스하는 것만으로 3) 2004 Information Format Trends. OCLC Library & Information Center Report 는 불충분하게 되었다. 디지털 환경 자체가 성숙한 결과 절대 다수의 국민들에게 정보를 보급하 http://www5.oclc.org/downloads/community/2004infotrends_content.pdf 4) NISO, A Framework of Guidance for Building Good Digital Collection, 2nd Ed., Marylanf, USA, 2004. 5) Stephen L. Abrams. 2005. Establishing a Global Digital Format Registry, Library trends, 54(1), pp. 125-143.22 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 23
  • 13. 디지털장서 관리 및 연구 개발 이중에서 content stream 유형의 디지털 매체는 [그림 Ⅳ-1]처럼 다양하게 구분될 수 있으나, Language)과 전자책을 위한 OEBPS(Open eBook Forum Publication Structure)이 있고, 기 문자(text), 음성(audio), 그림(still image), 동영상(moving image), 복합 매체(hyper media), 타 DTB(Digital Talking Book), NCBIArch(NCBI/NLM Journal Archiving and 기타 유형(software, database, CAD file 등) 등으로 구분하는 것이 일반적이다. 각 유형들은 뷰 Interchange DTD), NITF(News Industry Text Format) 등이 있다. 어(viewer) 또는 재생기(player)에 따라서 다양한 파일 포맷(file format)으로 세분화 되고 최신 PDF는 원래 Postscript에 기초해서 그것을 다양한 컴퓨터와 프린터로 프린트할 수 있게 하기 화된다. 이러한 세분화된 포맷은 기술의 발달과 함께 새로운 포맷이 등장하고 있어서 지속적으로 위해 만들어진 것으로서 종이 문서와 같은 느낌과 외관을 갖는다. 이중 PDF/A는 장기 보존을 위 관찰하고 그에 따른 수집 정책을 수립하여야 할 것이다. 해서 ISO에서 표준화 한 유형이다. XML은 각 항목의 의미의 마크업과 정보의 표현을 모두 수용 본 장에서는 디지털 매체 중 문서, 그림, 음성, 동영상 등의 content stream 유형을 중심으로 할 수 있는 태그를 포함하는 포맷으로 상호운용성 면에서 가장 유리하다. 살펴보았다. DTB: Digital Talking Book OEBPS: Open eBook Forum Publication Structure 분야 DCMI1) Type Vocabulary MIME2) Media Types GDFR3) format category 국가지식 포털4) NCBIArch: NCBI/NLM Journal Archiving and Interchange DTD Collection Dataset application Logical 원문(full-text) NITF: News Industry Text Format Event audio Numerical 메타데이터(text) Image example Text 이미지(image) PDF: Portable Document Format InteractiveResource image Image(still) 녹음자료(audio) XML: Extensible Markup Language MovingImage message Image(motion) 동영상(video) 매체 PhysicalObject model Audio 멀티미디어(multipart) 다. 그림(still image) 유형 구분 Service multipart 소프트웨어(application) Software text 기타 그림 유형의 파일 포맷에는 픽셀에 기반한 것으로 JPEG(Joint Photographic Experts Sound video Still Image Group), TIFF(Tagged Image File Format), GIF(Graphics Interchange Format), Text PNG(Portable Network Graphics) 등이 대표적이며, 벡터 방식으로는 SVG(Scalable Vector Graphics)가 있다. 1) DCMI: Dublin Core Metadta Initiative JPEG은 모든 디지털 카메라에서 지원하는 포맷으로 손실(lossy) 압축 알고리즘을 채택하기 때 2) MIME: Multipurpose Internet Mail Extensions 3) GDFR: Global Digital Format Registry 문에 비교적 작은 파일 크기를 갖는다6). 그래서 PDF에서는 JPEG이 이미지 압축 알고리즘으로 4) 국가지식포털 (http://www.knowledge.go.kr/) 사용되고 있다. TIFF는 LZW라는 손실없는(lossless) 압축 알고리즘을 채택하기 때문에 비교적 [표 Ⅳ-1] 디지털 매체 유형 구분 사례 큰 파일 크기를 갖는다. 그래서 웹브라우저에서는 TIFF를 지원하지 않는다. GIF는 256 색으로 한정되어서 적은 색의 그림 파일에 적합하다. GIF는 애니메이션을 지원하기 때문에 이미지를 이 나. 문자(text) 유형 용한 애니메이션 효과를 내는 데 널리 활용된다. PNG는 GIF의 후속으로 나온 최신의 오픈 소스 파일 포맷으로 GIF와는 달리 트루 컬러(true color)를 지원하며, Internet Explorer 7부터 지원 문자 유형은 도서관을 위한 가장 보편적인 디지털 매체로서 PDF(Portable Document 이 된다. 벡터 방식인 SGV는 스크립팅이라는 장점을 이용해서 상호작용 웹(interactive web)에 Format)가 가장 대표적이라고 할 수 있다. 그 외에 마크업 문서인 XML(Extensible Markup 6) http://en.wikipedia.org/wiki/Image_file_formats24 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 25
  • 14. 디지털장서 관리 및 연구 개발 중요한 요소로 사용된다. AC-3_A, AC-3 Compressed Audio (Dolby Digital), Revision A AES3, Digital Audio Interface Format BIIF, Basic Image Interchange Format AIFF, Audio Interchange File Format CAM_RAW, Camera Raw Formats (Group Description) A-Law, A-Law Compressed Sound Format CPC, Cartesian Perceptual Compression Encoding (CPC) AMR, Adaptive Multi-Rate Speech Codec DNG_1_1, Adobe Digital Negative (DNG), Version 1.1 ASF, ASF (Advanced Systems Format) GIF_89a, Graphics Interchange Format, Version 89a AudCom, Audible.Com File Format ITU_G4, ITU-T Group 4 FAX Compression DLS, Downloadable Sounds Format JFIF, JPEG File Interchange Format DSD, One-bit Delta Sigma Audio Encoding J2K_C, JPEG 2000 Part 1, Core Coding System DTS, Digital Theater Systems Audio Formats JP2_FF, JPEG 2000 Part 1 (Core) jp2 File Format FLAC_1_1_2, FLAC (Free Lossless Audio Codec), Version 1.1.2 JP2_J2K_C_LL, JP2 File Format with JPEG 2000 Core Coding, Lossless ID3, ID3 Metadata for MP3 MrSID, MrSID Image Format IFF,Electronic Arts Interchange File Format 1985 PNG, Portable Network Graphics LPCM, Linear Pulse Code Modulated Audio SPIFF, Still Picture Interchange Format MIDI_SD, MIDI Sequence Data SVG, Scalable Vector Graphics MODS, Module Music Format (Mods) TGA, Truevision TGA, version MP3 TIFF, Revision 6.0 and earlier μ -Law, μ -Law (Mu-Law) Compressed Sound Format WMP, Windows Media Photo Ogg, Ogg File Format PCM, Pulse Code Modulated Audio 라. 음성(audio) 유형 Quicktime RealAudio 음성 저장 매체는 LP에서 카세트 테이프, DAT(digital audio tape), 음성 CD, 미니 디스크, 플 RMID, RIFF-based MIDI File Format 로피 디스크, 하드 디스크 등으로 변천해 왔다. 이중에서 디지털 매체에 저장되는 음성 포맷으로 SHN, Shorten Lossless Audio Format 는 MPEG 계열의 MP3(MPEG-1 Level 3) 파일이 현재 가장 보편적으로 활용되고 있고, 플러그 SMF, Standard MIDI File Format 인에 따라서 RealAudio와 MIDI, WAVE, QTA(QuickTime Audio), WMA(Windows Media Vorbis, Vorbis Audio Codec Audio) 등이 대표적이다. WAVE, WAVE Audio File Format WMA, Windows Media Audio AAC, Advanced Audio Coding XMF, eXtensible Music Format26 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 27
  • 15. 디지털장서 관리 및 연구 개발 마. 동영상(moving image) 유형 RealVideo Sorenson, Sorenson Video Codec 동영상 저장 매체는 16밀리 필름에서 카세트형 비디오 테이프를 거쳐 음성 유형과 마찬가지로 SWF, Macromedia Flash SWF File Format CD, 미니 디스크, 하드 디스크 등으로 변천해 왔다. 이중에서 디지털 매체에 저장되는 동영상 포 WMV, Windows Media Video 맷으로는 MPEG 계열과, 플러그인에 따른 RealVideo, AVI, DivX, QT(QuickTime), WMV(Windows Media Video) 등이 대표적이다. 2. 디지털 매체의 식별 AAF, Advanced Authoring Format (AAF) 디지털 매체는 열러가지 유형이 있을 뿐만 아니라 같은 유형 내에서도 버전(version)이 다를 수 AC-3_A, AC-3 Compressed Audio (Dolby Digital), Revision A 있고, 특정한 목적을 위해서 일부 변형한 하부 유형(subtype)이 있을 수 있으며, 여러 개의 포맷 ASF, Advanced Systems Format 을 포괄(wrapper or bundle)하는 유형도 있다. 그래서 단지 매체 유형 이름만으로는 정확하게 AVI, Audio Video Interleaved 구분하기 어려운 경우도 있다. 그래서 미국의 NDIIPP(National Digital Information Cinepak, Cinepak Video Codec Infrastructure and Preservation Program)의 디지털 포맷 홈페이지7) 에서는 주변 포맷들 간 DCDM, Digital Cinema Initiative Distribution Master (DCDM) 의 관계를 표시하는 기술 형식으로 각 포맷을 기술하고 있다. 본 보고서에서는 <부록 2>에 주요 DivX, DivX Video Codec 포맷을 아래와 같은 형식으로 기술하여 놓았다. DPX_2, Digital Moving-Picture Exchange (DPX), Version 2.0 DTS, Digital Theater Systems Audio Formats <디지털 매체의 관계 기술 사례> DV, Digital Video Encoding (DV, DVCAM, DVCPRO) PDF/A: ISO 19005-1. Document management - Electronic document file format for SWF, Macromedia Flash SWF File Format long-term preservation - Part 1: Use of PDF Indeo, Indeo Video Codec - 설명 : PDF/A-1 is a constrained form of Adobe PDF version 1.4 intended to be suitable for long- J2K_C, JPEG 2000 Part 1, Core Coding term preservation of page-oriented documents for which PDF is already being used in MJP2_FF, Motion JPEG 2000 File Format practice. The ISO standard [ISO 19005-1:2005] was developed by a working group with representatives from government, industry, and academia and active support from Adobe MPEG-1, MPEG-1 Video Coding (H.261) Systems Incorporated. Part 2 of ISO 19005 will be a version of PDF/A based on a more MPEG-2, MPEG-2 Video Coding (H.262) recent version of PDF. - 상태 : A final-state format for delivery to end users and long-term preservation of the docu- MPEG-4_V, MPEG-4, Visual Coding (Part 2) (H.263) ment as disseminated to users. AAC, Advanced Audio Coding - 관계 : * Subtype of PDF MP4_FF, MPEG-4 File Format * Subtype of PDF_1_4 * Has subtype PDF/A-1a MP4_XMT, MPEG-4 eXtensible MPEG-4 Textual Format (XMT) * Has subtype PDF/A-1b MXF, Material Exchange Format (MXF) QuickTime 7) http://www.digitalpreservation.gov/formats/28 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 29
  • 16. 디지털장서 관리 및 연구 개발 3. 디지털 매체의 유형 선정 기준 나. Library of Congress: 저장을 위한 디지털 포맷 선정 요인 매체 유형 선정 기준은 목적에 따라 달라질 수 있을 것이다. 이와 관련된 프로젝트가 세계 각국 미국의 의회 도서관(LC: Library of Congress)에서는 디지털 자원의 장기적 저장(archiving) 에서 이루어지고 있는데 여기서는 그 중 일부를 소개하고 NDL에서 어떻게 반영할 것인가에 대 을 위해서 디지털 포맷 관련 프레임워크와 전략을 수립하였다. 여기서는 디지털 포맷을 평가할 해서 생각해 보고자 한다. 때 고려해야 할 요인(factors)을 유지관리 요인(sustainability factor)과 품질 및 기능성 요인 (factors reflecting quality and functionality)로 구분하여 제시하고 있다.9) 가. NISO: 디지털 객체 선정 지침 1) 유지관리 요인 미국의 NISO에서는 지난 2004년 디지털 컬렉션 구축 지침 프레임워크 보고서를 발간하였다. 이 보고서에서 디지털 객체(digital object)란 하나의 파일(file) 또는 여러 개의 연결된 파일로 구 ● 공개 정도(disclosure): 이것은 기술적 완결성(integrity)을 검증할 수 있는 명세와 도구가 성되거나, 여러 개의 파일과 그것들을 묶는데 필요한 구조적 메타데이터로 구성된다고 보고 있 완비되었고 디지털 콘텐츠로의 접근 가능한 정도를 말한다. 즉, 정보가 어떻게 비트(bit)와 다. 이런 의미에서 객체는 도서관의 소장 품목(item)과 개념적으로 유사하다. 또한 디지털 객체는 바이트(byte)로 부호화 되었느냐를 이해할 수 있어야 한다는 것이다. 독점 포맷보다는 비독 컬렉션(collection)의 구성 요소가 된다.8) 점의 공개 표준이 더 문서화가 잘 되어 있고 검증 도구가 더 잘 지원되는 것이 일반적이다. 디지털 객체는 소장을 위한 원본(master copy)과 이용을 위한 임시적 복사본으로 구분하여 관 ● 채택 정도(adoption): 이것은 그 포맷이 정보원의 일차 생산자, 보급자 또는 이용자에 의해 리하기도 한다. 예컨대, 그림 파일 원본은 압축이 없는 TIFF 포맷으로 이용을 위한 것은 압축 방 서 이미 이용되고 있는 정도를 말한다. 어떤 포맷이 널리 이용된다는 것은 그만큼 폐기될 가 식의 JPEG 포맷으로 관리함으로써 웹 이용자들이 빠른 시간에 다운로드할 수 있도록 할 수 있다. 능성이 낮고 에뮬레이션 도구를 쉽게 얻을 수 있다는 것을 의미한다. ● 투명성(transparency): 이것은 디지털 표현이 문자 에디터를 이용하여 사람이 읽을 수 있는 ● 디지털 객체는 상호호환성(interoperability)과 재사용성(reusability)을 유지하기 위한 설 것을 포함해서 기본도구로 직접 분석할 수 있도록 공개된 정도를 말한다. 중요한 정보가 쉬 명이 잘 되어 있어야 한다. 우면서도 직접적으로 표현되어 있는 디지털 포맷이 아무래도 새 포맷으로의 변환이 쉬울 것 ● 디지털 객체는 오랜 시간이 지나도 지속적(persistent)으로 사용할 수 있어야 한다. 이다. 음성, 동영상, 그림 등과 같은 많은 포맷들이 압축되어 있거나 암호화 되어 있는데, 이 ● 디지털 객체는 플랫폼에 대하여 독립적이어야 하고, 어떤 환경에서도 접근이 가능해야 경우는 널리 사용되고 공개되어 있으며 손실 없는(lossless) 형식의 경우는 무리가 없을 것 (broadly accessible) 한다. 이다. ● 디지털 객체는 지속적이고 유일한 식별자로 명명되어야 한다. ● 기록의 자체 보유(self-documentation): 해당 디지털 포맷을 설명하고 그것의 생성과 초기 ● 디지털 객체는 출처, 구조, 이력, 용도, 품질 등이 인증될 수 있어야 한다. 단계와 관련된 기술적 및 관리적 사항이 포함된 메타데이터가 매체 자체에 포함되어 있으면 ● 디지털 객체는 관련 메타데이터가 있어야 한다. 그렇지 않은 경우보다 더 유리할 것이다. OAIS(Open Archival Information System) 참 조 모델은 메타데이터에 포함되어야 할 몇 가지 사항을 제시하고 있다. 1) 표현(represen- tation): 데이터가 정보로서 사용될 수 있게 하는 표현 정보, 2) 참조(reference): 해당 콘텐 8) NISO Framework Advisory Group. 2004. A Framework of Guidance for Building Good Digital Collection. 2nd Ed. NISO. Maryland. USA. Available from: 9) Arms, C. R. and Fleischhauer, C. 2003. Digital Formats for Library of Congress Collections: Factors To Consider http://www.niso.org/framework/framework2.pdf When Choosing Digital Formats. Library of Congress. USA.30 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 31
  • 17. 디지털장서 관리 및 연구 개발 트를 식별하고 설명할 수 있는 참조 정보, 3) 상황(context): 예를 들어 콘텐트 생성과 관련 - 음장(sound field): 다채널 음 지원 된 기록, 4) 불변성(fixity): 콘텐트 데이터의 완결성의 검사를 허락하는 불변성 정보, 5) 기 - 정상음 표현 범위를 넘는 기능성: 부호화 애니메이션, 프레임 정밀 편집, 추가 음 궤적) 원(provenance): 콘텐트가 생성된 이후의 변화 및 보관 이력 기록. ● 외부 의존성(external dependencies): 이것은 특정 포맷이 특정 하드웨어, 소프트웨어, 운 다. 덴마크 국립/왕립 도서관: 파일 포맷 평가 기준 영 시스템 등과 관련된 정도와 미래의 기술적 환경에서 그러한 의존성을 다루기 위해 예측 되는 복잡성을 말한다. 덴마크에서는 국립 도서관(The State Library)과 왕립 도서관(The Royal Library)이 공동 프 ● 기술적 보호 장치(technical protection mechanisms): 콘텐트에 암호화 되었거나, 패스워 로젝트를 수행하였으며, 그 일환으로 파일 포맷 관리 전략을 수립하였다10). 이 자료에서는 개방성 드를 걸었거나, 특허권 보호를 위한 이용 제한 등과 같은 기술적인 보호 장치가 없어야 미래 (openness), 이식성(portability), 품질(quality) 등의 세 부류의 기준을 제안하고 있다. 의 기술 환경에서도 쉽게 이용하게 될 것이다. 1) 개방성 2) 품질 및 기능성 요인 제품 정보가 공개되어 있을 것 특허나 저작권에 얽매이지 않을 것 품질 및 기능성 요인은 표현 장르와 형태에 따라 달라진다. 뷰어 소스가 무료일 것 뷰어 소스가 GPL 라이선스를 가질 것 ① 음성 녹음 자료 암호화 되지 않을 것 - 충실도(fidelity): 고음 해상도를 지원 - 음장(sound field): 다채널 음 지원 2) 이식성 - 정상음 표현 범위를 넘는 기능성: 주해에 의한 표현(예, MIDI) 하드웨어에 독립적일 것 ② 정지 영상 자료 운영 시스템에 독립적일 것 - 청명도(clarity): 화질의 고해상도를 지원 타 소프트웨어와 독립적일 것 - 색상 유지(color maintenance) 특정 기관, 단체 또는 사건과 독립적일 것 - 정상 그림 표현을 넘는 기능성: 벡터 그래픽스, 삼차원 모델 등 널리 이용되고 있을 것 ③ 문자 자료 내장 기능성이 최소일 것 - 문서 구조와 내비게이션의 완결성 버전이 하나이거나 잘 정의되어 있을 것 - 배치, 폰트, 디자인 특성 등의 완결성 - 수학, 화학식, 도식 등의 표현 완결성 3) 품질 ④ 동영상 자료 공간 비용이 적을 것 - 청명도(clarity): 화질의 고해상도를 지원 추가적 관리가 필요한 유관 포맷이 적을 것 - 충실도(fidelity): 고음 해상도를 지원 10) Clausen, L. R. 2004. Handling file formats. The State and University Library, Denmark.32 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 33
  • 18. 디지털장서 관리 및 연구 개발 견실성 - 포맷의 기술적인 특성을 쉽게 이해할 수 있는 메타데이터를 가지고 있어야 한다. 단순성 검증이 많이 되어 있을 것 ● 독립성(independency) 손실이 없을 것 - 비독점적이어야 한다. 메타데이터가 지원될 것 - 암호화 되지 말아야 한다. - 압축되어 있지 말아야 한다. 라. NDL의 디지털 포맷 선정 기준 제안 - 지적재산권 제한이 없어야 한다. - 특정 하드웨어나 운영 시스템에 독립적이어야 한다. 앞의 3 기관의 사례를 분석·종합했을 때 NDL의 경우는 [그림 Ⅳ-2]와 같은 5가지 요인(설명 - 특정 소프트웨어에 독립적이어야 한다. 성, 독립성, 일관성, 범용성, 품질)을 가지고 디지털 포맷의 선정에 활용하는 것이 바람직할 것이 - 특정 기관 또는 사건과 무관해야 한다. 다. 5가지 선정 기준 가운데 마지막의 품질의 경우는 공통적 품질 기준과 매체별 품질 기준으로 나눌 수 있다. 품질 기준은 미국 의회도서관의 품질 기능성 요인을 그대로 활용한다. ● 일관성(consistency) - 기술이 변해도 계속해서 사용할 수 있어야 한다. NISO LC Denmark NDL - 버전관리가 잘 되어야 한다. Descriptive Descriptive Descriptive Descriptive - 포맷 이름이 변동되지 않고 유일 식별되어야 한다. Independency Independency Independency Independency ● 범용성(widely adopted) Consistency Consistency - 표준적인 매체여야 한다. Widely Widely Widely Widely - 널리 사용되고 있는 것이어야 한다. adopted adopted adopted adopted - 좋은 이용 사례가 있어야 한다. Quality Quality Quality ● 품질(quality) [그림 Ⅳ-2] 디지털 포맷 선정 요인 도출 - 공간 비용이 적어야 한다. - 추가적 관리가 필요한 유관 포맷이 적어야 한다. 1) 일반적 선정 요인 - 견실성 - 단순성 ● 설명성(descriptive) - 변환 시 손실이 없을 것 - 상호 호환과 재사용을 할 수 있도록 포맷의 생성, 이력, 용도 등과 관련된 문서가 마련되 - 매체별 품질 요인(별도 설명) 어 있어야 한다.34 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 35
  • 19. 디지털장서 관리 및 연구 개발 2) 매체별 품질 선정 요인 <1st : quality and functionality factors> <2nd : sustainability factors> ● 문서 - 문서 구조와 내비게이션의 완결성 - 배치, 폰트, 디자인 특성 등의 완결성 - 수학, 화학식, 도식 등을 표현 완결성 ● 그림 - 해상도(clarity): 화질의 고해상도를 지원 - 색상 유지(color maintenance) - 정상 그림 표현을 넘는 기능성: 벡터 그래픽스, 삼차원 모델 등 ● 음성 [그림 Ⅳ-3] NDL의 디지털 매체 선정 모형 - 해상도(fidelity): 고음 해상도를 지원 - 음장(sound field): 다채널 음 지원 다음에서는 미국의 NDIIPP 프로젝트에서 디지털 매체별 선정 특성에 따라서 평가한 결과를 - 정상음 표현 범위를 넘는 기능성: 주해에 의한 표현(예, MIDI) 소개한다. 각 매체 내에서는 또 다시 문서 유형별로 특성이 달라지기 때문에 매우 복잡한 양상을 보이고 있다. ● 동영상 - 청명도(clarity): 화질의 고해상도를 지원 가. 문서 - 충실도(fidelity): 고음 해상도를 지원 - 음장(sound field): 다채널 음 지원 문서 유형의 디지털 매체에서 고려하여야 할 품질 및 기능성 요인으로는 1) 문서 구조와 내비게 - 정상음 표현 범위를 넘는 기능성: 부호화 애니메이션, 프레임 정밀 편집, 추가 음 궤적) 이션의 완결성, 2) 배치, 폰트, 디자인 특성 등의 완결성, 3) 수학, 화학식, 도식 등을 표현 완결성 등이 대표적으로 거론될 수 있다. [표 Ⅳ-2]와 [표 Ⅳ-3]에 이러한 기준을 따라서 각 유형에 맞는 선정 특성 분석과 적정 포맷을 예시하였다.11) 4. NDL의 디지털 매체 선정 모형 및 수집 범주 선택 지침 디지털 매체의 선정은 [그림 Ⅳ-3]과 같이 우선적으로 품질과 기능성 요인을 만족시킨 후에 유 지관리 요인을 반영하는 순서로 하여야 할 것이다. 왜냐하면 유지관리 요인에 대한 평가가 아무 리 좋다고 하여도 요구되는 품질이나 기능을 구비하지 못한다면 유용성이 떨어지기 때문이다. 11) http://www.digitalpreservation.gov/formats/content/text_curator.shtml36 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 37
  • 20. 디지털장서 관리 및 연구 개발 유형 구분 유형 구분 색상 정상이상 보관 이용 보호 문서구조 배치 수식표현 해상도 의 순번 유형설명 예 순번 유형설명 예 유지 기능성 요구 요구 효과 문서 구조와 내비게이션을 중요시 해상도에 1 사전, 단행본, 보고서, 극본 등 ◎ △ × 미세 단순 하는 문서 1 고도의 예술적 그림 전문사진, 광고, 예술 작품 등 ◎ ○ 영향주지 표현 가공 말아야 함 2 단순 문서구조를 가지는 짧은 문서 기사, 수필, 연설문 등 ○ △ × 해상도에 미세 단순 2 공간 해상도를 중요시 하는 그림 지도, 그래프, 도형 등 ◎ 영향주지 표현 가공 말아야 함 브로셔, 포스터, 광고물, 어린이 3 배치와 디자인을 중요시 하는 문서 △ ◎ × 도서 등 해상도에 3 작품성이 낮은 그림 ○~△ 영향주지 말아야 함 비문자형 시각요소(수식, 도형 등) 4 학술논문, 연구보고서 등 ○ ○ ◎ 내의 정보 내용을 중요시 하는 문서 4 부수적 그림 또는 애니메이션 웹용 이미지 △ × (범례) ◎: 매우중요, ○: 중요, △: 보통, ×: 중요하지 않음 원본의 원본의 원본의 기능에 [표 Ⅳ-2] 문서 유형별 선정 특성 분석 특정 SW 5 벡터 그래픽스 CAD 도면 정밀도 기능성 기능성 영향주지 활용 유지 유지 유지 말아야 함 유형 구분 정적 삼차원 객체용 가상현실 선호 매체 유형 허용 매체 유형 6 순번 유형설명 묘사 XML+DTD HTML (범례) ◎: 매우중요, ○: 중요, △: 보통, ×: 중요하지 않음 1 문서 구조와 내비게이션을 중요시 하는 문서 SGML+DTD PDF [표 Ⅳ-4] 그림 유형별 선정 특성 분석 XML+DTD 2 단순 문서구조를 가지는 짧은 문서 SGML+DTD HTML 유형 구분 PDF 선호 매체 유형 허용 매체 유형 순번 유형설명 HTML XML+DTD+XSL 3 배치와 디자인을 중요시 하는 문서 비트맵, PDF 리치컬러, ·TIFF UNC(RGB, 24bit 이상) 비문자형 시각요소(수식, 도형 등) 내의 정보 내용을 중요시 PDF XML+DTD+수식표현기능 비압축 4 하는 문서 ·TIFF/EP 디지털 ·TIFF_UNC_EXIF 또는 TIFF ·TIFF LZW 맹인을 위한 말하는 책 XML+ANSI/NISO 카메라 5 1 고도의 예술적 그림 UNC(RGB, 24bit 이상) ·JP2_J2K_C_LL in JPX J2K Z39.86 ·JP2_J2K_C_LL in JP2 J2K ·TIFF/IT 6 이메일 내용 RFC 2822 인쇄 원본 ·PDF/X 7 일러스트레이션을 중요시 하는 문서 그림 유형 선정 기준 활용 ·TIFF_UNC 다광 데이터 [표 Ⅳ-3] 문서 유형별 적정 포맷 비트맵, 고품질 또는 ·JP2_J2K_C_LSY in 나. 그림 JPX_FF or JP2_FF 컬러, ·TIFF_UNC 인덱스된 공간 해상도를 중요시 하는 ·GIF 2 비압축 컬러 ·BMP 그림 벡터 ·PDF/A 그림 유형의 디지털 매체에서 고려하여야 할 품질 및 기능성 요인으로는 1) 해상도(화질의 고해 delivery ·PDF/X 상도를 지원), 2) 색상 유지, 3) 정상 그림 표현을 넘는 기능성(벡터 그래픽스, 삼차원 모델 등) 등 ·JP2_J2K_C_LSY in JPX_FF or JP2_FF 3 작품성이 낮은 그림 ·JPEG_DCT in JFIF 또는 JPEG_EXIF ·GIF 이 대표적으로 거론될 수 있다. [표 Ⅳ-4]와 [표 Ⅳ-5]에 이러한 기준을 따라서 각 유형에 맞는 ·GIF 선정 특성 분석과 적정 포맷을 예시하였다.12) 12) http://www.digitalpreservation.gov/formats/content/still_curator.shtml38 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 39
  • 21. 디지털장서 관리 및 연구 개발 유형 구분 4 부수적 그림 또는 애니메이션 선호 매체 유형 허용 매체 유형 순번 유형설명 5 벡터 그래픽스 ·AAC_M4A 1 서라운드 음향 ·AAC_ADIF ·QTA_AAC 정적 삼차원 객체용 가상현실 ·WMA_WMA9_PRO 6 묘사 ·MP3+ID3 ·AAC_ADIF [표 Ⅳ-5] 그림 유형별 적정 포맷 ·WAVE_LPCM-BWF ·AAC_M4A 2 모노 또는 스테레오 음향 ·WAVE_LPCM ·QTA_AAC 다. 음성 ·AIFF-LPCM ·WMA_WMA9_PRO ·WMA_WMA9 ·MP3 음성 유형의 디지털 매체에서 고려하여야 할 품질 및 기능성 요인으로는 1) 해상도(고음 해상도 ·AAC_ADIF 를 지원), 2) 음장(다채널 음 지원), 3) 정상음 표현 범위를 넘는 기능성(악보에 의한 표현) 등이 대 3 보통의 음향 ·AAC_M4A ·QTA_AAC 표적으로 거론될 수 있다. [표 Ⅳ-6]과 [표 Ⅳ-7]에 이러한 기준을 따라서 각 유형에 맞는 선정 특 ·WMA_WMA9 4 부수적인 음향 모든 형식 가능 성 분석과 적정 포맷을 예시하였다.13) ·SMF 5 악보기반 표현 ·XMF ·MODS 유형 구분 정상이상 ·RMID 보관 이용 보호 해상도 음장 의 순번 유형설명 예 기능성 요구 요구 효과 6 음향 효과 해상도에 7 오디오북 ·DTB 최소변화 복수 단순 1 서라운드 음향 ◎ 영향주지 유지 스피커 가공 말아야 함 [표 Ⅳ-7] 음성 유형별 적정 포맷 해상도에 단순 2 모노 또는 스테레오 음향 ◎~○ 영향주지 가공 말아야 함 라. 동영상 정상표현에 3 보통의 음향 스트림, 웹캐스트 등 △ 영향주지 말아야 함 동영상 유형의 디지털 매체에서 고려하여야 할 품질 및 기능성 요인으로는 1) 해상도(화질의 고 4 부수적인 음향 배경 음악 × × 해상도를 지원), 2) 충실도(고음 해상도를 지원), 3) 음장(다채널 음 지원), 4) 정상 동영상 표현 범 원본의 특정 성능 원본의 원본의 기능에 5 악보기반 표현 MIDI 정밀도 n/a SW 성능 성능 영향주지 위를 넘는 기능성(부호화 애니메이션, 프레임 정밀 편집, 추가 음 궤적) 등이 대표적으로 거론될 유지 활용 유지 유지 말아야 함 수 있다. [표 Ⅳ-8]와 [표 Ⅳ9]에 이러한 기준을 따라서 각 유형에 맞는 선정 특성 분석과 적정 포 6 음향 효과 맷을 예시하였다.14) 7 오디오북 다양함 (범례) ◎: 매우중요, ○: 중요, △: 보통, ×: 중요하지 않음. [표 Ⅳ-6] 음성 유형별 선정 특성 분석 13) http://www.digitalpreservation.gov/formats/content/sound_curator.shtml 14) (http://www.digitalpreservation.gov/formats/content/video_curator.shtml)40 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 41
  • 22. 디지털장서 관리 및 연구 개발 유형 구분 정상이상 ·MPEG-2 보관 이용 보호 해상도 음장 의 4 자료용 동영상 ·MPEG-4_AVC 순번 유형설명 예 기능성 요구 요구 효과 ·MPEG-4_V 해상도에 ·MPEG-2 최소변화 복수 단순 단순 고품질 손실 고품질 손실 1 극장배급용 동영상 ◎ 영향주지 ·MPEG-4_AVC 유지 스피커 가공 가공 말아야 함 압축(공개) 압축 (독점) ·MPEG-4_V 5 인터넷 방송용 동영상 지상파 방송, 위성 방송, 케이블 최소변화 복수 단순 단순 해상도에 ·MPEG-2 2 방송용 동영상 ◎ 영향주지 저품질 유지 스피커 가공 가공 ·MPEG-4_AVC 방송 등 말아야 함 손실 압축 ·MPEG-4_V 서라운드는 정상표현에 단순 6 부가적 동영상 모든 형식 가능 3 비디오용 동영상 비디오 테이프, DVD, 인터넷 등 ◎ 스테레오에 영향주지 정규화 가공 말아야 함 ·FLA 7 동적 애니메이션 ·SVG_1_2 ·SWF 4 자료용 동영상 뉴스, 토크쇼 등 △ ·SVG_1_1 [표 Ⅳ-9] 동영상 유형별 적정 포맷 5 인터넷 방송용 동영상 △ × 6 부가적 동영상 웹캐스트, 단순 애니메이션 등 × 5. 디지털 컬렉션 구축 방향 원본의 원본의 원본의 성능에 특정 SW 7 동적 애니메이션 대화용 프로그램 정밀도 n.a. 활용 성능 성능 영향주지 가. 디지털 컬렉션 구축 지침 유지 유지 유지 말아야 함 (범례) ◎: 매우중요, ○: 중요, △: 보통, ×: 중요하지 않음. [표 Ⅳ-8] 동영상 유형별 선정 특성 분석 NISO에서 발간한 디지털 컬렉션 구축 지침 프레임워크 보고서에 따르면, 디지털 컬렉션(digi- tal collection)은 디지털 객체(digital object)로의 접근과 이용을 할 수 있도록 선정되고 조직화 유형 구분 선호 매체 유형 허용 매체 유형 된 디지털 객체들로 구성된다. 이 보고서는 또한 좋은 디지털 컬렉션에 적용되는 원칙으로 다음 순번 유형설명 ·DPX_2 과 같은 것들을 제시하고 있다. ·MPEG-2 또는 1 극장배급용 동영상 ·DCDM_1_0 MXF(MXF_GC_MPEG-2) ·MXF(MXF_GC_UNC) ·MXF(MXF_GC_ ● 좋은 디지털 컬렉션은 디지털화 전에 합의되고 문서화된 분명한 컬렉션 개발 지침에 따라 비압축, 고품질 손실 UNC) 비손실 압축 ·MJP2_FF_LL 압축(독점) 만들어진다. 2 방송용 동영상 ·MPEG-2 또는 ·MPEG-2 ● 컬렉션은 이용자가 컬렉션의 다음과 같은 특성을 이해할 수 있도록 설명되어져야 한다: 범 고품질 손실 저품질 손실 MXF(MXF_GC_MP ·MPEG-4_AVC 압축(공개) 압축 위, 포맷, 접근 제한, 소유권, 컬렉션의 신빙성, 완결성, 해석을 결정하기 위해 중요한 모든 EG-2) ·MPEG-4_V 정보 등 ·MPEG-2 또는 MXF(MXF_GC_MP ● 컬렉션은 지속적으로 유지되어야 한다. 고품질 손실 고품질 손실 EG-2) 압축(공개) 압축(독점) ·MPEG-4_AVC ● 좋은 컬렉션은 범용적이어야 하고 사용하기에 불필요한 장애물이 없어야 한다. 장애인도 이 3 비디오용 동영상 ·MPEG-4_V 용에 불편이 없어야 한다. ·MPEG-2 저품질 손실 ·MPEG-4_AVC ● 좋은 컬렉션은 지적재산권을 존중한다. 압축 ·MPEG-4_V42 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 43
  • 23. 디지털장서 관리 및 연구 개발 ● 좋은 컬렉션은 기록되는 표준적인 유용성 측정을 허용하는 이용 정보와 여타 정보를 제공하 3) 음성 유형의 전자 자원의 디지털 포맷 구축 방향 는 메커니즘을 가져야 한다. [표 Ⅳ-10]에서는 음성 유형의 전자 자원으로 특별한 지칭이 없이 음성 자원과 구전 역사 등이 ● 좋은 컬렉션은 중요하게 관련된 국가적 및 국제적 디지털 도서관 정책에 부합되어야 한다. 제시되고 있다. 따라서 음성 유형의 경우는 원하는 음질의 수준에 따라서 <부록 2>의 3. 소리유형 설명에 따라 다양한 디지털 포맷을 선택하여 활용할 수 있을 것이다. 나. 전자자원 구축 방향 4) 동영상 유형의 전자 자원의 디지털 포맷 구축 방향 <부록 1>에는 미국의 의회도서관(LC), 영국의 BL, 호주의 NLA 세 기관의 전자 자원 개발 정책 [표 Ⅳ-10]에서는 동영상 유형의 전자 자원으로 특별히 지칭된 것이 없다. 따라서 동영상 유형 을 소개하였다. 이를 디지털 포맷에 따라 구분하면 [표 Ⅳ-10]과 같이 정리할 수 있다. 이것을 살 도 음성 유형의 경우처럼 음질 및 화질의 수준에 따라서 <부록 2>의 4. 동영상 유형 설명에 따라 펴보면, 문자 유형에는 전자저널, 전자책, 악보, 신문, 간행물 등이 있고, 그림 유형으로는 지도와 다양한 디지털 포맷을 선택하여 활용할 수 있을 것이다. 사진이 있다. 음성 유형의 경우는 언급만 있고 동영상 유형의 경우는 세 곳 모두 언급하지 않고 있다. 구분 LC BL NLA 문자 전자 저널, 전자 책 전자 저널 악보, 책, 신문, 간행물 그림 지도 사진, 지도 콘텐츠 스트림 음성 음성 자원 구전 역사 동영상 물리적 매체 CD-ROM, DVD-ROM 음성 CD 기타 웹 사이트, 온라인 DB 웹 아카이빙 [표 Ⅳ-10] 세계 주요 국가 도서관의 전자 자원 범위 1) 문자 유형의 전자 자원의 디지털 포맷 구축 방향 [표 Ⅳ-10]에서는 문자 유형의 전자 자원으로 전자 저널, 전자 책, 악보, 신문, 간행물 등을 확 인할 수 있다. <부록 2>의 문서유형에 따르면, 전자책에 선호되는 디지털 포맷으로는 XML과 SGML이라 할 수 있고, 전자 저널의 경우는 PDF라고 할 수 있다. 2) 그림 유형의 전자 자원의 디지털 포맷 구축 방향 [표 Ⅳ-10]에서는 그림 유형의 전자 자원으로 지도와 사진이 있다. <부록 2 >의 2. 그림유형 설 명에 따르면, 사진에 선호되는 디지털 포맷은 TIFF 계열의 파일 포맷이 대표적이라 할 수 있고, 지도의 경우는 TIFF_UNC와 PDF/A, PDF/X 등이 선호된다.44 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 45
  • 24. 디지털장서 관리 및 연구 개발 제5장 장서수집수준정의 3) Bushing17) “미래 장서관리에 관한 의사결정의 근거를 제시하는 체계적인 주제기반의 장서조사” 4) Coleman18) “지적인 탐구영역을 계층화된 주제구분을 이용하여 기술하는 것” 5) Evans & Saponaro19) “컨스펙터스 모델은 사실상 현존하는 장서에 다양한 가치를 설정해주고 도서관이 유지 혹은 보 존하고자 하는 장서의 수준의 기준(standard)이 되었다. 그것은 장서의 정책(policy)과 평가 1. 컨스펙터스(Conspectus)의 개념 (assessment) 모두를 위한 도구(tool)가 된다.” “컨스펙터스 모델은 장서정책(collection policy)을 공식화하는데 도움을 준다. 왜냐하면 컨스 가. 사전적 의미 : conspectus[ ] n. 개관; 개요, 적요 펙터스 모델은 장서개발 직원으로 하여금 구체적인 주제별로 분석하게 하도록 만들기 때문이다. 보통, 컨스펙터스 모델은 주제 분석(subject analysis)의 기준(basis)으로서 LC 시스템과 함께 나. 컨스펙터스에 대한 학자들의 포지셔닝 DDC용으로 변환된 테이블을 사용한다.” “다양한 종류의 200개 이상의 도서관들이 Pacific Northwest 모델을 성공적으로 사용하였다. 15) 1) Gwinn & Mosher Pacific Northwest 모델은 기본적인 컨스펙터스 구조를 사용하지만 모든 유형의 도서관이 사용 “컨스펙터스는 미국연구도서관위원회 회원도서관의 현재 구성된 장서의 강도(existing col- 할 수 있는 코딩 시스템(coding system)을 제공한다. 도서관이 선택할 수 있는 네 가지의 주제수 lection strength)와 장래에 수집하고자 하는 장서의 강도(future collecting intensity)에 대한 준이 있다.” 개요나 요약이다. 이 개요나 요약은 주제, 분류기호 혹은 주제와 분류기호 순으로 배열되며, 각 주제별로 기존장서강도와 장차 수집하고자 하는 장서강도의 수준을‘0’ ‘5’ 에서 라는 표준화된 6) 송영희 외20) 기호로 나타내고 있다.” “컨스펙터스란‘개설, 개요, 요약’ 이라는 사전적 의미를 가지고 있으나, 장서개발과 관련하여 서 사용되는 컨스펙터스란 도서관장서의 주제를 주류(division), 강목(category), 요목(subject) 16) 2) Ferguson & Rustein 별로 구분하고, 각 주제별로 평가대상 장서의 현재장서수준(Current Collection Level), 수집의 “과거의 장서에 대한 심도(past collecting depth)인 기존 장서강도와 현재의 장서수집에 대한 지수준(Acquisition Commitment Level), 목표장서수준(Collection Goal Level)을 표준화한 심도(current collecting depth)인 현재 개발 중인 장서의 강도를 제시하는 하나의 개요” 장서수준기호로 표시할 수 있도록 기술해 놓은 도구를 가리키는 용어이다.” 17) Bushing, M,“The Conspectus: Possible Process and Useful Product for The Ordinary Library” ,《In Conspectus Assessment: A Look at the RLG Conspectus》Haworth Press, 1992, pp. 81-95. , 15) Gwinn, N. E. and Mosher, P. H.“Coordinating Collection Development: The RLG Conspectus” ,《College and 18) Coleman, J,“The RLG Conspetus: A History of Its Development and Influence and a Prognosis”,《In Conspectus Research Libraries》Vol. 44, No. 2, pp. 128-140. , Assessment: A Look at the RLG Conspectus》Haworth Press, 1992, pp. 25-43. , 16) Ferguson, A. W. Grant, J. and Rustein, J. S,“The RLG Conspectus, Its Use and Benefits” ,《College and Research 19) G. Edward Evans, Margaret Zarnosky Saponaro, 「Developing Library and Information Center Collections」 Libraries》Vol. 49, No. 2, pp. 197-206. , 20) 송영희 외, 「디지털시대의 장서관리」한국도서관협회, 2005. ,46 제1부 장서개발정책 기본모형 연구·개발 및 수립 제5장 장서수집 수준 정의 47
  • 25. 디지털장서 관리 및 연구 개발 7) 박진희21) - 200개의 주제(subject) 레벨: 많은 단과대학(colleges)들이 사용하고 있음 - 500개의 필드(field) 레벨: 많은 단과대학(colleges)들이 사용하고 있음 “컨스펙터스란 도서관 장서를 주류(主類), 강목(綱目), 요목(要目)별로 구분하고, 각 주제별로 - 5,000개의 토픽(topic) 레벨: 연구용 장서를 위해 필요한 레벨 장서에 대한 개요나 요약을 제시한 것이다. 장서에 대한 개요나 요약이란 컨스펙터스 주제번호별 · 일반적으로 도서관에서 채용하고 있는 몇 개의 분류기호를 군집시켜 여기에 부여하는 특정번호 로 장서의 현재장서수준(CL), 수집의지수준(AC), 목표장서수준(GL)을 표준화된 장서수준기호로 컨스펙터스주제번호 · 컨스펙터스주제번호는 3개의 문자와 일련의 숫자로 구성 (Conspectus - 3개의 문자: 해당 분류기호의 군집이 속해 있는 주류(division)를 나타냄 명시하는 것을 의미한다. 장서수준기호로는 등간척도로 구성된‘0’ ‘5’ 에서 까지의 기호가 사용 line number) ex) 농업은‘AGR’ 표시. 주류를 나타내는 이 3개의 문자 다음에는 해당 주제번호를 나타내는 일 로 련의 숫자가 기록됨 된다.” · 컨스펙터스주제기술어는 분류표의 주제기술어와 거의 일치함 주제기술어 · 주류(division)별 컨스펙터스주제번호 수는 사용하는 분류표에 따라 차이가 있음 컨스펙터스(conspectus)란, 그 사전적으로‘개설’ ,‘개요’ 라는 의미를 가지고 있으며, 도서관 (subject descriptor) - 미국서부지역도서관망 LCC 용: 4,540개의 주제번호 - DDC 용: 4,714개의 주제번호 이 ① 현재 보유하고 있는 장서, ② 수집의지, ③ 앞으로 개발하고자 하는 장서의 강도를 평가하 고 기술해주는 도구이다. 컨스펙터스를 이용한 장서평가는 도서관의 장서를 주제별로 구분(주류, · 컨스펙터스는 각 주제별 장서수준을 세 가지 차원으로 구분하고 장서수준기호(collection level code) 라는 표준화된 척도를 이용하여 장서의 응답능력 즉 이용자의 요구를 충족시켜주는 정도와 도서관목 강목, 요목)하고, 각 주제에 대해 장서수준(collection level)을 평가하여 장서수준기호(collec- 표를 성취하기 위한 책임능력의 정도를 기술 장서수준 · WLN 컨스펙터스의 장서수준 구분 tion level code)로 기술한다. - 현재장서수준(CL): 도서관에 소장되어 있는 이용 가능한 장서에 대한 강도를 의미 (collection level) - 수집의지수준(AC): 개발 중인 자료를 수집하려는 의지수준. 즉 특정 주제분야의 장서개발에 현재 투 자되는 예산 및 노력의 정도 2. 컨스펙터스의 구성요소 및 유형 - 목표장서수준(GL): 도서관 목적을 달성하고, 이용자요구를 충족시켜 줄 수 있는 장서를 구성하기 위 하여 도서관이 계획하고 있는 미래의 장서수준 · WLN 컨스펙터스는 11개의 장서수준 기호 사용. 이는 RLG 컨스펙터스의 장서수준기호 1~5가 나타내 가. 컨스펙터스 구성요소 는 장서수준의 의미와 해석범위를 확대한 것 · Pacific Northwest Collection Assessment Manual은 미국의 200개 이상의 도서관에서 사용하는 장서수준기호 것으로 코드를 자료량에 따라 부여할 수 있어 관종이나 크기에 관계없이 비교적 간단하게 적용할 수 (collection level code) 컨스펙터스는 주제분류기호(subject classification code), 컨스펙터스 주제번호(Conspectus 있다. 이는 RLG 컨스펙터스가 대규모 연구도서관에 적합하다는 한계점을 극복하기 위해 개발되었음. · 미국도서관협회(ALA)의「장서정책문서에 관한 지침서」 에서는 도서관들이 WLN의 장서수준기호를 이 line number), 주제기술어(subject descriptor), 장서수준(collection level), 장서수준기호(col- 용하여 장서수준을 부여할 것을 권고하였음(1979) lection level code), 언어범위기호(language coverage code), 장서설명(comment)으로 구성되 · 각 주제별 장서의 언어범위특성을 나타내는 기호를 의미 어 있다. · 언어범위기호는 장서수준기호와 결합하여 표기되며 주로 장서수준 3 ~ 5(학습 및 교육지원수준 ~ 언어범위기호 망라적인수준)에 해당하는 장서가 구축되어 있는 연구도서관에서 주로 이용 (language coverage - E: 영어자료가 우세한 장서 구성요소 설명 code) - F: 영어자료 이외의 외국어 자료가 일부 소장된 장서 - W: 여러 언어로 된 자료를 광범위하게 선택하고 있는 장서 · WLN 컨스펙터스 모델에 나타나는 각 주제는 주류(division), 강목(category), 요목(subject)이라는 세 - Y: 영어 이외의 1개 외국어 자료로만 구성된 장서 개의 계층구조를 가짐 - 주류: 계층적 주제 중 가장 상위의 개념. 총 24개의 주제 · 컨스펙터스에는 실제로 분류표에 나열되어 있는 모든 주제에 대하여 컨스펙터스주제번호가 모두 부여 - 강목: 주류의 하위주제로 500여 개로 구성. 이는 LCC 분류기호와 거의 일치 되어 있는 것이 아니라 중요하다고 판단된 주제에 대하여만 컨스펙터스주제번호가 부여되기 때문에 주제분류기호 - 요목: 강목의 하위주제로서 약 7,000여 개로 구성 장서설명 이 번호가 부여되지 않은 주제분야의 장서에 대하여는 별도로 언급할 필요가 있음 (subject classification · Pacific Northwest 모델의 주제수준 분류 (comment) · 여러 측면에서 주제배열의 한계성을 극복하고 장서수준기호로 설명하지 못하는 장서상황을 설명할 수 code) - 20개의 주요 LC 구분: 가장 세분화되어 있지 않으며 작은 도서관과 중간 규모의 비특성화된 도서관 있는 장치로서 정서설명을 마련함 (nonspecialized libraries)에 가장 적합 · 예외적인 상황을 컨스펙터스에 반영시켜 장서를 보다 정확히 기술하고 객관적으로 평가할 수 있음 21) 박진희, “컨스펙터스방법을 이용한 장서평가 연구” , 《정보관리학회지》제15권, 제2호, 1998, pp. 163-191. , [표 Ⅴ-1] 컨스펙터스 구성요소48 제1부 장서개발정책 기본모형 연구·개발 및 수립 제5장 장서수집 수준 정의 49
  • 26. 디지털장서 관리 및 연구 개발 나. 컨스펙터스 유형 2) WLN-OCLC Conspectus 1) RLG Conspectus ● 미국 서부도서관네트워크(WLN) 컨스펙터스는 미국연구도서관위원회(RLG) 컨스펙터스의 장서수준기호‘1-5’ 나타내는 장서수준의 의미와 해석범위를 1a, 1b, 2a, 2b, 3a, 3b, 3c, 가 ● 일반적으로 알려진 컨스펙터스. 4, 5 등으로 세분하고 있다. ● 미국의 연구도서관그룹(RLG)이 작성한 것으로 이것은 다양한 주제분야의 장서수준을 기술 ● 규모가 작거나 연구도서관 이외의 다른 관종의 도서관에서도 컨스펙터스를 사용할 수 있도 하는데 적합하다. 록 하였다. ● RLG 컨스펙터스는 미국의회도서관 분류체계(LCC) 시스템을 기반으로 하고 있으며 주제범 장서수준기호 내용 위와 주제디스크립터로 구성된 각각의 주제카테고리에 대해서 장서수준(기존장서의 강도라 ·Out of Scope Level 0 - 도서관의 자료수집범위에서 벗어나는 주제분야의 장서로 도서관이 이 분야의 자료를 수집하지 않는 고도 함. 즉 장서의 질), 수서의지(형행 수집 강도라고도 함. 즉 특정주제분야의 장서개발에 것을 원칙으로 함 현재 투자되는 예산 및 노력의 정도), 그리고 도서관이 원하는 장서목표(바람직한 수집 강도 ·Minimal Level 라고도 함. 즉 미래의 도서관의 수준)를 장서수준코드에 따라 기술한다. Level 1 - 최저수준으로 매우 기본적인 자료 이외에는 어떠한 자료도 거의 선택하지 않음 - 최저수준은 아래와 같이 세분화할 수 있다. 장서수준기호 내용 ·Minimal Level, Uneven Coverage ·Out of Scope Level 1a - 불균형적 최저수준으로 해당 주제에 대한 자료를 극소수 선택함 Level 0 - 도서관의 자료수집범위에서 벗어나는 주제분야의 장서로 도서관이 이 분야의 자료를 수집하지 않는 - 주제에 관한 내용이 장서에 비체계적으로 나타남 것을 원칙으로 함 ·Minimal Level, Even Coverage · Minimal Level Level 1 - 균형적 최저수준으로 이 수준에서는 해당 주제분야의 자료를 극소수로 선택하지만 그 분야의 기본 - 최저수준으로 매우 기본적인 자료 이외에는 어떠한 자료도 거의 선택하지 않음 Level 1b 적인 저자, 일부 핵심저자가 장서에 포함되며, 광범위한 주제범위를 다룸 · Basic Information Level - 특정 주제에 관한 기본적인 질문에 응답할 수 있음 Level 2 - 기초정보수준으로 한 주제에 관하여 입문적인 지식과 개요를 제공함 ·Basic Information Level · Study or Instructional Support Level Level 2 - 기초정보수준으로 한 주제에 관하여 입문적인 지식과 개요를 제공함 - 학습 및 교육지원수준으로 이 수준은 한 주제분야에 관한 지식을 체계적으로 추가하고 유지하는 데 - 기초정보수준은 아래와 같이 세분됨 Level 3 적합함 - 전문적 연구를 지원하기에는 낮은 수준 ·Basic Information Level, Introductory - 독립연구, 학부 및 대학원 교육은 물론 공공 및 특수도서관 이용자의 학문적 요구를 지원하기에 적합함 - 입문단계의 기초정보수준으로 하나의 주제를 소개하고 정의하는 자료를 제공함 Level 2a - 입문단계의 기초정보수준은 한 주제에 관한 개론적인 과목에 등록한 학생이나 한 주제에 관하여 일 · Research Level 반적인 정보를 원하는 이용자를 지원하기에 적합함 - 연구보고서, 새로운 연구결과, 과학적 검증결과, 기타 연구자들에게 유용한 정보는 물론 학위논문과 Level 4 독립연구에 필요한 중요 정보원을 포함함 ·Basic Information Level, Augmented - 박사학위 프로그램 및 기타 순수연구를 지원함 Level 2b - 고급단계의 기초정보수준이며,‘2a’ 광범위하고 심도 있게 기초정보를 제공함 보다 - 고등교육을 받은 이용자 혹은 전문대학생, 대학 학부생에게 기초정보를 지원하기에 적합함 · Comprehensive Level - 망라적 수준이라 하며, 한 도서관이 매우 제한된 주제분야에 대하여 모든 실용 언어로 쓰인 기록지식 ·Study or Instructional Support Level Level 5 즉 모든 중요 자료를 소장하고자 노력함 - 학습 및 교육지원수준으로 이 수준은 한 주제분야에 관한 지식을 체계적으로 추가하고 유지하는 데 - 한 주제분야에 관한 전문적인 장서를 유지하기에 적합하며, 자료를 포괄적으로 소장하는 것에 목적을 둠 Level 3 적합함 - 전문적 연구를 지원하기에는 낮은 수준 - 독립연구, 학부 및 대학원 교육은 물론 공공 및 특수도서관 이용자의 학문적 요구를 지원하기에 적합함 [표 Ⅴ-2] RLG 컨스펙터스 장서수준기호50 제1부 장서개발정책 기본모형 연구·개발 및 수립 제5장 장서수집 수준 정의 51
  • 27. 디지털장서 관리 및 연구 개발 Basic Study or Instructional Support Level PNWCP - 초급단계의 학습 및 교육지원수준으로 한 주제분야의 기본적인 주제나 핵심주제에 관한 지식을 전 1. 주제별 단행본 수 2. 표준 주제서지에 포함된 자료의 소장 비율 Level 3a 달하고 유지하는데 적합함 - 평생교육 수강자의 몇몇 초보적인 독립연구에 관한 요구를 지원하고, 대학학부 하급학년의 교과과정 1a 수집하지 않는 단행본 수 1b 5% 또는 이하 을 지원하기에 적합함 1b 2,500종 미만 2a 10% 이하 2a 2,500 ~ 5,000종 2b 15% 이하 Intermediate Study or Instructional Support Level - 중급단계의 학습 및 교육지원수준으로, 한 주제분야에서 기본적인 주제 혹은 핵심주제에 관한 지식 2b 5,000 ~ 8,000종 3a 15 ~ 20% Level 3b 을 전달하고 유지하는데 적합함 3a 8,000 ~ 12,000종 3c 30 ~ 40% - 학부의 상급학년 교과과정을 지원하기에는 충분하나 석사학위 프로그램을 지원하는 데는 적합하지 않음 3b 12,000종 이상 4 75 ~ 80% Advanced Study or Instructional Support Level [표 Ⅴ-4] PNWCP 컨스펙터스 장서수준기호 - 고급단계의 학습 및 교육지원수준으로 한 주제분야 중에서 핵심주제 및 2차 주제에 관한 지식을 전 Level 3c 달하고 유지하기에 적합함 - 연구도서관 내의 주제전문가의 연구와 같이 전문적인 연구는 물론 석사학위 프로그램을 지원하기에 위 3가지 모델의 특징을 요약하면 아래 표와 같다. 적합함 RLG WLN PNWCP Research Level - 연구보고서, 새로운 연구결과, 과학적 검증결과, 기타 연구자들에게 유용한 정보는 물론 학위논문과 도서관 자료수집 범위에서 벗어나는 도서관 자료수집 범위에서 벗어나는 Level 4 0 0 1. 주제별 단행본 수 독립연구에 필요한 중요 정보원을 포함함 주제분야의 장서 주제분야의 장서 - 박사학위 프로그램 및 기타 순수연구를 지원함 1 최소수준 1 최소수준 1a 수집하지 않는 단행본 Comprehensive Level 1a 불균형적 최소수준 1b 2,500종 미만 - 망라적 수준이라 하며, 한 도서관이 매우 제한된 주제분야에 대하여 모든 실용 언어로 쓰인 기록지 1b 균형적 최소수준 2a 2,500 ~ 5,000종 Level 5 식 즉 모든 중요 자료를 소장하고자 노력함 2 기본정보수준 2 기본정보수준 2b 5,000 ~ 8,000종 - 한 주제분야에 관한 전문적인 장서를 유지하기에 적합하며, 자료를 포괄적으로 소장하는 것에 목적 을둠 2a 입문단계의 기본정보수준 3a 8,000 ~ 12,000종 2b 고급단계의 기본정보수준 3b 12,000종 이상 [표 Ⅴ-3] WLN 컨스펙터스 장서수준기호 3 학습 및 교육지원 수준 3 학습 및 교육지원 수준 2. 표준 주제서지에 포함된 자료의 소장 비율 3a 초급 학습 및 교육지원 수준 1b 5% 또는 이하 3) Pacific Northwest Collection Project Conspectus 3b 중급 학습 및 교육지원 수준 2a 10% 이하 3c 고급 학습 및 교육지원 수준 2b 15% 이하 4 연구수준 4 연구수준 3a 15 ~ 20% ● Pacific Northwest Collection Project에서 개발한 모델이다. 5 망라적 수준 5 망라적 수준 3c 30 ~ 40% ● RLG 컨스펙터스가 대규모 연구도서관에 적합하기 때문에 적용이 어려운 도서관이 존재한 4 75 ~ 80% 다는 단점을 보완하기 위해 고안되었다. ● Pacific Northwest 모델은 미국의 200개 이상의 도서관에서 사용하는 것으로 코드를 자료 [표 Ⅴ-5] 컨스펙터스 장서수준기호 의 양에 따라 부여할 수 있어 관 종이나 크기에 관계없이 비교적 간단하게 적용할 수 있다.52 제1부 장서개발정책 기본모형 연구·개발 및 수립 제5장 장서수집 수준 정의 53
  • 28. 디지털장서 관리 및 연구 개발 3. 컨스펙터스 수정 Basic Information - 주제영역을 소개하고 정의해주며, 이용 가능한 다양한 정보원을 알려주는 최신의 자료(인쇄, 전자)에 접근할 수 있음 가. 컨스펙터스 수정 사례 - 사전류(dictionaries), 백과사전류(encyclopedias) 등을 포함하며, CD-ROM을 포함한 적합한 서지 Level 2 DB(bibliographic databases), 기본적이고 중요한 저서, 편람(handbooks), 매뉴얼(manuals), 필 름(films), 청각자료(sound recording), 대중적이거나 중요한 연속간행물(serials)이 포함되며, 인터 넷 자원에 접근할 수 있음 1) Johnson22) - 일반적인 질의, 학교 및 일부 학부생 교육, 그리고 대중의 수준에 맞는 정보를 지원함 ● 인쇄매체가 도서관장서의 주류를 이루던 1970년대에 개발된 컨스펙터스는 정보기술의 발달 - 학부과목의 심화과정(advanced undergraduate course)을 지원하기에는 부족함 로 도서관의 중요 정보자원으로 부각된 전자자료의 역할을 반영하기 위하여 1990년대 중반 Basic Information: Introductory - 해당주제를 소개하고 정의하는 자원을 제공함 컨스펙터스 수준의 정의가 개정되었다. - 텍스트(textbooks), 주제영역의 발전에 대한 역사적 기술(historical descriptions), 해당 분야의 핵 Level 2a ● 전자자료는 전자자료의 이용에 대한 정책과 절차가 기존의 다른 도서관 자료 이용 정책과 심 토픽 관한 기본서(general works)와 같은 기본적인 참고자료원(reference resources)과 설명 서(explanatory works)를 포함함 절차와 다르지 않다면 인쇄매체와 동등한 것으로 간주하여야 한다고 보며, 개정된 컨스펙터 - 인터넷 자원에 대한 접근을 제공함 스에서는 이용자를 전자자료로 링크 시켜주기 위한 도서관 웹 인터페이스 상의 메뉴 선택사 Basic Information: Augmented 항(menu options)을‘한정된 접근(defined access)’ 용어로 지칭하고 있다. 이란 - 해당 주제분야에 보다 광범위하고 깊이 있는 수준의 기초정보(basic information)가 제공됨 - 보다 광범위한 기초설명서(basic explanatory works), 역사적 기술(historical descriptions), CD- ROM을 포함한 참고정보원(reference resources)이 장서에 포함되며, 해당 주제분야를 소개하고 2) Clayton & Gorman23) Level 2b 정의하는 정기간행물(periodicals)도 장서에 포함됨 - 인터넷 자원에 대한 접근이 가능함 ●‘레벨2’부터 전자자원의 수집 및 접근을 통한 이용이 이루어지며, 전체적인 장서수준기호 - 해당 주제분야의 기초과정에 있는 학생뿐만 아니라 공공도서관 및 전문도서관(special libraries) 이 는 기존의 WLN 장서수준기호와 유사하다. 용자의 기초적 정보요구를 지원할 수 있음 장서수준기호 내용 Intermediate Out of Scope - 학부생(undergraduate)과 대부분의 대학원강의(graduate instruction), 일련의 독립적인 연구, 실 - 주제분야에서 벗어나는 자료(resource)로서 도서관은 이러한 자료를 수집하지 않고 접근(access)을 무에서 비롯된 관심이나 전문적인 질의를 지원할 수 있는 넓은 범위의 자원을 포함함 Level 0 - 전문적 연구를 지원하기엔 부족하지만, 해당 주제분야의 지식을 체계적으로 유지하고 전달하는데 적 제공하지 않음 - 인터넷 자원(internet resources)에 대한 전자적 접근(electronic access)이 제한됨 Level 3 합함 - 기초적인 참고자료와 서지자료(CD-ROM 포함), 중요한 고전자료(classic retrospective materi- Minimal als), 주요 저자들의 저서를 모두 포함한 완벽한 컬렉션, 부가적인(secondary) 작가들의 저서 중 선 Level 1 - 최소수준으로서 매우 기초적인 수준을 넘지 않음 정된 자료, 대표적인 저널 등 넓은 범위의 기본서들이 포함됨 - 인터넷 자원에 대한 전자적 접근은 주로(primarily) 제한됨 - 인터넷 자원뿐만 아니라 적합한 온라인 데이터베이스에 대한 접근을 제공함 Minimal with Uneven Coverage Intermediate: Introductory - 해당주제에 대한 자료를 극소수 선택함 - 이 레벨의 정보자원은 해당 주제분야의 주요한(primary) 토픽에 대한 지식을 유지하고 전달하는데 Level 1a 적합함 - 주제분야에 대한 장서가 비체계적(uneven)으로 수집됨 - 인터넷 자원에 대한 전자적 접근은 주로(primarily) 제한됨 - 고전자료, 주요 토픽과 관련한 모든 주요 저널, 부차적인(secondary) 토픽과 관련한 선택된 저널과 Level 3a 독창성 있는 저서, 기초적인 참고자료와 서지자료(CD-ROM 포함) 등이 이 레벨의 장서에 포함됨 Minimal with Even Coverage - 인터넷 자원뿐만 아니라 적합한 온라인 데이터베이스에 대한 접근이 제공됨 - 해당주제에 대한 극소수의 자료를 선택하지만, 그 분야의 핵심 저자, 일부 핵심 저서가 장서에 포함됨 - 학부생 강의뿐만 아니라 공공도서관과 연구도서관 고객들의 독자적 연구 활동과 실무과정에서 발생 Level 1b - 인터넷 자원에 대한 전자적 접근은 주로(primarily) 제한됨 한 요구를 지원하기에 적합하지만 대학원과정(postgraduate course)을 지원하기에는 부족함 Intermediate: Augmented 22) Johnson, Peggy, 「Fundamentals of Collection Development & Management」ALA, 2004, p.277. , - 해당 주제분야의 주요한 토픽과 부차적인 토픽에 관한 지식을 유지하고 전달하는데 적합함 Level 3b 23) Clayton, Peter, Gorman, G. E,“Updating conspectus for a digital age”,《Library Collections, Acquisitions & - 해당 주제분야와 관련한 주요하고 독창성 있는 다수의 저서 및 저널들에게로 접근이 가능함 Technical Services》Vol 26, 2002, pp. 253-258. ,54 제1부 장서개발정책 기본모형 연구·개발 및 수립 제5장 장서수집 수준 정의 55
  • 29. 디지털장서 관리 및 연구 개발 - 다수의 주요한 고전자료, 부차적인 저자의 저서 컬렉션, 연구(research)·테크닉(techniques)·평 ● 다음과 같은 조건을 만족시킨다면, 전자저널은 외부에 저장되어 있든 내부에 저장되어 있든 가(evaluation)에 관한 심층적인 논의를 제공하는 저서, 기초적인 참고자료와 서지자료(CD-ROM 상관없이 인쇄저널과 동등한 가치를 지닌다고 언급하고 있다. 포함)가 포함됨 Level 3b - 인터넷 자원뿐만 아니라 적합한 온라인 데이터베이스에 대한 접근을 제공함 - 접근할 수 있는 전자저널은 인쇄물과 동일하다. - 모든 학부생, 대학원생 과정을 지원하기에 적합하며, 공공도서관과 연구도서관 고객의 보다 심화된 독자적 연구와 실무과정의 요구를 지원하기에 적합함 - 접근할 수 있는 충분한 단말기가 있다. - 이용자에게 부과되는 정보이용에 대한 추가적인 비용이 없다. Research - 사료(historical material)를 포함한 소급자료(retrospective resources)와 현시대자료(current ● 논문(monographs), 정기간행물(periodicals), 이미지(images) 등의 전자자원은 반드시 자 resources) 모두에 접근이 가능함 - 이 레벨의 장서는 대학원과정과 독자적인 연구를 지원함 관에 저장되어 있어야 하는 것은 아니며, 온라인으로 접근할 수 있는 자원도 장서로서 인정 Level 4 - 주요 인쇄정보원에 대한 접근이 가능하며, 모든 종류의 중요한 참고자료(인쇄와 전자 모두)들과 다방 된다. 면의 전공논문(specialized monographs), 매우 방대한 저널(전자저널 포함)과 해당분야의 서지, 초 록, 색인서비스로의 즉각적인 접근, 연구 결과물과 비서지 데이터베이스(non-bibliographic data- ● 반드시 소장한 자료에 대한 자료만을 장서로 인정하는 것은 아니며 즉각적으로 이용 가능한 bases)가 포함됨 - 원본 및 단명한 자료(ephemera)를 포함한 모든 적합한 포맷과 언어의 자료들이 포함됨 전자자원 역시 해당 도서관의 장서로 포함한다. 하지만 상호대차 등을 통해 이용할 수 있는 비 즉각적인 자료는 해당 도서관의 장서로 포함시키지 않는다. Comprehensive - 해당분야에서 적절한 언어로 되어있으며 합리적으로 가능한 모든 중요한 기록된 지식(출판물, 필사 본, 전자매체와 다른 형태)을 포함함 Level 5 - 이 레벨의 수집강도(collecting intensity)는 모든 이용 가능한 온라인 자원으로 보완된 특수한 장서 (special collection)를 유지함 장서수준기호 내용 - 아카이브(archive)와, 망라성(exhaustiveness)을 목적으로 함 Out of Scope Level 0 - 도서관은 이 주제에 대한 어떤 형태의 자료도 의도적으로(intentionally) 수집하지 않음 [표 Ⅴ-6] 수정된 컨스펙터스 장서수준기호 #1 Minimal Information Level - 주제분야에 대한 최소한의 질의(inquires)를 지원할 수 있는 장서 - 논문(monographs)과 참고자료(reference works)를 포함한 일반적인 자료에 대한 아주 제한적인 3) Biblaz24) 장서(a very limited collections) Level 1 - 해당 주제를 직접적으로 다루고 있는 정기간행물과 심층적인(in-depth) 전자정보자원은 수집되지 ● 수정된 컨스펙터스 장서수준기호정의(the revised Conspectus collection depth indica- 않음 - 장서는 정보의 최신성을 위해 종종 그리고 체계적으로 리뷰(review)되어야 함 tor definitions)는 1996년과 1997년 초에 WLN(Western Library Network)의 도움을 받 - 시대에 뒤떨어진 판(editions)과 출판물(titles)은 회수되어야 함 은 ARL의 후원으로 개발되었으며, 기존의 장서수준기호를 최대한 유지하면서 개정되었다. - 고전적(classic)이거나 표준적인(standard) 고전자료(retrospective materials)는 유지되어야 함 ● 개정된 정의는 장서개발에 있어 비인쇄(non-print)형태와 전자(electronic)형태의 정보에 Basic Information Level - 주제영역을 소개(introduce)하고 정의(define)할 수 있는 장서 대한 access vs. ownership 이슈를 보다 적합하게 다루고자 하는 요구를 반영한다. - 다른 곳에 존재하고 있는, 이용 가능한 다양한 정보를 알려줌 ● 음악, 영화 등의 분야와 같이 일반적인 단행본, 논문, 저널 등의 자료보다는 음악파일, 필름, Level 2 - 이 장서는 대학 2학년까지의 강의를 충족시킬 수 있는 수준의 자료 - 제한적인(limited) 논문(monographs)과 참고자료(reference works) CD-ROM등의 자료가 더 적합한 주제영역은 주기를 달아줄 것을 제안함. 이는 기존의 인쇄 - 제한적인 일반 정기간행물의 소급본(retrospective general periodicals) 25) - 자관 소장 혹은 외부로의‘한정된 접근(defined access)’ 을 통해 이용가능한 제한적인 전자 서 자료가 함께 서비스되는 상황에서 점차적으로 늘어나는 멀티미디어 기반 자료 및 전자자료 지도구(bibliographic tools), 텍스트(text), 데이터(data set), 저널(journals) 등 를 수용하기 위한 노력이라고 볼 수 있다. Study or Instructional Level Level 3 - 주제영역에 대한 체계적인 정보를 제공하지만 연구(research)를 지원할 수준에는 미치지 못하는 24) Biblaz, Dora,“Guidelines For A Collection Development Policy Using The Conspectus Model” International , 장서 Federation of Library Associations and Institutions Section on Acquisition and Collection Development, 2001.56 제1부 장서개발정책 기본모형 연구·개발 및 수립 제5장 장서수집 수준 정의 57
  • 30. 디지털장서 관리 및 연구 개발 - 이 장서는 대학 전(全) 학년과 대학원 초급 과정의 강의를 충족시킬 수 있는 수준 4) Burke26) - 일반적인 논문(monographs)과 참고자료(reference works)뿐만 아니라 특정 분야에 대해 선정된 호주 컨스펙터스 (Australian Conspectus: http://www.nla.gov.au/niac/conspectus/)는 논문과 참고자료도 포함된 폭넓은(extensive) 장서 - 일반적인 정기간행물과 함께 특수 분야의 대표적인(representative) 정기간행물을 포함한 폭넓은 1998년 11월까지는 NLA(National Library of Australia)에서 호주 도서관의 장서개발 활동을 장서 - 외국어 자료(foreign language materials) 중 적합한 것으로 구성된 제한적인 장서. 예를 들어, 외 기록하기 위하여 호주 컨스펙터스 데이터베이스(Australian Conspectus Database)를 운영하 Level 3 국인(non-native speaker)을 위한 외국어 학습 자료나 독일의 역사와 같은 주제에 대한 외국어 였다. 이 데이터베이스는 더 이상 존재하지 않지만, 호주 도서관의 장서개발에 관한 정보는 각 도 자료 - 잘 알려진 작가들의 작품(the works of well-known authors)과 덜 알려진 작가들의 작품(the 서관별로 유지되고 있다. 또한 Australian Libraries Gateway(ALG)를 통해서 개별 도서관에 works of lesser-known authors) 중 선택된 것들로 구성된 폭넓은 장서 - 서지도구, 텍스트, 데이터, 저널 등, 소장 혹은 외부로의 접근이 가능한 전자자원들로 구성된 폭넓은 접근할 수 있고, 호주도서관 장서평가 보고서(Australian library collection assessment 장서에 대한‘한정된 접근(defined access)’ 가능 이 reports)도 이용할 수 있다. Intermediate: Introductory - 이 레벨의 정보자원은 해당 주제분야의 주요한(primary) 토픽에 대한 지식을 유지하고 전달하는데 적합함 ●‘레벨3C’ 채용하였음 를 - 고전자료, 주요 토픽과 관련한 모든 주요 저널, 부차적인(secondary) 토픽과 관련한 선택된 저널과 Level 3a ● QUT와 같은 연구(research)를 지원하는 도서관이 레벨3, 혹은 레벨4 수준에 미치지 못하 독창성 있는 저서, 기초적인 참고자료와 서지자료(CD-ROM 포함) 등이 이 레벨의 장서에 포함됨 - 인터넷 자원뿐만 아니라 적합한 온라인 데이터베이스에 대한 접근이 제공됨 는 문제점을 개선하기 위한 것 - 학부생 강의뿐만 아니라 공공도서관과 연구도서관 고객들의 독자적 연구 활동과 실무과정에서 발생 한 요구를 지원하기에 적합하지만 대학원과정(postgraduate course)을 지원하기에는 부족함 ● 기존의 장서수준기호‘레벨4’ 외국어자료(자국어 자료 외의 외국어자료를 뜻함)의 보유수 는 준이 중요한 척도인데, 영어를 자국어로 쓰는 국가의 도서관은 상대적으로 불리한 상황이라 Research - 박사과정 연구(doctoral study)와 독립적 연구(independent research)에서 요구되는 주요 출판 고 할 수 있음.(국제적 출판 언어가 영어이므로 영어 이외의 자료를 충분히 확충하기란 쉽지 자료(the major published materials)를 포함하는 장서 - 일반적이고 특수한 논문, 참고자료들을 매우 폭넓게(very extensive) 포함한 장서 않기 때문) - 일반적이고 특수한 정기간행물들을 매우 폭넓게 포함한 장서 Level 4 ● ‘레벨3c’ 도입하였으며, 이로 인해 기존의 레벨3a와 3b의 실제 수준은 다소 낮아짐 를 - 잘 알려진 작가뿐만 아니라 덜 알려진 작가들의 연구물까지 포함한 매우 폭넓은 장서 - 서지도구, 텍스트, 데이터, 저널 등, 소장 혹은 외부로의 접근이 가능한 전자자원들로 구성된 매우 ● 예전의 레벨3b는“이 장서는 모든 학부과정과 대부분의 대학원과정연구를 지원하기에 적합 폭넓은 장서에 대한‘한정된 접근(defined access)’ 가능 이 - 역사적 연구(historical research)에 필요한 요구를 충족시키기 위해 체계적으로 보존되어 있는 오 하다.” 였지만, 새로운 레벨3b는“이 장서는 학부과정 이상의 과정과 전문적 교육 프로그램 래된 자료(older materials)를 포함 을 지원한다.” 개정 고 Comprehensive - 해당 전문분야에 대해 적용가능한 모든 언어에 대해 가능한 망라적(exhaustive)이고자 하는 장서 - 출판된 자료의 망라적인 장서 5) Digital Library SunSITE Collection and Preservation Policy27) Level 5 - 매우 폭넓은 필사본 장서(manuscript collections) ● SunSITE의 사례는 살펴보았던 장서수준(collection level)과는 달리 전자자원의 이용이 어 - 기타 모든 적절한 형태의 포맷에 대한 매우 폭넓은 장서 - 포괄적인 수준(comprehensive level)의 장서는 국가적 혹은 국제적 차원의 장서를 제공 떠한 수준에서 유지되느냐를 고려하고 있다. ● Archived, Served, Mirrored, Linked의 4단계로 구분되어 있으며, 자료의 가치에 따라 자 [표 Ⅴ-7] 수정된 컨스펙터스 장서수준기호 #2 료의 유지방법이 달라진다. 25) ‘한정된 접근(defined access)’ 이용자를 전자자료로 링크시켜주기 위한 도서관 웹 인터페이스 상의 메뉴 선택사항(menu 이란 26) Jess Burke,“Renovating Conspectus for the Digital Era: Applied at Queensland University of Technology” , options)을 뜻한다.(송영희 외,「디지털시대의 장서관리」 한국도서관협회, 2005, p.331.)‘한정된 접근’ 수준(the level of , 의 Australian Libraries Gateway(ALG): Embracing Electronic Access, NLA. defined access)은 장서수준에 따라 변화한다. 예를 들어, 전자자원의 장서에 대한 제한적인(limited) 접근에서부터 포괄적인 (http://www.nla.gov.au/libraries/hosted/embracin.html, 2007.10.12 cited) (extensive), 매우 포괄적인(very extensive) 접근이 있다. 27) http://sunsite.berkeley.edu/Admin/collection.html (2007.10.12 cited)58 제1부 장서개발정책 기본모형 연구·개발 및 수립 제5장 장서수집 수준 정의 59
  • 31. 디지털장서 관리 및 연구 개발 수준 내용 유지수준 내용 자료가 SunSITE에 속해되어 있으며, SunSITE에서 영구적으로 이용가능하게 하고자 하는 지적 콘텐 De-accessioned 리뷰(review) 후 한 번도 사용되지 않는 자료 archived 츠(intellectual content) 검색(searching)을 편리하게 하기 위해 도서관이 제공하는 전자적 도구(aids)와 메타데이터(metadata) Finding Aids - 이 메타데이터는 도서관의 디지털장서와 함께 구성되지만 저장(store), 관리(manage), 유지(maintain) 자료가 SunSITE 내에 존재하지만‘아카이브(archive)’수준까지 영구적으로 서비스하고자 하는 자료 는 장서와 개별적으로 이루어짐 serverd 는 아님 Linked 자료는 다른 곳에 저장(hosted)되어 있으며, 해당 도서관은 그 위치를 알려줌. 자료에 대한 통제권은 없음 다른 곳에 존재하고 있는 자료의 복사본으로서 SunSITE에 속해 있는 자료이며, 아카이빙(archiving) 자료는 물리적으로 다른 곳에 저장되고 유지되지만(다른 기관에 의해), 해당 도서관은 이 자료에 대해 될 자료는 아님 Brokered 협의된 접근권한(negotiated access)을 가짐 mirrored 도서관 보다는 기관(institution)에서 이 자료를 주로 관리함 다른 곳에 존재하는 자료의 복사본이 도서관에 저장되어 있으며, 아카이브(archive) 하지는 않음 Mirrored 이 자료는 다른 곳에 존재하는 자료로서 SunSITE는 그 위치를 알려줌 다른 기관이 이 자료의 유지 대한 책임을 가지고 있음 linked SunSITE는 그 정보에 대해 아무런 통제권이 없음 Served 자료가 도서관에 저장되어 있지만, 이것을 지속적으로 이용가능하게 하는 수준은 아님 자료가 도서관에 저장되어 있으며, 이 자료는 영구적으로 이용 가능하도록 하고자 하는 지적 콘텐츠 [표 Ⅴ-8] SunSITE 전자자원 유지수준 Archived (intellectual content) [표 Ⅴ-10] 유지수준 28) 6) Maria & Koichi & Shigeo 유지수준 Comprehensive Research Study Basic Minimal ● 장서수준(Collection Levels)을 5단계로 구분하고, 유지수준(Persistence Levels)을 7단계 Archived HIGH(Default)29) 로 구분하였으며, 두 가지 항목들을 종합하여 matrix로 제시하였다. Served Mirrored 장서수준 내용 Brokered Minimal 매우 특별한 자료를 제외하고는 거의 수집되지 않음 Linked Basic 주제분야에 대한 소개(introduce) 및 정의(define)를 해줄 수 있는 자료 Finding Aids LOW(Default)30) 학부생과 대부분의 대학원 코스를 지원할 수 있으며 일반적인 수준에서 지식을 유지할 수 있는 정도 Study De-accessioned N/A(Default)31) 의 장서 [표 Ⅴ-11] 장서수준과 유지수준 통합 matrix 주요 학위논문(major dissertations) 및 새로운 결과물, 과학실험결과, 유용한 연구정보 등이 포함된 Research 독립연구(independent research)를 포함하는 장서 Comprehensive 주제 영역에 존재하는 모든 중요한 자료들이 포함된 장서 나. NDL의 장서수집 수준 정의 지침 [표 Ⅴ-9] 장서수준 1) 선행연구 종합 ● Conspectus에 관한 연구들을 리뷰한 결과 기본적으로 기존의 WLN Conspectus의 장서수 준기호를 유지하고 있었으며, 디지털자원만을 위한 새로운 기호는 개발되지 않고 있다. ● 디지털 시대에 맞게 수정된 컨스펙터스의 특징은, ① CD-ROM 등과 같은 소장될 수 있는 전자자원에 대한 수집범위를 언급한 점, ② 링크(link)를 통해 이용할 수 있는 전자자원에 대 28) Maria Luisa Calang, Koichi Tabata, Shigeo Sugimoto,“Linking Collection Management Policy to Metadata for 29) High(H): 보존(preservation)과 접근(access)이 매우 안정적인 자료 Preservation - a Guidance Model to Define Metadata Description Levels in Digital Archives” Proc. Int. Conf. on , 30) Low(L): 보존(preservation)과 접근(access)이 떨어지는 자료 Dublin Core and Metadata for e-Communication 2002, pp.35-43. 31) Not Applicable60 제1부 장서개발정책 기본모형 연구·개발 및 수립 제5장 장서수집 수준 정의 61
  • 32. 디지털장서 관리 및 연구 개발 한 수집범위를 언급한 점으로 나눌 수 있다. ● 상기의 컨스펙터스 matrix를 적용한 사례를 아래에 예시하였다. 통일신라시대의 탑이라는 ● 주제분야에 따라(예: 음악, 미술 등) 문자로 된 자료보다 이미지, 음향 등의 자료가 더 적합 컬렉션을 예로, Link되어 있는 자료의 경우 HTML(JPG 이미지 포함) 문서를 기본으로 3a 하고 많을 경우 이에 대해 언급하여야 한다는 의견과 링크를 통해 즉각적으로 이용할 수 있 수준의 모든(All) 이용자용으로 개발할 경우이다. 는 전자자원은 도서관의 장서로 포함하여 장서수준을 결정하라는 의견을 반영하여야 한다. 2) NDL Conspectus 수정안(Revised Conspectus for the NDL: a draft) ● NDL 장서는 디지털 유형으로서 포털을 통해 온라인으로 제공되어야 할 자료의 비중이 높으 므로 NDL CDP의 컨스펙터스는 ①장서의 수준과 ②장서유지 수준이 함께 고려되어야 한다. ● NDL을 위한 컨스펙터스 모형은 기본적인 컨스펙터스의 개념인 장서수준뿐만 아니라 자료 의 유형별로 어떤 강도로 장서를 유지 및 서비스할 것인지를 판단해야 한다. ● 장서수준(Collection Levels)은 보다 상세하며 전자자원에 대한 연구가 진행되어 온 WLN 컨스펙터스 장서수준기호를 활용하고, 유지수준(Persistence Levels)은 Maria 등이 제시한 7단계 수준을 활용하는 것이 좋을 것으로 판단된다. ● NDL CDP에 적용될 컨스펙터스는 아래의 matrix를 기본 골격으로 장서수준과 유지수준 에 대한 장서유형별 적용범위를 설정할 수 있다. [그림 V-1] 컨스펙터스 적용 사례(안)-1 De- 유지수준 Archived accessioned Finding Aids linked Brokered Mirrored Server 0 1 1a 1b 2 2a 2b 3 3a 3b 3c 4 5 [그림 V-2] 컨스펙터스 적용 사례(안)-2 [표 Ⅴ-12] NDL 컨스펙터스 (안)62 제1부 장서개발정책 기본모형 연구·개발 및 수립 제4장 디지털장서의 수집대상과 범위 분석 63
  • 33. 디지털장서 관리 및 연구 개발 제6장 디지털장서개발정책구성요소 Peggy Johnson. Fundamentals of collection development and management(2004) Peggy Johnson. Collection Development Policies and Electronic Information Resources(1997) 관련 연구 Louis A. Pitschmann. Building Sustainable Collections of Free Third-Party Web Resources(2001) [표 Ⅵ-1] 구성요소 도출 대상 나. 사례별 구성요소 도출 1) 디지털장서개발정책 가이드라인 1. 구성요소 도출 ALA RUSA(Reference and User Services Association)32)에서는 전자자원의 장서정책을 위 가. 사례 선정 한 핵심 요소(Core Elements of Electronic Resource Collection Policies)33)를 제공하고 있다. ALA의 RUSA는 사람과 정보원, 서비스, 장서 사이를 연결하는 참고 전문가와 정보 전문가의 구성요소는 ALA의 디지털장서개발정책 가이드라인과 6개의 대표적인 국가도서관 디지털장서 주요 조직이다. RUSA는 성인들에게 도서관의 서비스와 자료를 전달하는 것, 모든 유형의 도서 개발정책, 그리고 5편의 관련 연구를 통해 도출하였다. 관에서 모든 연령을 위한 참고와 정보 서비스, 장서개발, 정보공유에 대한 준비에 있어서 장점을 디지털장서개발정책의 구성요소 도출을 위해 선정된 대상은 다음 [표 Ⅵ-1]과 같다. 촉진하고 지원하는 것에 책임이 있다. RUSA에는 6개의 부문이 있어 교육 제공, 서비스 가이드 라인과 향상에 관한 조언, 인식 증대, 출판물 준비의 역할을 담당하고 있다. 6개의 부문은 기업 구분 대상 ALA(Reference and User Services Association) 참고서비스 부문(BRASS)34), 장서개발과 평가 부문(CODES)35), 역사 부문(HS)36), 기계 보조의 참 가이드라인 Core Elements of Electronic Resource Collection Policies 고서비스 부문(MARS)37), 참고 서비스 부문(RSS)38), 자원에 대한 접근 공유와 변환 부문 Library of Congress: Collections policy statements > Selection Guidelines for Electronic (STARS)39)이다. Resources National Library of Australia: Collection Development Policy > Australian Electronic Resources 32) ALA는 RUSA의 장서개발과 평가 부분(CODES: Collection Development and Evaluation Section)에서 장서개발정책에 대 National Science Digital Library: NSDL Collection Policy 해 다루고 있다. 33) <http://www.ala.org/ala/rusa/rusaourassoc/rusasections/codes/codessection/codescomm/colldevpolicies/coreele- 장서개발정책 National Library of Medicine: Collection Development Manual > Electronic Resources ments/core.htm> 2007년 10월 12일. 34) Business Reference and Services Section의 약자이며, 참고 사서, 기업 정보 전문가, 그리고 기업의 참고정보 서비스에 종사 National Agricultural Library: Collection Development Policy of NAL > Electronic Resources 하는 사람들의 주제 관심을 대표한다. Selection Policy 35) Collection Development and Evaluation Section의 약자이며, 장서개발과 평가에 관련 있거나 관심 있는 참고 서비스 사서를 위한 것이다. Internet Public Library 36) History Section의 약자이며, 참고 사서, 아키비스트, 서지학자, 족보학자, 역사가, 그리고 역사 참고 또는 연구에 종사하는 사 IPL Collection Policy 람들의 주제 관심을 대표한다. 37) Machine-Assisted Reference Section의 약자이며, 도서관에서 모든 형태의 컴퓨터 기반의 참고 정보 서비스를 계획, 개발, 관 Samuel Demas, Peter McDonald, Gregory Lawrence. The Internet and Collection 리, 교육, 실시하는 것에 있어서 양질을 달성하고자 하는 사람들의 관심을 대표한다. Development(1996) 38) Reference Services Section의 약자이며, 모든 종류의 도서관에서 참고 서비스와 이용자 서비스의 전달, 관리, 평가를 포함하 관련 연구 는 참고정보 서비스의 모든 측면에 종사하는 사서와 도서관 직원의 관심을 대표한다. Gary W. White and Gregory A. Crawford. Developing an electronic information resources col- 39) Sharing and Transforming Access to Resources Section의 약자이며, 상호대차, 원격 대출, 접근 서비스, 협력 참고 서비스, lection development policy(1997) 협력 장서개발, 원격 보존, 그리고 자원의 공유 활동을 지원하는 출판사, 생산자, 제공자뿐 아니라 기타 공유되는 도서관 서비스 에 관련 있는 사서와 도서관 직원과 함께 한다.64 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 65
  • 34. 디지털장서 관리 및 연구 개발 이 가운데 장서개발정책은 CODES의 장서개발과 평가 위원회(Collection Development 미국의회도서관은‘Acquisitions’ ‘Collection Development, Policies’ 장서개발정책 의 에서 Policies and Assessment Committee)에서 담당하고 있다. CODES에서 제시하고 있는 디지털 을 제공하고 있다. 전자자원에 관한 장서개발정책은‘Electronic Resources, Selection 장서개발정책의 핵심 요소(Core Elements of Electronic Resource Collection Policies)40)는 Guidelines’ 다루고 있다. 미국의회도서관의 디지털장서개발정책 구성은 다음과 같다. 에서 다음과 같다. 제목 Ⅰ. 소개 요소 세부 요소 Ⅱ. 정의 1. 용어 정의 Ⅲ. 일반적인 가이드라인 2. 정책 개정에 대한 일정 Ⅳ. 구체적인 가이드라인 3. 전반적인 도서관 정책과의 관계 4. 인쇄 자원과 기타 전자 자원과의 관계: 현재 자원을 대체하 [표 Ⅵ-3] 미국의회도서관의 디지털장서개발정책 구성 거나 보강하는 것 a. 서비스 대상이 되는 이용자 ② 호주국가도서관(National Library of Australia) 5. 선정(Selection): b. 누가 소프트웨어를 선정하고 제적하는가? 누가 하드웨어를 선정하는가? 누가 전체적인 책임을 지는가? 호주국가도서관은‘Policy & Planning’ ‘Collection Development Policy’ 의 에서 장서개발 a. 범위 정책을 제공하고 있다. 전자자원에 관한 장서개발정책은‘AUSTRALIAN ELECTRONIC 6. 정보의 기준 b. 정확함/최신성 RESOURCES’ 참고하였다. 호주국가도서관의 디지털장서개발정책 구성은 다음과 같다. 를 a. 산업 표준에 대한 충족 7. 하드웨어 고려사항 b. 설명서와 기타 기술적 지원 제목 소제목 a. 산업 표준에 대한 충족 물리적 포맷 전자자원 8. 소프트웨어 b. 설명서와 기타 기술적 지원 정의 온라인 자원 9. 비용: 소프트웨어, 하드웨어, 유지보수 계약에 대한 자금은 디지털화한 자원 어디서 나오는가? 누가 편성 및 조정하는가? 물리적 포맷 전자자원 10. 직원: 부서별/기관별/컨소시엄 책임은 어떻게 구분하는가? 온라인 자원 수집 [표 Ⅵ-2] ALA의 디지털장서개발정책 핵심 요소와 기준 디지털화한 자원 전자자원의 보존 2) 국가도서관의 디지털장서개발정책 [표 Ⅵ-4] 호주국가도서관의 디지털장서개발정책 구성 본 연구에서 선정한 국가도서관의 디지털장서개발정책 구성을 살펴보면 다음과 같다. ③ 미국국립과학디지털도서관(National Science Digital Library) 미국국립과학디지털도서관은‘About NSDL의 ’ Collection Policy 에서 장서개발정책을 제공 ‘ ① 미국의회도서관(Library of Congress) 하고 있다. 미국국립과학디지털도서관의 장서개발정책은 특별한 구성양식 없이 서술형으로 되어 있다. 40) http://www.ala.org/ala/rusa/rusaourassoc/rusasections/codes/codessection/codescomm/colldevpolicies/coreele- ments/core.cfm 2007년 10월 7일.66 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 67
  • 35. 디지털장서 관리 및 연구 개발 ④ 미국국립의학도서관(National Library of Medicine) 제목 미국국립의학도서관은‘Collection Development and Acquisitions’ 의‘Collection IPL의 역할 정책의 목적 Development Manual of the National Library of Medicine’ 에서 장서개발정책을 제공하고 선정에 대한 정의 있다. 장서개발정책은 주제별, 포맷별로 구분하여 제공하고 있는데 전자자원에 관한 장서개발정 선정의 목적 책은 포맷별 구분의‘Electronic Resources’ 다루고 있다. 미국국립의학도서관의 디지털장 에서 일반적 원칙 서개발정책 구성은 다음과 같다. 선정을 위한 구체적인 기준 주요 주제 분야에서 선정을 위한 구체적인 기준 제목 링크 점검 I. 소개 이용자의 제안 II. 정의 [표 Ⅵ-7] 인터넷공공도서관의 장서개발정책 구성 III. 미국국립의학도서관에서의 전자장서 개발 IV. 물리적 미디어로 된 전자자원을 위한 선정 기준 [표 Ⅵ-5] 미국국립의학도서관의 디지털장서개발정책 구성 3) 관련 연구 ⑤ 미국 국립농학도서관(National Agricultural Library) 관련 연구를 통해 디지털장서개발정책의 구성요소와 전자자원 선정 시 고려해야 할 사항에 대 미국 국립농학도서관은‘About NAL의 ’ Policies and Guidelines 가운데‘Collection 해 살펴보았다. Development Policy of NAL에서 장서개발정책을 제공하고 있다. 전자자원에 관한 장서개발정 Demas41)는 인터넷 자원을 위한 장서개발정책의 5가지 구성요소와 12가지 쟁점을 제시하였다. 책은 ’ 2. Electronic Resources Selection Policy 에서 다루고 있다. 미국국립농학도서관 부록 ‘ 구분 내용 의 디지털장서개발정책 구성은 다음과 같다. 1. 특징 정의 Definition/defining characteristics 제목 2. 대표 사례 Typical examples 1. 소개 구성요소 3. 장서 수준 Collection policy notes/collection level 2. 정의 4. 선정 쟁점과 지침 Selection questions and guidelines 3. 선정 절차에 있어서 고려사항 5. 유용한 선정도구 목록 A list of selection tools useful for identifying Internet resources 4. 이행 1. 도서관은 어떤 유형의 인터넷자원을 선정할 것인가? 인쇄 형태의 정보자원을 선정하지 않을 것인 가? 그렇다면, 왜 그런가? [표 Ⅵ-6] 미국 국립농학도서관의 디지털장서개발정책 구성 2. 전체 서버와 서버에 포함된 모든 것에 대한 접근을 선정하고 제공할 것인가? 아니면 단지 특정한 title-level의 정보자원에 대한 접근만을 선정하고 제공할 것인가? ⑥ 인터넷공공도서관(Internet Public Library) 장서개발정책의 쟁점과 3. 다양한 유형의 출판물에 대한 보존 정책은 무엇인가? 구식이 된 자원들을 폐기할 것인가? 당면한 화제에 대한 자료는 짧은 기간 동안 전시될 것인가? 선정 시 고려사항 인터넷공공도서관은‘About the IPL의 ’ Collection Policy에서 장서개발정책을 제공하고 있 4. 다른 정보 게이트웨이의 목록에서 포인터를 통해 접근을 제공할 때와 자원을 다운로드하고 저장할 다. 인터넷공공도서관의 장서개발정책 구성은 다음과 같다. 때를 어떻게 결정할 것인가? 포인터는 충분한가, 그리고 사이버스페이스에서 이용자가 길을 잃게 만드는 것은 무엇인가? 포인터를 제공하는 자원에 대한 아카이브를 어떻게 보장할 것인가? 5. 장서 정책과 선정 전략에 의하여 네트워크 환경에서“참고 업무” 구성하는 것은 무엇인가? 를68 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 69
  • 36. 디지털장서 관리 및 연구 개발 6. 사람들이 참여할 뿐 아니라 읽기를 원하는 온라인 회의와 게시판과 같이 진행 중이고, 순식간이며, 범위의 안정성 비공식적인 커뮤니케이션은 어떻게 처리할 것인가? 지속성 7. 캠퍼스 내의 다른 도서관과 지역의 다른 도서관, 국가의 다른 도서관과의 인터넷자원에 관한 정책 비용 을 어떻게 조정할 것인가? 일반적인 가이드라인 가격의 예측가능성 8. 인쇄자원, CD-ROM 또는 기타 동등물과 인터넷자원을 함께 소장하거나 구독한다면, 그것들이 도 서관의 선정 결정에 어떻게 영향을 미칠 것인가? 어떤 상황에서 하나 이상의 포맷이나 접근 메커 장비 니즘을 제공할 것인가? 기술적 지원 장서개발정책의 쟁점과 9. 동일한 자원이 다양한 버전으로 이용 가능할 때, 어떤 것을, 왜 선정할 것인가? 인터넷으로 접근 공간 선정 시 고려사항 가능한 자원에 몇 가지 중요한 요소가 부족하다면, 부족한 것이 전반적인 선정에서 얼마나 중요한 정보는 보통 중복을 피하기 위해 하나의 포맷으로 구매되어야 한다. 그러나 이러한 결정은 비용, 이 지 어떻게 결정할 것인가? 불완전한 자원을 선정할 것인가? 용, 요구, 공간 조건, 부가적 요소를 고려해야 한다. 10. 접근에 요금이 부과되는 인터넷자원을 어떻게 다룰 것인가? 계약상의 조건이 현재의 대학 커뮤니 다른 요소들이 동일할 때, 정보의 다양한 이용을 위해 증가된 가능성과 전자 포맷에 대해 증가하는 티를 넘어서는 이용자에 의한 접근을 배제한다면 어떻게 할 것인가? 어떤 수준의 보안, 인증, 개 장서개발정책의 쟁점과 이용자 친밀성 때문에 정보의 전자 버전이 더 선호된다. 별 이용자를 추적하는 능력을 제공할 것인가? 선정 시 고려사항 새로운 정보 저장과 검색 기술은 도서관이 구매와 이용을 약속하기 전에 철저하게 조사되어야 한다. 11. 도서관 이용자의 상당수가 접근하지 않는 하드웨어 또는 소프트웨어를 요구하는 자원을 선정할 것인가? 교수나 선정자로부터 주문을 받을 때, 전자 자료/정보에 대한 요청은 책, 정기간행물에 대한 요구, 혹 은 계속 주문(standing orders)과 같은 조건으로 다루어져야 한다. 12. 선정 기준에 관하여, 자원의 권위와 신뢰성을 판단하는데 어떤 조정을 해야 하는가? [표 Ⅵ-9] White & Crawford의 전자자원 선정 시 고려사항 [표 Ⅵ-8] Demas의 인터넷 자원에 대한 장서개발정책 요소 42) Johnson은 전자자원을 선정할 때 고려해야 할 부가적인 기준43)과 전자자원 사이에 그리고 전 White & Crawford 는 일반적인 가이드라인과 구체적인 가이드라인으로 구분하여 정책을 제 자자원과 인쇄자원 사이에서 평가하고 선정할 때 정책에서 고려해야 할 사항44)들을 제시하였다. 시하였다. 일반적인 가이드라인은 전자자원 또는 인쇄자원 가운데 어떤 포맷을 구매할 지에 대한 결정을 돕고 매체의 수명, 자원을 사용하는데 필요한 장비, 기술적 지원의 이용 가능성과 같은 전 구분 내용 통적인 선정과는 다른 특징들을 고려할 수 있도록 한다. 구체적인 가이드라인은 부가적인 지시를 1. 응답시간 2. 로컬 서비스 implications 제공한다. 보통 복본을 줄이고 예산을 절약하기 위해서 한 가지 포맷으로 구매하길 선호하는데 3. 정보 전송에 대한 지원 구체적인 가이드라인은 두 번째 아이템에 대해 다룬다. 4. 공간, 가구, 하드웨어, 배선과 통신을 포함하는 도서관 내의 물리적, 논리적 요구사항 전자자원을 선정할 때 구분 내용 5. 기술의 효과적인 이용 고려해야 할 부가적인 기준 적합성 6. 라이선스와 계약 조건, 제한, 의무 중복성 7. 인쇄 구독을 유지하는 것에 대한 디스카운트와 컨소시엄 구매에 대한 디스카운트를 포함하는 가격 책정 방식 고려 일반적인 가이드라인 요구 8. 이용과 효과를 측정하기 위한 데이터의 이용 가능성 사용용이성 1. 네트워크, 하드웨어와 소프트웨어의 호환성, 산업 표준의 준수 이용가능성 2. 네트워크, 하드웨어, 소프트웨어 자원의 이용 가능성과 비용 implications 3. 전기와 통신선의 이용 가능성과 비용 implications 41) Demas, Samuel & McDonald, Peter & Lawrence, Gregory, "The Internet and Collection Development: Mainstreaming Selection of Internet Resources", Library resources & technical services Vol. 39 No.3(1996), pp.275- 290. 43) Johnson, Peggy(2004), 앞의 단행본, pp.209-210. [electronic resource] 42) White & Crawford(1997), 앞의 논문. 44) Johnson, Peggy(1997), 앞의 단행본.70 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 71
  • 37. 디지털장서 관리 및 연구 개발 4. 전기, 통신선, 시스템 지원, 유지보수, 하드웨어와 소프트웨어의 업그레이드를 포함하는 지속적인 비용 사례와 연구를 통해 도출된 디지털장서개발정책의 구성요소를 종합해보면 다음 [표 Ⅵ-12]와 5. 도서관 이용자와 직원을 위한 사용 용이성을 포함하는 인터페이스의 질 같다. 6. 검색엔진의 효과성과 효율성 기관 학자 7. 직원과 이용자를 위한 교육 implications 요소 Pitsch 8. 서비스 implications와 요구되는 직원 지원의 수준 ALA LC NLA NSDL NLM NAL IPL Demas White Johnson mann 전자자원과 인쇄자원 9. 이용자 커뮤니티의 사이즈, 이용 빈도, 원격과 현장에서의 접근에 대한 요구를 포함하는 잠재적인 이용 소개 ● ● ● ● ● ● 사이에 그리고 전자자원 사이에서 평가하고 선정할 목적 ● ● 10. 벤더의 신뢰도와 기술적 지원, 교육, 문서화를 포함하는 벤더 지원의 이용 가능성 때 고려사항 용어 정의 ● ● ● ● ● ● ● 11. 과월호에 대한 실효, 저작권법 보다 엄밀한 제약, 이용에 관한 규제를 포함하는 라이선스 고려사항 개정 계획 ● 12. 하드카피를 보유하는 것에 대한 디스카운트, 동시 이용자 수, 이용자 정의, 잠재적인 총 이용자 개요 다른 정책 및 자원과의 관계 ● ● ● ● 집단을 포함하는 가격책정 방식 이용자 커뮤니티 정의 ● ● ● ● 13. 그래픽, 공식, 비표준 기호의 처리 책임사항 ● ● ● 14. 파일 전송 프로토콜, 다운로딩, 인쇄 가능성에 대한 지원을 포함하는 정보 전송에 대한 지원 수집범주 ● ● ● ● ● ● ● 언어 ● [표 Ⅵ-10] Johnson의 전자자원 선정 시 고려사항 ● ● 출판 장소 주제 ● ● ● 내용 ● ● ● ● ● ● ● Pitschmann45)은 맥락, 내용, 형식과 이용, 처리와 기술의 4가지 부분으로 구분하여 인터넷 자 기능성 ● ● ● ● ● ● 원의 선정 기준을 제시하였다. 포맷 ● ● ● ● 이용자 요구 ● ● 구분 소구분 내용 출판사, 벤더, 저자의 권위 ● ● ● ● 선정시 a. 출처 비용 ● ● 1. 맥락에 따른 기준 고려사항 b. 다른 자원과의 관계 ● 선정도구 a. 타당성 수집수준 ● b. 정확성 복본 ● ● c. 권위 디지털화 ●(별도) ●(별도) d. 유일성 2. 내용상의 기준 보존 ●(별도) ●(별도) e. 완결성 f. 범위 접근 ● ● g. 최신성 기술적 문제 ● ● ● ● 인터넷 자원 선정기준 h. 이용자 유지와 갱신 ● a. 구성 예산 ● b. 항해의 특징 저작권 ● ● ● 3. 형식과 이용 특징 c. 인정된 표준과 적절한 기술 행정적 라이선스 ● (접근 가능성)에 따른 기준 d. 이용자 지원 벤더 ● ● e. 계약 조건과 규정 이슈 교육 ● f. 권리의 정당성 수집요청 절차 ● ● a. 정보의 무결성 4. 처리 또는 기술적 기준 b. 사이트의 무결성 [표 Ⅵ-12] 구성요소 종합 c. 시스템의 무결성 [표 Ⅵ-11] Pitschmann의 전자자원 선정 시 고려사항 45) Pitschmann, Luis A.(2001), 앞의 단행본.72 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 73
  • 38. 디지털장서 관리 및 연구 개발 2. NDL 장서개발정책 기본모형 이용자 커뮤니티 정의 해당 도서관의 전자자원 이용자 커뮤니티에 대해 정의함 가. 장서개발정책의 구성요소 서비스 대상이 되는 이용자를 정의하고 정기적 이용자연구에 대해 명시 이용자의 요구가 무엇이며, 서비스 대상에서 제외되는 이용자 집단이 있다면 밝힘 1) 구성요소의 내용 본 연구에서 제시하는 디지털장서개발정책 모형의 필수 구성요소들은 아래와 같다. 업무의 책임사항 디지털장서개발 관련 업무 담당부서 및 기타 책임사항 명시 소개 해당 도서관과 디지털장서개발정책에 대한 소개 수집대상의 범주 도서관의 장서는 모기관의 요구와 목적을 반영함 수집대상이 되는 디지털장서의 범위 명시 장서개발정책은 도서관 사명을 구현하여야 함 수집대상이 되는 전자자원의 유형과 제외되는 전자자원의 유형 규정 장서의 구성 범주와 특징에 대한 설명 선정기준 목적 언어 : 주 언어가 무엇이며, 주 언어 외에 수집대상이 되는 언어와 수집대상에서 제외되는 언 디지털장서개발정책의 목적을 밝히는 부분 어 명시 주제 : 자원이 도서관의 수집 주제범위에 부합하는지 또는 주제범위가 포괄적인지를 고려해 용어 정의 야함 디지털장서개발정책에서 사용하는 용어에 대해 정의하는 부분 내용: 내용이 정확하고, 완전하며, 보편성과 유일성이 있는지 등을 고려해야 함 개정 계획 기능성 디지털장서개발정책의 개정과 검토 계획, 일정 등에 관한 부분 응답시간, 화면 디자인, 인터페이스, 키워드, 논리 연산자 등과 관련한 기능적인 부분에 대한 장서개발정책이 타당성을 유지하고 도서관과 이용자의 변화하는 요구를 반영하기 위해서는 규정 지속적인 개정이 필요함 정책 개정주기 명시 포맷 포맷이 적절한지를 고려해야 하며, 다른 포맷을 동반하는 경우와 포맷별 고려사항에 관한 것 다른 정책 및 자원과의 관계 을 다룸 해당 디지털장서개발정책 외에 NDL 및 국립중앙도서관의 다른 정책과의 관계를 밝힘 인쇄자원 및 주제별 장서개발정책과의 관계 명시 이용자 요구 자원이 이용자의 요구에 부합하는지 고려함74 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 75
  • 39. 디지털장서 관리 및 연구 개발 출판사와 벤더, 저자의 권위 장서 평가 방법, 평가주기 등 장서 평가에 대해 규정할 수 있음 출판사와 벤더, 저자가 권위와 명성이 있는지 고려해야 함 폐기와 제적에는 어떠한 기준이 적용되는지, 얼마나 정기적으로 폐기와 제적하고 있는지, 폐 기와 제적 이후의 절차 명시 비용 비용 대비 효과적인지, 예상 이용에 대한 비용, 업데이트, 백업파일에 대한 비용, 구독조건에 예산 따른 가격책정 방식 명시 사용되는 자금, 기금, 예산에 대한 부분 예산 할당, 예산 분배 원칙 제시 선정도구 자원의 유형 간에 지정된 비율이 있다면 밝힘 전자자원의 선정 시 참고할 서지, 서평, 목록 등의 구체적인 선정도구를 명시함 저작권 수집수준 저작권법을 준수하는 것과 관련한 사항을 다룸 전자자원의 수집수준을 정의하는 부분 컨스펙터스 방법을 사용할 수 있음 라이선스 수집 대상 주제와 포맷별로 장서를 기술할 수 있으며, 현 장서의 강점과 미래 수집 계획을 나 벤더와의 라이선스 계약 협상과 관련한 사항 타낼 수 있음 벤더 복본 선호하는 벤더의 특징을 소개하고 벤더와 관련된 고려사항 정리 동일한 내용을 담은 하나 이상의 자원을 수집하는 것에 대한 기준과 관련 사항에 대한 부분 인쇄자원과 전자자원의 복본 수집과 부가적인 라이선스 수집 고려 교육 및 홍보 이용자와 직원 교육에 대해 다루는 부분 접근 이용자들에게 도서관의 업무와 장서에 대해 알리는 방법과 수단 등, 도서관 홍보와 마케팅에 접근에 선호되는 매체와 방법, 인증방식 및 접근 수준에 관한 부분 관한 부분 기술적 문제 수집요청 절차 전자자원 이용에 필요한 하드웨어, 소프트웨어, 장비, 네트워크 관련 사항 명시 전자자원 수집을 요청하는 방법과 요청하는 절차와 형식 명시 유지와 갱신 2) 구성요소별 중요도 지속적인 검토를 통해 전자자원의 접근을 유지할지에 대한 결정을 하는 것에 대한 부분으로 [표 Ⅵ-12]의 구성요소에 대하여 문헌정보학계 전문가들의 검증을 거친 결과 아래와 같은 중요 폐기, 제적, 갱신, 구독 취소 등 포함 도를 보이는 것으로 나타났다.76 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 77
  • 40. 디지털장서 관리 및 연구 개발 번호 영역 구성요소 평균 순위 나. NDL 장서개발정책 기본모형(안)46) 1 소개 3.9 18 2 목적 4.7 2 1. 개요 3 용어 정의 3.8 20 4 개정 계획 3.2 28 개요 1.1. NDL 장서개발정책의 개요 5 다른 정책 및 자원과의 관계 3.4 24 6 이용자 커뮤니티 정의 4.1 13 ● 국립디지털도서관(NDL)은 풍부하면서도 품질 수준이 높은 디지털정보자원을 체계적으로 7 업무의 책임사항 4.2 9 수집, 정리, 보존하고 또한 편리하면서도 적합한 정보서비스를 제공하여 정보 리터러시 수 8 수집대상의 범주 4.8 1 준이 높은 국민, 즉 국민 모두가 디지털 지성인이 되도록 하는 활동에 기반을 둔다.47) 9 언어 3.5 23 ● NDL의 장서개발정책(Collection Development Policy: CDP)은 모든 유형의 전자자원을 10 주제 4.2 9 대상으로 이들의 선정, 수집, 관리, 보존에 관한 마스터플랜으로 기능한다. NDL은 국민의 11 내용 4.5 4 학습, 연구, 자기계발 및 취미활동을 지원하기 위하여 장서를 구성한다. NDL의 주제담당 사 12 기능성 4.2 9 13 포맷 3.7 21 서와 장서개발 자문그룹은 정보요구 반영의 균형을 유지하면서 장서개발이 효과적이고 적 14 이용자 요구 4.2 9 절하게 이루어질 수 있도록 한다. 15 출판사와 벤더, 저자의 권위 4.3 7 선정시 고려사항 16 비용 4.0 15 1.2. 목적 17 선정도구 3.5 23 ● NDL의 장서개발정책은 NDL이 상기 1.1.의 비전을 달성할 수 있도록 NDL 장서개발의 특 18 수집수준 4.5 4 19 복본 3.4 24 징과 범주, 수집의 우선순위와 수준 등을 규정하는 것을 목적으로 한다. 장서개발정책을 통 20 접근 4.3 7 하여 NDL은 장서구성상의 강점과 약점을 지속적으로 파악하고, 장서구성(Collection 21 기술적 문제 4.1 13 Building)의 전략을 수립하며, 예산분배(Budget Allocation)의 근거와 효율성을 확보한다. 22 유지와 갱신 4.0 15 또한, CDP를 공개하고 확산시킴으로써 국내외 디지털도서관간의 협력을 진작하며, NDL 23 예산 3.7 21 조직 내부와 외부 커뮤니티 사이의 커뮤니케이션을 원활히 하고, 지적 자유 보호와 검열 24 저작권 4.7 2 (Censorship) 등에 관한 도서관의 입장을 천명한다. 25 라이선스 4.4 6 행정적 이슈 26 벤더 3.3 27 27 교육 4.0 15 1.3. 용어 정의 28 수집요청 절차 3.9 18 ● 전자자원 [표 Ⅵ-13] 구성요소 중요도 컴퓨터를 통해 접근할 수 있도록 기호화되고 만들어진 온라인이나 물리적 포맷의 저작을 뜻 한다. 전자자원은 인터넷에서 자유롭게 이용 가능하거나 도서관이 라이선스에 대한 비용을 46) 중요도 조사 결과 총 28개 요소 중 상위 25개 항목을 중심으로 구성하였다. 47) 국립디지털도서관 운영전략 기본계획. 국립중앙도서관, 2006: 3.78 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 79
  • 41. 디지털장서 관리 및 연구 개발 지불하며, 제공자와 원격접근에 대해 협의한 콘텐트 스트림(Content Stream)과 다양한 저 1.5. 이용자 커뮤니티 정의 장 미디어에 존재하는 물리적 매체(Physical Media)를 포함한다. 이들은 원격 접근 또는 직 ● NDL은 언제 어디서나 누구든지 접근 가능한 도서관 포털이어야 한다.48) NDL이 대상으로 접 접근에 의해 이용된다. 하는 서비스 커뮤니티는 포괄적 이용자들을 대상으로 하고 있으며 컬렉션 단위에서는 이들 ● 접근(Access) 망라적 이용자들을 체계적으로 구분하며, 외국인, 노령인구, 장애인 등 소외계층을 별도로 전자자원을 이용하기 위한 역량으로, 1) 일반적으로 기억 장치에 데이터를 기록하거나, 혹은 범주화한다. 기억 장치에 저장되어 있는 데이터를 읽어 내거나 탐색하여 획득하는 것이다. 또한 2) 이용 자가 정보시스템에 저장된 자원이나 프로그램을 이용하기 위해 접속하는 것이다. 1.6. 업무의 책임사항 ● 원격 접근 ● NDL 장서개발팀의 주제 전문사서들이 NDL 장서개발의 책임을 맡는다. 이들 셀렉터들은 컴퓨터 네트워크를 통한 전자자원의 이용을 의미한다. 담당 주제의 이용자 요구를 조사하고, 이용 가능한 정보자원의 범위를 모니터하며, 정보자 ● 직접 접근 원의 구입, 구독, 기증, 제작에 관한 전반적인 책임을 진다. 컴퓨터 장치나 그 보조 장치로 삽입되도록 만들어진 매체(예: 디스크, 카세트, 카트리지)를 통한 전자자원의 이용을 나타낸다. 1.7. 수집대상의 범주 ● 온라인매체/ 콘텐트 스트림(Content Stream) ● IV장에서 디지털 매체 유형 선정 기준(3절)과 NDL의 디지털 매체 선정 모형 및 수집 범주 WWW으로 출판되거나 이메일과 같이 다른 도구에 의해 인터넷을 통해 배포되는 디지털 자 선택 지침(4절)을 제시하였다. 원이다. 무료이든 유료이든 웹에서 자유롭게 이용가능하다면, 이러한 매체의 생산은 ‘출판’ ● 매체별 품질 선정 요인 된 것으로 간주한다. 문서 ● 물리적 매체 - 문서 구조와 내비게이션의 완결성 물리적 매체로 출판되는 객체(tangible objects)로서 아날로그 전자자원(예: 카세트 테잎, - 배치, 폰트, 디자인 특성 등의 완결성 비디오)과 디지털 전자자원(예: 플로피 디스크, CD-ROM, DVD, VCD) 모두를 포함한다. - 수학, 화학식, 도식 등을 표현 완결성 ● 수집(Acquisition) 그림 NDL이 구독, 구입, 기증, 협력, 제작, 저작권 기탁과 양도 등의 공식적 입수 절차를 통해 수 - 해상도(clarity): 화질의 고해상도를 지원 집하거나, 계약, 라이선스, 기타 공식적 동의를 통해 원격 또는 직접 접근을 제공하는 온라인 - 색상 유지(color maintenance) 또는 물리적 전자자원을 소장하거나 접근, 보관하는 것을 의미한다. - 정상 그림 표현을 넘는 기능성: 벡터 그래픽스, 삼차원 모델 등 음성 1.4. 다른 정책과의 관계 - 해상도(fidelity): 고음 해상도를 지원 ● 디지털장서개발은 NDL의 일반적, 구체적 정책에 준하여 수행된다. 본 장서개발정책은 - 음장(sound field): 다채널 음 지원 NDL의 주제별 장서개발정책의 근간이 된다. NDL의 장서개발정책은 국립중앙도서관 발전 - 정상음 표현 범위를 넘는 기능성: 주해에 의한 표현(예, MIDI) 계획, 한국도서관협회의 가이드라인, 세계적 디지털도서관 표준 그리고 국가적 정보기술전 략이니셔티브(IT Strategic Initiative)와의 관계를 고려하여 수행된다. 48) 국립디지털도서관 운영전략 세부계획 보고서 (2006.12) > 제2부 NDL 운영전략 세부추진과제 > 제3장 목표과제 3. 인포메이션 코먼스 > 중점과제 7. 정보서비스 > 세부과제 20. 정보서비스 정책 수립 > 3. 추진목표 및 전략 참조80 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 81
  • 42. 디지털장서 관리 및 연구 개발 동영상 션의 용이성 및 링크옵션, 전송 메커니즘, 및 보안과 인증 체계에 있어서 적절성 등을 고려 - 청명도(clarity): 화질의 고해상도를 지원 하여 정보자원을 선정한다. - 충실도(fidelity): 고음 해상도를 지원 2.5. 포맷 - 음장(sound field): 다채널 음 지원 ● 디지털포맷의 정보자원에 대한 일반적 선정 조건은 아래와 같다. - 정상음 표현 범위를 넘는 기능성: 부호화 애니메이션, 프레임 정밀 편집, 추가 음 궤적) 설명성(descriptive) 2. 선정시 고려사항 - 상호 호환과 재사용을 할 수 있도록 포맷의 생성, 이력, 용도 등과 관련된 문서가 마련되 어 있어야 한다. 2.1. 언어 - 포맷의 기술적인 특성을 쉽게 이해할 수 있는 메타데이터를 가지고 있어야 한다. ● NDL은 한국어로 만들어진 전자자원을 망라적으로 수집한다. 또한 영어와 주변국가의 언어 독립성(independency) 인 일본어와 중국어자료를 선별적으로 수집한다. 그 밖에 프랑스어, 이탈리아어, 스페인어, - 비독점적이어야 한다. 독일어, 러시아어, 폴란드어, 라틴어, 그리스어로 된 전자자원은 요구가 있을 경우 수집하는 - 암호화 되지 말아야 한다. 것을 원칙으로 한다. - 압축되어 있지 말아야 한다. - 지적재산권 제한이 없어야 한다. 2.2. 주제 - 특정 하드웨어나 운영 시스템에 독립적이어야 한다. ● NDL이 수집하는 정보자원의 주제범주는 망라적이며 모든 국민이 다양한 문화를 향유할 수 - 특정 소프트웨어에 독립적이어야 한다. 있도록 주제범주에 제한을 두지 않는다. 다만, 정보이용 제한에 관한 세부적인 사항은 정보 - 특정 기관 또는 사건과 무관해야 한다. 통신윤리와 정보공개 관련 법령에 준하여 따로 정한다. 일관성(consistency) - 기술이 변해도 계속해서 사용할 수 있어야 한다. 2.3. 내용 - 버전관리가 잘 되어야 한다. ● NDL이 수집하는 정보자원은 관련법규에 명시된 NDL의 사명과 목적을 충족시키고 내용적 - 포맷 이름이 변동되지 않고 유일 식별되어야 한다. 으로 완결되어 있을 것을 전제로 한다. 구체적으로는 정보자원의 지적 수준, 깊이와 포괄성, 범용성(widely adopted) 권위, 유일성, 완전성, 적시성, 그리고‘한국’ 관련성 등을 고려하여 선정한다. - 표준적인 매체여야 한다. - 널리 사용되고 있는 것이어야 한다. 2.4. 기능성 - 좋은 이용 사례가 있어야 한다. ● NDL은 기능성 측면에서 일반적인 수준을 유지한다. 데이터베이스 셋업이나 활성 스크립트 품질(quality) 등의 특별한 기능성을 요구하는 경우, 하드웨어적 소프트웨어적 상황을 고려하여 선별적으 - 공간 비용이 적어야 한다. 로 수집한다. - 추가적 관리가 필요한 유관 포맷이 적어야 한다. ● 검색 시스템의 우수성과 검색 용이성, 인터페이스의 편리성 및 디자인의 통일성, 네비게이 - 견실성82 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 83
  • 43. 디지털장서 관리 및 연구 개발 - 단순성 ● 장서수준(Collection Levels)은 WLN 컨스펙터스 장서수준을 활용하되, V장에서 밝힌 바와 - 변환 시 손실이 없을 것 같이 이용자별 구분이 가능하도록 하고, 유지수준(Persistence Levels)은 아래 표에서 보는 - 매체별 품질 요인(별도 설명) 바와 같이 7단계로 구분한다. ● NDL CDP에 적용될 컨스펙터스는 아래의 matrix를 기본 골격으로 장서수준과 유지수준 2.6. 이용자 요구 에 대한 장서유형별 적용범위를 설정할 수 있다. ● 인쇄 자원과 마찬가지로, 디지털 장서개발에 있어서도 특정의 정보자원이 이용자의 요구에 부합하는지 고려하며, 이용자의 요구를 최대한 반영한다. 또한 정기적/부정기적으로 이용자 De- 유지수준 Archived accessioned Finding Aids linked Brokered Mirrored Server 서베이를 통하여 장서구성에 대한 기본적인 평가를 시행한다. 0 1 2.7. 출판사와 벤더, 저자의 권위 1a ● 출판사와 벤더, 저자가 권위와 명성이 있는지 고려한다. 그 근거는 출판사나 벤더의 기존의 1b 명성이나 권위 이외에 실질적으로 필요한 자료나 문건들이 명확하게 제공되는지, 업무시간 2 2a 중 고객 지원이 되는지, trial 기간이 충분히 보장되는지, 벤더의 신빙성과 사업 기록이 업데 2b 이트되고 있는지 등의 자료를 근거로 판단한다. 3 3a 2.8. 비용 3b ● 가격이 적정한지, 비용대비 효과가 있는지, 업데이트, 백업 및 향후 업그레이드의 가능성과 3c 4 비용이 적정한지 고려한다. 가용한 가격책정 옵션에 있어서 최대한 효율성을 기한다. 5 2.9. 선정도구 [표 Ⅵ-14] NDL 컨스펙터스 (안) ● 정보자원의 선정을 위하여 주제 중심의 비평 자료와 서평지를 망라적으로 검토한다. 전자자 원에 대한 리뷰와 기술보고서 등 가용한 정보자원에 관한 정보를 다루는 선정도구들을 일차 2.11. 접근 적으로 참고하며, 이들 서지, 색인, 초록 등에 수록된 정보자원들에 비중을 둔다.49) ● NDL은 전자자원에 대해서 NDL 포털을 통한 원격접근과 인포메이션 코먼스를 통한 CD- Net 및 멀티미디어 워크스테이션 등 모든 플랫폼을 사용할 수 있도록 한다. 다만 WWW의 2.10. 수집수준 경우 사용이 편리하고, 널리 사용할 수 있으며, 신속한 업데이트와 보존비용이 저렴하다는 ● NDL 장서는 컨스펙터스를 사용하여 수집수준을 정의한다. NDL 장서는 디지털 유형으로서 점 때문에 상대적으로 선호하게 된다. 접근의 수준은 Network/ local load/ remote 포털을 통해 온라인으로 제공되므로 NDL CDP의 컨스펙터스는 ①장서의 수준과 ②장서유 access/ within building(s); Stand-alone/local load/ remote access/ Shelf; 지 수준을 함께 고려하고 있다. Commercial mediated search service/subsidized/ full fee recovery 로 구분된다. ● 라이선스를 통하여 구입, 구독된 정보자원의 경우 권한 부여, 벤더 기반 IP 인증 등의 방법 49) AcqWeb <http://www.acqweb.org>84 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 85
  • 44. 디지털장서 관리 및 연구 개발 을 사용하며, 다양한 수준과 배경을 지닌 이용자들에게 접근권을 제공한다. 이와 관련된 사 자세한 사항은 정보공유라이선스 2.050), 크리에이티브 커먼즈 라이선스(Creative 항은 별도 이용규정에 명시되어 있다. Commons License)51), 저작권법52)에 준하여 따로 정한다. 2.12. 기술적 문제 3.3. 라이선스 ● NDL의 정보자원 선정에 있어서는 적절한 하드웨어와 소프트웨어의 입수 가능성이 함께 고 ● NDL은 라이선스가 필요한 경우 출판사/어그리게이터와 계약하되 정보이용에 장애가 될 정 려된다. 특수한 하드웨어와 소프트웨어가 요구됨에도 불구하고 이를 제공하지 않는 디지털 도의 이용 제한이 있는 자료는 구입/ 구독하지 않는다. NDL은 라이선스에 관해 다음의 사 정보자원은 특별한 경우에 한하여 선정한다. 항을 고려한다. ● 정보자원의 선정에 있어서 웹 브라우저를 포함하여 기존 하드웨어, 소프트웨어와의 기술적 호환성, 기술적 지원 능력, 응답 시간과 원격 통신, 서버의 신뢰성, 디지털저장 가능성, 및 NDL의 라이선스에 의해서 권한과 의무를 부여받은 이용자는 NDL의 등록된 이용자와 기술적 표준 준수 여부 등을 평가하며 다양한 기술적 사항들을 고려한다. NDL 현지 이용자를 포함하는 것으로 본다. 이용자 지위(status)를 증명하기 위해 IP 범위를 통하거나 사용자명과 패스워드 접근을 가 2.13. 유지와 갱신 능하도록 할 수 있다. ● NDL은 정보자원에 대한 현재적 이용이 지속적 유지보수와 갱신을 요하는지 파악하기 위하 가격책정에 관한 사항은 따로 정하되, 전자자원의 구매는 그 정보에 대한 영속적인 접근에 여 지속적으로 이용통계를 연구한다. 대한 조건을 포함해야 한다. 계약은 아카이빙 관련 사항을 명시해야 한다. ● NDL은 주제 분야에 따라 일반적인 폐기의 기준을 적용한다. 특히, 인터넷자원의 경우, 역동 적인 특성 때문에 아래에 해당되는 인터넷자원은 폐기하는 것을 원칙으로 한다. 3.4. 교육 해당 인터넷 정보자원을 더 이상 이용할 수 없거나 유지되지 않는 경우 ● NDL은 정기적으로 정보리터러시교육을 실시하며 개인이나 그룹의 요구가 있을시 수시로 정보자원이 더 이상 최신성과 신뢰성의 가치가 없다고 판단한 경우 교육을 실시한다. 이용교육은 NDL의 다양한 서비스에 대한 안내, NDL장서 이용과 정보검 다른 인터넷 사이트나 정보자원이 더 포괄적인 정보를 제공하는 경우 색 방법 등 학습과 연구지원을 위한 프로그램으로 진행된다. 또한 NDL은 NDL포털과 인포 메이션 코먼스를 통하여 인포메이션 리터러시 튜토리얼을 제공한다. 3. 행정적 이슈 3.5. 수집요청 절차 3.1. 예산 ● 기술의 발전과 새로운 정보자원의 출현 등 여러 가지 요인에 의해 새로운 정보자원에 대한 ● NDL의 장서개발 예산은 NDL의 전체 예산범위 내에서 탄력적으로 운영되며, 주제별, 매체 요구가 있을 수 있다. 새로운 정보자원에 대한 요청 절차와 방법은 별도의 양식을 사용하여 별로 할당된다. 요청하고 NDL 장서개발위원회의 승인을 얻도록 한다. 동위원회에서는 다음의 사항을 검토 한다. 3.2. 저작권 ● 도서관은 디지털자원의 저작권 관련법규를 준수하며, 이용자와 직원들에게 동일하게 적용 50) http://www.freeuse.or.kr/htm/ 2007년 11월 20일. 된다. 또한“공정한 이용(Fair Use)”규정 또는 저작권법이 NDL의 모든 장서에 적용된다. 51) http://www.creativecommons.or.kr/ 2007년 11월 20일. 52) http://www.mct.go.kr/web/dataCourt/ordinance/statute/statuteList.jsp 2007년 11월 20일.86 제1부 장서개발정책 기본모형 연구·개발 및 수립 제6장 디지털장서 개발정책 구성요소 87
  • 45. 자원의 유용성 대안적 접근/ 복본 또는 유사한 정보자원 하드웨어와 소프트웨어적 요구사항 등 제2부 NDL 장서관리시스템 개발 지침 및 기능 표준화 1. 장서관리 원칙 2. . 장서수집기 3. . 장서등록기 4. . 콘텐트관리기 5. . 표준화와 요소기술88 제1부 장서개발정책 기본모형 연구·개발 및 수립
  • 46. 디지털장서 관리 및 연구 개발 제1장 장서관리원칙 기술된다. 셋째, 해당 디지털 자원은 단일의 인터페이스(또는 URL)에서 검색되고 접근된다. 디지털 도서관을 운영하는 기관의 관점에서 보면, 디지털 장서는 해당 기관에 의해 자체 제작 하여 소유하는 장서(소유형 장서 또는 내부 장서)와 외부에서 제작하여 소유하는 것에 대한 접근 라이선스를 가진 장서(접근형 장서 또는 외부 장서)의 유형으로 구분된다. 즉, 저작권이나 라이선 스에 따라 디지털 장서의 유형을 구분한 것이다. 또한 디지털 장서는 소장 아이템에 대한 목록정 보로 구성된 것(목록형 장서)과 아이템의 원문을 포함하는 것(원문형 장서)으로 구분할 수 있다. 이러한 구분에 따르면 디지털 장서는 다음의 [표 1-1]과 같이 4가지 유형으로 설명이 가능하다. 목록형 장서 원문형 장서 1. 디지털 장서 소유형 장서 자관 OPAC, Finding Aids 등 자체제작 장서, 아카이브 장서, 지식 레파지토리 장서 등 접근형 장서 외부 OPAC, 외부 Finding Aids, 색인초록형 DB 등 전자저널, 전자책, 전자참고자료, 원문제공형 DB 등 1) 장서와 디지털 장서 [표 I-1] 디지털 장서의 유형 구분 장서(collection)는 간단히“개별적인 정보자원의 집합체” 정의된다. 이 정의에서 정보자원 라고 소유형 장서는 서지/색인, 원문 DB, 레파지토리 장서 등 디지털도서관이 특정한 목적의 장서제 (resource)은 아이템(item), 객체(object), 콘텐트(content) 등과 같은 것으로 물리적인 형태를 작 프로그램에 따라 구축한 것이기에 특별한 경우를 제외하고는 장서의 소유권은 해당 기관이 가 가진 것과 디지털 형태를 가진 것으로 구분할 수 있으며, 이용자들이 정보서비스 과정을 통해 접 진다. 반면, 접근형 장서는 라이선스 장서(licensed collections)를 의미하며, 해당 기관이 아닌 근되고 전달되는 기본적인 단위이다. 흔히들 디지털도서관의 장서는 디지털 형태의 자원 즉 디지 외부의 개인이나 기관, 단체에서 상업적 유통의 목적 또는 공공유통의 목적으로 제작하여 구축한 털자원(또는 전자자원)을 어떤 목적이나 기준에 따라 모아놓은 것으로 디지털 장서(digital col- 장서이다. 디지털도서관에서 라이선스를 취득하여 정보서비스를 제공한다. 상업적 유통을 목적 lection)이라 한다. 으로 구축된 장서는 전자저널, 전자책 등이 대표적이다. 공공유통의 목적으로 정부나 공공기관에 디지털 장서는 디지털도서관의 장서를 말하며, 디지털 형태의 자원 즉 디지털자원(또는 전자자 서 구축된 정책 영역의 장서는 누구든지 무료접근이 가능한 장서(public domain collections)도 원)을 어떤 목적이나 기준에 따라 모아놓은 묶음 또는 패키지를 말한다. 장서 내에서 개별 디지털 포함된다. 한편, 생산자가 저작권을 가지지만 접근을 개방한 개방접근 장서(open access col- 자원은 디지털생산(born digital)과 디지털변환(reborn digital)의 형태로 제작되며, 특정한 장소 lections)도 라이선스 장서의 한 영역이다. 에 소장되어 있을 수 있고, 지리적으로 분산된 다양한 장소에 존재할 수 있다. 한편, 디지털 장서는 생산주체가 개인인 경우와 기관인 경우로 구분하며, 기관은 공공기관과 일반적으로 디지털 장서는 텍스트, 수치 데이터, 오디오, 비디오, 동영상, S/W 프로그램 등과 민간기관으로 구분할 수 있다. 이러한 주체에 의해 생산된 디지털 장서는 형태 또는 장르에 따라 같은 장르의 디지털 자원들로 구성되며, 다양한 디지털 포맷으로 인코딩된다. 따라서 이들을 검 다양하게 구분할 수 있다: 도서(단행본, 보고서 등), 낱장자료(낱권 형태이지만 페이지나 형식이 색하고 접근하는 방식, 선정하고 조직하고 유지하는 방식은 인쇄자원과 같은 아날로그 장서와는 도서와 다름), 참고정보원(사전, 지도 등), 전자저널, 전자신문, 웹DB, 웹사이트, 음성물, 영상물, 뚜렷하게 구분되고 식별되어야 한다. 멀티미디어(게임, 학습콘텐트 등 복합형 또는 복수차원형 자원), 응용S/W, 사실정보(수치, 통계 디지털 장서는 원칙적으로 다음과 같은 특성을 가진다. 첫째, 하나 이상의 유사한 성격의 디지 등), 서지정보(목록 및 색인), 오프라인 자료(CD-ROM, DVD 등). 털 자원으로 구성된다. 둘째, 하나의 장서에 포함되는 디지털 자원은 공통의 메타데이터에 의해90 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제1장 장서관리 원칙 91
  • 47. 디지털장서 관리 및 연구 개발 2) 디지털 장서 구축의 원칙 장서 원칙 3. 장서는 오랫동안 지속될 수 있어야 한다. 특히, 내외부의 재원이 투자되어 구축 된 디지털 장서는 투자기간이 지난 이후에도 지속적인 사용을 위한 계획이 있 디지털 장서는 객체(디지털 아이템)의 집합보다 더 큰 개념이며, 오직 사용자들의 요구가 계속 어야 한다. 지속되거나 또는 사용이 가능한 동안에만 존재할지도 모른다. 한마디로 디지털 장서는 장서를 구 성하는 디지털 아이템들의 수명이 지속적이거나 일시적인 것 등으로 매우 다양할 수 있다. 심지 장서 원칙 4. 우수한 장서는 폭넓게 이용가능하며, 이용에 불필요한 방해가 없어야 한다. 장 어 어떤 집합체는 유형의 아이템을 위해 오직 제한적인 기간 동안에만 사용하기 위해서 생성된 서는 장애를 가진 사람들도 이용할 수 있어야 하며, 다양한 기술들을 적용하여 일시적인 디지털 장서일 수도 있다. 효과적으로 이용할 수 있어야 한다. 일반적으로 디지털도서관에서의 디지털 장서는 협업 조직체의 그룹 또는 기관에서 시행하는 특정한 프로젝트의 일환으로 제작되기도 하고, 외부에서 제작한 것을 구입 또는 구독하기도 하 장서 원칙 5. 우수한 장서는 지적재산권을 존중한다. 장서 관리자는 모든 자료에 부가된 저작 며, 협력에 의해 연계되기도 한다. 경우에 따라서는 장기적 보존을 위해 납본을 받기도 한다. 이 권자와 이용허락사항에 대한 레코드를 보유해야 한다. 렇듯 제작, 구입/구독, 협력, 보존 활동에 의해 구축되는 디지털 장서를 기술하고 관리하기 위하 여 적절한 메타데이터를 사용한다. 물론 디지털 장서 내에 포함되는 개별적인 아이템 객체들에 장서 원칙 6. 우수한 장서는 유용성에 대한 표준화된 측정값이 기록되도록 한다. 사용도 데이 대한 메타데이터도 필요하다. 이러한 메타데이터는 장서 수준에서의 정보의 검색과 식별, 그리 터나 다른 데이터를 제공하는 메카니즘을 갖고 있어야 한다. 고 아이템 수준에서의 검색과 식별을 위해 사용되며, 보존을 위해서도 사용된다. 아무튼 메타데 이터에 의해 기술되는 장서와 아이템 객체는 적절한 검색과 식별을 위한 인터페이스를 제공하여 장서 원칙 7. 우수한 장서는 국가 및 국제적인 규모의 디지털도서관 프로젝트들과 매우 밀접 야 한다. 하게 관련되어야 한다. NISO는 2004년‘우수한 디지털장서 구축을 위한 지침 프레임워크(A Framework of Guidance for Building Good Digital Collections)’ 발표하였다. 이 프레임워크(이하 NISO 를 프레임워크)는 디지털 장서 구축을 위한 4가지 핵심 개체(entities)를 장서(collections), 객체 2. 국립디지털도서관의 장서관리 원칙 (objects), 메타데이터(metadata), 프로젝트(projects)로 나누어 기본원칙을 제시하고 있다. 이 중에서 장서에 대한 기본원칙을 살펴보면 다음과 같다. 1) 국립디지털도서관 장서구축의 원칙 장서 원칙 1. 좋은 디지털 장서는 대상 자료의 디지털화 작업 전에 생성 기관의 협정에 의해 국립디지털도서관 장서의 구축은 앞서 언급한 NISO 프레임워크의 장서원칙을 준수함을 기본 결정하고 문서화된 명시적인 장서개발 정책에 따라서 생성된다. 으로 한다. 또한 국립디지털도서관의 장서는 다양한 유형의 국민들이 학습, 교육, 연구 등의 활동 을 수행하는데 필요한 최적의 정보서비스를 제공할 수 있도록 구축되어야 한다. 이러한 목적의 장서 원칙 2. 장서는 규모와 형식, 접근의 제약, 소유권, 그리고 장서의 진본성, 무결성 및 해 디지털 장서는 다음과 같은 5가지 방법으로 구축되며, 이것은 국립디지털도서관 장서구축의 원 석에 영향을 미치는 중요한 정보 등과 같은 장서의 특성을 이용자가 탐색할 수 칙이라 할 수 있다. 있도록 기술되어야 한다.92 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제1장 장서관리 원칙 93
  • 48. 디지털장서 관리 및 연구 개발 장서구축 원칙 1. 국립디지털도서관 장서는 국립중앙도서관을 포함하는 각급 도서관이나 문 국립디지털도서관 장서의 협력은 공공기관, 상업적 기관 또는 다양한 커뮤니티들과 디지털 자 화유산기관에서 소장하고 있는 아날로그 콘텐트를 디지털로 제작하여 구축 원의 공동활용을 위해 체결된다. 대표적인 대상으로는 각국의 국가도서관 장서, 국내의 도서관이 한다.(제작형 장서) 나 정보센터 장서, 개인이나 기관의 우수한 장서 등이 해당된다. 협력을 위해서는 공동활용을 위 한 세부적인 내용의 협약을 체결하여야 한다. 국립디지털도서관 장서의 제작은 디지털도서관의 매우 중요한 장서이다. 흔히들 원문DB의 구 축작업이라 부르는 이 작업은 특정한 프로젝트에 의해 수행되는 게 보통이다. 디지털 장서 제작 장서구축 원칙 5. 국립디지털도서관 장서는 국내외 기관이나 단체 커뮤니티에서 생산된 디지 프로젝트는 구체적인 방법론에 따라 팀을 구성하고, 구체적인 목적과 정해진 기간을 가지고 진행 털 콘텐트를 납본을 통해 구축한다.(납본형 장서) 된다. 국립디지털도서관 장서의 납본은 지역적 수준과 기관적 수준으로 나누어 접근할 수 있다. 지역 장서구축 원칙 2. 국립디지털도서관 장서는 외부에서 디지털매체로 제작하여 생산한 콘텐트 적 차원은 국가 또는 지방 단위의 특정 지역 내에서 온라인으로 출판된 디지털자료를 수집하여 의 원문을 직접 구입하여 구축한다.(구입형 장서) 보존하고, 현재의 지역민들이 이를 효율적으로 이용하도록 하는데 있다. 또한 국가의 문화유산으 로 인정하여 후대에 전승하기 위한 보존의 책무도 함께 한다. 기관적 수준의 납본은 기관에 소속 디지털매체로 제작된 장서를 구입할 때에는 내용요소, 서비스요소, 비용요소, 기술적인 요소, 하는 구성원들이 생산한 각종 디지털 저작물들을 대상으로 수집, 관리, 배포, 보존의 역할을 위해 접근요소, 제도적 요소 등의 다양한 평가기준을 가지고 디지털 콘텐트를 선정해야 한다. 또한 국 필요하다. 지역적 수준이든 기관적 수준이든 디지털 장서의 납본은 이용의 활성화와 아키이빙이 립디지털도서관 장서를 구입할 때 콘텐트 제공자 즉, 출판업체와 관련하여 고려해야 할 사항이 라는 보존의 목적이 우선시 된다. 많다. 2) 국립디지털도서관의 장서관리시스템 장서구축 원칙 3. 국립디지털도서관 장서는 외부에서 제작한 콘텐트의 원문에 대한 접근 라 이선스를 구독하여 구축한다.(구독형 장서) 국립디지털도서관에 구축되는 장서는 효율적으로 관리되어야 한다. 이러한 역할을 수행하는 시스템을 장서관리시스템(Collection Management System)이라 부르며, 다음과 같은 3가지의 국립디지털도서관 장서의 구독은 대상 콘텐트의 원문을 구입하는 것이 아니라, 원문에 대한 사 주요 기능으로 구분한다. 첫째, 장서수집기로 디지털 장서를 효율적인 프로세스에 따라 수집하는 용권(접근권)을 특정 기간 동안 계약으로 구매하는 것을 말한다. 이러한 방식으로 구독하는 대표 역할을 담당한다. 둘째, 장서등록기로 수집된 장서의 메타데이터를 등록하는 역할을 담당한다. 적인 디지털 장서는 전자저널, 전자책, 웹DB 등 학술적 가치를 가지는 콘텐트가 해당된다. 디지 셋째, 콘텐트관리기로 장서를 구성하는 콘텐트들의 효율적인 관리 역할을 담당한다. 이러한 3가 털 장서의 구독은 구독 대상 콘텐트의 선정과 구독방법의 결정이 매우 중요하다. 지 시스템은 국립디지털도서관 장서관리의 핵심적 기능을 수행한다. 따라서 장서관리 업무의 유 용성 및 적용성을 확보하여야 하며, 국제표준 및 최신 요소기술을 적용하고, 국가적 또는 국제적 장서구축 원칙 4. 국립디지털도서관 장서는 국내외 기관이나 단체에서 소유하고 있는 장서들 호환성도 확보하는 것이어야 한다. 을 협력으로 연계하는 방식으로 구축한다.(협력형 장서)94 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제1장 장서관리 원칙 95
  • 49. 디지털장서 관리 및 연구 개발 (1) 장서수집기 3. 국립디지털도서관 장서관리시스템의 기능 디지털 장서의 제작, 구입, 구독, 납본, 협력을 위한 제반 처리기능으로 구성된다. 각각의 기능 은 고유한 모듈로 구분되지만, 선정, 계약, 입수, 검수, 이관 등의 연관된 기능을 공유할 수 있다. 국립디지털도서관 장서관리시스템의 전체적인 기능 구성도는 아래 표와 같다. 각각의 처리 모듈은 외부의 주요 작업들과도 연관된다. 예를 들어, 장서제작의 경우, 제작을 위한 [표 I-2] 국립디지털도서관 장서관리시스템의 기능 구성도 (V 1.0) 디지털 처리기능은 외부의 별도 모듈에서 처리한다. 장서납본의 경우, 납본대상자가 사용하는 납 본 인터페이스는 별도로 제공하여야 하며, 장서수집기에서는 납본대상자가 납본한 장서의 콘텐 1레벨 2레벨 3레벨 01 로그인 01.01 로그인 01.01.01 로그인 트를 선정, 계약, 입수, 검수, 이관 등의 역할을 수행한다. 또한 납본된 디지털 콘텐트의 저장은 01.01.02 로그아웃 별도의 납본 저장소(Repository)를 사용할 수 있다. 01.01.03 개인정보변경 02 장서수집기 02.01 제작 02.01.01 제작선정대상목록 02.01.02 제작선정대상상세 (2) 장서등록기 02.01.03 제작선정대상등록 장서등록기는 수집하여 이관된 디지털 장서를 등록하는 기능을 담당한다. 장서의 등록은 장서 02.01.04 제작선정대상수정 02.01.05 제작선정대상삭제 수준의 메타데이터인 DC Collection AP와 부가적인 객체들의 메타데이터를 사용한다. 장서등록 02.01.06 제작장서선정 기는 등록된 장서에 대한 조회 및 입력, 추가 및 삭제 등의 관리기능을 가진다. 또한 콘텐트관리 02.01.07 제작선정목록 02.01.08 제작장서상세 기에 의해 해당 장서의 콘텐트를 관리하기 위한 다양한 환경관리 기능도 갖추어야 한다. 메타데 02.01.09 제작장서수정 이터 사전에 대한 관리, 워크폼의 설정 기능, 저장소관리 등의 기능도 갖추어야 한다. 장서등록기 02.01.10 제작선정취소 는 또한 장서와 콘텐트의 각종 검색 및 참여 서비스를 위한 내부처리 기능을 갖추어야 하는데, 이 02.01.11 제작장서이관 02.01.12 프로젝트찾기 것은 지능형 통합 에이전트라 한다. 지능형 통합 에이전트는 디지털 장서에서 제공 가능한 서비 02.01.13 프로젝트신규 스들을 통합하고 접근하는데 필요한 지능적인 처리를 담당한다. OAI 수확기, RSS 통합기, SRU 02.02 구입 02.02.01 구입선정대상목록 02.02.02 구입선정대상상세 처리기, OpenAPI 처리기, OpenURL 처리기 등이 여기에 해당된다. 02.02.03 구입선정대상등록 02.02.04 구입선정대상수정 (3) 콘텐트관리기 02.02.05 구입선정대상삭제 02.02.06 구입장서선정 콘텐트관리기는 디지털 장서 내의 개별 콘텐트의 등록, 편집, 삭제, 반입, 검색 등의 기능을 처 02.02.07 구입선정목록 리한다. 콘텐트는 기본적으로 콘텐트용 메타데이터에 의해 관리되고 처리된다. 국립디지털도서 02.02.08 구입선정상세 02.02.09 구입선정수정 관의 장서관리시스템에서 콘텐트는 LC에 의해 디지털 자원의 서지기술 표준으로 제정한 MODS 02.02.10 구입장서입수 메타데이터를 이용하여 관리한다. MODS 레코드는 콘텐트를 단일의 서지적 개체로 인식한 경우 02.02.11 구입입수목록 이며, 이 서지적 개체를 FRBR 모델의 복수 개체로 확장이 필요한 장서의 경우, FRBR 확장기능 02.02.12 구입입수상세 02.02.13 구입입수수정 을 사용하여 콘텐트 메타데이터를 재구성하는 기능을 갖추고 있다. 또한 콘텐트의 원문을 연결하 02.02.14 구입선정취소 고, 원문별 저작권을 설정하고, 대표화면이나 이미지 등을 연동하는 기능, 각종 보안 및 저장 기 02.02.15 구입장서이관 02.02.16 구입기관찾기 능도 갖추어야 한다. 02.02.17 구입기관신규96 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제1장 장서관리 원칙 97
  • 50. 디지털장서 관리 및 연구 개발 1레벨 2레벨 3레벨 1레벨 2레벨 3레벨 02.03 구독 02.03.01 구독선정대상목록 03.02.02 장서복원 02.03.02 구독선정대상상세 03.02.03 장서완전삭제 02.03.03 구독선정대상등록 04 콘텐트관리기 04.01 콘텐트등록 04.01.01 콘텐트메타등록 02.03.04 구독선정대상수정 04.01.02 콘텐트FRBR확장 02.03.05 구독선정대상삭제 04.01.03 저작선택 02.03.06 구독장서선정 04.01.04 저작수정 02.03.07 구독선정목록 04.01.05 표현형선택 02.03.08 구독선정상세 04.01.06 콘텐트FRBR메타등록 02.03.09 구독선정수정 04.01.07 콘텐트파일등록 02.03.10 시범구독 04.01.08 콘텐트메타수정 02.03.11 구독 04.01.09 콘텐트FRBR메타수정 02.03.12 재구독 04.01.10 콘텐트파일수정 02.03.13 구독중지 04.01.11 콘텐트상세 02.03.14 구독선정취소 04.01.12 콘텐트XML보기 02.03.15 구독장서이관 04.01.13 콘텐트이관 02.03.16 구독만료처리 04.01.14 콘텐트삭제 02.04 협력 02.04.01 협력선정대상목록 04.02 콘텐트삭제함 04.02.01 삭제콘텐트목록 02.04.02 협력선정대상상세 04.02.02 콘텐트복원 02.04.03 협력선정대상등록 04.02.03 콘텐트완전삭제 02.04.04 협력선정대상수정 04.03 콘텐트반입 04.03.01 반입작업목록 02.04.05 협력선정대상삭제 04.03.02 반입작업상세 02.04.06 협력장서선정 04.03.03 반입작업등록 02.04.07 협력선정목록 04.03.04 반입작업수정 02.04.08 협력장서상세 04.03.05 반입작업삭제 02.04.09 협력장서수정 04.03.06 반입처리 02.04.10 협력선정취소 04.03.07 반입콘텐트목록 02.04.11 협력장서이관 04.03.08 반입콘텐트상세 02.04.12 협력기관찾기 05 검색 03.03 장서검색 03.03.01 키워드검색 02.04.13 협력기관신규 03.03.02 장서간략목록 03 장서등록기 03.01 장서관리 03.01.01 등록장서목록 03.03.03 장서상세정보 03.01.02 등록장서상세 03.03.04 장서별콘텐트목록 03.01.03 장서메타수정 03.03.05 콘텐트상세정보 03.01.04 장서선택 03.03.06 장서(Collection)브라우징 03.01.05 커뮤니티선택 03.03.08 수집자(Collector)브라우징 03.01.06 소장처선택 03.03.09 소유자(Owner)브라우징 03.01.07 프로젝트선택 03.03.10 소장처(Location)브라우징 03.01.08 서비스메타등록 03.03.11 프로젝트(Project)브라우징 03.01.09 장서이관 04.03 콘텐트검색 04.03.01 장서제한선택 03.01.10 장서삭제 04.03.02 콘텐트검색 03.02 장서삭제함 03.02.01 삭제장서목록 04.03.03 콘텐트간략목록98 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제1장 장서관리 원칙 99
  • 51. 디지털장서 관리 및 연구 개발 1레벨 2레벨 3레벨 1레벨 2레벨 3레벨 04.03.04 콘텐트상세-FRBR 06.06.09 SP수집기 06 환경관리기 06.01 메타사전 06.01.01 장서메타사전 06.06.10 데이터구축기 06.01.02 콘텐트메타사전 06.06.11 에이전트데몬 06.01.03 커뮤니티메타사전 06.07 저장소관리 06.07.01 저장소목록 06.01.04 서비스메타사전 06.07.02 장소상세 06.01.05 소장처메타사전 06.07.03 저장소등록 06.01.06 프로젝트메타사전 06.07.04 저장소수정 06.02 워크폼관리 06.02.01 장서워크폼목록 06.07.05 저장소삭제 06.02.02 장서워크폼상세 06.08 사용자관리 06.08.01 사용자목록 06.02.03 장서워크폼등록 06.08.02 사용자상세 06.02.04 장서워크폼수정 06.08.03 사용자등록 06.02.05 장서워크폼삭제 06.08.04 사용자수정 06.02.11 콘텐트워크폼목록 06.08.05 사용자삭제 06.02.12 콘텐트워크폼상세 06.09 코드관리 06.09.01 코드목록 06.02.13 콘텐트워크폼등록 06.09.02 코드등록 06.02.14 콘텐트워크폼수정 06.09.03 코드수정 06.02.15 콘텐트워크폼삭제 06.09.04 코드삭제 06.03 커뮤니티관리 06.03.01 커뮤니티목록 06.03.02 커뮤니티상세 06.03.03 커뮤니티등록 06.03.04 커뮤니티수정 06.03.05 커뮤니티삭제 06.04 소장처관리 06.04.01 소장처목록 06.04.02 소장처상세 06.04.03 소장처등록 06.04.04 소장처수정 06.04.05 소장처삭제 06.05 프로젝트관리 06.05.01 프로젝트목록 06.05.02 프로젝트상세 06.05.03 프로젝트등록 06.05.04 프로젝트수정 06.05.05 프로젝트삭제 06.06 수집에이전트 06.06.01 DP목록 06.06.02 DP상세 06.06.03 DP등록 06.06.04 DP수정 06.06.05 DP삭제 06.06.06 스케줄상세 06.06.07 스케줄등록 06.06.08 스케줄삭제100 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제1장 장서관리 원칙 101
  • 52. 디지털장서 관리 및 연구 개발 제2장 장서수집기 2) 장서 수집 업무정의 및 흐름도 디지털 장서의 수집 업무는 대상 자원의 발견, 시범서비스, 구독갱신, 라이선스조건(패키지여 부 포함), 인터페이스, 거래처(컨소시엄, 대행사, 출판사 등), 수록범위, 원문이용기간, 자료유형, URL 등 다른 업무와 개념을 가지고 있다. 따라서 도서관자동화의 수서시스템과는 다른 운영 형 태를 가져야 한다. [그림 1-2]53)와 같이 디지털 장서의 전자자원은 인쇄자원과는 다른 생명주기를 가지고 있다. 그리고 [표 1-3]과 같이 전자자원 선정 시에 추가로 고려해야 할 대상이 많다. 구독갱신 1. 개요 발견 시범이용 선정 수서 이용/접근 결정 1) 목적 구독중단 [그림 Ⅱ-2] 전자자원의 생명주기 장서수집기는 국립디지털도서관 정보자원개발정책의 이념을 구현한 체계적, 망라적 장서수집 구분 선택사항 을 위한 기능을 처리하는 것에 그 목적이 있다. 즉, 디지털 장서를 수집하여 국립디지털도서관의 대상자원 색인/초록 데이터베이스, 개별/패키지 전자저널, 전문데이터베이스 등 장서로 구축하는 과정으로 기능이 구성된다. 전체 기능의 간략한 구성은 다음 [그림 1-1]과 같다. 구입방식 출판사, 대행사, 컨소시엄, 공동구매 등 일반 구독, 소급분 구독, 고정 기간, 가변기간 등 구축과정 수록범위 및 원문지연기간 원문 사용기간 및 고정사용기간의 혼합 등 조사 선정 수서 서비스 평가 인증방식 기관 내 또는 기관내 일부 IP, ID/PW 이용, 복합인증 등 서비스제공플랫폼 출판사 자체 인터페이스, 애그리게이터 인터페이스, 전자저널 게이트웨이 인터페이스 제작 디지털화 구독 중단시 접근가능성 아카이빙 데이터 제공, 구독했던 기간의 자료에 대한 웹을 통한 이용, 전제 이용 불가 작업 구입 수 [표 Ⅱ-1] 전자자원 선정 시의 고려사항 관련된 집 구독 주요 기능들 업 따라서 디지털 장서의 수집업무를 진행하는 직원은 해당 패키지나 디지털 장서의 상태를 구분 무 협력 할 수 있어야 하며, 지불 및 라이선스에 대한 상세한 정보를 제공해야 한다. 기존의 업무프로세스 납본저장소 와 연관지어 보면, 전자자료에 대한 장서관리는 도서관자동화 시스템의 단행본 수서, 연속간행물 납본 수서, 연속간행물관리의 종합적인 부분과 패키지 여부, 이용 라이선스, 웹을 통한 서비스 인터페 [그림 Ⅱ-1] 장서 수집기 구성도 53) Sadeh, Tamar and Mark Ellingsen, 2005. "Electronic resource management systems: the need and the realization." New Library World, 106(1212/1213) : 208-218102 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제2장 장서수집기 103
  • 53. 디지털장서 관리 및 연구 개발 이스 등 많은 부분들이 필요한 것을 알 수 있다. 수집 Pool No (수집/신청/제공자 등) 신규자원 수집의 단계에서 이용에 대한 모든 부분을 검토하고 결정해야 하는 전반적인 관리차원에서의 여부 업무진행이 필요하다. 또한, 디지털 장서에 대한 수집 업무는 자료 형태, 수집 유형에 따라 크게 조사 Yes (가격조사,중복조사..) 장서등록기 등록 구독/재구독, 구입, 제작, 협력, 납본의 형태로 나눌 수 있으며, 이에 따른 주문, 송금, 인수 등, 수 메타데이터 입력 서의 고유의 업무가 뒤따라 와야 할 것이다. 장서수집기는 수집업무와 수서업무를 조합 또는 분 Yes 시범서비스 시범테스트 서비스, 라이센스 리가 가능하도록 개발하여, 업무의 효율을 극대화하고, 조직의 변동에도 쉽게 적용될 수 있도록 여부 권한 설정 해야 할 것이다. 시범서비스 필요없는 경우 (재구독, 제작 등) No 평가 선정 서비스 등록 조사 선정 수서 서비스 평가 (선정/취소) 제작 ·아웃소싱 계약 ·등록 ·제작 대상자원 조사 ·선정 ·이용통계 평가 ·반입 ·서비스 주문 견적 ·구입 희망 자원 접수 ·발주 ·등록 클레임/ 구입 계약사항검토 ·가격 조사 ·선정 ·계약 ·서비스 ·이용통계 재주문 (라이센스 조건 등) ·결제 통보 인수 No ·시범 등록 구입결정/취소/발주 ·발주 ·구독 희망자원 접수 ·재구독 선정 ·시범서비스 Yes 구독 ·계약 ·가격 조사 ·신규구독 선정 ·정식 등록 ·이용통계 ·결제 통보 송금 송금/예산관리 ·정식서비스 ·협력 대상 자원 조사 ·등록 협력 ·선정 ·계약 ·이용통계 ·서비스 인계 장서등록기 등록 ·자동수집기 ·계약 ·등록 [그림 Ⅱ-3] 장서수집기 업무 흐름도 납본 ·선정 ·이용통계 ·제출기 ·결제 통보 ·서비스 장서수집기는 제작, 구입, 구독(재구독 포함), 협력, 납본 등의 수집 업무에 대한 기능과 수집에 [표 Ⅱ-2] 장서수집 업무 구성 필요한 각종 행정 절차 및 시범서비스, 주문, 인수, 송금, 인계, 거래처 관리, 환경 관리 등의 수서 업무에 대한 기능이 존재하여야 하며, 이는 업무 진행자의 의사나 조직 구성에 따라, 일원화 또는 일반적인 디지털 장서일 경우, 제작, 구입, 구독, 협력, 납본의 수집 형태에 있어 대부분의 업무 이원화 될 수 있도록 개발되어져야 할 것이다. 요소들은 동일하다. 그러나 전자자료의 형태, 주제나 자료의 제공자의 유형에 따른 수집 형태의 그리고 국립디지털도서관 외의 다른 공공도서관과 디지털 정보자원 공동활용 방안을 수립하 이질성으로 업무의 역할이 정해지므로, 수집형태에 따른 시스템 개발은 필수적이다. 그리고 납본 여, 정보자원의 중복성을 피하고 망라적 정보자원 수집을 위하여 국내외 도서관·정보센터와의 업무는 온라인 디지털자료 납본 및 이용에 관한 법률안이 개정된 후 납본이 원활하게 이뤄질 수 자원공유체제를 구축하고, 국내 공공·민간도서관의 디지털장서 보유 현황을 파악하여 정보자원 있도록 준비가 되어야 할 것이다. 납본 업무프로세스의 초기 단계의 자동수집기 및 납본 Pool은 보유 지도를 작성하고 이들 기관과 정보자원의 실질적 공유체제를 구축하고, 해외 디지털 도서관 일반 전자자원의 수집 업무를 행하는 직원 역시 능동적인 수집업무를 모색하는데 많은 도움을 줄 과의 파트너십을 강화하여 해외 디지털 정보자원의 활용도를 높여 국가전자도서관으로서의 자리 수 있을 것이다. 매김을 해야 할 것이다.104 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제2장 장서수집기 105
  • 54. 디지털장서 관리 및 연구 개발 2. 장서수집기의 역할과 기능 요 장서를 포함하여 해외영인 업무 및 외국에 산재해 있는 좋은 자료들을 선별하여 DB화 하여야 한다. 장서수집기 중 선정 전의 유형에 따라 협력, 구입, 구독, 제작, 납본으로 나눌 수 있다. 제작과 장서 DB구축 사업은 국가지식정보자원관리사업이나 문화원형디지털콘텐츠화사업처럼 국립 협력은 그 업무 유형이 비슷하나, 디지털화(Digitalizing)를 위한 장서의 소장 여부, 타 기관 제 디지털도서관이 주관하고, 지역의 공공도서관을 협력파트너로 삼아 사업을 진행하고 특히 지역 공, 타 기관과의 관계 설정 측면에서 제작과 협력으로 구분되어 업무가 진행되어야 한다. E- 의 공공도서관과 협력하여 지역의 문화유산DB를 발굴하고 구축하여야 한다. 또한 이용자생성콘 Book, 온라인 DB 등 연속간행물이 아닌 전자자원이긴 하나 단행본의 형태일 때는 구입, 전자저 텐츠(UCC), 온라인 레파지토리 등 개인생산자와 연계하여 디지털장서를 구축할 수 있도록 해야 널은 구독, 전자납본은 납본으로 진행되어야 할 것이다. 한다. 국립디지털도서관의 구축대상인 장서DB는 디지털화를 위한 프로모션 작업 후, 국립디지털도 1) 제작 서관 고유의 DB제작 대상의 수요조사를 하고, 제작을 하여야 한다. 제작 프로모션 2) 구입/구독 제작 리스트 작성 자체제작 수요(자료)조사 국립디지털도서관에서 구입과 구독(재구독)은 전자유형의 형태에 따라 구분되어진다. E- 중복 자료 체크* 용역 사업 Book, Online DB, CD/DVD-ROM, 일반 웹 자원, AV 자원은 구입업무를 통해 수집된다. 그리 선정 기간/예산 검토 고 학술지 및 전자저널은 구독업무를 통해 수집된다. 현시점에서의 전자자원의 구입/구독은 소장 입찰/발주 의 개념보다는 접근의 개념이 훨씬 많다. 구입/구독에 있어서 기존의 인쇄매체와의 가장 큰 차이 주문 범위/예산 편성 는 시범서비스와 패키지, 컨소시엄, 라이선스, 갱신·중단 결정이다. 검수 라이센스 결정** 수집기 입수 - 시범서비스: 정식 구입/구독 결정을 내리기 전에 구독검토를 하기 위해 데이터베이스나 전자 대상리스트 완료 저널을 이용하는 형태로, 국립디지털도서관 홈페이지에서 이용자가 해당 전자 등록기 인계 자원을 이용할 수 있는 환경을 제공한다. 시범서비스 기간에 사서들이 파악한 * 기존 디지털화된 전자자원이 없는지 검토 서비스·콘텐트의 특성, 인터페이스 검토 내역 등과 이용자의 통계 및 피드백은 ** 제작 후 라이선스(서비스 범위 및 저작권)에 대한 설정 구입/구독 결정에 반영된다.(예외적으로, 기구독분 갱신, 교양자료, 참고 봉사를 [그림 Ⅱ-4] 제작 업무 흐름도 위한 전자자원들은 시범서비스를 거치지 않고 선정될 수 있을 것이다) - 컨소시엄, 패키지: 중소형 대행사들의 통폐합으로 대형 출판사/대행사/aggregator는 독과 국립디지털도서관에서는 장서 DB 구축과 관련하여 체계적인 조직을 구성하고, 디지털 장서의 점의 시장상황을 연출하기에 이르렀으며, 하나의 아티클/저널/DB에 의 제작과 활용에 이르는 영역까지 포괄하는 디지털 장서제작 프로그램을 수립하여야 한다. 물론 국 한 상품 형성 보다는 여러 상품을 하나의 패키지로 판매하기 시작하였다. 립디지털도서관의 성격에 부합하는 고유의 DB제작 사업이어야 하며, 미국 LC의 "American 그리고 학술/상용 전자자원의 가격이 높아짐에 따라, 수요기관들은 컨소 Memory"와 같이 "한국의 기억유산" DB를 지향하여야 한다. 또한 구축대상은 본관에 소장된 주 시엄을 형성하여, 출판사의 독과점에 단체로 대응하기 시작하였으며, 이106 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제2장 장서수집기 107
  • 55. 디지털장서 관리 및 연구 개발 를 Big Deal 이라고 한다. 국립디지털도서관의 경우는 국가대표도서관으로서 이용 및 아카이빙 문제로 라이선스 획득에 - 라이선스: 도서관(또는 컨소시엄 주체)과 출판사(또는 대행사)가 법적 계약을 통하여 전자잡 따른 비용이 높을 가능성이 있고, 비용으로 인한 이용의 제한은 공공도서관으로서의 목표 상실의 지에 대한 접근 및 이용권을 도서관에 양도하는 것을 말한다. 의미를 가져오기 쉽다. - 갱신·중단 결정: 전자자원은 구입/구독 시 정해진 기간 동안 이용할 수 있으므로, 기간이 만 료될 때에는 갱신이나 중단을 결정해야 한다. 이 갱신·중단 결정은 선정 3) 협력 단계에서의 최초 결정과는 달리, 시스템에 축적된 실제적인 정보를 기초로 이루어져야 한다. 이때에는 실제적인 전자자원 이용 등에 대한 사항 외에 상호협력 절차에 의해 국내외 도서관 및 공공기관에서 소유하고 있는 콘텐트 장서를 서비스하 인터페이스의 신뢰성, 제공사의 반응도 등과 같은 사항도 고려해야 한다. 는 경우, 장서수집기의 협력 계약과 같은 업무를 통하여야 한다. 협력은 국립디지털도서관과 개인 중단하기로 한 경우에는, 해당 자원에 대해 영구적인 접근 권한, 아카이빙 또는 기관 간에 이루어지며, 디지털 콘텐트의 협력 수집에는 가능한 비용을 지불하지 않는 것으로 권한 등과 같은 중단과 관련된 라이선스 내용을 처리할 수 있어야 한다. 해야 한다. 협력업무의 영역에는 콘텐트 제공자가 특정한 레파지토리에 콘텐트를 자발적 등록 수집 Pool 갱신 (self- archiving)하는 경우, 타 도서관이나 정보센터와 협력체결을 하는 경우, Open Access 기 (수집/신청/제공자 등) (기 구독분) 반의 디지털자원들을 수확(harvesting)하거나 크롤링(crawling)하여 접근하는 경우 등이 포함된 조사 다. 그리고 수증, 기증에 대한 업무, 정부간행물 수집, 국제교환업무도 여기서 담당하도록 한다. (가격조사, 중복조사...) 장서등록기 등록 견적 협력 프로모션 Yes 시범서비스 시범테스트 계약사항검토 여부 (라이센스, 컨소시엄 등) 협력 리스트 작성 수요(자료)조사 No 평가 선정 중복 자료 체크* 선정 구독중단 기증/수증 선정 기간/예산 검토 주문 중단 주문 협력기관 협약 주문 범위/예산 편성 입수 라이센스 사항 검토 라이센스 결정** 입수 송금 No 접근권한, 서비스 종료 아카이빙 권한 대상리스트 완료 인계 Yes 등록기 인계 라이센스 관리 * 기존 디지털화된 전자자원 및 유관 기관, 타 소장기관이 없는지 검토 ** 협력 후 서비스 라이선스(서비스 범위 및 저작권)에 대한 설정 인계 [그림 Ⅱ-6] 협력 업무 흐름도 [그림 Ⅱ-5] 구입/구독/재구독 업무 흐름도108 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제2장 장서수집기 109
  • 56. 디지털장서 관리 및 연구 개발 4) 납본 자동제출 납본은 디지털 콘텐트의 생산자가 납본시스템에 콘텐트를 직접 제출하여 납본하게 하는 행위를 말한다. 자동제출은 자발적 납본이든 의무 납본을 통해 이루어진다. 자동제출과 달 국립디지털도서관에서 납본은 국가적 수준에서의 납본을 말한다. 국가에서 생산되어 보존이 리 자동수집은 납본 대상을 파악하여 시스템이 자동으로 납본을 받는 것을 말한다. [그림 1-7]과 요구되는 디지털 자원을 납본하는 것으로, 개념적으로 보면 디지털 납본시스템(Digital 같이 수집 또는 제출에 의해 납본된 콘텐트들은 납본 Pool에 모이게 되고, 시범서비스 등 담당 사 Repository)라 할 수 있다. 이 시스템은 납본업무를 처리하는 기능과 납본된 콘텐트를 저장하고 서의 선정 작업을 통해, 서비스 유/무와 아카이빙 여부를 결정하는 방식으로 처리를 할 수 있다. 보존하는 기능의 저장소가 필요하다. 일반적으로 디지털 납본시스템은 기관 단위 또는 주제형 커뮤니티 단위에서 구축된다. 이 시스 템은 기관이나 커뮤니티의 소속 구성원 개인이 생산한 각종 디지털 저작물(연구, 학습, 행정 자 료)을 수집, 배포, 보존하는 시스템으로 다음과 같은 세부적인 역할을 구분할 수 있다. 첫째, 개인 이 생산한 디지털 저작물 중에서 보존의 가치가 있는 자원은 공유될 뿐만 아니라 장기적으로 보 존되어야 한다. 둘째, 기관이나 커뮤니티의 개인 단위에서 자신의 저작물들을 홈페이지나 이메일 등을 통해 배포하지 않고, 디지털 레파지토리에 자동제출(self-archiving)하는 방식을 취하는 경 우, 조직의 효율성이 향상된다. 셋째, 기관의 소속 구성원들이 생산한 다양한 저작물들에 대한 배 포로 기관의 활동을 홍보하는 역할을 한다. 자동수집기 납본 Pool 자동제출기(납본) 조사 [의무/자발적 납본] (가격조사, 중복조사 시범서비스 라이센스, 저작권조사...) No 신규자원 여부 의무 납본 Yes 시범테스트 Yes 장서등록기 등록 자발적 납본 여부 메타데이터 입력 No 시범서비스 서비스, 라이센스 선정확정(선정/취소) 권한 설정 평가 송금/예산관리 서비스 등록 원저작자 통보/송금 인계 평가 저작권 관리 시스템 장서등록기 등록 [그림 Ⅱ-7] 납본 업무프로세스110 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제2장 장서수집기 111
  • 57. 디지털장서 관리 및 연구 개발 제3장 장서등록기 게 검색해야 할 지 방법을 모를 수 있다. 통합검색을 수행하면 너무 많은 양의 검색결과가 나오 고, 브라우징 검색을 하더라도 원하는 콘텐트를 찾아가는 길을 모르게 된다. 2) 장서등록기의 요구 장서의 다양성과 규모성을 효율적으로 관리하고, 이용자에게 편리한 검색과 접근의 서비스를 제공하기 위해 나타난 새로운 개념이 바로 장서 수준의 관리기법이다. 즉, 디지털도서관에서 제 공하는 정보자원을 장서 수준과 콘텐트 아이템 수준으로 구분하고, 장서 수준에서의 관리와 접 근, 콘텐트 수준에서의 관리와 접근을 위한 방법을 각각 제공한다는 것이다. 장서 수준의 정보는 1. 개요 장서등록기(Collection Registry)에 의해 관리되며, 콘텐트 수준의 정보는 콘텐트관리기 (Content Management System)에서 관리한다. 각각의 관리시스템에서 관리하는 정보는 포털 1) 디지털 장서의 관리 을 통해 이용자들에게 검색되고 접근되어 진다. 이용자의 입장에서 보면, 장서 정보의 검색과 콘텐트 정보의 검색으로 이원화된다는 것이다. 디지털도서관이 제공하는 장서는 전통적인 도서관의 장서와는 다른 특성을 지니고 있다. 전통 이용자는 장서 정보를 대상으로 자신의 정보요구에 적합한 콘텐트를 소장하고 있는 장서의 범위 적 도서관의 장서는 내부에서 소장하는 것이 대부분이다. 그러나 디지털도서관의 장서는 물리적 를 탐색하고, 이를 대상으로 콘텐트를 검색하게 된다. 전자를 장서조망(collection landscaping) 또는 디지털 형태의 객체들로 구성되며, 도서관 내부에서 반드시 소장하고 있을 필요가 없다는 이라 하며, 후자는 콘텐트검색(content search)이라 한다. 점이다. 즉, 디지털도서관의 장서는 특정한 도서관이나 기관에 소장된 장서에 한정되지 않고 분 이처럼 디지털도서관에서 장서등록기는 소장된 자원이든 분산된 자원이든 장서 수준의 정보를 산된 장서도 포함된다는 것이다. 효율적으로 관리하고 이용자들에게 효과적인 콘텐트의 접근을 지원하는 역할을 수행하는 주요한 또한 디지털도서관을 통해 서비스되는 장서의 대상과 형식이 매우 다양하다. 아날로그형 장서 기능으로 인식되어졌다. 한편, 다양한 유형의 디지털도서관이 등장하면서부터 디지털도서관에서 와 디지털형 장서를 모두 포함하며, 공공성격의 장서나 상업적 성격의 장서도 포함된다. 이처럼 소장하고 있는 장서에 대한 상호운용성을 보장할 필요성도 제기되었다. 즉, 디지털도서관의 장서 전통적 도서관과는 상대가 안될 정도로 방대한 규모를 갖추게 된다. 그리고 디지털도서관의 장서 정보를 보다 표준적인 형식으로 기술하고 호환하는 방법에 대한 요구가 생겨나게 된다. 이러한 는 텍스트, 이미지, 동영상, 멀티미디어, 시뮬레이션 자료 등 다양한 형식의 콘텐트로 구성된다. 요구는 장서 수준의 메타데이터(collection-level metadata)의 개념으로 정리가 된다. 개별 자 디지털 장서의 구체적인 유형의 사례는 다음과 같이 구분할 수 있다: 도서(단행본, 보고서 등), 낱 원(또는 콘텐트) 수준의 메타데이터와 별도로 장서 수준에서 메타데이터 표준에 관심을 갖게 된 장자료(낱권 형태이지만 페이지나 형식이 도서와 다름), 참고정보원(사전, 지도 등), 전자저널, 전 것이다. 자신문, 웹DB, 웹사이트, 음성물, 영상물, 멀티미디어(게임, 학습콘텐트 등 복합형 또는 복수차원 이러한 동향은 영국의 RSLP(Research Support Libraries Programme)에서 수행한 장서기 형 자원), 응용S/W, 사실정보(수치, 통계 등), 서지정보(목록 및 색인), 오프라인 자료(CD-ROM, 술 프로젝트가 선도하였다. 이 프로젝트는 RSLP가 투자한 모든 디지털 장서의 정보를 기술하기 DVD 등). 위한 목적으로 수행되었다. 그 결과 RSLP 장서기술(Collection Description) 모델과 스키마를 한편, 이용자는 디지털도서관 장서의 대상이나 유형이 다양함으로 인해 그것을 효율적으로 검 개발하게 된다. RSLP 장서기술(Collection Description) 모델은 히니(Michael Heaney)의 장서 색하고 활용하는데 어려움을 겪게 된다. 특히 자신의 정보요구에 적합한 콘텐트를 어디에서 어떻 모델을 참조하여 장서 개체, 소장처 개체, 그리고 에이전트 개체의 간단한 개체(entity)들로 정의112 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제3장 장서등록기 113
  • 58. 하였다 한편, IMLS(Institute of Museum and Library Services)는 1998년 이후 NLG(National Leadership Grant) 프로그램을 통해 개발한 디지털 장서들을 효율적으로 관리 하는 장서등록기 개발 프로젝트도 장서 수준의 관리와 접근 패러다임을 선도한 대표적인 사례의 하나이다. 2. 장서등록기의 역할과 기능 장서등록기는 장서 수준 메타데이터(또는 장서 메타데이터)를 이용하여 디지털도서관에서 제 공하는 각종 장서에 대한 정보를 관리하는 시스템이다. 시스템의 기능적 관점에서 보면, 그다지 복잡하지 않다. 특정한 장서가 디지털도서관에 구축될 경우, 해당 장서의 정보를 장서 메타데이 터를 이용하여 등록하고 관리하는 기능으로 구성되기 때문이다. 장서등록기의 주요한 기능을 정 리하면 다음과 같다. 첫째, 장서 메타데이터의 편집 기능으로 메타데이터 레코드 생성, 수정, 갱신, 반입/반출, 저작 권 정보 등록 등을 포함한다. 둘째, 장서 메타데이터 레코드의 조회 기능으로 검색과 브라우징뿐만 아니라 간략정보와 상세 정보의 표현 기능 등이 포함된다. 셋째, 장서 메타데이터 레코드의 부가적 관리 기능으로 배치처리, 삭제함 관리, 메타데이터 스 키마 관리 기능, 워크폼 관리 기능 등이 포함된다. 넷째, 지능형 에이전트(intelligent agents) 기능으로 내외부장서의 통합을 위한 각종 지능적 처리를 담당한다. OAI 수확기(harvester), RSS 통합기(aggregator), OpenURL 해석기 (resolver), Z39.50/SRU 중개기(broker) 등이 해당된다.114 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화
  • 59. 디지털장서 관리 및 연구 개발 제4장 콘텐트관리기 는 보존이나 배포 등과 같은 목적으로 기존의 비디지털 형식의 문헌을 디지털화한 것이다. 아날 로그 자료(도서, 필사본, 박물관 유물, 비디오테이프 등)의 대체물이며, 디지털문헌으로 다시 태 어난다는 의미에서 디지털 재생산(reborn digital)이라고 부르고도 있다. 디지털변환에 의해 재 생산된 디지털문헌도 적절한 H/W와 S/W, 운영체제가 있어야 재현되며 활용될 수 있다. 2) 디지털 콘텐트의 유형 디지털 콘텐트의 유형은 오래전부터 도서관에서 정보자원의 형태를 구분하기 위해 많이 사용 하여 왔다. 형태의 구분은 적용하는 기준에 따라 다양하게 나타난다. 디지털도서관 영역에서 가 1. 개요 장 많이 알려진 메타데이터 표준인 더블린코어(Dublin Core) 메타데이터는 15가지 기본요소의 하나로서 유형(type)을 중요시 하고 있다. 유형 요소는 자원 유형의 성격 또는 장르로서, 내용의 1) 디지털 콘텐트와 객체 일반적인 범주, 기능, 장르, 또는 집성 수준을 표현하는 말이라고 정의하고 있다. 더블린코어 메 타데이터에서 유형의 데이터 값은 다음 12가지 중에서 선택하도록 되어 있다. 이것은‘DCMI 유 디지털도서관에서 콘텐트 관리는 장서 내의 개별적인 콘텐트 아이템인 디지털 객체의 관리를 형어휘(Type Vocabulary)’ 한다. 라 말한다. 디지털 객체는 디지털도서관 시스템에서 처리되는 정보의 한 단위이다. 시스템과 관련된 설명에서 사용하는 용어로 비트열(bit stream) 또는 바이트열(byte stream)로 표현되며, 단일의 장서(Collection) : 아이템의 집합체 파일로 구성되는 단순객체(Simple Object)로 존재하거나 복수의 파일, 또는 복수의 멀티미디어 데이터세트(Dataset) : 정의된 구조에서 부호화된 정보.(예: 리스트, 테이블, 데이터베이스) 파일로 구성되는 복합객체(Complex Object)로 구성되기도 한다. 디지털객체는 디지털문헌이며, 사건(Event) : 예- 전시회, 회의, 워크샵, 공연, 재판, 큰 화재 디지털매체(digital media), 전자기록물(electronic records), 이프린트(e-print), 이텍스트(e- 이미지(Image) text), 디지털자원, 전자정보, 디지털 지식정보 등 다양한 용어로 사용된다. 이처럼 다양한 용어 대화식 자원(Interactive Resource) : 예- 애플릿, 채팅 서비스, 가상현실 가 사용된다는 것은 특정한 관점이나 디지털문헌을 관리하는 공동체의 응용영역에 따라 구분하 동영상(Moving Image) 여 사용하기 때문이다. 또한 전자저널, 학위논문, 원자료, 기술보고서, 세미나자료, 강의자료, 기 물리적 객체(Physical Object) : 3차원의 객체 또는 물질.(예: 컴퓨터, 피라미드, 조각) 록물 등 디지털문헌의 유형(또는 장르)에 따라 보존방식이나 기술이 다르게 적용될 수 있다. 서비스(Service) : 예- 은행 서비스, 인증 서비스, 도서관 상호 대출, 웹서비스 생산방식에서 보면, 애초부터 디지털형식으로 생산되는 디지털생산(born digital) 유형과 초기 소프트웨어(Software) 의 생산은 비디지털이었지만, 이후 디지털변환(being digital)을 통해 디지털문헌이 된 두 가지로 사운드(Sound) 구분 가능하다. 전자의 경우는 전자책, 전자DB, 전자저널, 디지털 사진, 웹사이트 등 가시적인 실 정지화상(Still Image) 물(physical instance)이 존재하지 않는 파일의 형태이다. 인쇄형으로 출력할 수 있지만, 이것은 텍스트(Text) 원본이 아니며, 단지 보존을 위한 사본일 뿐이다. 그러기에 원본은 적절한 H/W와 S/W, 그리고 운영체제도 있어야 하며, 기술적인 문제가 생기면 영원히 복구하지 못할 수도 있다. 후자의 경우116 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제4장 콘텐트관리기 117
  • 60. 디지털장서 관리 및 연구 개발 한편, MODS에서는“typeOfResource”요소에서 유형값을 기술하도록 규정하고 있다. 이 요 디지털 콘텐트에 사용되는 디지털 포맷의 유형은 디지털 매체의 유형(media type)에 따라 구 소의 유형값은 다음의 12가지로 정의하고 있다. 이 요소에서 구체적으로 표현하지 못하는 특정한 분되어진다. 현재 포맷의 유형은 컴퓨터 매체 유형을 정의하고 있는 MIME (Multi-purpose 유형은“genre" 요소에서 기술할 수 있다. Internet Media Type)에서 정의한 것을 많이 사용하고 있다. 더블린코어나 MODS 메타데이터 에서도 이 유형구분을 사용하고 있다. MIME은 말 그대로를 풀이 하면 "다목적 인터넷 메일 확장 텍스트(text) " 즉, 인터넷 메일 교환을 위한 멀티미디어 문헌의 표준을 구분한 것이다. MIME에서 포맷의 유 지도(cartographic) 형은 2가지로 나누어 구분하고 있다. 첫 번째 구분은 문헌의 콘텐트 유형(type)에 따라 8가지로 악보(notated music) 구분한다. application, audio, image, message, model, multipart, text, video이며, 각각은 녹음자료(sound recording) *음악/비음악 이외의 자료가 혼재하는 경우 다시 하위유형(sub-type)들이 존재한다.[관련 표준 참조: RFC 2045, RFC 2046] 예를 들면 녹음자료-음악(sound recording-musical) video는 그 하위유형으로 avi, mpeg, mov 등이 있다. 녹음자료-비음악(sound recording-nonmusical) 디지털 포맷은 텍스트, 이미지, 멀티미디어와 같이 디지털 콘텐트가 어떻게 표현되는가에 따라 녹음자료(sound recording) 다른 유형의 포맷으로 구성된다. 텍스트는 단순한 아스키 파일(TXT 확장자 파일), RTF 파일 정지화상(still image) (TXT보다 고급의 텍스트 파일), 워드프로세서 파일(HWP, DOC 등), 식자형 포맷의 파일(Tex, 동영상(moving image) LaTex 등), 인쇄용 파일(PDF, Postscript 등) 등으로 세분할 수 있다. 또한 텍스트는 SGML, 입체자료 및 실물(three dimensional object) XML, HTML 등과 같은 마크업(markup) 형식으로 구성될 수도 있다. 이 경우는 텍스트의 포맷 소프트웨어(software) 및 멀티미디어(multimedia) * software, numeric data, 방식, 구조정보, 의미, 속성과 같은 정보가 기술되어 진다. computer-oriented multimedia, online systems and services 등 이미지는 저장 공간을 많이 차지하는 단순한 비트맵 포맷(BMP, PCX), 압축저장 포맷(GIF, 혼합 자료(mixed material) JPG), 문서교환포맷(TIFF) 등으로 구분된다. 비트맵 포맷은 화면에 점(픽셀)으로 그래픽을 표현 하며 압축 기법을 사용하지 않으므로 상당히 많은 공간을 필요로 한다. 반면에 압축저장 포맷은 3) 디지털 콘텐트의 포맷 이미지 압축 표준방식을 사용하여 만든 파일이다. 문서교환용으로 사용하는 TIFF 포맷은 문서출 판 및 인쇄에서 많이 사용하는 포맷이다. 디지털 콘텐트는 디지털 파일(file)이라는 디지털객체로 존재하며, 이것은 특정한 형식의 디지 멀티미디어 파일은 오디오 포맷(ASF, WAV, MIDI, MP3, AU), 애니메이션 및 동영상 포맷 털 포맷(digital format)으로 구성된다. 즉, 디지털 파일은 흔히들 확장자라고 알려져 있는 포맷 (MPEG, AVI, FLI, QuickTime 등), 컴퓨터그래픽 파일(CGM), 가상현실모델 언어(VRML), 마 으로 저장되며, 그것을 다루는 방법을 알고 있는 S/W 프로그램이나 H/W 환경에 의해서만 처리 크업 표준(HyTime) 등으로 표현된다. 된다. 그러므로 디지털문헌에서 파일의 포맷은 매우 중요한 정보이다. 문헌의 생산, 처리, 출력 일반적으로 도서관의 응용영역에서 사용되는 디지털 파일 포맷은 다양한 유형을 가지며, 하나 등에 영향을 미치며, 특히 장기적 보존과 검색에 필요한 각종 정보나 처리방법이 포맷의 정보로 의 포맷에도 서로 다른 버전을 가지고 있다. 그러므로 원칙적으로 사용되는 포맷에 제한을 두면 부터 규정되기 때문이다. 더블린코어(Dublin Core)의 15가지 기본요소의 하나로서 규정된 포맷 안 되지만, 장기적 보유와 검색의 관점에서 파일포맷에 대하여 어느 정도의 제한을 가하는 것이 의 정의를 살펴보면, ‘자원을 물리적 또는 디지털 형식으로 구성한 것으로서, 매체의 유형과 특징 불가피할 수 있다. 또한 디지털문헌의 생산자들이 소속된 공동체의 문화적 관습에 따라 사용하는 을 포함한다. 자원을 재현하고, 동작하는데 필요한 S/W, H/W, 다른 장치를 인식하는데 사용하 포맷이 다를 수 있음도 감안하여야 한다. 국내의 경우 학술논문, 학위논문 등과 같은 문헌과 일반 는 정보’ 한다.(DCMI 홈페이지) 라고 행정문서는 주로 글(HWP)을 많이 사용하며, 외국의 경우는 워드(MS Word) 문서가 많은 것과118 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제4장 콘텐트관리기 119
  • 61. 디지털장서 관리 및 연구 개발 같다. 또한 전공영역에 따라 다를 수 있다. 특히 물리, 화학, 수학 등과 같이 수식을 많이 사용하 ③ 검색(search and retrieval) : 이용자가 디지털 객체를 검색하고, 콘텐트에 접근하는 과정을 는 경우는 TeX나 LaTeX 포맷을 많이 사용하며, 역사학, 어문학 등에서는 워드(MS-Word), ㅎ · ㄴ글 말한다. (HWP)을 많이 사용하고 있다. ④ 활용(utilization) : 검색된 디지털 객체를 활용하고, 재활용하고, 수정하는 행위를 말한다. ⑤ 보존(preservation and disposition) : 재생(refreshing), 포맷전환(migration), 무결성 검 4) 디지털 콘텐트 관리의 워크플로우 증(integrity checking) 등을 통해 지속적인 활용을 보장하는 처리를 수행한다. 더 이상 필 요가 없을 경우 폐기되기도 한다. 디지털 콘텐트의 관리는 디지털 객체의 수명주기로 정리할 수 있다. 수명주기는 디지털 콘텐트 의 생산에서 보존, 평가, 폐기 등과 같은 워크플로우로 스웨트랜드(Anne J. Gilliland- Swetland)가 제시한 수명주기이며, 다음 [그림 1-8]과 같이 디지털 정보시스템에서 디지털 객체 2. 콘텐트관리기의 역할과 기능 를 생산-조직-검색-활용-보존의 단계로 나누어 설명하고 있다.54) 1) 디지털 객체관리의 원칙 NISO 프레임워크 보고서에서는 정의하는 디지털 객체는 하나 이상의 디지털 장서에 속하게 되며, 그 형태는 다음의 3가지 형태 중의 하나가 된다. 첫째, 객체는 하나의 파일로 구성된다(예: PDF파일로 발간된 보고서). 둘째, 객체는 다중 링크된 파일로 구성된다(예: HTML 페이지와 페 이지 내의 이미지). 셋째, 다중 파일과 그것을 연결하는 구조적 메타데이터로 구성된다(예: 페이 지 단위로 이미지화된 도서). 한편, 디지털 객체는 보존용 객체(master copy 또는 preservation copy)와 서비스용 객체(access 또는 use copy)로 구분하면 편리하다고 한다. 전자는 최초의 디 [그림 Ⅳ-1] 디지털 콘텐트의 수명주기 지털 객체 원본을 의미하며, 대체적으로 가장 품질이 높은 버전이다. 후자는 특정한 목적이나 계 획에 따라 이용자의 서비스를 위해 파생된 것이다. NISO는 이러한 디지털 객체를 위한 6가지 기 ① 생산(creation and multi-versioning) : 디지털 객체를 디지털 형태로 생성하거나 디지털 본원칙을 다음과 같이 제시하고 있다. 포맷으로 변환하여 디지털정보 시스템에 등록하는 단계이다. 동일 객체에 대하여 복수의 버 전을 만드는 작업(multi-versioning)은 보존, 연구, 배포, 또는 제품개발의 목적을 위한 것 객체 원칙 1. 우수한 디지털 객체는 상호운용성과 재사용성을 위한 품질 수준을 유지하면서, 이다. 이 경우 생산자는 디지털 객체를 등록할 때 관리정보와 기술정보 메타데이터를 포함 장서의 우선순위를 보장하는 방식으로 생산되어야 한다. 시킨다. 객체 원칙 2. 우수한 객체는 영구적으로 보존되어야 한다. 즉, 개인 또는 기관의 의지에 의해 ② 조직(organization) : 디지털 객체를 디지털정보 시스템에서 활용하기 위한 용도의 작업을 기술적인 변화에도 불구하고 우수한 객체의 접근성이 보장되어야 한다. 수행한다. 즉, 등록, 목록, 색인 과정을 통하여 부가적인 메타데이터를 생성하게 된다. 객체 원칙 3. 우수한 객체는 현재와 미래의 이용을 지원하거나, 또는 이러한 이용을 지원하는 접근용 복제물(서비스용 객체)을 변환하는 것을 지원하는 형식(포맷)으로 디지털 54) Anne J. Gilliland-Swetland, "Setting the Stage" in Introduction to Metadata : in Pathways to Digital Information, 화가 된다. 결국, 우수한 객체는 플랫폼들 사이에서 교환가능하며, 광범위하게 2000. <http://www.getty.edu/research/institute/standards/intrometadata/>120 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제4장 콘텐트관리기 121
  • 62. 디지털장서 관리 및 연구 개발 접근가능하며, 인정된 표준적인 방식이나 모범사례 또는 각종 표준이나 사례를 1) 조직 기능 참조하는 방식으로 디지털화가 된다. 객체 원칙 4. 우수한 객체는 영구적이고 고유한 식별자를 이용한 명칭이 부여될 것이다. 절대 ① 메타데이터 적인 파일명이나 주소를 참조하는 방식으로 명칭을 사용해서는 안 된다. 파일명 - 각 디지털 객체는 하나 이상의 관련된 메타데이터를 가진다. 과 주소는 변경의 여지가 있기 때문이다. 안정된 식별자는 실제적인 주소로 매 - 이용자는 메타데이터 레코드들을 생성할 수 있어야 한다. 핑할 수 있다. - 이용자는 메타데이터 레코드들을 수정할 수 있어야 한다. 객체 원칙 5. 우수한 객체는 최소한 다음의 3가지 관점에서 진본성을 인증 받는다. 첫째, 이 - 시스템은 메타데이터의 확장성과 복잡성을 보장해 주어야 한다. 용자가 객체의 원본, 구조, 개발이력(버전 등)을 결정할 수 있다. 둘째, 이용자는 - 시스템은 이용자가 디지털 객체와 메타데이터를 연결하는 것을 지원해야 한다. 자신의 취지나 의도에 알맞은 객체를 결정할 수 있다. 셋째, 이용자는 객체가 - 시스템은 메타데이터 버전관리를 지원해야 한다. 비인가된 방식으로 수정되거나 변경되지 않았음을 결정할 수 있다. - 시스템은 장서/서브그룹 등을 위한 다양한 메타데이터 체계들을 지원해야 한다. 객체 원칙 6. 우수한 객체는 관련된 메타데이터를 가진다. 우수한 모든 객체는 기술적/관리 - 시스템은 동일한 장서/서브그룹 등을 위한 다양한 메타데이터 체계들을 지원해야 한다. 적 메타데이터를 가질 수 있다. 일부의 복합객체는 구조적 메타데이터를 가질 메타데이터 스키마는 권한정보 필드를 제공해야 한다. 것이다. ② 콘텐트 2) 디지털 콘텐트 관리시스템 - 이용자는 신규 디지털 객체들을 업로드할 수 있어야 한다. - 이용자는 시스템으로부터 디지털 객체들과 관련된 메타데이터를 다운로드(반출)할 수 있 디지털 콘텐트 관리시스템(digital content management system)은 디지털 콘텐트의 조직, 어야 한다. 배포, 보존 등의 관리 기능을 담당하는 S/W 시스템이다. 한(Yan Han)은 디지털 콘텐트 관리시 - 이용자는 시스템 내에 있는 디지털 객체들을 수정(추가/삭제/갱신)할 수 있어야 한다. 스템의 주요한 기능적 요건을 다음의 4가지로 정리하고 있다.55) 첫째, 조직 기능(Organization - 시스템은 디지털 객체들의 버전관리를 지원해야 한다. requirements)으로 콘텐트와 관련된 메타데이터를 조직하는 기능이다. 둘째, 표현 기능 - 시스템은 디지털 객체들이 조직화된 구조(예: 선형/계층/그래픽 구조)로 그룹화가 되도록 (Presentation requirements)으로 이용자가 보고 느끼는(look-and feel) 기능과 통계 기능을 지원해야 한다. 포함한다. 셋째, 접근 기능(Access requirements)으로 내부와 외부에서의 접근 기능, 그리고 안 - 시스템은 디지털객체들이 복수의 장서들에 포함되도록 허용해야 한다. 전한 접근을 보장하는 기능을 말한다. 넷째, 보존 기능(preservation requirements)으로 저장, - 시스템은 하나의 장서가 다른 복수의 장서들에 포함되도록 허용해야 한다. 백업, 콘텐트와 메타데이터의 장기적 보존 문제를 처리하는 기능을 말한다. 이러한 기능적 요건의 세부적인 기능을 정리하면 다음과 같다. ③ 기타 - 시스템은 온라인 도움말을 제공해야 한다. - 시스템의 도움말은 언제든지 접근할 수 있어야 한다. - 시스템은 디지털 객체에 고유한 URL을 지원해야 한다. 55) Yan han, "Digital content management: the search for a content management system," Library Hi tech 22(4), 2004, - 시스템은 원본 포맷으로 콘텐트와 메타데이터의 반출을 지원해야 한다. pp.355-365.122 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제4장 콘텐트관리기 123
  • 63. 디지털장서 관리 및 연구 개발 - 시스템은 필요시 디지털 객체들을 대상으로 색인을 생성할 수 있어야 한다. - 시스템은 OAI-PMH 접근을 제공해야 한다. - 시스템은 워크플로우 단계로 묘사되어야 한다. - 시스템은 콘텐트나 메타데이터에 대한 다른 유형의 표준 웹서비스 접근들을 제공해야 한다. 2) 표현 기능 ③ 인증 및 권한 - 시스템은 다양한 권한을 지원해야 한다. - 하나의 메타데이터 스키마를 다른 스키마로 변환하는 기능을 제공할 필요가 있다.(예: - 시스템은 하나 이상의 권한들을 갖는 그룹을 지정할 수 있도록 해야 한다. Dublin Core → MARC) - 시스템은 하나 이상의 권한들을 갖는 이용자를 지정할 수 있도록 해야 한다. - 시스템은 모든 기능들을 웹기반 환경으로 제공해야 한다. - 시스템은 다음의 권한들을 지원해야 한다: 최소 수준의 권한, 일반 이용자 권한, 기여자 - 시스템은 유니코드 호환 인터페이스로 표현할 수 있어야 한다. 권한, 콘텐트 개발자 권한, 관리자 권한, 최대 수준의 역권한 등 - 시스템은 이용자들이 시스템 문제들에 관한 피드백을 제공할 수 있도록 해야 한다. - 시스템은 시스템 내에서 다른 권한들을 지원하도록 권한관리 기능을 사용해야 한다. - 시스템은 필요시 디지털 객체들에게 워트마크/밴딩/브랜딩할 수 있어야 한다. - 시스템은 시스템의 보안을 위하여 이용자 인증 기능을 사용해야 한다. - 시스템은 이용자에게 현재의 작업 상황을 알려주어야 한다. - 시스템은 이용통계와 관련 보고서들을 제공할 수 있어야 한다. ④ 시스템 - 시스템은 다양한 역할(권한)을 가진 이용자에게 원거리 및 복합 접근 기능을 지원해야 한다. 3) 접근 기능 - 시스템은 ACID(Atomicity, Consistency, Isolation, Durability) 이어야 한다. - 시스템의 모든 기능들은 유니코드 호환이어야 한다. ① 내부 접근 - 이용자는 메타데이터를 통해 콘텐트를 검색할 수 있어야 한다. 4) 보존 기능 - 이용자는 디지털 객체들을 브라우징할 수 있어야 한다. - 시스템은 전문검색 기능을 제공해야 한다. - 시스템은 콘텐트와 별도로 메타데이터를 저장해야 한다. - 시스템은 절단검색 기능을 제공해야 한다. - 시스템은 모든 유형의 파일포맷을 저장해야 한다. - 시스템은 부울검색 기능을 제공해야 한다. - 시스템은 잘 알려진 파일 유형에 대해서는 가능한 무결성을 지원해야 한다(예: MS - 시스템은 권한정보를 이용자에게 제공해야 한다. Word) - 시스템은 메타데이터와 콘텐트의 버전제어 기능을 가져야 한다. ② 외부 접근 - 시스템은 오류/이용도/디버거 로그파일을 유지할 수 있어야 한다. - 시스템은 이용자에게 다양한 접근방법들(예: 공공 APIs, 웹서비스 등)을 위한 새로운 모 - 시스템은 원본 파일의 이름, 크기, 생성일자를 유지해야 한다. 듈을 추가할 수 있도록 해야 한다. - 시스템은 대규모 용량의 저장처리가 가능해야 한다. - 시스템은 접근방법들에 대한 도움말을 제공하여야 한다. - 시스템은 Z39.50 접근을 제공해야 한다.124 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제4장 콘텐트관리기 125
  • 64. 디지털장서 관리 및 연구 개발 제5장 표준화와요소기술 다. 첫 번째는 장서수집기로 디지털 장서의 제작, 구입, 구독, 협력, 납본에 필요한 제반업무를 처 리하는 시스템이다. 시스템의 기능은 디지털 장서 수집 프로세스에 기반하는 것으로 프로세스는 크게 조사단계, 선정단계, 주문단계, 수서단계, 서비스단계, 평가단계로 구분할 수 있다. 이 중 서 비스단계는 장서수집기의 기능이 아니기 때문에 제외하고 총 5가지 단계에서 요구되는 기능으로 구성되어 있다. 두 번째 시스템은 장서수집기에서 수집한 디지털 장서의 메타데이터를 등록하는 장서등록기이다. 담당자는 장서수집기에서 이관된 디지털 장서의 수집 정보를 바탕으로 국립디 지털도서관 장서 메타데이터로 기술한다. 따라서 장서등록기는 등록된 장서에 대한 조회 및 메타 데이터 입력, 추가 및 삭제 등의 관리기능을 가진다. 마지막으로 콘텐트관리기는 디지털 장서에 포함된 개별 콘텐트의 메타데이터를 등록, 수정, 삭제 등의 기능을 처리한다. 콘텐트는 기본적으 1. 국립디지털도서관 장서관리시스템 표준화 로 MODS 메타데이터를 이용하여 관리되며, FRBR 확장기능을 사용하여 메타데이터를 재구성 할 수도 있다. 국립디지털도서관 장서관리시스템은 국내외에서 생산되는 방대한 양의 디지털 장서를 망라적 [그림 1-9]는 상기 내용을 바탕으로 도출한 국립디지털도서관의 장서관리시스템 구성도이다. 으로 수집하고 체계적으로 관리하여 이용자들이 국립디지털도서관 포털을 통해서 디지털 장서와 장서관리시스템이 대상으로 하는 디지털 장서는 크게 내부 디지털 장서와 외부 디지털 장서로 나 콘텐트를 쉽고 빠르게 검색하고 정확하게 접근하여 이용할 수 있도록 지원하는 시스템이다. 다시 누어 볼 수 있다. 내부 디지털 장서는 현재 국립중앙도서관에 구축되어 있는 원문 데이터베이스 말해 국립디지털도서관의 장서관리시스템 개발의 쟁점은 디지털 장서에 대한‘망라적 수집’ 이 (이하 DB)와 각종 물리적 장서에 대한 목록DB이다. 외부 디지털 장서는 수집 프로세스에 따라 며, 따라서 디지털 장서를 식별하고 그 범위를 정하는 단계에서부터 난관에 봉착할 수밖에 없다. 납본법에 의해 의무적으로 납본해야 하는 장서(납본대상기관의 DB), 제작 프로젝트를 통해 구축 이에 연구팀은 디지털 장서의 수집 프로세스에 초점을 맞추어 그 유형을 제작, 구입, 구독, 협력, 한 장서(제작 프로젝트 DB), 구입계약기관의 DB, 구독계약기관의 DB, 국내외 협력기관의 DB로 납본으로 구분하였다. 국내외 디지털 장서는 이 5가지 유형을 통해 국립디지털도서관으로 유입 볼 수 있다. 되며 이를 체계적으로 수집·관리하기 위해 시스템을 장서수집기, 장서등록기, 콘텐트관리기로 나누어 접근하였다. 이러한 장서관리시스템의 디지털 장서 수집 프로세스를 간략화하여 업무의 효율성을 증대시키고 동시에 시스템의 체계적인 운용 및 디지털 장서를 소장하고 있는 이기종 시 스템 간의 상호운용성을 보장하기 위해서는 국제표준 및 최신 요소기술에 기반한 시스템 개발이 필수적이다. 따라서 본 장에서는 국립디지털도서관 장서관리시스템의 구성을 도식화하고 이를 기반으로 시 스템에 필요한 표준과 요소기술을 식별하고 각각에 대한 프로파일을 작성하고자 한다. 1) 장서관리시스템의 구성 국립디지털도서관 장서관리시스템은 앞서 언급한 것처럼 크게 3가지 단위 시스템으로 구성된 [그림 Ⅴ-1] 국립디지털도서관 장서관리시스템의 구성도126 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 127
  • 65. 디지털장서 관리 및 연구 개발 장서수집기의 원문통합DB로 수집되는 디지털 장서는 내부 디지털 장서인 원문DB와 납본, 제 에 제한을 두게 된다. 따라서 본 연구는 장서관리시스템의 주요 기능인‘디지털 장서의 수집과 관 작, 구입을 통해 원문을 획득하게 되는 DB로 볼 수 있다. 구독 장서는 원문에 대한 접근 라이선스 리, 배포’ 초점을 맞추어 각각의 프로세스에서 반드시 필요한 요소기술과 표준을 제안하고 이 에 를 획득하기 때문에 원문통합DB와의 직접적인 연관성은 없지만 보존용 백파일을 수집하는 경우 에 대한 프로파일을 다음과 같이 작성하였다. 에는 이 두 DB 간의 관계를 설정할 수 있다. 국내외 기관과의 협력을 통해 수집하는 장서의 경우 적용 영역 표준화 및 요소기술 도 원문을 획득하는 방식보다는 메타데이터를 수확하거나(지능형 에이전트를 통한 수확), 질의 - content metadata: DC, MODS 요청 시 해당 기관의 DB에 접근하여 응답하는 방식이기 때문에 원문통합DB와의 직접적인 연관 메타데이터 영역 - collection metadata: DC Collection AP, RSLP CD Schema 성은 없다. 인터페이스 영역 HTTP, HTML/XHTML, XML, UNICODE, OpenAPI 장서수집기의 수집정보 메타DB는 디지털 장서를 수집하는 과정에서 필요한 정보의 메타데이 프로토콜 OAI-PMH, Z39.50, SRU, RSS 서비스 영역 터 DB이다. 다시 말해 장서수집기의 기능인 디지털 장서 조사, 선정, 주문, 수서, 평가 과정에서 웹 서비스 SOAP, WSDL, UDDI 식별체계 영역 OpenURL, URI, DOI 수집해야하는 정보, 예를 들어 구독 기간, coverage, 계약 업체 정보 등을 개별 장서에 대한 메타 장서평가 영역 COUNTER, SUISHI 데이터로 기술하여 관리하는 것이다. 수서 과정이 끝나면 이 메타데이터 중 일부가 장서등록기로 이관된다. [표 Ⅴ-1] 국립디지털도서관 장서관리시스템의 주요 표준화 및 요소기술 장서등록기는 수집된 디지털 장서 정보를 이관 받아 이용자 서비스에 필요한 정보를 추가적으 로 기술하기 위한 시스템이다. 장서등록기는 지능형 에이전트와 상호작용하게 되는데 이러한 프 [표 1-5]는 국립디지털도서관 장서관리시스템의 주요 표준화와 요소기술의 목록이다. 적용 영 로세스는 장서 메타데이터의 서비스 속성을 기술함으로써 가능한 일이다. 지능형 에이전트는 해 역은 총 5가지로 메타데이터 영역, 인터페이스 영역, 서비스 영역, 식별체계 영역, 장서평가 영역 당 디지털 장서의 접근 제한 정보와 인터페이스 정보 등을 통해 OAI-PMH, RSS, OpenURL, 이다. Z39.50/SRU 등의 서비스 프로토콜을 제어하고 이에 적합한 행동(action)을 취하게 된다. 메타데이터 영역에서는 장서 메타데이터와 콘텐트 메타데이터로 나누어 대표적인 표준과 스키 콘텐트관리기는 장서등록기와의 상호작용을 통해 개별 콘텐트를 하나의 장서로 묶어주며 지능 마를 제안하고, 인터페이스 영역에는 장서관리시스템 인터페이스에 적용되는 HTTP, 형 에이전트를 통해 수확한 콘텐트 메타데이터를 관리한다. 국립중앙도서관의 물리적 장서에 대 HTML/XHTML, XML과 같은 웹 표준과 문자 인코딩 표준인 UNICODE, 개방형 인터페이스를 한 목록DB는 콘텐트관리기에서 이관 받아 MODS로 기술하고 FRBR 모델을 적용할 수 있다. 통해 다양한 웹 사이트들과 상호작용을 할 수 있는 OpenAPI를 제안한다. 서비스 영역은 프로토 콜과 웹 서비스로 나누었으며, 식별 체계 영역은 OpenURL, URI, DOI을, 그리고 장서평가 영역 2) 장서관리시스템 표준 프로파일 은 장서수집기의 평가 기능에 적용할 수 있는 COUNTER, SUISHI를 제안한다. 한국전산원(2002)56)은 지식정보자원관리사업을 통해 구축되는 시스템의 표준 프로파일을 도출 하기 위해서 응용분야, 데이터분야, 플랫폼 분야, 통신 분야, 보안 분야, 관리 분야로 구성된 기술 2. 표준화 및 요소기술 명세 참조모델(Technical Reference Model)을 기반으로 분야별 기술적용 원칙과 표준 프로파일을 제공하고 있다. 이 기술참조모델은 정보시스템의 모든 분야를 총괄하고 있어 이에 따라 기술적용 1) 메타데이터 영역 원칙을 제시하기에는 기존의 시스템과 응용프로그램이 수용할 수 있는 요소기술과 표준의 범위 56) 한국전산원(2002). "정보화사업 상호운용성 확보지침", 서울 : 한국전산원128 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 129
  • 66. 디지털장서 관리 및 연구 개발 가. DC(Dublin Core) 다. DC Collection AP(Dublin Core Collection Application Profile) 표준번호 IETF RFC 2413 표준번호 요소기술: 장서 메타데이터 스키마 표준화 기구 Dublin Core Collection Description Working Group 미국국가표준(ANSI/NISO Z39.85 - Dublin Core Metadata Element Discovery), IETF(Internet 표준화 기구 Engineering Task Force) 표준(RFC 2413 - Dublin Core Metadata for Resource Discovery) DC Collection AP는 RSLP 장서기술 스키마에 기반을 두고 DCMI(Dublin Core Metadata Initiative)가 제안한 장서 메타데이터로 DC 메타데이터 기술 셋을 장서 수준 기술로 구성하는 방법 어떠한 영역의 어떠한 형태의 자료라도 기술할 수 있는 기본적인 메타데이터 표준으로 NISO 표준 을 구체화하기 위해 장서에 초점을 맞추고 메타데이터 속성을 제안하였다. 이후에 DC는 장서와 목 Z39.85-2001로 승인되었다. DC의 목표는 데이터의 형식과 구조를 단순화하여 원문의 저자나 발행 록 혹은 색인 간의 목적과 범위의 차이를 인지하고 이에 대한 기술을 별도로 정의하고 있다. DC 자가 메타데이터를 직접 작성하고, 이를 바탕으로 특정분야에서 요구되는 수준으로 확장하여 사용할 표준 개요 Collection AP는 기본적으로 장서의 탐색과 선정을 지원하면서도 장서관리와 같은 기타 기능도 지 표준 개요 수 있도록 하는 것이다. DC는 처음에 HTML을 이용하여 이용자가 복사해서 문서에 붙여 썼으며 최 원하도록 설계되었다. 근에는 XML을 이용하고 있다. DC의 Collection AP는 장서와 다른 개체들 간의 관계에 대한 개체-관계 모델을 기반으로 장서에 DC는 3가지 영역의 15가지 요소로 구성되어 있다. 대한 총 30가지 속성과 목록 혹은 색인에 대한 26가지 속성을 제시하고 있다. ‘국립디지털도서관 메타데이터 적용지침’ 의‘장서 메타데이터 표준’참고. 기타 Dublin Core Metadata Initiative. <http://dublincore.org/> 기타 <http://www.ukoln.ac.uk/metadata/dcmi/collection- application-profile/> 나. MODS(Metadata Object Description Schema) 라. RSLP CD Schema NISO Registration 표준번호 요소기술: 장서 메타데이터 스키마 표준번호 Title: Metadata Object Description Schema (MODS) Version 3.0 표준화 기구 RSLP Collection Description Working Group 표준화 기구 NISO Registration RPSL 장서 기술 프로젝트는 UK Research Support Libraries Programme (RSLP)이 투자한 모 MODS는 미리 정의된 요소 집합과 인코딩 규칙을 통합한 하이브리드(hybrid) 메타데이터 스키마로 든 프로젝트를 장서 수준에서 기술하기 위한 목적으로 OCLC로부터 추가적인 지원을 받아서 장서 다양한 메타데이터를 통합한 표준 메타데이터이다. LC에서는 디지털 자원의 기술과 관리를 위해 새 모델과 이를 기반으로 한 목록을 개발하였다. 로운 형식의 메타데이터 스키마가 필요하다는 다수의 요구를 수용하여 XML 환경에 적합하고, 디지 털 자원의 기술을 특별히 지원하며, 기존의 형식보다 덜 복잡하고, 특히 MARC 레코드와 높은 수준 RSLP에서 제시한 장서기술 모델에서 장서(Collection)는 물리적 또는 전자적 아이템의 집합이며, 소 의 상호호환이 가능한 메타데이터 스키마를 개발하기 시작하였다. 그 결과, 2002년 7월에 XML 기 장처(Location)는 장서를 소장하고 이는 물리적 또는 디지털 장소를 말한다. 에이전트(Agent)는 생 표준 개요 반의 MODS(1.0 버전)를 발표하고, 이에 대한 전문가 및 이용자 의견을 수렴하여 이듬해인 2003년 산자, 제작자, 수집자, 소유자, 관리자를 말하며, 콘텐트, 아이템, 장서, 소장처는 객체(Object)로 본 표준 개요 2월에 2.0 버전을, 그리고 2003년 12월에 3.0 버전을 공개하였다. 다. 에이전트는 사람 또는 기관으로 콘텐트 생산, 아이템 제작, 장서로 아이템을 수집, 소장처 관리와 같이 객체에 대한 행위를 취하며, 장서 이용을 제어하면서 누가 장서와 소장처로의 접근권을 가는지 MODS version 3.2는 20개의 상위요소(element)와, 그와 함께 사용할 하위요소(subelements) 또 누가 저작권이나 소유권을 가지는지를 결정할 수 있다. 및 속성(attributes)에 대해 정의하고 있다. 모든 상위요소와 하위요소, 속성은 필요한 경우에만‘선 RSLP는 이 모델을 기반으로 장서, 소장처, 에이전트의 세 개체로 나누어 각 개체에 대한 속성을 제 택적’ 사용하며, 특정 상위요소나 하위요소에 속하는 데이터가 다수일 경우 이를‘반복’ 수 으로 할 시하고 있다. 있다. 기타 ‘국립디지털도서관 메타데이터 적용지침’ 의‘장서 메타데이터 표준’참고. ‘국립디지털도서관 메타데이터 적용지침’ 의‘MODS 적용지침’참고. 기타 MODS. <http://www.loc.gov/standards/mods/>130 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 131
  • 67. 디지털장서 관리 및 연구 개발 2) 인터페이스 영역 다. XHTML 2.0 가. HTTP(HyperText Transfer Protocol) 1.1 표준번호 XHTML™ 2.0 표준화 기구 W3C 표준번호 RFC2616 XHTML은 HTML의 후속으로 웹 콘텐트가 기존의 컴퓨터에서 벗어나 여러 가지 장치(이동기기 등)에 표준화 기구 웹 컨소시엄(W3C, World Wide Web Consortium), IETF 표준 서 이용되기 시작하면서부터 그 등장을 예고했다. XHTML은 DTD를 사용하여 XHTML 문서를 규정 HTTP는 웹상에서 정보를 주고받는 데 필요한 프로토콜로 주로 HTML문서를 주고받는 데 쓰인다. 하고 MathML, SVG와 같은 다른 XML 네임스페이스(Namespace)의 구성요소들과 함께 쓸 수 있다. 1996년에 버전 1.0, (RFC1945) 그리고 1999년에 버전 1.1(RFC2616)이 각각 발표되었으며 이 버전 XHTML의 가장 큰 변화는 문서가 정형화(well formed)되어 있고 모든 태그들이 소문자로 작성되어 은 현재 가장 널리 쓰이는 버전이다. 야 한다. 또한 XHTML에서는 수치를 포함한 모든 속성은 따옴표로 묶어야 한다. HTTP는 클라이언트와 서버 사이에 이루어지는 요청/응답(request/response) 프로토콜로, 클라이 표준 개요 표준 개요 XHTML 2.0의 새로운 기능은 다음과 같다: 언트인 웹 브라우저가 HTTP를 통하여 서버로부터 웹페이지나 이미지 정보를 요청하면, 서버는 이 - HTML 폼(form)은 XForms로 교체 요청에 응하여 필요한 정보를 해당 사용자에게 전달하게 된다(Wiki). - HTML 프레임은 XFrames로 교체 HTTP 버전 1.1의 세 가지 주요 특징은 가상 호스팅, 정보 요청에 대한 효율적인 처리와 캐싱이다. - DOM 이벤트는 XML DOM을 사용하는 XML 이벤트로 교체 이는 웹 페이지의 전달 속도를 높이고 웹 정체현상을 완화하기 위한 것이다(한국전산원 2002). - 모든 요소에 대한 하이퍼링크가 가능 - src 속성을 이용해 모든 요소에 대한 대체 기술이 가능 (Wiki) REC2616 Hypertext Transfer Protocol -- HTTP/1.1. 기타 <http://tools.ietf.org/html/rfc2616> 기타 XHTML™ 2.0. <http://www.w3.org/TR/xhtml2> W3C. <http://www.w3.org/Protocols/> 라. XML(Extensible Markup Language) 1.0 나. HTML(HyperText Markup Language) 표준번호 Extensible Markup Language (XML) 1.0 표준화 기구 W3C HTML specification 표준번호 TTAS.IF-RFC1866 XML은 인터넷 상에서 데이터 교환을 목적으로 모든 문서 및 응용에 대한 범용 마크업 정의 방법을 표준화한 메타언어이다. 표준화 기구 W3C 이는 HTML이 데이터 구조를 기술하는 기능이 없다는 한계를 극복하고, SGML(Standard HTML은 전 세계에서 볼 수 있는 정보를 작성하고, 모든 컴퓨터가 알 수 있는 웹 문서를 작성하기 Generalized Markup Language)의 복잡함을 단순화함으로서, SGML과 HTML 양쪽 모두와의 상 위한 언어이다. HTML은 특히 하이퍼텍스트를 작성하기 위해 개발되었으며, 인터넷에서 웹을 통해 표준 개요 호운용이 가능하다. 표준 개요 접근하는 대부분의 웹 페이지들은 HTML로 작성된다. XML은 표준 규약을 따름으로써 응용 프로그램 호환성 문제를 극복하는데 커다란 구실을 하며, 하드 HTML에서 사용하는 명령어를 태그(Tag)라고 하는데, 태그는 시작과 끝을 표시하는 2개의 쌍으로 웨어, 운영체제, 프로그래밍 언어에 무관하게 중립적인 방식으로 정의되고, XML 지원 소프트웨어가 이루어져 있고, 이를 통해 문서의 글자 모양, 글자 크기, 색 등을 표현할 수 있으며 관련 정보를 연결 풍부하여 응용 프로그램 설계와 개발이 편리하다는 장점이 있다. (hypertext link)시켜줄 수 있다. 기타 XML 1.0. <http://www.w3.org/TR/REC-xml/> 기타 W3C. <http://www.w3c.org>132 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 133
  • 68. 디지털장서 관리 및 연구 개발 마. UNICODE 3) 서비스 영역 표준번호 ISO/IEC 10646-1 : Universal Multiple-Octet Coded Character Set 가. OAI-PMH 2.0 표준화 기구 국제표준화기구(ISO, International Organization for Standardization) 표준번호 The Open Archives Initiative Protocol for Metadata Harvesting version 2.0 ISO 8859의 등장으로 다양한 문자를 여러 사람이 사용할 수 있게 되었으나, 모든 사람이 서로 다른 문자 셋을 사용함으로써 호환성 문제에 직면하게 되었다. 즉 사용자는 두 가지 서로 다른 문자 셋이 표준화 기구 Open Archives Initiative 두 개의 다른 문자에 대해 같은 번호를 사용하거나, 같은 문자에 대해 다른 번호를 사용함으로써 데 이터 손상의 위험을 겪게 된다. 다양한 종류의 디지털 자원의 개방성 및 접근성 향상에 대한 필요성이 제기되자 OAI에서는 이러한 표준 개요 요구사항을 해결하기 위해 OAI-PMH를 제안하게 되었다. OAI-PMH는 하나의 서비스가 다른 서비 이에 Apple, IBM, Microsoft 등이 컨소시엄을 통해 전 세계 문자 코드를 표현할 수 있는 문자 셋을 스에게 자신의 모든 메타데이터 레코드 또는 자신의 메타데이터 레코드 중 일부를 복사할 수 있게 제공하였고, ISO/IEC JTC1에서 1995년 9월 국제표준으로 제정하였다. 유니코드는 데이터의 원활한 해준다. 교환을 위해 문자 1개에 부여되는 값을 16비트로 통일하였다. ISO/IEC 10646-1의 문자판에는 전 세계에서 사용하고 있는 26개 언어의 문자와 특수기호에 대해 일일이 코드 값을 부여하고 있는데, OAI-PMH는 HTTP, XML, XML 스키마와 같은 웹 표준을 기반으로 동작하기 때문에 구현하기가 쉬 216 = 65,536개의 문자를 수용할 수 있다. 우며, 프로토콜에 의해 지원되는 동작체계가 단순하다는 장점이 있다. OAI-PMH는 2001년 1월 21 일에 버전 1.0을 발표하였으며, 2001년 7월 2일에 버전 1.1을, 2002년 6월 14일에 버전 2.0을 발 기타 Unicode. <http://unicode.org/> 표하였다. OAI-PMH 버전 1.0과 2.0의 주요한 차이점은 OAI-PMH 버전 2.0에서는 XML 스키마를 사용하였다는 것이다. 바. OpenAPI OAI 요청 (HTTP 또는 POST 명령어 사용) 통합 메타DB SP 1 DP 1 로컬 메타DB 표준번호 요소기술: OpenAPI 표준 개요 표준화 기구 - 통합 SP 2 DP 2 로컬 메타DB HTTP 메타DB OpenAPI는 SOAP(Simple Object Access Protocol), 자바스크립트 등 웹 기술에 의해 웹 사이트 들이 서로 상호작용 할 수 있도록 하는 기술의 집합이다(Wiki). 이러한 측면에서 다양한 서비스를 복 표준 개요 합화시키기 위한 핵심 수단으로서 OpenAPI가 주목받고 있는 것이다. Google, Ebay, Amazon 등 많은 개방형 플랫폼 업체들이 협력 업체와 개발자에게 다양한 OpenAPI를 제공하고 있다. 통합 메타DB SP 3 DP 3 로컬 메타DB OAI 응답 (XML로 표현한 레코드) 구현 사례 Service Providers Data Providers : 구글 맵스. <http://www.google.com/apis/maps> 기타 : 플리커. <http://www.fliker.com> OAI-PMH는 서비스제공자(SP, Service Provider)와 데이터제공자(DP, Data Provider) 사이의 메 : 네이버 OpenAPI. <http://openapi.naver.com/index.nhn> 타데이터 교환의 수단으로 사용된다. SP는 OAI-PMH에 적합한 요청을 DP에게 보내며, DP는 상기 등의 사례는 정한민, 이미경, 성원경의“Open API 기술 동향”참고. 의 요청을 분석하여 해당되는 메타데이터를 SP에게 제공하게 된다. 제공된 메타데이터를 SP가 수집 하고 사용자에게 필요한 정보를 제공한다. - 송종철, 문병주. "OAI의 메타데이터 하비스팅 관련 기술 동향" 기타 OAI-PMH v.2.0. <http://www.openarchives.org/OAI/openarchivesprotocol.html#harvester>134 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 135
  • 69. 디지털장서 관리 및 연구 개발 나. Z39.50 라. RSS(Really Simple Syndication) 2.0 ANSI/NISO z39.50-1995- Information Retrieval(z39.50) : Application Service Definition an 표준번호 RSS 2.0 Specification 표준번호 Protocol Specification RSS 2.0 at Harvard Law, Internet technology hosted by Berkman Center (2003년에 표준화 기구 표준화 기구 ANSI/NISO UserLand Software to Berkman Center로부터 소유권 이전) Z39.50은 이용자에게 질 높은 정보자원을 제공하기 위한 통합접근의 기반이 되는 것으로, 원격 데이 RSS는 콘텐트가 자주 갱신(update)되는 웹 사이트를 위한 XML 기반의 자료 교환 규격으로, 콘텐트 터베이스로부터 정보 검색을 위한 Client/Server 기반 서비스와 프로토콜을 말한다. 배급에 필요한 최소한의 정보를 작성할 수 있도록 구성되어 있으며 현재 0.9, 1.0, 2.0 등 다양한 버 전으로 서비스되고 있다. Z39.50은 특정 레코드를 식별할 수 있는 기준을 설정하고 식별된 레코드의 일부 혹은 전부를 전송 표준 개요 하도록 요구할 수 있다. Z39.50을 이용할 경우 OS, 하드웨어, 탐색엔진, DBMS 등이 서로 다른 시 운영자가 자신의 웹로그에 새로운 정보를 갱신하면 RSS 피드(feed)가 가능해진다. RSS 피드는 스템들끼리 어려움 없이 상호작용할 수 있다. Z39.50을 구현한 시스템에서는 여러 복합 시스템을 검 RSS 공급을 말하는 것으로, 이용자는 관심 있는 웹로그의 RSS URL을 자신의 RSS 리더(reader)에 색함에 있어서 단일의 인터페이스를 제공하므로 이용자는 새로운 검색명령어와 탐색기법을 배울 필 표준 개요 추가함으로써 웹로그를 직접 방문하지 않고도 최신 콘텐츠를 받아볼 수 있다. RSS를 통해서 서비스 요 없이 평소대로 검색을 수행할 수 있다는 장점이 있다. 운영자는 이메일 발송을 하지 않고도 최신의 정보를 빠르고 쉽게 제공할 수 있고, 이용자는 콘텐트 구독을 위해 자신의 신상 정보를 제공할 필요가 없기 때문에 스팸 메일로부터 자유로울 수 있다. 이 기타 ANSI/NISO Z39.50 Protocol. <http://www.cni.org/pub/ NISO/docs/Z39.50-brochure/> 는 이메일이 일방적으로 콘텐츠를 강요하는 Push Model인데 반해, RSS는 이용자가 선택한 정보만 볼 수 있도록 해주는 Pull Model이기 때문이다. RSS가 이메일을 대신할 커뮤니케이션 채널 하나로 떠오르게 된 것도 바로 이런 이유에서다. 다. SRU(Search/Retrieval via URL) 1.2 기타 RSS 2.0 Specification. <http://cyber.law.harvard.edu/rss/ index.html> 표준번호 SRU Version 1.2 Specifications 표준화 기구 미의회도서관(LC, Library of Congress) 웹 기반의 정보 환경이 일반화되면서 Z39.50의 유용성에 반론이 제기되자 차세대 Z39.50을 개발하 기 위해 여러 가지 실험적 연구와 프로젝트들이 수행되었고, 이러한 일련의 활동을 일컬어 ZING(Z39.50 International: Next Generation)이라고 한다. 초기에 SRU는 SRW와 함께 ZING 중에서 가장 활발하게 연구되었던 주제로, Z39.50의 기본 개념은 대부분 유지하면서도 XML, SOAP, HTTP, URL과 같은 웹 기반 기술을 이용하여 프로토콜을 재정 표준 개요 의한 것이다. SRU는 질의 표현 구문 표준인 CQL(Contextual Query Language)을 이용한 인터넷 검색 질의를 위한 XML 기반 검색 프로토콜로, 이용자가 질의어를 포함하는 searchRetrieve 요청 메시지를 보내면, 서버는 질의어에 일치되는 레코드들을 가리키는 searchRetrieve 응답 메시지를 보낸다. SRU는 클라이언트가 서버에 서비스를 요청할 때는 HTTP 방식으로, 서버가 클라이언트에 결과를 보 낼 때는 SOAP 방식으로 전달하는 REST 방식으로 처리한다. 기타 SRU. <http://www.loc.gov/standards/sru/>136 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 137
  • 70. 디지털장서 관리 및 연구 개발 마. SOAP(Simple Object Access Protocol) 1.2 바. WSDL(Web Service Description Language) 2.0 SOAP Version 1.2 Part 0: Primer 표준번호 Web Services Description Language (WSDL) Version 2.0 Part 1: Core Language 표준번호 SOAP Version 1.2 Part 1: Messaging Framework 표준화 기구 W3C SOAP Version 1.2 Part 2: Adjuncts WSDL은 원하는 서비스가 어디에 존재하며, 웹 서비스로 무엇을 할 수 있고, 또 이를 실행하기 위해 표준화 기구 W3C 서는 어떻게 해야 하는가를 XML 형식으로 제공하는 메타언어이다. SOAP은 분산 환경에서 HTTP 등의 통신 프로토콜을 이용하여 XML 기반의 RPC 호출 메커니즘을 WSDL 문서 구조 제공하기 위한 2세대 XML 프로토콜로, 정보를 전달할 때 웹 서비스를 패키징하여 HTTP, TCP, SMTP 등의 인터넷 프로토콜을 사용하여 전송한다. Service Service Implementation ·SOAP 메시지 구조 Definition Port a. Envelop: Header와 Body 요소 가짐 Binding b. Header: SOAP 메시지가 어떻게 처리되어야 하는지에 대한 메타 정보 c. Body: 처리되어야 할 정보 Service PortType Interface Definition Message SOAP Envelope 표준 개요 Type SOAP Header 표준 개요 a. 서비스 인터페이스 정의 Header block 메시지 확장이 오는 자리 : 여러 웹 서비스 구현 정의에 의해 참조될 수 있는 서비스 정의로, 특정 서비스 인터페이스를 이 Header block 용하기 위해 필요한 프로토콜, 데이터 포맷, 보안 정보와 같은 메타 정보를 기술하는데 이용되는 <wsdl:binding>과 웹 서비스가 제공하는 연산자를 정의하는 <wsdl:portType>, 각 연사자들의 입 SOAP Body 력, 출력값으로 다루는 XML 데이터의 형식을 정의하는 <wsdl:message>, 복잡한 입출력 XML 데이터 구조를 정의하는 <wsdl:type> 요소로 구성됨 Message body 메시지 내용물이 오는 자리 b. 서비스 구현 정의 : 어떻게 특정 서비스 인터페이스가 서비스 제공자에 의해 구현되어져야 하는지를 기술하는 것으 로, <wsdl:service>는 <wsdl:port>의 집합으로 웹 서비스를 모델링하고 <wsdl:port>는 <wsdl:portType>로 지정된 연산들에 대한 인스턴스로 <wsdl:binding>과 연결되어 바인딩 정보 를 포함 기타 WSDL Version 2.0. <http://www.w3.org/TR/wsdl20/> 기타 SOAP Version 1.2. <http://www.w3.org/TR/soap12- part0/>138 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 139
  • 71. 디지털장서 관리 및 연구 개발 사. UDDI(Universal Description, Discovery and Integration) 3.02 4) 식별 체계 표준번호 UDDI Version 3.0.2 Specification 가. OpenURL 표준화 기구 OASIS UDDI는 웹 서비스에 대한 디렉토리 서비스를 지원하기 위해 개발된 표준으로 웹 서비스를 등록하고 표준번호 ANSI/NISO Z39.88 -2004 검색/발견하기 위한 메커니즘을 제공한다. 표준화 기구 ANSI/NISO UDDI 자료 구조 URL(Uniform Resource Locator)의 한계 즉, 위치 의존성, 자원의 식별과 위치연결의 동일시, 이 용자의 상황(User’ Context)과 무관한 자원 접근으로 인해“상황인식연계(context-sensitive s business Entity : 웹 서비스를 제공하는 tModel : 서비스의:거래 기술, 분류, 식별자 business Entity 웹 서비스를 제공하는 업체 또는 개체에 대한 정보 와 같은 UDDI 객체의 이용에 있어 참조할 linking)” 필요성이 부각된다. 의 업체 또는 개체에 대한 정보 필요가 있는 기술 정보에 대한 정의 “상황인식연계” 특정 기관에 소속됨으로써 이용자의 접근권한 내에 있는 정보자원을 식별하고, 자 란 business Service : 세부 서비스에 대한 Entity : 웹 서비스를 제공하는 설명 정보 업체 또는 개체에 대한 정보 원에 대한 기관의 소유상태와 정보서비스(문헌전달 서비스 등)에 대한 기관의 선호도 등 이용자 정보 환경을 고려하여 이용자에게 적합한 링크만을 선별 제공하는 것이다. binding Template : 서비스를 제공하는 business Entity : 웹 서비스 이용을 위해 필요한 기술 정보를 표현 업체 또는 개체에 대한 정보 OpenURL 프레임워크는 참조대상이 되는 연계자원에 대한 메타데이터와 식별자를 기반으로 하여 이를 지원하는 아키텍처로, 링크 생성자가 주기적으로 링크의 연결여부를 관리해야만 하는 부담을 publisherAssertion : 두 비즈니스 파트너 줄임과 동시에 안정적인 자원 연결 서비스를 지원한다. 간의 관계에 대한 정보 표준 개요 a. businessEntity OpenURL은 위치정보가 아닌 정보자원 자체의 식별을 위해서 필요한 메타데이터 집합이나 고유한 : 특정 서비스를 UDDI 레지스트리에 등록하고자 하는 비즈니스 개체에 대한 정보로써 이름, 설 식별자를 통해서 정보자원을 연결한다. 기존의 URL과는 달리, OpenURL은 연결 대상 자원의 고정 명, 파일 기반의 서비스 검색을 위한 URL, 연락처와 비즈니스의 식별과 분류를 위한 하위 데이 된 위치정보를 지시하지 않는다. 대신, OpenURL은 다음과 같은 내용을 포함한다. 표준 개요 터 구조를 가짐 ① OpenURL을 입력값으로 받는 OpenURL 변환기의 주소 b. businessService ② 이용자 소속을 식별하는 메타데이터 : 서비스에 대한 논리적 정보로 하나의 businessEntity는 여러 개의 businessService가 존재할 ③ 연결대상 자원을 식별하기 위한 정보 수 있음 여기서 연결대상 자원을 식별하는 정보(메타데이터, 식별자)는 정보자원의 특정 표현물(incarnation) c. bindingTemplate 을 식별하지 않고 정보자원 자체를 식별한다. : 웹 서비스에 대한 기술적 정보를 표현하기 위해 사용되는 데이터 구조로, 서비스 엔트리 포인트 OpenURL Framework for Context-Sensitive Services. 를 지정하기 위한 accessPoint와 서비스 구현에 정보를 제공하기 위한 instanceDetail, 서비 기타 <http://www.niso.org/committees/committee_ax.html> 스 이용에 필요한 기술에 대한 개요 문서를 보이기 위한 overviewDoc과 같은 하위 자료 구조 로 구성됨. 하나의 bindingTemplate은 단 하나의 businessService에만 속함 d. tModel : UDDI에서 표현되는 모든 객체가 사용하는 메타데이터를 기술하기 위해 이용. tModel을 사용 하는 목적은 웹 서비스를 이용하는 데 필요한 기술 표준(technical specification)들을 표현하 는 것임 e. PublisherAssertion : 각 비즈니스 개체의 킷값과 비즈니스 개체간 관계성의 종류를 지정함으로써 두 비즈니스 개체 간 의 관계 표현 기타 UDDI Version 3.0.2. <http://uddi.org/pubs/uddi_v3. htm>140 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 141
  • 72. 디지털장서 관리 및 연구 개발 나. URI(Uniform Resource Identifier) 다. DOI(Digital Object Identifier) RFC 1630 - Universal Resource Identifiers in WWW: A Unifying Syntax for the Expression ISO TC 46/SC 9 WG7: Digital Object Identifier System (Final Committee Draft) 2007-12- 표준번호 of Names and Addresses of Objects on the Network as used in the World-Wide Web 05, ISO/WD 26324 표준번호 IETF RFC 4452, the "info" URI Scheme for Information Assets with Identifiers in Public 표준화 기구 IETF Namespaces ANSI/NISO Z39.84-2000 Syntax for the Digital Object Identifier URI는 인터넷에 존재하는 정보자원과 콘텐츠의 위치 확인 및 검색이 가능한 식별체계로서 웹서비스 를 위한 영문·한글 도메인과 IP주소, 무선인터넷 접속을 위한 모바일 인터넷주소, 전화번호를 이용 표준화 기구 ISO, IETF, ANSI/NISO 한 ENUM 등 모든 인터넷 서비스 이용의 기반이 되는 인터넷주소자원을 총괄하는 개념이다. 가장 보편적인 형태의 URI가 바로, 웹페이지 주소 즉, URL인데 이는 URI의 특별한 형태이자 부분집합이 DOI는 인터넷 주소가 변경되더라도 사용자가 그 문서의 새로운 주소로 다시 찾아 갈 수 있도록 웹 라 할 수 있다. URI는 대체로 다음과 같이 설명할 수 있다. 파일이나 인터넷 문서에 영구적으로 부여된 식별자이다. 중앙에서 관리되는 디렉터리에 DOI를 제출 하고 나서, 정식 인터넷 주소 대신 그 디렉토리의 주소에 DOI를 더하여 사용하게 된다. DOI 시스템 표준 개요 - 자원에 접근하기 위해 사용되는 절차 은 Corporation for National Research Initiatives와 협력관계에 있는 미국 출판업 협동조합에 의 - 어떤 자원을 가지고 있는 특정한 컴퓨터 해 고안되었으며, 현재는 세계 DOI 재단에 의해 관리되고 있다. DOI 시스템은 본질적으로, 중앙의 - 컴퓨터상의 특정 자원의 이름 (파일 이름) 관리자 프로그램이 웹페이지의 주소를 최신의 것으로 고쳐주기 위한 복안이다. URI의 또 다른 종류 중 하나는 URN이다. URN은 "제도적인 영속성"을 갖는 URI의 한 형태로서, 그 DOI의 전형적인 형태는 다음과 같다. 것의 정확한 위치는 때로 변할 수 있지만, 일부 에이전시가 그것을 찾을 수 있다는 것을 의미한다. 표준 개요 (텀즈, http://www.terms.co.kr/URI.htm) 10.1002/ISBNJ0-471-58064-3 RFC 1630. <http://www.faqs.org/rfcs/rfc1630.html> 위의 예에서, "10.1002"은 디렉터리를 나타내고, "/" 이후가 DOI의 나머지 부분이다. 맨 마지막 부분 기타 Wikipedia. <http://en.wikipedia.org/wiki/Uniform_Re source_Identifier> 의 "-3"은 그 책의 특정한 부분이나 장(章)을 가리킨다. DOI는 디렉터리 내에서 특정 웹페이지나 URL과 연관될 수 있다. DOI 시스템의 초기 사용자들은 대체로 웹상에서 활용 가능한 수천 개의 문서들을 추적 관리해야하 는 대형 출판업자들이었다. 이와 같이 많은 양의 문서 파일들을 재배치하는 것은 출판업자들의 사이 트에 있는 수많은 링크들에 대한 변경이 수반되며, 어쩌면 사용자들의 편의를 위해 리디렉션이 필요 할 수도 있다. DOI 시스템을 이용하면 나중에 어떠한 위치 변경이 있더라도 다른 사이트들의 링크에 영향을 미치지 않을 것이다. (텀즈: http://www.terms.co.kr/DOI.htm) 기타 DOI.<http://www.doi.org/about_the_doi.html#standards>142 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 143
  • 73. 디지털장서 관리 및 연구 개발 5) 장서평가 영역 나. SUSHI(Standardized Usage Statistics Harvesting Initiative) 가. COUNTER(Counting Online Usage of Networked Electronic Resources) 표준번호 NISO Standardized Usage Statistics Harvesting Initiative (SUSHI) 표준화 기구 NISO 요소기술 : SUSHI는 Project COUNTER와 밀접한 관련이 있는 이용통계 관련 표준으로 COUNTER 표준보고 Release 1 of the COUNTER code of Practice for Journals and Databases 서의 XML 버전을 자동적으로 보내고 받을 수 있는 SOAP기반 미들웨어 서비스이다. 표준번호 Release 2 of the COUNTER code of Practice for Journals and Databases (Published April 2005) 아래 그림에서도 볼 수 있듯이 SUSHI는 도서관 사서의 개입 없이 다수의 이용통계 보고서가 일정 주기에 맞춰 도서관으로 자동적으로 배달되고 통합되게 하는 서비스 표준이다. 웹 인터페이스 상에 표준화 기구 PALS(Publisher and Librarian Solutions) 그룹 서 이용에 대한 정보가 SUSHI 인터페이스를 통해 누적된다. 이렇게 누적된 데이터는 리포트 요청자 에게 자동 또는 원하는 시기에 전달될 수 있다. 온라인 정보자원의 이용성을 측정할 수 있는 국제표준을 개발하기 위해 JISC, ALPSP, The Publishers Association에 의해 형성된 PALS 그룹이 주도한 프로젝트이다. COUNTER는 2002년 3월에 영국에서 시작되었으며, 온라인 이용 통계의 기록과 교환을 용이하게 함으로써 사서와 출판업자와 정보중개자를 지원할 목적으로 추진되었다. 2002년 12월에 COUNTER는 Code of Practice를 공개했는데, COUNTER Code of Practice는 데이터 프로세싱뿐만 아니라 측정될 데이터 요소 및 기타 용어에 대한 정의, 보고서의 내용과 포맷 출력에 대한 가이드라인을 제공한다. 가이드라인은 사서가 다양한 벤더들이 산출한 통계를 비교하고 표준 개요 온라인 자원의 구매 결정시에 참조할 수 있으며 더욱 효율적으로 기반(infrastructure)을 확립할 수 있게 도와주고 있다. 또한 벤더와 정보중개자는 COUNTER를 통해서 고객에게 유용한 포맷으로 데 이터를 작성하고 다른 배송 채널들 간의 상대적인 이용성을 비교하며 온라인 이용 패턴에 대해 더 많이 학습할 수 있다. 이 뿐만 아니라, COUNTER는 온라인 이용 통계에 대한 정보에 관심 있는 사 표준 개요 람들을 위해 가이드라인을 제공하고 있다. COUNTER Code of Practice의 Release 1은 도서(Books)와 참고자료(Reference Works)에 관 해 사서와 출판업자가 전문 지식을 바탕으로 작성한 입력 폼(form)에 의해 개발되었으며, 벤더가 온 라인 이용에 관한 기초 보고서를 제공할 수 있는 기반을 마련하고 있다. COUNTER Code of 따라서 SUSHI가 표준화되고, 구현되면 이용통계를 수집하는 노력은 현저히 감소하게 될 것으로 기 Practice의 Release 2는 사서들의 포커스 그룹과 COUNTER International Advisory Board 및 대된다. 하지만 현재 SUSHI 표준은 개발 초기 단계에 있어 이 기능을 통해 이용통계 보고서를 제공 기타 소스로부터 입력된 자료에 의해 개발되었으며, 온라인으로 이용가능하며 대부분의 도서관 자료 하는 업체의 수는 제한적이라는 단점이 있다. 구입예산의 주요 아이템인 저널과 데이터베이스에 초점을 맞추고 있다. (현재, EBSCO, ExLibis, Innovative Interface,Inc, Swets Information Service, Thomson COUNTER는 전문가 집단뿐만 아니라 사서, 출판업자, 정보중개자의 국제적 커뮤니티에 의해 광범 Scientific 지원 중) 위하게 지지되고 있다. Code of Practice는 COUNTER의 International Advisory Board 뿐만 아 니라, Board of Directors, Executive Committee로 대표되는 모든 그룹의 활동적인 참여자들과 기타 SUSHI. <http://www.niso.org/committees/SUSHI/SUSHI _comm.html> 함께 발전하고 있다. 기타 COUNTER. <http://www.projectcounter.org/>144 제2부 NDL 장서관리시스템 개발지침 및 기능 표준화 제5장 표준화와 요소기술 145
  • 74. 제3부 표준 메타데이터 모델 및Semantic Language 연구 개발 1. 서론 2. 표준 메타데이터 모델 및 적용 3. 시맨틱 온톨로지 언어 4. 국립중앙도서관 FRBR모델 기반 온톨로지 설계 5. 국립중앙도서관의 시맨틱 DL 서비스 6. 결론
  • 75. 디지털장서 관리 및 연구 개발 제1장 서론 이러한 문제를 해결하기 위해서 주목을 받고 있는 것 중의 하나가 넓게는 메타데이터이며, 더 구체적으로는 FRBR모델을 온톨로지 모델 중 하나인 토픽맵으로 구현해 보자는 것이다. 이 목적 뿐만 아니라 최근 회자되고 있는 Semantic Web환경으로 나아가기 위해서도 메타데이터는 온톨 로지와 함께 현재의 다양한 정보시스템의 기본축이 될 것이다. 이에 현재 정보시스템의 주요한 축이 되고 있는, 목록 및 이용자 정보서비스에 대전환점이 일어나고 있는 것은 당연한 일이다. 바로 이 전환점으로 인해서 이제 진정한 의미에서 이용자를 중심에 둘 때이다. 기존의 top- down의 시스템이 아닌 bottom-up시스템을 만들 수 있는 계기가 된 셈이다. 기존에는 메타데이 터가 없었다는 것은 아니다. 도서목록 등의 메타데이터는 다양한 형태로 전통적으로 도서관에 존 재해 오고 있었지만 지금처럼 표준화 및 상호운용을 통해서, 더 다양한 관계를 맺게 함으로써, 더 오늘날은 기존의 도서관 자원들뿐만 아니라 다양한 형태로 증가하는 전자정보원을 새롭게 조 주관적으로 의미 있는 묶음으로 정보를 제공해 주지 못한다는 것이다. 즉, 이용자가 알고 싶어 하 직하고, 이용자들이 보다 편리하게 지식을 습득할 수 있게 하는 효율적인 정보제공시스템을 제공 는 주제영역을 좀 더 의미 있게 묶어주자는 것이 정보학의 존재 이유 중의 하나일 것이다. 이점에 하는 것이 필요하다. 도서관 전산화 이후 약 40년간 MARC(MAchine Readable Cataloging, 이 서 Cutter가 19세기에 이미 말한 콜로케이션(Collocation)을 주제명목록을 중심으로 한 주제중 하 MARC)가 사서들에게 가장 친숙한 목록기술의 도구가 되어왔으나 현재는 다양한 목적에 맞추 심의 컨텐츠를 조직하자는 의도는 시사하는 바가 크다. 이제 우리가 어떻게 다양한 메타데이터를 어 다양한 메타데이터 스키마가 개발되어서 가공, 저장, 표현되고 있다. 웹의 출현 및 계속 되는 효과적으로 활용하여, 누구에게나 똑같은 의미로 다가가는 객관적인 정보뿐만 아니라 다양한 상 발전으로 무수히 생성되는 모든 정보를 MARC의 가변적이지만 평면적인 개념으로는 도저히 담 황에 처한 다양한 이용자들의 주관적인 정보요구를 들어줄 수 있는 진정한 의미에서의 이용자를 을 수 없는 상황이 되었다. MARC는 복잡하기도 하지만 서지정보가 지닌 풍부한‘관계’ 표현 를 위한 시스템을 만들어 줄 때가 된 셈이다. 즉, 이용자들이 처한 상황과 맥락 속에서 의미화를 갖 하는 데는 태생적인 한계가 있다. 게다가 간결성, 효율성, 표현력, 융통성에서 너무나 제한적이 게 해주자는 것이다. 다. 이용자의 정보요구가 한정된 정보 레이어에 포함되어 자료유형 형태로 존재하고 있지만, 현 이를 위해서는 관련된 메타데이터들끼리의 다양한 연결, 재조합, 조화 및 융합이 필요할 것이 재 MARC자체의 획일성으로 인해서, 아주 세밀화되고 구체화된 이용자의 요구를 모두 수용하지 다. 하나하나 따로 분산되어 의미 없게 존재하는 것이 아니라, 전체적인 맥락에서, 하나의 다양성 못한 채 정보시스템 내에서 제공되고 있는 실정이다. 수학으로 보자면 미적분으로 해결해야 할 을 인정하면서 융합을 시켜보자는 것이다. 각각의 도서관에서 따로 따로 존재하고 있었던 정보를 문제를 그냥 인수분해 정도로 해결하려고 하는 것이나 마찬가지이다. 현 정보시스템의 경직성이 웹상에서 전체의 그림을 그려보면 우리가 생각하지도 못했던 관계가 만들어 질 수 있다는 것이 이용자의 유연성과 다양성을 못 따라 가고 있다는 의미이다. 다. 바로 이런 것이 이용자의 뇌리 속에 개념상으로 존재하고 있는 것도 다양한 collocation에 의 조금 전문적으로 표현해 보면 이용자들의 개인적인 요구와 선호 (Personal Needs and 해서 다양한 형태의 정보를 찾아 낼 수 있다는 것이다. 또 이것은 창고형 또는 폴더형의 웹에서 Preferences)와 시스템의 디지털 자원의 기술 (Digital Resource Description) 사이에 많은 차 ‘생태계형 웹 (ecological web)’으로의 진화가 눈앞에 있다. 즉, 이제 정보조직화 방식의 근본적 이 (difference, 또는 bridge)가 존재한다는 것이다. 이를 해결하기 위해서 이용자, 시스템 양측 인 변화가 필요한 때이다. 이렇게 될 때 인터넷 상의 방대한 정보들이 중심으로 조직화되기 ‘나’ 이 서로 바라보고 있는 지향점(Mental Model)을 비교, 분석해 보는 것이 이러한 불일치(dis- 시작했음을 의미한다. 수많은‘나’ 등장과 함께 창고 속에 의미 없이 흩어져있던 정보들이 이 의 crepancy)를 줄여나가는 데 큰 도움이 될 것이다. 그 비교, 분석을 FRBR(Functional Require- 용자들의 개별적인 맥락 또는 상황 속에서의 의미화 (sense making)과정을 거쳐서 재편성되고 ments for Bibliographic Records, 이하 FRBR) 모델을 기준으로 바라보자는 것이 이 연구의 있으며, 그 결과 인터넷 공간은 유기적인 정보 생태계공간으로 변모해 나갈 수 있다는 것이다. 목적이다.148 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제1장 서론 149
  • 76. 디지털장서 관리 및 연구 개발 그렇다면 이제 문제는 이런 전자정보원의 메타데이터를 어떤 방법과 기술로 관계를 맺게 할 것 근거한 Prototype을 만든다. 인가가 가장 중요한 이슈가 될 것이다. 이 메타데이터 역시 따로 따로 놀게 그냥 둘 것인가? 아니 구체적인 데이터는 현재 국립중앙도서관의 서지 메타데이터인 KORMARC중에서 한국문학부 면 국가차원에서 융합을 시도할 것인가? 인터넷의 발전으로 분산된 환경에서 메타데이터를 단일 문 (분류번호 81X 번호 대)에서 2003년 이후의 자료들을 사용한다. 이에 기존 선행 알고리듬을 형식으로 통합하는 것은 분명히 한계가 있다. 따라서 이용자의 수준과 분야마다 요구되는 다양한 문헌 및 실제 자료로 분석할 것이다. 그 다음에는 우리 KORMARC에 맞는 알고리듬이 개발 될 데이터 요소를 충족시켜 줄 수 있는 메타데이터의 다양성을 인정하고 이를 수용할 수 있는 메타 것이다. 더 기술적으로는 KORMARC을 먼저 xml로, 그 다음에는 FRBR모델로 매핑된 뒤 Field 데이터 간의 표준화 및 상호운용성을 서두르자는 것은 당연한 일이다. 이 말은 어떻게 보면 아주 간 관계(Relationship)를 추출하고, 요소, 관계 테이블을 작성하여(Work, Expression, 역설적으로 들릴 수도 있다. 위에서‘나’ 중심의 정보 조직화라는 말에는 지극히 개인주의적인 요 Manifestation, Item 항목 분류) 새로운 관계를 형성한다. 그 다음은 개발된 알고리즘을 바탕으 소가 있는 듯 했으나, 실제로 이 과제는 국립중앙도서관과 같은 강한 카리스마의 존재가 필요한 로 실제적인 온톨로지를 설계한다. 이때 필요한 모델링 표준 기술형식은 RDF/OWL, Topic Map 것이다. 환원주의자들이 말하는 하나하나 쪼개어서 분석하는 것만이 만사가 아니라 융합해서 섞 중에서 Topic Map으로 한다. 그 기술 도구는 Protege, Semantic Works, Ontopoly 중의 하나 어서 전체의 맥락에서 현상을 바라보게 하자는 것이다. 즉 전체의 맥락 속에서 관계를 맺게 해주 로 한다. 는 역할이 필요하다는 것이다. 현재의 KORMARC자체가 얼마나 우리가 원하는 수준으로 매핑할 수 있을 지? 또는 다른 메타 국가단위의 메타데이터 센터를 만들기 위해서는 향후 몇 년의 단계별 과정으로 나누어 로드맵 데이터 (가령, DC) 등으로는 어떨지 등의 연구는 추후에 고려해 볼 수 있을 것이다. 을 그리고, 진행해야 할 것이다. 그 중 이번에 집중적인 관심을 갖는 것은 KORMARC의 FRBR 이 Prototype는 현재 KORMARC에 있는 그대로의 모습을 가지고 토픽맵으로 구현하여 어떻 모델화 및 나아가서는 온톨로지화이다. 지금까지 목록규칙에서 취급하지 못했던 전자자료나 멀 게 이용자의 요구에 부응할 수 있을 것인가를 보여주면서 또한 이 현재 데이터의 한계점 및 개선 티미디어자료와 같은 자료를 수용할 수 있고 보다 더 인터넷 환경을 적용한 시스템을 만들어 다 책도 역시 제안하고자 한다. 앞으로의 자료목록의 새로운 방향도 제시할 수도 있을 것이다 양한 이용자들의 요구에 부응할 수 있는 시스템은 불가능할까? 말로만 이용자를 위한다는 lip service가 아니라 진정하게 다양한 이용자들의 정보요구에 부응할 수 있는 시스템이 기존의 평면 적인 KORMARC 데이터를 활용, 변형하여, FRBR 모델을 활용하여 개념들 간의 관계를 생성한 다면 우리가 미처 생각 못 했던 새로운 수많은 Collocation이 만들어 질 수 있을 것이다. 우선 본 연구에서 지향하는 단계의 연구는 KORMARC을 FRBR 모델로 구현할 수 있는 가이다. 본 연구에서는 앞서 언급된 생태계형 웹 (ecological web)에서 예상되는 이용자 요구의 변화에 따른 도서관 장서목록의 변화를 FRBR라는 개념적인 모델에 적용해보고 더 구체적으로는 Semantic Web 구현의 기반으로 온톨로지 언어인 토픽맵이라는 새로운 기술에 접목한다. 기존 의 KORMARC에서 추출하여 FRBR 모델화 된 데이터를 기반으로 이용자의 요구에 다양하게 부 합하는 차세대 정보서비스를 제공하는 Semantic Web 기술에 대한 연구를 수행한다. Semantic Web 구현을 위한 온톨로지 언어로 각광받고 있는 ISO 13250의 토픽맵과 W3C에서 제정한 RDF/OWL을 이런 목적으로 두고 검토한다. 특히 FRBR모델의 구축은, 구축이 어렵고 추론이 강한 RDF/OWL보다는 연관자원을 다양한 이용자에게 의미 있게 묶어주는 기능이 강하고 단순 하고 또 구현이 용이하다는 점에서 토픽맵 기술로 구축하는 것이 적절하다고 판단해서 토픽맵에150 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제1장 서론 151
  • 77. 디지털장서 관리 및 연구 개발 제2장 표준메타데이터모델및적용 기존의 경험을 바탕으로 새로운 변화를 시도하지 않으면 안 되는 상황에 놓이게 되었다. 자료가 기하급수적으로 늘어남에 따라서 더 중요한 것은 기존의 syntactic한 Match로는 도저히 감당 할 수가 없었던 것이다. 검색에서의 정확성과 재현율의 조화를 바랄 수가 없었던 것이다. 기존 도서관의 어휘통제 기술만으로는, 보이지 않고 깊게 묻혀있는 자료들에서 애매 모호성을 제거하 면서 명확하게 표현할 수가 없었다. 뭔가 뜻을 담은 검색을 할 수가 없었던 것이다. 바로 이 점에 서 필요한 것이 Semantic Matching이 요구되는 것이다. 지금 그 개념과 기술이 모두 가능한 시기이다. 이점에서 이젠 새로운 요구를 담을 수 있는 내용과 그릇이 필요하다. 기존의 질서, 환경으로는 더 이상 현실을 담을 수가 없었던 것이다. 좀 더 깊게 의미가 표현되고 (rich), 이용자나 시스템이 1. FRBR 모델 대화 하게 할 수는 없을까? Semantic Web 기술의 도래가 바로 이 점에서 새로운 지평선을 열어 준다. 이젠 거의 어느 도서관에서도 단독으로 서비스를 제공하겠다는 소유의 개념으로 정보를 제 1.1 FRBR 모델의 주요 개념 공하지는 못한다. 소유보다는 접근이라는 개념으로 요구가 바뀌어 나가고 있다. 기존의 카드목록 에서 기본표목과 부출표목으로 나누어 생각하던 것을 접근점(access point)라는 개념으로 용어 전통적인 도서관목록은 도서관의 소장자료를 대상으로 구체적인 데이터를 정확하게 기술하 를 정리하면서‘기본’ ‘부출’ 개념이 사라져가듯이 목록규칙에 변화가 일고 있다. 과 의 는데 초점을 두고 있었다. 즉, 소장자료의 요소를 기술하고(to describe), 서가에서의 위치를 안 똑같은 내용이 다른 언어나 제목으로, 다른 (영화, 오페라, 발레작품, 뮤지컬, 애니매이션 등의) 내해 주고(to locate), 검색기능을 제공(to retrieve)함으로써 도서관 소장자료에 대해서 색인 역 정보원으로, 또는 매체이전이 용이해 짐에 따라서 다른 (Book, CD, DVD, VHS, mp3, html, 할을 하는 대체물(surrogates) 역할을 해온 것이다. 정보를 원하는 이용자와 정보를 조직한 시 pdf 등의) 포맷으로도 존재할 수 있다. 이렇게 다양하게 자료들이 존재하듯이 이 자료를 선정하 스템 사이에서 그냥 자료를 일치(matching)시켜 줌으로써 그 역할을 다해왔었다. 이점에 있어 는 과정도 이용자마다 다를 수 있다. 가령, 어떤 저작을 어떤 어린이는 신데렐라라는 내용의 그림 서 MARC가 정보 자원의 기술(description)이라는 측면에서 도서관 목록의 역할을 성실히 수행 이 든 쉬운 책을 찾을 수도 있고, 맹인이용자는 오디오 테이프로 되어 있는 자료를 찾을 수도 있 해온 메타데이터이다. 이러한 패러다임에 근거한 정보시스템을 Matching Paradigm이라고 해 을 것이고, 또 그냥 일반인은 한국어로 되어 있는 자료를 찾을 것이고 어떤 사람은 영어로 되어 두자. 있는 자료를 찾을 수도 있을 것이다. 또 하나의 저작을 시작으로 해서 다양한 장르의 다른 작품, 이러한 과정에서, 도서관은 목록규칙(cataloging rules)과 형식(format)을 채택하여 이용자들 주인공, 그 작품의 배경, 그 작품과 관련된 주제어들을 바로 검색하면서 생각하지도 않았던 정보 이 원하는 자료에 접근할 수 있는 여러 경로를 제공해 왔다. 그렇기 때문에, 도서관에 소장하고 를 우연히 발견할 수도 있다. 있는 자료에 효율적으로 접근하기 위한 도구가 도서관목록이었고, 이용자들은 도서관이 제공하 바로 이러한 정보요구를 포함한 새로운 개념적인 모델인 FRBR는 이용자가 필요로 하는 데이 는 목록을 훑어본 후 서가에 배열되어 있는 자료에 물리적으로 접근할 수 있었다. 이 점에 있어서 터요소를 어떻게 조직하느냐에 중점을 두고 있다. 기존에는 없었던 다양한‘관계’ 통해 이용자 를 는 MARC로 구성된 메타데이터가 그 역할을 잘 수행해왔다. 그러나, 데이터의 기술언어라는 측 의 필요에 따라 의미 있게 묶어주는 기능 (Collocation)과 항해기능 (navigation)을 이용자에게 면에서 보면 MARC는 특정한 기술규칙에 근거한 것으로, 비록 네트워크 환경에서 사용되고 있으 효과적으로 지원하여, 대상 자료를 한정하지 않고 전자 자료의 검색기능을 강화하고 있다. 즉, 나 다양한 정보자원을 기술하는 데에 여러 가지 한계가 있다. FRBR 모형은 목록에서 서지 개체를 다층 레이어 구조로 개선하여, 각각의 데이터의 속성을 더 정보의 양이 급증하고, 정보를 담고 있는 매체의 성격과 유형이 다양해지면서, 도서관목록은 많이 부여하고 (tagging을 하여), 전에 없었던 관계를 형성하여 훨씬 더 효율적인 정보 검색을 할152 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 153
  • 78. 디지털장서 관리 및 연구 개발 수 있게 한다. 전통적으로는 서지단위는 맥락을 무시하고 또는 완전히 서로 다른 맥락에서 기술 의 그룹으로 제1그룹은 저작, 표현형, 구현형, 개별자료(work, expression, manifestation, 되었지만, FRBR에서는 다른 저작 또는 표현형과 관계를 맺어 주기에 충분하게 맥락 속에 존재하 item)로 되어 있으며, 제2그룹은 개인, 단체(person, corporate body) 그리고 제3그룹: 개념, 대 게 해준다는 것이다. 이 점은 정보검색에서 아주 중요한 요소이다. 어떤 특별한 분야를 찾던 이용 상, 사건, 장소(concept, object, event, place)등으로 구성되어 이 모델에서 entity로 사용된다. 자는 이제 다른 관계있는 자료들도 한 눈에 볼 수 있게 된 것이다. 즉, 관계가 있으리라고 생각되 그리고 이 각각의 entity는 특유의 속성(attribute)를 가진다. 는 것이 Collocation되어 나타난다는 것이다. 가령 이 정보를 찾던 사람이 찾았던 다른 정보들의 묶음도 보여줄 수 있다는 것이다. 이것은 인터넷상의 다양한 전자자원과 멀티미디어 자료간의 복 제 1그룹의 속성들의 예 잡한 관계를 다루기에 적절하며, 웹상에 있는 자원의 다양한 관계를 효과적으로 표현할 수 있다. ● Work 이제 목록은 책자형태의 자료에 갇혀 있는 것이 아니라, 인터넷 환경의 전자적 자원에 대한 그 특 Work title, form or genre, date, performance medium, coordinates (map) 성을 반영하고, 이용자 지향적인 입장에서 목록의 역할과 이를 담아내는 시스템에 대한 변화를 ● Expression 요구하고 있는 것이다. Expression title, form of the expression, language of the expression, type of score 그리고 지금까지는 용기(Carrier) 위주로 목록을 해왔지만, 서지 기술의 대상물로서 새로 출현 ● Manifestation 한 디지털자료는 매체전환이 용이하므로 콘텐츠(contents)와 용기(carrier)를 구분할 필요가 있 Manifestation title, publisher, date of publication, form of carrier, dimensions 다. FRBR모델의 Work나 Expression은 개념적으로 존재하는 컨텐츠이고, Manifestation과 ● Item Item은 실제 물리적으로 존재하기 때문에 목록이라는 용기에 담는다. 현재의 목록기술규칙은 물 Location or call no.(i.e. identifier, barcode), provenance, condition 리적 형태를 기준으로 하고 있어 같은 콘텐츠이지만 형태가 다른 자료라는 것을 기술하기가 어렵 다. 여기에 급증하는 웹정보자원은 웹상에서 같은 위치에 존재하지만 내용이 수시로 변하여 기존 Attribute examples (groups 2 & 3) 의 목록규칙으로는 이를 취급하기 어렵게 한다. 즉, FRBR은 지금까지 목록규칙에서 취급하지 못 했던 전자자료나 멀티미디어자료와 같은 자료를 수용할 수 있고, 컴퓨터 환경을 보다 더 적용한 ● Person: names, dates, titles .... 목록규칙을 고려하여 출현한 것이다. 이것은 데이터베이스 설계시 사용되는 "개체-관계분석 ● Corporate body: name, number, place... (Entity-relationship Analysis)" 기법을 사용한 것으로 이용자의 관점에서 서지레코드가 수행 ● Concept: Term, e.g. economics 하는 제 기능을 명확하게 정의된 용어로 기술하고 그 요건을 모델화하여 도식화 한 것이다. 따라 ● Object:Term, e.g. ships 서 목록 자체를 관계형 데이터베이스 모델로 만들려는 것이다. 온라인 상에서의 서지 레코드간 ● Event: Term, e.g. Battle of Hastings 의 연계성이 점점 중시되고 있는 점 또한 이렇게 관계형 데이터베이스를 모델로 FRBR모델이 필 ● Place: Term, e.g. New Haven 요했던 것이다. FRBR는 다음의 세 그룹의 개체를 개념화하고 있으며, 개체(entity)와 각각의 개체가 가지고 이제는 여기에 Created by, Translated by, Produced by, Owned by, Is subject of 등의 관 있는 속성(Attributes)들이 상호작용하여 다양한 관계 및 역할(role)을 맺어 기존의 MARC시스 계 (Relationships)가 입체적으로 연결됨으로써 이용자들이 원하는 자료를 자유롭게 네비게이션 템에서는 평면적으로만 존재하고 있던 구성을 완전한 관계형 모형으로 구현해 주고 있다. (navigation)할 수 있는 구조를 지향하고 있는 개념적 모델이다. FRBR는 또 세 그룹의 entity들과 이 entity들을 4개 (search, identify, select, obtain)의 Operator를 적용 한 하나의 도구로서 도서목록과 이용자의 needs와 tasks로 연결시킨다. 세 개154 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 155
  • 79. 디지털장서 관리 및 연구 개발 Relationship examples (within group 1) 2. KORMARC의 FRBR 변환 ● Work to work 2.1 기존 변환 알고리즘 분석 ● Successor ● Supplement 가. OCLC의 Work-set 알고리즘 ● Complement ● Summarization 우선 OCLC에서 MARC의 FRBR모델 변환에 대한 기존 알고리즘 work-set을 분석해 보고자 ● Adaptation 한다. Work-set 알고리즘 연구는 각 서지레코드에서 저자/서명 키를 생성한다. 현재 알고리즘 ● Transformation 은 생성된 work-set이 FRBR work보다 상위레벨인 경우의 형식은 무시하고 작성한다. work- ● Imitation set은 같은 저자/서명키를 가진 서지레코드 그룹을 의미한다. 전거화일에서 다양한 헤딩으로 부 여되는 저자나 저자/서명은 설계된 형식이 변화되었다. LC 전거데이터에서 이 값을 매핑하여 설 1.2 FRBR 모델의 주요 안건 계하는 것을 첫 단계로 하였다. 도서관목록은 정보생태계 변화와 더불어 그 개념이 보다 확장되고 있음을 알 수 있다. 다시 말 1) Authority Mappings 해, 전통적 환경에서의 도서관목록이 자료에 대한 정확한 기술과 소장위치를 제시해 주는데 보다 저자 매핑은 이름채택 표목에 따라 다양한 형식으로 연결된다. 즉 400tag에 여러 개의 보라참 많은 에너지를 소모하였다면, 디지털 환경에서는 이를 기반으로 이용자들이 그들의 요구에 보다 조가 생성될 수 있다. 저자/서명 매핑은 서명 채택 표목에 따라서 저자와 한 쌍이 되는 서명의 다 적합한 자료를 자유롭게 네비게이션할 수 있도록 구조적인 측면을 부각시키고 있는 것이다 양한 형식과 연결된다. 여기서도 400tag에 여러 개의 보라참조가 생성될 수 있다. (user’ navigate complex information spaces). 더불어, 생산자의 관점보다는 이용자의 관점 s 을, 그리고 과거와의 연속성을 지향하면서도 새로운 정보기술을 충분히 활용할 수 있는 방향으로 ⓛ Constructing Authority Indexes 진화되고 있다는 특징을 보인다. 이 과정에서, 도서관목록은 이용자들이 다양한 정보에 접근하기 위한 진정한 접속점으로서의 저자 역할을 다할 수 있도록 보다 유연하고 논리적인 구조로 발전할 수 있을 것이며, 동시에 여기서 도 a. 채택표목에서 구성한다. 서관목록의 유용성을 확보할 수 있는 방안을 찾을 수 있을 것이기 때문이다. 이제는 더 이상 과 100tag가 없는 레코드를 제외한다. 거의 스냅사진으로 지금의 역동적인 정보를 정확하게 재현해 낼 수 없는 시점에 와 있음을 자각 100tag가 있고, 서명정보를 가진 서브필드 tnmpr이 있는 레코드를 제외한다. 하여야 한다. 008tag /09(레코드종류)가 a또는 공백인 레코드가 아닌 것을 제외한다. 즉 채택 표목레 코드만을 사용한다. 008tag /15="a"(주제부출 표목을 사용)이고 /11= a"(주제명표목표 a=LC주제명 표목표) “ 가 아닌 레코드는 제외한다. 즉, 주제명표목표가 LCSH인 것만 대상으로 사용한다. 국립 중앙주제명표목표는 k 사용156 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 157
  • 80. 디지털장서 관리 및 연구 개발 100tag 서브필드 abcdq 값으로 키를 생성한다. a. 첫 번째는 정확한 일치이다. 이름과 생몰년이 나와 있는 채택표목과의 완전한 일치이다. b. 다양한 표목에서 구성한다. b. 만약 다양한 일치하는 것이 있다면, 가장 자주 사용된 채택표목을 선택한다. “사용된(used) 008tag /14="a"가 아닌 레코드를 제외한다. 즉 기본표목이나 부출표목을 사용하는 레코 “의 뜻은 WorldCat레코드 번호가 존재하고, 다른 레코드에서 부여된 소장번호의 값이 추가 드만을 대상으로 한다. 로 가진 저자의 레코드를 뜻한다. 400tag 서브필드 abcdq 값으로 키를 생성한다. 반복 가능한 필드이다. c. 마지막으로 서지레코드의 이름이 서브필드 d의 생몰년 값을 가진 것처럼 서지레코드와 반복 키 값이 채택 표목과 일치되지 않는다면 매핑하여 저장한다. 되는 이전 서브필드 들의 날짜 앞에 서브필드를 추가로 만들 수 있다. “Marsh, John Robert $cMrs 1900-1949” 는“Marsh, John Robert $cMrs $d1900- 저자/서명 1949”이런 식으로 변할 수 있다. a. 채택표목에서 구성 저자나 서명 중 하나가 없는 레코드는 제외한다. 저자/서명 008tag /09(레코드종류)가 a또는 공백인 레코드가 아닌 것을 제외한다. 즉 채택 표목레 서명은 전거색인에서 정확한 일치를 찾기 위해 5가지 방안을 시도할 수 있다. 서지적 서명 값의 코드만을 사용한다. 생성은 두 가지 가능한 서명에서 만들 수 있다. short title과 full title은 전거 색인 표목과 일치 008tag /15="a"(주제부출 표목을 사용)이고 /11= a"(주제명표목표 a=LC주제명 표목표) “ 를 찾기 위해 사용된다. 방안은 명령을 주고, 일치에 성공했을 때 멈춘다. 가 아닌 레코드는 제외한다. 즉, 주제명표목표가 LCSH인 것만 대상으로 사용한다. 국립 a. short title과 결합한 저자는 전거의 저자/서명 색인에서 찾을 수 있다. 중앙주제명표목표는 k 사용 b. short title은 다음으로 시작한다. 100tag의 서브필드 tmnpr, 또는 130tag 서브필드 amnpr에서 서명을 구성한다. 저자의 마지막 이름 / 100tag 서브필드 abcdq에서 저자를 구성한다. 저자의 첫 번째 이름 저자의 마지막 이름 / 저자/서명으로 키를 생성한다. 저자의 이름은 전체 서명이 아니다. 그러므로 저자의 이름에서 제거 한다. b. 다양한 표목에서 구성 c. full title과 결합한 저자는 일치를 체크한다. 400tag에서 서브필드 tmnpr이 없는 레코드를 제외한다. d. tragedy of, comedy of single plays 등과 같이 별칭 패턴이 적용된 full title이 있다면, a, 400tag 서브필드 tmnpr로부터 서명부분을 생성한다. 반복 가능한 필드이다. an, the 같은 관사를 삭제하고 일치를 체크한다. 같은 400tag 서브필드 abcdq에서 저자부분을 생성한다. 채택표목과 일치하지 않는다면 저자/서명으로 매핑하여 저장한다. 2) Work-Set Keys ② Matching Authority Indexes ① FRBR Work-Set을 설계하는데 3가지 단계가 있다. a. 저자부분을 설계한다. 저자 b. 서명부분을 설계한다. 전거화일 자동매칭할 때 서지 레코드에서 다른 이름으로부터 이름을 일치시키는 데에는 다양 c. 키 부분을 합친다. 한 방법이 있다.158 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 159
  • 81. 디지털장서 관리 및 연구 개발 ② Construction Key Parts Full Title 저자 a. short title이 242, 245, 256, 또는 247tag을 서브필드 a로만 구성되어 추출하였다면, a. 100, 110, 111 tag의 서브필드 abcdq를 추출한다. full title의 서브필드 sbfgnp를 추출한다. b. 전거 색인부분에 기술한 규칙을 사용하여 전거저자매핑이 된 이름을 찾는다. b. 그렇지 않으면 full title은 short title과 동일하게 관리한다. c. 채택표목이 있다면, 채택표목으로 대신한다. c. full title이 비어 있다면, 740tag의 서브필드 anp에서 얻으려고 한다. d. full title이 여전히 비어 있다면, 245tag 서브필드 k로부터 얻는다. 서명 값 정화 e. full title을 정화한다. a. 가능하다면 지시기호를 제외시키고 사용한다. b. 130이나 240tag라면, 소문자로 변환하고“english"를 제외한다. ④ Combinig Key Parts c. 괄호를 스페이스로 변경하여 삭제한다. 목표는 유일하고, Work-Set의 확실한 값을 갖는 key를 생성하는 것이다. 가장 좋은 경우는 d. NACO에서 사용하는 정규화를 진행한다. 서명을 가진 저자나 단독의 통일서명을 가졌을 경우이다. 저자나 통일서명이 없는 경우라면, e. 관사를 삭제한다. 7XX 필드나 연관된 항목의 도움을 받아 생성하려고 시도한다. 연관된 항목의 그룹의 진행절차는 f. 필요 없는 공백을 삭제한다. 저자가 없는 경우에 set의 지난 절차부분을 협의한다. 1XX, 7XX가 레코드 내에 존재하지 않는 경우, 오직 24Xtag를 가진다면, 유일한 키의 통제번호를 가지고 병합한다. Short Tile 가능한 키 패턴 4가지는, 1)저자/서명 2)통일서명 3)/서명/하나이상의 이름 4)/서명/제어번 a. 다음의 필드에서 서명을 추출한다. 호 등이다. - 130tag 서브필드 amnpr - 240tag 서브필드 amnpr a. 저자가 있다면 - 242, 245, 246, 247tag에서 전거통제화일에 매핑되어 있는 저자나 서명의 값을 찾는다. 242(목록작성기관에서 번역한 표제), 246(여려형태의 표제), 247(변경전 표제나 표제 만약 매핑되는 것이 없다면, 저자 + full title을 다른 표제 패턴에 적용하여 찾아본다. 변동) b. 그렇지 않으면, 130tag가 존재하면 서명하나로도 충분한 키가 된다. 008tag/35-37의 언어가 eng가 아니면, 246tag가 서명필드를 가지는 것 c. 그렇지 않으면, 7XX 필드가 존재하면, 서명에 부가된 이름이 존재한다. 7XX의 서브필드 레코드에 110 또는 100, 111 등의 저자가 없는 경우는 서브필드 abfgnp 를 사용한다. tk는 제외하고, 이름인 abcdq를 사용한다. 나머지는 서브필드 a를 사용한다. d. 그렇지 않으면, 유일한 값이 있는 제어번호를 추가한다. ③ Short title을 정리한다. 나. MARC 요소의 메타데이터 분석 1) DC / MODS 요소와 MARC 메타데이터 요소 매핑160 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 161
  • 82. 디지털장서 관리 및 연구 개발 MARC 기술사항 DC MODS FRBR 다. FRBR 모델의 속성(Attribute)과 MARC의 매핑 245/246/740 tag Title titleInfo work 1XX/7XX tag creator name 2집단-책임개체(개인/단체) 실제 MARC21의 구체적인 항목과 FRBR 모델의 각 개체별 속성들과의 매핑사례를 LC 보고서 6XX tag subject subject 3집단-주제제공개체 를 바탕으로 나열해 보기로 한다. 050/056/082/080tag classification 260tag work date originInfo 1) Work(저작)의 인용 008/15-17 manifestation leader/06,07 type typeOfResource expression 개체 attribute 속성명 MARC21 요소 MARC21 기술내용 비고 008/23~34 BK/SE/VM/MU/CF/MP genre 100/110/111 006/007/008고정장 256tag physicalDescription 700/710/711 person/corpo- 300tag format extent created by 작성자 작성자는 개인, 단체 $t,$n,$p,$d,$f,$k,$s,$m,$r, rate body 520tag abstract $l,$o,$h 505tag tableOfContents 통일표제 여러표제가 있을 130 $a,$n,$p 856tag location Title of work 저작의 표제 종합통일표제 경우, 통일표제 identifier item 240/243/245 $a,$n,$p 020/022tag etc identifier 서명기술 (uniform title) 852/856 tag source location 130 $d 저작연도가 없을 760-787/800-830/ 440/490 tag relation relatedItem Date of work 저작관련 일자 240/243 $d 조약체결일자 경우, 출판년이나 Work 506/510/511/518/530/ 245 $g 날짜기입 note 저작 533/534/583, 5XXtag 130 $k 소설, 희곡, 시, 수필, Form of work 저작의 형식 형식부표목 coverage 240/243/245 $k 전기, 그림, 사진 등 506/540tag right accessCondition Medium of 130 $m 피아노, 바이올린, 008/35-37 연주수단 연주수단 language language expression performance 240/243 $m 오케스트라, 성악 등 041tag 130 $r 521tag Key 장조 음악자료의 장조 음악작품 장조 audience targetAudience 240/243 $r 008/22 Coordinates 좌표 255 $c 경위도표시 지도자료 좌표 [표 II-1] 메타데이터 요소 간 매핑 2) 저작의 다양한 표현형에 대한 안내 개체 attribute 속성명 MARC21 요소 MARC21 기술내용 비고 표현의 형식:alpha- Form of expression 표현형의 표제 leader/06 자료유형 numeric, notation, musical sound 등162 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 163
  • 83. 디지털장서 관리 및 연구 개발 4) 각 표현형의 다양한 구현형을 위한 간략개체 - 간기/출판사항 130 $l Language of 저작의 언어 다수의 언어포함이 표현형의 언어 240/243 $l expression 언어필드 가능함 개체 attribute 속성명 MARC21 요소 MARC21 기술내용 비고 008/35-37 한 구현형은 하나이 Identify 동일저작에서 표현된 260 $b 발행처,배포처 상의 발행자나 배포 Identify the Publisher/distributor 발행자/배포자 130 $o 것이 하나 이상일 경 533 $c 복제기관 자에 의해서 배포될 Other distinguishing 편곡 mani- the 기타 식별특성 240/243 $o 우에 식별할 특성: characteristic 판(revision) 수 있음 expres festa- 245 $s edition,version, sion(s) tion(s) designation,revision Date of publication/ 260 $c 발행년,배포년 구현형의 public 표현형 구현형 발행년/배포년 distribution 533 $d 복제일자 release 날짜 254 $a 총보 Type of score 악보의 유형 악보의 표현형식 Music 008/20 음악의 형식 255 $a 지도제작의 5) 각 표현형의 다양한 구현형을 위한 간략개체 - 물리적 기술/표준번호 Scale 축척 축척표시 034 $b,$c,$h 수치데이터 개체 attribute 속성명 MARC21 요소 MARC21 기술내용 비고 3) 각 표현형의 다양한 구현형을 위한 간략개체 - 서명/판사항/권호 Form of carrier, 300 $a 특정자료종별과 수량, Select 매체의 형태, 범위 extent of carrier 533 $e 복제형태사항 the 개체 attribute 속성명 MARC21 요소 MARC21 기술내용 비고 mani- 300 $c 크기 구현형의 public release festa- Dimensions of carrier 매체의 크기 구현형의 종류에 따른 533 $e 복제형태사항 날짜 tion(s) 다양한 표제가 가능, 245 $a,$n,$p 구현형 Title of manifestation 구현형의 표제 본표제, 권차, 권제 Key title, expanded Physical medium, cap- 242 $a,$n,$p title, translated title, ture mode, playing 물리적 매체, 수록 supplied title 등 speed, groove width, 방식, 재생속도, 음 300 $b는 FRBR모델에서 Identify kind of cutting, tape 구의 폭, 편집유형, 식별하는 여러 속성들은 the configuration, kind of 테이프의 형태, 음 author, composer, 300 $b 기타 물리적 특성 포함하고 있다. 이중 물리 mani- Statement of 245 $c sound, special repro- 향의 종류 특수재 책임표시 책임표시 translators, edi- 적 매체와 표현형식 2가지 festa- responsibility 242 $c duction characteristics, 생특성, 색상, 극성, tions 등 속성을 기본으로 한다. tion(s) colour, polarity, pres- 표현형식, 파일특 구현형 entation format, file 성 Edition/issue 판표시 characteristics 판표시/권호표시 250 $a,$b 판사항 designation 판의 저작자표시 340 $f 회전율/축소율 권,연차, 연속간행물의 권, Reduction ratio 축소율 물리적 매체유형 Numbering 권호표시 362 $a 533 $e(?) 복제형태사항 발행년표시 연차, 연월차 사항 ISBN,STRN:BK ISSN,Coden:SE BK:020,027,074 Other standard SE:022,030,074 identifier, publisher Manifestation identifier 구현형 식별기호 Other:024,028, number:other 074 Form of musical composition code:074t164 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 165
  • 84. 디지털장서 관리 및 연구 개발 MARC21 메타데이터 형식기술과 FRBR 모델의 속성을 매핑한 표를 바탕으로 실제 MARC 데 010 ##$a80050691 이터를 FRBR모델의 저작, 표현형, 구현형으로 분리하여 기술해 보면 다음과 같다. 020 ##$a0812277848 020 ##$a0812211103 (pbk.) Record 1 040 ##$aDLC$cDLC$dDLC LDR 00848cam##2200277#a#450# 050 00$aPS3507.R55$bS5 1981 001 691862 082 00$a813/.52 $219 005 20020220145543.0 100 1#$aDreiser, Theodore, $d1871-1945. 008 961125s1997####nyu###########000#1deng## 245 10$aSister Carrie / $cTheodore Dreiser. 010 ##$a96037888 250 ##$aThe Pennsylvania ed. 020 ##$a067960250X 260 ##$a[Philadelphia, Pa.] : $bUniversity of Pennsylvania Press, $c1981. 040 ##$aDLC $cDLC $dYDX $dOCL 300 ##$axi, 679 p. : $bill. ; $c24 cm. 043 ##$an-us-il $an-us-ny 504 ##$aIncludes bibliographical references. 050 10$aPS3507.R55 $bS5 1997 650 #0$aYoung women$xFiction. 082 00$a813/.52$22 650 #0$aMistresses$xFiction. 100 1#$aDreiser, Theodore, $d1871-1945. 651 #0$aNew York (N.Y.)$xFiction. 245 10$aSister Carrie / $cTheodore Dreiser. 651 #0$aChicago (Ill.)$xFiction. 250 ##$aModern Library ed. 655 #7$aDidactic fiction.$2gsafd 260 ##$aNew York : $bModern Library, $c1997. 600 10$aDreiser, Theodore, $d1871-1945. $tSister Carrie. 300 ##$axvii, 659 p. ; $c20cm. 650 #0$aYoung women$zIllinois$zChicago$vFiction. Record 3 650 #0$aYoung women$zNew York (State)$zNew York$vFiction. LDR 00973cam##2200289###450# 651 #0$aNew York (N.Y.)$vFiction. 001 2649689 651 #0$aChicago (Ill.)$vFiction. 005 20010313124850.0 008 690714r1969####nyu###########000#1#eng## Record 2 010 ##$a68054227 LDR 01052cam##2200313#i#450# 040 ##$aDLC $cDLC $dDLC 001 2300110 050 00$aPZ3.D814 $bS39 $aPS3507.R55 005 20010313125533.0 082 00$a813/.5/2 008 801010s1981####paua#####b####000#1#eng##166 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 167
  • 85. 디지털장서 관리 및 연구 개발 100 1#$aDreiser, Theodore, $d1871-1945. 245 00$aSister Carrie (Theodore Dreiser)$h [Sound recording] / $cLecturer, Sheldon 245 10$aSister Carrie. Grebstein. 250 ##$aAn abridged ed. $bby Theodore Dreiser and Arthur Henry. 260 ##$aDeland, Fla.,$bEverett/Edwards, $cp1970. With a new introd. by Jack Salzman. 300 ##$a1 cassette. $b1/2 track. $cmono. 260 ##$aNew York, $bJohnson Reprint Corp., $c1969. 306 ##$a003500 300 ##$ax, 357 p.$c21 cm. 440 #0$a20th century American novel 490 0#$aBelles lettres in English 490 0#$aCassette curriculum 650 #0$aYoung women$xFiction. 500 ##$aDuration : 35 min. 650 #0$aMistresses$xFiction. 533 ##$aPreservation master $bWashington, D.C. 651 #0$aNew York (N.Y.)$xFiction. $cLibrary of Congress Magnetic Recording Laboratory. 651 #0$aChicago (Ill.)$xFiction. $d1978. $e On 1 sound tape reel : analog, 655 #7$aDidactic fiction.$2gsafd 7 1/2 ips, 2 track, mono. ; 10 in. 700 1#$aHenry, Arthur, $d1867-1934. 600 10$aDreiser, Theodore, $d1871-1945. $t Sister Carrie. 740 0#$aSister Carrie (Theodore Dreiser). Record 4 LDR 01260cim##22003491##450# 위의 record 4건을 가지고, 서명-저자 기본 기입 알고리즘과 FRBR 개체 속성을 바탕으로 001 12045511 FRBR 변환을 시켜보면 다음과 같다. 005 20001006095103.0 007 ssu-msnna----- <저작> 007 st|oundmbunnue record 1 의 100tag와 245tag의 work(저작)을 추출한다. 008 780315s19uu####flu##n#########l####eng## 035 ##$a(OCoLC)ocm03719351 100 1#$aDreiser, Theodore, $d1871-1945. (created by) 010 ##$a99568173 245 10$aSister Carrie. (title of work) 028 02$a105 $bEverett/Edwards 040 ##$aDLC $cIU $dDLC <표현형> 042 ##$alcderive record 1,2,3 의 LDR/06 = a (form of expression) 과 008/35-37 eng (language of 050 00$aRYC 1776 expression) 을 기준으로 expression 으로 분리한다. 050 00$aLWO 12316 r11 A3;B1 (preservation master) 100 1#$aGrebstein, Sheldon Norman.168 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 169
  • 86. 디지털장서 관리 및 연구 개발 <구현형> - record 4에서 새로운 저작 record 1,2,3 의 각각의 구현형 속성 요소에 따라 구현형으로 레코드 분리된다. <저작> - record 1에서 구현형 1 008/18-19 ## (Verification of match) 020 ##$a067960250X (manifestation identifier) 100 #$aGrebstein, Sheldon Norman. (created by) 245 10$aSister Carrie / $cTheodore Dreiser. (Title/statement of responsibility of 245 00$aSister Carrie (Theodore Dreiser) (title of work) manifestation) 250 ##$aModern Library ed. (edition/issue designation) <표현형> 260 ##$aNew York : $bModern Library, $c1997. (publisher/date of publication) - record 4에서 표현형 300 ##$axvii, 659 p. ; $c20cm. (form, extent, dimensions, etc) LDR/06 i (non-musical sound recording) (form of expression) 008/35-37 eng (language of expression) - record 2에서 구현형 2 020 ##$a0812277848 (manifestation identifier) <구현형> 020 ##$a0812211103 (pbk.) (manifestation identifier) - record 4의 구현형 1 245 10$aSister Carrie / $cTheodore Dreiser. (Title/statement of responsibility of 028 02$a105 $bEverett/Edwards (manifestation identifier) manifestation) 245 00$aSister Carrie (Theodore Dreiser)$h [Sound recording] / 250 ##$aThe Pennsylvania ed. (edition/issue designation) $cLecturer, Sheldon Grebstein. (Title/statement of responsibility of 260 ##$a[Philadelphia, Pa.] : $bUniversity of Pennsylvania Press, $c1981. (publish- manifestation) er/date of publication) 260 ##$aDeland, Fla.,$bEverett/Edwards, $cp1970. (publisher/date of publication) 300 ##$axi, 679 p. : $bill. ; $c24 cm. (form, extent, dimensions, etc) 300 ##$a1 cassette. $b1/2 track. $cmono. (form of carrier, dimentions, etc.) 533 ##$aPreservation master $bWashington, D.C. - record 3에서 구현형 3 $cLibrary of Congress Magnetic Recording Laboratory. 245 10$aSister Carrie. (Title of manifestation) $d1978. $e On 1 sound tape reel : analog, 250 ##$aAn abridged ed. $bby Theodore Dreiser and Arthur Henry. 7 1/2 ips, 2 track, mono. ; 10 in. (date of manifestation/ Reproduction information) With a new introd. by Jack Salzman. (edition/issue designation) 260 ##$aNew York, $bJohnson Reprint Corp., $c1969. (publisher/date of publica- tion) 위의 변환 사례에서 보는 바와 같이, 레코드에서 저자-서명 기본기입으로 동일한 표목을 사용 300 ##$ax, 357 p.$c21 m. (form, extent, dimensions, etc) 하는 경우를 동일 저작의 개념으로 파악하고, 언어, 자료형식 등을 기준키로 하여 표현형을 분리 해 준다. 저작과 표현형, 구현형이 각 계충형 구조를 가지며, 저작개념과 저작 내에서 표현형을170 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 171
  • 87. 디지털장서 관리 및 연구 개발 분리하고, 각 표현형의 구현형으로 단일 레코드들을 연결시켜서, 최종의 레코드는 구현형 단위에 서 매칭이 일어난다. 2.2 KORMARC to FRBR 변환 알고리즘 개발 가. OCLC변환 알고리즘의 적용 제한점 - 국립중앙도서관은 전거레코드 작성이 없이 서지레코드를 근거로 추출해야 한다. 서지레코 드에서는 전거표목에서와 같이 상세한 태그기술이나 전거통제 표목값이 명확하지 않으므로 추출한 태그에서 명확한 저자표목을 설정하기 어렵다. - 기본기입의 변경으로 2002년 이후, 기본표목100tag를 사용하지 않고, 저자기입을 700tag 로 사용하였으므로 서명/저자 표목으로 사용할 경우, 245tag의 표제지서명과 700tag의 부 출 저자명으로 추출함으로 정확성이나 일치판별이 어려운 실정이다. [그림 II-1] KORMARC 변환 알고리즘 나. KORMARC 메타데이터 요소의 변환 국립중앙도서관 KORMARC 레코드에서는 052tag에 자관 청구기호를 기술하고, 049tag에 각 도서의 등록번호를 기술하고 있다. 따라서 이를 추출하여 각 구현형의 개별자료로서의 속성으 국립중앙도서관의 서지데이터 기술방식은 KORMARC 기술규칙을 따르고 있으므로 FRBR 변 로 정의한다. 환 알고리즘 또한 국립중앙도서관 KORMARC 서지데이터를 대상으로 변환요소를 분석하고 개 좀 더 구체적인 요소의 매핑과 변환알고리즘 개발은 다음 chapter에서 살펴보기로 한다. 발한다. OCLC의 표목설정은 전거레코드의 기술형식과 데이터요소의 추출에서 시작되었지만, 국립중 다. FRBR 모델에 따른 KORMARC의 매핑 앙도서관 데이터의 경우는 서지레코드로 그 범위를 한정하고 1XX 또는 7XX에 작성된 저자기술 work 표목채택으로 동일 저작 추출 사항과 245tag $a의 서명기술사항을 기준으로 추출하여 정규화작업을 거친 메타데이터를 저작 언어,자료유형의 추출로 표현형 분리 Expression 의 개념으로 설정하도록 한다. 발행년, 출판사, 판 사항, 페이지 추출로 구현형분리 Manifestation FRBR모델의 표현형과 구현형의 추출은 동일 표목 내에서 언어, 발행사항, 판사항, 형태사항 청구기호와 등록번호로 개별 자료 표기 Item 등의 주 입력요소들을 선별, 비교하여 그 특성에 따라 표현형과 구현형을 추출하도록 한다. 이때, FRBR모델의 각 개체의 속성 내용을 파악하여 이를 근거로 하여 동일 저작에 대한 표현형을 그룹 100tag $abcdq로 개인 저자추출 Person 핑하고, 여기에 하위계층구조로서 구현형의 속성요소와 KORMARC의 요소를 매핑하여 구현형 110/111tag $abcdq로 단체/회의명 추출 Corporate body 을 기술하도록 한다. [그림 II-2] FRBR 모델개체(entity)에 따른 KORMARC의 매핑172 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 173
  • 88. 디지털장서 관리 및 연구 개발 개체 attributes(속성) 매핑MARC MARC유형 개체 attributes(속성) 매핑MARC MARC유형 title of the work 저작의 표제 240t $a, 245t $a scale 축척 507t 축척주기(MP) 지도/평면영사자료 965t$a(예:희곡,시,소설,,) projection 평면도법 008/22-23(MP) 지도/평면영사자료 form of work 저작의 형식 008/33(BK),008/30-31(MU) presentation technique 표현기법 지도/평면영사자료 date of the work 저작 관련일자 008/07-10 or 260t $c representation of relief 고저표현 지도/평면영사자료 Expression other distinguishing characteristic 기타 식별특성 245t $b,c geodetic,grid, 측지선, 그리드, 표현형 지도/평면영사자료 intended termination 종간 예정일 008/11-14 andverticalmeasurement 수직 측정 Work intended audience 대상 이용자 521t $a, 008/22 recording technique 화상기록기법 원격탐사도 저작 context for the work 저작의 배경 965t $b special characteristic 특성 원격탐사도 medium of performance 연주수단 511t 연주자 제작진주기 음악자료 technique 기법 영상자료 numeric designation 번호지정 음악자료 title of the manifestation 구현형의 표제 245t $a key 조 음악자료 statement of responsibility 책임표시 100/700, 110/710t $a$d coordinates 좌표 지도자료 edition/issue designation 판표시/권호표시 250t $a equinox 분점 지도자료 place of publication/distribution 발행지/배포지 260t $a title of the expression 표현형의 표제 245t $a publisher/distributor 발행자/배포자 260t $b form of expression 표현형의 형식 leader/06 date of publication/distribution 발행년/배포년 260t $c date of expression 표현형의 일자 008/07-10 or 260t $c fabricator/manufacturer 제작자 508t $a language of expression 표현형의 언어 008/35-37 41t$a series statement 총서표기 440t $a;$v other distinguishing characteristic 기타 식별특성 250t $a form of carrier 매체의 형태 leader/06+007/00-01 extensibility of expression 표현형의 확장성 extent of the carrier 매체의 범위 300t $a revisability of expression 표현형의 개정가능성 physical medium 물리적 매체 340t $a Manife extent of the expression 표현형의 범위 capture mode 수록방식 station summarization of content 내용 요약 520t $a, 505t dimentions of the carrier 매체의 크기 구현형 Expression context for the expression 표현형의 배경 965t $b manifestation identifier 구현형 식별기호 020t $a, 001t 표현형 critical response to the expression 표현형에 대한 비평 nonmarc source for acquisition 입수/접근인증을 541t $a use restrictions on the expression 표현형에 대한 이용제한 506t $a /access authorization 위한 정보원 sequencing pattern 연속성의 패턴 362t $a 연속간행물 terms of availability 구득요건 예상되는 권호의 accessrestriction 구현형에 관한 506t$a expected regularity of issue 008/19 r 연속간행물 정규성 on the manifestation 접근제한 540t$a 예상되는 권호의 type face 서체 인쇄자료 expected frequency of issue 310t $a, 008/18 연속간행물 간행빈도 type size 활자의 크기 인쇄자료 type of score 악보의 유형 008/20 음악자료 foliation 장수 매기기 인쇄자료 511t연주자제작진주기 collation 낙장조사 인쇄자료 medium of performance 연주수단 음악/녹음자료 008/18-19연주형식 publication 발행상태 연속간행물174 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 175
  • 89. 디지털장서 관리 및 연구 개발 개체 attributes(속성) 매핑MARC MARC유형 개체 attributes(속성) 매핑MARC MARC유형 numbering 권호표시 연속간행물 number associated 단체와 관련된 playing speed 재생속도 음악/녹음자료 with the corporate body 수치 groove width 음구의 폭 음악/녹음자료 place associated 단체와 관련된 Cor- kind of cutting 편집유형 음악/녹음자료 porate with the corporate body 지명 tape configuration 테이프의 형태 음악/녹음자료 Body date associated 단체와 관련된 단체 kind of sound 음향의 종류 음악/녹음자료 with the corporate body 날짜 special reproduction characteristic 특수재생특성 음악/녹음자료 other designation associated 단체와 관련된 Manife with the corporate body 기타 호칭 colour 색상 영상자료 station Concept 구현형 reduction ratio 축소율 마이크로폼 개념 term for the concept 개념에 대한 용어 Object polarity 극성 마이크로폼/영상자료 대상 term for the object 대상에 대한 용어 Event generation 세대 마이크로폼/영상자료 사건 term for the event 사건명 Place presentation format 표현형식 영상자료 장소 term for the place 지명 system requirements 시스템 조건 538t $a 전자자료 [표 II-2] FRBR 모델의 속성(Attribute)과 KORMARC의 매핑 file characteristics 파일 특성 전자자료 mode of access 접근 방식 전자자료 access address 접근 주소 856t $u 전자자료 item identifier 개별자료의 식별기호 049t $l fingerprint 서문(書紋) provenance of the item 개별자료의 내력 marks/inscriptions 표지(標 )/제자(題字) Item exhibition history 전시기록(展示記 ) 585t $a 개별자료 condition of the item 개별자료의 상태 treatment history 처리내력 scheduled treatment 처리계획 개별자료에 대한 access restrictions on the item 접근제한 name of person 개인명 100/700t $a,$d dates of person 개인의 생몰년 Person title of person 개인의 직위 100/700t $c 개인 other designation 개인과 관련된 100/700t $a,$d associated with the person 기타 직위 name of the corporate body 단체명 110/710t $a$b176 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제2장 표준메타데이터 모델 및 적용 177
  • 90. 디지털장서 관리 및 연구 개발 제3장 시맨틱온톨로지언어 1. 온톨로지 언어 장단점 비교 1.1 RDF와 토픽맵의 관계 정리 RDF와 토픽맵은, 다른 표준화단체가 담당하고 있다. RDF는 W3C, 토픽맵은 ISO이다. RDF와 토픽맵은, 기술적으로 유사하지만, 다르다. 목적(goal)과 비전도 유사하지만, 강점이 서 로 다르나 상호 보완적이다. 현재 RDF와 토픽맵 간의 데이터 호환성이 국제표준으로 제시하기 위한 기술안내서가 곧 완성될 것으로 보인다. 실제적인 면에서는, 각 기술이 적절하게 사용될 애 웹상에 공유된 수많은 정보검색 대상에서 자신이 원하는 정보만을 정확하게 검색하는 것은 불 플리케이션 분야가 다른 것으로 생각된다. 여기에서는, 주로 토픽맵의 입장에서, RDF와 토픽맵 가능하다. 기존의 WWW에서의 정보검색은 사람이 이해하고 판단을 하는 사람을 위한 것으로 기 의 비교를 시도한다. 계와 인간의 의미를 나타내는 정보표현 능력에 초점을 맞춰왔다. 그러나 지식표현의 능력은 부족 하여 정확한 정보의 검색이나 내포된 지식의 자동추론이 되도록 인간과 기계, 기계와 기계사이의 가. 역사 의미를 공유할 수 있도록 지능형 에이전트가 방안으로 시도되고 있다. 특히 온톨로지와 같이 개 우선, RDF와 토픽맵의 역사를 개관한다. 념이나 어휘들의 의미적, 계층적인 구조 형성과 의미 관계 설정에 대한 연구가 이루어지고 있다. 1) 토픽맵의 역사 시맨틱웹은 웹상에서 정보에 의미를 부여하고, 정보를 조직화하여 기계가 의미를 파악하고 이 최초의 활동은, 1990년대의 초기까지 거슬러 올라간다고 말할 수 있다. 창조자의 한 사람인 해하여 처리할 수 있도록 한다. 시맨틱웹 구현은 자동으로 의미를 구성할 수 있도록 정보에 대한 Steven R. Newcomb 에 의하면, OReilly와 DEC 복수의 매뉴얼의 통합색인작성 프로젝트가 일 구조적인 접근이 가능해야 한다. 온톨로지는 시맨틱 웹에서 가장 중심에 있는 개념으로서 응용 의 시작이라고 말하는 것이다. 그 후의 경과를 아래에 나타낸다. 프로그램 사이에 통신을 할 때 단어에 대한 의미를 이끌어내는데 중요하다. ● 1996년에 ISO의 work item으로서 승인되었다 온톨로지 언어는 컴퓨터가 세상의 사물에 대한 개념과 개념간의 상호관계를 이해하고 새로운 - 최초의 에디터: Steve Newcomb, Michel Biezunski, Martin Bryan 사실을 추론하며 예측할 수 있도록, 보다 정확하게 묘사하고, 보다 빨리 결론을 찾아내는 성능이 ● 2000년에, 국제규격(International Standard) 으로서 공개 (ISO/IEC 13250:2000) 중요시 된다. 그러므로 온톨로지를 실제로 구축하는 과정에서는 응용 프로그램에서 요구되는 표 - SGML베이스의 구문, HyTime베이스의 모델 현력(expressiveness)과 결정가능성(decidability) 및 계산 속도 등을 고려하여 이에 적합한 지 ● 2001년에, TopicMaps.Org 가 Web 용의 규격(XTM: XML Topic Maps 1.0) 을 공개 식표현 모델과 추론 메커니즘을 제공하는 온톨로지 언어를 선택해야 한다. ● 2001년10월에, XTM 이 ISO규격으로 채용 ● 2003년에 제2판을 공개 W3C(World Wide Web Consortium)의 권고(Recommendation)인 RDF (Resource - ISO 13250: 2003 (XTM: XML Topic Maps 을 포함) Description Framework)와 OWL(Web Ontology Language), 그리고 ISO/IEC 13250 국제표 ● 현재, ISO 13250 의 개정판을 책정 중 준으로 채택된 토픽맵의 표준 스펙인 XTM(XML Topic Maps)을 비교·분석한다. - 멀티파트 표준 (데이터모델, XML구문, 정규화 등을 포함)178 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제3장 시맨틱 온톨로지 언어 179
  • 91. 디지털장서 관리 및 연구 개발 ● ISO 18048 TMQL(토픽맵 질의언어), ISO 19756 TMCL(토픽맵 제약언어) 도 책정 중 나. 규격 군 토픽맵이나, RDF나 복수의 규격이 있다. 규격 군은, 구문, 데이터모델, 질의언어, 제약언어로 2) RDF의 역사 나눌 수 있다. RDF에 관계하는 활동으로서는, Ramanathan V. Guha가 1995-1996년에 Apple에 있어서 메타데이터와 데이터를 위한 공통 표현인 MCF (Meta Content Framework)를 작성한 것이 시 1) 구문 작이라고 생각한다. 그리고, 1996년에 모델과 텍스트 베이스 구문을 IETF 에 제출했다. 토픽맵, RDF 둘 다 복수의 구문이 존재하고, 어느 쪽도, XML 형식의 구문이 있다. 그 후, World Wide Web 컨소시엄에서 활동이 개시된, 그 후의 경과를 아래에 나타낸다. 토픽맵은 HyTM(HyTime Topic Maps)으로 시작했고, XTM (XML Topic Maps)이 2000년 ● 1997年6月 Guha 와 Bray 가 MCF의 XML 구문을 작성 출간되었고 이 구문구조가 너무 복잡하여 온토피아 회사에서 간결 구문구조 LTM (Linear Topic (W3C에서는, 메타데이터 표준으로서 PICS-NG 의 작성 작업이 시작되었지만, XML- Maps)을 선보여 널리 활용되고 있으며, 현재는 간결 구문구조의 표준화의 시급성이 대두되어 MCF가 통합되어, RDF가 되었다.) CTM(Compact Topic Maps)이 곧 국제표준으로 채택될 전망이다. RDF에는 RDF/XML, n3 등 ● 1997년8월 최초의 working draft 공개 의 구문이 있다. ● 1999년2월 recommendation 이 된다 ● 2004년 코어 명세의 제2판이 공개 2) 데이터 모델 데이터 모델로서는, 토픽맵의 데이터 모델의 근간은 TMDM이고, RDF 모델의 근간은 모든 토픽맵과 RDF의 연대기를 [그림 III-1]에 나타낸다. statement를 triple(주어, 술어, 목적어)로 표현하는 것이다. 양 모델에서 네임스페이스와 URI는 중요한 하부구조를 제공한다. 3) 제약 언어 제약언어의 규격으로서, 토픽맵 측에서는 온토피아의 OSL(Ontopia Schema Language), TOMA 스키마 언어 등이 시도되었고, JTC1 SC34에서 TMCL(Topic Maps Constraint Language) 표준이 거의 완성단계에 있다. RDF측에서는 RDFS(RDF Schema)와 OWL(Web Ontology Language)이 권고안(recommendation)으로 나온 상태이다. 앞으로 상당한 기간 동 안 이러한 제약언어의 과도한 사용은 자제해야 할 것으로 판단된다. 추론의 요소를 강하게 사용 할 경우에 시스템에 많은 과부하를 가져 오게 되고 추론에 대한 필요가 특히 국립중앙도서관 시 스템에는 그리 많지 않을 것으로 판단된다. 4) 질의 언어 질의 언어의 규격으로서, 토픽맵 측에서는 온토피아의 tolog, TOMA, AsthMa+, [그림 III-1] 토픽맵과 RDF의 연대기 NetworkPlanet 등에서 다양한 토픽맵 질의어를 실험하였고, 현재는 ISO JTC1 산하 SC34에서180 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제3장 시맨틱 온톨로지 언어 181
  • 92. 디지털장서 관리 및 연구 개발 TMQL(Topic Maps Query Language) 국제표준 토픽맵 질의어가 거의 완성단계에 있다. RDF ② RDF 쪽은 추론을 중시하고 있다 측에서는 SPARQL을 주로 사용하고 있다. ③ 토픽맵 쪽은 구체화(reification), 한정, 유래, 문맥과 n-ary의 지원이 강하다. [그림 III-2]에 토픽맵 규격 군과 RDF 규격 군을 나타낸다. ④ 토픽맵은 2종류의 URI 참조를 갖추고 있다. 웹으로 접근이 가능한 자원과 그렇지 못한 자원에 대한 구분을 제공하고 있다. 라. 토픽맵과 RDF의 목적(goal) 및 이용법의 비교 1) 목적의 비교 토픽맵과 RDF의 목적을 열거하면 아래와 같다. ① 토픽맵의 목적 a. 정보를 찾기 쉽고 모호성이 제거되도록 구성한다. b. 색인의 통합 가능하게 한다. c. 정보의 결부를 가능하게 한다. d. 지식의 연결 ② RDF 의 목적 [그림 III-2] 토픽맵 규격 군과 RDF 규격 군 a. Web上에서의 메타데이터의 표현 (RDF MS, Lassila & Swick) b. 메타데이터와 데이터의 일체화 (MCF, Guha) 다. 토픽맵과 RDF의 유사점과 다른 점 c. 데이터 통합의 지원 (Miller) 토픽맵과 RDF의 유사점과 다른 점을 열거하면 아래와 같다. d. Semantic Web 데이터의 기반을 제공 1) 유사점 2) 이용법의 비교 ① 그래프 기반의 데이터모델 토픽맵과 RDF의 이용법의 예를 열거하면 아래와 같이 된다. ② 잘 정의된 동일성 테스트와 정보의 통합이 가능하다. ① 토픽맵의 이용법 ③ 사람이 읽기 쉬운 구문과 XML베이스의 교환구문을 갖는다 a. 포털의 기반 ④ 복수의 규격 군으로 구성되어 있다 b. 분류/색인 부여 ⑤ 표준화된 제약 언어와 질의 언어를 갖추고 있다 c. 어플리케이션 통합 d. 비즈니스 프로세스 모델링 2) 다른 점 e. 제품구성관리 ① 토픽맵 쪽이 데이터 모델링 부분에서 더 풍부한 표현 기능을 갖는다. f. 자산관리 (IT자산관리)182 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제3장 시맨틱 온톨로지 언어 183
  • 93. 디지털장서 관리 및 연구 개발 g. e-learning 있다. 이진 관계 뿐 아니라 n-ary 관계를 표현 하는 데 토픽맵의 장점이 있다. 반면 RDF는 모든 h. 메타데이터, 택사노미 관리 것을 이진관계로만 표현해야 한다. I. 기타 4) 단언에 대한 단언 (구체화: Reification) ② RDF의 이용법 구체화는 많은 경우에 사용된다. RDF는 구체화를 표현이 가능하기는 하지만 자연스럽지 못한 a. 포털의 기반 편이다. 토픽맵은 구체화의 표현에 대한 강력한 지원이 있어서 아무런 불편이 없다. b. 어플리케이션 통합 c. 문서의 메타데이터 5) 유효범위(scope)를 사용한 문맥의 지원 d. 웹 에이전트 어플리케이션 토픽맵은 지식의 표현에 관한 것이다. 지식은 절대적인 것이 아니라, 문맥의 위에 성립하고 있 다. 토픽맵에서는, 문맥은 유효범위(scope)의 개념을 통하여 토픽이나 어커런스의 경계를 표현할 마. 토픽맵과 RDF의 모델의 비교 수 있고, 유효범위(scope)는 토픽의 집합으로 정의된다. 토픽맵과 RDF의 모델에 대해, 좀 더 상세하게 비교해 본다. 바. 식별성 (Identity) 1) 자원과 기호 토픽맵 및 RDF의 노드는 글로벌한 식별성(identity)을 갖는다. 다른 그래프에 있어서의 노드 RDF와 토픽맵의 핵심은 함께, 실세계의 자원을 컴퓨터 내에서 표현하는 기호라고 하는 것이 가 동일한지 아닌지의 규칙이 존재하고, 다른 그래프와 병합시킬 때의 규칙이 존재한다. 다. 그리고, RDF나 토픽맵이나 이들의 자원에 대한 서술문(statement)으로 구성되어 있다. RDF는 식별에 관한 2개의 규칙이 있다. ● 블랭크(공백) 노드에 대한 규칙: 그래프를 걸쳐 비교할 수 없다 2) 사용되고 있는 용어 ● URI 참조에 대한 규칙: URI 가 같으면 동일한 자원으로 간주한다. 토픽맵은 실제 자원이나 개념을 토픽을 가지고, 모든 토픽은(거의) 균일하게, 현상세계의 주제 를 표현한다. 주제에 대해서는, 아래와 같이 명확하게 정의하고 있다. “주제” b 란,존재하고 있는 토픽맵에 있어서도 2종류의 방법이 있다. 기본적인 규칙은 동일 주제를 갖는 토픽은 하나로 지 아닌지,또는 다른 특정한 특질을 가지고 있는 지 어떤지 상관하지 않고,그것에 대해 어떤 통합될 수 있다는 것이다. 수단으로 단언해도 좋은 모든 것으로 한다.c ● 웹 접근이 가능한 자원의 식별성: 정보자원을 표현하는 토픽의 식별은 쉽다. 토픽의 주제로 케이터(Subject locator)로서 URI를 부여한다. 그 자원의 URI가 그 정보자원의 식별을 표 3) 단언 (Assertions) 현하는 식별자의 값이 된다. RDF는 주어(subject), 술어(predicate) 목적어(object)를 트리플로 한 1종류의 단언을 표현 , ● 웹 접근이 가능치 않은 자원의 식별성: 웹 상에서 접근이 가능치 않은 주제를 표현하고자 할 한다. 주어와 술어는 URI로 표현되어야 하고 목적어가 URI로 표현이 가능한 것은 다른 서술에서 때 주제지시자(subject indicator)를 사용하여 개념을 기술하는 간단한 웹 페이지를 작성하 는 주어로 사용되어 다른 triple 서술의 대상이 될 수 있다. 이것에 대해서, 토픽맵은 RDF와 유사 고 이것에 식별자를 부과하여 사람은 주제지시자를 사용하고, 컴퓨터는 주제지시자를 비교 하게 토픽(topic), 연계(association), 어커런스(occurrence)로 표현한다. 토픽, 연계, 어커런스는 하는 방식으로 간접적으로 참조하는 방법을 취한다. 타입화될 수 있고 토픽과 어커런스는 범위(scope)로 그 표현의 타당성의 범위를 한정시킬 수도184 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제3장 시맨틱 온톨로지 언어 185
  • 94. 사. 제약 언어 RDFS 및 OWL에 대응하는 제약언어에 대한 토픽맵 규격은 TMCL(Topic Maps Constraint Language)이다. TMCL은 현재 이번 2007년 12월 교토총회에서 CD로 확정되어 국제표준이 될 확고한 기반을 마련하게 되었다. 현재 검토되고 있는 TMCL은 타입 제약을 정의하는 스키마(TMCL-Schema)와, 질의언어 형 식으로 기술된 제약과의 적합을 검사하는 규칙(TMCL-Rule)로 구성되어 있다. 주된 이용 목적 은 아래와 같다. ● 토픽맵의 정당성 확인 ● 토픽맵의 필터링 ● 토픽맵의 구조 파악 아. 질의 언어 RDF측은 W3C Data Access WG에서 질의 언어 SPARQL를 작성 중이다. SPARQL은 현재 Working Draft의 상태이다. SPARQL은 단순한 그래프 매칭 언어이다. 토픽맵에서도 TMQL 을 작성 중이다. TMQL은 현재 CD투표가 가결되어 국제표준이 되기 위한 중요한 고비를 넘긴 상태이고 그 CD를 개정하고 있는 중이다. TMQL에서는 XML Query 와 유사한 path 표현, SQL과 유사한 SELECT 표현, 그리고, Prolog과 유사한 FLWR 표현을 사용하여 질의를 수행할 수 있다.186 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발
  • 95. 디지털장서 관리 및 연구 개발 제4장 국립중앙도서관FRBR모델 기반온톨로지설계 토픽맵 기반의 개념으로 매핑하여 온톨로지 설계를 시작한다. KORMARC의 메타데이터 요소와 FRBR모델의 개체들을 바탕으로 지식층의 주제어간의 연관관계를 표현할 항목을 토픽타입으로 정의한다. 토픽타입간의 연관관계를 연관관계타입으로 설정한다. 각 토픽타입의 정보층으로 주 제에 대한 정보원들을 어커런스 타입으로 정의한다. 먼저 토픽 타입의 개념은 FRBR모델의 제1집단, 2집단, 3집단의 개체와 KORMARC의 메타데 이터 요소 중에서 정보의 의미 있는 묶음이 될 수 있고, 정보간의 상호운용성이 일어나는 요소를 추출하여 토픽타입의 개념으로 추출한다. 아래의 [그림 IV-1]과 같이 FRBR모델의 저작, 표현형, 구현형, 개별자료의 1집단과 인물, 단체의 2집단, 그리고, 대상, 사건, 장소의 3집단 개체들과 KORMARC요소 가운데 토픽간의 연관관계를 형성하는 요소로서 발행처, 발행일, 자료유형, 분 1. 국립중앙도서관 KORMARC의 FRBR모델 기반 온톨로지 설계 류체계, 국가, 언어, 이용대상, 매체유형, 주제, 장르, 배경으로 구성하였다. 이 토픽타입의 요소 들 가운데, 이용대상과 주제는 KORMARC 데이터 상에 입력되지 않은 사항이 많아서, 이용자 참 국립중앙도서관의 KORMARC 메타데이터에서 프로토타입의 대상이 되는 범위는 분류번호 여형 서비스 구현의 사례로 이용자 태깅에 의하여 데이터 값을 입력받으면서 지속적으로 구축한 8XX 번호대의 1만건을 대상으로 한다. 프로토타입의 구현방법은 온톨로지의 구현방법 중 토픽 다. 실제 국립중앙도서관의 650tag에 기술된 내용은 최신 레코드 위주로 구성되어 있으며, 그 내 맵을 기반으로 FRBR모델을 적용한 온톨로지를 설계하고자 한다. 용이“한국소설” “환상소설”등의 장르를 의미한다. 따라서 토픽타입 개념에서도 KORMARC의 토픽맵을 선택한 이유는 RDF/OWL에 비해 구현이 용이하고, 서비스의 효과측면에서 비용대 650tag에서 추출된 값을 장르에 매핑하고, 주제는 작품주제로 이용자 태깅으로 입력을 받는다. 비 효과가 우수할 수 있다는 특성과 FRBR개념 모델을 적용하여 모델링하기에 기타 언어에 비해 토픽맵 언어 편집기인 ontopoly를 사용하여 정의한 토픽타입은 다음과 같다. 단순하며, 서비스 상호운용성 증대 효과도 기대할 수 있기 때문이다. 토픽맵 서비스는 이용자에 게 유익을 줄 수 있는 의미 있는 묶음(토픽)으로 정보를 표현하고자 할 때 유용한 언어이며, 시맨 Topic Types Expand all nodes 틱 데이터 모델링을 구축할 수 있는 방법이며, 스키마 변환의 유연성을 갖추고 있다. 따라서, 기 □ 개별자료 구축된 자료의 활용으로 구축보다는 서비스 효과 측면의 차별성과 효율성을 다양하게 살리는 프 □ 구현형국가단체 □ 대상 로토타입 구현을 위하여 토픽맵을 기반으로 온톨로지 설계를 구성하고자 한다. □ 매체유형 KORMARC 온톨로지 설계는 앞서 연구한 KORMARC의 FRBR 변환을 기초로 하여 토픽맵 □ 발행일 □ 발행처 온톨로지 설계 방법을 적용하면서 토픽맵 편집기인 ontopoly를 이용하여 설계한 후, XTM화일 □ 배경 □ 분류체계 로 다운로드 받아서 프로토타입을 구축한다. □ 사건 □ 언어 □ 이용대상 □ 인물 1.1 KORMARC의 FRBR모델 기반 온톨로지 개념 추출 및 정제 □ 자료유형 □ 장르 □ 장소 앞서 살펴본 바와 같이 KORMARC의 메타데이터 요소와 FRBR모델의 개체, 속성요소와의 매 □ 저작 □ 주제 핑에 의하여 변환 알고리즘을 만들어 보았고, 여기에 주요 온톨로지 개념을 추출해 보았다. 이를 □ 표현형 [그림 IV-1] 토픽타입의 구성188 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 189
  • 96. 디지털장서 관리 및 연구 개발 각 토픽타입을 FRBR모델 및 KORMARC 요소로 개념 정의하면 다음과 같다. KORMARC 요소 토픽맵의 어커런스 타입 서명/저자 사항 (1XX/24X/4XX/7XX) 개인직위, 저자의 다른이름, 대등서명, 부서명, 원서명, 총서사항, 통일서명 토픽타입 개념 FRBR 모델 및 KORMARC 요소 발행사항 (26X) 간기, 권차사항, 발행지, 정규성, 종간예정일, 판사항 저작/표현형/구현형/개별자료 KORMARC의 기본서명을 name으로 한다. FRBR모델의 제1집단 요소 형태기술사항 (3XX) 기술매체, 매체크기, 물리적매체, 책크기, 페이지 FRBR모델의 제2집단 요소 주기사항 (5XX), 주제(653) 일반주기, 내용주기, 이용제한, 입수처정보, 키워드 인물 / 단체 저작의 책임표시사항 KORMARC의 저자명,단체명 비도서유형의 기술사항 시스템주기, 악보유형, 연주자주기, 연주형식, 전시주기, 제작진주기, 축척, 투영법 대상 / 사건 / 장소 FRBR 모델 제3집단 요소 제어필드사항 (0XX) DDC, KDC, ISBN, 가격,국립중앙도서관청구기호, 등록번호, 식별기호, 원본언어 국가 / 장르 한국 현대소설, 화상소설 등 KORMARC의 650tag 내용 서비스사항 URL, 도서상태, 리뷰, 서평, 초록, 표지이미지 자료유형 문자인쇄자료, 음악, 녹음자료 등 KORMARC의 리더부(06), 표현형의 구분값 [표 IV-2] KORMARC 메타데이터 요소에서 추출한 어커런스 타입 KORMARC의 부호화정보필드의 언어표기부 언어 한국어, 영어, 일본어 등 (008tag 35-37), 표현형의 구분값 KORMARC의 매체유형 표시 (245tag $h), KORMARC에서 추출된 어커런스 타입들을 각 토픽타입의 정보로 매핑하면 다음 표와 같다. 매체유형 점자자료, DVD, 카세트테이프 등 구현형의 구분값 분류체계 한국소설, 수필, 시 등 KORMARC의 KDC 분류번호 중 3자리 분류내용 토픽타입 어커런스 배경 저작의 시대적, 사회적, 역사적, 예술적 배경 FRBR 모델의 개체 속성정보 저작 통일서명, 종간예정일 표현형 원서명, 원본언어, 악보유형 KORMARC의 발행사항(260tag $b), 발행처 출판사항 구현형의 여러표현 대등서명, 부서명, 판사항, 발행지, 내용주기, 제작진주기, 연주자주기, 총서사항, 페이지, 물리적 발행일 발행연도 표기 KORMARC의 발생사항(260tag $c) 매체, ISBN, 식별기호, 입수처정보, 이용제한, 시스템주기, URL정보, DDC, KDC, 권차사항, 기 구현형 술매체, 초록, 목차, 리뷰, 서평, 표지이미지, 전시주기, 매체크기, 정규성, 간기, 축척, 투영법, 키 KORMARC의 이용대상(521tag) 및 이용대상 어린이용, 청소년용, 장애인용 등 사용자 tagging 정보 워드, 책크기 등 주제 작품의 주제, 이슈 사용자 작성의 주제 tagging 정보 개별자료 국립중앙도서관청구기호, 등록번호, 도서상태 발행처 발행지 [표 IV-1] 토픽타입의 정의 분류체계(KDC) KDC, DDC, 국립중앙도서관청구기호 인물 생몰년 다음으로, 어커런스 타입의 개념은 토픽맵의 정보층을 구성하며, 토픽에 대한 상세한 정보를 작품주제 이용자 tagging 의미한다. KORMARC 메타데이터 요소 중에서 토픽타입으로 정제된 나머지 요소를 모두 어커런 스 타입으로 정의한다. FRBR 모델의 각 개체별 속성 값들을 기준으로 어커런스 타입을 분류하 [표 IV-3] 토픽 타입별 어커런스 정의 여, 해당 토픽타입에 연결시켜 정보층을 생성한다. 구현형이 MARC 레코드와의 매핑이므로, 대 부분의 KORMARC 메타데이터 요소와 현재 도서관에서 서비스하고 있는 MARC외의 정보 즉, 저작, 표현형, 구현형, 개별자료의 각 FRBR 모델 개체에 따른 속성 값으로 앞서 살펴본 바와 표지이미지, 서평, 목차 등의 메타데이터 요소들을 어커런스 타입으로 정의하고 구현형에 매핑한 같이 저작에는 작성자, 저작의 표제, 저작관련일자, 저작의 형식, 연주수단, 장조, 좌표 등이 있 다. KORMARC의 토픽맵 변환에 따라 국립중앙도서관의 서지레코드에 작성된 항목들은 정보층 고, 표현형에는 표현형의 표제, 언어, 기타 식별특성, 악보유형, 축척 등의 속성 값을 가지고 있 의 구성요소로서 개념을 나열하여 구성한다. 지만, FRBR모델 변환에서는 저작과 표현형에는 KORMARC의 실제 레코드가 아닌, 추상적 개 념모델로서 서명과 저자에 대한 통제된 저작, 저작에 대한 표현 언어와 자료유형에 의한 표현형190 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 191
  • 97. 디지털장서 관리 및 연구 개발 개념의 분리이므로, 실 KORMARC 메타데이터 요소를 속성 값에 맞추어 어커런스로 매핑하기 보다는 실 레코드와 매칭 되는 구현형에 필요한 어커런스 요소를 정의하는 것으로 방침을 설정 한다. 저작 표현되다 표현형 구현되다 구현형 사례가되다 개별자료 책임표시 소장되다 인 물 제작되다 실현되다 단 체 창작되다 [그림 IV-2] FRBR모델 개체간의 관계 [그림 IV-3] 온톨로지 요소의 관계 정의도 마지막으로 연계타입은 정의한 토픽타입 간의 연관관계를 설정한다. FRBR모델의 개체간의 관 FRBR모델 제1집단의 저작, 표현형, 구현형, 개별자료를 중심으로 KORMARC의 서지레코드 계정의를 토픽타입 간의 관계정의에 적용하고, KORMARC 요소 간에도 관련된 지식의 관계를 요소와의 연관관계를 주로 표현한다. 저작과 관련한 관계는 저작의 장르, 이용대상, 분류체계, 저 정의한다. 관계정의의 기본은 위 [그림 IV-2]와 같이 FRBR 모델의 개체간의 관계를 기본 대상으 작일과 연관되며, 표현형은 표현물의 자료유형, 표현언어, 분류체계, 표현물의 배경, 그리고 표현 로 하며, 그 외의 정의된 KORMARC요소의 토픽타입은 MARC 상의 연관관계를 중심으로 관계 일과 관계정의를 할 수 있다. 개별 서지레코드와의 매핑이 이루어지는 구현형의 경우는 구현물의 를 정의한다. 발행처, 구현일, 구현매체유형, 분류체계와 연관성을 가진다. 제2집단인 인물, 단체의 경우, 관계 정의는 책임표시로 이루어질 수 있으므로 역할타입을 정의하여 동일한 연관성을 나타낸다. 책임 1.2 KORMARC의 상호연관성 분석 및 관계정의 과 저작과의 관계는 창작물, 책임과 표현형 간에는 실현물, 책임과 구현형 간에는 제작물의 관계 가 정의된다. KORMARC의 저자사항에 대한 요소들이 각 관계를 이룰 수 있다. 그리고 개별자료 상기에 정의된 지식층을 구성하는 토픽타입들의 연관관계를 KORMARC의 요소간의 관계와 와 책임 간에는 소장물의 관계가 있지만, 이는 국립중앙도서관이라는 소장기관이 지정되어 있으 FRBR모델의 개체간의 관계를 분석하여 상호연관성을 도식화해 보면 다음과 같다. 므로 개별 관계생성이 필요치 않다. 제 3집단의 개념, 대상, 사건, 장소는 KORMARC내에서 주 제어를 추출하여 대표성을 지니도록 한다. 이때 작품이라는 역할타입을 구성하여 저작, 표현형, 구현형을 그룹핑하여 각 작품에 대한 관계표현을 동일하게 갖는다. 이는 국가라는 토픽타입, 즉 작품이 작성된 소속인 국가와의 관계도 같은 표현형식을 따른다. 상호연관성 분석과 관계표시의 이해를 돕기 위하여 도표로 구성해 보면 다음과 같다.192 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 193
  • 98. 디지털장서 관리 및 연구 개발 토픽타입 관계도 토픽타입 토픽타입 관계도 토픽타입 Work form Carrier form 장르 매체유형 작품의 장르 ↔ 장르의 작품 구현물의 매체유형↔ 구현매체물 Realized Through Published by 표현형 발행처 표현물 ↔ 원작 구현형 구현물의 발행처 ↔ 발행한 구현물 Created by Manifestation classified 책임표시(인물/단체) 분류체계 저자 ↔ 저작물 구현물의 분류 ↔ 분류된 구현물 저작 Publication year Manifestation date 발행일 발행일 저작일 ↔ 발행일 작품 구현일 ↔ 구현일의 작품 Context for Intended audience 배경 이용대상 저작의 배경 ↔ 배경이 된 저작 저작이용대상 ↔ 이용대상의 저작물 Work classified Owned by 분류체계 개별자료 책임표시(인물/단체) 저작의 분류번호 ↔ 분류된 저작 소장처 ↔ 개별자료 Embodied in Subjects 구현형 작품주제 구현물 ↔ 표현물 주제를 가진 저작 ↔ 작품의 주제 작품(저작/표현형/구현형) Realized by Belongs to 책임표시 국가 원저자 ↔ 표현물 국가의 작품 ↔ 작품속 국가 Expression form 자료유형 표현형의 형식 ↔ 자료형식의 표현물 [표 IV-4] 토픽간 상호연관성 정의 Expression language 언어 표현언어 ↔ 언어로 된 표현물 1.3 KORMARC의 FRBR모델 기반 온톨로지 모델링 표현형 Expression classified 분류체계 표현물의 분류 ↔ 분류된 표현물 국립중앙 도서관의 KORMARC 메타데이터를 근간으로 해서 FRBR모델 기반의 온톨로지 모 Expression context 배경 델링을 위한 개념정의를 해 보았다. KORMARC 기반의 온톨로지 모델링을 위한 각 기본 요소들 표현물의 배경 ↔ 배경표현물 Expression date 을 OKS(Ontopia Knowledge Suit: 토픽맵기반 온톨로지 엔진)의 온톨로지 편집기인 온토폴리 발행일 표현일 ↔ 표현일의 작품 (ontopoly)를 이용하여 설계하였다. 온토폴리는 토픽맵 온톨로지 디자인 편집기로서 온톨로지 Translator 구성에서 토픽타입, 어커런스타입, 연계타입, 역할타입, 이름타입에 대한 정의와 인스턴스에서 책임표시(개인/단체) 번역(편역)자 ↔ 번역작품 각 온톨로지 디자인에 데이터를 입력할 수 있는 모드, 그리고 Export로 XML기반의 토픽맵 구성 Exemplified in 개별자료 형식인 XTM, LTM의 반입, 반출기능 등이 있다. 지금까지의 온톨로지 개념의 정의와 추출에 의 개별자료 ↔ 구현물 Produced by (subclass) 한 디자인을 구성해 보면 다음 그림과 같다. 책임표시(개인/단체) 구현자 ↔ 구현물 상단의 지식층에서는 FRBR모델의 주요개체와 KORMARC 주요요소들 간의 관계를 표현해 준다. 제3집단의 사건, 대상, 장소에 대한 개체는 KORMARC 메타데이터 내에 매핑되는 실제 데194 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 195
  • 99. 디지털장서 관리 및 연구 개발 이터가 없으므로, 디자인 차원에서만 정의하고, 이번 프로젝트의 프로토타입 구축에는 제외하였 다. 이용대상이나 주제 부분도 KORMARC 상에서는 빠진 경우가 많아서 정상적인 상호연관성의 표현은 어려울 것 같다. 하지만, 메타데이터의 특성상 이용자서비스에 주요한 대상이 될 것으로 보아, 이용자 참여형 tagging서비스로 프로토타입에서 입력받아 서비스에 반영하고자 한다. [그림 IV-4] KORMARC 의 토픽맵 온톨로지 디자인 [그림 IV-4]의 토픽맵 온톨로지 디자인을 바탕으로 온토폴리 툴에 직접 구축한 토픽타입의 구 성, 연계타입의 구성을 사례로 보면 다음과 같다. [그림 IV-5] 온토폴리 토픽타입 구성의 예 [그림 IV-5]는 온토폴리 디자인 중에서 표현형의 토픽타입 구성화면의 예를 보여주고 있다. 상 단 부분은 표현형에 대한 정의와 고유하고 공통적으로 이용될 수 있는 PSI(Published Subject196 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 197
  • 100. 디지털장서 관리 및 연구 개발 Indicator) 값을 지정하여 이후, FRBR모델의 통합, 타시스템과의 통합에서도 공동으로 이용할 수 있는 값으로 사용한다. Existing Fields 부분에서는 표현형과 연결된 어커런스들과 연계타입 들이 모두 표현되어 있고, 추가 및 삭제 구성할 수 있다. 좌측부터 레이블 명과 토픽타입명 또는 어커런스의 경우는 표기형식 (string, number, URI 등)을 보여준다. Many로 잡힌 경우는 아래 의 사례에서 보여주듯이 연계타입에서 하나의 표현형에 책임표시인 저자와 단체가 함께 연결되 어 있는 경우에 나타난다. 저작과 표현형은 주요 개념을 전제로 하기 때문에 어커런스 보다는 지 식층 간의 연관관계가 더 많이 형성되고, 실제 데이터를 다루는 구현형에서는 다양한 어커런스가 표현되어 있다. 저작, 표현형, 구현형의 토픽name은 기본 서명 값을 추출하여 생성한다. [그림 IV-6]은 온톨로지 연계타입의 구성을 보여준다. 연계타입도 대표적인 PSI를 갖고 있으 며, 토픽과 토픽 간의 연관관계를 정의한다. 이때 사용하는 것이 연관관계의 역할을 하는 역할 타 입을 사용한다. 대개의 경우는 토픽타입과 역할타입을 동일하게 사용하는 경우가 많지만, 앞의 모델링에서 보았듯이 FRBR요소의 제2집단 개체인 인물이나 단체는 저작, 표현형, 구현형에 대 하여 책임표시로 함께 관계를 표현함으로 책임표시라는 역할타입을 생성하여 인물과 단체 2가지 토픽타입을 모두 사용하였다. interface control은 실제 인스턴스 입력과정에서 토픽간의 연계 를 맺어줄 때, 저작이나 인물, 단체를 검색하지 위한 drop down list 방식 또는 search dialog 방식의 선택 방법을 결정한다. 두 연관관계 간의 계층구조를 작성하고자 할 경우에 hierarchical association을 설정해 줄 수 있다. [그림 IV-6] 온토폴리 연계타입의 구성 예 지금까지 국립중앙도서관의 KORMARC 데이터를 대상으로 FRBR모델의 요소와 KORMARC 메타데이터 요소를 토픽맵 기반 온톨로지 디자인을 해 보았다. 다음 장에서 실제 온톨로지 서비 스를 위한 프로토타입을 구성해 볼 것이다.198 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 199
  • 101. 디지털장서 관리 및 연구 개발 2 국립중앙도서관 FRBR모델 기반 프로토타입 구현 를 기본으로 하여 FRBR모델로 변환하여 보고, 이를 토픽맵 온톨로지로 변환하였다. 보고서 앞 장에서 살펴본 MARC to FRBR 변환 알고리즘, FRBR to TopicMaps 변환 알고리즘을 적용하 2.1 FRBR모델 적용사례 분석 여 프로토타입을 구현해 보고자 한다. 본 연구의 프로토타입은 기본 KORMARC 데이터를 FRBR 모델로 변환, 적용하여 서비스의 차별화를 모색해 보고자 한다. 또한 Web2.0 기술 중 가. The BIBSYS FRBR project tagging 서비스를 도입하여 온톨로지와 결합한 이용자 참여형 서비스를 지향하고 주제간의 의미 BIBSYS database에서 FRBR model을 사용하고 있으며 8백만 개의 장서와 3백8십만 개 연계와 유기적인 관계생성으로 생태계형 웹으로 접근해 보고자 시도한다. 의 레코드로 구성되어 있다. 이것은 도서관을 위한 노르웨이 서비스센타의 주축기관들인 노르 FRBR모델 기반 프로토타입 개발의 벤치마킹 사례로는 OCLC의 FictionFinder가 국립중앙도 웨이 대학도서관들, 노르웨이 국립도서관 및 많은 연구도서관을 포함하여 컨소시움 형태로 서 서관의 서지데이터 기반인 부분까지도 유사하여 이를 분석하여 프로토타입의 향상을 도모하고자 비스한다. 한다. [그림 IV-7]의 사례에서 보는 바와 같이 FictionFinder에서의 주요 정보의 collocation으로 잡 나. FictionFinder Prototype 은 부분은 장르, 등장인물, 배경, 주제, 이용대상 등이다. 이 정보들은 한 저작을 이해하는데 중요 FictionFinder는 WorldCat database에서 fiction분야 2백8십만 저작을 중심으로 표현형 및 한 정보원이 될 수 있으며, 이는 MARC21을 통하여 65X에서 장르, 주제, 배경 등에 대하여 상세 구현형을 다양한 관계를 맺어 Collocation시키면서 접근을 허락하고 있는 OCLC의 프로젝트이 히 기술하고 있으며, 이용대상에 중점을 두어 알기 쉽게 표현하고 있다. 다. 서명, 저자명, ISBNs 또는 다른 접근점 문학상 또는 책의 요약에 의해서 책, eBook, 소리책, 그리고 표목을 서명과 저자 기입으로 하여 저작 설정을 하고 있으며, 저작에 따른 언어별 그룹 다양한 멀티미디어 자료를 찾을 수 있다. 또 다양한 의미 있는 묶음 (Collocation)에 의해서 장르 핑으로 표현형을, 판사항 및 매체표현형식의 그룹핑으로 구현형을, 그리고, 소장한 도서관 수로 별, 등장인물, 지명 (가상의 장소), 저작의 배경 및 주제에 의해서 브라우징 및 검색을 할 수 있게 개별자료를 나타내어 주고 있다. 된다. 이용자들이 관심 있는 Item(개별자료)을 찾으면, 이 Fictionfinder는 그 Item의 존재여부 와 해당 청구번호까지 찾을 수 있게 도와준다. 장소 (예, New Orleans) 또는 주인공 이름(Nancy Drew)의 검색도 물론 가능하다. 다. Worldcat.org FRBR화된 데이터베이스(FRBR-ized database)를 활용하고 있는 시스템은 fictionfinder.org의 Prototype도 있지만 worldcat.org 그 자체도 FRBR모델을 잘 따르고 있 다. 이것은 Author, Content, Format, Language, Year 등으로 의미 있게 묶어서 보여주기도 한다. 2.2 FRBR모델 기반 프로토타입 정의 및 범위 [그림 IV-7] Fiction Finder의 FRBR모델 구현 사례 FRBR 모델 기반 프로토타입은 실제 국립중앙도서관의 서비스 중인 KORMARC 메타데이터200 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 201
  • 102. 디지털장서 관리 및 연구 개발 프로토타입의 범위는 다음과 같다. 서관의 서지메타데이터를 살펴보면, 먼저, 등장인물에 대한 기술표시, 시대적, 장소적 배경부분, 국립중앙도서관 KORMARC 데이터를 대상으로 2500건 레코드를 기준으로 한다. 65X tag의 주제분야에 대한 상세기술, 저작의 장르에 대한 사항이 OCLC의 데이터처럼 정확하 OCLC의 Fiction Finder 프로토타입과 유사하게 한국 문학분야를 대상으로 기초데이터 한국 고 상세하지 못한 실정이다. 2003년 이후의 KORMARC 서지레코드를 기준으로 프로토타입 대 소설, 한국희곡, 한국 시 분야의 기초데이터 각 500건 레코드를 추출하여 변환한다. 상을 다룰 때, OCLC를 대체할 수 있는 메타데이터 정보로는 650tag에 기술한 사항인데, 이 내 1500건 레코드를 기준으로 연관된 표현형, 구현형 레코드를 국립중앙도서관 KORMARC에 용은 주제정보라기 보다는 한국 현대소설, 환상소설 등과 같이 시대 및 장르에 해당한다고 볼 수 서 추가로 추출하여 KORMARC을 다운로드 받아 추가 변환한다. 이 레코드가 1300건 정도에 있다. KORMARC의 653tag인 비통제주제어 또한 서명에서 키워드 추출에 의한 생성이므로 필 달한다. 요 없는 값이 더 많으며, 문학분야에서는 특히나 작품에 대한 주제라고 이야기 할 수 없으므로 주 KORMARC 메타데이터의 FRBR모델로 변환하여 프로토타입에 반영한다. 저작과 표현형을 제로 생성하지 못한다. 이용대상자 또한 521tag의 주기사항의 기술이나 부호화정보필드 실제 서지레코드의 매핑이 아닌, 개념 모델로 접근하고 구현형에서 서지레코드에 매핑하여 간략, (008tag)에서 기호로 기술하는데 없는 사항이 많고, 문학 자체의 이용대상을 주로 일반이용자 전 상세서지의 구성에 변화를 주는 서비스를 범위로 한다. 체로 다루고, 장애인용이나 아동도서인 경우만을 구분해 주는 경향이 한국의 목록기술 현실로 보 Web2.0 기술과 온톨로지 서비스 접근으로 프로토타입의 차별화 전략을 모색해 본다. 아야 할 것이다. 하지만, 이는 인터넷 서점 사이트에서는 이용대상이나 작품분류를 상세히 하고 있으므로, 이후 연계한 서비스를 모색해 볼 수 있을 것이라 사려 된다. 2.3 FRBR 모델 기반 프로토타입 설계 및 정제 둘째, 저작의 선정에서 서명과 저자를 보면, 저자사항이 전거레코드 관리로 이름 + 생몰년으 로 통제관리가 되고 있지만, KORMARC에서는 1XX의 기본표목도 사용하지 않을 뿐더러, 부출 프로토타입 설계 지침은 다음과 같다. 표목에서도 이름만을 다루고 있기 때문에 이명표기나 동명이인에 대한 처리가 이루어질 수 없는 MARC to FRBR, FRBR to TopicMap 변환 알고리즘 적용 실정이다. 현 프로토타입에서는 이름과 저작의 중복 체크로서 저작을 설정하는 정제작업을 하고 XML schema를 XSLT를 이용하여 XTM schema로 변환 자 한다. 2000년도 이후 작성된 서지레코드 중 한국문학과 관련된 서지 2000건을 대상으로 저작과 번 셋째, 개별자료의 표현에 있어서, 현재 국립중앙도서관의 KORMARC 또는 서비스에서는 국내 역자료(표현형), 자료유형(구현형)으로 변환 프로그래밍 공공도서관에 대한 공동목록과 관련된 통합서비스를 실시하지 않고 있으므로, 저작에 대한 국립 저작을 대상으로 국립중앙도서관 사이트에서 관련된 표현형, 구현형 자료를 검색, KORMARC 중앙도서관의 소장정보만을 확인할 수 있는 실정이다. 따라서, 개별자료의 표현자체가 도서의 등 레코드를 다운로드 받아 변환 프로그램으로 온톨로지에 등록 작업 록번호에 따른 복본 수에 지나지 않기 때문에 큰 의미가 없으므로 개별자료 부분을 프로토타입의 FRBR기반 프로토타입 사이트 설계 및 디자인 대상에서 제외한다. 이용자 참여기반의 반영으로 서지정보에 대한 이용대상 및 작품주제에 대한 이용자 태깅정보 마지막으로 현재의 국립중앙서비스는 동일한 저작에 대하여 전자책, DVD, 비디오자료 등의 등록 및 열람 서비스 반영 다양한 매체형식에 따른 관련 작품에 대한 서비스와 출판사-출판연도별, 판사항별 서지레코드를 토픽맵기반 온톨로지의 프로토타입 반영으로 서지정보 간의 collocation이 일어날 수 있도록 다양하게 구성하여 제공하고 있으므로, 이를 표현하는 구현형에 초점을 맞춘 프로토타입의 구성 설계 이 효과적이라 사려되어 서비스에 반영하고자 한다. 국립중앙도서관서비스를 FictionFinder에 벤치마킹하는 데에는 기반 KORMARC 메타데이터 의 제한점이 존재한다. 첫째, FictionFinder에서 다루는 분야인 Fiction분야에 대한 국립중앙도202 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 203
  • 103. 디지털장서 관리 및 연구 개발 2.4 FRBR모델 기반 프로토타입 구축 및 구현 <subfield code="a">895.734</subfield> <subfield code="2">19</subfield> 프로토타입 구축은 먼저 국립중앙도서관의 KORMARC 데이터를 다운로드 받아서, MAR- </datafield> CXML형식으로 변경한다. FRBR모델로의 변환을 위한 XSLT를 작성하여 변환 프로그래밍한다. <datafield tag="100" ind1="1" ind2=" "> 아래의 문서는 KORMARC 한 레코드를 MARCXML로 다운로드 받은 형식이다. <subfield code="a">이인화</subfield> </datafield> <datafield tag="245" ind1="1" ind2="0"> <collection> <subfield code="a">영원한 제국:</subfield> <record> <subfield code="c">이인화 장편소설/</subfield> <leader>00465nam a2200205 k 4500</leader> <subfield code="d">이인화 지음</subfield> <controlfield tag="001">0000257617</controlfield> </datafield> <controlfield tag="005">20070821160312</controlfield> <datafield tag="260" ind1=" " ind2=" "> <controlfield tag="008">931201s1993 ulk 000 f kor <subfield code="a">서울:</subfield> </controlfield> <subfield code="b">세계사,</subfield> <datafield tag="020" ind1=" " ind2=" "> <subfield code="c">1993</subfield> <subfield code="a">8933800344:</subfield> </datafield> <subfield code="c">5500</subfield> <datafield tag="300" ind1=" " ind2=" "> </datafield> <subfield code="a">357p.;</subfield> <datafield tag="040" ind1=" " ind2=" "> <subfield code="c">23cm</subfield> <subfield code="a">011001</subfield> </datafield> <subfield code="c">011001</subfield> <datafield tag="653" ind1=" " ind2=" "> </datafield> <subfield code="a">제국</subfield> <datafield tag="052" ind1="0" ind2="1"> </datafield> <subfield code="a">813.6</subfield> <datafield tag="950" ind1="0" ind2=" "> <subfield code="b">이578ㅇ</subfield> <subfield code="b">5500</subfield> </datafield> </datafield> <datafield tag="056" ind1=" " ind2=" "> <datafield tag="965" ind1=" " ind2=" "> <subfield code="a">813.6</subfield> <subfield code="a">소설</subfield> <subfield code="2">3</subfield> <subfield code="z">한국</subfield> </datafield> </datafield> <datafield tag="082" ind1=" " ind2=" ">204 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 205
  • 104. 디지털장서 관리 및 연구 개발 </record> </collection> MARCXML 파일에 FRBR모델의 변환 알고리즘을 반영한다. FRBR모델 변환 알고리즘과 앞 서 살펴본 온톨로지 모델링 스키마를 XTM으로 다운로드 받아서 XSLT로 작성하여 변환한다. [그림 IV-8]은 프로토타입 구축을 위한 변환과정을 보여주고 있다. [그림 IV-8] 프로토타입 구축 과정 및 구조 [그림 IV-9] XSL 변환 문서 [그림 IV-9]의 XSL 변환문서는 MARC의 FRBR요소와 온톨로지의 topic 부분을 모두 포함한 프로토타입 구현의 화면디자인 구성에 대하여 기술하면 다음과 같다. 최종 변환 파일이 된다. 이 파일을 통한 변환 프로그램으로 FRBR 모델 변환 및 온톨로지 토픽맵 - 메인 페이지의 컨셉은 [그림 IV-10]의 OCLC의 FictionFinder과 [그림 IV-11]의 프로토타 XTM 요소로의 변환이 작성된 XML파일이 최종 결과로 만들어진다. 이 파일을 XTM문서로 입을 유사하게 구성하여 시작하기로 한다. OKS의 토픽맵 엔진에 import하여 스키마 또는 데이터베이스로 저장하게 된다. 이렇게 변환된 온톨로지 메타데이터를 가지고 웹 프로그래밍하여 프로토타입 서비스를 개발, 구현한다.206 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 207
  • 105. 디지털장서 관리 및 연구 개발 형 자료들의 연관정보와 저작에 대한 정보층 즉, KORMARC 메타데이터의 상세정보를 열람할 수 있도록 구성한다. [그림 IV-10] OCLC FictionFinder의 프로토타입 시작 화면 [그림 IV-12] 문학작품의 화면 예시 [그림 IV-12]의 문학작품의 화면 예시에서 볼 수 있듯이 문학작품의 가나다순의 저작 리스트와 함께 해당 저작의 표현형, 구현형 통계가 나타난다. 여기서 저작을 클릭하면 Web2.0의 Ajax 기 술을 이용하여 동일화면에서 구현형의 간략 리스트를 열람할 수 있도록 작은 브라우저가 나타난 [그림 IV-11] 국립중앙도서관의 프로토타입 메인화면 다. 우측 프레임의 관련항목으로 소설분야, 현대시, 수필분야의 저작 리스트를 서비스 하고 있다. 저자 메뉴에서는 저자별 저작리스트를 모아서 서비스하고, 프로토타입 범위에서 다루는 한국소 - FRBR모델 기반 프로토타입이 한국문학위주의 메타데이터를 대상으로 구축하였으므로, 메 설, 한국희곡, 한국시 분야의 대표 저자리스트를 화면내에서 하나의 관련정보로 서비스 구성한 인메뉴의 구성을 크게 문학작품, 저자, 장르별, 시대별로 서비스를 제공하고자 한다. 다. 구현시 아쉬운 점은 저자에 대한 상세 정보가 메타데이터 내에 없는 관계로 저자의 저작이나 문학작품의 페이지에서는 저작위주의 리스트 열람과 검색을 제공하면서 저작의 표현형과 구현 주요 출판사 정도의 정보 연계가 없다는 점이 한계가 되고 있다. 형을 정보의 그룹핑된 결과로서 열람할 수 있도록 제공하고, 상세화면에서는 저작의 다양한 구현208 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 209
  • 106. 디지털장서 관리 및 연구 개발 [그림 IV-13] 저자의 화면 예시 [그림 IV-13]의 저자 화면예시에서 저자의 가나다순의 리스트에 저자의 문학작품들을 그룹핑 [그림 IV-14] 프로토타입 상세화면 예시 하여 서비스하고 있으며, 화면의 프레임을 나누어서 소설, 수필, 시 분야의 저자 리스트로도 장르 별 저자라는 새로운 정보열람의 기회를 제공하고 있다. 프로토타입의 모델링 자체가 KORMARC의 서지데이터 위주이고, 메타데이터의 내용 또한 문 장르에서는 KORMARC 최근 데이터에 부여한 650tag의 주제장르를 디렉토리 서비스로 이용 학작품에 대한 사항들이 대부분이므로, 문학작품 이외로는 다양한 컨텐츠를 구성할 수 없다는 제 자에게 장르별 저작리스트를 열람하도록 서비스를 제공하도록 한다. 한점이 있으며, 이는 국립중앙도서관에서 제공하는 서비스 자체가 도서에 대한 상세정보라는 도 시대는 OCLC의 FictionFinder처럼 문학작품의 시대적 배경과 역사적 시기 및 사건 위주의 메 메인의 특성을 감안하여, 정보의 상호운용성의 효과나 유기적인 연계부분, 이용자 참여부분이 최 타데이터가 있다면 서비스에 빛을 발할 수 있겠지만, 현재의 실정에서는 저작의 발행일을 시대로 대한 온톨로지적으로 나타날 수 있도록 상세화면의 구성을 살려보고자 한다. 따라서 기존의 서지 하여 5년 단위로 끊어서 대상이 되는 저작 리스트를 보여주도록 한다. 상세화면과 차별화가 되도록 먼저, FRBR 모델의 디자인이 나타나도록 하며, 상세화면 보기의 내 용과 정보의 collocation이 일어나는 주제, 출판사, 저자, 장르 등에 대한 서비스, 그리고 비쥬얼 한 서비스 네비게이션(vizigator) 등을 구성하고자 한다. 이용자 참여부분에서는 저작에 대한 작 품주제와 이용대상에 대한 이용자 태깅을 입력받아 컨텐츠의 보완으로 활용한다.210 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 211
  • 107. 디지털장서 관리 및 연구 개발 2.5 FRBR모델 기반 프로토타입을 통한 서비스 효과 본 연구과제를 통하여 표준 메타데이터 모델 및 시맨틱 언어 개발 연구를 하면서 지극히 일부 분이나마 국립중앙도서관의 실제 데이터를 변환하여 문학분야의 프로토타입을 구현해 보았다. 프로토타입과 기존의 국립중앙도서관 서비스와의 차별성을 몇 가지 시나리오로 비교하여 서비스 효과를 기술해 보고자 한다. 또한 온톨로지 서비스 효과를 살리기 위한 메타데이터 컨텐츠 보완 및 서비스 측면의 몇 가지 제언을 해 보도록 한다. 가. 기본 검색에 의한 간략화면의 구성 [그림 IV-15]는 현재의 국립중앙도서관 서비스에서 프로토타입과 동일한 조건으로 2003년 이 후 한국소설 자료를 검색한 결과화면이다. 이 서비스의 특징은 도서, 비도서 등의 자료 유형별로 그룹핑하여 서명, 저자, 출판사, 연도, 언어, 청구기호 등의 리스트를 제공하며, 서지레코드의 목 차, 원문 여부 등을 표현해주며, 도서 내의 구분, 비도서 내의 매체구분 정보를 보여주고 있다. [그림 IV-15]의 프로토타입 문학작품 리스트 화면에서 보는 바와 같이 동일한 서지에 대한 언 어별, 자료유형별 서지건수(표현형), 출판사항이 다른 경우나, 저작의 다른 매체구현 자료의 건수 (구현형)를 알려주고, 같은 화면 내에서 스크롤하여 표현형, 구현형 자료들의 간략 리스트 까지 [그림 IV-15] 국립중앙도서관 한국 현대소설 검색결과 화면 보여주고 있다. 두 서비스 방식이 다르고 장단점이 있겠지만, 프로토타입을 통하여 이용자자 찾고자 하는 자료 를 검색한 경우, 동일 저작에 대한 다양한 표현물이나 구현작품들을 동시에 열람시켜서 이용자에 게 저작에 대한 체계를 마련해주고 이용 선택의 폭을 넓혀 주는 새로운 의미를 줄 것이라고 기대 된다. 나. 저자로 검색했을 경우 국립중앙도서관에서 저자로 검색할 경우, 동명이인, 저자가 아닌 다른 역할자인 경우의 자료를 모두 검색하고, 저자의 저작들이 모두 검색되지만, 저작의 다양한 구현매체들은 비도서라는 다른 탭으로 서비스를 제공하고 있다. [그림 IV-16]에서 보는 바와 같이 안도현으로 검색했을 경우, 나 오는 결과에는 안도현 엮음 작품들과 비도서에서 안도현의 작사 녹음자료 및 시낭송집 (안도현의 시 포함) 등이 검색결과로 제공한다.212 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 213
  • 108. 디지털장서 관리 및 연구 개발 [그림 IV-17] 프로토타입의“안도현”검색 결과 다. 컨텐츠를 통한 다양한 서비스 제공 및 이용자참여 이번 프로토타입을 구성하는데 중요방안으로 둔 부분이 정보의 의미 있는 묶음과 현재의 컨텐 츠를 통한 서비스의 다양한 기능 즉 패싯(facet) 기능으로 제공하고자 한다. 패싯은 특정 상황에 관한 정보를 채우기 위한 프레임 표기법의 한 요소로 다면체의 한 요소를 이루는 한 단면을 의미 한다. 즉, 자료 검색이외에 추출된 정보나 키워드를 통하여 새로운 서비스를 구성해 보고자 함이 다. 프로토타입에서는 범위에서의 한국소설, 현대시, 한국 수필이라는 큰 주제분야에 의한 패싯 [그림 IV-16] 국립중앙도서관“안도현”저자 검색결과 을 설정하여 프레임에서 분야별 문학작품 리스트, 분야별 저자리스트 등의 서비스를 제공하고 있다. 프로토타입에서는“안도현” 작품 리스트로 한 저작에 대한 다양한 표현물과 구현물, 그리고 의 모든 저작리스트를 제공하고 있다. 출판사, 발행년도가 다른 작품들과 전자책, 컴퓨터화일, 녹음 자료 등을 상세히 알려 줌으로써 이용자가 원하는 자료를 선택하여 열람할 수 있도록 하며, 패싯 으로 다른 저작리스트, 발행처리스트 및 분야별 저자리스트 등을 서비스하고 있다.214 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 215
  • 109. 디지털장서 관리 및 연구 개발 수 있었다. [그림 IV-18]은 장르별 서비스의 대표적인 화면으로 국회의원 범주에 있는 저작과 그 저작의 구현형들을 보여주고 있다. 예시화면은 저자“김홍신” 국회의원 시설의 작품들 목록을 서비스 의 하고 있다. 또한 프로토타입의 주요 컨텐츠인 소설, 시, 희곡분야의 작품을 카테고라이즈 하여 패 싯으로 서비스를 제공하고 있다. Web2.0 시대의 도래에 맞추어, 도서관의 컨텐츠도 기존의 서지중심과 목차, 원문제공의 서비 스에서 탈피하여 이용자가 만들어가는 새로운 이상향의 서비스를 제공하고자 하는 목표에 편승 하여, 문학작품에 대한 이용자 태깅을 하나의 메타데이터로 구성하였다. 대중에게 접근하면서 직 접 문학작품 들을 접해본 이용자에 의한 작품 주제, 시대적, 역사적, 문화적, 예술적 배경, 등장인 물, 작품의 내용적 분류 등을 직접 입력받아 컨텐츠가 구축된다면 형식은 없지만, 이용자에게는 더욱 유용하고 새로운 정보로 환영받을 수 있는 정보가 될 것이다. 일반 웹사이트의 이용자 태깅 은 내용과 형식에 있어서 자유로운 기술을 사용하고 있지만, 본 프로토타입의 이용자 태깅은 작 품의 주제라는 항목과 이용대상이라는 큰 범주를 제공하면서 이용자의 태깅을 입력받도록 한다. 이는 이용자 지식의 자유로움도 제공하면서 도서관 컨텐츠의 내용상 메타데이터 요소로 정의하 여 재사용할 수 있는 이점을 제공한다. 독자가 판단하고 작성한 이용대상 또한 다양하면서도 의 미 있는 정보가 될 것이라고 사려 된다. 앞에서 현재의 국립중앙도서관서비스와 프로토타입을 세 가지 측면에서 비교하여 서비스효과 를 살펴보았다. 각각의 장단점이 존재하겠지만, FRBR모델의 주요 특징인 저작을 중심으로 한 네 트워크 목록의 구성이라는 초점에서 새로운 서비스 효과를 볼 수 있을 것이며, 온톨로지 구축을 통하여 검색 결과에 대한 다양한 연관관계로의 접근으로 정보제공 서비스의 상호운용성과 vizigator를 통한 네비게이션 기능을 시도해 볼 수 있었다. [그림 IV-18] 프로토타입 장르별 서비스 예시 하지만, 서지중심의 한정된 메타데이터 요소와 레코드간의 상호연관성 생성요소의 부족함은 서비스효과를 크게 살려주지 못하는 한계와 한 주제분야에 제한된 프로토타입이 다양한 정보 항 또한 장르별, 시대별 서비스는 단순 패싯이 아닌 KORMARC내의 발행연도나 주제분류에 의한 해의 저해요인이 될 수도 있었다. 장르표기를 대상으로 저작을 분류하여 컨텐츠 서비스를 제공하고 있다. KORMARC의 650tag 따라서 차세대 도서관 서비스로서 이용자의 참여와 공유가 함께하는 Web2.0 시대에 맞추어 에 기술된 내용은 한국 현대소설, 환상소설, 공상과학소설, 교양소설 등의 내용의 큰 범주구성에 서, 이상적인 온톨로지 서비스를 디자인하고 이에 맞춘 이용자참여 및 외부서비스와의 연계에 의 서부터 글모음집, 글 쓰는 법 등 형식적 분류와 국회의원 등의 작품의 특이성까지를 망라하여 프 한 컨텐츠 보완을 제언함으로 서비스의 효과를 한층 살리고자 한다. 로토타입에서만도 69가지의 범주가 나타났으며, 이를 토대로 장르별 문학작품 서비스를 작성할 첫째, 저자명에 표목을 설정하고 이에 PSI를 부여함으로써, 유일한 저자로 모일 수 있도록 한216 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제4장 국립중앙도서관 FRBR모델 기반 온톨로지 설계 217
  • 110. 다. 저자명 표목은 저자명과 생몰년, 그 밖의 항목들로 유일하게 구성하면서 PSI로 관리하게 되 면, 이후 동명이인이 발생할 경우에도 제어할 수 있는 값이 될 것이다. 동일 저자에 대한 저작이 한 곳에 모일 수 있는 효과도 있으며, 여기에 저자에 관련한 다양한 메타데이터 요소를 추가하여 구축한다면, 도서관의 서비스 요소가 작품에만 한정되지 않고 더 다양한 정보제공의 기회가 될 것이며, 인적 네크워크의 활용에도 기여할 것이다. 이를 위한 인물 온톨로지 구축사례나 모델도 벤치마킹할 요소들이 있다고 사려된다. 둘째, 인터넷 서점이나 웹사이트와 연계하여 MARC나 DC등에서 정의한 메타데이터 요소 이 외의 다양한 컨텐츠를 구축하는 것이다. 인터넷 서점의 형식적 분류나 상세한 이용대상, 리뷰 및 서평, 저자정보 뿐 아니라, 개인 블로그 및 웹 사이트에 올라있는 작품의 장소, 대상, 사건, 등장 인물이나 이슈 등의 요소를 도서관 컨텐츠로 흡수한다면 FRBR모델의 제3개체의 요소들에 대한 서비스로 확장할 수 있고, 이는 서지정보 외에 이용자가 진정으로 제공받고자 하는 정보일 것이 라 사려 된다. 차세대 국립중앙도서관의 서비스 모형은 기존의 서지수준의 컨텐츠에서 다양한 연관관계를 생 성해 주면서, 이용자 참여형 컨텐츠를 활성화시켜서, 컨텐츠면이나 이용자 서비스측면에서 차별 화되고 정보의 자유로운 네비게이션이 가능한 생태계형 웹서비스를 제공하는 서비스로 지향할 수 있다.218 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발
  • 111. 디지털장서 관리 및 연구 개발 제5장 국립중앙도서관의시맨틱 해할 수 있도록 표현하여 컴퓨터와 사람이 협업하기에 좋은 환경을 제공함으로써 이용자에게 보 DL 서비스 다 효과적인 정보전달을 가능케 하는 시맨틱 웹을 제안하였다. 시맨틱 웹은 기계가 해석할 수 있 는 데이터의 생성에서 출발하여 궁극에는 기계가 정보를 이해하고 추론할 수 있는 환경을 마련하 는 것을 목표로 하고 있다. 그래서 시맨틱웹이란 "기존의 웹을 확장하여, 컴퓨터가 이해할 수 있 는 잘 정의된‘의미’ 기반으로, 의미를 이해하고 처리할 수 있는 웹기술"이라고 할 수 있다. 시 를 맨틱웹은 인간을 위한 정보의 표현뿐만 아니라, 컴퓨터가 정보의 의미를 이해하고, 처리를 자동 화하고, 정보를 재사용할 수 있도록 하여 주는 차세대 웹기술이다. 디지털 도서관과 Semantic Digital Library 현재 웹의 문제점 이젠 정보기술의 발전으로 정보자원의 디지털화가 가능해지고 정보통신망의 보급으로 개방적 현재의 웹에서 데이터 그 자체로서는 분명한 의미를 지니고 있지만, 기계는 그 뜻을 전혀 이해 인 정보 서비스 제공의 필요성이 증대되어 디지털 도서관이 등장하게 되었다. 디지털 도서관은 를 할 수 없고 단지 이용자만이 인간이기에 이해할 수 있을 뿐이다. 그래서 검색엔진을 통해 검색 다양한 매체와 형식의 전자정보자원을 효과적으로 관리하기 위해 대용량 저장장치와 콘텐츠관리 된 정보는 이용자의 의미적 요구가 전혀 반영되지 않은 채 단순히 겉모습만 같은 것 끼리 모여서 시스템을 기반으로 구축된다. 또한 컴퓨터 네트워크를 통해 전자정보 자원의 교환과 공유체계를 요구되는 방법으로 정렬되어 이용자에게 제공되고 있다. 구축하고 있다. 바로 여기에서 기계가 이해 할 수 있는 부가 정보를 넣을 수 있는 방법은 없을까라는 고민이 시 그러나 점점 다양해지는 매체와 형식의 전자정보 자원의 서지 정보를 기술하는데 기존 체계는 작되었다. 뜻이 살린 검색을 할 수 없을까라는 고민인 것이다. 즉, 정보에 가치를 부가해 보자는 한계가 나타나게 되었다. 이에 정보의 의미 이해를 수반하는 표준적인 서지정보 기술방식이 요구 것이다. (Value Added Information) 이렇게 하여‘기계가 이해’ 한다는 것은 사람이 수고스럽던 되었다. 이에 더블린 코어를 비롯한 많은 메타데이터 체계가 개발되어 서지정보기술의 새로운 방 것을 이젠 기계가 수고스럽게 해보자는 시도이다. 정보에 의미를 부여한다는 것은 기계가 정보를 향을 제시하였으며 시맨틱 웹을 기존의 디지털도서관에 적용할 필요성이 부각되었다. 단순한 객체가 아닌 정보로써 받아 드릴 수 있도록 정보에, 정보를 설명하는 부가적인 정보, 즉 디지털 도서관에의 시맨틱 웹 적용은 웹정보 기술이 다양한 영역으로 빠르게 확장되어 이용자 메타데이터를 삽입하고, 정보와 정보간의 관계를 정의 (예. 저자와 저작 간의 관계 등)하여, 이를 에게 보다 유용한 정보공간을 제공하기 위해 정보자원과 서비스가 제공되는 공간이 웹으로 이동 기계가 논리적인 제약에 따라 이용, 활용할 수 있도록 하는 것을 의미한다. 이러한 부가 정보는 하게 되었다. 이에 새로운 형태의 디지털 도서관 출현에 대한 요구가 발생하였고 초고속 정보통 단순히 정보에 대한 이력을 담고 있는 것이 아니라 정보가 가진 의미적 내용을 설명하는 것이다. 신망, 고성능 서버, 대용량 기억 장치를 기본 인프라로 하여 서비스 서브렛으로 구현된 서비스가 이는 기계가 이용자로부터 받아드린 의미적 질의를 근거로 의미검색을 할 수 있는 바탕을 마련해 실현되고 있다. 줄 뿐만 아니라 이용자가 생각치도 못했던 우연적 정보검색도 가능하게 할 것이다. 디지털 도서관에 활용된 정보기술의 효율적 운용을 위해 URI, DOI와 같은 정보자원 식별체계 가 개발 되었으며 다양한 형태의 정보자원 서지특성을 효과적으로 기술하기 위한 메타데이터 표 시맨틱웹이란? 준이 활발히 개발되었다. 이렇듯 디지털 도서관이 인터넷 기반의 웹기술을 중심으로 전개됨에 따 라 분산 환경 하에서의 이질적 정보시스템의 통합, 다양한 이용자 서비스 제공을 목적으로 하는 바로 이점에 착안하여 월드 와이드 웹의 창시자인 팀 버너스 리는 데이터의 의미를 기계가 이 새로운 형태의 도서관이 출현하게 되었다. 이들 도서관의 정보공간의 확대, 이용자의 용이한 접220 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제5장 국립중앙도서관의 시맨틱 DL 서비스 221
  • 112. 디지털장서 관리 및 연구 개발 근, 정보자원의 활용 확대 목적을 이루기 위해서는 시맨틱 웹의 적용이 필수적으로 요구된다. 스와의 공존을 추구하면서 발전적 흡수를 위한 방법론을 연구해야 할 것이다. 그 외에도 국립중앙도서관에서는 다음 분야를 연구할 필요가 있다. Semantic Digital Library란? 가. 데이터 모델링 및 차세대 의미검색시스템 연구: 지금까지 이러한 요구는 주로 이질적인 시스템간의 물리적 통합, 메타데이터를 활용한 서지정 ● 다양한 독립적인 또는 이종( 種)의 데이터의 상호운용을 위한 RDF/토픽맵 데이터 모델링 보 기술체계 확립과 웹기반의 다양한 서비스 제공이 중요한 사항이었다. 그러나 정보자원 관리와 연구. 서비스 체계의 혁신을 위해서는 강력한 의미 표현 기능을 갖는 온톨로지의 활용, 연관관계의 표 ● 시맨틱 DL의 구조적 상호운용을 위한 스키마 모델링을 위한 TMCL(토픽맵 스키마 언어)와 현이 뛰어난 FRBR과 같은 개념모델의 활용과 같은 보다 근본적인 접근이 요구된다. 디지털 도서 OWL(RDF 스키마 언어)의 활용방안 연구. 관의 지능화된 정보자원 관리와 이용자 주도 서비스 혁신이 요구되며 이러한 의미기반 디지털 도 ● 새로운 의미 검색을 위한 언어로 TMQL(토픽맵 질의언어)와 SPARQL(RDF 질의어)의 활용 서관을 Semantic Digital Library라고 한다. 방안 연구. 구체적으로는 Fulltext 기반의 용이한 검색을 허용하는 현 디지털도서관의 개념을 넘어 통합 메타데이터와 온톨로지를 적극적으로 활용하여 맞춤형 지식서비스를 제공하자는 것이다. 서로 나. 차세대 의미검색시스템을 위한 하부구조: 다른 메타데이터를 사용하고 있는 자원(resources), 이용자 프로파일(user profile), 북마크 ● 현 디지털도서관의 구문구조 의존형 검색에서 의미 검색 (semantic matching)이 이루어지 (bookmarks), 택사노미(taxonomies) 또는 온톨로지를 통합시켜서 "기계와의 (with 는 시스템으로 발전하기 위한 하부구조를 마련한다. machines)" 뿐만 아니라 "기계에 의해서(by machines)" 상황 속에서의 의미화(make sense)를 ● 다양한 도서관의 의미적 통합검색을 위한 각 도서관의 네임스페이스 정책 수립. 가능하게 하여 정보의 상호연계성을 증진시킬 필요가 있다. ● 모든 메타데이터와 온톨로지가 등록될 수 있는 레지스트리 시스템 운영방안 수립. ● Semantic Digital Library의 기반구조를 제공할 것으로 기대되는 WordNet, DMoz, and 1. 시맨틱 DL 구성요소 SKOS등의 시소러스의 벤치마킹. ● 더블린코어 레지스트리의 벤치마킹을 통한 국립메타데이터 레지스트리 운영방안 수립. 이에 국립중앙도서관에서는 시맨틱 디지털 도서관의 주요 구성요소가 될 RDFS, OWL, ● 미국 NSDL에서 운영하고 있는 온톨로지 레지스트리의 벤치마킹. SPARQL, JeromeDL, MarcOnt, FOAFRealm, and HyperCuP 및 BRICKS 등을 연구해야 할 것이다. 다. 이용자 참여형 차세대 검색시스템을 위한 하부구조: 현재의 정적인 정보공간(information space)에서 동적인 지식 공간(knowledge space)으로 RDF Schema for FRBR 활용하여 많은 의미(meanings)를 포함하면서 서로 공유 할 수 있는 체계를 마련할 필요가 있다. RDF Schema: http://vocab.org/frbr/core 특정 정보의 요구에서 시작한 이용자의 질의를 끝없이 연결되게 할 뿐만 아니라, 이용자들도 아 시맨틱 디지털 도서관에서의 온톨로지의 역할규명 주 쉽게 자기가 표현하고 싶은 것을 웹상에 표현하게 하여 (tagging) 시스템과 이용자, 이용자들 끼리 새로운 정보를 나누게 할 하부구조를 확립할 필요가 있다. 특히 Bibliographic 온톨로지인 FRBR, SKOS, MarcOnt를 집중적으로 연구할 필요가 있다. ● Blog, Forum, Wiki 등의 커뮤니케이션 툴에 대한 연구. Mashifications : Mash-Up Libraries 추구. 아무리 새로운 시스템을 구축해도 기존의 서비 ● 이용자 태깅, social bookmarking, Folksonomies, ajax 등 연구.222 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제5장 국립중앙도서관의 시맨틱 DL 서비스 223
  • 113. 디지털장서 관리 및 연구 개발 라. 이용자 이용패턴연구: ● 메타데이터 요소 등록 ● 이용자 정보이용 패턴분석의 도구 개발 - 메타데이터 요소 정의 ● Connetea, del.icio.us, Flickr 등의 이용자 커뮤니티 연구 - 메타데이터 요소 URI 등록 ● 온톨로지 기반 검색과 facet 검색에서의 이용자 연구 - 메타데이터 요소의 상. 하 관계 등록 ● Community-enabled browsing의 행태 연구 ● 온톨로지 등록 ● 키워드 기반 검색시스템의 의미적 질의확장에 대한 이용자 연구 - 클래스(URI 포함) 정의 등록 - Direct RDF querying - 클래스들 간의 관계 등록 - Natural language templates - 속성 (URI 포함) 등록 - 속성들 간의 관계 등록 2. 시맨틱 DL 기반 국립중앙도서관 서비스 제안 - 온톨로지 전체 등록 2.1 Metadata 및 Ontology Registry 확립 2.2 시맨틱 DL의 기능적 요구사항 분석 네임스페이스 관리를 적절히 하고 있는 기관을 분석하고 국립중앙도서관의 네임스페이스 정책 가. 의미기반 서비스 제공 을 수립한다. 이를 위해서는 국제적으로 널리 사용되고 있는 모든 메타데이터 스키마와 응용프로 의미기반 검색서비스, 연합된 업무서비스 등이 지원 되어야 하며 메타데이터와 온톨로지 간의 파일을 등록하여 모든 시스템 개발자들이 참조할 수 있는 메타데이터 등록시스템을 운영한다. 국 상호운용성이 보장되어야 한다. 립중앙도서관은 더블린코어 레지스트리를 확장해서 더블린코어 요소만 등록하는 것이 아니라 국 제적으로 신망을 얻은 모든 메타데이터 스키마를 등록하고 국내에서도 메타데이터를 제대로 설 나. 풍부한 이용자 경험 계해서 사용하도록 권고한다. 더 세부적으로는 다음과 같은 항목을 실시한다. 이용자의 정보검색에 대하여 관련 주제 공간을 시각화하여 탐색 할 수 있게 하거나, 연관된 이 ● 네임스페이스 정책수립 미지, 음악, 동영상 등을 제공하는 것과 같은 풍부한 경험이 제공되어야 한다. 이는 이용자에게 - DC namespace 연구 가치 있고 의미 있는 서비스가 될 수 있도록 해야 한다, - MODS의 19개의 주요소와 47개의 하위요소 등 네임스페이스 연구 ● 식별자 벤치마킹 다. 다중접근 가능 - PURL 컴퓨터뿐만 아니라 다양한 통신기기를 이용한 접근이 가능하여야 하며 다중 서비스 접근도 가 - DOI (Digital Object Identifier) 능해야 한다. - Handle: 미국 디지털 도서관 프로젝트의 일환으로 제안되었으니 특히 유심히 살펴볼 필 요가 있음 라. 개인화 - 국내식별체계 분석: UCI, COI, KOI, 등등 서비스 컴포넌트를 활용하여 개인 맞춤 정보 포털을 실현하고 자동 구독이 가능케 하여 개인정 보 포털로서의 역할을 수행할 수 있어야 한다. RSS 피드백을 제공하여 이용자가 직접 국립중앙224 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제5장 국립중앙도서관의 시맨틱 DL 서비스 225
  • 114. 디지털장서 관리 및 연구 개발 도서관 홈페이지에 방문하지 않고도 최신 소식과 최근 업데이트 된 내용, 최근 게시된 리뷰나 코 나. JeromeDL이 제공하는 유익 멘트 등을 알 수 있게 한다. - 기존 도서관의 유물 지원 - 이용자 지향 브라우징 특징 제공 마. 커뮤니티 지원 - 효과적인 검색 허용 도서관 이용자, 관리자 및 개발자 상호간에 커뮤니티가 구성되어 상호 협력적 정보 서비스를 - 보안 보장과 논리제약 계산 실현하여야 한다. 다양한 정보 기술을 활용하여 협업 작업, 정보공유, 이용자의 목록작업 참여 등 - 다중형식자원을 지원 다양한 활동을 제공하고 커뮤니티의 지식을 연결하는 공동지식 포털로 발전해야한다. 더 구체적 - 다른 디지털 도서관 시스템과의 의사소통 가능 으로는 다음과 같은 서비스를 제공한다. - 시맨틱 웹과 커뮤니케이션, 정보 관리 연구에서의 최근 결과를 이용 Blog : 도서관 업무활동, 도서관 최신정보, 도서관 웹사이트, 커뮤니티 1) 응용 프로파일 (Application Profiles)의 분석 Wiki : 도서관 업무활동, 커뮤니티, 도서관 이용지도, 도서관 웹사이트, 도서관 OPAC 서평, 1개 또는 더 많은 네임스페이스로부터 적용하는 사람에 의해서 합쳐지거나 최적화되어지면서 주제정보 서비스, 참고정보 서비스, 교육·연구 지원 활용되는 데이터요소로 구성할 필요가 있다. 이럴 때 사용할 수 있는 다양한 응용 프로파일 Toolbar : 도서관 자원 링크 및 접근 (Application Profiles)이 있다. 이 영역도 최적화라는 측면에서 반드시 고려되어져야 할 것이다 바. 디지털 자산 관리 ● DC-ed: Education Application Profile 시맨틱 DL에서는 디지털 정보자원 뿐만 아니라 메타데이터와 온톨로지, 이용자 프로파일, 업 ● DC-lib 무 명세서 등 문헌정보시스템과 관련된 디지털 자산을 효과적으로 관리하여야 한다. ● DC-gov: DC-GOV Application Profile ● AGLS: Application Profile: agls-ap 2.3 해외 사례: JeromeDL ● DC-collection: The Dublin Core Collection ● Edna:Education Network Australia 가. 개발 배경 서로 다른 이용자들의 서로 다른 요구 (Different Users, different requirements)를 충족시 키자. 도서관 이용자가 요구하는 바가 서로 다르기 때문에 이를 조율할 수 있는 방법이 요구된다. 일반 이용자: 쉬운 이용 전문가(연구자): 학문을 가로지르는 정보의 이용 사서: 유물의 보존 디지털 도서관, 시맨틱 웹, 웹 2.0 의 조화를 통해 서로 다른 이용자의 서로 다른 요구를 충족226 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제5장 국립중앙도서관의 시맨틱 DL 서비스 227
  • 115. 디지털장서 관리 및 연구 개발 제6장 결론 FRBR 기반 프로토타입 정의 및 범위, 설계 및 정제, 인스턴스 구축 등이 향후 서비스 효과와 함 께 정리되어 있다. 그리고 향후 국립중앙도서관이 시맨틱 DL 서비스를 할 때 필요할 시맨틱 DL 구성요소를 항목별로 기술하였고 마지막으로 SDL 기반 국립중앙도서관 서비스를 제안하였다. MARC는 복잡하기도 하지만 서지 정보가 지닌 풍부한 관계를 표현하는 데는 그 한계가 있는 실정이다. 도서목록 등의 메타데이터는 다양한 형태로 전통적으로 도서관에 존재해 오고 있었지 만 표준화 및 상호운용을 통해서, 더 다양한 관계를 맺게 함으로써, 더 주관적으로 의미 있는 묶 음으로 정보를 제공해 주지 못했다. 그리고 지금까지 목록규칙에서 효율적으로 취급하지 못했던 전자 자료나 멀티미디어자료와 같은 자료를 수용할 수 있고 보다 더 인터넷 환경을 적용한 시스 템을 만들어 다양한 이용자들의 요구에 부응하지 못했다. 이에 본 연구에서는 MARC 데이터를 보다 풍부하게 표현할 수 있는 FRBR모델을 활용하여 이 용자들의 정보요구에 부합하는 온톨로지를 구축하였다. 이 온톨로지는 우리 문학 분야의 지식을 컴퓨터가 이해할 수 있도록 명확하게 정의한 공유된 지식체계 속에서 표현한 것이다. 이렇게 웹 정보를 온톨로지로 기술하게 되면, 컴퓨터가 정보의 내용을 이해하고 지능적인 처리를 할 수 있 게 되어 시맨틱웹을 실현할 수 있는 가능성을 여는 것이다. 구체적으로는 표준 메타데이터로서 FRBR모델을 적용했으며, 그 주요 개념 및 적용사례로 OCLC의 fictionfinder를 간단하게 소개하였다. MARC21이 매핑되어 FRBR모델을 통하여 fic- tionfinder라는 온톨로지가 되었듯이, 국립중앙도서관의 문학분야의 일부 KORMARC을 매핑하 여 FRBR 모델로 변환하는 데 성공했다. 기존의 변환 알고리즘을 소개하였고, KORMARC에서 FRBR로의 변환 알고리즘 개발하였고, 국립중앙도서관의 메타데이터 요소를 추출하여 국립중앙 도서관 FRBR기반 서비스를 설계했다. 시맨틱 온톨로지 언어인 RDF/OWL과 Topic Map의 장 단점을 간단히 비교한 후, KORMARC에서 온톨로지 개념을 추출 및 정제하고, 서로간의 상호연 관성 분석 및 관계를 정의하면서 온톨로지 모델링을 완료하였다. 이런 절차로 국립중앙도서관 FRBR 기반 프로토타입을 구현하게 되었으며, 본 연구에는 이228 제3부 표준 메타데이터 모델 및 Semantic Language 연구 개발 제6장 결론 229
  • 116. 「2007 디브러리 총서」 만든 사람들 를 | 총서3. 디지털장서 관리 및 연구 개발 |총 괄 | 최경호 (국립디지털도서관준비기획단 단장) 책임연구원 | 장덕현 (부산대학교 문헌정보학과 교수) / 이수상 (부산대학교 문헌정보학과 교수)실무팀 | 조영주 (국립디지털도서관준비기획단 사서사무관) 오삼균 (성균관대학교 문헌정보학과 교수) 박현주 (국립디지털도서관준비기획단 전문연구관) 연 구 원 | 서태설 (한국과학기술정보연구원 지식전략팀 책임연구원) 박진호 (국립디지털도서관준비기획단 전문연구관) 노지현 (부산대학교 문헌정보학과 교수) / 조용완 (부산대학교 문헌정보학과 강사) 류희경 (국립디지털도서관준비기획단 사서주무관) 보조연구원 | 김정숙 김초롱 변아영 서옥연 최원찬 이순영 위성광 이경화 박수현 (국립디지털도서관준비기획단 사서실무관) 한현진 원시내 조현석 조명대 장인호 이유진 장원홍 자 문 위 원 | 김영기 (경성대학교 문헌정보학과 교수) / 김홍기 (서울대학교 치의학과 교수)지원팀 | 여위숙 (국립중앙도서관 정보화담당관실 정보화담당관) 김수미 (국립중앙도서관 정보화담당관실 전산주무관) | 총서4. 디브러리 이용자 공간 구축 | 박신정 (국립중앙도서관 정보화담당관실 전산주무관) 책임연구원 | 남영준 (중앙대학교 문헌정보학과 교수) / 김성희 (중앙대학교 문헌정보학과 교수) 박일심 (국립중앙도서관 정보화담당관실 사서주무관) 황옥경 (서울여자대학교 문헌정보학과 교수) 홍영아 (국립중앙도서관 정보화담당관실 사서실무관) 연 구 원 | 최철영 (삼성전자(주) 차장) 김정아 (삼성전자(주) 책임) / 민경섭 (삼성전자(주) 책임)추진팀 | 총괄책임 양수형 (삼성전자(주) 솔루션사업그룹장) 김경태 (삼성전자(주) 선임) / 이혜연 (중앙디자인(주) 상무) 총괄PM 복준성 (삼성전자(주) 차장) 박지훈 (중앙디자인(주) 과장) / 정미영 (중앙디자인(주) 주임) 부문PL 김미희 (삼성전자(주) 선임) / 김희석 (오티앤씨(주) 이사) 고범창 (엔터엠 이사) / 성시애 (중앙대학교대학원 기록관리학 석사) 최현정 (유니닥스(주) 차장) 길영은 (서울여자대학교 문헌정보학과 연구원) / 오세훈 (광운대학교 중앙도서관 과장) 지원총괄 임진환 (삼성전자(주) 솔루션영업그룹장) 김규환 (중앙대학교 문헌정보학과 강사) / 박찬훈 (한국건설기술연구원 연구원) 이미영 (중앙대학교 문헌정보학과 강사)| 총서1. 디브러리 포털사이트 모형 개발 | 보조연구원 | 임정길 이준우 김정심 정수진책임연구원 | 조현양 (경기대학교 문헌정보학과 교수) 자 문 위 원 | 이공희 (국민대 건축공학과 교수) / 정찬근 (고양지식정보산업진흥원 원장)연 구 원 | 최재황 (경북대학교 문헌정보학과 교수) 박영호 ((주)오티엔씨 부장) / 이혜영 ((주)오티엔씨 과장) | 총서5. 정보소외계층 서비스 |연구보조원 | 윤세진 장혜정 정의석 최선희 권욱일 서정민 책임연구원 | 남영준 (중앙대학교 문헌정보학과 교수)자 문 위 원 | 박소연 (덕성여자대학교 문헌정보학과 교수) 연 구 원 | 고범창 (엔터엠 이사) / 성시애 (중앙대학교 대학원 기록관리학과 석사) 김경태 (삼성전자(주) 선임) / 김창환 (삼성전자(주) 선임) / 이혜연 (중앙디자인(주) 상무) 박지훈 (중앙디자인(주) 과장) / 정미영 (중앙디자인(주) 주임)| 총서2. 이용자 시나리오 연구 개발 | 정무영 (한국정보문화진흥원 과장) / 김규환 (중앙대학교 문헌정보학과 강사)책임연구원 | 노동조 (상명대학교 문헌정보학과 교수) 박찬훈 (한국건설기술연구원 연구원) / 이미영 (중앙대학교 문헌정보학과 강사)연 구 원 | 박영호 ((주)오티엔씨 부장) / 윤세진 ((주)오티엔씨 과장) 보조연구원 | 김정심 정수진 이혜영 ((주)오티엔씨 과장) / 장혜정 ((주)오티엔씨 대리) 자 문 위 원 | 최두진 (정보문화진흥원 정보격차해소연구센터장)연구보조원 | 정의석 권욱일 서정민 박지훈 김경태 변지수 이영숙 (국립중앙도서관 장애인지원센터 사무관) / 김정호 (엑스비젼테크놀로지 이사)자 문 위 원 | 이지연 (연세대학교 문헌정보학과 교수) 홍경순 (한국정보문화진흥원 팀장) / 이완우 (나사렛대학교 교수)
  • 117. 디브러리 총서 3디지털장서 관리 및 연구 개발2007년 12월 22일 인쇄2007년 12월 31일 발행발행처 국립중앙도서관 국립디지털도서관준비기획단주소 서울시 서초구 반포로 664전화 02 590 0747전송 02 590 0571제작·편집 페덱스킨코스코리아ISBN 978-89-7383-235-4 94020 978-89-7383-232-3(세트) <비매품>