도서관 분야의 링크드 데이터 구축 동향
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

도서관 분야의 링크드 데이터 구축 동향

on

  • 749 views

KISTI, ICON 지식리포트 제40호

KISTI, ICON 지식리포트 제40호

Statistics

Views

Total Views
749
Views on SlideShare
749
Embed Views
0

Actions

Likes
0
Downloads
19
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

도서관 분야의 링크드 데이터 구축 동향 Document Transcript

  • 1. 3 KISTI 지식리포트 제40호 ❚ 목 차 ❚ 1. 서론 ········································································································ 1 1) 시맨틱 웹과 링크드 데이터 ··························································· 1 2) 링크드 데이터의 원칙 ···································································· 2 2. 도서관 링크드 데이터 ··········································································· 3 1) 도서관 링크드 데이터의 특징 ························································· 3 2) 도서관 링크드 데이터 활동 ····························································· 4 3. 도서관 링크드 데이터 사례 ·································································· 8 1) 영국 국립도서관 ·············································································· 8 2) 독일 국립도서관 ············································································· 10 3) 프랑스 국립도서관 ········································································· 11 4) OCLC(Online Computer Library Center) ···································· 13 5) LC Bibliographic Framework ······················································· 17 4. 도서관 링크드 데이터 구축의 필요성 ················································ 20 1) 데이터 중심의 웹 생태계 ······························································ 20 2) 링크드 데이터의 실용성 ································································ 22 3) 링크드 데이터를 통한 접근성 향상 ·············································· 26 5. 결론 및 제언 ······················································································· 29 참고문헌 ··································································································· 31
  • 2. 도서관 분야의 링크드 데이터 구축 동향 ❚ 표 목 차 ❚ <표 1> 링크드 데이터의 혜택 ································································ 6 <표 2> 전통적 도서관 데이터의 문제 ····················································· 7 <표 3> LLD 실현을 위한 권고사항 ························································· 7 <표 4> OCLC 링크드 데이터 자원 ························································ 14 <표 5> 도메인별 링크드 데이터 현황 ···················································· 21
  • 3. KISTI 지식리포트 제40호 ❚ 그 림 목 차 ❚ <그림 1> 영국 국립도서관 단행본 링크드 데이터 모델 ························· 9 <그림 2> 영국 국립도서관 연속간행물 링크드 데이터 모델 ················· 9 <그림 3> 프랑스 국립도서관 RDF 데이터 모델 ··································· 13 <그림 4> WorldCat과 Schema.org를 활용한 WorldCat.org 서비스 효과 ····· 15 <그림 5> WorldCat.org 서지정보 검색결과 ·········································· 15 <그림 6> OCLC 데이터셋 스키마 ·························································· 16 <그림 7> BIBFRAME Work-Instance 중심 링크드 데이터 모델 ·········· 18 <그림 8> BIBFRAME Work-Instance-Annotation 링크드 데이터 모델 ··· 19 <그림 9> BIBFRAME의 텍스트, 비텍스트형 자원에 대한 개념 모형 ····· 19 <그림 10> 링크드 데이터 현황(2011년 9월 19일 현재) ························ 20 <그림 11> LOV Aggregator 화면 ·························································· 23 <그림 12> LOV Suggest 화면 ································································ 24 <그림 13> LOV Search 화면 ·································································· 24 <그림 14> Clean Energy Linked Open Data Cloud ···························· 25 <그림 15> OECD Odata API 예제 - 메타데이터 조회 ························ 27 <그림 16> 링크드 데이터 기반 BBC Music The Beatles 서비스 ········· 28 <그림 17> BBC News Juicer 서비스 ····················································· 28
  • 4. KISTI 지식리포트 제40호 1 1. 서론 1) 시맨틱 웹과 링크드 데이터 □ Web 2.0 이 후로 웹을 플랫폼으로 거의 모든 정보활동이 일어남. - 정보는 웹에서 탄생하고, 풍부해지고, 재창조되고, 공유되고, 확산되고, 소멸됨(박진호, 2013a). - 사람들은 매일 웹에서 수많은 데이터를 활용하지만 이 데이터를 웹의 일부분으로 보기는 힘듦. 현재의 데이터들은 애플리케이션에 의해서 통 제되는 것으로 각각의 애플리케이션이 이 데이터를 스스로 유지하고 있 음(W3Ca, n.d.). □ 본래 웹은 사람뿐만 아니라 기계간에도 소통이 가능한 정보공간으로 설계 되었으나 현재 웹은 잘 정의된 데이터베이스로부터 정보를 추출함에도 불 구하고 웹 로봇 등 기계 보다는 사람에게만 유용한 구조를 갖고 있음. - 시맨틱 웹(Semantic Web)은 기계 처리가 가능한 형태로 정보를 표현하 기 위한 언어를 개발하는 접근법임(Tim Berners-Lee, 1998). - 시맨틱 웹은 웹문서의 교환에 집중되어 다양한 출처(source)에서 가져온 데이터를 통합, 조합할 수 있는 공통의 형식을 만드는 것에 관한 것이며, 또한 데이터가 실세계의 개체를 어떻게 표현할 것인지에 관한 것을 기 록하기 위한 언어임(W3Ca, n.d.). ☐ 시맨틱 웹은 현재의 문서 중심의 웹(Web of Document)에 데이터가 중심 이 되는 새로운 계층(Web of Data)을 만드는 것이고, 링크드 데이터 (Linked Data)는 시맨틱 웹을 구현하기 위한 방법으로 역참조할 수 있는 (deRefernceable) URI(Uniform Resource Identifier)를 활용해서 웹상에 데 이터를 공개, 공유 연결하는 방법임. - Berners-Lee(2007)는 현재 웹의 단계는 연결의 웹(Web of Links)으로 일반적으로 네트워크라는 말 대신 “웹”이라는 용어를 대표적으로 사용하 고 있으며, 이를 문서의 웹(Web of Documents)으로 칭함. - 궁극적으로 우리가 원하는 것은 모든 것(All Things)들이 웹에서 공유되 는 것으로 보다 직접으로 데이터(전통적인 데이터베이스 콘텐츠와 같은)
  • 5. 도서관 분야의 링크드 데이터 구축 동향 2 를 웹에 확장해야 하고, 사람 혹은 분명한 실체를 갖고 있는 것과 추상 적인 것, 장소 등과 연결 관계를 만들어야 함. - 거시적인 관점에서 이러한 연결을 데이터 웹(Web of data)라고 부를 수 있으며 이것이 링크드 데이터의 기초를 형성할 수 있음. 2) 링크드 데이터의 원칙 ☐ Berners-Lee(2011)는 시맨틱 웹은 웹에 데이터를 올리는 것만을 의미하지 는 않으며, 링크를 만듦으로써 사람과 기계가 데이터 웹을 탐색할 수 있도 록 하는 것으로 정의함. - 여기서 링크는 현재 문서 웹의 하이퍼텍스트와 다르게 RDF(Resource Description Framework)로 기술된 모든 것(things)들 사이의 연결을 의 미하며, URI는 객체나 개념을 식별하는데 활용됨. ☐ 링크드 데이터 발행을 위한 원칙은 다음과 같음. - 특정 개념(things)을 URI를 사용하여 명명함. - HTTP를 활용해서 URI로 명명된 자원에 접근할 수 있도록 함. - URI로 정보를 찾았을 때 RDF(S), SPARQL과 같은 표준을 활용해서 유 용한 정보를 제공해야 함. - 또 다른 URI를 포함하고 있어서 더 많은 것(개념, things)들을 탐색할 수 있어야 함.
  • 6. KISTI 지식리포트 제40호 3 2. 도서관 링크드 데이터 1) 도서관 링크드 데이터의 특징 ☐ 도서관 링크드 데이터는 전통적으로 도서관이 관리하고 있는 데이터를 변 환하는 것을 기본으로 하며 이 범주에 속하는 데이터는 크게 서지 데이터 와 전거 데이터가 있음. - 서지 데이터(bibliographic data) : 서명, 저자, 날짜 등 - 전거 데이터(authority data) : 분류, 주제명, 저자명, 시소러스, 텍소노미 등 ☐ 현재 기존의 도서관에서 관리하는 데이터를 링크드 데이터로 변환하여 발 행하는 사례와 데이터 범주는 다음과 같음. - 영국국립도서관(서지, http://bnb.data.bl.uk/) - 스웨덴 종합목록(서지/전거, http://data.libris.kb.se/) - 독일국립도서관(서지/전거) - 네이처(서지, http://data.- nature.com/) - VIAF(전거, http://viaf.org/viaf/data/) - 미국의회도서관(전거, http://id.loc.gov/) - Lobid(서지/단체/조직, http://lobid.org/) - 유로피아나(전거, http://data.europeana.eu/) ☐ 보통 도서관에서 전거데이터는 주제명, 저자명(개인, 단체명)을 칭하지만 실 제로 국립도서관의 경우 별도로 관리하고 있는 다양한 통제 어휘들이 존재 하며 이의 링크드 데이터 변환과 발행도 중요함. - 국립중앙도서관의 경우 도서관 부호, 정부기관 부호, 국가 부호, 발행국 부호, 한국대학 부호, 외국지역구분 부호, 한국지역구분 부호, 언어구분 부호 등 다양한 통제어휘집이 존재함. - 이러한 부호표는 외부 공개 시 다양한 분야에서 활용이 가능한 데이터임. ☐ Voß(2012)은 도서관이 가지고 있는 데이터에 대한 시각적 확대가 필요함을 언급함. - 비서지형 데이터 중 열람시간, 접근정보 등의 부가적인 정보도 중요함.
  • 7. 도서관 분야의 링크드 데이터 구축 동향 4 - 특히 고객정보(Patron Information)와 관련된 데이터는 좀 더 주의 깊게 살펴볼 필요가 있음. ∙개인 데이터 : 이름, 이메일 주소 등 ∙계정 데이터 : 계정상태, 유형, 기한 등 도서관 서비스 관련 데이터 ∙대출, 예약 데이터 - 도서관 이용자는 특정 저작물(FRBR1)의 Work)이나 개별 자료(FRBR의 Item)에 관심이 있을 것이라는 전제 하에 고객정보와 문헌정보를 연결시 켜 또 다른 부가 서비스를 창출할 수 있음. ∙Voß은 PAIA(Patron Account Information API)2)와 온톨로지를 구성 하여 공개하고 있음. 2) 도서관 링크드 데이터 활동 ☐ 도서관 링크드 데이터(Library Linked Data, 이하 LLD) 관련 활동은 기존 도서관 데이터를 링크드 데이터 원칙에 맞추어 발행하는 것과 근본적으로 도서관 서지 데이터를 다른 관점에서 바라보고 변화시키려는 2가지로 구분 할 수 있음. - 전자의 경우는 전통적으로 서지목록 작성, 표준화와 관련된 역할을 담당 하는 국립도서관 등의 서지, 통제어휘 관리기관과 국제적인 서지목록 공 유 프레임워크인 OCLC가 대표적임. ※ OCLC는 서지정보에 대한 링크드 데이터 프로젝트를 위해 Schema.org를 활 용하고 있음. 이는 웹 환경에서 검색엔진(서비스)들이 보다 잘 서지 정보를 검 색하고 결과를 이용자에게 보여주기 위한 노력의 일환으로 링크드 데이터 원 칙에 맞춘 프로젝트로 보기는 어려워 별도로 기술함. - 후자의 경우는 미국 의회도서관을 중심으로 연구가 진행 중인 Bibliographic Framework가 대표적임. ☐ W3C Library Linked Data Incubator Group은 2010년 5월에서 8월까지 활 동한 그룹으로 웹 환경에서 도서관 데이터가 글로벌 상호운용성 증진을 위 한 역할을 하기 위한 연구를 진행하고 있음. 1) FRBR(Functional Requirements for Bibliographic Records)은 서지레코드의 기능상의 요건을 의미함. 2) http://gbv.github.io/paia/paia.html
  • 8. KISTI 지식리포트 제40호 5 ☐ LLD와 관련된 실제적인 지침과 방향을 제시하고자 W3C Library Linked Data Incubator Group은 2011년 10월 25일에 LLD 최종보고서3)를 발행하 였음. - 이 최종보고서에서 도서관(Library)은 도서관, 박물관, 기록관 등 모든 문화유산 기관을 포함하는 용어임. - 최종보고서에서는 링크드 데이터가 줄 수 있는 혜택, 링크드 데이터 발 행을 위해 현재 도서관이 가지고 있는 문제와 향후 LLD의 발전을 위해 관련된 자(기구 포함)들에 대한 권고사항을 기술하고 있으며 실제 지침 으로 활용할 수 있도록 구성됨(박진호, 2013b). - LLD 최종보고서는 도서관 데이터가 가지고 있는 문제는 웹의 다른 자 원과 통합이 어려움, 도서관에서만 적용 가능한 표준의 활용, 대부분의 정보가 보여주기 위한 텍스트 중심인 점, 시맨틱 웹 커뮤니티와 유사 개 념에 대한 상이한 용어의 사용, 소수의 기술 공급자에 따른 의존적인 발 전이라고 지적하고 있음. - 마지막으로 최종보고서에서는 도서관 데이터의 개방은 데이터 웹을 사 용함으로써 도서관의 데이터 포용력을 높이는 활동이며, 도서관 데이터 는 웹에 존재하는 다른 자원과 통합이 되어야 도서관 서비스에 대한 인 식이 높아질 수 있을 지적하며 <표 3>과 같은 권고사항을 제시함. ☐ LLD 최종보고서에서 사용하고 있는 LLD와 관련된 자원의 표현은 다음과 같음. - 데이터셋(Datasets) : 영국 국가서지, 헝가리 국립도서관 목록, Open Library, CrossRef, Europeana 등 - 값 어휘집(Value Vocabularies) : 미국국회주제명표목, AGROVOC4), VIAF (Virtual International Authority File), DDC(Dewey Decimal Classification System), GeoNames 등 - 메타데이터 요소셋(Metadata Element Sets) : DCMI(Dublin Core Metadata Initiative) 메타데이터 용어, RDA의 구성요소, SKOS(Simple Knowledge Organization System), FOAF(Friend of A Friend) 어휘 등 3) http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/ 4) AGROVOC은 Agriculture, Forestry, Fisheries, Food security(농업, 산림, 어업, 식량 보존)의 약자로 농업, 산림, 어업, 식량 보존과 그에 연결된 분야 (예를 들면 지속 가능한 발전과 영양) 안 에서 모든 주제와 관련된 다중 언어로 서비스되는 사전임.
  • 9. 6 도서관 분야의 링크드 데이터 구축 동향 ☐ 개방형 링크드 데이터는 공유, 확장, 재사용 측면에서 기존의 데이터 접근 방식보다 많은 장점을 가지고 있으며, 국립도서관과 같이 신뢰할 수 있는 정 보원으로부터 생산된 데이터들의 연결이 데이터의 가치를 높여줄 수 있음. - 특히, 도서관의 저자명, 주제명 전거데이터는 연결 데이터 사이에 공유 되는 핵심 개체를 명확하게 식별해 주기 때문에 데이터 중복을 줄여줄 수 있음. <표 1> 링크드 데이터의 혜택 활용 주체 활용 혜택 ∙ 도서관과 외부 기관과의 정보자원 연결로 보다 풍부한 탐색이 가능함. 정보 접근자 (연구자, 학생, 이용자) ∙ 도서관의 정보를 통해 웹 상의 다른 정보로 연결될 수 있음. ∙ 웹에 구조화된 데이터가 추가되기 때문에 검색엔진 최적화(SEO) 를 통해 향상된 검색 결과 제공이 가능함. ∙ 다양한 분야의 지식베이스에 연결이 가능하여 학제 간 연구에 도움을 줄 수 있음. ∙ 상향식 데이터 발행으로 자관의 정보자산을 기술하는 일의 가치 를 높일 수 있음. ∙ 예산 문제로 상세한 수준의 데이터 기술이 부족한 문제를 극복 할 수 있음. ∙ 도서관이 관리시스템 등 주류 솔루션을 벗어나 데이터 연결이 정보관리 조직 (도서관 등) 가능한 다수의 시스템 선택이 가능하고, 표준 연결데이터 활용으 로 보다 다양한 개발자 그룹과 소통이 가능함. ∙ 클라우드 기반의 데이터 활용 접근을 위한 출발점이 될 수 있으 며, 독립형 시스템에 비해 비용대비 효과가 큼. ∙ 규모가 작은 기관, 개인들이 적은 비용으로 가시적인 데이터 연 결 효과를 볼 수 있음. 즉 공개된 데이터를 활용하여 누군가 가 치 있는 성과를 낼 수 있는 기회를 제공해 줌. ∙ 글로벌 공유 데이터를 통해 편목에서의 중복 노력을 줄이고, 자 정보활동 주체 (사서, 기록담당자 등) 원 기술의 효율성, 재활용성을 증가시킴. ∙ 타 지식분야의 잘 정리된 기술내용을 활용할 수 있어 사서는 본 인의 전문분야에 대한 기술노력에 집중할 수 있음. ∙ 구문, 형식이 아니라 데이터의 의미를 기술하는 것으로 향후 지 속가능한 체계로 데이터 관리가 가능함. ∙ 도서관에 특화된 데이터에 집중할 필요 없이, HTTP와 같은 웹 프로토콜을 활용함으로써 일관된 방식의 데이터 검색과 결합이 관련 개발자(사) 가능함. ∙ 링크드 데이터 방식으로 도서관 분야를 벗어나 새로운 시장에 활용할 수 있으며, RDF, HTTP를 활용함으로써 특정 소프트웨 어 활용의 부담에서 벗어날 수 있음.
  • 10. 7 KISTI 지식리포트 제40호 <표 2> 전통적 도서관 데이터의 문제 도서관 데이터의 문제점 ∙ 도서관 데이터는 웹 인터페이스에서 접근 가능하지만 날짜, 지리 웹 자원과 통합의 어려움 도서관 분야에서만 활용되는 표준 정보, 사람, 조직 등 수많은 데이터 접점들과의 연결에는 어려움 이 있음. ∙ MARC, Z39.50 등은 도서관 분야에서만 통용되며 주로 이러한 표준들은 국제도서관협회 등의 기관에 의해서 추진됨. ∙ 도서관 데이터는 텍스트 형태로 표현됨. 도서관 데이터는 자연어 (natural-language) 텍스트로 표현됨. ∙ ISBN과 같은 식별자는 연결을 위해 사용이 가능하지만 텍스트 값을 정규화 하는 과정이 필요함. ∙ 통제어휘를 활용하고 있으나 이는 부분적이며, 웹에 연결될 수 있는 URI 표현이 부족함. 도서관계와 시맨틱 웹 커뮤니티 간 상이한 용어 표현 ∙ 서로 상이한 용어를 사용하여 통합의 과정을 어렵게 할 수 있음. ∙ 도서관에서는 “statements”, 시맨틱 웹에서는 “headings”, “authority control” 등의 용어를 이해하기 어려움. 소수의 기술 공급자에 의존적 ∙ 도서관 자동화, 이용자 서비스 등의 시스템과 소프트웨어는 소수 의 공급자 중심이며, 링크드 데이터 도입의 경우 도서관의 자체 계획보다 업체의 기술개발 계획에 의존해야 하는 경우가 발생함. <표 3> LLD 실현을 위한 권고사항 주체 도서관 관리그룹(leadership) 표준화기구 및 참여자 (standards bodies and 권고내용 ∙ 조기에 링크드 데이터로 발행할 수 있는 데이터셋 확인 ∙ 개방형 데이터에 대한 토론 장려 ∙ 시맨틱 웹 표준화 부분에 도서관의 참여 확대 ∙ 링크드 데이터에 부합하는 도서관 데이터 표준 개발 participants) ∙ LLD에 적합한 최고의 설계(best practice design) 개발 및 보급 데이터, 시스템 설계자 (data and systems ∙ 링크드 데이터에 기반한 이용자 서비스 개발과 테스트 ∙ 도서관 데이터셋에 포함되는 개별자료(items)에 대한 URI 생성 ∙ 링크드 데이터 어휘집과 그 URI를 관리하기 위한 정책 개발 designers) 사서와 기록관 ∙ 기존 링크드 데이터 어휘집과 매핑 혹은 재활용하여 도서관 데이 터 표현 ∙ 링크드 데이터 요소 셋(element sets)과 값 어휘집(value vocabularies) 보존 (librarians and archivists) ∙ 장기보존과 큐레이션에 있어서 도서관의 경험을 LD 데이터셋에 적용
  • 11. 도서관 분야의 링크드 데이터 구축 동향 8 3. 도서관 링크드 데이터 사례 ☐ 본 장에서는 LLD의 대표적인 3가지 유형의 사례를 살펴보고자 함. - 자관이 소장하고 있는 데이터를 링크드 데이터 원칙에 맞추어 발행하고 있는 대표적인 사례로 영국 국립도서관, 독일 국립도서관, 프랑스 국립 도서관의 사례를 살펴봄. - 데이터 웹에서 명확한 접근점과 기준점을 제시해 줄 수 있는 값 어휘집 을 제공하고 있는 대표 사례인 OCLC를 살펴봄. - 링크드 데이터를 넘어 서지 정보자원을 데이터 웹에 어떻게 표현하는가에 관한 개념적인 접근을 시도하고 있는 LC Bibliographic Framework 사례 를 살펴봄. ☐ 본 장에서 소개하는 링크드 데이터 서비스 사례는 기존에 도서관에서 수행 하지 않았던 새로운 서비스가 아닌 디지털서비스의 일종임. 1) 영국 국립도서관 ☐ 자관 서지 정보를 링크드 오픈 데이터 형태로 개방하고 있으며, 현재 단행 형태의 도서자료와 연속간행물에 대한 데이터 서비스를 수행하고 있음. - Free Data Services라는 명칭으로 서비스 중임. - 접근 URL : http://www.bl.uk/bibliographic/datafree.html - 스키마 정보 URL : http://www.bl.uk/schemas/ - 전체 파일 다운로드(Bulk downloads, RDF/XML과 N-Triples) URL : http://www.bl.uk/bibliographic/download.html
  • 12. KISTI 지식리포트 제40호 <그림 1> 영국 국립도서관 단행본 링크드 데이터 모델 <그림 2> 영국 국립도서관 연속간행물 링크드 데이터 모델 9
  • 13. 도서관 분야의 링크드 데이터 구축 동향 10 ☐ 현재 약 280만 건의 원천 레코드를 대상으로 총 93,583,853건의 트리플을 제 공하고 있으며, 기존에는 데이터 활용을 위한 세 가지의 접점 서비스를 제공 하였으나 현재는 데이터서비스를 위한 단일 웹사이트(http://bnb.data.bl.uk/) 로 통합되었음. ☐ 영국 국립도서관에서 링크드 데이터 기술을 위해 활용하고 있는 어휘집은 다음과 같음. - Bibliographic Ontology, Bio, British Library Terms, Dublin Core, Event Ontology, FOAF, ISBD, Org, OWL, SKOS, RDF Schema, WGS84 Geo Positioning, RDA ☐ 영국 국립도서관 링크드 데이터 자원과 연결된 외부 링크드 데이터셋은 다 음과 같음. - VIAF, LCSH, Lexvo, GeoNames(출판국 표현), MARC(국가/언어코드), Dewey.info, RDF Book Mashup ☐ 영국 국립도서관 사례에서의 시사점은 다음과 같음. - 현재 영국 국립도서관에서는 데이터 서비스를 위한 별도의 사이트를 운 영하고 있는데, 링크드 데이터는 이러한 데이터 서비스의 일부로 자유롭 게 활용이 가능한 데이터 서비스로 분류되어 서비스 되고 있음. - 영국 국립도서관의 데이터서비스 사이트(http://bnb.data.bl.uk/)에서 메타 데이터 서비스 메뉴의 Free Data 메뉴를 통해 이용이 가능함. - 단행본, 연속간행물 등 전통적인 도서관의 관리 대상 객체를 하나의 도 메인으로 보고 모델링하였음. 2) 독일 국립도서관 ☐ 독일 국립도서관의 링크드 데이터 프로젝트는 2010년 전거데이터의 변환을 시작으로 2012년 서지데이터에 대한 링크드 데이터화로 이어짐. - 접근 URL : http://www.dnb.de/EN/lds - 전체 파일 다운로드(Dumps) URL : http://datendienst.dnb.de/cgi-bin/mabit.pl?userID=opendata&pass=opend ata&cmd=login
  • 14. KISTI 지식리포트 제40호 11 ☐ 전거데이터(GND, Gemeinsame Normdatei)는 기존에 존재하던 PND, 주제 명(SWD), 종합 전거(GKD), 독일음악 기록물 표목전거를 통합한 형태로 독 일어 정보자원에 대한 접근성을 향상시켜 독일어권 국가의 다양한 기관에 서 활용할 수 있도록 함. ☐ 서지데이터에 대한 링크드 데이터화는 악보, 핵심 장서, 연속간행물 목록 정보, 일반 저널, 신문, 연속간행물 모두를 포함하고 있으며, 링크드 데이터 로 변환하기 위한 모델링 작업과 변환에 적합한 데이터 선정을 위해 독일 어권 국가 도서관 특별위원회를 운영하고 있음. ☐ 독일 국립도서관에서 링크드 데이터 기술을 위해 활용하고 있는 어휘집은 다음과 같음. - Dublin Core terms, Dublin Core elements, Bibliographic Ontology, RDA, ISBD, RDF Schema, Upper Mapping and Binding Exchange Layer (Umbel), FOAF, Schema.org ☐ 독일 국립도서관의 링크드 데이터 자원과 연결된 외부 링크드 데이터셋은 다음과 같음. - MARC-Code, Dewey.info, 내부 서지정보 링크(http://d-nb.info) ☐ 독일 국립도서관 사례에서의 시사점은 다음과 같음. - 독일 국립도서관은 현재 링크드 데이터 변환 서비스 외에 미국 의회도 서관 중심의 LC Bibliographic Framework 프로젝트에 참여하고 있으며, 향후 새로운 데이터 모델링과 어휘집을 활용한 링크드 데이터 서비스를 기대할 수 있음. - 현재 데이터에 대한 발행서비스와 더불어 미래지향적인 서지 목록에 대 한 연구를 동시에 진행하고 있음. 3) 프랑스 국립도서관 ☐ 프랑스 국립도서관은 소장 주요 목록은 물론 디지털도서관 서비스인 갈리 카(Gallica)를 포함한 링크드 데이터 서비스를 제공하고 있음.
  • 15. 도서관 분야의 링크드 데이터 구축 동향 12 - 접근 URL : http://data.bnf.fr/ - 전체 파일 다운로드(Dumps) URL : http://echanges.bnf.fr/PIVOT/databnf_all_rdf_xml_2013_09_25.tar.gz?use r=databnf&password=databnf ☐ 프랑스 국립도서관에서 링크드 데이터 기술을 위해 활용하고 있는 어휘집 은 다음과 같음. - RDF, RDF Schema, SKOS, DC, FOAF, RDA Group2, RDA Relationships, RDA Group1, OWL, ORE ☐ 프랑스 국립도서관의 링크드 데이터 자원과 연결된 외부 링크드 데이터셋 은 다음과 같음. - LCSH(id.loc.gov), Dewey.info, DCMI type, DBpedia, VIAF, IdRef, Wikipedia - 프랑스 국립도서관 링크드 데이터는 FRBR 모형을 기본 모델링에 반영 하고 있음. ☐ 프랑스 국립도서관 사례에서의 시사점은 다음과 같음. - 데이터 모델링에 FRBR 개념을 반영하고 있어 보다 서비스 지향적인 접 근 방식을 취하고 있음. - 향후 LC Bibliographic Framework 접근에 있어 타 도서관보다 유연하 게 대처 가능한 구조를 가지고 있음.
  • 16. 13 KISTI 지식리포트 제40호 <그림 3> 프랑스 국립도서관 RDF 데이터 모델 4) OCLC(Online Computer Library Center) ☐ OCLC는 1967년 설립되어 전 세계 171개국 및 지역의 72,000개 도서관과 연계되어 목록, 참고자원, 전자자원 통합검색과 도서관 자원 공유 및 보존, 웹 서비스 활동을 수행하는 비영리 기구임. ☐ OCLC가 링크드 데이터로 개발하여 운영하고 있는 데이터 자원으로는 DDC, FAST(Faceted Application of Subject Terminology), VIAF가 있음.
  • 17. 14 도서관 분야의 링크드 데이터 구축 동향 <표 4> OCLC 링크드 데이터 자원 링크드 데이터 유형 VIAF (Virtual International Authority File) DDC (Dewey Decimal Classification) FAST (Facet Application of Subject) 링크드 데이터 특징 ∙ URL : http://viaf.org ∙ 제공형태 : HTML, RDF/XML ∙ URL : http://dewey.info ∙ 제공형태 : HTML/RDFa, RDF/XML, Turtle, JSON-SPARQL ∙ URL : id.worldcat.org/fast ∙ 제공형태 : HTML, RDF/XML - Download ☐ OCLC는 2012년 6월부터 WorldCat.org 레코드에 Schema.org 태그를 추가 하여 도서관 자원에 대한 검색엔진의 접근성을 향상시킴. - 동년 8월에는 WorldCat에서 활용 가능한 약 8천만건의 서지 링크드 데 이터 트리플을 발행하였으며, 전체 데이터셋을 다운로드5) 할 수 있도록 하고 있음. ☐ WorldCat 링크드 데이터 서비스 - WorldCat은 Schema.org의 용어집을 활용하여 서지 정보에 대한 구조화 된 데이터를 제공함. - 이는 웹 검색엔진(서비스)에서 WorldCat 서지 정보에 대한 접근성을 강 화하는 효과를 갖는데, 이는 서지 정보 기술을 위한 OCLC의 1세대 링 크드 데이터 모델임. - OCLC는 사서의 관점에서 Schema.org의 단점을 해결하기 위해 “도서 관”, “소장”이라는 객체를 설명하기 위한 어휘를 확장하고, 콘텐츠와 캐 리어(carrier)를 분리하는 시도를 함. - W3C Community and Business Groups 내에 “Schema Bib Extend Community Group”은 Schema.org를 확장하여 서지 정보를 구조화하고 공유하기 위한 보다 향상된 방법을 찾고자 하는 시도임6). - 근본적으로 OCLC의 데이터셋은 FRBR 개념에 기초하고 있으며, 이는 미국 의회도서관의 LC Bibliographic Framework 프로젝트와 유사한 개 념적 접근을 가짐. 5) http://purl.oclc.org/dataset/WorldCat/datadumps/WorldCatMostHighlyHeld-2012-05-15.nt.gz 6) http://www.w3.org/community/schemabibex/
  • 18. 15 KISTI 지식리포트 제40호 <그림 4> WorldCat과 Schema.org를 활용한 WorldCat.org 서비스 효과 <그림 5> WorldCat.org 서지정보 검색결과
  • 19. 도서관 분야의 링크드 데이터 구축 동향 16 <그림 6> OCLC 데이터셋 스키마 ☐ OCLC 사례에서의 시사점은 다음과 같음. - 값 어휘집(Value Vocabularies)에 속하는 VIAF, DDC, FAST 데이터를 제공하고 있는데, 이를 통해 다양한 데이터셋들이 상호 연결될 수 있는 연결점 역할이 가능하며 기존의 도서관 데이터셋(저자, 주제 등)들의 활 용성을 극대화 시킬 수 있음. - Schema.org 어휘집을 활용하여 웹에서 OCLC 데이터에 대한 검색 최적 화를 도모하고 있으며, 이점은 일반적인 도서관에서의 링크드 데이터 발 행이 자관 데이터를 RDF 파일로 출판하고 공유하는 형식인 것을 감안 할 때 차별화 된 방식임. - 단순히 링크드 데이터로 변환하여 소장 정보를 발행하는 것 외에 분명 한 목적을 가지고 링크드 데이터를 발행할 수 있는 용어집과 발행 방법 (RDFa)을 선택한 점에서 시사점이 있음.
  • 20. KISTI 지식리포트 제40호 17 5) LC Bibliographic Framework ☐ 미국 의회도서관은 2011년 5월에 서지 프레임워크 이니셔티브를 발표하고 장기적인 관점에서 “네트워크”라는 개념을 중심에 두고, 서지 정보들이 끊 임없이 상호 연결되어 있는 새로운 서지 환경을 구축하고자 함. ☐ LC Bibliographic Framework(이하 BIBFRAME)은 어떤 형태의 내용 표준 이나 콘텐츠 표준(예, RDA)도 수용할 수 있도록 구성되어야 하지만 역시 도서관 간에 데이터 교환이 가능한 모델을 지향함. ☐ BIBFRAME(현재 초안)의 목적은 미래의 정보자원과 MARC21로 인코딩 된 전통적인 서지데이터를 모델링 할 수 있는 패턴을 제공하는 것임. - 이 패턴은 웹을 기본적인 틀로 활용하여 기존 서지정보의 통합을 가능 하게 하고, 링크드 데이터 등을 통해 기존 데이터에 대한 정제 및 재개 발과 같은 대안적인 접근이 가능하도록 함. - MARC21은 도서관 간의 데이터 교환을 위해 개발된 가장 최근의 데이 터 포맷임. - MARC21 형식을 링크드 데이터 모델로 반영함으로써 데이터의 유용성 이 높아질 수 있고, 데이터 활용 범위가 도서관의 영역에서 문화유산 기 관으로 확장될 수 있음. ☐ BIBFRAME을 연구 활동, 기술개발 등의 관점으로 보는 것도 중요하지만 기존의 서지데이터가 갖는 역사적 맥락을 수용하여 새로운 환경(웹)에서의 정보 및 데이터 생태계를 구축하기 위한 노력으로 이해해야 함. ☐ BIBFRAME은 다음과 같은 점을 고려하여 설계되었음. - 미래의 목록 정보, 새로운 이용자 시나리오와 다양한 정보출처 등에 대 응하기 위한 유연성 확보 - 분산된 정보들을 연결하고 표현하기 위한 아키텍처 모델로서의 웹 - 도서관 외부의 사회적, 기술적 변화에 대한 도입 - 도서관 커뮤니티 내부의 사회적, 기술적 확장 - 링크드 데이터로 서지 정보를 표현하기 위한 이전의 시도 - 기계적인 작업을 위한 기술 도입과 주제 전문가로서 사서의 역량 수용
  • 21. 도서관 분야의 링크드 데이터 구축 동향 18 - 도서관, 출판계, 기록관, 박물관 커뮤니티에서의 서지 정보를 모델링하기 위한 이전의 노력 - MARC의 다음과 같은 특징을 고려하여 설계함. ∙저작물의 지식적 본질과 관련된 데이터의 생성, 관리, 공유, 보존 ∙저작물의 실제 인스턴스와 관련된 데이터의 생성, 관리, 공유, 보존 ∙제어번호, 레코드 제어코드와 같은 메타데이터의 생성, 관리, 공유, 보존 ☐ BIBFRAME의 핵심 클래스는 다음과 같음. - Creative Work : 목록화 된 자료의 개념적 본질을 반영하고 있는 자원 - Instance : 저작물을 구현한 개별 자료 등을 반영하고 있는 자원 - Authority : 사람, 장소, 주제, 조직 등을 포함한 전거 자원으로 저작물이 나 인스턴스에 반영되어 관계를 정의하고 있는 개념 자원 - Annotation : BIBFRAME의 다른 자원을 표현할 수 있는 추가적인 자원 으로 도서관의 소장정보나 표제 그림, 논평 등의 자원 <그림 7> BIBFRAME Work-Instance 중심 링크드 데이터 모델
  • 22. KISTI 지식리포트 제40호 19 <그림 8> BIBFRAME Work-Instance-Annotation 링크드 데이터 모델 ☐ BIBFRAME의 구성은 FRBR의 저작(work)과 구현(manifestation) 관계를 중심으로 FRBR2, 3 모델을 접목한 형태를 가짐. <그림 9> BIBFRAME의 텍스트, 비텍스트형 자원에 대한 개념 모형
  • 23. 도서관 분야의 링크드 데이터 구축 동향 20 4. 도서관 링크드 데이터 구축의 필요성 1) 데이터 중심의 웹 생태계 ☐ “연결”의 관점에서 현재 웹의 중심은 “Web of Documents”, 즉 HTML 구 문(syntax)이 중심이 되는 문서 간 연결로 이루어진 생태계이며, 링크드 데 이터는 “Web of data” 즉 XML, RDF/OWL을 활용하여 의미(semantic)가 중심이 될 수 있도록 웹에 표현된 다양한 객체/개념을 연결하여 데이터 간 의 연결이 중심이 되는 새로운 생태계임. - 링크드 데이터는 결국 웹에 새로운 데이터 중심 계층을 형성하게 되고 웹은 그 자체로 글로벌 데이터베이스 역할을 수행함. ☐ <그림 10>은 2011년 9월 19일 현재 링크드 데이터 현황을 나타냄. - 데이터셋 현황과 데이터셋 간의 연결 관계를 보여줌. - 각 노드는 링크드 데이터 형태로 발행된 각각의 데이터셋을 나타냄. - 연결선(화살표)은 RDF 링크로 두 개의 연결된 데이터셋에 포함된 개별 항목(items)들의 관계를 표현함. <그림 10> 링크드 데이터 현황(2011년 9월 19일 현재)
  • 24. 21 KISTI 지식리포트 제40호 ☐ <표 5>는 2011년 9월 19일 현재 링크드 데이터 클라우드에 포함된 데이터 들의 도메인별 현황을 보여줌. - 가장 많은 데이터셋을 포함하고 있는 도메인은 출판이며, 정부 도메인에 속하는 데이터가 두 번째 비중을 차지함. - 반면, 정부 도메인은 전체 트리플의 양적규모가 42.09%로 절대적인 수치 를 형성하고 있음. - RDF 링크 수는 특정 도메인내의 데이터 소스에서 다른 데이터 소스로 설정되어 나가는 링크(out-links)를 의미함. - 가장 많은 링크(out-links) 비중은 생명공학이지만 출판 도메인의 데이 터 역시 27.76%로 두 번째 비중을 차지함. <표 5> 도메인별 링크드 데이터 현황 도메인 데이터셋 개수 Media 25 1,841,852,061 5.82 50,440,705 10.01 Geographic 31 6,145,532,484 19.43 35,812,328 7.11 Government 49 13,315,009,400 42.09 19,343,519 3.84 Publications 87 2,950,720,693 9.33 139,925,218 27.76 Cross-domain 41 4,184,635,715 13.23 63,183,065 12.54 Life sciences 41 3,036,336,004 9.60 191,844,090 38.06 User-generated content 20 134,127,413 0.42 3,449,143 0.68 합계 295 31,634,213,770 100 503,998,829 100 트리플수 비율(%) 외부링크수 비율(%) 출처 : http://lod-cloud.net/state/ ☐ 데이터를 중심으로 하는 새로운 웹 생태계 구성 관점에서 지식정보 관리기 관은 자관이 소유, 관리하고 있는 데이터를 링크드 데이터 원칙에 맞추어 발행하는 과정을 고려해야 함. - 관리하고 있는 데이터 형태(구조적, 비구조적)와 특징(저작권 유무 등) 파악이 필요함. - 링크드 데이터 형태로 발행했을 때 가장 효과적인 데이터가 무엇인지 파악해야 함.
  • 25. 도서관 분야의 링크드 데이터 구축 동향 22 ☐ 동일 도메인 혹은 타 도메인과의 인터 링킹(inter-linking)으로 자관의 데이 터에 보다 풍부한 접근점을 줄 수 있다는 필요성 외에 새로운 데이터 웹 구축에 기여하다는 측면에서의 시도에 중점을 두는 것이 필요함. ☐ 데이터를 중심으로 하는 새로운 웹 생태계 구성은 링크드 데이터 원칙에 맞추어 현재 관리하고 있는 데이터를 웹에 공개하는 관점에서의 접근점으 로 앞서 기술된 국립도서관들의 사례가 대표적임. 2) 링크드 데이터의 실용성 ☐ 링크드 데이터에 대한 관심과 링크드 데이터 원칙에 준하여 생산된 데이터 의 증가는 또 다른 문제점과 접근점을 제시함. - 링크드 데이터의 증가에 따라 객체와 객체(개념과 개념)를 이어주고 관 계를 보다 상세히 기술할 수 있도록 해주는 용어집의 선택 문제가 생김. ☐ 링크드 데이터를 기반으로 한 웹의 성장으로 수많은 RDFS/OWL 기반의 용어집들이 존재하며, 용어집은 SKOS, DC, FRBR과 같은 표준뿐만 아니 라 FOAF, Event Ontology와 같이 사실상의 표준으로 통용되고 있는 것들 도 있음. - 현재 수많은 용어집들이 생성되고, 상호 연결되어 웹상에 발행되면서 새 로운 용어집 생태계를 이루고 있음. ☐ 링크드 데이터 자체도 관리가 필요한 하나의 데이터라는 관점의 변화가 필 요하며, 이는 대표적으로 Linked Open Vocabularies(이하 LOV)와 같은 프 로젝트가 보여주는 다양한 서비스에서 확인이 가능함. ☐ LOV(http://lov.okfn.org)는 어휘 생태계에 쉽게 접근할 수 있는 방법을 제 공하는데, OKF(Open Knowledge Foundation)의 지원으로 Datalift7) 프로 젝트의 결과로 개발되었음. 7) 프랑스 국립 연구청(L'Agence nationale de la recherche)의 지원 하에 수행된 실험적 연구프로 젝트로 프로젝트의 목적은 관계형 DB, CSV, XML 등 다양한 구조적 형태의 원천 소스를 웹상에 상호 연결된 시맨틱 데이터로 변환할 수 있도록 하는 것임. 이용자는 이 프로젝트에서 개발된 툴 로 데이터를 출판하기 위한 온톨로지 선택 – 데이터를 적절한 형태의 RDF(선택한 온톨로지를 활 용해서 RDF 형태로) 변환 – 링크드 데이터로 출판 – 다른 데이터 소스와 인터링킹 등의 기능을 수행할 수 있음.
  • 26. 23 KISTI 지식리포트 제40호 ☐ LOV의 주 이용자 계층은 어휘 이용자와 관리자 모두를 대상으로 함. - 어휘 이용자는 자신의 데이터를 가장 잘 기술할 수 있는 적합한 어휘를 선택해야하고, 관리자는 자신이 관리하는 용어집에 대한 가용성을 확인 하고 이용자 피드백을 통해서 장기적으로 안정적인 용어집 운용이 가능 하도록 할 수 있음. - LOV는 어휘집 생태계에서 각 어휘들의 품질 평가와 검색을 위한 플랫폼 인 동시에 이 생태계를 장기적으로 지속가능하게 유지하기 위한 활동임. ☐ LOV는 기본적으로 LOD 클라우드(http://linkeddata.org/)에 존재하는 RDFS 용어집이나 OWL 온톨로지를 포함하고 있으며, 다음의 조건을 충족하는 용 어집을 수집(LOV에 직접 신청도 가능)함. - RDFS, OWL과 시맨틱 웹 온톨로지 언어 중 하나로 표현되어야 함. - 웹에서 자유롭게 활용 가능하도록 출판되어야 함. - 네임 스페이스의 URI를 활용하면 내용 협상(content negotiation)에 의한 검색이 가능해야 함. - 다른 용어집의 일부 혹은 전체로 통합과 재사용이 용이해야 함. ☐ LOV가 제공하는 기능은 다음과 같음. - LOV Aggregator : 용어집과 용어에 대한 Endpoint 제공, 각 용어집의 현재 상태를 일 단위로 조회할 수 있고 다운로드가 가능함. <그림 11> LOV Aggregator 화면
  • 27. 24 도서관 분야의 링크드 데이터 구축 동향 - LOV Suggest : LOV 목록에 포함시키기 위한 새로운 용어집 등록 기능 을 제공함. 용어집에 대한 유효성 검증 후에 등록이 가능함. <그림 12> LOV Suggest 화면 - LOV Search : LOV 검색으로 요소명(속성, 클래스, 용어집 등)에 대한 검색이 가능하며, 검색한 요소명에 대한 도메인별, 유형별, 용어집별 필 터링을 지원함. 다음과 같은 평가 지표를 가짐. ∙ 질의어와 요소명(element labels) 관련성 ∙ 중요도와 일치된 요소명 ∙ LOV 데이터셋에서 요소의 발생 건수 ∙ 요소를 참조하고 있는 LOV 데이터셋에서 용어집의 수 ∙ LOC에서 요소의 발생 건수 <그림 13> LOV Search 화면
  • 28. KISTI 지식리포트 제40호 25 ☐ 링크드 데이터 역시 관리가 필요한 데이터라는 점은 단순히 자관의 데이터 를 링크드 데이터로 서비스한다는 범위를 벗어나 링크드 데이터라는 개념 에 접근하고자 하는 이들과 연구자 등에게 또 다른 형태의 서비스를 제공 해 줄 수 있음. - 이러한 접근점을 갖는 정보관리기관은 해당 도메인에 특화된 링크드 데 이터 모델 제공과 더불어 링크드 데이터에 대한 학문적, 실용적 접근을 가능하게 함. ☐ Blumauer(2013)는 링크드 데이터가 학문적인 영역은 물론이고 일반적인 활 용을 위한 접근점으로의 역할을 수행하기 위해서는 지금과 같은 형태의 일 반적인 지식이 아니라 보다 세부 도메인의 지식을 전달할 수 있는 신뢰할 수 있는 링크드 데이터 클라우드가 필요함을 언급함. - 대표적인 예로 독일 국립도서관 링크드 데이터 클라우드와 클린 에너지 링크드 데이터 클라우드를 제시함. <그림 14> Clean Energy Linked Open Data Cloud
  • 29. 도서관 분야의 링크드 데이터 구축 동향 26 - 초기에 구축된 링크드 데이터 클라우드는 다시 한 번 재점검이 필요하 며, 첫 단계로 개방형 데이터인 것과 아닌 것을 보다 명확히 표시하고, 두 번째로 클라우드 내 데이터셋의 품질과 신뢰성에 책임을 지고 있는 자(기관)를 보다 명확히 할 필요가 있음. - 또한, 링크드 데이터 클라우드에서는 데이터가 전부가 아니며, 그 뒤에 존재하는 사람과 조직이 중요한데, Trusted Clean Energy Lod Cloud의 경우 연결된 데이터셋을 관리하는 조직들은 공통의 데이터 인프라 기반 위에서 효율적인 협업 작업을 수행하고 있음. ☐ 하나의 데이터로써 링크드 데이터와 실용적 활용 기반 구축은 단순히 소장 데이터에 대한 링크드 데이터 개방 외에 링크드 데이터를 활용하고자 하는 자(조직)에게 효과적이고 효율적인 접근점(LOV와 같은 링크드 데이터 분 석, 평가)을 제시해 줄 필요가 있음. 링크드 데이터의 링크가 가장 파괴력 을 발휘할 수 있는 것은 데이터 뒤에 연결되어 있는 조직 간의 연계협력 인프라임을 주지해야 함. 3) 링크드 데이터를 통한 접근성 향상 ☐ 링크드 데이터는 웹이라는 플랫폼에서 소통하기 위한 방식 중의 하나로, 도서관의 경우 MARC, OAI, OpenAPI 등 다양한 방식으로 데이터를 개방 하고 도서관 간 혹은 타 기관과 데이터를 교환해 왔음. - 그러나 이러한 소통 방식은 직접적으로 웹을 플랫폼으로 활용하지는 않 으며, 데이터 간의 소통을 위한 표현(속성) 역시 MARC, MODS 등 도 서관 도메인에서만 가능한 한계가 있음. ☐ 링크드 데이터 원칙을 준수하여 웹에 구조화된 데이터를 발행하고 공유하 고 재사용할 수 있는 기회를 제공하는 것은 가장 근본적인 데이터 웹을 만 드는 방식이지만, 기존의 소통방식(OAI 등) 역시 유지해야 하며, 구조화된 데이터의 개방과 활용이라는 관점에서 OData(Open Data Protocol)와 같은 방식도 고려한 데이터 플랫폼 구축에 중점을 둘 필요가 있음. - OData(개방형 데이터 프로토콜)는 인터넷을 통해 데이터를 전송하는 프 로토콜로 웹상에서 손쉽게 데이터를 조회, 수정 등이 가능한 웹 프로토 콜(http://www.odata.org)임.
  • 30. KISTI 지식리포트 제40호 27 ☐ 구조화된 데이터의 발행과 접근점 향상은 웹상에 구조화된 데이터를 발행 하고 링크드 데이터 방식 이외의 다양한 웹을 기반으로 하는 소통방식에 접근할 필요가 있음을 강조한 것으로, 뿐만 아니라 링크드 데이터는 발행뿐 만 아니라 실제로 서비스에 활용이 가능한 데이터임을 주지해야 함. <그림 15> OECD Odata API 예제 - 메타데이터 조회 (http://stats.oecd.org/OECDStatWCF_OData/OData.svc/$metadata) ☐ 링크드 데이터에 대한 접근 방식 중 하나로 고려해야 하는 것 중의 하나는 웹에서 특히, 검색엔진에서의 접근성 향상 관점임. - OCLC의 사례처럼 대부분 이용자들의 접근 경로인 Google 등 검색엔진 (서비스)에서의 접근성 향상을 위한 Shema.org 용어집 참조와 RDFa 적 용 등 고려 필요 ☐ 링크드 데이터는 데이터의 발행 방식 중의 하나인 동시에 활용이 가능한는 살아있는 데이터 셋임. ☐ BBC에서는 BBC Music, BBC Programmes와 같은 링크드 데이터를 활용 한 서비스를 개시하여 제공하고 있음(<그림 16> 참조). - 또한 BBC에서는 2012년부터 링크드 데이터를 활용하여 BBC News를 위한 시맨틱 프로토타이핑 플랫폼인 BBC News Juicer 시작함.
  • 31. 도서관 분야의 링크드 데이터 구축 동향 <그림 16> 링크드 데이터 기반 BBC Music The Beatles 서비스 <그림 17> BBC News Juicer 서비스 28
  • 32. KISTI 지식리포트 제40호 29 5. 결론 및 제언 ☐ 본 보고서는 도서관의 링크드 오픈 데이터 서비스 동향을 살펴보고 향후 발전된 서비스 방안을 제시하는 것이 목적임. ☐ 이를 위해 간단히 시맨틱 웹과 링크드 데이터에 대한 정의와 링크드 데이 터의 원칙을 살펴보고, 도서관 링크드 데이터의 가장 실용적인 지침인 W3C Library Linked Data Final Report의 중요 내용을 점검하였으며, 대 표적인 도서관 링크드 데이터 사례를 3가지 관점에서 제시함. - 첫 번째 관점은 영국 등 국립도서관들의 소장정보에 대한 링크드 데이 터화와 발행이며, 두 번째는 OCLC의 WorldCat, VIAF 등과 같이 웹에 서의 접근성 향상과 값 어휘집 제공 사례, 세 번째는 미국 의회도서관의 BIBFRAME으로 데이터 웹에 대한 개념적인 접근 사례임. ☐ 이 와 별개로 도서관이 가지고 있는 데이터가 단순히 서지, 전거 데이터뿐 만 아니라 이용자와도 관련된 데이터가 존재하며 이의 유의미한 활용이 가 능하다는 관점도 제시함. ☐ 링크드 데이터를 기반으로 발전된 서비스 방향 설정을 위해서 3가지의 접 근점을 제시함. - 첫 번째는 데이터를 중심으로 하는 새로운 웹 생태계 구성에 참여할 필 요가 있으며 이를 위해서는 관리, 소장하고 있는 데이터에 대한 분석과 링크드 데이터 원칙을 준수한 데이터 발행이 필요함을 언급하였음. 이것 은 웹에 새로운 데이터 생태계를 구성하는데 참여하고 있다는 거시적인 관점과 발전방향 설정이 필요함을 지적한 것임. - 두 번째는 하나의 데이터로써 링크드 데이터를 바라볼 필요가 있으며, 이 는 연구자(기관) 혹은 링크드 데이터를 실용적으로 활용해야하는 자(기관) 에게 효율적인 접근점을 제시해줄 수 있는 서비스적 관점이 필요함을 지 적한 것임. 또한 링크드 데이터의 핵심인 연결은 데이터의 연결뿐만 아니 라 뒤에 존재하는 조직적인 인프라의 유대와 결속이 중요함을 지적하였음. - 마지막은 구조화된 데이터의 발행과 접근점 향상으로 링크드 데이터가 기존의 소통방식과 다른 형태를 취하고 있으나 역시 데이터를 교환하고
  • 33. 도서관 분야의 링크드 데이터 구축 동향 30 상호운용성을 확보하고 데이터의 재사용성과 활용성을 높인다는 관점에 서 동일선상의 개방형 데이터 정책으로 볼 필요가 있음을 지적한 것임. 또한 이미 개방된 링크드 데이터를 직접적으로 업무나 서비스에 활용할 수 있는 방안 수립도 필요함을 언급하였음. ☐ 본 보고서의 범위는 도서관을 기본 도메인으로 하고 있으며, 주요 내용은 정보자원 관리 기관이 개념적으로 링크드 데이터에 대해 접근할 수 있도록 하고 현재 시점에서 필요한 것이 무엇이며, 이를 바탕으로 향후 추진해야하 는 방향과 과제가 무엇인지를 알아보는데 중점을 두고 있음. ☐ 링크드 데이터가 웹에서 보다 효과적인 소통 방식임을 직시하고, 링크드 데 이터 발행자(관리자), 소비자로써의 역할로 접근하여 정책을 설정하고 실행 계획을 수립하는 것이 필요함.
  • 34. 31 KISTI 지식리포트 제40호 <참고문헌> 박진호 (2013a, 7월). 도서관은 웹에 존재하는가? : 링크드 데이터, 글로벌 데이 터베이스. 국가전자도서관 세미나. 경기도 : 국가기록원 박진호. (2013b). 도서관 데이터의 링크드 데이터(Linked Data) 변환과 인터링 킹(interlinking)을 통한 정보연계 확장성에 관한 연구 : 국립중앙도서관 서지, 주제명, 저자명 데이터를 중심으로. 석사학위논문, 성균관대학교, 서울. Berners-Lee, T., Hendler, J., & Lassila, O. (2001). The semantic web. Scientific american, 284(5), 28-37. Berners-Lee, T. (1998). Semantic web road map, September 1998. W3C Draft http://www. w3. org/DesignIssues/Semantic. html. Berners-Lee, T. (2007). Giant global graph. online posting, Networks,” Proceedings of the National Academy of Sciences of the United States of America, 98, 404-9. Berners-Lee, T. (2011). Design issues: Linked data (2006). URL http://www. w3. org/DesignIssues/LinkedData. html. Blumauer, Andreas. (2013, June 7). The LOD cloud is dead, long live the trusted LOD cloud. Retrieved from http://blog.semantic-web.at/2013/ 06/07/the-lod-cloud-is-dead-long-live-the-trusted-lod-cloud/ Voß, Jakob. (2012, November). Encoding Patron Information in RDF. Paper presented at the Semantic Web in Libraries(SWIB12) Conference, Cologne, Germany. W3C. (n.d.). W3C SEMANTIC http://www.w3.org/2001/sw/ WEB ACTIVITY. Retrieved from
  • 35. ◀저자▶ 현 미 환 ⋅KISTI NDSL서비스실 선임연구원 ⋅mhhyun@kisti.re.kr 김 완 종 ⋅KISTI NDSL서비스실 선임연구원 ⋅wjkim@kisti.re.kr 이 혜 진 ⋅KISTI NDSL서비스실 선임연구원 ⋅hyejin@kisti.re.kr 유 수 현 ⋅KISTI NDSL서비스실 선임연구원 ⋅yoosu@kisti.re.kr 김 혜 선 ⋅KISTI NDSL서비스실장 ⋅hskim@kisti.re.kr 박 진 호 ⋅성균관대학교 문헌정보학과 ⋅jino.kor@gmail.com KISTI 지식리포트 제40호 도서관 분야의 링크드 데이터 구축 동향 인 쇄 2014년 1월 6일 발 행 2014년 1월 7일 펴낸곳 펴낸이 박영서 편집인 김혜선 주 소 서울시 동대문구 회기로 66 고객센터(ARS) 080-969-4114 등 록 1991. 2. 12, 제5-258호 IS B N 978-89-294-0464-2 93020 인쇄처 승림디엔씨 ※ 본 연구의 내용은 본 연구원의 공식적인 견해가 아닌 참여 연구원들의 의견임을 밝혀둔다.
  • 36. □ KISTI 지식리포트 발행 목록 호 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 서명 저자 학술지 수집 정책 수립을 위한 국내 현황 분석 이재윤, 김혜선, 이혜진 국내 과학기술지식의 글로벌 확산 전략 서태설, 최현규 국가 과학기술 진흥을 위한 KISTI의 전략적 정보자원 개발방안 황혜경, 최호남, 윤희윤 학술논문 오픈 액세스를 위한 공공접근정책 방향 서태설, 허 선, 노경란 과학데이터의 공유와 활용 이상환, 심원식 E.infrastructure기반 국가 R&D 정보서비스의 지능화 방안 송인석, 오세홍 한국과학기술인용색인서비스(KSCI)의 현황 및 발전 전략 최선희, 이재윤 학술정보센터의 새로운 서비스 모델 : 오픈 액세스 출판 노경란, 이혜진 과학기술정보의 아카이빙 체제 구축 황혜경, 이선희, 최호남, 서혜란 이상환, 노경란, 김혜선, 세계 주요 과학기술 정보기관의 최근 동향 황혜경, 정은경 이선희, 황혜경, 류범종, 과학기술 정보자료 보존관리 : 현황분석 및 미래예측 윤희윤, 김석영 리포지터리 사례분석 및 시사점 도출 이상기, 정영미 디지털 콘텐츠 유통을 위한 저작권 쟁점 분석 유수현 이공계 대학 교수의 과학기술정보 이용 현황 김환민, 김재훈 계량서지적 분석용 공개 소프트웨어 활용 방안 최선희, 김희정, 이재윤 2010년도 한국 과학자의 SCI 논문 계량분석 김완종, 노경란, 박민수, 최현규 국내 과학기술정보 이용실태 조사 분석 박민수, 이상환, 최현규, 정정수 국내 과학기술정보 이용자 니즈 및 형태 연구 박민수, 이상환, 최현규, 정정수 학술지 유통환경 변화와 국내 학술지의 국제화 서태설, 김규환, 최현규 우리나라 SCI급 논문의 영향력 분석 김완종, 노경란, 최현규, 박민수 : NCR for Korea 1981-2010을 기준으로 연구자들의 소셜 미디어 이용 노경란, 최현규 연구자를 위한 소셜 미디어 활용 가이드 노경란, 최현규 김지영, 신기정, 황혜경, 서비스 사이언스 기반 과학기술 콘텐츠 서비스 방안 조부연 효율적 연구를 위한 소셜 미디어 활용 노경란, 유수현, 최현규 SEO(검색엔진최적화)를 통한 검색순위 올리기 전략 현미환, 이태석, 문영수, 권정혁 이혜진, 현미환, 김혜선, 연구자 협업지원형 정보서비스 사례연구 박민수, 최현규 과학기술 R&D 라이프사이클 연구 : 생명공학 및 나노분야를 김혜선, 권나현, 정은경, 이정연, 최현규 중심으로 웹사이트의 사용성 개선을 위한 단계별 전략 현미환, 박민수, 이태석, 최현규 현미환, 이혜진, 김혜선, 국내 과학기술 연구자의 소셜 미디어 활용 현황 박민수, 최현규 이용현황 분석을 통한 학술정보 활용지표 개발 이혜진, 유수현, 김혜선, 이재윤 FTA와 개정 저작권법이 정보유통에 미치는 영향 유수현, 이대희 정영임, 신용주, 한성근, 김재훈, 고품질 정보서비스 지원을 위한 컴퓨팅자원 인프라 구축 김정환, 최호남 모바일 앱(App) 개발을 위한 특화 기술 분석 현미환, 신수미, 김혜선 한국과학기술정보연구원(KISTI) 원문제공서비스 현황 분석 이선희, 김지영, 문영수, 신기정 이태석, 신수미, 유수현, 정보서비스 공공기관 검색엔진 활용 만족도 조사 정용일, 이은정 국내외 오픈액세스 기술 및 서비스 동향 이은지, 현미환, 김완종, 김혜선 학술정보의 공개 및 공유를 위한 법적 쟁점 유수현, 김완종, 김혜선, 최진원 정보 공유를 위한 국내외 OpenAPI 서비스 동향 현미환, 신수미, 김혜선 클라우드 기반 정보서비스 동향 및 사례 신수미, 현미환, 김혜선 발간일 2009.06.11 2009.09.04 2009.09.21 2009.10.23 2009.11.10 2009.12.04 2010.01.29 2010.02.11 2010.02.16 2010.03.02 2010.06.30 2010.10.07 2010.10.07 2010.12.02 2011.01.24 2011.04.06 2011.04.08 2011.04.08 2011.06.07 2011.08.17 2011.10.19 2011.10.19 2011.10.26 2011.11.09 2011.11.11 2011.12.01 2011.11.30 2011.12.05 2011.12.08 2012.01.31 2012.02.21 2012.03.30 2012.08.10 2012.12.31 2013.07.31 2013.11.29 2013.12.06 2013.12.10 2013.12.13