도서관에서의 Linked Data의 활용
Upcoming SlideShare
Loading in...5
×
 

도서관에서의 Linked Data의 활용

on

  • 4,574 views

현재의 정보이용추세에 맞춰 각종 도서관 및 정보센터가 진화해서 궁극적으로 Social Semantic Digital Library가 될 필요성이 있다. 그러나 아직 대부분의 ...

현재의 정보이용추세에 맞춰 각종 도서관 및 정보센터가 진화해서 궁극적으로 Social Semantic Digital Library가 될 필요성이 있다. 그러나 아직 대부분의 도서관이 그냥 자료를 전산화시킨 수준에 머물러 있다. 이미 디지털도서관이라는 것들도 Web에 Publish를 못할 뿐만 아니라, 혹시 연결이 되었다 하더라도 자료들 간의 관계 부족으로 Semantic level이 너무 떨어지고 있다. 우리 인간이 이해하는 대로 기계가 이해하게 하면서 Semantic level을 올릴 수는 없을까? 바로 이 점에서 Semantic web이 출발한다. 이 문제를 극복하고자 DCMI를 위시한 ‘다양한’ 메타데이터가 등장했으며 지금은 Linked Data까지 등장하고 있다. 메타데이터가 다양하게 존재하고 있기 때문에 다양하게 섞어서 사용할 수 있다는 장점이 있다. 다양한 상호운용성의 방법 (하나의 메타데이터로 통합 다양한 메타데이터 인정, Metadata Registry, Open Source의 활용 및 Linked data)이 있다. 그중에서 Linked Data를 중심으로 도서관이 어떻게 구체적으로 대응해 나가고 있는지를 미의회도서관 및 스웨덴의 LIBRIS를 중심으로 살펴보고, 이를 바탕으로 아직도 카탈로그의 캡슐에 묻혀 있는 우리나라 도서관의 목록의 실정을 언급하고 Linked data를 중심으로 적극적인 상호운용성의 방법을 제안하고 하고자 한다. 웹에 있는 다양한 Resource사이에 관계를 부여하면서 뜻을 더 명확하게 표현하자는 시도가 바로 Linked Data이다. 이 글에서는 맹자가 말하는 明志, 즉 ‘뜻을 분명히 밝히라’는 가르침을 Tim Berners-Lee가 어떻게 답하는 가를 밝힌다. 이에 그가 제안하는 dereferenceable uri, rdf 및 http를 통한 출판을 간단히 살피고, skos를 위시한 rdf vocabularies를 언급한다. 궁극적으로는 rdf 링크를 통한, 심지어는 다른 데이터 셋을 활용하여 끝없는 탐색을 하게 될 모델을 제공하고자 한다.

Statistics

Views

Total Views
4,574
Views on SlideShare
4,281
Embed Views
293

Actions

Likes
2
Downloads
125
Comments
1

5 Embeds 293

http://blog.saltlux.com 140
http://www.websci.or.kr 117
http://in2.saltlux.com 24
http://www.slideshare.net 11
http://doremi.konantech.com 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
  • fffff
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • http://docs.google.com/present/view?id=0ARP4fDAaJOdXZGNxajNqcGRfNDgyZjg3Y3FmNQ&hl=en The Future of Digital Librarianship in Academic Libraries An overview of nine areas in which the digital librarian of the future will be engaged Preservation Enable digital curators to mitigate risks to their data First and foremost,preserve the bits The line between access systems and archiving systems will continue to blur Scholarly Communication Advocate Open Access(OA) Who benefits from OA?     university faculty /  university libraries /  university admin. /  university students /  local communities /  scholars all over Educate scholars about copyright / Advocate for negotiation of copyright retention iii. Repositories The evolution of repositories  collection-building tools (Greenstone, DLXS)  display applications with harvestable metadata (DSpace, CONTENTdm)  OAIS-inspired monolithic frameworks(Fedora, aDORe)  decoupled micro-services + web architecture (California Digital Library, SWORD, OAI-ORE) Build trust in repositories How?  By ensuring:     content will not change except, e.g., for planned format migration   derivatives and migrations of content are faithful to the original masters   content is authentic and has documented provenance   content is accessible via known identifiers Technologies for trust     digital signatures   persistent identifiers   audit trails / provenance metadata   content versioning   authorization / authentication   rights / access control Continue growing the repository Broad growth   electronic theses & dissertations research data learning objects pre-prints electronic records public domain documents Deep growth   Incorporate the repository into institutional programs and workflows Resolve the tension between preservation and growth If these sound like Herculean tasks, it's only because they are  Fortunately, the future digital librarian will be endowed with Herculean strength Herculean strength in numbers    The digital library is increasingly acknowledged as an institutional  rather than individual endeavor Digital librarians will be successful to the extent that their  colleagues and administration are involved iv. Outreach Situate the digital library within the institution by working with deans, provosts, and scholars The values of scholars and administration are different from those of the library Outreach will help frame the message Conversations   institution-wide data census   an institutional bibliography   collaborative design of scholarly communication tools v. Digitization Guide the selection of content to be digitized  Align digitization resources with scholarly communication needs vi. Metadata Serve as a conduit between library metadata and the "outside world's" best practices and 2.o-style uncontrolled metadata Outward    Contribute authority metadata and schemas to efforts to build a more descriptive web Inward   Add value to services by augmenting them with crowdsourced metadata The centrality of identifiers (the topic that launched a million flame-wars) vii. Discovery Make information easier to discover by surfacing relationships between objects in addition to traditional collection browse interfaces viii. Technology & Interoperability Lead the library‘ stechnological vanguard Much of the recentconvergence between library technology and the web has occurred in the digital library context Libraries andcyberinfrastructure Integrate library systems and processes into campus cyberinfrastructure How? Standards and best practices help, as does alignment withtechnologies from outside libraries ix. Sustainability Sustain the digital library through a framework of partnerships, institutional commitments,  and technology strategies
  •   Authority control fulfills two important functions. First, it enables catalogers to disambiguate items with similar or identical headings. For example, two authors who happen to have published under the same name can be distinguished from each other by adding middle initials, birth and/or death (or flourished, if these are unknown) dates, or a descriptive epithet to the heading of one (or both) authors. Second, authority control is used by catalogers to collocate materials that logically belong together, although they present themselves differently. For example, authority control enables a catalog to index all manifestations of a given book (including translations) together.
  • RECOMMENDATIONS  TOP Warmer digital libraries cannot be achieved by software tools alone. The digital libraries themselves can take simple steps to make data and metadata more amenable to human and automated use, making their content more useful and useable. Only with proper and better access to linked data and metadata can the tools that computational biologists require be built. We make the following recommendations to achieve this goal. Simple URIs. URIs for human use should be as simple as possible, to allow easy linking to individual publications and their authors. Short URIs are much more likely to be used and cited  [192]  than longer, more complicated URIs. Persistent URIs. It has been noted many times before  [193] , [194] , but it is worth repeatedly restating: persistent URIs make digital libraries a much more useful and usable place. Although URIs will inevitably decay  [195] , [196] , many (but not all) will be preserved by the Internet Archive [197] , [198] , and every effort should be made to keep them persistent where possible. Exposing metadata. Publication metadata, in whatever style (EndNote, BibTeX, XML, RDF, etc.), should be transparently exposed and readily available, programmatically and manually, from URIs, HTML [199] , and PDF files of publications. Identifying publications. URNs (such as Digital Object Identifiers) should be used to identify publications wherever possible. Most large publishers already do this, although there are still many confounding exceptions. Identifying people. This problem is twofold: people need to be identified as users of a system and as authors of publications. To tackle the first issue, tools and libraries should use Single Sign On (SSO) schemes, such as OpenID  [187]  to provide access to personalized features where possible, as this prevents the endless and frustrating proliferation of username/passwords to identify users in Web applications. The second requires unique author identification, an ongoing and as yet unsolved issue for digital libraries. By following these recommendations, publishers, scientists, and libraries of all kinds can add significant value to the information they manage for the digital library. The  Semantic Web  is an evolving development of the  World Wide Web  in which the meaning ( semantics ) of information and services on the web is defined, making it possible for the web to "understand" and satisfy the requests of people and machines to use the  web content .
  • [22] Linked Data may not yet be on the radar of the manufacturers of household goods, but it is definitely knocking on the door of libraries and library applications.
  • Hyperlink => typed link A revolution is happening in the structure of the web itself. It’s gentle and it’s powerful, Tim Berners-Lee invented the Web about 20 years ago, and 5 years later he started working about what the next generation of the web was going to be. It’s about moving from a Web of documents to a Web of data, where the data carries with it the meaning of each item of data. It doesn’t rely on understanding the documents. The data carries its own meaning and expresses that meaning.
  • 1 개의 테이블에 해당 자료를 다 넣어도 별 무리가 없는데 , 좀 더 ' 명확 ' 하게 구분 짓기 위해서 테이블을 나누는 경우이다 . 심각하지도 어렵지도 않는 단순 명쾌한 관계로 연결 지을 수 있다 . 한 레코드 안에 모든 것을 다 가지고 있는 큰 덩치를 좀 더 훌륭한 기능을 수행할 수 있게 잘게 하나 하나의 개체로 나누어서 서로 관계를 맺어주자 중앙집권정부가 대내 대외업무를 다 맡지 말고 , 잘게 나누어진 지방정부들이 전권을 가지고 대외협력 등의 관계를 맺게 해주자 H umans will always stay one step ahead of the machines.
  • 그러나 현재의 목록기술규칙은 물리적 형태를 기준으로 하고 있어 같은 콘텐츠이지만 형태가 다른 자료라는 것을 기술하기가 어렵다는 데 있다 .
  • 기계는 아무 것도 몰라 !!! 단지 구문으로 형태가 같은 것을 찾아낼 뿐 !!!
  • Contents and Carriers 지금까지는 Carrier 위주로 목록을 해왔다 . 이용자들이 MARC 로 만들어진 목록을 본다고 해서 어떤 장점이 있던가 ? 오히려 그들은 복잡해진다 .
  • The term "linked data" describes a method of exposing and connecting data on the Web from different sources using URIs ( define ) (Uniform Resource Identifiers). URI is the generic term for names and addresses on the Web, including Web page URLs. documents on the web often have data within their texts—data that can be treated as information in its own right. Berners-Lee and colleagues recognized this when they envisioned that we could enhance the web of documents with a web of data that exists sometimes within and sometimes alongside the documents themselves. documents on the web often have data within their texts—data that can be treated as information in its own right. Berners-Lee and colleagues recognized this when they envisioned that we could enhance the web of documents with a web of data that exists sometimes within and sometimes alongside the documents themselves. The basic requirements that data has to fulfill in order to be part of the Semantic Web are: All entities of interest, such as information resources, real-world objects, and vocabulary terms should be identified by URI references. URI references should be dereference-able , meaning that an application can look up a URI over the HTTP protocol and retrieve RDF data about the identified resource. Data should be provided using the RDF/XML syntax. Data should be interlinked with other data. Thus resource descriptions should contain links to related information in the form of dereference-able URIs within RDF statements or as rdfs:seeAlso links.
  • All of the possible uses of library bibliographic data by others are unimaginable today, but we have already seen the popularity of nonlibrary use of bibliographic data in systems like Wikipedia and LibraryThing. The data provided in OCLC's WorldCat Identities research project gives us a hint of the richness of library data once it is freed from the capsules of the catalog and of the bibliographic record. Opening library data to the web in a linkable form should allow that richness to be explored on a global scale.
  • Full text 검색을 해주면서 쉽게 검색을 할 수 있게 해주는 현재의 Online Digital Library 개념에서 탈피해서 “통합메타데이터를 만들 수 없을까 ?” 라는 물음에서 Social Digital Library 또는 Social Semantic Digital Library 의 필요성이 대두될 것이다 . 서로 다른 메타데이터를 사용하고 있는 , 이를 테면 , 자원 (resources), 이용자 프로파일 (user profile), 북마크 (bookmarks) 또는 taxonomies 를 통합시켜서 “ 기계와의 (with machines)” 뿐만 아니라 “기계에 의해서 (by machines) 상황 속에서의 의미화 (make sense) 를 가능하게 하여 뜻있게 정보를 연결하게 해주자 . What is a Social Semantic Digital Library?  Social Semantic digital libraries integrate information from various sources provide interoperability with other systems (not only libraries) deliver more robust, user friendly and adaptable search and browsing interfaces empowered by semantics and social networking
  • This allows the user to start with one data source and then move through a potentially endless Web of data sources connected by RDF links.
  • *** This page is a placeholder. Its main purpose is to serve links to the RDF representation and not yet to be visually pleasing or useful to a human. *** Triple store
  • The Metadata Registry provides services to developers and consumers of controlled vocabularies and is one of the first production deployments of the  RDF-based   Semantic Web Community's   Simple Knowledge Organization System  (SKOS)
  • The Web of Data can be accessed using Linked Data browsers, just as the traditional Web of documents is accessed using HTML browsers. However, instead of following links between HTML pages, Linked Data browsers enable users to navigate between different data sources by following RDF links. This allows the user to start with one data source and then move through a potentially endless Web of data sources connected by RDF links. For instance, while looking at data about a person from one source, a user might be interested in information about the person's home town. By following an RDF link, the user can navigate to information about that town contained in another dataset.

도서관에서의 Linked Data의 활용 도서관에서의 Linked Data의 활용 Presentation Transcript

  • From Marc to Linked Data
            • 성균관대학교 사서교육원
            • 조명대
            • [email_address]
  • Contents
    • 1. Intro
    • 1.1 Brief Overview: from MARC to Linked Data
    • 1.2 Paradigm Shift in www
    • 2. MARC 의 문제점 및 Frbr 개념모델의 등장
    • 3. 시맨틱웹의 한 부분으로서의 도서관 목록
    • 3.1 Linked data 를 통한 도서관의 진화
      • 3.1.1 Linked data 의 활용
      • 3.1.2 Library related Linked Data projects
      • 3.1.3 Possible applications of libraries in the Linked Data
    • 3.2 Controlled Vocabulary 의 활용
    • 4. Proposed Models for Libraries with Linked data
  • Intro: 정보검색의 영원한 숙제 False Positive / authority control ( 전거 통제 ) / … Disambiguation 및 Collocation + interoperability 식별자 특히 http uri
  • 1.1 Brief Overview: from MARC to Linked Data Card 목록 MARC: electronic version of the old card file . Internet 1 세대 :  데이터의 의미 가 아닌 구문 의 형태를 인식 Bush (1945) Tim Berners-Lee (1989) Global hypertext system 시맨틱웹 : 뜻을 살리자 the meaning ( semantics ) of information and services on the web is defined 차세대 웹
  • 1.1 Brief Overview: from MARC to Linked Data
    • Oh my goodness, the original web of documents was
    • just the tip of iceberg.” ( Sir Tim Berners Lee, July 2008)
    • Linked data: Semantic web 의 한 분야로 웹상에서 분리해서 참조할 수 있는 uri (dereferenceable uri), rdf 및 http uri 를 활용해서 데이터를 의미 있게 연결시키는 방법
    • Linked Data finally, truly, connects libraries to the web.
  • Paradigm Shift in www
  • Paradigm Shift in 정보탐색
    • 전통적 다큐먼트 => HTML browsers
    • A web of data => Linked Data browsers / RDF links.
    • ( 분리할 수 있는 URI)
    • 어떤 data 소스 – rdf 링크를 통한 ( 심지어는 다른 데이터 셋을 활용한 ) 끝없는 탐색
    • 예 ) 어떤 사람 – 그 사람의 고향 – 그 고향의 유명인사 – 그곳에서 태어난
    • 자 , 죽은 자 , - 그 사람이 감독한 영화 – 그 영화의 출연 배우들 – 그들의 배역 – 등등 …… .
  • 2. MARC 의 문제점 및 FRBR 개념모델의 등장
    • 기하급수적 데이터 생태계 에서 현재의 도서관 자료조직으로 살아남을 수 있을까 ?
      • No 1:1 Principle
      • (Marc 자체가 아닌 그렇게 사용하지 못한 시스템의 문제 )
  • 1 to 1 principle
    • 1 개의 테이블에 해당 자료를 다 넣어도 별 무리가 없는데 , 좀 더 ' 명확 ' 하게 구분 짓기 위해서 테이블을 나누는 경우이다 . 심각하지도 어렵지도 않는 단순 명쾌한
    • 관계로 연결 지을 수 있다 .
    • 이 말은 한 레코드 ( a record ) 안에 모든 것을 다 가지고 있는 큰 덩치를 좀 더 훌륭한 기능을 수행할 수 있게 잘게 하나 하나의 개체로 나누어서 서로 관계를 맺어주자
  • Frbr 개념모델의 등장
    • frbr 에서는 3 개의 큰 그룹으로 나누고
      • 1 그룹에는 work, expression, manifestation, item (Uniform Title)
      • 2 그룹에는 person & corporate body (names)
      • 3 그룹에는 concept, object, event, place (subject)
    • 으로 크게 나누고 다시 더 세분화해서 필요한 것끼리 1:1 관계 를 맺어준다 .
    • 바로 이 1:1 관계가 Collocation 을 맺게 해준다 .
    • (Cutter’s 2 nd principle for libraries)
    • 바로 이것이 지금 웹에서 말하는 Web of Data/Linked data 의 기본이 될 수 있다 . 즉 하나 하나의 데이터에 의미 를 부여하여 필요한 관계 를 맺어주자는 말이다 .
  • “ a” Marc Record Monolithic
  • Meaningful Decompose 논리적으로 잘게 나눌 수는 없을까 ? 새롭게 배열 (collocate) 해주자 “ 의미 있게 묶어준다”고 하여 “ Collocation” 이라고 한다 이 큰 덩치를 어떻게 할까 ? 이젠 , 쓸모있는 부분에 작은 표식 (tag, metadata) 을 하고 필요한 만큼 연결시켜보자 -Link and Tag!!!
  • integrating framework?
    • 이러한 서지구조의 integrating framework 은 ?
    • 바로 이것이
    • Functional Requirements for Bibliographic Records
    • ( 서지 레코드를 위한 기능적 요구 )
    • 간단히 말하면 , 어떤 하나의 query 는 다른 언어 또는 다른 주제명하에 목록이 되어 있어도 검색가능 .
    • => 도서관에서의 semantic web 의 시작이었으며 바로 이것이 linked data 이다 .
  • Surrogates vs entities (objects)
  • 실제 관계가 맺어지는 모습 _ 토픽 ( 영화 ) 와 토픽 남자배우가 1:1 관계
  • 실제 관계가 맺어지는 모습
  • 실제 관계가 맺어지는 모습
  • 실제 관계가 맺어지는 모습
  • 실제 관계가 맺어지는 모습
  • 실제 관계가 맺어지는 모습
  • ( 개념상 ) 다시 전통적인 카드목록으로…
    • 전통적인 카드목록으로 돌아온 셈인데
    • 이 목록에는 특별한 “창 (virtual window)” 이 있더라
    • 수십 장의 카드가 아니라 단 한 장에서 더 처리할 수 있는
    • 특수카드
    • 바로 이 창에서 Collocation 을 표현한다 .
    • ( 참조 : 전통적인 Collocation 의 방법은 서명 . 저자명 . 주제명표목 및 분류표 )
    • 카드목록 -> (MARC) flat database -> Ontology with old concept of cataloging is embeded
  • The new card catalogue: the result of searching for person=conrad? . 바로 이 창이 저자와 서명을 묶어주는 창 (Collocation) 이다 .
  • Focusing on works by Joseph Conrad. 어떤 저자의 특정 작품이 다른 언어로 번역된 모습을 Collocation 시켜서 보여준다 .
  • 내용과 용기의 분리 _ 토픽맵의 경우
  • 내용과 용기의 분리 _ FRBR 의 경우 저작에도 표준번호가 부여되기 시작했다 . 개념에도 번호부여 예 ) ISTC
  • FRBR 개념적모델
  • FRBR 의 1:1 principle: Starting of linked data in library community
  • Works, expressions, manifestations and relations between the two works by Morten Traavik and Joseph Conrad. Boxes are entities, relations are arrows.
  • The work "Heart of darkness" and some of its expressions and manifestations, and the persons responsible.
  • FRBR 의 활용 : unified database of information Music Ontology 문화 예술영역 / 저작권 등
  • 3. 시맨틱웹의 한 부분으로서의 도서관 목록
    • 關係를 표시 못해줬기 때문에 意味 ( 뜻 . Meaning) 가 불명확했다
    • 明確 / 明志 하게 해주자는 시도가 Semantic Web 이며
    • Web of Data / Linked data 라고도 하며 그 중 온톨로지가 대표적인 기술이다
    • The Semantic Web is  a web of data.  [W3C] 에서
    • ( URI 를 통해 어디서든 연결할 수 있는 데이터라면 무엇이든지 가능 )
    • 이제 우리는 도서관의 Semantic level 을 올릴 필요성이 있다 .
  • From reading to understanding
      • 즉 ,
      • MARC 이후 machine-readable( 기계가 읽을 수 있는 ) 정도의 레벨에서
      • machine-understandable( 기계가 이해할 수 있는 )  레벨로 바꾸자는 시도가 바로 시멘틱웹이 지향하는 가치중의 하나이다 .
      • 이렇게 읽는 데에서 이해하는데 40~50 년이 걸렸다
      • 도서관에서는 Moving the MARC legacy data into RDA
      • (no AACR2 anymore)
  • 3.1 Linked Data 를 통한 도서관의 진화
    • Linked Data is a methodology for
    • providing meanings and relationships between things (data, concepts and documents) anywhere on the web, using
    • - URIS for identifying,
    • - RDF for describing and
    • - HTTP for publishing_ HTTP allows a client to get a
    • representation of the document
    • Rdf is the data format for linked data
  • Closed containers of data
    • Information systems, such as library catalogs, have
    • been, and still are, for the greatest part closed
    • containers of data, or “silos” without connections
    • between them.
    • (by Tim Berners Lee)
    • free from the capsules of the catalog
  • 도서관 진화의 필요성 Social Semantic Digital Library Involves the community into sharing knowledge Semantic Digital Library Accessible by machines, not only with machines Digital Library Online, easy searching with a full-text index coherent, organized collection of resources / links to other libraries or information /united view Library Organized collection
  • 3.1.1 Linked data 의 활용 :Fictionfinder
  • 예 ) 국중 project_2007
  • Libris 에서의 Linked data 활용
  • 예 ) linked data: wiki vs dbpedia
    • Ambidextrous 하라
      • Web of document =>
        • http://wikipedia.org
        • vs
      • web of data
      • Dbpedia: the semantic web version of Wikipedia
        • http://dbpedia.org/page/Dublin
        • 또는
          • SELECT ?books WHERE { ?books dbpedia2:author < http://dbpedia.org/resource/Ernest_Hemingway >. }
  • A page with hypertext
  • Dbview: A topic with many properties
  • 내용과 용기의 분리
  • Wiki 의 dublin 에 대한 hypertext
  • Dbpedia 의 “ Linked data” on dublin
  • Dbpedia 검색 ( 헤밍웨이 저작 )   &quot;Ernest hemingway&quot; 의 이름을 갖는 ?who 를 object 로 갖는 ?books(subject) 를 찾아라 &quot; 헤밍웨이가 쓴 작품을 나열하라 &quot;
  • Dbpedia 검색 ( 헤밍웨이 저작 ) 동명이인이 있을경우 , 모호성이 생길 수 있다 . 그래서 아래와 같이 명시적으로 헤밍웨이를 지정할 수 있다 .  SELECT ?books WHERE { ?books dbpedia2:author < http://dbpedia.org/resource/Ernest_Hemingway >. } 즉 , 헤밍웨이의 uri 를 지정하는 것이다 . 바로 이것이 전거이다 .
  • Dbpedia 검색 ( 헤밍웨이 저작 )
    • http://dbpedia.org/snorql/?describe=http://dbpedia.org/resource/The_Old_Man_and_the_Sea
    노인과 바다에 대한 property 집합
  • 예 ) NYT 의 경우
    • http://data.nytimes.com/
  • More Examples of linked data
    • Most ontologies
    • dbview-generated from SQL virtual RDF data
    • New: D2R Server provides linked data as well as SPARQL
      • http://www4.wiwiss.fu-berlin.de/bizer/d2r-server/
    • FOAF (home brew, LiveJournal, Opera Community etc)
    • Semantic wikipedia
    • Place-names ... etc
    • The biggest challenge is links to other systems
  • Brief Overview
    • 한 페이지에서 하이퍼텍스트로 보여주는 … . [wiki] 에서
    • 다양한 소스에서 관계되는 것을 “전부” 모아서 보여주는… [dbpedia] 형태로
    • Vs
      • 어느 한 도서관에 있는 정보만을 체계적으로 보여주는… [ 전통적 MARC 도서관 ] 에서
    • 여러 도서관에서 관계되는 정보를 모아서 관계 속에서 “전부” 모아서 의미를 풍부하게 해주는… semantic digital library 를 만들자
    • 나아가서는 Social semantic digital library 로
    • => 어떻게 ?
  • 메타데이터의 필요성
    • 그래서
      • 각각의 자원 (resources) 에 고유의 식별자를 주고…
      • 관계를 표시하는 요소에도 고유의 식별자를 주고 …
      • 어떤 틀 위에서 표현을 하게 하자 .
    • 이 식별자가 없으면 Semantic 이라는 말은 결코 있을 수 없다
    • 이때 그 식별자를 표현하기 위해서 만든 것이 있는데… .
    • 뭘까 ????
  • 메타데이터의 활용 _DCMI 가 대표적
    • 이 resource 및 관계를 표시하는 식별자를
    • uri 로 표시한 것이 바로 메타데이터이다 .
    • 이제 기존 Marc 위에 새로운 메타데이터를 새로운 틀 (frame) 위에 더해서 semantic level 을 올리는 것이다 .
      • 기존의 HTML 에 특정 마크업 및 링크를 추가하면 , 컴퓨터가 해당 정보가 어떤 종류인지 파악할 수 있으며 이를 통해 사람도 더욱 편리하게 정보를 얻을 수 있다 .
  • 메타데이터의 활용 _as Vocabulary
    • METS/MODS
    • FRBR
    • SIOC
    • FOAF
    • BIBO
    • SKOS
  • 사서들의 새로운 시나리오
  • 사서들의 새로운 시나리오
  • 사서들의 새로운 시나리오
  • 업그레드 된 표준
  • 3.1.2 도서관과 관련된 Linked Data 프로젝트
    • A brief and incomplete list of some library related
    • Linked Data projects:
      • RDF BookMashup – Integration of Web 2.0 data sources like Amazon, Google or Yahoo into the Semantic Web.
      • Library of Congress Authorities – Exposing LoC Autorities and Vocabularies to the web using URI’s
      • DBpedia – Exposing structured data from WikiPedia to the web
        • UK football clubs with maps of the birthplaces of their players
        • Rock and Roll Groups and their discography as a SIMILE timeline
      • LIBRIS – Linked Data interface to Swedish LIBRIS Union catalog
      • Scriblio+Wordpress+Triplify – “A social, semantic OPAC Union Catalogue”
  • Libris 의 구조 Bibo,dc,skos,foaf,libris,geo 등의 vocabulary 를 사용하고 있다
  • 3.1.3 Possible applications of libraries in the Linked Data
    • Vocabularies & authorities
    • Dublin Core Metadata Terms http://purl.org/dc/terms
    • VIAF http://viaf.org/ ( The V irtual I nternational A uthority F ile)
    • LC authorities & vocabularies http://authorities.loc.gov
    • Rameau http://stitch.cs.vu.nl/rameau
    • OAI-ORE http://www.openarchives.org/ore/
    • Data & Services
    • Catalogues: Libris http://libris.kb.se/
    • Applications and Services
    • Real-World use cases
  • “ things” from the data set (Dbpedia)
    • The table below contains links to some example “things” from the data set:
    • Class Examples
    • City Cambridge , Berlin , Manchester
    • Country Spain , Iceland , South Korea
    • Politician George W. Bush , Nicolas Sarkozy , Angela Merkel
    • Musician AC/DC , Diana Ross , Röyksopp
    • Music album Led Zeppelin III , Like a Virgin , Thriller
    • Director Woody Allen , Oliver Stone , Takashi Miike
    • Film Pulp Fiction , Hysterical Blindness , Breakfast at Tiffany's
    • Book The Lord of the Rings , The Adventures of Tom Sawyer , The Holy Bible Computer Game Tetris , World of Warcraft , Sam & Max hit the Road
    • Technical Standard HTML , RDF , URI
  • “ things” from the data set (Dbpedia)
    • Sample Resources
    • Some example Linked Data URIs from the DBpedia data set are listed below. To start surfing the Semantic Web, please enter any of these URIs into the navigation bar of one of the Semantic Web browsers listed above.
    • http://dbpedia.org/resource/The_Lord_of_the_Rings
    • http://dbpedia.org/resource/Berlin
    • http://dbpedia.org/resource/Category:Cities_in_England
    • http://dbpedia.org/resource/The_Beatles
    • http://dbpedia.org/resource/Paul_McCartney
    • http://dbpedia.org/resource/Category:English_musicians
    • http://dbpedia.org/resource/Semantic_Web
    • http://dbpedia.org/resource/Tetris
    • http://dbpedia.org/resource/Semantic_Web
    • http://dbpedia.org/resource/SPARQL
  • 3.2 Controlled Vocabulary 의 할용
    • 웹에서 LCSH publishing 하기
    • SKOS 의 활용
    • LCSH in Skos
    • NSDL 메타데이트 레지스트리
  • 웹에서 LCSH publishing 하기
    • Project LCSH into RDF (i.e., create an RDF representation)
    • http://lcsubjects.org/
      • Library of Congress Subject Headings  available as  linked-data  using the  SKOS  vocabulary
  • SKOS 의 활용 1_ LCSH
    •  
    http://lcsubjects.org/
  • LCSH in SKOS
  • LCSH in SKOS
  • LCSH in Topic maps also using SKOS
  • SKOS 의 활용 2_ NSDL Metadata Registry http://metadataregistry.org/ http://metadataregistry.org/rdabrowse.htm
  • NSDL Metadata Registry
  • 4. Proposed Models for Libraries with Linked data
    • 출판사는 onix 등을 활용하여 출판하는 책에 대한 간단한 메타데이터 작성
    • 국중에서는 서지사항 및 전거목록을 추가 (DC, Mods, Mets 등 활용 )
    • 예 ) frbr: work”istc 0A9-2002-12B4A105-7”[ 개념에 대한 검색 활용 ]
    • dc:creator http://purl.org/......
      • dc:subject http://lcsubjects.org/subjects/sh85118553#concept
      • 예 2) SKOS 등을 활용해서 국가 차원에서 thesaurus 등을 만들고 전 도서관들이 활용하게 한다 (e.g., lc)
    • 지역 도서관에서는 자관에 필요한 메타데이터 입력 ( mods 등 활용 )
      • Mods:shelflocator “123.456”
      • Mods:location http://mylibrarey.gov......
    • - 가능하다면 이용자들이 직접 입력한 메타데이터 ( 태깅 ) 도 적극적으로 활용한다 . / Community 의 성격에 맞는
    • Ontology 를 지속적으로 개발한다 .
    • 이 도서관에서는 위키피디어 , flickr, Youtube, delicious 등을 활용하여 적극적인 Mash up (java 또는 PHP script
    • 활용 ) The URI has a hash (#) or follows 303 redirects
    • 해당 이용자가 찾고 있는 정보와 관련된 모든 관련된 정보를 rdf 및 rdf vocabularies (foaf, sioc, skos 등 ) 를 활용해서
    • Collocation 시킨다 . (same author, same subject, bio )
    • - 이 때 HTML pages 뿐만 아니라 분리할 수 있는 URI 를 적극 활용한다 ( RDF links .) 다른 데이터 소스도 물론 방문하게 한다 .
    • 自館 자료들을 계속해서 http:// 형태로 출판한다 . / Openness
  • Linked data_Advantages over other methods
    • No crosswalk/mapping
    • - Each one uses his own metadata format, all triples can be aggregated
    • No data redundancy
    • - Each one creates only the data he needs, and retrieves already existing information
    • No harvesting
    • - The data is available directly on the Web
    • No branding issue
    • - The URIs allow to track down the original data whatever its origin
    • No software-specific developments
    • - Everything relies on open standards as RDF, SPARQL … no need to learn a new protocol or query language
    • Universal identifiers (URIs): like written word
    • – For “connecting the dots”
    • Abstract syntax (RDF triples): sentence grammar
    • – Foundation of syntactic interoperability
    • Vocabularies: words and concepts
    • – Foundation of semantic interoperability
    • Human-understandable – machine-processable
    5. Language of Interoperability
  • Thank you &quot; 책은 무생물이지만 ,  책을 읽는 순간 생물이 되고 친구가 된다 .  책을 생물이 되게 해주고 보관하는 곳이 바로 도서관이다 &quot;