국가전자도서관세미나
2013.7.3(수)
국가기록원나라기록관대강당

도서관은 웹에 존재하는가?
링크드데이터, 글로벌 데이터베이스
박진호(jino.kor@gmail.com)
이 자료는 네이버에서 제공한 나눔글꼴이 적용되어 있습니다
http://hangeul.naver.com/font

This work is licensed under the Creative Commons 저작자표시-비영리-...
사서는 할
수 있고,
공무원은
할 수 없는,

Library
Linked
data이야
기,

사실은
Open
Data가 더
중요,

핵심은Dat
a

결국
은소
통
도서관은 웹에 존재하는가?
•

웹 생태계에 도서관의 위치는 무엇인가?

•

데이터 웹에서 도서관의 위치는 무엇인가?
Web of Documents

Web of Data

Global Database
오늘날의 웹 : Web of Documents(HTML)

링크

링크

Resourc
e

링크
링크

Resourc
e

Resourc
e
링크

링크

링크
Resourc
e
Resourc
e

Resourc
e
...
오늘 이야기하는 웹 : Web of Data

도서관은 웹에
존재하는가?

dc:creator

dc:publisher

o:workplace

박진호

Home
o:homepage

p:email

jino.kor@
...
• 두 개가 전혀 별개의 것인가?
• 문서 중심의 웹이 사라지고 데이터
웹이 등장하는 것인가?
"The Semantic Web is an extension of the current web in which
information is given

well-defined meaning, better enabling
...
첫 번째 문제점 및 접근점
•

아직까지웹의 문서들은 HTML로 작성, HTML은 문법으로
숨겨진 의미(Meaning, Semantics)를 표현하지는 못함

•

만약컴퓨터가, 우리처럼 Meaning을 이해할 수

있...
두 번째 문제점 및 접근점
•

이미구조화 된 데이터(정보원)를 비구적인 형태로 표현함

•

제공할 수 있는 많은 데이터(정보원)중 공급자 중심에서
판단하고서비스함
unstructured

structured

[출처 : http://www.slideshare.net/sandhaus/all-about-rnews-evan-sandhaus]
Wikipedia Vs Dbpedia
http://en.wikipedia.org/wiki/Samul_nori
http://dbpedia.org/page/Samul_nori
Elements of Linked Open Data Stack(revison 3)
Linked Data 기본 원칙
• Use URIs as names for things.
• Use HTTP URIs so that people can look up those
names.
• When someone l...
우리가 공유하고 있는 것.
한국어?
appl
e
사과
누군가 사과를 바라보는 시각

색

모양

분류

붉은 색에 둥근 모양을 갖고 있고 움푹 들어간 꼭지를 가지고 있는 과일

쌍떡잎식물 장미목 장미과 낙엽교목 식물인 사과나무의 열매.
[출처] 사과 | 두산백과
도서관 데이터(Library Data)

•
•
•
•
•
•

표제/책임표시사항: 철학이 필요한 시간 : 강신주
의 인문학 카운슬링 / 강신주 지음
발행사항 파주 : 사계절출판사, 2011
형태사항 346 p. :천연...
도서관 데이터(Library Data)는

•
•
•
•
•
•

표제/책임표시사항: 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음
발행사항 파주 : 사계절출판사, 2011
형태사항 346 p. :천연...
Library Linked Open Data

특정 객체, 개념과 속성과 속성이 갖는 값(강신주, 철학)을
누구나 이해할 수 있는 형태로 공개해서 활용할 수 있도록 해주는 것
Library Linked Open Data

객체,
서브젝트,
개념

서지 정보/데이터

속성

제목
저자
출판사
발행년

주제명 정보/데이터 저자명 정보/데이터

용어
상위어
하위어

이름
생몰년
연락처
공공정보로서 서지정보의 가치
공공정보로서 서지정보의 가치

인류의 지식
문자의 역사
인류의 기록
현재까지 도서관의 데이터 공개
MARC, OAI, Open API
도서관 데이터 플랫폼 구축
• 문서 중심의 현재 웹 생태계에 RDF기반의 데이터
플랫폼을 구축하고 사람들이 활용할 수 있도록 하는 활동
– 데이터 변환 : MARC2RDF
– 데이터 플랫폼 구축 : 데이터 검색, 다운로...
문학인

문학

range
isWrittenBy

subClassOf

subClassOf

subClassOf

domain
소설

시인

type
인간에
대한 예
의

소설가

type

isWrittenBy

공지...
복잡한 게 아닙니다. 기계가 이해할 수 있다(No)
사람과 기계가 같이 이해할 수 있는 공유의 장!
기계가 이해할 수 있다는 것은 사실

좀 더 엄격하고,
정확하고,
명확한 규칙과 정의가 필요
중요한 것은,

RDF, RDFa, Microformat,
Microdata,
Odata를 공부해라? 배워라? 써라?
OPEN

Standard
Data
Data Platform
개념화

Metadata
Vocabulary
…
도서관 데이터 플랫폼 구축의 특징
• 개념적 접근과 기술적 접근이 동시에 진행
– 개념적 접근 = FRBR, RDA(?), BIBFRAME
– 단순히 가지고 있는 데이터를 표준언어, 프로토콜에 맞추어
개방하는 것이 아니...
British Library Data Model - Book
BIBFramework
BIBFramework
BIBFramework
BIBFramework
FRBR
핵심연구과제 : URI정합성 연구
http://dbpedia.org/page/Gwanghwam
un

http://ja.dbpedia.org/resource/光化門

http://ko.dbpedia.org/resourc...
핵심연구과제 : URI정합성 연구
핵심연구과제 : URI정합성 연구
ISTC

created-by/creates

ISNI
Role: Creator/Author

adapted-by/adapts

ISNI
Role: Adaptor

performed-b...
의미있는 데이터 플랫폼(이용자 입장)
• 어떤 객체, 개념을 가지고 있는 지 알 수 있는가?
• 그 객체, 개념을 어떤 속성으로 관리하고 개방하고 있는지 알
수

있는가?
– 개방하고 있는 정보가 정말 가지고 있는 모든...
국립 도서관의 LOD 구축 원칙
•

Open이 먼저
– 국립도서관의 데이터는 기본적으로 누구나 자유롭게 활용할 수 있는
공공데이터(Public Data)
– 어떤 형태, 방식으로든 Open

•

Open하되 되도록이...
국립 도서관의 LOD 구축 원칙
• 이용자를 생산자로
– 단순한 데이터의 개방과 서비스를 넘어, 데이터를 만들고 자유롭게
활용할 수 있는 Data Literacy 교육

• 도서관 데이터의 시각화가 아니라 „이용자‟가 ...
도서관 데이터 플랫폼
서지MARC

주제명DB

저자명전거MARC

디지털서지(XML)

구조화된 데이터

RDB

API

기타(웹등)
비구조화 데이터

RDF Store

도서관 Data Platform

RDF f...
도서관 데이터 플랫폼
• 원하는 데이터를 원하는 형태로, 원하는
Vocabulary/Data Model로 활용할 수 있도록 함

도서관 Data Platform

MARC

OAI

Open
API

RDF

OData...
도서관 데이터 플랫폼
• 내가 활용하고 싶은 객체의 속성은 무엇인가?
• 내가 표현하고 싶은 객체의 속성은 무엇인가?
• 다른 사람들은 어떻게 부르고 어떻게 표현하는가?
도서관 데이터 플랫폼
서지정보의 미래 : 구조화된 데이터
• 국립도서관의 중요한 역할
– 국립도서관은 정보를 영구보존 합니다.
– 책, 전자책, CD, DVD, Web Site, Digital File

• 이 전자책의
제목은, 저자는, 출...
서지정보의 미래 : 구조화된 데이터
• 도서관이 바라보는 전자책

Epub해석규
칙
(EpubReader)

정보객체
(Information Object)

표현정보

001011100
000111101
11111011...
서지정보의 미래 : 구조화된 데이터
• Epub, Microsoft 2007이상
– 구조화된 형태로(XML) 표준 메타데이터를 활용(DublinCore
등)하여 플랫폼, 애플리케이션 독립적으로 활용이 가능한
디지털 정보...
Data, Platform
• 내부데이터의처리와새로운가능성
• 텍스트마이닝등을통한학술논문,특허
DB에서의유의미한가치발견
• 비구조화된외부데이터(SNS)처리,연결방안

Big Data

Complexity

Library...
참고자료
•

참고자료
–
–
–

–
–

•

Kevin Ford, LC‟s Bibliographic Framework Initiative: An Update
http://3windmills.com/kefo-swib...
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
Upcoming SlideShare
Loading in …5
×

도서관은 웹에 존재하는가

747 views
593 views

Published on

2013년 7월 국가전자도서관 세미나 주제발표

Published in: Technology
2 Comments
2 Likes
Statistics
Notes
  • @gyuhyon 감사합니다.^^ 자료에는 드루팔 이야기 없었는데^^ 국립중앙도서관에 있을 때 dublincore.go.kr을 drupal로 만들어놨었는데, 관리자 기능은 참 편리한데 포스팅하는 방식이 참 낯설었던 기억이 있네요^^ 국내에도 있었군요^^ 좋은 결과 만드시길 바랍니다.~~
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • 관심있게 보고 있었는데 도움이 많이 되었습니다.
    검색, 연결된 정보와 개인화된 체험, 해외 대학도서관에서는 드루팔과 디스페이스를 많이 쓰는 것 같습니다. 저희는 드루팔 개발업체인데, 올해 연세대 도서관에서 드루팔과 디스페이스를 사용하여 기존 시스템을 통합하려고 하는데 저희도 관여하고 있는데 한국에서도 뭔가 변화가 있을 수 있으면 좋겠습니다. ^^
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
No Downloads
Views
Total views
747
On SlideShare
0
From Embeds
0
Number of Embeds
11
Actions
Shares
0
Downloads
26
Comments
2
Likes
2
Embeds 0
No embeds

No notes for slide
  • http://www.flickr.com/photos/caroslines/462854603/
  • 도서관은 웹에 존재하는가

    1. 1. 국가전자도서관세미나 2013.7.3(수) 국가기록원나라기록관대강당 도서관은 웹에 존재하는가? 링크드데이터, 글로벌 데이터베이스 박진호(jino.kor@gmail.com)
    2. 2. 이 자료는 네이버에서 제공한 나눔글꼴이 적용되어 있습니다 http://hangeul.naver.com/font This work is licensed under the Creative Commons 저작자표시-비영리-변경금지 2.0 대한민국 License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-nd/2.0/kr/ or send a letter to Creative Commons, 444 Castro Street, Suite 900, Mountain View, California, 94041, USA.
    3. 3. 사서는 할 수 있고, 공무원은 할 수 없는, Library Linked data이야 기, 사실은 Open Data가 더 중요, 핵심은Dat a 결국 은소 통
    4. 4. 도서관은 웹에 존재하는가? • 웹 생태계에 도서관의 위치는 무엇인가? • 데이터 웹에서 도서관의 위치는 무엇인가?
    5. 5. Web of Documents Web of Data Global Database
    6. 6. 오늘날의 웹 : Web of Documents(HTML) 링크 링크 Resourc e 링크 링크 Resourc e Resourc e 링크 링크 링크 Resourc e Resourc e Resourc e Resourc e
    7. 7. 오늘 이야기하는 웹 : Web of Data 도서관은 웹에 존재하는가? dc:creator dc:publisher o:workplace 박진호 Home o:homepage p:email jino.kor@ gmail.co m p:title Library Data Architect www.jino. home
    8. 8. • 두 개가 전혀 별개의 것인가? • 문서 중심의 웹이 사라지고 데이터 웹이 등장하는 것인가?
    9. 9. "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001
    10. 10. 첫 번째 문제점 및 접근점 • 아직까지웹의 문서들은 HTML로 작성, HTML은 문법으로 숨겨진 의미(Meaning, Semantics)를 표현하지는 못함 • 만약컴퓨터가, 우리처럼 Meaning을 이해할 수 있다면,우리(사람)의 정보검색(탐색)은더 풍요로워질것임
    11. 11. 두 번째 문제점 및 접근점 • 이미구조화 된 데이터(정보원)를 비구적인 형태로 표현함 • 제공할 수 있는 많은 데이터(정보원)중 공급자 중심에서 판단하고서비스함
    12. 12. unstructured structured [출처 : http://www.slideshare.net/sandhaus/all-about-rnews-evan-sandhaus]
    13. 13. Wikipedia Vs Dbpedia http://en.wikipedia.org/wiki/Samul_nori http://dbpedia.org/page/Samul_nori
    14. 14. Elements of Linked Open Data Stack(revison 3)
    15. 15. Linked Data 기본 원칙 • Use URIs as names for things. • Use HTTP URIs so that people can look up those names. • When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) • Include links to other URIs. so that they can discover more things.
    16. 16. 우리가 공유하고 있는 것. 한국어?
    17. 17. appl e 사과
    18. 18. 누군가 사과를 바라보는 시각 색 모양 분류 붉은 색에 둥근 모양을 갖고 있고 움푹 들어간 꼭지를 가지고 있는 과일 쌍떡잎식물 장미목 장미과 낙엽교목 식물인 사과나무의 열매. [출처] 사과 | 두산백과
    19. 19. 도서관 데이터(Library Data) • • • • • • 표제/책임표시사항: 철학이 필요한 시간 : 강신주 의 인문학 카운슬링 / 강신주 지음 발행사항 파주 : 사계절출판사, 2011 형태사항 346 p. :천연색삽화 ;23 cm 표준번호/부호 ISBN: 978-89-5828-534-2 03100 분류기호: 한국십진분류법-> 104 한국십진분 류법-> 001.3 듀이십진분류법-> 102 듀이십 진분류법-> 001.3 주제명: 철학 에세이[哲學--] 인문 과학[人文科 學]
    20. 20. 도서관 데이터(Library Data)는 • • • • • • 표제/책임표시사항: 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음 발행사항 파주 : 사계절출판사, 2011 형태사항 346 p. :천연색삽화 ;23 cm 표준번호/부호 ISBN: 978-89-5828-534-2 03100 분류기호: 한국십진분류법-> 104 한국십진분류법-> 001.3 듀이십진분류법-> 102 듀이십진분류법-> 001.3 주제명: 철학 에세이[哲學--] 인문 과학[人文科學] 저자명 정보/데이터 서지 정보/데이터 주제명 정보/데이터
    21. 21. Library Linked Open Data 특정 객체, 개념과 속성과 속성이 갖는 값(강신주, 철학)을 누구나 이해할 수 있는 형태로 공개해서 활용할 수 있도록 해주는 것
    22. 22. Library Linked Open Data 객체, 서브젝트, 개념 서지 정보/데이터 속성 제목 저자 출판사 발행년 주제명 정보/데이터 저자명 정보/데이터 용어 상위어 하위어 이름 생몰년 연락처
    23. 23. 공공정보로서 서지정보의 가치
    24. 24. 공공정보로서 서지정보의 가치 인류의 지식 문자의 역사 인류의 기록
    25. 25. 현재까지 도서관의 데이터 공개 MARC, OAI, Open API
    26. 26. 도서관 데이터 플랫폼 구축 • 문서 중심의 현재 웹 생태계에 RDF기반의 데이터 플랫폼을 구축하고 사람들이 활용할 수 있도록 하는 활동 – 데이터 변환 : MARC2RDF – 데이터 플랫폼 구축 : 데이터 검색, 다운로드 등 – 데이터 활용 교육(Data Literacy) 및 해커톤
    27. 27. 문학인 문학 range isWrittenBy subClassOf subClassOf subClassOf domain 소설 시인 type 인간에 대한 예 의 소설가 type isWrittenBy 공지영
    28. 28. 복잡한 게 아닙니다. 기계가 이해할 수 있다(No) 사람과 기계가 같이 이해할 수 있는 공유의 장! 기계가 이해할 수 있다는 것은 사실 좀 더 엄격하고, 정확하고, 명확한 규칙과 정의가 필요
    29. 29. 중요한 것은, RDF, RDFa, Microformat, Microdata, Odata를 공부해라? 배워라? 써라?
    30. 30. OPEN Standard Data
    31. 31. Data Platform
    32. 32. 개념화 Metadata Vocabulary …
    33. 33. 도서관 데이터 플랫폼 구축의 특징 • 개념적 접근과 기술적 접근이 동시에 진행 – 개념적 접근 = FRBR, RDA(?), BIBFRAME – 단순히 가지고 있는 데이터를 표준언어, 프로토콜에 맞추어 개방하는 것이 아니라 „책‟ „서지‟라는 객체가 갖는 데이터모델로 접근
    34. 34. British Library Data Model - Book
    35. 35. BIBFramework
    36. 36. BIBFramework
    37. 37. BIBFramework
    38. 38. BIBFramework
    39. 39. FRBR
    40. 40. 핵심연구과제 : URI정합성 연구 http://dbpedia.org/page/Gwanghwam un http://ja.dbpedia.org/resource/光化門 http://ko.dbpedia.org/resource/광화문 freebase:광화문 http://es.dbpedia.org/resource/Gwanghwamun http://fr.dbpedia.org/resource/Gwanghwamun
    41. 41. 핵심연구과제 : URI정합성 연구
    42. 42. 핵심연구과제 : URI정합성 연구 ISTC created-by/creates ISNI Role: Creator/Author adapted-by/adapts ISNI Role: Adaptor performed-by/performs ISNI abstraction-of/manifestation contained-in/contains abstraction-of/performance ISBN ISAN ISRC performed-by Role: Contributor performed-by ISNI written-by Role: Performer contributed-by/contributes
    43. 43. 의미있는 데이터 플랫폼(이용자 입장) • 어떤 객체, 개념을 가지고 있는 지 알 수 있는가? • 그 객체, 개념을 어떤 속성으로 관리하고 개방하고 있는지 알 수 있는가? – 개방하고 있는 정보가 정말 가지고 있는 모든 것인가? • 범용적인, 혹은 내가 놀고 있는 플랫폼에서 활용 가능한가?(표준) • 나도 (개발능력이 없는) 활용할 수 있는 플랫폼인가? – 나에게 어떤 노력을 기울이고 있는가?
    44. 44. 국립 도서관의 LOD 구축 원칙 • Open이 먼저 – 국립도서관의 데이터는 기본적으로 누구나 자유롭게 활용할 수 있는 공공데이터(Public Data) – 어떤 형태, 방식으로든 Open • Open하되 되도록이면 개방형 표준을 활용 – Linked Data Principle 준수 • Information Ecosystem에 기여 – Web은 가장 보편화되고 일반적인 Platform이자 Ecosystem • Linked data로 얻는 이득보다 글로벌 데이터베이스(Web) 세계에 기여한다는 마음이 우선 – 개방으로 직접적으로 얻을 수 있는 이득 보다 우리의 데이터가 살아서 누군가에게 새로운 “가능성”을 열어 줄 수 있음을 우선 고려
    45. 45. 국립 도서관의 LOD 구축 원칙 • 이용자를 생산자로 – 단순한 데이터의 개방과 서비스를 넘어, 데이터를 만들고 자유롭게 활용할 수 있는 Data Literacy 교육 • 도서관 데이터의 시각화가 아니라 „이용자‟가 갖고 있는 데이터의 조합과 시각화
    46. 46. 도서관 데이터 플랫폼 서지MARC 주제명DB 저자명전거MARC 디지털서지(XML) 구조화된 데이터 RDB API 기타(웹등) 비구조화 데이터 RDF Store 도서관 Data Platform RDF files
    47. 47. 도서관 데이터 플랫폼 • 원하는 데이터를 원하는 형태로, 원하는 Vocabulary/Data Model로 활용할 수 있도록 함 도서관 Data Platform MARC OAI Open API RDF OData FOAF, FRBR, SKOS, SIOC, DC, MODS, PREMIS, BibFrame, EDM… JASO N XML
    48. 48. 도서관 데이터 플랫폼 • 내가 활용하고 싶은 객체의 속성은 무엇인가? • 내가 표현하고 싶은 객체의 속성은 무엇인가? • 다른 사람들은 어떻게 부르고 어떻게 표현하는가?
    49. 49. 도서관 데이터 플랫폼
    50. 50. 서지정보의 미래 : 구조화된 데이터 • 국립도서관의 중요한 역할 – 국립도서관은 정보를 영구보존 합니다. – 책, 전자책, CD, DVD, Web Site, Digital File • 이 전자책의 제목은, 저자는, 출판년도는, 출판사는, 주제분야는, – 어떤 SW로 만들어졌고, 어떤 OS에서 돌아가고, 그 SW의 업데이트는 언제 이루어졌고, 어디에 위치해있고, 현재 상태는 어떠하고...
    51. 51. 서지정보의 미래 : 구조화된 데이터 • 도서관이 바라보는 전자책 Epub해석규 칙 (EpubReader) 정보객체 (Information Object) 표현정보 001011100 000111101 111110110 101010110 데이터 객체
    52. 52. 서지정보의 미래 : 구조화된 데이터 • Epub, Microsoft 2007이상 – 구조화된 형태로(XML) 표준 메타데이터를 활용(DublinCore 등)하여 플랫폼, 애플리케이션 독립적으로 활용이 가능한 디지털 정보 객체
    53. 53. Data, Platform • 내부데이터의처리와새로운가능성 • 텍스트마이닝등을통한학술논문,특허 DB에서의유의미한가치발견 • 비구조화된외부데이터(SNS)처리,연결방안 Big Data Complexity Library Linked Data Possibility • 누구에게나열려있는가능성 • 데이터의가치판단은소비자에게 • Not Literal But Things
    54. 54. 참고자료 • 참고자료 – – – – – • Kevin Ford, LC‟s Bibliographic Framework Initiative: An Update http://3windmills.com/kefo-swib12-bfi/kefo-swib12.pdf Sam Oh. 2011. Invited Speech - ISO/TC46 & ISO/IEC JTC1/SC34. 『 LaRC 2011』, June 10-11, 2011. [Seoul, Korea : Seoul Olympic Parktel] www.istandard.or.kr/_custom/ksa/download.jsp?file_id=16779 박진호. ISO Identifier & UCI. 『국가디지털콘텐츠식별체계(UCI) 세미나 및 활용전략 발표회』, 2012.10.31. [서울, 한국저작권위원회] 박진호, 국가서지정보 Open Public Data Platform 구축, 『공공정보활용 사업화 전략 세미나-대전』, 2013.3.29. [대전, 대전시청] 박진호, 웹의 또 다른 모습, 글로벌 데이터베이스 Linked Open Data, 『웹데브모바일 4월 세미나 마크업 개발 Upgrade』, 2012.4.7. [서울,성공을도와주는가게] 이미지 출처 – – – – – – – – – – – http://www.flickr.com/photos/taylorsloan/5539665800 http://www.flickr.com/photos/shareconference/5422273956 http://www.flickr.com/photos/eole/2349202525 http://www.flickr.com/photos/gingerkitty/906756839 http://www.flickr.com/photos/charlestilford/2552654321/ http://www.flickr.com/photos/robgallop/514764284 http://www.parentsociety.com/parenting/7-things-parents-say-youll-say-them-too/ http://www.flickr.com/photos/hashir/936394705/ http://www.flickr.com/photos/maxbraun/58054501/ http://www.flickr.com/photos/dullhunk/202872717/ http://www.flickr.com/photos/julian_pierre/4762023750/

    ×