SlideShare a Scribd company logo
1 of 38
LOD
InterLinking
선행기술연구 팀장 이경욱
국가적 차원 공공 Data 공개
Linked Open Data 가 무엇인지?
Linked Data의 기본원칙
RDF GRAPH MODEL
국외의 경우
LOD CLOUD현황
CONTENTS
InterLinking 에 앞서01
InterLinking 예시
InterLinking 이란02
Data 중복 구축 방지
Data 중복 구축 방지 활용 예
잠재적 지식 발견 및 지식의 확장
InterLinking 의 필요성03
인터링킹 방법
인터링킹 시스템
인터링킹 목표
InterLinking 의 자동화04
국가 DB open 투명성 확보
데이터의 창조적 활용
InterLinking 에 앞서 -
국가적 차원 공공 Data 공개
InterLinking 에 앞서 -
국가적 차원 공공 Data 공개
국가 DB open 투명성 확보
데이터의 창조적 활용
InterLinking 에 앞서 -
개방
공공정보를 적극적으로 개방
누구나 자유롭게 활용 하도록
Linked Open Data 로 제공
융합
융·복합 연계 체계 구축
원천데이터를 Linked Open
Data(LOD) 기반으로 통합
재활용
정보제공 환경 마련
Linked Open Data 개방·연계·
활용 플랫폼 제공
창조
새로운 콘텐츠 창출
개방된 공공정보를 민간에서
타 분야 지식정보와 Cross-Over
하여 신규 서비스 개발
정부
국가적 차원 공공 Data 공개
InterLinking 에 앞서 - HTML
Linked Open Data 가 무엇인지?
Resource
Resource
Resource
Resource
Resource
Resource
Resource
링크
링크 링크
링크
링크링크
링크
문서 중심의 Web(Web of Documents) – HTML (Hyperlink)
InterLinking 에 앞서 - HTML
Linked Open Data 가 무엇인지?
Human Readable
예종
숙종
1054.07
문종
왕옹
nikh:hasFather nikh:hasGrandFather
nikh:realName
Nikh:hasFather
nikh:birthDate 경릉(景陵)
nikh:tombPlace
InterLinking 에 앞서 - RDF
Linked Open Data 가 무엇인지?
Data(Things) 중심의 Web(Web of data)– RDF (데이터 간의 연계, 의미 부여)
InterLinking 에 앞서 - RDF
Linked Open Data 가 무엇인지?
Machine Readable
1) Use URIs as names for things
2) Use HTTP URIs so that people can look up those names.
3) When someone looks up a URI, provide useful information, using the
standards (RDF, SPARQL)
4) Include links to other URIs. so that they can discover more things.
InterLinking 에 앞서 -
Linked Open Data 가 무엇인지?
Linked Data의 기본원칙 4가지 – 팀 버너스 리
주어
(Subject)
목적어
(Object)
술어(Predicate)
주어(Subject) 술어(Predicate) 목적어(Object)
예종의 아버지는 숙종이다
<RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종">
<nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName>
<nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate>
<nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate>
<nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace>
<nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather>
<nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather>
</RDF:Description>
Subject
Predicate Object
InterLinking 에 앞서 - RDF GRAPH MODEL
Linked Open Data 가 무엇인지?
InterLinking 에 앞서 - RDF GRAPH MODEL
Linked Open Data 가 무엇인지?
InterLinking 에 앞서 – 국외의 경우
Linked Open Data 가 무엇인지?
InterLinking 에 앞서 – 국외의 경우
Linked Open Data 가 무엇인지?
InterLinking 에 앞서 – 국외의 경우
Linked Open Data 가 무엇인지?
2008
ADD
TITLE
ADD
TITLE
2009
2010
2011
InterLinking 에 앞서 – LOD CLOUD 현황
Linked Open Data 가 무엇인지?
Version 0.3, 09/19/2011
InterLinking 에 앞서 – LOD CLOUD현황
Linked Open Data 가 무엇인지?
Version 0.3, 09/19/2011
InterLinking 이란
<http://dbpedia.org/resource/Amsterdam>
owl:sameAs <http://rdf.freebase.com/ns/...> ;
owl:sameAs <http://sws.geonames.org/2759793> ;
...
<http://sws.geonames.org/2759793>
owl:sameAs <http://dbpedia.org/resource/Amsterdam>
wgs84_pos:lat “52.3666667” ;
wgs84_pos:long “4.8833333” ;
geo:inCountry <http://www.geonames.org/countries/#NL> ;
...
Dbpedia DataSet에 있는 암스테르담과
Geonames DataSet에 있는 2759793(암스테르담)을
owl:sameAs로 인스턴스 동일화
<http://dbpedia.org/resource/Amsterdam>
owl:sameAs <http://sws.geonames.org/2759793>;
InterLinking 의 예시
LOD 구축에 있어서 인터링킹의 필요성
Data 중복 구축 방지
Relational databases: primary keys
Books
Title
Author
Year
ID
Authors
Name
Year
ID
Primary key Primary key
Foreign key
Authors record
Dan Brown
1964
456ID
Name
Year
The Da Vinci Code
Books record
456
2003
1289
Title
ID
Author
Year
Data 중복 구축 방지
LOD 구축에 있어서 인터링킹의 필요성
Relational databases and applications
Select title, year from books
Select name, year from authors where books.author=authors.id
Title: The Da Vinci Code
Author: Dan Brown, 1964
Year: 2003
Database
Application
User interface
Authors record
Dan Brown
1964
456ID
Name
Year
The Da Vinci Code
Books record
456
2003
1289
Title
ID
Author
Year
SQL
Data 중복 구축 방지
LOD 구축에 있어서 인터링킹의 필요성
OpenLibrary
Title
Author
Year
URI
VIAF
Name
Year
URI
Primary key Primary key
Foreign key
Authors record
Dan Brown
1964
http://viaf.org/viaf/102403515URI
Name
Year
The Da Vinci Code
Books record
http://viaf.org/viaf/102403515
2003
http://openlibrary.org/works/OL76837W
Title
URI
Author
Year
Data 중복 구축 방지
LOD 구축에 있어서 인터링킹의 필요성
Triple Repository: URIs(primary keys)
Linked data and applications
Select ?title ?year …
Select ?name ?year WHERE …..
Title: The Da Vinci Code
Author: Dan Brown, 1964
Year: 2003
Database
Application
User interface
SPARQL
Authors record
Dan Brown
1964
http://viaf.org/viaf/102403515URI
Name
Year
The Da Vinci Code
Books record
http://viaf.org/viaf/102403515
2003
http://openlibrary.org/works/OL76837W
Title
URI
Author
Year
Data 중복 구축 방지
LOD 구축에 있어서 인터링킹의 필요성
Data 중복 구축 방지 활용 예 – BBC Music Site
Artist Profile
Artist Biography
LOD 구축에 있어서 인터링킹의 필요성
잠재적 지식 발견 및 지식의 확장
LOD 구축에 있어서 인터링킹의 필요성
<RDF:Description RDF:about="http://www.history.go.kr/ontology/사건_ 거란, 만주족 전쟁 ">
<nikh:isCausedBy RDF:datatype="http://www.w3.org/2001/XMLSchema#string">매(海東靑)</nikh:title>
<nikh:hasStartAge RDF:datatype="http://www.w3.org/2001/XMLSchema#string">xxx</nikh:hasStartAge>
<nikh:beginDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">xxx</nikh:beginDate>
<nikh:hasEventPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">xxx</nikh:hasEventPlace>
<RDF:type RDF:resource="http://www.history.go.kr/ontology/event"/>
</RDF:Description>
지식의 확장: 매사냥으로 인한 거란, 만주족 간의 전쟁 유발
<RDF:Description RDF:about="http://www.biology.go.kr/ontology/조류">
<nikh:hasName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">매(海東靑)</nikh:title>
<nikh:isCategory RDF:datatype="http://www.w3.org/2001/XMLSchema#string">척삭동물</nikh:hasStartAge>
<nikh:isSpecies RDF:datatype="http://www.w3.org/2001/XMLSchema#string">매과</nikh:beginDate>
<nikh:isLivedIn RDF:datatype="http://www.w3.org/2001/XMLSchema#string">xxx</nikh:hasEventPlace>
<RDF:type RDF:resource="http://www. biology.go.kr/ontology/event"/>
</RDF:Description>
owl:sameAs
역사
의약
특허
생물
약초
잠재적 지식 발견 및 지식의 확장
LOD 구축에 있어서 인터링킹의 필요성
엄청난 양의 LOD Cloud01
비효율적인 LOD Link02
InterLinking 자동화란
효율적인 Linking 추천03
자동으로 Source DataSet 에서 의미 있는 인
스턴스를 추출하고 Target DataSet 로 부터
최대로 유사한 인스턴스를 찾아 추천해 주
는 시스템 필요
InterLinking 자동화란
인터링킹 방법
Schema Dependent
RDF Predicate의 의미에 관한 지식이 필요
Ex) Source DataSet의 Predicate #PreLable와 Target DataSet의 Predicate
#Name과 같다는 것을 알아야 한다
Publisher 마다 다른 Schema 구조로 데이터를 저장 발행
Schema Independent
스키마에 대한 인간의 지식을 필요하지 않음
 Ontology Matching
 Graph Matching

 Instance Matching
 Data Matching

인터링킹
방법
인터링킹 시스템 - SERIMI
시스템 비교 KEY 차별성 알고리즘 절차 예시
SERIMI Predicate String Matching
(RWSA) Algorithm
1) Source DataSet의 Class를 선택
2) Class의 인스턴스를 선택
3) 그 인스턴스의 Predicate를 선
택
4) High Entropy 들만 선택
5) Property List를 생성
6) Target DataSet도 동일 수행
7) Predicate으로 같거나 비슷한
Predicate를 탐색
8) 탐색된 Property의 값을 본 후
Interlinking 할지 말지 결정
9) 결정되면 sameAs
4,5,6,7,9) 다음페이지 참고
InterLinking 자동화란
Schema Independent
<RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종">
<nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName>
<nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate>
<nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate>
<nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace>
<nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather>
<nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather>
</RDF:Description>
Subject
Predicate Object
Property List 생성
realName
birthDate
deathDate
High Entropy
Predicate 선택
realName (High Entropy)
birthDate (High Entropy)
deathDate (High Entropy)
tombPlace (Low Entropy)
Target DataSet
에서도 동일 수행
name
bDate
dDate
InterLinking
<http://source.dataset.org/resource/왕우>
owl:sameAs <http://target.dataset.org/왕우>;
같거나 비슷한
Predicate 탐색
realName = name
birthDate = bDate
deathDate = dDate
1Step 2Step 3Step 4Step 5Step
<RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종">
<nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName>
<nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate>
<nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate>
<nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace>
<nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather>
<nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather>
</RDF:Description>
Subject
Predicate Object
인터링킹 시스템 - SERIMI
InterLinking 자동화란
시스템 비교 KEY 차별성 알고리즘 절차 예시
SLINT Predicate Blocking
Step
Coverage
Discriminability
Dice Coefficient
TF-IDF
Inverted-Indexing
(Weighted
Co-occurrence)
1) 중요한 Predicate를 선택 -
Coverage & Discriminability
2) Source DataSet과 Target
DataSet에서 선택된 Predicate
들은 같은 Type 끼리 결합해서
Predicate Alignment를 생성
3) Predicate Alignment의 신뢰도
평가 – Dice Coefficent
4) 각각의 Source, Target DataSet
으로 부터 Object의 값을 추출
해서 Inverted-Indexing
5) URI, String – TF-IDF
6) Decimal, Integer, Date – 0/1
7) 적정 Threshold 이상 sameAs
3) 유사한 Predicate는 유사
한 정보를 의미한다
Ex) title <-> titleKor
인터링킹 시스템 - SLINT
InterLinking 자동화란
Schema Independent
<RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종">
<nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName>
<nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate>
<nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate>
<nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace>
<nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather>
<nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather>
</RDF:Description>
Subject
Predicate Object
Predicate Alignment를 생성
Type:string || S:realName, D:name
Type:date || S:birthDate, D:bDate
Type:Integer || S:age, D:age
중요한
Predicate 선택
realName (Coverage) birthDate
(Coverage) deathDate (Coverage)
tombPlace (Discriminability)
Predicate Alignment의 신뢰도
평가
Ex) title <-> titleKor
String: Token
URI: ‘/’ Split
Decimal: 2-decimal digit
Integer, Date: 변경없음
InterLinking
<http://source.dataset.org/resource/왕우>
owl:sameAs <http://target.dataset.org/왕우>;
Object의 값 추출
Ex) 숙종, 이순신, 강감찬, …
Inverted-Indexing
URI, String 이면 TF-IDF
Decimal, Integer, Date 이면 0/1
1Step 2Step 3Step 4Step 5Step
<RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종">
<nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName>
<nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate>
<nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate>
<nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace>
<nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather>
<nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather>
</RDF:Description>
Subject
Predicate Object
인터링킹 시스템 - SLINT
InterLinking 자동화란
시스템 비교 KEY 차별성 알고리즘 절차 예시
SILK Predicate
AgreeMaker Predicate
인터링킹 시스템 – SILK, AgreeMaker
InterLinking 자동화란
Schema Independent
InterLinking 자동화란
인터링킹 시스템 – SILK 관리도구
InterLinking 자동화란
인터링킹 시스템 – SILK 관리도구
InterLinking 의 목표
InterLinking 의 목표
THANK YOU

More Related Content

What's hot

공공데이터, 현재 우리는?
공공데이터, 현재 우리는?공공데이터, 현재 우리는?
공공데이터, 현재 우리는?Myungjin Lee
 
LOD (linked open data) part 2 lod 구축과 현황
LOD (linked open data) part 2   lod 구축과 현황LOD (linked open data) part 2   lod 구축과 현황
LOD (linked open data) part 2 lod 구축과 현황LiST Inc
 
LOD를 말하다: Europeana, BBC, LinkedUp
LOD를 말하다: Europeana, BBC, LinkedUpLOD를 말하다: Europeana, BBC, LinkedUp
LOD를 말하다: Europeana, BBC, LinkedUpHansung University
 
개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석
개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석
개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석Hansung University
 
Linked Open Data Tutorial
Linked Open Data TutorialLinked Open Data Tutorial
Linked Open Data TutorialMyungjin Lee
 
Linked Data 이야기
Linked Data 이야기Linked Data 이야기
Linked Data 이야기Haklae Kim
 
웹의 또 다른 모습, 글로벌 데이터베이스 Linked open data
웹의 또 다른 모습, 글로벌 데이터베이스 Linked open data웹의 또 다른 모습, 글로벌 데이터베이스 Linked open data
웹의 또 다른 모습, 글로벌 데이터베이스 Linked open dataHansung University
 
Interlinking for Linked Data
Interlinking for Linked DataInterlinking for Linked Data
Interlinking for Linked DataMyungjin Lee
 
서울시 열린데이터 광장 문화관광 분야 LOD 서비스
서울시 열린데이터 광장 문화관광 분야 LOD 서비스서울시 열린데이터 광장 문화관광 분야 LOD 서비스
서울시 열린데이터 광장 문화관광 분야 LOD 서비스Myungjin Lee
 
Linked Data 이야기
Linked Data 이야기Linked Data 이야기
Linked Data 이야기Haklae Kim
 
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가도서관은 웹에 존재하는가
도서관은 웹에 존재하는가Hansung University
 
LODAC 2017 Linked Open Data Workshop
LODAC 2017 Linked Open Data WorkshopLODAC 2017 Linked Open Data Workshop
LODAC 2017 Linked Open Data WorkshopMyungjin Lee
 
도서관 링크드 데이터 동향(KISTI)
도서관 링크드 데이터 동향(KISTI)도서관 링크드 데이터 동향(KISTI)
도서관 링크드 데이터 동향(KISTI)Hansung University
 
LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인Hansung University
 
도서관 분야의 링크드 데이터 구축 동향
도서관 분야의 링크드 데이터 구축 동향도서관 분야의 링크드 데이터 구축 동향
도서관 분야의 링크드 데이터 구축 동향Hansung University
 
공공데이터와 Linked open data
공공데이터와 Linked open data공공데이터와 Linked open data
공공데이터와 Linked open dataMyungjin Lee
 

What's hot (19)

공공데이터, 현재 우리는?
공공데이터, 현재 우리는?공공데이터, 현재 우리는?
공공데이터, 현재 우리는?
 
LOD (linked open data) part 2 lod 구축과 현황
LOD (linked open data) part 2   lod 구축과 현황LOD (linked open data) part 2   lod 구축과 현황
LOD (linked open data) part 2 lod 구축과 현황
 
LOD를 말하다: Europeana, BBC, LinkedUp
LOD를 말하다: Europeana, BBC, LinkedUpLOD를 말하다: Europeana, BBC, LinkedUp
LOD를 말하다: Europeana, BBC, LinkedUp
 
개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석
개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석
개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석
 
Linked Open Data Tutorial
Linked Open Data TutorialLinked Open Data Tutorial
Linked Open Data Tutorial
 
Linked Open Data
Linked Open DataLinked Open Data
Linked Open Data
 
Linked Data 이야기
Linked Data 이야기Linked Data 이야기
Linked Data 이야기
 
웹의 또 다른 모습, 글로벌 데이터베이스 Linked open data
웹의 또 다른 모습, 글로벌 데이터베이스 Linked open data웹의 또 다른 모습, 글로벌 데이터베이스 Linked open data
웹의 또 다른 모습, 글로벌 데이터베이스 Linked open data
 
Interlinking for Linked Data
Interlinking for Linked DataInterlinking for Linked Data
Interlinking for Linked Data
 
서울시 열린데이터 광장 문화관광 분야 LOD 서비스
서울시 열린데이터 광장 문화관광 분야 LOD 서비스서울시 열린데이터 광장 문화관광 분야 LOD 서비스
서울시 열린데이터 광장 문화관광 분야 LOD 서비스
 
library linked data
library linked datalibrary linked data
library linked data
 
Linked Data 이야기
Linked Data 이야기Linked Data 이야기
Linked Data 이야기
 
도서관은 웹에 존재하는가
도서관은 웹에 존재하는가도서관은 웹에 존재하는가
도서관은 웹에 존재하는가
 
LODAC 2017 Linked Open Data Workshop
LODAC 2017 Linked Open Data WorkshopLODAC 2017 Linked Open Data Workshop
LODAC 2017 Linked Open Data Workshop
 
도서관 링크드 데이터 동향(KISTI)
도서관 링크드 데이터 동향(KISTI)도서관 링크드 데이터 동향(KISTI)
도서관 링크드 데이터 동향(KISTI)
 
LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인
 
도서관 분야의 링크드 데이터 구축 동향
도서관 분야의 링크드 데이터 구축 동향도서관 분야의 링크드 데이터 구축 동향
도서관 분야의 링크드 데이터 구축 동향
 
RDF 해설서
RDF 해설서RDF 해설서
RDF 해설서
 
공공데이터와 Linked open data
공공데이터와 Linked open data공공데이터와 Linked open data
공공데이터와 Linked open data
 

Viewers also liked

LOD 기반의 다중 개체 식별 시스템 개발 및 그 활용
LOD 기반의 다중 개체 식별 시스템 개발 및 그 활용LOD 기반의 다중 개체 식별 시스템 개발 및 그 활용
LOD 기반의 다중 개체 식별 시스템 개발 및 그 활용Haklae Kim
 
goetz_phddefense
goetz_phddefensegoetz_phddefense
goetz_phddefenseJohn Goetz
 
Big Data on the Web – What We Will Do
Big Data on the Web – What We Will Do Big Data on the Web – What We Will Do
Big Data on the Web – What We Will Do Haklae Kim
 
Technology Trends for LOD and Semantic Web
Technology Trends for LOD and Semantic WebTechnology Trends for LOD and Semantic Web
Technology Trends for LOD and Semantic WebSaltlux Inc.
 
Linked Open Government Data
Linked Open Government DataLinked Open Government Data
Linked Open Government DataMyungjin Lee
 
전문가토크릴레이 2탄 Open data and linked data (김학래 박사)
전문가토크릴레이 2탄 Open data and linked data (김학래 박사)전문가토크릴레이 2탄 Open data and linked data (김학래 박사)
전문가토크릴레이 2탄 Open data and linked data (김학래 박사)Saltlux zinyus
 
05 Coreonto It Device Ontology 20080623
05 Coreonto It Device Ontology 2008062305 Coreonto It Device Ontology 20080623
05 Coreonto It Device Ontology 20080623sejin nam
 
쉽게 이해하는 LOD
쉽게 이해하는 LOD쉽게 이해하는 LOD
쉽게 이해하는 LODMyungjin Lee
 
Linked Data Technology and Status
Linked Data Technology and StatusLinked Data Technology and Status
Linked Data Technology and StatusMyungjin Lee
 
센서데이터 웹으로의 비상
센서데이터 웹으로의 비상센서데이터 웹으로의 비상
센서데이터 웹으로의 비상Haklae Kim
 
왓슨컴퓨터의 인공지능
왓슨컴퓨터의 인공지능왓슨컴퓨터의 인공지능
왓슨컴퓨터의 인공지능SeokWon Kim
 
Ibm왓슨과 apple 시리
Ibm왓슨과 apple 시리Ibm왓슨과 apple 시리
Ibm왓슨과 apple 시리Saltlux zinyus
 

Viewers also liked (14)

LOD 기반의 다중 개체 식별 시스템 개발 및 그 활용
LOD 기반의 다중 개체 식별 시스템 개발 및 그 활용LOD 기반의 다중 개체 식별 시스템 개발 및 그 활용
LOD 기반의 다중 개체 식별 시스템 개발 및 그 활용
 
คู่มือ ชรบ.
คู่มือ ชรบ.คู่มือ ชรบ.
คู่มือ ชรบ.
 
goetz_phddefense
goetz_phddefensegoetz_phddefense
goetz_phddefense
 
Big Data on the Web – What We Will Do
Big Data on the Web – What We Will Do Big Data on the Web – What We Will Do
Big Data on the Web – What We Will Do
 
Technology Trends for LOD and Semantic Web
Technology Trends for LOD and Semantic WebTechnology Trends for LOD and Semantic Web
Technology Trends for LOD and Semantic Web
 
Linked Open Government Data
Linked Open Government DataLinked Open Government Data
Linked Open Government Data
 
전문가토크릴레이 2탄 Open data and linked data (김학래 박사)
전문가토크릴레이 2탄 Open data and linked data (김학래 박사)전문가토크릴레이 2탄 Open data and linked data (김학래 박사)
전문가토크릴레이 2탄 Open data and linked data (김학래 박사)
 
M S Anantha Prasad resume
M S Anantha Prasad   resumeM S Anantha Prasad   resume
M S Anantha Prasad resume
 
05 Coreonto It Device Ontology 20080623
05 Coreonto It Device Ontology 2008062305 Coreonto It Device Ontology 20080623
05 Coreonto It Device Ontology 20080623
 
쉽게 이해하는 LOD
쉽게 이해하는 LOD쉽게 이해하는 LOD
쉽게 이해하는 LOD
 
Linked Data Technology and Status
Linked Data Technology and StatusLinked Data Technology and Status
Linked Data Technology and Status
 
센서데이터 웹으로의 비상
센서데이터 웹으로의 비상센서데이터 웹으로의 비상
센서데이터 웹으로의 비상
 
왓슨컴퓨터의 인공지능
왓슨컴퓨터의 인공지능왓슨컴퓨터의 인공지능
왓슨컴퓨터의 인공지능
 
Ibm왓슨과 apple 시리
Ibm왓슨과 apple 시리Ibm왓슨과 apple 시리
Ibm왓슨과 apple 시리
 

Similar to 인터링킹, InterLinking, LOD

LOD 구축현황 과 현황
LOD 구축현황 과 현황LOD 구축현황 과 현황
LOD 구축현황 과 현황sbchae
 
서울시 링크드 데이터 서비스 소개-Overview
서울시 링크드 데이터 서비스 소개-Overview서울시 링크드 데이터 서비스 소개-Overview
서울시 링크드 데이터 서비스 소개-OverviewHaklae Kim
 
국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향Haklae Kim
 
대한민국, 잇다!
대한민국, 잇다! 대한민국, 잇다!
대한민국, 잇다! Haklae Kim
 
Pharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked DataPharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked Dataymchu88
 
Pharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked DataPharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked Dataymchu88
 
CKAT (Connected Knowledge and Tools) #1 - Seoul City
CKAT (Connected Knowledge and Tools) #1 - Seoul CityCKAT (Connected Knowledge and Tools) #1 - Seoul City
CKAT (Connected Knowledge and Tools) #1 - Seoul Cityok-korea
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked dataymchu88
 
Node.js에서 공공API를 활용해서 개발하기
Node.js에서 공공API를 활용해서 개발하기Node.js에서 공공API를 활용해서 개발하기
Node.js에서 공공API를 활용해서 개발하기Inho Kwon
 
Open source engineering
Open source engineeringOpen source engineering
Open source engineeringYoungSu Son
 
몽고디비교육1일차
몽고디비교육1일차몽고디비교육1일차
몽고디비교육1일차seung-hyun Park
 
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012Daum DNA
 
DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료Hyun Namgoong
 
도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]ymchu88
 
스프링 스터디 1장
스프링 스터디 1장스프링 스터디 1장
스프링 스터디 1장Seongchan Kang
 
Semantic Web: sustainable solution for ending hunger of data
Semantic Web: sustainable solution for ending hunger of dataSemantic Web: sustainable solution for ending hunger of data
Semantic Web: sustainable solution for ending hunger of dataHaklae Kim
 
Open source engineering - 0.1
Open source engineering - 0.1Open source engineering - 0.1
Open source engineering - 0.1YoungSu Son
 

Similar to 인터링킹, InterLinking, LOD (20)

LOD 구축현황 과 현황
LOD 구축현황 과 현황LOD 구축현황 과 현황
LOD 구축현황 과 현황
 
서울시 링크드 데이터 서비스 소개-Overview
서울시 링크드 데이터 서비스 소개-Overview서울시 링크드 데이터 서비스 소개-Overview
서울시 링크드 데이터 서비스 소개-Overview
 
국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향
 
Kswc2012
Kswc2012Kswc2012
Kswc2012
 
대한민국, 잇다!
대한민국, 잇다! 대한민국, 잇다!
대한민국, 잇다!
 
1.sos2010 tony
1.sos2010 tony1.sos2010 tony
1.sos2010 tony
 
Pharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked DataPharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked Data
 
Pharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked DataPharmaceutical Industry and Linked Data
Pharmaceutical Industry and Linked Data
 
CKAT (Connected Knowledge and Tools) #1 - Seoul City
CKAT (Connected Knowledge and Tools) #1 - Seoul CityCKAT (Connected Knowledge and Tools) #1 - Seoul City
CKAT (Connected Knowledge and Tools) #1 - Seoul City
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked data
 
Druid+superset
Druid+supersetDruid+superset
Druid+superset
 
Node.js에서 공공API를 활용해서 개발하기
Node.js에서 공공API를 활용해서 개발하기Node.js에서 공공API를 활용해서 개발하기
Node.js에서 공공API를 활용해서 개발하기
 
Open source engineering
Open source engineeringOpen source engineering
Open source engineering
 
몽고디비교육1일차
몽고디비교육1일차몽고디비교육1일차
몽고디비교육1일차
 
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
 
DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료
 
도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]
 
스프링 스터디 1장
스프링 스터디 1장스프링 스터디 1장
스프링 스터디 1장
 
Semantic Web: sustainable solution for ending hunger of data
Semantic Web: sustainable solution for ending hunger of dataSemantic Web: sustainable solution for ending hunger of data
Semantic Web: sustainable solution for ending hunger of data
 
Open source engineering - 0.1
Open source engineering - 0.1Open source engineering - 0.1
Open source engineering - 0.1
 

인터링킹, InterLinking, LOD

  • 2. 국가적 차원 공공 Data 공개 Linked Open Data 가 무엇인지? Linked Data의 기본원칙 RDF GRAPH MODEL 국외의 경우 LOD CLOUD현황 CONTENTS InterLinking 에 앞서01 InterLinking 예시 InterLinking 이란02 Data 중복 구축 방지 Data 중복 구축 방지 활용 예 잠재적 지식 발견 및 지식의 확장 InterLinking 의 필요성03 인터링킹 방법 인터링킹 시스템 인터링킹 목표 InterLinking 의 자동화04
  • 3. 국가 DB open 투명성 확보 데이터의 창조적 활용 InterLinking 에 앞서 - 국가적 차원 공공 Data 공개
  • 4. InterLinking 에 앞서 - 국가적 차원 공공 Data 공개 국가 DB open 투명성 확보 데이터의 창조적 활용
  • 5. InterLinking 에 앞서 - 개방 공공정보를 적극적으로 개방 누구나 자유롭게 활용 하도록 Linked Open Data 로 제공 융합 융·복합 연계 체계 구축 원천데이터를 Linked Open Data(LOD) 기반으로 통합 재활용 정보제공 환경 마련 Linked Open Data 개방·연계· 활용 플랫폼 제공 창조 새로운 콘텐츠 창출 개방된 공공정보를 민간에서 타 분야 지식정보와 Cross-Over 하여 신규 서비스 개발 정부 국가적 차원 공공 Data 공개
  • 6. InterLinking 에 앞서 - HTML Linked Open Data 가 무엇인지? Resource Resource Resource Resource Resource Resource Resource 링크 링크 링크 링크 링크링크 링크 문서 중심의 Web(Web of Documents) – HTML (Hyperlink)
  • 7. InterLinking 에 앞서 - HTML Linked Open Data 가 무엇인지? Human Readable
  • 8. 예종 숙종 1054.07 문종 왕옹 nikh:hasFather nikh:hasGrandFather nikh:realName Nikh:hasFather nikh:birthDate 경릉(景陵) nikh:tombPlace InterLinking 에 앞서 - RDF Linked Open Data 가 무엇인지? Data(Things) 중심의 Web(Web of data)– RDF (데이터 간의 연계, 의미 부여)
  • 9. InterLinking 에 앞서 - RDF Linked Open Data 가 무엇인지? Machine Readable
  • 10. 1) Use URIs as names for things 2) Use HTTP URIs so that people can look up those names. 3) When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) 4) Include links to other URIs. so that they can discover more things. InterLinking 에 앞서 - Linked Open Data 가 무엇인지? Linked Data의 기본원칙 4가지 – 팀 버너스 리
  • 11. 주어 (Subject) 목적어 (Object) 술어(Predicate) 주어(Subject) 술어(Predicate) 목적어(Object) 예종의 아버지는 숙종이다 <RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종"> <nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName> <nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate> <nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate> <nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace> <nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather> <nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather> </RDF:Description> Subject Predicate Object InterLinking 에 앞서 - RDF GRAPH MODEL Linked Open Data 가 무엇인지?
  • 12. InterLinking 에 앞서 - RDF GRAPH MODEL Linked Open Data 가 무엇인지?
  • 13. InterLinking 에 앞서 – 국외의 경우 Linked Open Data 가 무엇인지?
  • 14. InterLinking 에 앞서 – 국외의 경우 Linked Open Data 가 무엇인지?
  • 15. InterLinking 에 앞서 – 국외의 경우 Linked Open Data 가 무엇인지?
  • 16. 2008 ADD TITLE ADD TITLE 2009 2010 2011 InterLinking 에 앞서 – LOD CLOUD 현황 Linked Open Data 가 무엇인지? Version 0.3, 09/19/2011
  • 17. InterLinking 에 앞서 – LOD CLOUD현황 Linked Open Data 가 무엇인지? Version 0.3, 09/19/2011
  • 18. InterLinking 이란 <http://dbpedia.org/resource/Amsterdam> owl:sameAs <http://rdf.freebase.com/ns/...> ; owl:sameAs <http://sws.geonames.org/2759793> ; ... <http://sws.geonames.org/2759793> owl:sameAs <http://dbpedia.org/resource/Amsterdam> wgs84_pos:lat “52.3666667” ; wgs84_pos:long “4.8833333” ; geo:inCountry <http://www.geonames.org/countries/#NL> ; ... Dbpedia DataSet에 있는 암스테르담과 Geonames DataSet에 있는 2759793(암스테르담)을 owl:sameAs로 인스턴스 동일화 <http://dbpedia.org/resource/Amsterdam> owl:sameAs <http://sws.geonames.org/2759793>; InterLinking 의 예시
  • 19. LOD 구축에 있어서 인터링킹의 필요성 Data 중복 구축 방지
  • 20. Relational databases: primary keys Books Title Author Year ID Authors Name Year ID Primary key Primary key Foreign key Authors record Dan Brown 1964 456ID Name Year The Da Vinci Code Books record 456 2003 1289 Title ID Author Year Data 중복 구축 방지 LOD 구축에 있어서 인터링킹의 필요성
  • 21. Relational databases and applications Select title, year from books Select name, year from authors where books.author=authors.id Title: The Da Vinci Code Author: Dan Brown, 1964 Year: 2003 Database Application User interface Authors record Dan Brown 1964 456ID Name Year The Da Vinci Code Books record 456 2003 1289 Title ID Author Year SQL Data 중복 구축 방지 LOD 구축에 있어서 인터링킹의 필요성
  • 22. OpenLibrary Title Author Year URI VIAF Name Year URI Primary key Primary key Foreign key Authors record Dan Brown 1964 http://viaf.org/viaf/102403515URI Name Year The Da Vinci Code Books record http://viaf.org/viaf/102403515 2003 http://openlibrary.org/works/OL76837W Title URI Author Year Data 중복 구축 방지 LOD 구축에 있어서 인터링킹의 필요성 Triple Repository: URIs(primary keys)
  • 23. Linked data and applications Select ?title ?year … Select ?name ?year WHERE ….. Title: The Da Vinci Code Author: Dan Brown, 1964 Year: 2003 Database Application User interface SPARQL Authors record Dan Brown 1964 http://viaf.org/viaf/102403515URI Name Year The Da Vinci Code Books record http://viaf.org/viaf/102403515 2003 http://openlibrary.org/works/OL76837W Title URI Author Year Data 중복 구축 방지 LOD 구축에 있어서 인터링킹의 필요성
  • 24. Data 중복 구축 방지 활용 예 – BBC Music Site Artist Profile Artist Biography LOD 구축에 있어서 인터링킹의 필요성
  • 25. 잠재적 지식 발견 및 지식의 확장 LOD 구축에 있어서 인터링킹의 필요성 <RDF:Description RDF:about="http://www.history.go.kr/ontology/사건_ 거란, 만주족 전쟁 "> <nikh:isCausedBy RDF:datatype="http://www.w3.org/2001/XMLSchema#string">매(海東靑)</nikh:title> <nikh:hasStartAge RDF:datatype="http://www.w3.org/2001/XMLSchema#string">xxx</nikh:hasStartAge> <nikh:beginDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">xxx</nikh:beginDate> <nikh:hasEventPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">xxx</nikh:hasEventPlace> <RDF:type RDF:resource="http://www.history.go.kr/ontology/event"/> </RDF:Description> 지식의 확장: 매사냥으로 인한 거란, 만주족 간의 전쟁 유발 <RDF:Description RDF:about="http://www.biology.go.kr/ontology/조류"> <nikh:hasName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">매(海東靑)</nikh:title> <nikh:isCategory RDF:datatype="http://www.w3.org/2001/XMLSchema#string">척삭동물</nikh:hasStartAge> <nikh:isSpecies RDF:datatype="http://www.w3.org/2001/XMLSchema#string">매과</nikh:beginDate> <nikh:isLivedIn RDF:datatype="http://www.w3.org/2001/XMLSchema#string">xxx</nikh:hasEventPlace> <RDF:type RDF:resource="http://www. biology.go.kr/ontology/event"/> </RDF:Description> owl:sameAs
  • 26. 역사 의약 특허 생물 약초 잠재적 지식 발견 및 지식의 확장 LOD 구축에 있어서 인터링킹의 필요성
  • 27. 엄청난 양의 LOD Cloud01 비효율적인 LOD Link02 InterLinking 자동화란 효율적인 Linking 추천03 자동으로 Source DataSet 에서 의미 있는 인 스턴스를 추출하고 Target DataSet 로 부터 최대로 유사한 인스턴스를 찾아 추천해 주 는 시스템 필요
  • 28. InterLinking 자동화란 인터링킹 방법 Schema Dependent RDF Predicate의 의미에 관한 지식이 필요 Ex) Source DataSet의 Predicate #PreLable와 Target DataSet의 Predicate #Name과 같다는 것을 알아야 한다 Publisher 마다 다른 Schema 구조로 데이터를 저장 발행 Schema Independent 스키마에 대한 인간의 지식을 필요하지 않음  Ontology Matching  Graph Matching   Instance Matching  Data Matching  인터링킹 방법
  • 29. 인터링킹 시스템 - SERIMI 시스템 비교 KEY 차별성 알고리즘 절차 예시 SERIMI Predicate String Matching (RWSA) Algorithm 1) Source DataSet의 Class를 선택 2) Class의 인스턴스를 선택 3) 그 인스턴스의 Predicate를 선 택 4) High Entropy 들만 선택 5) Property List를 생성 6) Target DataSet도 동일 수행 7) Predicate으로 같거나 비슷한 Predicate를 탐색 8) 탐색된 Property의 값을 본 후 Interlinking 할지 말지 결정 9) 결정되면 sameAs 4,5,6,7,9) 다음페이지 참고 InterLinking 자동화란 Schema Independent <RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종"> <nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName> <nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate> <nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate> <nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace> <nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather> <nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather> </RDF:Description> Subject Predicate Object
  • 30. Property List 생성 realName birthDate deathDate High Entropy Predicate 선택 realName (High Entropy) birthDate (High Entropy) deathDate (High Entropy) tombPlace (Low Entropy) Target DataSet 에서도 동일 수행 name bDate dDate InterLinking <http://source.dataset.org/resource/왕우> owl:sameAs <http://target.dataset.org/왕우>; 같거나 비슷한 Predicate 탐색 realName = name birthDate = bDate deathDate = dDate 1Step 2Step 3Step 4Step 5Step <RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종"> <nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName> <nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate> <nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate> <nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace> <nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather> <nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather> </RDF:Description> Subject Predicate Object 인터링킹 시스템 - SERIMI InterLinking 자동화란
  • 31. 시스템 비교 KEY 차별성 알고리즘 절차 예시 SLINT Predicate Blocking Step Coverage Discriminability Dice Coefficient TF-IDF Inverted-Indexing (Weighted Co-occurrence) 1) 중요한 Predicate를 선택 - Coverage & Discriminability 2) Source DataSet과 Target DataSet에서 선택된 Predicate 들은 같은 Type 끼리 결합해서 Predicate Alignment를 생성 3) Predicate Alignment의 신뢰도 평가 – Dice Coefficent 4) 각각의 Source, Target DataSet 으로 부터 Object의 값을 추출 해서 Inverted-Indexing 5) URI, String – TF-IDF 6) Decimal, Integer, Date – 0/1 7) 적정 Threshold 이상 sameAs 3) 유사한 Predicate는 유사 한 정보를 의미한다 Ex) title <-> titleKor 인터링킹 시스템 - SLINT InterLinking 자동화란 Schema Independent <RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종"> <nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName> <nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate> <nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate> <nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace> <nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather> <nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather> </RDF:Description> Subject Predicate Object
  • 32. Predicate Alignment를 생성 Type:string || S:realName, D:name Type:date || S:birthDate, D:bDate Type:Integer || S:age, D:age 중요한 Predicate 선택 realName (Coverage) birthDate (Coverage) deathDate (Coverage) tombPlace (Discriminability) Predicate Alignment의 신뢰도 평가 Ex) title <-> titleKor String: Token URI: ‘/’ Split Decimal: 2-decimal digit Integer, Date: 변경없음 InterLinking <http://source.dataset.org/resource/왕우> owl:sameAs <http://target.dataset.org/왕우>; Object의 값 추출 Ex) 숙종, 이순신, 강감찬, … Inverted-Indexing URI, String 이면 TF-IDF Decimal, Integer, Date 이면 0/1 1Step 2Step 3Step 4Step 5Step <RDF:Description RDF:about="http://www.history.go.kr/ontology/인명_예종"> <nikh:realName RDF:datatype="http://www.w3.org/2001/XMLSchema#string">왕우</nikh:realName> <nikh:birthDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">10790100</nikh:birthDate> <nikh:deathDate RDF:datatype="http://www.w3.org/2001/XMLSchema#string">11220400</nikh:deathDate> <nikh:tombPlace RDF:datatype="http://www.w3.org/2001/XMLSchema#string">유릉(裕陵)</nikh:tombPlace> <nikh:hasFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">숙종(肅宗)</nikh:hasFather> <nikh:hasGrandFather RDF:datatype="http://www.w3.org/2001/XMLSchema#string">문종(文宗)</nikh:hasGrandFather> </RDF:Description> Subject Predicate Object 인터링킹 시스템 - SLINT InterLinking 자동화란
  • 33. 시스템 비교 KEY 차별성 알고리즘 절차 예시 SILK Predicate AgreeMaker Predicate 인터링킹 시스템 – SILK, AgreeMaker InterLinking 자동화란 Schema Independent