서울시 Linked Data 서비스 사례 소개
오픈 데이터에서 링크드 데이터로 진화
Open Knowledge Foundation Korea, 2013
구축 범위
Modeling
- 서울시 열린데이터광장 데이터 중 시범과제에 적합한 데이터셋 선정 ( 문화시설
- 추가로 문화재청 데이터와 행정구역 모델링
문화재
( 문화재
청 )
문화재
( 문화재
청 )
문화시설
( 열린데
이터광
장 )
문화시설
( 열린데
이터광
장 )
행정구역행정구역
모델링 주안점 ( 방향 )
Modeling
3
표현력 보다는 기존 데이터의 연결을 통한 Linked Data
구성
기존 Vocabulary 의 재사용을 통한 모델링
- dc, dcterm, foaf, sioc, schem.org 등
11
22
33
44
외부 데이터셋과의 연결성 강화 (dbpedia)
- 구축된 데이터의 silo 경계
영어권에서도 활용 가능한 영문 레이블 동시 제공
구축절차
Modeling
데이터셋 선정
4
11
* 서울시 열린데이터 광장에서 모델링 대상 데이터셋 선정 ( 문화시설 )
* 문화재청 , 행정구역 모델링 추가
데이터셋 항목 검토 및 매핑22
* 데이터셋의 개별 항목과 온톨로지 ( 클래스 , 속성 ) 의 매핑 관계 검토
* 외부 어휘의 재사용 여부 및 범위 결정
* 어휘와 데이터셋 항목 매핑
URI 체계 결정 및 온톨로지 설계 완료33
* 클래스 , 속성 , 인스턴스 URI 체계 결정
* 온톨로지 모델링
문화시설 – 1. Raw Data
Modeling
5
문화시설 – 1. Raw Data
Modeling
6
필드명 필드설명 사용여부
id 일련번호 X
facility_code 문화시설코드 ?
management_code 관리번호 X
subject_code 주제분류코드 X
theme_code 테마분류코드 X
facility_name 문화시설명 O
region1 시도 O
region2 군구 O
region3 읍면동 O
san_yn 산지여부 O
bon_yn 산지여부 O
bu_yn 산지여부 O
main_img 대표이미지 O
address 주소 O
phone 전화번호 O
fax 팩스번호 O
homepage 홈페이지 O
open_hour 관람시간 O
enter_fee 관람료 O
close_day 휴관일 O
open_day 개관일자 O
seat_cnt 객석수 O
x_coord x좌표 O
y_coord y좌표 O
etc_desc 기타사항 O
facility_desc 시설소개 O
enter_free 무료구분 X
x_wgs84 위도 O
y_wgs84 경도 O
facility_name_eng 영문명 O
address_eng 영문주소(Full) O
zipcode 우편번호 O
serial 시리얼 X
address_kor 주소(시/구/동) O
address_eng2 영문주소2 O
문화시설 – 2. Grouping
Modeling
7
문화시설 – 3. 기존 Vocabulary 분석
Modeling
문화시설 – 3. 기존 Vocabulary 분석
Modeling
문화시설 – 4. 클래스 , 속성 모델링 진행
Modeling
문화시설 초기 클래스 구조
문화시설 – 5. schema.org 재사용 상의 이슈
Modeling
schema.org 클래스 구조
문화시설 – 5. schema.org 재사용 상의 이슈
Modeling
Another Type System 사용
Place
CivicStructure
Musieum
국립중앙박물관
type
장소
이름
구청
문화예술회관
구민회관
영화관
박물관
갤러리
기념관
전시관
궁
국악원
문화원
수련관
type
전시시설
박물관 기념관 갤러리
type 열거형 타입 시스템
계층형 타입 시스템
Schema.org 클래스
문화시설 – 6. 모델링을 위한 공유 Template
Modeling
( 최종본 아님 )
문화시설 – 7. 문화시설 온톨로지 명세서
Modeling
http://lod.datahub.kr/
문화재– 문화재청 데이터 활용
Modeling
15
문화재– 1. 문화재청 Raw Data
Modeling
16
17
data.seoul.go.kr
필드명 필드설명 사용여부 비고
id 아이디 변경됨(x->o)
category 종목명 O 종목(열거형), 지정번호로 구분
category_eng 종목명_영문 O name{@en}
name 이름 X 한자 포함된 전체 이름
eng_name 이름(영어) O name{@en}
kor_name 이름(한글) O name{@ko}
ch_name 이름(한자) O name{@zh}
class 분류 X
class1 분류 O
class2 분류 O
class3 분류 O
class4 분류 O
concept 문화재청(SKOS) 분류명 O 문화재분류 매핑을 위해 추가한 필드
quantity 수량 O
designate 지정일 O 문화재 지정일
address 소재지 O address에서 주소 부분만 추출
address_cls1 시도 O
address_cls2 시군구 O
address_cls3 읍면동 O
address_cls1_eng 시도(영문) O
address_cls2_eng 시군구(영문) O
address_cls3_eng 읍면동(영문) O
address_cls4_eng X 데이터 없음
age 시대 O 열거형
owner 소유자 O
owner_eng 소유자(영문) O name{@en}
manager 관리자 O
manager_eng 관리자(영문) O name{@en}
detail 관리기관 연락처 ?
Contents 설명 O
image_url 이미지URL O 링크가 ';' 구분으로 복수개로 되어 있음. 확장자: JPG
qrcode_url QR이미지 O
movie_url 동영상URL O 링크가 ';' 구분으로 복수개로 되어 있음, 확장자: WMV
street-code X 데이터 없음
building-num X 데이터 없음
문화재청 데이터 필드 및 사용여부 결정
문화재 – 2. 외부 어휘 분석
Modeling
Europeana 의 EDM(European Dana Model) - http://www.europeana.eu/schemas/edm/
문화재 – 3. 문화재 클래스 구조
Modeling
| 보물 | 사적 | 명승 | 천연기념물 | 중요무형문화재 | 중요민속문화재 | …
문화재 – 4. 문화재 분류체계 모델링
Modeling
class1 class2 class3 class4
유적건조물 정치국방 성 성곽시설
유적건조물 종교신앙 불교 탑
기록유산 서각류 금석각류 비
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 석등
유적건조물 종교신앙 불교 탑
기록유산 서각류 금석각류 비
기록유산 서각류 금석각류 비
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 석등
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 석등
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 불전
유적건조물 종교신앙 불교 탑
유적건조물 종교신앙 불교 탑
유적건조물 교통통신 교통 교량
유적건조물 교통통신 교통 교량
유적건조물 종교신앙 불교 불전
기록유산 서각류 금석각류 비
유물 불교조각 금속조 불상
유물 불교조각 금속조 불상
유물 불교조각 금속조 불상
유물 불교공예 의식법구 의식법구
유적건조물 종교신앙 불교 탑
유물 과학기술 천문지리기구 천문
기록유산 서각류 목판각류 판목류
기록유산 서각류 금석각류 비
문화재청 웹사이트 분류체계
문화재 – 4. 문화재 분류체계 모델링 이슈
Modeling
Another type or subject?
SKOS 적용 여부
11
22
33
44
문화재청 분류모델과 RDF 모델의 불일치
분류체계로서의 대표성
문화재 – 4. 문화재 분류체계 모델링 이슈
Modeling
문화재 – 5. Temporal 모델링
Modeling
age 필드값 매핑U RI(PeriodO fTim e 인스턴스) 이름
선사시대 http://ko.w ikipedia.org/w iki/선사_시대 PrehistoryicA ge
석기시대 http://ko.w ikipedia.org/w iki/석기_시대 StoneA ge
청동시대 http://ko.w ikipedia.org/w iki/청동기_시대 BronzeA ge
철기시대 http://ko.w ikipedia.org/w iki/철기_시대 IronA ge
삼국시대 http://ko.w ikipedia.org/w iki/삼국_시대 ThreeKingdom s
고구려 http://ko.w ikipedia.org/w iki/고구려 G oguryeo
백제 http://ko.w ikipedia.org/w iki/백제 Baekje
신라 http://ko.w ikipedia.org/w iki/신라 Silla
가야 http://ko.w ikipedia.org/w iki/가야 G aya
발해 http://ko.w ikipedia.org/w iki/발해 Balhae
통일신라 http://ko.w ikipedia.org/w iki/통일신라 U nifiedSilla
고려시대 http://ko.w ikipedia.org/w iki/고려 G oryeo
조선시대 http://ko.w ikipedia.org/w iki/조선 Joseon
대한제국시대 http://ko.w ikipedia.org/w iki/대한제국 G reatH anEm pire
일제강점기 http://ko.w ikipedia.org/w iki/일제_강점기 JapaneseIm perialism
대한민국 행정구역을 의미적으로 표현하기 위한 정의
행정구역은 국가마다 다름
- 특별시 , 광역시 , 도 , 시 , 군 , 구 , 읍 , 면 , 동 , 리로 구분
- 1 개의 특별시 , 6 개의 광역시 , 8 개의 도 , 1 개의 특별자치시 , 1 개의 특별
자치도로 구성
행정구역 – 행정구역 온톨로지 모델링
Modeling
행정구역 – 1. Raw Data
Modeling
25
행정구역 – 2. 행정구역 온톨로지 모델링
Modeling
행정구역 – 3. 행정구역 인스턴스 구축
Modeling
시
시
hasGu 구
동
hasDong
A 안 >
B 안 >
구
구
include
include
행정구역 – 4. 행정구역 모델링 이슈
Modeling
*
Vocabulary
Vocabulary
- /def/{vocabulary}
Classes
- /def/{vocabulary}/{class}
Document
- /def/{vocabulary}/{property}
Class
http://lod.datahub.kr/def/cf
http://lod.datahub.kr/def/cf/Museum
Facility
http://lod.datahub.kr/def/cf/collect
s
* Class 의 첫글자는 영문 대문자 , Property 는 소문자를 사
용함
303 See other
URIs for Ontology Vocabulary
Modeling
URIs for Real-World Things
Modeling
*
Culture Facilities
Things
- /id/{type}/{id}
- /id/{type}/{id}/{child-type}/{child-id}
Document
- /doc/{type}/{id}
- /doc/{type}/{id}/{child-type}
List
http://lod.datahub.kr/id/cf
http://lod.datahub.kr/doc/cf
303 See other
Facility
http://lod.datahub.kr/id/cf/123456
* id 형식 및 값에 대한 의사결정 필요
이후 진행 계획
Modeling
행정구역 , 우편번호 등 인프라 온톨로지 구축
서울시 문화시설  전국 주요 기관 , 시설로 확
대
11
22
33
44
온톨로지 스키마 고도화
파편화 되어있는 Raw Data 를 Linked Data 로…

서울시 링크드 데이터 서비스 사례 소개-모델링

  • 1.
    서울시 Linked Data서비스 사례 소개 오픈 데이터에서 링크드 데이터로 진화 Open Knowledge Foundation Korea, 2013
  • 2.
    구축 범위 Modeling - 서울시열린데이터광장 데이터 중 시범과제에 적합한 데이터셋 선정 ( 문화시설 - 추가로 문화재청 데이터와 행정구역 모델링 문화재 ( 문화재 청 ) 문화재 ( 문화재 청 ) 문화시설 ( 열린데 이터광 장 ) 문화시설 ( 열린데 이터광 장 ) 행정구역행정구역
  • 3.
    모델링 주안점 (방향 ) Modeling 3 표현력 보다는 기존 데이터의 연결을 통한 Linked Data 구성 기존 Vocabulary 의 재사용을 통한 모델링 - dc, dcterm, foaf, sioc, schem.org 등 11 22 33 44 외부 데이터셋과의 연결성 강화 (dbpedia) - 구축된 데이터의 silo 경계 영어권에서도 활용 가능한 영문 레이블 동시 제공
  • 4.
    구축절차 Modeling 데이터셋 선정 4 11 * 서울시열린데이터 광장에서 모델링 대상 데이터셋 선정 ( 문화시설 ) * 문화재청 , 행정구역 모델링 추가 데이터셋 항목 검토 및 매핑22 * 데이터셋의 개별 항목과 온톨로지 ( 클래스 , 속성 ) 의 매핑 관계 검토 * 외부 어휘의 재사용 여부 및 범위 결정 * 어휘와 데이터셋 항목 매핑 URI 체계 결정 및 온톨로지 설계 완료33 * 클래스 , 속성 , 인스턴스 URI 체계 결정 * 온톨로지 모델링
  • 5.
    문화시설 – 1.Raw Data Modeling 5
  • 6.
    문화시설 – 1.Raw Data Modeling 6 필드명 필드설명 사용여부 id 일련번호 X facility_code 문화시설코드 ? management_code 관리번호 X subject_code 주제분류코드 X theme_code 테마분류코드 X facility_name 문화시설명 O region1 시도 O region2 군구 O region3 읍면동 O san_yn 산지여부 O bon_yn 산지여부 O bu_yn 산지여부 O main_img 대표이미지 O address 주소 O phone 전화번호 O fax 팩스번호 O homepage 홈페이지 O open_hour 관람시간 O enter_fee 관람료 O close_day 휴관일 O open_day 개관일자 O seat_cnt 객석수 O x_coord x좌표 O y_coord y좌표 O etc_desc 기타사항 O facility_desc 시설소개 O enter_free 무료구분 X x_wgs84 위도 O y_wgs84 경도 O facility_name_eng 영문명 O address_eng 영문주소(Full) O zipcode 우편번호 O serial 시리얼 X address_kor 주소(시/구/동) O address_eng2 영문주소2 O
  • 7.
    문화시설 – 2.Grouping Modeling 7
  • 8.
    문화시설 – 3.기존 Vocabulary 분석 Modeling
  • 9.
    문화시설 – 3.기존 Vocabulary 분석 Modeling
  • 10.
    문화시설 – 4.클래스 , 속성 모델링 진행 Modeling 문화시설 초기 클래스 구조
  • 11.
    문화시설 – 5.schema.org 재사용 상의 이슈 Modeling schema.org 클래스 구조
  • 12.
    문화시설 – 5.schema.org 재사용 상의 이슈 Modeling Another Type System 사용 Place CivicStructure Musieum 국립중앙박물관 type 장소 이름 구청 문화예술회관 구민회관 영화관 박물관 갤러리 기념관 전시관 궁 국악원 문화원 수련관 type 전시시설 박물관 기념관 갤러리 type 열거형 타입 시스템 계층형 타입 시스템 Schema.org 클래스
  • 13.
    문화시설 – 6.모델링을 위한 공유 Template Modeling ( 최종본 아님 )
  • 14.
    문화시설 – 7.문화시설 온톨로지 명세서 Modeling http://lod.datahub.kr/
  • 15.
  • 16.
    문화재– 1. 문화재청Raw Data Modeling 16
  • 17.
    17 data.seoul.go.kr 필드명 필드설명 사용여부비고 id 아이디 변경됨(x->o) category 종목명 O 종목(열거형), 지정번호로 구분 category_eng 종목명_영문 O name{@en} name 이름 X 한자 포함된 전체 이름 eng_name 이름(영어) O name{@en} kor_name 이름(한글) O name{@ko} ch_name 이름(한자) O name{@zh} class 분류 X class1 분류 O class2 분류 O class3 분류 O class4 분류 O concept 문화재청(SKOS) 분류명 O 문화재분류 매핑을 위해 추가한 필드 quantity 수량 O designate 지정일 O 문화재 지정일 address 소재지 O address에서 주소 부분만 추출 address_cls1 시도 O address_cls2 시군구 O address_cls3 읍면동 O address_cls1_eng 시도(영문) O address_cls2_eng 시군구(영문) O address_cls3_eng 읍면동(영문) O address_cls4_eng X 데이터 없음 age 시대 O 열거형 owner 소유자 O owner_eng 소유자(영문) O name{@en} manager 관리자 O manager_eng 관리자(영문) O name{@en} detail 관리기관 연락처 ? Contents 설명 O image_url 이미지URL O 링크가 ';' 구분으로 복수개로 되어 있음. 확장자: JPG qrcode_url QR이미지 O movie_url 동영상URL O 링크가 ';' 구분으로 복수개로 되어 있음, 확장자: WMV street-code X 데이터 없음 building-num X 데이터 없음 문화재청 데이터 필드 및 사용여부 결정
  • 18.
    문화재 – 2.외부 어휘 분석 Modeling Europeana 의 EDM(European Dana Model) - http://www.europeana.eu/schemas/edm/
  • 19.
    문화재 – 3.문화재 클래스 구조 Modeling | 보물 | 사적 | 명승 | 천연기념물 | 중요무형문화재 | 중요민속문화재 | …
  • 20.
    문화재 – 4.문화재 분류체계 모델링 Modeling class1 class2 class3 class4 유적건조물 정치국방 성 성곽시설 유적건조물 종교신앙 불교 탑 기록유산 서각류 금석각류 비 유적건조물 종교신앙 불교 탑 유적건조물 종교신앙 불교 석등 유적건조물 종교신앙 불교 탑 기록유산 서각류 금석각류 비 기록유산 서각류 금석각류 비 유적건조물 종교신앙 불교 탑 유적건조물 종교신앙 불교 탑 유적건조물 종교신앙 불교 탑 유적건조물 종교신앙 불교 석등 유적건조물 종교신앙 불교 불전 유적건조물 종교신앙 불교 불전 유적건조물 종교신앙 불교 불전 유적건조물 종교신앙 불교 탑 유적건조물 종교신앙 불교 석등 유적건조물 종교신앙 불교 불전 유적건조물 종교신앙 불교 불전 유적건조물 종교신앙 불교 탑 유적건조물 종교신앙 불교 탑 유적건조물 교통통신 교통 교량 유적건조물 교통통신 교통 교량 유적건조물 종교신앙 불교 불전 기록유산 서각류 금석각류 비 유물 불교조각 금속조 불상 유물 불교조각 금속조 불상 유물 불교조각 금속조 불상 유물 불교공예 의식법구 의식법구 유적건조물 종교신앙 불교 탑 유물 과학기술 천문지리기구 천문 기록유산 서각류 목판각류 판목류 기록유산 서각류 금석각류 비 문화재청 웹사이트 분류체계
  • 21.
    문화재 – 4.문화재 분류체계 모델링 이슈 Modeling Another type or subject? SKOS 적용 여부 11 22 33 44 문화재청 분류모델과 RDF 모델의 불일치 분류체계로서의 대표성
  • 22.
    문화재 – 4.문화재 분류체계 모델링 이슈 Modeling
  • 23.
    문화재 – 5.Temporal 모델링 Modeling age 필드값 매핑U RI(PeriodO fTim e 인스턴스) 이름 선사시대 http://ko.w ikipedia.org/w iki/선사_시대 PrehistoryicA ge 석기시대 http://ko.w ikipedia.org/w iki/석기_시대 StoneA ge 청동시대 http://ko.w ikipedia.org/w iki/청동기_시대 BronzeA ge 철기시대 http://ko.w ikipedia.org/w iki/철기_시대 IronA ge 삼국시대 http://ko.w ikipedia.org/w iki/삼국_시대 ThreeKingdom s 고구려 http://ko.w ikipedia.org/w iki/고구려 G oguryeo 백제 http://ko.w ikipedia.org/w iki/백제 Baekje 신라 http://ko.w ikipedia.org/w iki/신라 Silla 가야 http://ko.w ikipedia.org/w iki/가야 G aya 발해 http://ko.w ikipedia.org/w iki/발해 Balhae 통일신라 http://ko.w ikipedia.org/w iki/통일신라 U nifiedSilla 고려시대 http://ko.w ikipedia.org/w iki/고려 G oryeo 조선시대 http://ko.w ikipedia.org/w iki/조선 Joseon 대한제국시대 http://ko.w ikipedia.org/w iki/대한제국 G reatH anEm pire 일제강점기 http://ko.w ikipedia.org/w iki/일제_강점기 JapaneseIm perialism
  • 24.
    대한민국 행정구역을 의미적으로표현하기 위한 정의 행정구역은 국가마다 다름 - 특별시 , 광역시 , 도 , 시 , 군 , 구 , 읍 , 면 , 동 , 리로 구분 - 1 개의 특별시 , 6 개의 광역시 , 8 개의 도 , 1 개의 특별자치시 , 1 개의 특별 자치도로 구성 행정구역 – 행정구역 온톨로지 모델링 Modeling
  • 25.
    행정구역 – 1.Raw Data Modeling 25
  • 26.
    행정구역 – 2.행정구역 온톨로지 모델링 Modeling
  • 27.
    행정구역 – 3.행정구역 인스턴스 구축 Modeling
  • 28.
    시 시 hasGu 구 동 hasDong A 안> B 안 > 구 구 include include 행정구역 – 4. 행정구역 모델링 이슈 Modeling
  • 29.
    * Vocabulary Vocabulary - /def/{vocabulary} Classes - /def/{vocabulary}/{class} Document -/def/{vocabulary}/{property} Class http://lod.datahub.kr/def/cf http://lod.datahub.kr/def/cf/Museum Facility http://lod.datahub.kr/def/cf/collect s * Class 의 첫글자는 영문 대문자 , Property 는 소문자를 사 용함 303 See other URIs for Ontology Vocabulary Modeling
  • 30.
    URIs for Real-WorldThings Modeling * Culture Facilities Things - /id/{type}/{id} - /id/{type}/{id}/{child-type}/{child-id} Document - /doc/{type}/{id} - /doc/{type}/{id}/{child-type} List http://lod.datahub.kr/id/cf http://lod.datahub.kr/doc/cf 303 See other Facility http://lod.datahub.kr/id/cf/123456 * id 형식 및 값에 대한 의사결정 필요
  • 31.
    이후 진행 계획 Modeling 행정구역, 우편번호 등 인프라 온톨로지 구축 서울시 문화시설  전국 주요 기관 , 시설로 확 대 11 22 33 44 온톨로지 스키마 고도화 파편화 되어있는 Raw Data 를 Linked Data 로…