• Save
[오원석 Kswc2010]데이터의 가치를 높이는 linked data
Upcoming SlideShare
Loading in...5
×
 

[오원석 Kswc2010]데이터의 가치를 높이는 linked data

on

  • 1,726 views

데이터의 가치를 높이는 linked data

데이터의 가치를 높이는 linked data

Statistics

Views

Total Views
1,726
Views on SlideShare
1,726
Embed Views
0

Actions

Likes
3
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

[오원석 Kswc2010]데이터의 가치를 높이는 linked data [오원석 Kswc2010]데이터의 가치를 높이는 linked data Presentation Transcript

  • Composing the Semantic Web
    데이터의 가치를 높이는 Linked Data
    (주)탑쿼드란트코리아 오 원 석
  • 지구보다 큰 생각 : 화성시
    2
  • The Web : The World’s Largest Information System
    3
    View slide
  • Search
    색인
    검색
    참조
    4
    View slide
  • The Web : The World’s Largest Information System
    5
  • Semantic Web & Linked Data
    질의
    6
  • Linked Data 원칙
    http://bibleontology.com/page/Bilhah
    http://bibleontology.com/page/Bilhah
    http://bibleontology.com/page/Bilhah
    http://bibleontology.com/page/Bilhah
    http:// http://bibleontology.com/page/Bilhah
    1. Use URIs as names for things
    2. Use HTTP URIs so that people can look up those names
    3. When someone looks up a URI, provide useful RDF Information
    4. Include RDF statements that link to other URIs so that they can discover related things
    3. When someone looks up a URI, provide useful RDF Information
    4. Include RDF statements that link to other URIs so that they can discover related things
    1. Use URIs as names for things
    http://bibleontology.com/page/Bilhah
    1. Use URIs as names for things
    http://bibleontology.com/page/Bilhah
    2. Use HTTP URIs so that people can look up those names
    http://bibleontology.com/page/Bilhah
    Tim Berners-Lee 2007 http://www.w3.org/DesignIssues/LinkedData.html
    HTTP
    URI
    RDF
    7
  • Linked Data 예시
    [residences]
    Seoul
    HongGilDong
    http://dbpedia.org/
    resource/Seoul
    [researches]
    SemanticWeb
    [age]
    [name]
    [sameAs]
    Hong, Gil Dong
    35
    http://dbpedia.org/
    resource/Semantic_Web
    http://sws.geonames.org/1835848/
    [hasPhotoCollection]
    [nearbyFeatures]
    http://www4.wiwiss.fu-berlin.de/flickrwrappr/
    photos/Semantic_Web
    http://sws.geonames.org/1835848/nearby.rdf
    8
  • Linked Data – 기본 원칙
    • 웹에 데이터를 넣어서 데이터베이스에 질의하듯, 질의하고 싶어요
    URI
    로 식별하고, Linking 하고,
    RDF
    로 표현하고,
    SQL
    SPARQL
    로 질의하고,
    HTTP
    로 유통하고,
    SPARQL
    9
  • Linked Data Cloud
    10
  • Linked Data – SPARQL
    11
  • Linked Data에 대해 조금만 더…
    12
  • 지겹지만 : Current Web – Document Web
    인간이 이해할 수 있는(human-readable) 웹
    Beijing
    ?
    ?
    ?
    ?
    참고 : Chris Bizer / The Emerging Web of Linked Data
    13
  • 지겹지만 : Semantic Web – Data Web - Linked Data
    기계가 이해하고 처리할 수 있는 (machine-readable) 웹
    참고 : Chris Bizer / The Emerging Web of Linked Data
    14
  • Current Web – Document Web
    Search Engines
    Web Browsers
    Silo
    Silo
    Silo
    참고 : Chris Bizer / The Emerging Web of Linked Data
    15
  • OpenAPI - Mashup
    Open
    API
    Open
    API
    Open
    API
    X
    X
    X
    X
    Silo
    Silo
    Silo
    16
  • Linked Datause Semantic Web technologies …
    Use Semantic Web technologies to
    publish structured data on the Web,
    set links between data from one data source to data within other data sources.
    RDF
    RDF
    RDF
    RDF
    RDF
    RDF
    RDF
    RDF
    RDF
    RDF
    RDFlink
    RDFlinks
    RDFlinks
    RDFlinks
    A
    E
    C
    D
    B
    참고 : Chris Bizer / The Emerging Web of Linked Data
    17
  • Linked Data – 기본에충실하자
    웹상에서 데이터를 좀 더 효율적으로
    교환(유통) 하고자 하는 것
    SPARQL
    HTTP
    URI
    RDF
    18
  • Triple
    • 주어(Subject) , 술어(Predicate), 목적어(Object)의 형태로 데이터를 표현하고 기술 하는 방법
    • SPO 패턴으로 표현되기 때문에 트리플 구조라 부르며, 하나의 조합된 셋을 Statements라 함
    • RDF, RDFS, OWL은 모두 XML 표현 형식의 RDF 구조를 기반으로 하며 RDF 트리플 형식으로 데이터를 표현함,
    O
    S
    S
    P
    P
    P
    O
    O
    S
    19
  • Semantic Web & SPARQL
    • Triple Pattern으로 질의
    • RDF Model 구조를 모르더라도
    • 질의하고 싶은 URI 개체 또는
    • 질의하고 싶은 속성(property)을통해
    select ?p ?o where
    { <http://dbpedia.org/resource/Seoul>?p ?o}
    select ?s ?o where
    { ?s <http://dbpedia.org/property/xxx>?o}
    20
  • SPARQL Endpoint
    웹 브라우저
    어플리케이션
    HTML, RDF, XML,CSV, ..
    SPARQL
    HTML, RDF, XML, CSV, ..
    SPARQL
    HTTP
    RDF Triple
    SPARQL Endpoint
    Web Server / Servlet Container (java)
    트리플(Linked Data) 저장소
    21
  • SPARQL Endpoint – Content Negotiation
    Application
    Browser
    RDF Triple
    SPARQL Endpoint
    22
  • 시맨틱한 서비스 vs시맨틱웹 서비스
    통계
    언어처리
    마이닝
    추론
    검색

    링킹
    아이디어 발굴
    탐색
    어플 적용
    검색

    23
  • 시맨틱한 서비스 vs시맨틱웹 서비스
    시맨틱한 서비스
    통계
    언어처리
    마이닝
    추론
    검색
    논문1
    논문2

    논문3
    논문4
    24
  • 시맨틱한 서비스 vs시맨틱웹 서비스
    시맨틱웹 서비스
    정보과학회
    정보처리학회
    지도학회
    연구재단
    인용하다
    동일저자이다
    같은논문이다
    25
  • 시맨틱한 서비스 vs시맨틱웹 서비스
    링킹
    아이디어 발굴
    정보과학회
    정보처리학회
    지도학회
    연구재단
    탐색
    인용하다
    어플 적용
    검색

    동일저자이다
    링킹
    탐색
    검색
    같은논문이다
    정보를 더욱 풍부하게…
    연결된 정보간의 탐색
    자원간의 연결을 기반으로 검색
    아이디어발굴
    어플 적용

    다양한 분석 및 서비스에의 활용..
    다양한 미디어에서의 서비스 적용…

    26
  • 시맨틱한 서비스 vs시맨틱웹 서비스
    시맨틱한 서비스가 필요하지 않거나, 잘못 되었다는 것은 절대 아닙니다.
    시맨틱웹, 적어도 Linked Data에 대한 오해는 하지 말아야 할 것입니다.
    27
  • 연결
    • 웹상에서 데이터를 좀 더 효율적으로 교환(유통)하고자 하는 것
    시맨틱웹은 웹 상에서의 데이터 연결이 가장 우선시 되어야 합니다.
    그것이 RDF와 SPARQL이 필요한 이유입니다.
    추론
    지식 가공
    온톨로지
    의미 검색
    텍스트 마이닝
    SNA
    시맨틱 검색
    자연어 처리
    28
  • 공공데이터의 개방 ??
    • 지금도 공공데이터는 개방되어 있다.
    HTML
    29
  • 공공데이터의 개방 ??
    • 지금도 공공데이터는 개방되어 있다.
    30
  • 데이터를 갖고 있는 곳들
    31
  • Linked Data로 연결하면??
    회사를 창업하고 싶은데…. 관련된 정보는???
    내게 혜택이 있는 복지 정책은???
    아이를 출산했는데.. 무엇을..??
    data.go.kr
    32
  • 다른 나라는 ? 미국의 data.gov
    □ data.gov의 목적
    • 미국 연방정부의 고부가가치 기계가독형데이터셋을 대국민을 위해 개방
    • 국민 스스로 창조적으로 이용하도록 함.
    □ data.gov를 활용하여 국민들은
    • RAW DATA를 보거나 다운로드
    • 위젯이나 다른 툴을 이용하여 특정 데이터를 가공, 융합한 챠트나 지도, 스냅샷을 만들 수도 있음
     
    □ data.gov의 Linked Data화
    • 구축된 data.gov 의 일부를 시맨틱 웹 표준 포맷인 RDF(Resource Description Framework)로 변환하여 Linked Data로 공개
    • Tim Berners-Lee와 함께 시맨틱 웹의 창시자인 Jim Hendler교수가 프로젝트 수행
    33
  • 미국의 data.gov
    34
  • 미국의 data.gov – Data Sets
    35
  • 미국의 data.gov – SPARQL Endpoint
    36
  • 또 다른 나라는 ? 영국의 data.gov.uk
    □ data.gov.uk의 목적
    o 정부의 투명성을 높이기 위해
    o 국민의 권리 향상(Citizen empowerment)
    o 데이터의 공개를 통한 경제적 사회적 가치 증대
    o 영국이 차세대 웹(web of data, 즉, Semantic Web)에서 세계적으로 앞서나가기 위해
    □ 비전
    o 정부가 수집한 데이터의 원스톱샵(one-stop-shop for data collected by the government)
    □ 시맨틱 웹 기술을 이용하여 링크를 통해 데이터를 융합하고 검색을 확장하도록 제공
    o data.gov.uk의 이용자들은 이용가능한 정보를 이용해 자신만의 매쉬업을 만들 수 있을 것으로 기대
    37
  • 영국의 data.gov.uk
    38
  • 영국의 data.gov.uk – SPARQL Endpoint
    <?xml version="1.0"?>
    <sparqlxmlns="http://www.w3.org/2005/sparql-results#">
    <head>
    <variable name="type"/>
    </head>
    <results>
    <result>
    <binding name="type">
    <uri>http://www.w3.org/2006/vcard/ns#VCard</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://www.w3.org/2006/vcard/ns#Address</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Other_Independent_School</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://education.data.gov.uk/def/school/School</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Voluntary_Aided_School</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Community_School</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Community_Special_School</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Foundation_School</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_Voluntary_Controlled_School</uri>
    </binding>
    </result>
    <result>
    <binding name="type">
    <uri>http://education.data.gov.uk/def/school/TypeOfEstablishment_LA_Nursery_School</uri>
    </binding>
    </result>
    </results>
    </sparql>
    Analytics
    Education
    Environment
    Finance
    Transport
    Statutory Notices
    XML
    JSON
    39
  • 공공정보의 활용
    정보의
    효율적 활용
    • 다양한 디지털 환경에서, 다양한 서비스에 양질의 공공정보가 활용
    부처간 협력
    • 유관 부처와의 정보 연계에 따른 협력 체제 강화
    정보의
    재활용
    • 정보의 생산, 관리 비용 절감
    창의적인
    아이디어 발굴
    • 국민 스스로의 창의적인 아이디어 발굴 기회 부여
    40
  • 공공정보의 활용
    분석
    정보제공
    연계
    융복합
    다양한
    서비스
    민간

    공공
    다양한
    채널
    인터넷TV
    스마트폰
    인터넷
    협력체제
    강화및
    응용
    응용

    활용
    Linked Data
    민간
    포털및 대국민
    유관기관
    국해부, 행안부 등
    공개형 공공정보
    발행 및 제공
    Linkd Data Center
    서비스 기획 및 개발
    41
  • 공공정보를 개방하는 방법
    42
  • 공공정보에 Linked Data를 활용하면…
    단절된 국가 공공정보
    연결된 국가 공공정보
    부동산정보
    환경정보
    부동산정보
    환경정보
    문화재정보
    문화재정보
    교통정보
    XXX 정보
    교통정보
    XXX 정보
    공간정보
    공간정보
    일자리정보
    일자리정보
    여행정보
    토지정보
    여행정보
    토지정보
    문헌정보
    문헌정보
    상품정보
    상품정보
    민간 정보
    해외 정보
    포털 및 언론
    대학
    기타
    DBPedia
    BBC
    etc
    국가 공공정보
    XXX정보
    여행정보
    공간정보
    문헌정보
    환경정보
    43
  • 공공정보에 Linked Data가 필요한 이유
    • 공동 활용 및 자발적 참여를 통해 데이터가 선순환 될 수 있는 구조로
    • 정부가 공개한 공공정보를 활용해 누구나 창의적인 정보를 재생산, 재배포 할 수 있고, 관련 응용서비스를 발굴, 개발하여 서비스할 수 있게 지원할 수 있도록…
     다양한 환경(웹, 스마트폰, IPTV 등)에서의 다양한 서비스(정보제공, 분석, 통계, 추천, SNS 등) 발굴
    • 스마트폰이나 인터넷 TV, 차세대 웹환경의 전환에서 보듯, 양방향 정보 생산과 소비로 정보 유통 패러다임이 급속히 전환되는 추세
     OpenAPI는 단방향이며, 주도적인 제공
    • 국민 모두가 참여하여 데이터의 가치를 향상시키고, 창의적인 응용서비스를 발굴할 수 있도록 지원하는 데이터 유통 생태계
     HTTP, URI, RDF, SPARQL  dereferenceable URI , Linking
    • 구글이나 애플이 보유한 플랫폼이라는 것에 대해 배울점은??
     Linked Data는 데이터 유통 생태계를 조성하는 장을 위한 좋은 방법
    44
  • 공공정보에 Linked Data가 필요한 이유
    • 공공이나 민간에서 공개된 공공정보를 활용하여 창의적인 새로운 서비스를 발굴하여 활용할 수 있도록
    • 유관 부처 및 공공에서는 관련 정보를 활용하여 부처간 협력 체제 강화 및 업무 효율성 증진에 활용할 수 있음
    • 민간에서는 관련 정보를 응용하여 혁신적이며, 창의적인 서비스에 활용할 수 있음
    • 잠재적 정보 활용 대상의 서비스 요구 다양성에 즉각적으로 대응할 수 있는 생태계 조성이 필요
    45
  • Linked Data에 유용한 자원 발굴
    • 공공정보를 분석하여 Linked Data에 유용한 자원 도출
    • 대상 정보의 품질 및 업데이트 주기, 예측되는 응용서비스에서의 활용도 등을 체크
    • Linked Data로의 확보가 용이하며, Linked Data로 구축 시 활용도가 높은 대상을 도출
    • 정보 보유 기관과의 저작권 또는 공개 허용 범위 및 방법에 대한 협의
    • 모든 국민이 Linked Data 정책을 통해 공개된 데이터를 자유롭게 활용하는 것에 대한 저작권 및 정보 보유 기관의 정책에 대한 협의
    • 공개 정도에 대한 범위 확정 및 Linked Data 대상 자원으로써의 필요성 및 유용성 파악
    • Linked Data 유용성 및 기대되는 응용서비스, 기대효과 등의 도출
    • Linked Data를 확보하고 서비스함에 따라 예측 가능한 응용서비스 및 기대효과 도출
    • 예측 가능 정도에 따른 단계별 Linked Data 구축 방안 및 시스템 개발 방안 도출
    46
  • Linked Data를담을 그릇이 필요
    분석 및 설계
    설계 도구
    47
  • Linked Data 확보
    변환 규칙
    수집 규칙
    변환
    트리플(Linked Data) 변환
    (인스턴스 생성)
    트리플 저장소에 저장
    48
  • Linked Data 통합 운영

    스마트폰
    스마트TV
    공공시설
    Linked Data
    시각화 서비스
    탐색/브라우징 서비스
    Linked Data
    제공 서비스
    Linked Data
    운영/관리
    Linked Data
    제공 모듈
    (SPARQL Endpoint)
    외부 정보
    연계 모듈
    Linked Data
    연계 관리
    Linked Data
    변환기
    Linked Data
    저장소
    추론기
    모델 설계
    변환규칙 설계
    49
  • 앞에서 봤던 SPARQL Endpoint
    웹 브라우저
    어플리케이션
    HTML, RDF, XML,CSV, ..
    SPARQL
    HTML, RDF, XML, CSV, ..
    SPARQL
    RDF Triple
    SPARQL Endpoint
    Web Server / Servlet Container (java)
    트리플(Linked Data) 저장소
    50
  • SPARQL Endpoint 예시
    51
  • SPARQL Endpoint 결과 예시
    52
  • 외부 정보와의 연결 – Linking & Mashup
    Legacy Data
    OpenAPI(Data)
    OpenAPI(Service)
    Mashup
    Mashup
    Mashup
    Linking &
    Mashup
    RDF Triple
    외부정보 연계 모듈
    트리플(Linked Data) 저장소
    53
  • 시각화 서비스
    54
  • 탐색/브라우징 서비스
    55
  • 탐색/브라우징 서비스
    http://dbpedia.org/page/Namdaemun
    56
  • 결론
    플랫폼을 보유하면 승리한다. – 구글, 애플
    플랫폼은 생태계를 조성한다.
    플랫폼에서는 콘텐트와 서비스가 자발적으로 창조되고, 활용되고, 도태된다.
    Linked Data는 웹기반 데이터 유통 생태계를 조성하는 초석이다
    Linked Data를 통해 데이터는 활용되고, 풍부해지고, 유용해 진다.
    Linked Data, Linking을 통해 데이터들이 질적으로 풍부해지게 된다.
    57
  • 데이터 유통 생태계

    스마트폰
    스마트TV
    공공시설
    연구자
    개발자
    서비스(컨텐트) 기획자
    정책입안(결정)자
    CEO
    기관
    .
    .
    .
    .
    데이터를 자유롭게 활용할 수 있는 장(場)
    .
    .
    .
    .
    58
  • 데이터 유통 생태계
    + 재생산된 정보
    + 민간 정보, 해외 정보
    Linked Data 기반의 공공정보
    + 개별 공공정보
    Linked Data 기반의
    공공정보
    59
  • 데이터 유통 생태계
    포털
    포털
    SPARQL

    스마트폰
    스마트TV
    공공시설
    공간정보
    여행정보
    공개된 공공정보
    행안부
    복지부
    주소정보
    복지정보
    국해부
    환경부
    공간정보
    환경정보
    60
  • 끝…
    Gov2.0, 공공정보의 개방은
    사람이 브라우저를 통해 읽을 수 있는 수준이 아닌
    기계간, 기계와 사람간 협업을 위한 수준의 개방이었으면 좋겠습니다.
    Semantic Web (Linked Data)을 위한 Killer Application이 필요한 것이 아닙니다.
    Semantic Web (Linked Data)은 데이터 유통 생태계를 좀 더 SMART하게 하자는 것입니다.
    61
  • 감사합니다
    Q & A
    capsuleboy@topquadrant.co.kr
    linkeddata@linkeddata.kr
    @linked_data
    62