• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Введение в концепцию связанных открытых данных (Linked Open Data)
 

Введение в концепцию связанных открытых данных (Linked Open Data)

on

  • 1,189 views

Связанные открытые данные @ AIMS ...

Связанные открытые данные @ AIMS
Цикл вебинаров Linked Open Data @ AIMS
14 февраля 2013 года
Радченко Ирина Алексеевна
кандидат технических наук, научный сотрудник
Центра семантических технологий НИУ ВШЭ
LOD@AIMS

Statistics

Views

Total Views
1,189
Views on SlideShare
1,076
Embed Views
113

Actions

Likes
2
Downloads
10
Comments
0

1 Embed 113

http://aims.fao.org 113

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution-ShareAlike LicenseCC Attribution-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Введение в концепцию связанных открытых данных (Linked Open Data) Введение в концепцию связанных открытых данных (Linked Open Data) Presentation Transcript

    • Связанные открытые данные @ AIMS Цикл вебинаров Linked Open Data @ AIMS 14 февраля 2013 года Введение в концепцию связанных открытых данных (Linked Open Data) Радченко Ирина Алексеевна кандидат технических наук, научный сотрудник Центра семантических технологий НИУ ВШЭ http://about.me/Irina.RadchenkoНИУ ВШЭ, Москва, 2013
    • Содержание • Общее представление о Linked Open Data • Каким образом осуществляется связывание наборов данных? • Публикация наборов данных в пространстве Linked Open DataНИУ ВШЭ, Москва, 2013 2
    • • Общее представление о Linked Open DataНИУ ВШЭ, Москва, 2013 3
    • Эволюционирование вебаРазвитие веба Веб данных (связанные данные) Данные в вебе (открытые данные и т.д.) Веб документов (гипертекст) Документы в вебе (протокол Gopher и т.д.) 1990 2013 ВремяИсточник: Linked Open Data: The Essentials. A Quick Start Guide for Decision Makers.http://www.semantic-web.at/LOD-TheEssentials.pdf НИУ ВШЭ, Москва, 2013 4
    • Основные понятия Связанные данные (Linked Data) — это наборы данных, опубликованные в RDF-формате с использованием унифицированного идентификатора ресурсов URI (Uniform Resource Identifier) для идентификации элементов, которые они содержат.НИУ ВШЭ, Москва, 2013 5
    • Основные понятия Связанные открытые данные (Linked Open Data) — это связанные наборы данных, опубликованные в RDF-формате и пригодные для использования и переиздания их пользователями в своих целях, без каких-либо ограничений в виде авторских прав, патентов и других механизмов контроля.НИУ ВШЭ, Москва, 2013 6
    • Проект DBpedia Проект DBpedia послужил важным стимулом для развития Linked Open Data.Источник: http://dbpedia.org/About НИУ ВШЭ, Москва, 2013 7
    • Динамика развития Linked Open Data Темпы нарастания объемов фактов Количество наборов LOD 2007 2008 2009 2010 Время Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenDataНИУ ВШЭ, Москва, 2013 8
    • Веб данных: связанные открытые данные Облако наборов LOD охватывает около 30 миллиардов триплетов и 500 миллионов связей СМИ География Публикации Созданный пользователями контент Государственные данные Междисциплинарные области Науки о жизниИсточник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData НИУ ВШЭ, Москва, 2013 9
    • Пятизвездочная модель открытых данных по Тиму Бернерсу-ЛиИсточники: http://5stardata.info/, http://www.w3.org/DesignIssues/LinkedData.htmlНИУ ВШЭ, Москва, 2013 10
    • Связывание данных в контексте семантической паутиныТим Бернерс-Ли (Tim Berners-Lee) предложил идеюсвязанных данных на основе четырехпринципов, стимулирующих применение базовыхпринципов Web для доступа к данным:• Применение универсальных идентификаторов ресурсов (URI) в качестве имен объектов;• Применение HTTP URI для реализации возможности обращения по этим именам;• Предоставление полезной информации тому, кто обращается по URI, с помощью стандартов (RDF*, SPARQL);• Включение ссылок на другие URI, позволяющих найти дополнительную информацию.Источник: http://iradche.livejournal.com/12108.htmlНИУ ВШЭ, Москва, 2013 11
    • Интерпретация стека Linked Open Data Прикладной Поисковые Интеграция уровень Мэшапы системы данных Базы данных и Запросы на публикация данных SPARQL Лицензии открытых Словари Онтологии данных Обмен RDF Идентификаторы URL Элементы стека данных LOD – 2 мая 2011, Транспортный уровень: лицензия CC BY-CA-NC протокол HTTP Автор: Тим Дэвис (Tim Davies)Источники: http://www.opendataimpacts.net/2011/05/whats-in-the-linked-open-data-stack/, http://iradche.livejournal.com/9036.htmlНИУ ВШЭ, Москва, 2013 12
    • • Каким образом осуществляется связывание наборов данных?НИУ ВШЭ, Москва, 2013 13
    • Отличный пример из презентации Тома Бейкера (Tom Baker) Запись в AGRIS Эксперт VIVO BBC News Тезаурус AGROVOC BBC DBpedia Wikipedia Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 14
    • Ресурс 1: Проиндексированная статья в базе данных AGRIS Тема статьи “acrididae”, т.е. “grasshoppers”. Одного из авторов зовут “Han Jianguo”.Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-web,http://agris.fao.org/agris-search/search/display.do?f=2010%2FCN%2FCN0910.xml%3BCN2009002389 НИУ ВШЭ, Москва, 2013 15
    • Описание Ресурса 1 в виде «условных» триплетов Субъект Предикат Объект Ресурс 1 имеет заголовок 典型草原三种蝗虫种群死 亡率的研究 Ресурс 1 имеет автора Han Jianguo Ресурс 1 имеет тему Acrididae (grasshoppers) Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 16
    • «Триплифицируем» описание Ресурса 1 Субъект Предикат Объект agris:CN2009002389 имеет заголовок 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 имеет автора Han Jianguo agris:CN2009002389 имеет тему Acrididae (grasshoppers)Ресурс 1 идентифицирован при помощи URI http://agris.fao.org/resource/CN2009002389.Сократим его до agris:CN2009002389. Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-web НИУ ВШЭ, Москва, 2013 17
    • «Триплифицируем» описание Ресурса 1 Субъект Предикат Объект agris:CN2009002389 имеет заголовок 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 имеет автора agris-author:hanjianguo agris:CN2009002389 имеет тему Acrididae (grasshoppers) Автор идентифицирован при помощи URI http://agris.fao.org/author/hanjianguo. Сократим его до agris-author:hanjianguo. Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 18
    • «Триплифицируем» описание Ресурса 1 Субъект Предикат Объект agris:CN2009002389 имеет заголовок 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 имеет автора agris-author:hanjianguo agris-author:hanjianguo имеет имя Han Jianguo agris:CN2009002389 имеет тему Acrididae (grasshoppers) Автор agris-author:hanjianguo имеет имя Han Jianguo. Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 19
    • «Триплифицируем» описание Ресурса 1 Субъект Предикат Объект agris:CN2009002389 имеет заголовок 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 имеет автора agris-author:hanjianguo agris-author:hanjianguo имеет имя Han Jianguo agris:CN2009002389 имеет тему agrovoc:c_4416 Тема идентифицируется при помощи URI http://aims.fao.org/aos/agrovoc/c_4416. Сократим ее до agrovoc:c_4416. Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 20
    • «Триплифицируем» описание Ресурса 1 Субъект Предикат Объект agris:CN2009002389 имеет заголовок 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 имеет автора agris-author:hanjianguo agris-author:hanjianguo имеет имя Han Jianguo agris:CN2009002389 имеет тему agrovoc:c_4416 agrovoc:c_4416 имеет пометку Acrididae (en) agrovoc:c_4416 имеет пометку 蝗科 (zh) Описание http://aims.fao.org/aos/agrovoc/c_4416 в AGROVOC Concept Scheme говорит нам о том, как этот концепт на английском и китайском языках. Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 21
    • «Триплифицируем» описание Ресурса 1 Субъект Предикат Объект agris:CN2009002389 dct:title 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 имеет автора agris-author:hanjianguo agris-author:hanjianguo имеет имя Han Jianguo agris:CN2009002389 имеет тему agrovoc:c_4416 agrovoc:c_4416 имеет пометку Acrididae (en) agrovoc:c_4416 имеет пометку 蝗科 (zh) Элемент Dublin Core “Title” (заголовок) идентифицирован при помощи URI http://purl.org/dc/terms/title. Сократим его до dct:title. Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 22
    • «Триплифицируем» описание Ресурса 1 Субъект Предикат Объект agris:CN2009002389 dct:title 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 dct:creator agris-author:hanjianguo agris-author:hanjianguo foaf:name Han Jianguo agris:CN2009002389 dct:subject agrovoc:c_4416 agrovoc:c_4416 имеет пометку Acrididae (en) agrovoc:c_4416 имеет пометку 蝗科 (zh) Повторяем то же самое для автора (author, creator) и темы (topic, subject). Имя определено в словаре FOAF. Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 23
    • «Триплифицируем» описание Ресурса 1 Субъект Предикат Объект agris:CN2009002389 dct:title 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 dct:creator agris-author:hanjianguo agris-author:hanjianguo foaf:name Han Jianguo agris:CN2009002389 dct:subject agrovoc:c_4416 agrovoc:c_4416 skos:prefLabel Acrididae (en) agrovoc:c_4416 skos:prefLabel 蝗科 (zh) Свойство для пометок (preferred label) концепта определено в словаре Simple Knowledge Organization System (SKOS). Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 24
    • Триплет, построенный в виде графа dct:title 典型草… agris:CN…389 dct:subject dct:creator agrovoc:c_4416 agris-author: foaf:name hanjianguo Han Jianguo Субъект Предикат Объект agris:CN2009002389 dct:title 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 dct:creator agris-author:hanjianguo agris-author:hanjianguo foaf:name Han Jianguo agris:CN2009002389 dct:subject agrovoc:c_4416 Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 25
    • Ресурс 2: статья в базе AGRIS на немецком языке Тема статьи “acrididae” Одного из авторов зовут “Peter, B” Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 26
    • Триплеты, описывающие Ресурс 2 в виде графа dct:title Heuschrecken agris:CH…179 dct:subject dct:creator agrovoc:c_4416 agris-author: foaf:name peterb Peter, B. Субъект Предикат Объект agris:CH2001000179 dct:title Heuschrecken brauchen ökologische Ausgleichsflächen agris:CH2001000179 dct:creator agris-author:peterb agris-author:peterb foaf:name Peter, B. agris:CH2001000179 dct:subject agrovoc:c_4416 Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 27
    • Соединяем триплеты Ресурса 1… Субъект Предикат Объект agris:CN2009002389 dct:title 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 dct:creator agris-author:hanjianguo agris-author:hanjianguo foaf:name Han Jianguo agris:CN2009002389 dct:subject agrovoc:c_4416 Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 28
    • …с триплетами Ресурса 2 Субъект Предикат Объект agris:CN2009002389 dct:title 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 dct:creator agris-author:hanjianguo agris-author:hanjianguo foaf:name Han Jianguo agris:CN2009002389 dct:subject agrovoc:c_4416 agris:CH2001000179 dct:title Heuschrecken brauchen ökologische Ausgleichsflächen agris:CH2001000179 dct:creator agris-author:peterb agris-author:peterb foaf:name Peter, B. agris:CH2001000179 dct:subject agrovoc:c_4416 Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 29
    • Компьютер определяет совпадающие URI... Субъект Предикат Объект agris:CN2009002389 dct:title 典型草原三种蝗虫种群死 亡率的研究 agris:CN2009002389 dct:creator agris-author:hanjianguo agris-author:hanjianguo foaf:name Han Jianguo agris:CN2009002389 dct:subject agrovoc:c_4416 agris:CH2001000179 dct:title Heuschrecken brauchen ökologische Ausgleichsflächen agris:CH2001000179 dct:creator agris-author:peterb agris-author:peterb foaf:name Peter, B. agris:CH2001000179 dct:subject agrovoc:c_4416Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-web 30
    • Компьютер определяет совпадающие URI... dct:title Heuschrecken agris:CH…179 dct:subject dct:creator agris-author: foaf:name agrovoc:c_4416 peterb Peter, B. dct:subject agrovoc:c_4416 agris:CN…389 dct:title dct:creator 典型草… agris- foaf:name author:han jianguo Han Jianguo Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 31
    • …и соединяет (“связывает”) графы в один dct:title Heuschrecken agris:CH…179 dct:subject dct:creator agris-author: foaf:name agrovoc:c_4416 peterb Peter, B.Ресурсы на разных языках, dct:subjectсвязанные agris:CN…389ссылками dct:titleна общий концепт. dct:creator 典型草… agris- author:han foaf:name jianguo Han Jianguo Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 32
    • Одна запись, много связей SKOS Запись в AGRIS AGROVOC FOAF AGRIS Authors Dublin Core Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 33
    • • Публикация наборов данных в пространстве Linked Open DataНИУ ВШЭ, Москва, 2013 34
    • Публикация наборов данных в пространстве Linked Open Data Для того чтобы опубликовать наборы данных в пространстве LOD, необходимо сделать следующие шаги Проанализировать данные. Необходимо окинуть критическим взглядом модель данных и метаданные. Очистить данные. Данные и информация, приходящие из различного рода источников в различных форматах (включая базы данных, форматы CVS, геоданные, XML и т.д.), нуждаются в дополнительной очистке для более легкого и эффективного моделирования представления данных.Источник: http://richard.cyganiak.de/2007/10/lod/НИУ ВШЭ, Москва, 2013 35
    • Публикация наборов данных в пространстве Linked Open Data …далее… Сформировать модель представления данных. Создайте необходимые словари и тезаурусы для представления данных в RDF-формате. Создайте идентификаторы URI для каждых объектов. Выбрать подходящие словари. Существует большое количество RDF- словарей, которые можно использовать повторно. Выберите наиболее подходящий из них. Если подходящего словаря не найдено, то необходимо его создать. Каталог словарей можно посмотреть здесь: http://lov.okfn.org/dataset/lovИсточник: http://richard.cyganiak.de/2007/10/lod/НИУ ВШЭ, Москва, 2013 36
    • Публикация наборов данных в пространстве Linked Open Data RDF-словариИсточник: http://lov.okfn.org/dataset/lovНИУ ВШЭ, Москва, 2013 37
    • Публикация наборов данных в пространстве Linked Open Data Определить лицензию/лицензии. Необходимо решить вопрос лицензирования наборов данных. Удобнее всего выбрать из уже существующих и наиболее популярных лицензий: — Creative Commons (http://creativecommons.org/choose/); — Open Data Commons (http://opendatacommons.org/licenses/).Источник: http://richard.cyganiak.de/2007/10/lod/ НИУ ВШЭ, Москва, 2013 38
    • Публикация наборов данных в пространстве Linked Open Data Конвертировать наборы данных в RDF-формат. Это очень важный этап, т.к. RDF-формат является официальным стандартом консорциума W3C для моделей представления данных Семантического веба. Обязательно включите выбранные лицензии в RDF-файлы.Выберите подходящий инструмент для перевода данных в RDF-формат http://www.w3.org/2005/Incubator/mmsem/wiki/Tools_and_Resources http://www.w3.org/wiki/ConverterToRdf http://www.inf.unideb.hu/~jeszy/rdfizers/Источник: http://richard.cyganiak.de/2007/10/lod/НИУ ВШЭ, Москва, 2013 39
    • Публикация наборов данных в пространстве Linked Open Data Проект Simile (Semantic Interoperability of Metadata and Information in unLike Environments) http://simile.mit.edu/wiki/RDFizersНИУ ВШЭ, Москва, 2013 40
    • Публикация наборов данных в пространстве Linked Open Data …далее… Связать наборы данных с наборами данных пространства LOD. Обязательно удостоверьтесь, что Ваши наборы данных связаны между собой, связаны с наборами данных из пространства LOD и доступны для связывания с наборами данных сторонними разработчиками. Это предоставит возможность машинной обработки представляемых наборов данных и позволит извлекать новые знания из представляемых наборов данных. Вычислите наиболее релевантные наборы данных для связывания с Вашими наборами данных.Источник: http://richard.cyganiak.de/2007/10/lod/НИУ ВШЭ, Москва, 2013 41
    • Публикация наборов данных в пространстве Linked Open Data …и последнее Опубликовать и разрекламировать Ваши наборы данных в пространстве LOD. Опубликуйте Ваши наборы данных в вебе и разрекламируйте Ваши новые LOD- наборы данных. Даже лучшие наборы данных LOD не могут быть повторно использованы, если пользователь не узнает об их существовании и не сможет получить к ним доступ. Лучше всего добавить наборы данных в LOD облако.Источник: http://richard.cyganiak.de/2007/10/lod/НИУ ВШЭ, Москва, 2013 42
    • Как сделать данные открытыми и связанными 1. Выделить наиболее значимые данные (например, Субъект, Автор, Публикатор и т.д.). 2. Использовать везде, где это возможно, URI для обозначения этих данных. 3. Опубликовать данные в формате RDF, чтобы пользователи могли связать свои данные. 4. Упростить. Простые решения дают хорошие результаты! Источник: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-webНИУ ВШЭ, Москва, 2013 43
    • Спасибо за внимание! http://about.me/Irina.Radchenko @iRadche http://iRadche.livejournal.com/ https://www.facebook.com/iRadche http://www.slideshare.net/iRadche