SlideShare a Scribd company logo
1 of 24
Download to read offline
Области приложения семантических технологий
                        семинар Центра семантических технологий НИУ ВШЭ и
                             ЗАО «Авикомп Сервисез», 11 мая 2012 года


              Технологии для публикации данных
           в Semantic Web и их интеграции в единое
             международное пространство знаний
                       Linked Open Data

                               Радченко Ирина Алексеевна
                                 к.т.н., научный сотрудник
                        Центра семантических технологий НИУ ВШЭ

НИУ ВШЭ, Москва, 2012
Содержание


    1. Публикация данных в Semantic Web в виде наборов Linked
       Open Data

    2. Российский проект по созданию наборов Linked Open Data

    3. Перспективное направление – публикация государственных
       данных




НИУ ВШЭ, Москва, 2012
                                                                2
 Публикация данных в Semantic Web
     в виде наборов Linked Open Data




НИУ ВШЭ, Москва, 2012
                                        3
Публикация данных в Semantic Web

   Данные представлены при помощи
   языка разметки HTML
   (HyperText Markup Language)




                                                     Х
                                           HTML (текст)




                        Данные понятны человеку, но непонятны компьютеру

НИУ ВШЭ, Москва, 2012
                                                                           4
Публикация данных в Semantic Web

   Машиночитаемый формат обеспечивается
   моделью представления данных RDF
   (Resource Description Framework)




                          Данные понятны и человеку, и компьютеру


НИУ ВШЭ, Москва, 2012
                                                                    5
Модель
                          Resource Description Framework
  Машиночитаемый формат обеспечивается
  моделью представления данных RDF
  (Resource Description Framework)

                                 Модель RDF

                Субъект            Предикат       Объект


                                   Триплет


                                   Пример

                 Иванов           работает в     «Газпроме»



НИУ ВШЭ, Москва, 2012
                                                              6
Связанные открытые данные –
                              Linked Open Data
                              LOD (Linked Open Data)



                                                     Биографии
                        Новости

                                            тот же
                                                       Иванов
                        Иванов




                           Связи повышают ценность данных


НИУ ВШЭ, Москва, 2012
                                                                 7
Публикация открытых данных
                              в формате LOD
                Разработан                                  Читается не только
             международным                                    людьми, но и
            консорциумом W3C                                 компьютерами



                                               LOD
                                       (Linked Open Data)
     Обеспечивает
  простоту интеграции
   данных из разных
      источников                                                Обеспечивает
                                                             связывание данных
                                                                из различных
                               В него преобразуются              источников
                                   любые данные
                               (структурированные и
                               неструктурированные)
НИУ ВШЭ, Москва, 2012
                                                                                 8
Динамика развития Linked Open Data

                        Темпы нарастания объемов фактов
 Количество
наборов LOD




                        2007           2008             2009             2010
                                                                                      Время

   Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

НИУ ВШЭ, Москва, 2012
                                                                                              9
Области использования
                                          Linked Open Data
   Облако наборов LOD охватывает около 30 миллиардов триплетов и 500 миллионов связей




                                                                                                          СМИ
                                                                                                    География
                                                                                                  Публикации
                                                                                                      Созданный
                                                                                          пользователями контент
                                                                                    Государственные данные

                                                                          Междисциплинарные области
                                                                                               Науки о жизни
   Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

НИУ ВШЭ, Москва, 2012
                                                                                                               10
 Российский проект по созданию
    публичного ресурса открытых данных
    в области науки и техники,
    интегрированного в единое
    международное пространство знаний
    Linked Open Data



НИУ ВШЭ, Москва, 2012
                                         11
Разработка проекта LOD Центром
                             семантических технологий совместно
                             с компанией ЗАО «Авикомп Сервисез»
                                                   Наборы LOD с данными
 Разнородные источники                             по научно-технической
    исходных данных                                      тематике
                                   Программно-                      Мате-
          Интернет                                                  матика
                                   аппаратный
                                    комплекс
                                                       Нано-
                                                       техно-
    БД           Документы                             логии             Наборы LOD,
                                                                       опубликованные
                                                                         в Интернете
  Цели
 Создать наборы LOD в области науки и техники и
  интегрировать их в международное пространство
  знаний
 Создать программно-аппаратный комплекс
  для поддержки LOD
 Отработать технологию формирования наборов
  LOD для последующего тиражирования
 НИУ ВШЭ, Москва, 2012
                                                                              12
 Перспективное направление –
  использование технологии Linked Open Data
  для публикации государственных данных




НИУ ВШЭ, Москва, 2012
                                         13
Области использования
                                              Linked Open Data
   Облако наборов LOD охватывает около 30 миллиардов триплетов и 500 миллионов связей




                                                                                                            СМИ
                                                                                                      География
                                                                                                    Публикации
                                                                                                        Созданный
                                                                                            пользователями контент
                                                                                         Государственные данные

                                                                                 Междисциплинарные области
                                                                                                 Науки о жизни
  Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

НИУ ВШЭ, Москва, 2012
                                                                                                                 14
Открытые государственные данные
                                   за рубежом
   Цель: повысить открытость, доступность данных для населения,
   способствовать распространению государственной информации

  в США:                                        в Великобритании:
  http://www.data.gov/                          http://data.gov.uk/
  http://www.utah.gov/data/                     http://data.london.gov.uk/
  http://data.octo.dc.gov/                      http://openlylocal.com/councils
  https://nycopendata.socrata.com/              http://www.mysociety.org/
  http://dwexternal.co.mecklenburg.nc.us/ids/
  Nav_Reports.aspx/                             в Канаде:
  http://www.govtrack.us/                       http://www.toronto.ca/open/
  http://openstates.org/                        https://data.edmonton.ca/
                                                http://data.nanaimo.ca/
  в Австралии:                                  http://data.vancouver.ca/
  http://gov2.net.au/projects/index.html
                                                в Швеции:
                                                http://www.opengov.se/data/

НИУ ВШЭ, Москва, 2012
                                                                                  15
Открытые государственные данные
                                   за рубежом
 Правительством США опубликованы сотни наборов данных в формате LOD

                             Статистика потребления электроэнергии по 7 городам
                             с населением около полумиллиона человек
                             (Министерство энергетики США и Бюро переписи США,
                             http://en.openei.org/apps/mashathon2010/)
                             Набор данных для мониторинга уровня озона
                             (Агентство по охране окружающей среды,
                             http://data-gov.tw.rpi.edu/demo/exhibit/demo-8-castnet.php)

                            Статистика по музейным и библиотечным услугам
                            (Институт музейных и библиотечных услуг,
                            http://www.imls.gov/research/data_analysis_tools.aspx)

                            Информация о банкротстве публичных акционерных
                            компаний (Комиссия по ценным бумагам и биржам США,
                            http://www.sec.gov/open/datasets.shtml#bankruptcy)
НИУ ВШЭ, Москва, 2012
                                                                                     16
Открытые государственные данные
                                   за рубежом

Германия
•    Данные по сводкам происшествий (публикуются
     полицией Берлина). Используется сервисом
     Crimeblips, который визуализирует на карте
     данные по криминальной статистике


Венгрия
•   Публичный каталог Национальной библиотеки Венгрии

Швеция
•   Ресурс «Шведское культурное наследие» (содержит в формате связанных данных
    3,4 млн. объектов)


НИУ ВШЭ, Москва, 2012
                                                                           17
Пример стоимости проектов, связанных
                           с открытыми государственными данными
  Название проекта                Стоим.                                         Описание
                                  (млн $)
 Data.Gov (basic                    3,00       Сайт позволяет общественности найти, скачать и использовать
 functionality)                                машиночитаемые данные, собранные органами
 Data.Gov (innovative                          исполнительной власти. Способствует развитию отчетности,
                                    2,50
 functionality)                                вовлечению граждан в жизнь государства и улучшает процесс
                                               управления федеральными данными.
 FedSpace                           5,00       Позволяет государственным служащим совместно работать
                                               над одними документами, с помощью одних инструментов.
                                               Объединяет тех, "кто знает", с теми, "кто хочет знать".
 Citizen Services                   5,00       Определение показателей обслуживания клиентов
 Dashboard                                     наиважнейших гражданских сервисов для повышения
                                               прозрачности и качества, обеспечения подотчетности
                                               предоставляемых услуг.
 USASpending.gov and                9,50       Предоставление данных о расходах в соответствии с Законом
 dashboards                                    о необходимости отчетности и прозрачности Федерального
                                               финансирования (FFATA)
Источник: Report to the Committee on Homeland Security and Governmental Affairs, U.S. Senate. ELECTRONIC GOVERNMENT. September 2011
   НИУ ВШЭ, Москва, 2012
                                                                                                                         18
Открытые государственные данные
                                    в России


                                    Надо максимально открывать
                                информацию, которая накапливается
                                 в ведомственных базах данных. <...>
                                Кстати, такой информации <…> часто
                                     не хватает нашим компаниям,
                                    причем прежде всего малому и
                                среднему бизнесу при выстраивании
                                долгосрочных планов и определении
                                     инвестиционных приоритетов



НИУ ВШЭ, Москва, 2012
                                                                 19
Публикация государственных данных
                                     в России




                              Источник – OpenGovData.Ru
НИУ ВШЭ, Москва, 2012
                                                            20
Данные об оказанных медицинских услугах
                          в рамках обязательного медицинского
                                 страхования г. Москвы

                    Характеристика
                                                Содержание данных
                  предметной области
     • Более 11 млн. застрахованных       • Список оказанных услуг
     • Более 30 млн. счетов               • Фамилия, имя, отчество
       от лечебно-профилактических          пациента
       учреждений в месяц                 • Диагноз по МКБ-10
     • Ежегодный объем данных             • Фамилия, имя, отчество врача
       около 1.5 Терабайт                 • Наименование лечебно-
     • Увеличение единой базы               профилактического
       данных в среднем                     учреждения
       на 50 млн. записей в месяц




НИУ ВШЭ, Москва, 2012
                                                                      21
Открытые связанные данные
                            сферы здравоохранения
                             Данные               Отзывы и
                          общегородских           рейтинги
                            регистров

                                                                  Данные страховых
  Данные единой                                                     медицинских
    медицинской                                                     организаций
 информационной                     Данные об оказанных
автоматизированной                  медицинских услугах
      системы                      в рамках обязательного
                                  медицинского страхования
                                         г. Москвы                    Данные
                                                                    федеральных
              Данные                                                 регистров
            мониторинга
                                     …         Данные лечебно-
                               … …             профилактических
                                                  учреждений
НИУ ВШЭ, Москва, 2012
                                                                             22
Варианты создания сервисов на основе
                             данных сферы здравоохранения
     Сервисы для граждан                                                         Сервисы для научных
• Выбор лечебно-профилактического                                                    сотрудников
  учреждения, врача и страховой                           Научный         • Всесторонний и постоянный сбор
  медицинской организации                Пациент         сотрудник          информации по научным статьям,
• Совместимость лекарств с другими                                          их авторам, учреждениям и т.д.
  лекарствами, состояниями,                                               • Свод статистики по разным
  заболеваниями и аллергиями                                                параметрам и темам исследований
• Аптеки, цены на лекарства                                               • Составление научных отчетов и
• …                                                                         определение тенденций
                          Управленец
                                                                          • …
  Сервисы мониторинга и                                                   Врач
   статистики процессов                                                          Сервисы поддержки
    в здравоохранении                                                             принятия решений
  • Оперативное выявление тенденций          Сервисы для сферы            • Уточнение диагноза
    в динамике показателей                        бизнеса                 • Индивидуальный подбор тактики
    здравоохранения                        • Анализ рынка                   лечения
  • Исследование эффективности             • Какие исследования           • Совместимость лекарств
    реализуемых программ                     проводятся?                  • Прогнозирование развития
  • Отслеживание качества работы           • Какие результаты               заболевания
    медучреждений по отзывам                 достигнуты?                  • Разработка профилактических
    населения                              • Каков спрос на результаты?     мероприятий и новых способов
  • Анализ опыта других регионов стран     • Анализ работы компаний         лечения
  • …                                      •…                             • …
  НИУ ВШЭ, Москва, 2012
                                                                                                    23
Технологии для публикации данных  в Semantic Web и их интеграции в единое международное пространство знаний  Linked Open Data

More Related Content

What's hot

Введение в открытые данные. Первое занятие Школы открытых данных
Введение в открытые данные. Первое занятие Школы открытых данныхВведение в открытые данные. Первое занятие Школы открытых данных
Введение в открытые данные. Первое занятие Школы открытых данныхIrina Radchenko
 
Работа с открытыми данными (Open GeoData)
Работа с открытыми данными (Open GeoData)Работа с открытыми данными (Open GeoData)
Работа с открытыми данными (Open GeoData)Irina Radchenko
 
Russian Open Educational Resource dedicated Data Journalism
Russian Open Educational Resource dedicated Data Journalism Russian Open Educational Resource dedicated Data Journalism
Russian Open Educational Resource dedicated Data Journalism Irina Radchenko
 
Открытый доступ: роль библиотек
Открытый доступ:  роль библиотекОткрытый доступ:  роль библиотек
Открытый доступ: роль библиотекIryna Kuchma
 
Введение в журналистику данных (Data Journalism)
Введение в журналистику данных (Data Journalism)Введение в журналистику данных (Data Journalism)
Введение в журналистику данных (Data Journalism)Irina Radchenko
 
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...Irina Radchenko
 
Введение в открытые данные (Open Data introduction)
Введение в открытые данные (Open Data introduction)Введение в открытые данные (Open Data introduction)
Введение в открытые данные (Open Data introduction)Irina Radchenko
 
Data journalism and open data educational projects
Data journalism and open data educational projectsData journalism and open data educational projects
Data journalism and open data educational projectsIrina Radchenko
 
Введение в дата-журналистику
Введение в дата-журналистикуВведение в дата-журналистику
Введение в дата-журналистикуIrina Radchenko
 
Open data: quality and values
Open data: quality and valuesOpen data: quality and values
Open data: quality and valuesIrina Radchenko
 
Национальная открытая инфраструктура знаний
Национальная открытая инфраструктура знанийНациональная открытая инфраструктура знаний
Национальная открытая инфраструктура знанийDmitry Semyachkin
 
АРХИТЕКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ WIKI-ТЕХНОЛОГИИ И ИНТЕГРИРО...
АРХИТЕКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ WIKI-ТЕХНОЛОГИИ И ИНТЕГРИРО...АРХИТЕКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ WIKI-ТЕХНОЛОГИИ И ИНТЕГРИРО...
АРХИТЕКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ WIKI-ТЕХНОЛОГИИ И ИНТЕГРИРО...ITMO University
 
КиберЛенинка — итоги 2015 года
КиберЛенинка — итоги 2015 годаКиберЛенинка — итоги 2015 года
КиберЛенинка — итоги 2015 годаDmitry Semyachkin
 
Открытая наука в России: практические шаги
Открытая наука в России: практические шагиОткрытая наука в России: практические шаги
Открытая наука в России: практические шагиDmitry Semyachkin
 
Открытый доступ как нативная реклама научного журнала
Открытый доступ как нативная реклама научного журналаОткрытый доступ как нативная реклама научного журнала
Открытый доступ как нативная реклама научного журналаDmitry Semyachkin
 
Verification based on open data arrays [RUS]
Verification based on open data arrays [RUS]Verification based on open data arrays [RUS]
Verification based on open data arrays [RUS]Mikhail Vink
 

What's hot (19)

Введение в открытые данные. Первое занятие Школы открытых данных
Введение в открытые данные. Первое занятие Школы открытых данныхВведение в открытые данные. Первое занятие Школы открытых данных
Введение в открытые данные. Первое занятие Школы открытых данных
 
Работа с открытыми данными (Open GeoData)
Работа с открытыми данными (Open GeoData)Работа с открытыми данными (Open GeoData)
Работа с открытыми данными (Open GeoData)
 
Russian Open Educational Resource dedicated Data Journalism
Russian Open Educational Resource dedicated Data Journalism Russian Open Educational Resource dedicated Data Journalism
Russian Open Educational Resource dedicated Data Journalism
 
Открытый доступ: роль библиотек
Открытый доступ:  роль библиотекОткрытый доступ:  роль библиотек
Открытый доступ: роль библиотек
 
Введение в журналистику данных (Data Journalism)
Введение в журналистику данных (Data Journalism)Введение в журналистику данных (Data Journalism)
Введение в журналистику данных (Data Journalism)
 
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...
Открытые данные: мировые тенденции, предпосылки возникновения и основные напр...
 
Введение в открытые данные (Open Data introduction)
Введение в открытые данные (Open Data introduction)Введение в открытые данные (Open Data introduction)
Введение в открытые данные (Open Data introduction)
 
Data journalism and open data educational projects
Data journalism and open data educational projectsData journalism and open data educational projects
Data journalism and open data educational projects
 
Введение в дата-журналистику
Введение в дата-журналистикуВведение в дата-журналистику
Введение в дата-журналистику
 
Open data: quality and values
Open data: quality and valuesOpen data: quality and values
Open data: quality and values
 
Национальная открытая инфраструктура знаний
Национальная открытая инфраструктура знанийНациональная открытая инфраструктура знаний
Национальная открытая инфраструктура знаний
 
Open Data Sharing
Open Data SharingOpen Data Sharing
Open Data Sharing
 
Open transport data
Open transport dataOpen transport data
Open transport data
 
Open data
Open dataOpen data
Open data
 
АРХИТЕКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ WIKI-ТЕХНОЛОГИИ И ИНТЕГРИРО...
АРХИТЕКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ WIKI-ТЕХНОЛОГИИ И ИНТЕГРИРО...АРХИТЕКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ WIKI-ТЕХНОЛОГИИ И ИНТЕГРИРО...
АРХИТЕКТУРА СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ WIKI-ТЕХНОЛОГИИ И ИНТЕГРИРО...
 
КиберЛенинка — итоги 2015 года
КиберЛенинка — итоги 2015 годаКиберЛенинка — итоги 2015 года
КиберЛенинка — итоги 2015 года
 
Открытая наука в России: практические шаги
Открытая наука в России: практические шагиОткрытая наука в России: практические шаги
Открытая наука в России: практические шаги
 
Открытый доступ как нативная реклама научного журнала
Открытый доступ как нативная реклама научного журналаОткрытый доступ как нативная реклама научного журнала
Открытый доступ как нативная реклама научного журнала
 
Verification based on open data arrays [RUS]
Verification based on open data arrays [RUS]Verification based on open data arrays [RUS]
Verification based on open data arrays [RUS]
 

Viewers also liked

Open Knowledge Foundation Russia
Open Knowledge Foundation RussiaOpen Knowledge Foundation Russia
Open Knowledge Foundation RussiaIrina Radchenko
 
Дата-экспедиция №1 (Data Expedition #1)
Дата-экспедиция №1 (Data Expedition #1)Дата-экспедиция №1 (Data Expedition #1)
Дата-экспедиция №1 (Data Expedition #1)Irina Radchenko
 
How to visualize your datasets
How to visualize your datasetsHow to visualize your datasets
How to visualize your datasetsIrina Radchenko
 
All colours-of-Open-Science
All colours-of-Open-ScienceAll colours-of-Open-Science
All colours-of-Open-ScienceIrina Radchenko
 
Проблемы создания среды, обучения и работы с открытыми данными
Проблемы создания среды, обучения и работы с открытыми даннымиПроблемы создания среды, обучения и работы с открытыми данными
Проблемы создания среды, обучения и работы с открытыми даннымиIrina Radchenko
 
Data journalism and Data Expeditions
Data journalism and Data ExpeditionsData journalism and Data Expeditions
Data journalism and Data ExpeditionsIrina Radchenko
 
Open Data and Data Journalism in Russia
Open Data and Data Journalism in RussiaOpen Data and Data Journalism in Russia
Open Data and Data Journalism in RussiaIrina Radchenko
 
Some Russian Open data and Data Journalism projects
Some Russian Open data and Data Journalism projects Some Russian Open data and Data Journalism projects
Some Russian Open data and Data Journalism projects Irina Radchenko
 
Open Data and Data Journalism
Open Data and Data JournalismOpen Data and Data Journalism
Open Data and Data JournalismIrina Radchenko
 
Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)Irina Radchenko
 
Open Science and Open Education
Open Science and Open EducationOpen Science and Open Education
Open Science and Open EducationIrina Radchenko
 
Data Journalism at HSE conference
Data Journalism at HSE conferenceData Journalism at HSE conference
Data Journalism at HSE conferenceIrina Radchenko
 
Open Data and Data Journalism
Open Data and Data JournalismOpen Data and Data Journalism
Open Data and Data JournalismIrina Radchenko
 

Viewers also liked (17)

Open data aspects
Open data aspectsOpen data aspects
Open data aspects
 
Open Knowledge Foundation Russia
Open Knowledge Foundation RussiaOpen Knowledge Foundation Russia
Open Knowledge Foundation Russia
 
Open Science
Open ScienceOpen Science
Open Science
 
Дата-экспедиция №1 (Data Expedition #1)
Дата-экспедиция №1 (Data Expedition #1)Дата-экспедиция №1 (Data Expedition #1)
Дата-экспедиция №1 (Data Expedition #1)
 
Open data in biology
Open data in biologyOpen data in biology
Open data in biology
 
How to visualize your datasets
How to visualize your datasetsHow to visualize your datasets
How to visualize your datasets
 
All colours-of-Open-Science
All colours-of-Open-ScienceAll colours-of-Open-Science
All colours-of-Open-Science
 
Проблемы создания среды, обучения и работы с открытыми данными
Проблемы создания среды, обучения и работы с открытыми даннымиПроблемы создания среды, обучения и работы с открытыми данными
Проблемы создания среды, обучения и работы с открытыми данными
 
Open science platforms
Open science platformsOpen science platforms
Open science platforms
 
Data journalism and Data Expeditions
Data journalism and Data ExpeditionsData journalism and Data Expeditions
Data journalism and Data Expeditions
 
Open Data and Data Journalism in Russia
Open Data and Data Journalism in RussiaOpen Data and Data Journalism in Russia
Open Data and Data Journalism in Russia
 
Some Russian Open data and Data Journalism projects
Some Russian Open data and Data Journalism projects Some Russian Open data and Data Journalism projects
Some Russian Open data and Data Journalism projects
 
Open Data and Data Journalism
Open Data and Data JournalismOpen Data and Data Journalism
Open Data and Data Journalism
 
Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)
 
Open Science and Open Education
Open Science and Open EducationOpen Science and Open Education
Open Science and Open Education
 
Data Journalism at HSE conference
Data Journalism at HSE conferenceData Journalism at HSE conference
Data Journalism at HSE conference
 
Open Data and Data Journalism
Open Data and Data JournalismOpen Data and Data Journalism
Open Data and Data Journalism
 

Similar to Технологии для публикации данных в Semantic Web и их интеграции в единое международное пространство знаний Linked Open Data

Введение в открытые данные
Введение в открытые данныеВведение в открытые данные
Введение в открытые данныеIrina Radchenko
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS) Fred Kozlov
 
1 09 Использование возможностей Lms Moodle для смешанного обучения Опыт Мари...
1 09 Использование возможностей Lms Moodle для смешанного обучения  Опыт Мари...1 09 Использование возможностей Lms Moodle для смешанного обучения  Опыт Мари...
1 09 Использование возможностей Lms Moodle для смешанного обучения Опыт Мари...Сообщество eLearning PRO
 
Pp лекция веб-2.0
Pp лекция веб-2.0Pp лекция веб-2.0
Pp лекция веб-2.0anbogomolov
 
презентация учителя
презентация учителяпрезентация учителя
презентация учителяPyatnica
 
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...Open City Foundation
 
Информационно-образовательная среда – что это такое? Коллоквиум – дискуссия
Информационно-образовательная среда – что это такое? Коллоквиум – дискуссияИнформационно-образовательная среда – что это такое? Коллоквиум – дискуссия
Информационно-образовательная среда – что это такое? Коллоквиум – дискуссияPavel Kallinikov
 

Similar to Технологии для публикации данных в Semantic Web и их интеграции в единое международное пространство знаний Linked Open Data (8)

Введение в открытые данные
Введение в открытые данныеВведение в открытые данные
Введение в открытые данные
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS)
 
1 09 Использование возможностей Lms Moodle для смешанного обучения Опыт Мари...
1 09 Использование возможностей Lms Moodle для смешанного обучения  Опыт Мари...1 09 Использование возможностей Lms Moodle для смешанного обучения  Опыт Мари...
1 09 Использование возможностей Lms Moodle для смешанного обучения Опыт Мари...
 
Pp лекция веб-2.0
Pp лекция веб-2.0Pp лекция веб-2.0
Pp лекция веб-2.0
 
презентация учителя
презентация учителяпрезентация учителя
презентация учителя
 
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
 
Информационно-образовательная среда – что это такое? Коллоквиум – дискуссия
Информационно-образовательная среда – что это такое? Коллоквиум – дискуссияИнформационно-образовательная среда – что это такое? Коллоквиум – дискуссия
Информационно-образовательная среда – что это такое? Коллоквиум – дискуссия
 
тема 12
тема 12тема 12
тема 12
 

More from Irina Radchenko

Аналитик, данные и джаз
Аналитик, данные и джазАналитик, данные и джаз
Аналитик, данные и джазIrina Radchenko
 
Как и где искать открытые данные?
Как и где искать открытые данные?Как и где искать открытые данные?
Как и где искать открытые данные?Irina Radchenko
 
Дата-экспедиции. Data Expeditions
Дата-экспедиции. Data ExpeditionsДата-экспедиции. Data Expeditions
Дата-экспедиции. Data ExpeditionsIrina Radchenko
 
Data Expeditions Eduthon
Data Expeditions EduthonData Expeditions Eduthon
Data Expeditions EduthonIrina Radchenko
 
Анализ 
и визуализация данных
Анализ 
и визуализация данныхАнализ 
и визуализация данных
Анализ 
и визуализация данныхIrina Radchenko
 
Data management syllabus
Data management syllabusData management syllabus
Data management syllabusIrina Radchenko
 
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Irina Radchenko
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist Irina Radchenko
 
Вебинар по статистике
Вебинар по статистикеВебинар по статистике
Вебинар по статистикеIrina Radchenko
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data JournalismIrina Radchenko
 
Introduction to Open Data
Introduction to Open DataIntroduction to Open Data
Introduction to Open DataIrina Radchenko
 
Open Data hackathons in Russia
Open Data hackathons in RussiaOpen Data hackathons in Russia
Open Data hackathons in RussiaIrina Radchenko
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data JournalismIrina Radchenko
 

More from Irina Radchenko (20)

Аналитик, данные и джаз
Аналитик, данные и джазАналитик, данные и джаз
Аналитик, данные и джаз
 
Open access as is
Open access as isOpen access as is
Open access as is
 
Как и где искать открытые данные?
Как и где искать открытые данные?Как и где искать открытые данные?
Как и где искать открытые данные?
 
Дата-экспедиции. Data Expeditions
Дата-экспедиции. Data ExpeditionsДата-экспедиции. Data Expeditions
Дата-экспедиции. Data Expeditions
 
Data expedition
Data expeditionData expedition
Data expedition
 
Data Expeditions Eduthon
Data Expeditions EduthonData Expeditions Eduthon
Data Expeditions Eduthon
 
Анализ 
и визуализация данных
Анализ 
и визуализация данныхАнализ 
и визуализация данных
Анализ 
и визуализация данных
 
Data management syllabus
Data management syllabusData management syllabus
Data management syllabus
 
Data journalist
Data journalistData journalist
Data journalist
 
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
 
FREYA project
FREYA projectFREYA project
FREYA project
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist
 
Вебинар по статистике
Вебинар по статистикеВебинар по статистике
Вебинар по статистике
 
Программа CATT
Программа CATTПрограмма CATT
Программа CATT
 
Open Data aspects
Open Data aspectsOpen Data aspects
Open Data aspects
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data Journalism
 
Introduction to Open Data
Introduction to Open DataIntroduction to Open Data
Introduction to Open Data
 
Open Data hackathons in Russia
Open Data hackathons in RussiaOpen Data hackathons in Russia
Open Data hackathons in Russia
 
Working with Open Data
Working with Open DataWorking with Open Data
Working with Open Data
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data Journalism
 

Recently uploaded (9)

2023 Q4. The Ransomware report. [RU].pdf
2023 Q4. The Ransomware report. [RU].pdf2023 Q4. The Ransomware report. [RU].pdf
2023 Q4. The Ransomware report. [RU].pdf
 
MS Navigating Incident Response [RU].pdf
MS Navigating Incident Response [RU].pdfMS Navigating Incident Response [RU].pdf
MS Navigating Incident Response [RU].pdf
 
CVE. The Fortra's GoAnywhere MFT [RU].pdf
CVE. The Fortra's GoAnywhere MFT [RU].pdfCVE. The Fortra's GoAnywhere MFT [RU].pdf
CVE. The Fortra's GoAnywhere MFT [RU].pdf
 
Malware. DCRAT (DARK CRYSTAL RAT) [RU].pdf
Malware. DCRAT (DARK CRYSTAL RAT) [RU].pdfMalware. DCRAT (DARK CRYSTAL RAT) [RU].pdf
Malware. DCRAT (DARK CRYSTAL RAT) [RU].pdf
 
Cyberprint. Dark Pink Apt Group [RU].pdf
Cyberprint. Dark Pink Apt Group [RU].pdfCyberprint. Dark Pink Apt Group [RU].pdf
Cyberprint. Dark Pink Apt Group [RU].pdf
 
ИСТОЧНИКИ ИННОВАЦИОННОСТИ КИТАЯ (ПО ВЕРСИИ DGAP) | The Sources of China’s Inn...
ИСТОЧНИКИ ИННОВАЦИОННОСТИ КИТАЯ (ПО ВЕРСИИ DGAP) | The Sources of China’s Inn...ИСТОЧНИКИ ИННОВАЦИОННОСТИ КИТАЯ (ПО ВЕРСИИ DGAP) | The Sources of China’s Inn...
ИСТОЧНИКИ ИННОВАЦИОННОСТИ КИТАЯ (ПО ВЕРСИИ DGAP) | The Sources of China’s Inn...
 
Ransomware_Q3 2023. The report [RU].pdf
Ransomware_Q3 2023.  The report [RU].pdfRansomware_Q3 2023.  The report [RU].pdf
Ransomware_Q3 2023. The report [RU].pdf
 
СИСТЕМА ОЦЕНКИ УЯЗВИМОСТЕЙ CVSS 4.0 / CVSS v4.0 [RU].pdf
СИСТЕМА ОЦЕНКИ УЯЗВИМОСТЕЙ CVSS 4.0 / CVSS v4.0 [RU].pdfСИСТЕМА ОЦЕНКИ УЯЗВИМОСТЕЙ CVSS 4.0 / CVSS v4.0 [RU].pdf
СИСТЕМА ОЦЕНКИ УЯЗВИМОСТЕЙ CVSS 4.0 / CVSS v4.0 [RU].pdf
 
Cyber Defense Doctrine Managing the Risk Full Applied Guide to Organizational...
Cyber Defense Doctrine Managing the Risk Full Applied Guide to Organizational...Cyber Defense Doctrine Managing the Risk Full Applied Guide to Organizational...
Cyber Defense Doctrine Managing the Risk Full Applied Guide to Organizational...
 

Технологии для публикации данных в Semantic Web и их интеграции в единое международное пространство знаний Linked Open Data

  • 1. Области приложения семантических технологий семинар Центра семантических технологий НИУ ВШЭ и ЗАО «Авикомп Сервисез», 11 мая 2012 года Технологии для публикации данных в Semantic Web и их интеграции в единое международное пространство знаний Linked Open Data Радченко Ирина Алексеевна к.т.н., научный сотрудник Центра семантических технологий НИУ ВШЭ НИУ ВШЭ, Москва, 2012
  • 2. Содержание 1. Публикация данных в Semantic Web в виде наборов Linked Open Data 2. Российский проект по созданию наборов Linked Open Data 3. Перспективное направление – публикация государственных данных НИУ ВШЭ, Москва, 2012 2
  • 3.  Публикация данных в Semantic Web в виде наборов Linked Open Data НИУ ВШЭ, Москва, 2012 3
  • 4. Публикация данных в Semantic Web Данные представлены при помощи языка разметки HTML (HyperText Markup Language) Х HTML (текст) Данные понятны человеку, но непонятны компьютеру НИУ ВШЭ, Москва, 2012 4
  • 5. Публикация данных в Semantic Web Машиночитаемый формат обеспечивается моделью представления данных RDF (Resource Description Framework) Данные понятны и человеку, и компьютеру НИУ ВШЭ, Москва, 2012 5
  • 6. Модель Resource Description Framework Машиночитаемый формат обеспечивается моделью представления данных RDF (Resource Description Framework) Модель RDF Субъект Предикат Объект Триплет Пример Иванов работает в «Газпроме» НИУ ВШЭ, Москва, 2012 6
  • 7. Связанные открытые данные – Linked Open Data LOD (Linked Open Data) Биографии Новости тот же Иванов Иванов Связи повышают ценность данных НИУ ВШЭ, Москва, 2012 7
  • 8. Публикация открытых данных в формате LOD Разработан Читается не только международным людьми, но и консорциумом W3C компьютерами LOD (Linked Open Data) Обеспечивает простоту интеграции данных из разных источников Обеспечивает связывание данных из различных В него преобразуются источников любые данные (структурированные и неструктурированные) НИУ ВШЭ, Москва, 2012 8
  • 9. Динамика развития Linked Open Data Темпы нарастания объемов фактов Количество наборов LOD 2007 2008 2009 2010 Время Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData НИУ ВШЭ, Москва, 2012 9
  • 10. Области использования Linked Open Data Облако наборов LOD охватывает около 30 миллиардов триплетов и 500 миллионов связей СМИ География Публикации Созданный пользователями контент Государственные данные Междисциплинарные области Науки о жизни Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData НИУ ВШЭ, Москва, 2012 10
  • 11.  Российский проект по созданию публичного ресурса открытых данных в области науки и техники, интегрированного в единое международное пространство знаний Linked Open Data НИУ ВШЭ, Москва, 2012 11
  • 12. Разработка проекта LOD Центром семантических технологий совместно с компанией ЗАО «Авикомп Сервисез» Наборы LOD с данными Разнородные источники по научно-технической исходных данных тематике Программно- Мате- Интернет матика аппаратный комплекс Нано- техно- БД Документы логии Наборы LOD, опубликованные в Интернете Цели  Создать наборы LOD в области науки и техники и интегрировать их в международное пространство знаний  Создать программно-аппаратный комплекс для поддержки LOD  Отработать технологию формирования наборов LOD для последующего тиражирования НИУ ВШЭ, Москва, 2012 12
  • 13.  Перспективное направление – использование технологии Linked Open Data для публикации государственных данных НИУ ВШЭ, Москва, 2012 13
  • 14. Области использования Linked Open Data Облако наборов LOD охватывает около 30 миллиардов триплетов и 500 миллионов связей СМИ География Публикации Созданный пользователями контент Государственные данные Междисциплинарные области Науки о жизни Источник: http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData НИУ ВШЭ, Москва, 2012 14
  • 15. Открытые государственные данные за рубежом Цель: повысить открытость, доступность данных для населения, способствовать распространению государственной информации в США: в Великобритании: http://www.data.gov/ http://data.gov.uk/ http://www.utah.gov/data/ http://data.london.gov.uk/ http://data.octo.dc.gov/ http://openlylocal.com/councils https://nycopendata.socrata.com/ http://www.mysociety.org/ http://dwexternal.co.mecklenburg.nc.us/ids/ Nav_Reports.aspx/ в Канаде: http://www.govtrack.us/ http://www.toronto.ca/open/ http://openstates.org/ https://data.edmonton.ca/ http://data.nanaimo.ca/ в Австралии: http://data.vancouver.ca/ http://gov2.net.au/projects/index.html в Швеции: http://www.opengov.se/data/ НИУ ВШЭ, Москва, 2012 15
  • 16. Открытые государственные данные за рубежом Правительством США опубликованы сотни наборов данных в формате LOD Статистика потребления электроэнергии по 7 городам с населением около полумиллиона человек (Министерство энергетики США и Бюро переписи США, http://en.openei.org/apps/mashathon2010/) Набор данных для мониторинга уровня озона (Агентство по охране окружающей среды, http://data-gov.tw.rpi.edu/demo/exhibit/demo-8-castnet.php) Статистика по музейным и библиотечным услугам (Институт музейных и библиотечных услуг, http://www.imls.gov/research/data_analysis_tools.aspx) Информация о банкротстве публичных акционерных компаний (Комиссия по ценным бумагам и биржам США, http://www.sec.gov/open/datasets.shtml#bankruptcy) НИУ ВШЭ, Москва, 2012 16
  • 17. Открытые государственные данные за рубежом Германия • Данные по сводкам происшествий (публикуются полицией Берлина). Используется сервисом Crimeblips, который визуализирует на карте данные по криминальной статистике Венгрия • Публичный каталог Национальной библиотеки Венгрии Швеция • Ресурс «Шведское культурное наследие» (содержит в формате связанных данных 3,4 млн. объектов) НИУ ВШЭ, Москва, 2012 17
  • 18. Пример стоимости проектов, связанных с открытыми государственными данными Название проекта Стоим. Описание (млн $) Data.Gov (basic 3,00 Сайт позволяет общественности найти, скачать и использовать functionality) машиночитаемые данные, собранные органами Data.Gov (innovative исполнительной власти. Способствует развитию отчетности, 2,50 functionality) вовлечению граждан в жизнь государства и улучшает процесс управления федеральными данными. FedSpace 5,00 Позволяет государственным служащим совместно работать над одними документами, с помощью одних инструментов. Объединяет тех, "кто знает", с теми, "кто хочет знать". Citizen Services 5,00 Определение показателей обслуживания клиентов Dashboard наиважнейших гражданских сервисов для повышения прозрачности и качества, обеспечения подотчетности предоставляемых услуг. USASpending.gov and 9,50 Предоставление данных о расходах в соответствии с Законом dashboards о необходимости отчетности и прозрачности Федерального финансирования (FFATA) Источник: Report to the Committee on Homeland Security and Governmental Affairs, U.S. Senate. ELECTRONIC GOVERNMENT. September 2011 НИУ ВШЭ, Москва, 2012 18
  • 19. Открытые государственные данные в России Надо максимально открывать информацию, которая накапливается в ведомственных базах данных. <...> Кстати, такой информации <…> часто не хватает нашим компаниям, причем прежде всего малому и среднему бизнесу при выстраивании долгосрочных планов и определении инвестиционных приоритетов НИУ ВШЭ, Москва, 2012 19
  • 20. Публикация государственных данных в России Источник – OpenGovData.Ru НИУ ВШЭ, Москва, 2012 20
  • 21. Данные об оказанных медицинских услугах в рамках обязательного медицинского страхования г. Москвы Характеристика Содержание данных предметной области • Более 11 млн. застрахованных • Список оказанных услуг • Более 30 млн. счетов • Фамилия, имя, отчество от лечебно-профилактических пациента учреждений в месяц • Диагноз по МКБ-10 • Ежегодный объем данных • Фамилия, имя, отчество врача около 1.5 Терабайт • Наименование лечебно- • Увеличение единой базы профилактического данных в среднем учреждения на 50 млн. записей в месяц НИУ ВШЭ, Москва, 2012 21
  • 22. Открытые связанные данные сферы здравоохранения Данные Отзывы и общегородских рейтинги регистров Данные страховых Данные единой медицинских медицинской организаций информационной Данные об оказанных автоматизированной медицинских услугах системы в рамках обязательного медицинского страхования г. Москвы Данные федеральных Данные регистров мониторинга … Данные лечебно- … … профилактических учреждений НИУ ВШЭ, Москва, 2012 22
  • 23. Варианты создания сервисов на основе данных сферы здравоохранения Сервисы для граждан Сервисы для научных • Выбор лечебно-профилактического сотрудников учреждения, врача и страховой Научный • Всесторонний и постоянный сбор медицинской организации Пациент сотрудник информации по научным статьям, • Совместимость лекарств с другими их авторам, учреждениям и т.д. лекарствами, состояниями, • Свод статистики по разным заболеваниями и аллергиями параметрам и темам исследований • Аптеки, цены на лекарства • Составление научных отчетов и • … определение тенденций Управленец • … Сервисы мониторинга и Врач статистики процессов Сервисы поддержки в здравоохранении принятия решений • Оперативное выявление тенденций Сервисы для сферы • Уточнение диагноза в динамике показателей бизнеса • Индивидуальный подбор тактики здравоохранения • Анализ рынка лечения • Исследование эффективности • Какие исследования • Совместимость лекарств реализуемых программ проводятся? • Прогнозирование развития • Отслеживание качества работы • Какие результаты заболевания медучреждений по отзывам достигнуты? • Разработка профилактических населения • Каков спрос на результаты? мероприятий и новых способов • Анализ опыта других регионов стран • Анализ работы компаний лечения • … •… • … НИУ ВШЭ, Москва, 2012 23