SlideShare a Scribd company logo
1 of 8
Download to read offline
Данные «Портала открытых данных
правительства Москвы» в формате RDF,
связанные с адресами OpenStreetMap

Антон Полухин1, Петр Жалыбин 1 , Григорий Дробязко2
Eventos, Москва, Россия
{petr.zhalybin, anton.polukhin} @avicomp.ru
1

2

Национальный исследовательский университет «Высшая школа экономики», Москва,
Россия
gdrobyazko@hse.ru
Наборы данных «Портала открытых данных
правительства Москвы» в формате RDF
•

Наборы данных «Портала открытых данных правительства Москвы», созданный ДИТ
г. Москвы, - большой, хороший, многогранный архив сведений об различных
объектах, находящихся на территории Москвы в формате CSV

•

Разработчики приложений могут найти там много полезных наборов

•

Компания «Эвентос» использовала эти данные и пошла немного дальше, а именно,
•

выбрала для их представления формат RDF

•

добавила географические координаты объектов в стандарте WGS 84 (некоторые
были в проекции Меркатора (EPSG:3857), см. сайт GIS-Lab («ГИС Лаборатория»)

•

связала адреса объектов с адресами базы OpenStreetMap

•

преобразовала атрибуты объектов и адресов и объединила их в едином RDFграфе

•

Загрузила в RDF Хранилище OntoQuad и опубликовала через точку доступа
SPARQL

Количественные характеристики получившегося набора данных:
•

118 944 объектов 186 категорий, из которых

•

67 435 объектов связаны с

•

33 555 уникальными адресами OpenStreetMap

•

Общее количество рёбер RDF-графа составляет 2 249 232 триплетов
2
Ссылки на набор данных, сопутствующие материалы и
лицензия
Набор данных зарегистрирован на хабе открытых наборов данных http://datahub.io/ по
ссылке http://datahub.io/dataset/moscow-and-street-map-open-data с именем «moscow and
street map open data»
Представлены 186 наборов данных, полный список наборов данных, пример данных,
модель данных (онтология в формате OWL) находятся по адресам:
• https://communities.socrata.com/Community-Resources/-Ontoquad-/26up-4qvy
• http://datahub.io/dataset/moscow-and-street-map-open-data
Точка доступа SPARQL
•

http://my-eventos.com/mosdata/sparql

Лицензия определяется лицензией «Портала открытых данных правительства
Москвы», в частности:
•

Условия использования набора данных не предполагают ограничений использования набора
данных в некоммерческих и коммерческих целях.

•

Пользователи, получившие набор данных, вправе копировать, публиковать, распространять и
передавать набор данных третьим лицам, адаптировать, объединять набор данных с другими
наборами данных, а также использовать набор данных в собственных приложениях.

•

Пользователь Информационного портала должен предоставлять информацию об источнике
набора данных в случаях, когда он публично демонстрирует эти данные.

•

Разработчик приложения, использующего набор данных, должен указывать в публично
распространяемом приложении источник получения набора данных
3
Примеры веб-приложений, использующих данные
Использование открытых данных в формате RDF наиболее удобно для
разработчиков приложений и позволяет быстро создавать приложения-мэшапы.
Мы предлагаем ДИТ г. Москвы опубликовать на «Портале открытых данных
правительства Москвы» данные в формате RDF через точку доступа SPARQL-сервера

Интерактивная карта с Кинотеатрами г. Москвы
http://my-eventos.com/mosdata/kino.html
Графический интерфейс для навигации
по данным набора

http://my-eventos.com/mosdata/minidix/
Пример SPARQL запроса, использующего
данные этого набора
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#>
SELECT ?lat ?lonf ?name WHERE {
?s a <http://data.mos.ru/ontology/Kinoteatry>;
geo:lat
?lat;
geo:long
?lon;
rdfs:label ?name.}

4
Мэшап-приложение на RDF. Взгляд изнутри
Javascript SPARQL result set visualizer
от Google позволяет тратить минимум усилий
на разработку

20 минут!

Компонент
от Google
<html><head><meta charset="utf8"><title>Кинотеатры Москвы</title>
<script type="text/javascript"
src="http://ajax.goo
gleapis.com/ajax/libs/jquery/1.6.2/jquery.mi
n.js"></script>
<script type="text/javascript"
src="https://www.google.com/jsapi"></script>
<script type="text/javascript"
id="sgvzlr_script"
src="http://sgvizler
.googlecode.com/svn/release/0.5/sgvizler.js"
></script>
<script type="text/javascript">
$(document).ready(sgvizler.go());
function resizemap() {
$('#sgvzl_example1').width($(window).width()
-16).height($(window).height()-16);}
</script></head>
<body onload="resizemap()"><div
id="sgvzl_example1"
data-sgvizler-endpoint="http://myeventos.com/mosdata/sparql"
data-sgvizler-query="SELECT * WHERE
{…}"
data-sgvizler-chart="sMap"
style="width:1200px;
height:800px;"></div>
</body></html>

Запрос на
SPARQL

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#>
SELECT ?lat ?lon ?name WHERE {
?s a <http://data.mos.ru/ontology/Kinoteatry>;
geo:lat
?lat;
geo:long
?lon;
rdfs:label ?name.} limit 400

полный
javascript
код
5

Результат
Приложение: Фрагмент модели данных
Полная модель данных (онтология в формате OWL) приведена по адресам:
•

http://datahub.io/dataset/moscow-and-street-map-open-data

•

https://communities.socrata.com/Community-Resources/-Ontoquad-/26up4qvy?category=Community-Resources&view_name=-Ontoquad-

Фрагмент модели данных: Типовое отношение
has_address между концептами can_have_address и
address

6
Приложение: Пример экземпляра концепта «Парки
(включая парки неподведомственные)»
<http://data.mos.ru/ontology/494/10> mos:addr_jur "111141,г.Москва,ул. Лазо, вл.7" ;
mos:address "111141, г.Москва, ул. Лазо, вл.7" ;
mos:bui_no_bti "0" ;
mos:email "ppkio@mail.ru" ;
mos:fax "(495) 368-26-21" ;
mos:name "Государственное автономное учреждение культуры города Москвы
«Перовский парк культуры и отдыха»" ;
mos:no "10" ;
mos:okrug "Восточный АО" ;
mos:phone "(495) 368-26-10" ;
mos:rayon "Перово" ;
mos:x "37,774939" ;
mos:y "55,74049" ;
a
<http://data.mos.ru/ontology/Parki+(vkljuchaja+parki+ne+podvedomstvennyje)> ;
rdfs:label "ГАУК г.Москвы «Перовский парк культуры и отдыха»"^^xsd:string ;
geo:lat "55.74049" ;
geo:long "37.774939" ;
osm:has_address <http://www.openstreetmap.org/?way=27427313> .

Связан с экземпляром концепта «Адрес» с уникальным идентификатором
<http://www.openstreetmap.org/?way=27427313>

7
Приложение: Пример экземпляра концепта «Адрес»
<http://www.openstreetmap.org/?way=27427313> a osm:address ;
rdfs:label "Перовский парк, Кусковская улица, Перово, Москва, Восточный
административный округ, Москва, Центральный федеральный округ, 111398, Российская
Федерация" ;
geo:lat "55.7410973" ;
geo:long "37.7748965803335" ;
k_addr:city "Москва"^^xsd:string ;
k_addr:country "Российская Федерация"^^xsd:string ;
k_addr:district "Восточный административный округ"^^xsd:string ;
k_addr:postcode "111398"^^xsd:string ;
k_addr:province "Москва"^^xsd:string ;
k_addr:street "Кусковская улица"^^xsd:string ;
k_addr:subdistrict "Перово"^^xsd:string .

8

More Related Content

Similar to Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формате RDF, связанные с адресами OpenStreetMap

Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Irene Pochinok
 
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...Vitaly Yushkevich
 
Vlasov Vitaly - Civic hack night in Bishkek
Vlasov Vitaly - Civic hack night in BishkekVlasov Vitaly - Civic hack night in Bishkek
Vlasov Vitaly - Civic hack night in BishkekOpen City Foundation
 
библиотека проектов
библиотека проектов библиотека проектов
библиотека проектов LiliyaKupreychik
 
Open data: quality and values
Open data: quality and valuesOpen data: quality and values
Open data: quality and valuesIrina Radchenko
 
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИITMO University
 
Открытые данные, открытое обучение и открытая наука (Open data, open educatio...
Открытые данные, открытое обучение и открытая наука (Open data, open educatio...Открытые данные, открытое обучение и открытая наука (Open data, open educatio...
Открытые данные, открытое обучение и открытая наука (Open data, open educatio...Irina Radchenko
 
Введение в концепцию связанных открытых данных (Linked Open Data)
Введение в концепцию связанных открытых данных (Linked Open Data)Введение в концепцию связанных открытых данных (Linked Open Data)
Введение в концепцию связанных открытых данных (Linked Open Data)AIMS (Agricultural Information Management Standards)
 
Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Timur Ovadia Berezin
 
кузнецов кирилл. основные результаты работы и перспективный функционал порт...
кузнецов кирилл. основные результаты работы  и перспективный  функционал порт...кузнецов кирилл. основные результаты работы  и перспективный  функционал порт...
кузнецов кирилл. основные результаты работы и перспективный функционал порт...elenae00
 
Открытые данные: базовые знания для НКО
Открытые данные: базовые знания для НКО Открытые данные: базовые знания для НКО
Открытые данные: базовые знания для НКО Tania Evlampieva
 
Открытые данные в образовании
Открытые данные в образованииОткрытые данные в образовании
Открытые данные в образованииMikhail Navrotskii
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS) Fred Kozlov
 
Связанные открытые данные (Linked Open Data)
Связанные открытые данные (Linked Open Data)Связанные открытые данные (Linked Open Data)
Связанные открытые данные (Linked Open Data)Irina Radchenko
 
презентация оо субд сколково
презентация оо субд сколковопрезентация оо субд сколково
презентация оо субд сколковоvagrachev
 
Отчет по проектах ЦПИКС
Отчет по проектах ЦПИКСОтчет по проектах ЦПИКС
Отчет по проектах ЦПИКСARCCN
 
A tale of query languages. Is GraphQL the chosen one? - Victor Shepelev
A tale of query languages. Is GraphQL the chosen one? - Victor ShepelevA tale of query languages. Is GraphQL the chosen one? - Victor Shepelev
A tale of query languages. Is GraphQL the chosen one? - Victor ShepelevRuby Meditation
 

Similar to Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формате RDF, связанные с адресами OpenStreetMap (20)

Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...
 
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
 
Vlasov Vitaly - Civic hack night in Bishkek
Vlasov Vitaly - Civic hack night in BishkekVlasov Vitaly - Civic hack night in Bishkek
Vlasov Vitaly - Civic hack night in Bishkek
 
библиотека проектов
библиотека проектов библиотека проектов
библиотека проектов
 
Open data: quality and values
Open data: quality and valuesOpen data: quality and values
Open data: quality and values
 
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
 
Открытые данные, открытое обучение и открытая наука (Open data, open educatio...
Открытые данные, открытое обучение и открытая наука (Open data, open educatio...Открытые данные, открытое обучение и открытая наука (Open data, open educatio...
Открытые данные, открытое обучение и открытая наука (Open data, open educatio...
 
Введение в концепцию связанных открытых данных (Linked Open Data)
Введение в концепцию связанных открытых данных (Linked Open Data)Введение в концепцию связанных открытых данных (Linked Open Data)
Введение в концепцию связанных открытых данных (Linked Open Data)
 
Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017
 
Open Data
Open DataOpen Data
Open Data
 
кузнецов кирилл. основные результаты работы и перспективный функционал порт...
кузнецов кирилл. основные результаты работы  и перспективный  функционал порт...кузнецов кирилл. основные результаты работы  и перспективный  функционал порт...
кузнецов кирилл. основные результаты работы и перспективный функционал порт...
 
Открытые данные: базовые знания для НКО
Открытые данные: базовые знания для НКО Открытые данные: базовые знания для НКО
Открытые данные: базовые знания для НКО
 
Открытые данные в образовании
Открытые данные в образованииОткрытые данные в образовании
Открытые данные в образовании
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS)
 
Open data
Open dataOpen data
Open data
 
Связанные открытые данные (Linked Open Data)
Связанные открытые данные (Linked Open Data)Связанные открытые данные (Linked Open Data)
Связанные открытые данные (Linked Open Data)
 
презентация оо субд сколково
презентация оо субд сколковопрезентация оо субд сколково
презентация оо субд сколково
 
Hpc Day
Hpc DayHpc Day
Hpc Day
 
Отчет по проектах ЦПИКС
Отчет по проектах ЦПИКСОтчет по проектах ЦПИКС
Отчет по проектах ЦПИКС
 
A tale of query languages. Is GraphQL the chosen one? - Victor Shepelev
A tale of query languages. Is GraphQL the chosen one? - Victor ShepelevA tale of query languages. Is GraphQL the chosen one? - Victor Shepelev
A tale of query languages. Is GraphQL the chosen one? - Victor Shepelev
 

More from Open City Foundation

Открытые данные: лучшие практики (Бишкек, 2015)
Открытые данные: лучшие практики (Бишкек, 2015)Открытые данные: лучшие практики (Бишкек, 2015)
Открытые данные: лучшие практики (Бишкек, 2015)Open City Foundation
 
Open Data Institute - Presentation for workshop
Open Data Institute - Presentation for workshopOpen Data Institute - Presentation for workshop
Open Data Institute - Presentation for workshopOpen City Foundation
 
James Wong - Open data in transport, St.Petersburg
James Wong - Open data in transport, St.PetersburgJames Wong - Open data in transport, St.Petersburg
James Wong - Open data in transport, St.PetersburgOpen City Foundation
 
Jeanne Holm - Using open transport data for innovations
Jeanne Holm - Using open transport data for innovationsJeanne Holm - Using open transport data for innovations
Jeanne Holm - Using open transport data for innovationsOpen City Foundation
 
Михаил Бунчук (Всемирный банк) - Презентация отчета об исследовании открытых ...
Михаил Бунчук (Всемирный банк) - Презентация отчета об исследовании открытых ...Михаил Бунчук (Всемирный банк) - Презентация отчета об исследовании открытых ...
Михаил Бунчук (Всемирный банк) - Презентация отчета об исследовании открытых ...Open City Foundation
 
Яндекс и открытые данные
Яндекс и открытые данныеЯндекс и открытые данные
Яндекс и открытые данныеOpen City Foundation
 
Стив Каддинс - Перспективы создания единой транспортной системы в России
Стив Каддинс - Перспективы создания единой транспортной системы в РоссииСтив Каддинс - Перспективы создания единой транспортной системы в России
Стив Каддинс - Перспективы создания единой транспортной системы в РоссииOpen City Foundation
 
Татьяна Бабурина (Комитет по информатизции и связи ) - Открытые данные Петерб...
Татьяна Бабурина (Комитет по информатизции и связи ) - Открытые данные Петерб...Татьяна Бабурина (Комитет по информатизции и связи ) - Открытые данные Петерб...
Татьяна Бабурина (Комитет по информатизции и связи ) - Открытые данные Петерб...Open City Foundation
 
Александр Еремеев (ФРИИ) Customer development: 5 шагов к пользователю
Александр Еремеев (ФРИИ) Customer development: 5 шагов к пользователюАлександр Еремеев (ФРИИ) Customer development: 5 шагов к пользователю
Александр Еремеев (ФРИИ) Customer development: 5 шагов к пользователюOpen City Foundation
 
Hackathon 2014: One day in Saint-Petersburg
Hackathon 2014: One day in Saint-PetersburgHackathon 2014: One day in Saint-Petersburg
Hackathon 2014: One day in Saint-PetersburgOpen City Foundation
 
Hackathon 2014: Собрание дома
Hackathon 2014: Собрание домаHackathon 2014: Собрание дома
Hackathon 2014: Собрание домаOpen City Foundation
 
Hackathon 2014: Друзья времени
Hackathon 2014: Друзья времениHackathon 2014: Друзья времени
Hackathon 2014: Друзья времениOpen City Foundation
 
права учителя на льготы Open data hackathon
права учителя на льготы Open data hackathonправа учителя на льготы Open data hackathon
права учителя на льготы Open data hackathonOpen City Foundation
 
куда отдать Open data hackathon
куда отдать Open data hackathonкуда отдать Open data hackathon
куда отдать Open data hackathonOpen City Foundation
 
живи и работай Open data hackathon
живи и работай Open data hackathonживи и работай Open data hackathon
живи и работай Open data hackathonOpen City Foundation
 
волшебная карта новостроек Open data hackathon
волшебная карта новостроек Open data hackathonволшебная карта новостроек Open data hackathon
волшебная карта новостроек Open data hackathonOpen City Foundation
 
будильник для метро Open data hackathon
будильник для метро Open data hackathonбудильник для метро Open data hackathon
будильник для метро Open data hackathonOpen City Foundation
 

More from Open City Foundation (20)

Открытые данные: лучшие практики (Бишкек, 2015)
Открытые данные: лучшие практики (Бишкек, 2015)Открытые данные: лучшие практики (Бишкек, 2015)
Открытые данные: лучшие практики (Бишкек, 2015)
 
Open Data Institute - Presentation for workshop
Open Data Institute - Presentation for workshopOpen Data Institute - Presentation for workshop
Open Data Institute - Presentation for workshop
 
James Wong - Open data in transport, St.Petersburg
James Wong - Open data in transport, St.PetersburgJames Wong - Open data in transport, St.Petersburg
James Wong - Open data in transport, St.Petersburg
 
Jeanne Holm - Using open transport data for innovations
Jeanne Holm - Using open transport data for innovationsJeanne Holm - Using open transport data for innovations
Jeanne Holm - Using open transport data for innovations
 
Михаил Бунчук (Всемирный банк) - Презентация отчета об исследовании открытых ...
Михаил Бунчук (Всемирный банк) - Презентация отчета об исследовании открытых ...Михаил Бунчук (Всемирный банк) - Презентация отчета об исследовании открытых ...
Михаил Бунчук (Всемирный банк) - Презентация отчета об исследовании открытых ...
 
Яндекс и открытые данные
Яндекс и открытые данныеЯндекс и открытые данные
Яндекс и открытые данные
 
Стив Каддинс - Перспективы создания единой транспортной системы в России
Стив Каддинс - Перспективы создания единой транспортной системы в РоссииСтив Каддинс - Перспективы создания единой транспортной системы в России
Стив Каддинс - Перспективы создания единой транспортной системы в России
 
Татьяна Бабурина (Комитет по информатизции и связи ) - Открытые данные Петерб...
Татьяна Бабурина (Комитет по информатизции и связи ) - Открытые данные Петерб...Татьяна Бабурина (Комитет по информатизции и связи ) - Открытые данные Петерб...
Татьяна Бабурина (Комитет по информатизции и связи ) - Открытые данные Петерб...
 
Александр Еремеев (ФРИИ) Customer development: 5 шагов к пользователю
Александр Еремеев (ФРИИ) Customer development: 5 шагов к пользователюАлександр Еремеев (ФРИИ) Customer development: 5 шагов к пользователю
Александр Еремеев (ФРИИ) Customer development: 5 шагов к пользователю
 
Smooth
SmoothSmooth
Smooth
 
Hackathon 2014: One day in Saint-Petersburg
Hackathon 2014: One day in Saint-PetersburgHackathon 2014: One day in Saint-Petersburg
Hackathon 2014: One day in Saint-Petersburg
 
Hackathon 2014: Folk art
Hackathon 2014: Folk artHackathon 2014: Folk art
Hackathon 2014: Folk art
 
Hackathon 2014: Dropstuff
Hackathon 2014: DropstuffHackathon 2014: Dropstuff
Hackathon 2014: Dropstuff
 
Hackathon 2014: Собрание дома
Hackathon 2014: Собрание домаHackathon 2014: Собрание дома
Hackathon 2014: Собрание дома
 
Hackathon 2014: Друзья времени
Hackathon 2014: Друзья времениHackathon 2014: Друзья времени
Hackathon 2014: Друзья времени
 
права учителя на льготы Open data hackathon
права учителя на льготы Open data hackathonправа учителя на льготы Open data hackathon
права учителя на льготы Open data hackathon
 
куда отдать Open data hackathon
куда отдать Open data hackathonкуда отдать Open data hackathon
куда отдать Open data hackathon
 
живи и работай Open data hackathon
живи и работай Open data hackathonживи и работай Open data hackathon
живи и работай Open data hackathon
 
волшебная карта новостроек Open data hackathon
волшебная карта новостроек Open data hackathonволшебная карта новостроек Open data hackathon
волшебная карта новостроек Open data hackathon
 
будильник для метро Open data hackathon
будильник для метро Open data hackathonбудильник для метро Open data hackathon
будильник для метро Open data hackathon
 

Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формате RDF, связанные с адресами OpenStreetMap

  • 1. Данные «Портала открытых данных правительства Москвы» в формате RDF, связанные с адресами OpenStreetMap Антон Полухин1, Петр Жалыбин 1 , Григорий Дробязко2 Eventos, Москва, Россия {petr.zhalybin, anton.polukhin} @avicomp.ru 1 2 Национальный исследовательский университет «Высшая школа экономики», Москва, Россия gdrobyazko@hse.ru
  • 2. Наборы данных «Портала открытых данных правительства Москвы» в формате RDF • Наборы данных «Портала открытых данных правительства Москвы», созданный ДИТ г. Москвы, - большой, хороший, многогранный архив сведений об различных объектах, находящихся на территории Москвы в формате CSV • Разработчики приложений могут найти там много полезных наборов • Компания «Эвентос» использовала эти данные и пошла немного дальше, а именно, • выбрала для их представления формат RDF • добавила географические координаты объектов в стандарте WGS 84 (некоторые были в проекции Меркатора (EPSG:3857), см. сайт GIS-Lab («ГИС Лаборатория») • связала адреса объектов с адресами базы OpenStreetMap • преобразовала атрибуты объектов и адресов и объединила их в едином RDFграфе • Загрузила в RDF Хранилище OntoQuad и опубликовала через точку доступа SPARQL Количественные характеристики получившегося набора данных: • 118 944 объектов 186 категорий, из которых • 67 435 объектов связаны с • 33 555 уникальными адресами OpenStreetMap • Общее количество рёбер RDF-графа составляет 2 249 232 триплетов 2
  • 3. Ссылки на набор данных, сопутствующие материалы и лицензия Набор данных зарегистрирован на хабе открытых наборов данных http://datahub.io/ по ссылке http://datahub.io/dataset/moscow-and-street-map-open-data с именем «moscow and street map open data» Представлены 186 наборов данных, полный список наборов данных, пример данных, модель данных (онтология в формате OWL) находятся по адресам: • https://communities.socrata.com/Community-Resources/-Ontoquad-/26up-4qvy • http://datahub.io/dataset/moscow-and-street-map-open-data Точка доступа SPARQL • http://my-eventos.com/mosdata/sparql Лицензия определяется лицензией «Портала открытых данных правительства Москвы», в частности: • Условия использования набора данных не предполагают ограничений использования набора данных в некоммерческих и коммерческих целях. • Пользователи, получившие набор данных, вправе копировать, публиковать, распространять и передавать набор данных третьим лицам, адаптировать, объединять набор данных с другими наборами данных, а также использовать набор данных в собственных приложениях. • Пользователь Информационного портала должен предоставлять информацию об источнике набора данных в случаях, когда он публично демонстрирует эти данные. • Разработчик приложения, использующего набор данных, должен указывать в публично распространяемом приложении источник получения набора данных 3
  • 4. Примеры веб-приложений, использующих данные Использование открытых данных в формате RDF наиболее удобно для разработчиков приложений и позволяет быстро создавать приложения-мэшапы. Мы предлагаем ДИТ г. Москвы опубликовать на «Портале открытых данных правительства Москвы» данные в формате RDF через точку доступа SPARQL-сервера Интерактивная карта с Кинотеатрами г. Москвы http://my-eventos.com/mosdata/kino.html Графический интерфейс для навигации по данным набора http://my-eventos.com/mosdata/minidix/ Пример SPARQL запроса, использующего данные этого набора PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#> SELECT ?lat ?lonf ?name WHERE { ?s a <http://data.mos.ru/ontology/Kinoteatry>; geo:lat ?lat; geo:long ?lon; rdfs:label ?name.} 4
  • 5. Мэшап-приложение на RDF. Взгляд изнутри Javascript SPARQL result set visualizer от Google позволяет тратить минимум усилий на разработку 20 минут! Компонент от Google <html><head><meta charset="utf8"><title>Кинотеатры Москвы</title> <script type="text/javascript" src="http://ajax.goo gleapis.com/ajax/libs/jquery/1.6.2/jquery.mi n.js"></script> <script type="text/javascript" src="https://www.google.com/jsapi"></script> <script type="text/javascript" id="sgvzlr_script" src="http://sgvizler .googlecode.com/svn/release/0.5/sgvizler.js" ></script> <script type="text/javascript"> $(document).ready(sgvizler.go()); function resizemap() { $('#sgvzl_example1').width($(window).width() -16).height($(window).height()-16);} </script></head> <body onload="resizemap()"><div id="sgvzl_example1" data-sgvizler-endpoint="http://myeventos.com/mosdata/sparql" data-sgvizler-query="SELECT * WHERE {…}" data-sgvizler-chart="sMap" style="width:1200px; height:800px;"></div> </body></html> Запрос на SPARQL PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#> SELECT ?lat ?lon ?name WHERE { ?s a <http://data.mos.ru/ontology/Kinoteatry>; geo:lat ?lat; geo:long ?lon; rdfs:label ?name.} limit 400 полный javascript код 5 Результат
  • 6. Приложение: Фрагмент модели данных Полная модель данных (онтология в формате OWL) приведена по адресам: • http://datahub.io/dataset/moscow-and-street-map-open-data • https://communities.socrata.com/Community-Resources/-Ontoquad-/26up4qvy?category=Community-Resources&view_name=-Ontoquad- Фрагмент модели данных: Типовое отношение has_address между концептами can_have_address и address 6
  • 7. Приложение: Пример экземпляра концепта «Парки (включая парки неподведомственные)» <http://data.mos.ru/ontology/494/10> mos:addr_jur "111141,г.Москва,ул. Лазо, вл.7" ; mos:address "111141, г.Москва, ул. Лазо, вл.7" ; mos:bui_no_bti "0" ; mos:email "ppkio@mail.ru" ; mos:fax "(495) 368-26-21" ; mos:name "Государственное автономное учреждение культуры города Москвы «Перовский парк культуры и отдыха»" ; mos:no "10" ; mos:okrug "Восточный АО" ; mos:phone "(495) 368-26-10" ; mos:rayon "Перово" ; mos:x "37,774939" ; mos:y "55,74049" ; a <http://data.mos.ru/ontology/Parki+(vkljuchaja+parki+ne+podvedomstvennyje)> ; rdfs:label "ГАУК г.Москвы «Перовский парк культуры и отдыха»"^^xsd:string ; geo:lat "55.74049" ; geo:long "37.774939" ; osm:has_address <http://www.openstreetmap.org/?way=27427313> . Связан с экземпляром концепта «Адрес» с уникальным идентификатором <http://www.openstreetmap.org/?way=27427313> 7
  • 8. Приложение: Пример экземпляра концепта «Адрес» <http://www.openstreetmap.org/?way=27427313> a osm:address ; rdfs:label "Перовский парк, Кусковская улица, Перово, Москва, Восточный административный округ, Москва, Центральный федеральный округ, 111398, Российская Федерация" ; geo:lat "55.7410973" ; geo:long "37.7748965803335" ; k_addr:city "Москва"^^xsd:string ; k_addr:country "Российская Федерация"^^xsd:string ; k_addr:district "Восточный административный округ"^^xsd:string ; k_addr:postcode "111398"^^xsd:string ; k_addr:province "Москва"^^xsd:string ; k_addr:street "Кусковская улица"^^xsd:string ; k_addr:subdistrict "Перово"^^xsd:string . 8