This presentation gives a brief overview on achievements and challenges of the Data Web and describes different aspects of using the Semantic Data Wiki OntoWiki for Linked Data management.
Linked data for Enterprise Data IntegrationSören Auer
The Web evolves into a Web of Data. In parallel Intranets of large companies will evolve into Data Intranets based on the Linked Data principles. Linked Data has the potential to complement the SOA paradigm with a light-weight, adaptive data integration approach.
This presentation gives a brief overview on achievements and challenges of the Data Web and describes different aspects of using the Semantic Data Wiki OntoWiki for Linked Data management.
Linked data for Enterprise Data IntegrationSören Auer
The Web evolves into a Web of Data. In parallel Intranets of large companies will evolve into Data Intranets based on the Linked Data principles. Linked Data has the potential to complement the SOA paradigm with a light-weight, adaptive data integration approach.
В своём подкасте мы не могли не осветить такое событие, как Positive Hack Days, прошедшее в Москве в конце мая. На нём от лица компании Pentestit с докладом выступал Александр Sinister — гость 8-го выпуска.
Pentestit — компания молодая, даже очень молодая, не имеющая практически аналогов ни в России, ни даже за рубежом. Роман Романов — директор Pentestit — был в гостях подкаста полгода назад в 8-м выпуске вместе с Александром и рассказывал о своих лабораториях. В этот раз Максим Майоровский — руководитель отдела разработки лабораторий на проникновение Pentestit — продолжает рассказ о развитии компании и о том, как они готовили лабу для PHD.
Александр расскажет в подкасте о форуме Positive Hack Days в целом, а также о двух докладах, затрагивающих сети связи.
Один из них, с которым собственно он выступал, посвящен Intercepter-NG — мощному инструменту, позволяющему прослушивать трафик и организовывать атаки MITM в автоматическом режиме. С этим приложением связана одна таинственная история, о которой поведал Александр на PHD и нам в подкасте. Видеозапись презентации можно посмотреть по ссылке.
Второй доклад на довольно животрепещущую тему — атаки на сети мобильных операторов посредством протокола SS7. Такого рода угрозы изучались и проверялись на практике специалистами компании Positive Technologies — Сергеем Пузанковым и Дмитрием Курбатовым.
Злоумышленник, попав в технологическую сеть, может совершить жуткие вещи, начиная от перенаправления SMS и заканчивая прослушиванием звонка из любого конца планеты.
Видеозапись презентации можно посмотреть по ссылке.
В качестве новостей мы предлагаем вам:
Запустили новое зеркало корневого сервера DNS l-root (link)
Cisco приобрела стартап за $175M (link)
Новый стандарт Wi-Fi от Huawei(link)
Comcast открыл внешний доступ к 50 000 клиентских Wi-Fi-маршрутизаторов (link
Обновление старых тем:
Nokia и SK-Telecom объединили полосы, выделенные под FDD и TDD LTE и достигли скорости 3,78 Гбит/с (link)
Google провёл успешные испытания предоставления доступа в Интернет с помощью аэростатов (link)
Knowledge Graph Research and Innovation ChallengesSören Auer
Gives an overview on some challenges regarding the combination of machine-learning and knowledge graph technologies and the vision of devising a concept of Cognitive Knowledge Graphs consisting of graphlets instead of mere entity descriptions.
В своём подкасте мы не могли не осветить такое событие, как Positive Hack Days, прошедшее в Москве в конце мая. На нём от лица компании Pentestit с докладом выступал Александр Sinister — гость 8-го выпуска.
Pentestit — компания молодая, даже очень молодая, не имеющая практически аналогов ни в России, ни даже за рубежом. Роман Романов — директор Pentestit — был в гостях подкаста полгода назад в 8-м выпуске вместе с Александром и рассказывал о своих лабораториях. В этот раз Максим Майоровский — руководитель отдела разработки лабораторий на проникновение Pentestit — продолжает рассказ о развитии компании и о том, как они готовили лабу для PHD.
Александр расскажет в подкасте о форуме Positive Hack Days в целом, а также о двух докладах, затрагивающих сети связи.
Один из них, с которым собственно он выступал, посвящен Intercepter-NG — мощному инструменту, позволяющему прослушивать трафик и организовывать атаки MITM в автоматическом режиме. С этим приложением связана одна таинственная история, о которой поведал Александр на PHD и нам в подкасте. Видеозапись презентации можно посмотреть по ссылке.
Второй доклад на довольно животрепещущую тему — атаки на сети мобильных операторов посредством протокола SS7. Такого рода угрозы изучались и проверялись на практике специалистами компании Positive Technologies — Сергеем Пузанковым и Дмитрием Курбатовым.
Злоумышленник, попав в технологическую сеть, может совершить жуткие вещи, начиная от перенаправления SMS и заканчивая прослушиванием звонка из любого конца планеты.
Видеозапись презентации можно посмотреть по ссылке.
В качестве новостей мы предлагаем вам:
Запустили новое зеркало корневого сервера DNS l-root (link)
Cisco приобрела стартап за $175M (link)
Новый стандарт Wi-Fi от Huawei(link)
Comcast открыл внешний доступ к 50 000 клиентских Wi-Fi-маршрутизаторов (link
Обновление старых тем:
Nokia и SK-Telecom объединили полосы, выделенные под FDD и TDD LTE и достигли скорости 3,78 Гбит/с (link)
Google провёл успешные испытания предоставления доступа в Интернет с помощью аэростатов (link)
Knowledge Graph Research and Innovation ChallengesSören Auer
Gives an overview on some challenges regarding the combination of machine-learning and knowledge graph technologies and the vision of devising a concept of Cognitive Knowledge Graphs consisting of graphlets instead of mere entity descriptions.
Towards Knowledge Graph based Representation, Augmentation and Exploration of...Sören Auer
Despite an improved digital access to scientific publications in the last decades, the fundamental principles of scholarly communication remain unchanged and continue to be largely document-based. The document-oriented workflows in science have reached the limits of adequacy as highlighted by recent discussions on the increasing proliferation of scientific literature, the deficiency of peer-review and the reproducibility crisis. We need to represent, analyse, augment and exploit scholarly communication in a knowledge-based way by expressing and linking scientific contributions and related artefacts through semantically rich, interlinked knowledge graphs. This should be based
on deep semantic representation of scientific contributions, their manual, crowd-sourced and automatic augmentation and finally the intuitive exploration and interaction employing question answering on the resulting scientific knowledge base. We need to synergistically combine automated extraction and augmentation techniques, with large-scale collaboration to reach an unprecedented level of knowledge graph breadth and depth. As a result, knowledge-based information flows can facilitate completely new ways of search and exploration. The efficiency and effectiveness of scholarly communication will significant increase, since ambiguities are reduced, reproducibility is facilitated, redundancy is avoided, provenance and contributions can be better traced and the interconnections of research contributions are made more explicit and transparent. In this talk we will present first steps in this direction in the context of our Open Research Knowledge Graph initiative and the ScienceGRAPH project.
Slides of my talk at OSLCfest in Stockholm Nov 6, 2019
Video recording of the talk is available here:
https://www.facebook.com/oslcfest/videos/2261640397437958/
Towards an Open Research Knowledge GraphSören Auer
The document-oriented workflows in science have reached (or already exceeded) the limits of adequacy as highlighted for example by recent discussions on the increasing proliferation of scientific literature and the reproducibility crisis. Now it is possible to rethink this dominant paradigm of document-centered knowledge exchange and transform it into knowledge-based information flows by representing and expressing knowledge through semantically rich, interlinked knowledge graphs. The core of the establishment of knowledge-based information flows is the creation and evolution of information models for the establishment of a common understanding of data and information between the various stakeholders as well as the integration of these technologies into the infrastructure and processes of search and knowledge exchange in the research library of the future. By integrating these information models into existing and new research infrastructure services, the information structures that are currently still implicit and deeply hidden in documents can be made explicit and directly usable. This has the potential to revolutionize scientific work because information and research results can be seamlessly interlinked with each other and better mapped to complex information needs. Also research results become directly comparable and easier to reuse.
Towards digitizing scholarly communicationSören Auer
Slides of the VIVO 2016 Conference keynote: Despite the availability of ubiquitous connectivity and information technology, scholarly communication has not changed much in the last hundred years: research findings are still encoded in and decoded from linear, static articles and the possibilities of digitization are rarely used. In this talk, we will discuss strategies for digitizing scholarly communication. This comprises in particular: the use of machine-readable, dynamic content; the description and interlinking of research artifacts using Linked Data; the crowd-sourcing of multilingual
educational and learning content. We discuss the relation of these developments to research information systems and how they could become part of an open ecosystem for scholarly communication.
Introduction to the Data Web, DBpedia and the Life-cycle of Linked DataSören Auer
Over the past 4 years, the Semantic Web activity has gained momentum with the widespread publishing of structured data as RDF. The Linked Data paradigm has therefore evolved from a practical research idea into
a very promising candidate for addressing one of the biggest challenges
of computer science: the exploitation of the Web as a platform for data
and information integration. To translate this initial success into a
world-scale reality, a number of research challenges need to be
addressed: the performance gap between relational and RDF data
management has to be closed, coherence and quality of data published on
the Web have to be improved, provenance and trust on the Linked Data Web
must be established and generally the entrance barrier for data
publishers and users has to be lowered. This tutorial will discuss
approaches for tackling these challenges. As an example of a successful
Linked Data project we will present DBpedia, which leverages Wikipedia
by extracting structured information and by making this information
freely accessible on the Web. The tutorial will also outline some recent advances in DBpedia, such as the mappings Wiki, DBpedia Live as well as
the recently launched DBpedia benchmark.
This tutorial explains the Data Web vision, some preliminary standards and technologies as well as some tools and technological building blocks developed by AKSW research group from Universität Leipzig.
Проект Евросоюза LOD2 и Британский Институт Открытых данных
1. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Проект Евросоюза “ LOD2 –
Создание знаний из
связанных данных” и
Британский Институт
Открытых данных .
h ttp ://lod 2.e u
EU-FP7 LO D 2 Proje c t O ve rvie w . 02.09.2 01 0 . Page 1 h ttp ://lod 2.e u
3. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Развитие веб данных – достижения, проблемы и возможности
• W b-глобальная, распространенная платформа для объединения данных,
e
информации и знаний
• S m n icW bпредоставляет возможность доступа, обмена и соединения наборов
eat e
данных, информации и знаний с помощью U I R
R и DF
Достижения Проблемы и возможности
1. Расширение Всемирной • Когерентность: обеспечить
паутины с помощью обработку относительно мало
большого количества связанных данных
July 2007 April 2008 September 2008 данных ( 5 млрд фактов) • Качество: увеличить качество
>0
2. Вовлечение динамичных, данных
глобальных, • Производительность :
производственных и увеличить скорость обработки
научных сообществ связанных данных
• Удобство: обеспечить
3. Большая
удобоство и простоту
заинтересованность
использования связанных
промышленности ( B
B C,
данных для конечного
T o s nR u e s Эли
h mo e tr ,
пользователя
Лилли)
4. Новые правительственные
проекты ( a a o .u )
d t .g v k Решение этих задач
5. Связанные данные как является целью проекта
July 2009 средства для LOD2
развертывания S m n ic
eat
Wbe.
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 3 h ttp ://lod 2.e u
5. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
LOD2 в двух словах
Научные исследования
• управление RDF данными
в крупных масштабах
• Связывание и обогащение
данных
• Улучшение качества
информации
• Адаптивные,
семантические
пользовательские
интерфейсы
Примеры использования
• Медиа и издательство
• Данные сетей внутри
компании
• Открытые данные
Главный результат
• Полный комплекс для
управления жизненным
циклом связанных данных
Партнеры
Uni Leipzig, CWI, DERI
Galway, FU Berlin,
Semantic Web Company,
OpenLink, Tenforce,
Exalead, Wolters Kluwer,
OKFN
5
EU-FP7 LO D 2 Proje c t O ve rvie w . 02.09.2 01 0 . Page 5 h ttp ://lod 2.e u
6. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Важные понятия
LOD2
Проект, финансирующийся ЕС, целью которого является использование
Всемирной Паутины в качестве платформы для интеграции данных и информации
Связанные данные
Связанные данные предоставляют необходимые базовые технологии и стандарты
для реализации цели проекта.
Открытые связанные данные
публично доступные данные, которые должны быть интегрированы во Всемирную
паутину, связаны как между собой, так и с приватными данными, такими как
корпоративные Интранет- системы.
Особенности проекта
Инициатива создания открытых правительственных данных
Общеевропейская платформа publicdata.eu
Объединение ведущих Web 3.0 технологий в единый согласованный LOD2
комплекс (
например, DB e ia V t o o S d e S k
p d , ir u s , in ic , il )
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 6 h ttp ://lod 2.e u
7. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Пример использования: Открытые данные правительства
publicdata.eu – единый ресурс, который позволяет найти и повторно
использовать наборы данных из местных, региональных и национальных
государственных органов по всей Европе.
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 7 h ttp ://lod 2.e u
8. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Открытые данные правительства: Для кого?
Политическ
ие эксперты
Журналист
ы
Лица,
принимающие решения
Разработчи
ки приложений для веб-и мобильных устройств
Научные
деятели
P b ic
ul
bd s
o ie
Компании
Гражданское общество/неправиельственные организации
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 8 h ttp ://lod 2.e u
9. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Открытые данные правительства: Что будет включено?
Возможнос
ть обмена служебной информацией ( метадатой ) между различными
каталогами данных
Объедине
ние наборов данных из различных каталогов
Создание
Европейского сообщества пользователей для улучшения служебной
информации (
метадаты)
Создание
механизмов для выявления родственных/дочерних наборов данных
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 9 Заполнени2.e u
h ttp ://lod
10. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Пример визуализации данных
h t :/ e e g .p b ic a a u
t p / n r y u l d t .e
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 0 h ttp ://lod 2.e u
11. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Визуализация
статистических
данных
E U D igital A genda (Повестка
дня ЕС в цифрах):
http://scoreboard.lod2.eu
Европейский портал
данных:
Будет запущен в следующем
месяце
EU-FP7 LO D 2 Proje c t O ve rvie w . 02.09.2 01 0 . Page 1 1 h ttp ://lod 2.e u
12. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Факты: 14 партнеров, бюджет 1 ,2M€
0
Консорциум - 14 партнеров из 11 европейских стран + 1 партнер из Кореи
U iv r it t e z
n e s ä L ip ig Ce t u W k n e&
n r m is u d Na io a U iv r it o
t n l n es y f
( ,
Координатор) If r a ic , Нидерланды
n o mt a Ie a dinGa w y
r ln l a,
Германия Ирландия
F e U iv r it t e l
r ie n e s ä B r in
Op n in S f w r ,
eL k o t ae S m n icW bCo p n ,
eat e ma y
,
Великобритания Австрия
Германия
Tn o c,
eF re E aed
xla , W l e sK u e
o tr l w r
Бельгия Франция De t c l n , Германия
us ha d
Op nK o l d e
e n we g
V s k Š o aE o o ic á Z m n ad .o
yo a k l k n m k e a t .o .,
F udt n
o n a io ,
vP a e Чешская Республика Словения
r z,
Великобритания
K r aA v n e Is it t
o e d a c dn t ue
Is y u If r a y i
n tt tn o m tk Is it t ih j oP p ,
n t u M a l u in o S ie c a d
f c ne n
Go p d r z jПольша
s o a c e, Сербия Tc n lg,
ehoo y
Южная Корея
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 2 h ttp ://lod 2.e u
13. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Британский Институт Открытых Данных
Disclaimer: The following slides include
material from Nigel Shadbolt, Tim Berners-Lee
and http://theodi.org
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 3 h ttp ://lod 2.e u
14. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
„ Правительство предоставит до 1 0 миллионов фунтов стерлингов в течение
пяти лет, чтобы создать первый в мире Институт Открытый Данных,
помогающий бизнес -кругам использовать возможности ,
предоставляемые публичными данными“
«олучить значительные экономические выгоды, позволяя предприятиям и
п
некоммерческим организациям создавать инновационные приложения и веб-
сайты используя публичные данные.»
David Cameron (Премьер-министр Великобритании), May 201 0
“Наша цель – стать мировым лидером в области открытых данных”
George Osborne (Канцлер казначейства Великобритании), May 201 1
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 4 h ttp ://lod 2.e u
15. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Открытые правительственные данные
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 5 h ttp ://lod 2.e u
16. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Достижения в области открытых правительственных данных
• Запущены национальные, региональные
и городские порталы
• Опубликованы значительные
объемы данных
• Сформулированы принципы
публикации данных
• Открытые лицензии
• Открытые консультации
• Международное сотрудничество
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 6 h ttp ://lod 2.e u
17. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Открытые данные… приложения будут!
Благодаря открытым данным, компании, организации и
заинтересованные частные лица получают возможность
реализовывать инновационные приложения и создавать
графические представления данных.
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 7 h ttp ://lod 2.e u
18. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
« ы рассматриваем Институт Открытых Данных как мировой лидирующий центр
М
изучения инновационных технологий, использования и исследования
возможностей, предоставляемых политикой Открытых Правительственных
Данных. ”
•Бизнес-инновации
•Обучение созданию открытых данных
•Инновации в публичном секторе
•Исследование открытых данных
•Стандарты и политика открытых данных
•Советник правительства
•Международное сотрудничество
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 8 h ttp ://lod 2.e u
19. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Как будет работать Институт Открытых Данных
Институт Открытых Данных
имеет четыре департамента:
исследовательский
департамент, департамент
частного сектора, департамент
международных агентств и
бизнесс-департамент.
Цель департаментов – создать
условия для реализации
конкретных проектов с
соответствующими
заинтересованными сторонами
EU-FP7 LO D 2 Proje c t O ve rvie w . 02 .09.201 0 . Page 1 9 h ttp ://lod 2.e u
20. Cr a in K o l d eo t fIt r in e Da a
et g n we g u o n el kd t
Co t c
nat
Ad d re s s C oord inator
U iv r it o L ip ig
n es y f e z Dr. S ören Auer
F c l y fM t e a ic a dCo p t r
a u t o a h mt s n mu e
S ie c
c ne S ie t icP o e t e d r
c n if r j c L a e
Is it t o Co p t rS ie c
n t u e f mu e c n e
p r m n o u in s n o m t n P o e + 4 ( 4 ) 73 3 7
De a t e t fB s e sIf r a io h n: 9319 -2 6
S se s
ytm
F x 4 ( 4 )9 - 2 2
a :+ 9 3 1 73 3 9
P sfc 1 0 2
o ta h 0 9 0
0 0 9L ip ig
4 0 e z E a : a e @u i- e z .d
m il u r n l ip ig e
Ge m n
r ay h t :/ w w f r a ik n l ip ig e ~ u r
t p / w .in o m t .u i- e z .d / a e
T a k f ry u
hns o o r h ttp ://lod 2.e u
LO D 2 Title . 02.09.201 0 . Page 20 h ttp ://lod 2.e u
Editor's Notes
Представлено развитие «Паутины данных» начиная с 2007 . Круги предсталяют собой огромные наборы данных, стрелки между ними показывают связи . Охвачено большое количество областей, начиная от естественных наук и заканчивая библиографической информацией и развлечениями . В конечном итоге, наша цель – реализовать и поддерживать весь жизненный цикл связанных данных в сети .
на пути к семантическом вебе В дополнение к этим достижениям
Хранение . Управление связанными данными до сих пор остается более сложной задачей, чем управление реляционными данными. Наша цель – создание и внедрение технологий для оптимизации поисковых запросов, а также повышение масштабируемости. Создание . LOD2 облегчает создание богатых баз знаний за счет использования технологий Semantic Wiki , парадигмы «То, что ты видишь, есть то, что ты имеешь в виду», и распределенных социальных сетевых технологий. Связывание . (Полу-)автоматическое создание и управление связями остается одной из главных задач. Эта задача является ключевой для согласования данных и облегчения процесса их объединения. Мы ставим своей целью создание подходов для связывания данных, обладающих высоким уровнем точности и отклика, способных конфигурировать себя автоматически или на основе рекомендаций конечных пользователей. Классификация . Большинство связанных данных в сети являются сырыми . Тем не менее, для объединения, поиска, обогащения данных, мы вынуждены связывать эти данные и объединять с онтологиями более высокого уровня. Анализ качества . Качество связанных данных варьируется аналогично качеству веб-страниц . LOD2 разрабатывает технологии , помогающие оценить качество исходя из анализа структуры, происхождения, полноты и контекста . Исправление . Веб-данные динамичны . Мы должны облегчить исправление данных, сохраняя при этом согласованность . Все исправления в базах знаний, словарях и онтологиях должны быть видимы и прозрачны. LOD2 также разрабатывает технологии, которые выявляют проблемы в базах знаний и предлагают стратегии их устранения. Поиск . Для многих пользователей Веб данных до сих пор остается невидимым . LOD2 разрабатывает технологии поиска, исследования и визуализации различных видов связанных данных , делая «Веб данных» заметным для реальных пользователей.
Партнеры LOD2 предоставляют знания и важные инструменты для реализации проекта
Пример использования: найти и повторно использовать наборы данных из местных, региональных и национальных государственных органов по всей Европе из одного места
Этот пример - графическое представление данных европейского управления статистики. Показаны суммарные объемы выброса углерода по странам ЕС, а также объемы выброса в расчете на душу населения.
Повестка дня Европейской коммисии следит за изменением различных показателей экономического и социального благосостояния.
Теперь я приступаю к отчету по Институту Открытых Данных, который был основан господами Нигелем Шадбольтом и Тимом Бернсом-Ли в Великобритании. На прошлой неделе мы провели Европейский Форум, посвященный работе с данными, в Копенгагене, где Нигель Шадбольт давал речь, посвященную этому институту. Я представлю некоторые из его основных соображений.