Yablomsky

603 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
603
On SlideShare
0
From Embeds
0
Number of Embeds
19
Actions
Shares
0
Downloads
10
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Yablomsky

  1. 1. СЕМАНТИЧЕСКИЙ ВЕБ И WEB KNOWLEDGE MINING С.А. Яблонский, Т.А. Гаврилова Высшая школа менеджмента Санкт- Петербургского государственного университета Санкт-Петербург
  2. 2. Этапы развития WWW
  3. 3. • Web 1.0 – объединение в сети информации (этап пройден, информация постоянно пополняется); • Web 2.0 – объединение в сети людей – Social Web (пройден, социальные сети стали реальностью и стремительно растут); • Web 3.0 – объединение в сети знаний (начинается сейчас); • Web 4.0 – такое объединение в сети людей и компьютеров, когда и те и другие смогут общаться и получать знания наравне с друг другом (перспектива).
  4. 4. Tim Berners-Lee
  5. 5. Языки представления онтологий  RDF+ RDFS  OWL  Язык запросов к RDF/OWL SPARQL
  6. 6. RDFS • RDFS – язык описания словарей для RDF • RDF Schema определяет классы, свойства и другие ресурсы. • RDFS является семантическим расширением RDF.
  7. 7. Перечень классов RDFS Имя класса Пояснение rdfs:Resource Класс ресурс, включает «всё». rdfs:Literal Класс литеральных значений, текстовых строк или чисел. rdf:XMLLiteral Класс XML литералов rdfs:Class Класс классов. rdf:Property Класс RDF свойств. rdfs:Datatype Класс типов данных RDF. rdf:Statement Класс утверждений. rdf:Bag Класс неупорядоченных контейнеров. rdf:Seq Класс упорядоченных контейнеров. rdf:Alt Класс контейнеров-альтернатив. rdfs:Container Класс RDF контейнеров. rdfs:ContainerMembershipProperty Класс свойств «членства» в контейнерах, rdf:_1, rdf:_2, ..., все они являются подсвойствами свойства member( член). rdf:List Класс RDF списков.
  8. 8. Перечень свойств RDFS Имя свойства Пояснение Домен Диапазон rdf:type Субъект является экземпляром класса. rdfs:Resource rdfs:Class rdfs:subClassOf Субъект является подклассом класса. rdfs:Class rdfs:Class rdfs:subProperty Субъект является подсвойством свойства. rdf:Property rdf:Property Of rdfs:domain Домен свойства сеюъекта. rdf:Property rdfs:Class rdfs:range Диапазон свойства субъекта. rdf:Property rdfs:Class rdfs:label Человекочитаемое название субъекта. rdfs:Resource rdfs:Literal rdfs:comment Текстовое описание ресурса rdfs:Resource rdfs:Literal rdfs:member Член ресурса субъекта. rdfs:Resource rdfs:Resource rdf:first Первый элемент списка. rdf:List rdfs:Resource rdf:rest Оставшийся за первым элементом «хвост» rdf:List rdf:List списка. rdfs:seeAlso Дополнительная информация о субъекте. rdfs:Resource rdfs:Resource rdfs:isDefinedBy Определение ресурса субъекта. rdfs:Resource rdfs:Resource rdf:value Свойство, используемое для rdfs:Resource rdfs:Resource структурированных значений rdf:subject Субъект RDF утверждения (см. реификация). rdf:Statement rdfs:Resource rdf:predicate Предикат утверждения (см. реификация). rdf:Statement rdfs:Resource rdf:object Объект RDF утверждения (см. реификация). rdf:Statement rdfs:Resource
  9. 9. RDF • RDF – язык описания метаданных в Сети • Модель данных RDF – ориентированный граф • RDF граф строится на основе элементарных высказываний (триплетов) • Форма высказываний – бинарное отношение (S,P,O) • RDF чрезвычайно выразителен (кто угодно может сказать что угодно о чем угодно) • RDFS служит для определения словарей RDF.
  10. 10. Ограничение языка RDF + RDFS Целостность и непротиворечивость. RDF не запрещает делать бессмысленных утверждений или утверждений не согласующихся с другими. Вся ответственность за проверку целостности ложится на получателей (конечных пользователей) метаданных, т.е. на разработчиков приложений обрабатывающих RDF.
  11. 11. Дополнительно • упрощенные встроенные в HTML- страницы микроформаты (Microformats), • RDFa, • Embedded RDF (eRDF), • и др., широко используемые в Facebook, Yahoo! Local, блогах.
  12. 12. OWL • OWL (Web Ontology Language) – язык представления онтологий в Web. Фактически это словарь расширяющий набор терминов определенных RDFS. • OWL-онтологии могут содержать описания классов, свойств и их экземпляров.
  13. 13. Три диалекта OWL • OWL Lite (простота) • OWL DL (полнота и разрешимость) • OWL Full (выразительная мощь)
  14. 14. Языки запросов к RDF хранилищам Представление знаний в машинопонятном формате не имело бы никакого смысла, если бы к этим знаниям нельзя было обращаться, автоматически их обрабатывать и пополнять. Две близкие задачи: • Извлечение имеющихся в хранилище знаний запросами к RDF хранилищу - asking, querying. • Применение логического вывода над имеющимися знаниями (RDF-графами и онтологиями) - reasoning, entailment.
  15. 15. SPARQL Синтаксис запроса (упрощенный) SELECT <v_list> FROM <onologyURI> WHERE { <template_list>. FILTER <filter_expr> } - v_list – список имен переменных - onologyURI – ссылка на онтологию - template_list – список шаблонов - filter_expr – ограничения на значения переменных
  16. 16. OWL-S (http://www.w3.org/Submission/OWL-S/) Семантический язык разметки веб- сервисов (Web Services). Позволяет создавать семантические описания веб-сервисов, понятные для семантических веб-агентов (web agents).
  17. 17. RDF/OWL- ресурсы в сети (1) • FOAF (Friend of a Friend) (http://www.foaf- project.org/) • SIOC (Semantically-Interlinked Online Communities discussion forums,weblogs,blogrolls/feed subscriptions, mailing lists, shared bookmarks, image galleries - http://sioc-project.org/)
  18. 18. RDF/OWL- ресурсы в сети (2) • Open GUID (http://openguid.net/) • SIMILE (Semantic Interoperability of Metadata and Information in unLike Environments - http://simile.mit.edu/) • NextBio (http://www.nextbio.com/b/nextbio.nb)
  19. 19. RDF/OWL- ресурсы в сети (3) • Linking Open Data (http://esw.w3.org/topic/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData) • Wikipedia (http://www.wikipedia.org/) • Dbpedia (http://dbpedia.org/) • YAGO (http://www.mpi-inf.mpg.de/yago- naga/yago/)
  20. 20. Linked Open Data (LOD)
  21. 21. Например, проект DBpedia нацелен на извлечение структурированной информации из многоязычной веб- энциклопедии Wikipedia с помощью SPARQL-запросов. На основе обработки сниппетов (snippet) из Wikipedia построена база знаний, где хранят RDF-тройки: subject-predicate-object. Число RDF-троек сегодня превышает 274 миллиона на 30 языках, включая 415,000 категорий Wikipedia и 75,000 категорий YAGO. Онтология YAGO основана на Wikipedia и WordNet.
  22. 22. Спасибо! Сергей Яблонский serge_yablonsky@hotmail.com

×