Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Yablomsky

675 views

Published on

  • Be the first to comment

  • Be the first to like this

Yablomsky

  1. 1. СЕМАНТИЧЕСКИЙ ВЕБ И WEB KNOWLEDGE MINING С.А. Яблонский, Т.А. Гаврилова Высшая школа менеджмента Санкт- Петербургского государственного университета Санкт-Петербург
  2. 2. Этапы развития WWW
  3. 3. • Web 1.0 – объединение в сети информации (этап пройден, информация постоянно пополняется); • Web 2.0 – объединение в сети людей – Social Web (пройден, социальные сети стали реальностью и стремительно растут); • Web 3.0 – объединение в сети знаний (начинается сейчас); • Web 4.0 – такое объединение в сети людей и компьютеров, когда и те и другие смогут общаться и получать знания наравне с друг другом (перспектива).
  4. 4. Tim Berners-Lee
  5. 5. Языки представления онтологий  RDF+ RDFS  OWL  Язык запросов к RDF/OWL SPARQL
  6. 6. RDFS • RDFS – язык описания словарей для RDF • RDF Schema определяет классы, свойства и другие ресурсы. • RDFS является семантическим расширением RDF.
  7. 7. Перечень классов RDFS Имя класса Пояснение rdfs:Resource Класс ресурс, включает «всё». rdfs:Literal Класс литеральных значений, текстовых строк или чисел. rdf:XMLLiteral Класс XML литералов rdfs:Class Класс классов. rdf:Property Класс RDF свойств. rdfs:Datatype Класс типов данных RDF. rdf:Statement Класс утверждений. rdf:Bag Класс неупорядоченных контейнеров. rdf:Seq Класс упорядоченных контейнеров. rdf:Alt Класс контейнеров-альтернатив. rdfs:Container Класс RDF контейнеров. rdfs:ContainerMembershipProperty Класс свойств «членства» в контейнерах, rdf:_1, rdf:_2, ..., все они являются подсвойствами свойства member( член). rdf:List Класс RDF списков.
  8. 8. Перечень свойств RDFS Имя свойства Пояснение Домен Диапазон rdf:type Субъект является экземпляром класса. rdfs:Resource rdfs:Class rdfs:subClassOf Субъект является подклассом класса. rdfs:Class rdfs:Class rdfs:subProperty Субъект является подсвойством свойства. rdf:Property rdf:Property Of rdfs:domain Домен свойства сеюъекта. rdf:Property rdfs:Class rdfs:range Диапазон свойства субъекта. rdf:Property rdfs:Class rdfs:label Человекочитаемое название субъекта. rdfs:Resource rdfs:Literal rdfs:comment Текстовое описание ресурса rdfs:Resource rdfs:Literal rdfs:member Член ресурса субъекта. rdfs:Resource rdfs:Resource rdf:first Первый элемент списка. rdf:List rdfs:Resource rdf:rest Оставшийся за первым элементом «хвост» rdf:List rdf:List списка. rdfs:seeAlso Дополнительная информация о субъекте. rdfs:Resource rdfs:Resource rdfs:isDefinedBy Определение ресурса субъекта. rdfs:Resource rdfs:Resource rdf:value Свойство, используемое для rdfs:Resource rdfs:Resource структурированных значений rdf:subject Субъект RDF утверждения (см. реификация). rdf:Statement rdfs:Resource rdf:predicate Предикат утверждения (см. реификация). rdf:Statement rdfs:Resource rdf:object Объект RDF утверждения (см. реификация). rdf:Statement rdfs:Resource
  9. 9. RDF • RDF – язык описания метаданных в Сети • Модель данных RDF – ориентированный граф • RDF граф строится на основе элементарных высказываний (триплетов) • Форма высказываний – бинарное отношение (S,P,O) • RDF чрезвычайно выразителен (кто угодно может сказать что угодно о чем угодно) • RDFS служит для определения словарей RDF.
  10. 10. Ограничение языка RDF + RDFS Целостность и непротиворечивость. RDF не запрещает делать бессмысленных утверждений или утверждений не согласующихся с другими. Вся ответственность за проверку целостности ложится на получателей (конечных пользователей) метаданных, т.е. на разработчиков приложений обрабатывающих RDF.
  11. 11. Дополнительно • упрощенные встроенные в HTML- страницы микроформаты (Microformats), • RDFa, • Embedded RDF (eRDF), • и др., широко используемые в Facebook, Yahoo! Local, блогах.
  12. 12. OWL • OWL (Web Ontology Language) – язык представления онтологий в Web. Фактически это словарь расширяющий набор терминов определенных RDFS. • OWL-онтологии могут содержать описания классов, свойств и их экземпляров.
  13. 13. Три диалекта OWL • OWL Lite (простота) • OWL DL (полнота и разрешимость) • OWL Full (выразительная мощь)
  14. 14. Языки запросов к RDF хранилищам Представление знаний в машинопонятном формате не имело бы никакого смысла, если бы к этим знаниям нельзя было обращаться, автоматически их обрабатывать и пополнять. Две близкие задачи: • Извлечение имеющихся в хранилище знаний запросами к RDF хранилищу - asking, querying. • Применение логического вывода над имеющимися знаниями (RDF-графами и онтологиями) - reasoning, entailment.
  15. 15. SPARQL Синтаксис запроса (упрощенный) SELECT <v_list> FROM <onologyURI> WHERE { <template_list>. FILTER <filter_expr> } - v_list – список имен переменных - onologyURI – ссылка на онтологию - template_list – список шаблонов - filter_expr – ограничения на значения переменных
  16. 16. OWL-S (http://www.w3.org/Submission/OWL-S/) Семантический язык разметки веб- сервисов (Web Services). Позволяет создавать семантические описания веб-сервисов, понятные для семантических веб-агентов (web agents).
  17. 17. RDF/OWL- ресурсы в сети (1) • FOAF (Friend of a Friend) (http://www.foaf- project.org/) • SIOC (Semantically-Interlinked Online Communities discussion forums,weblogs,blogrolls/feed subscriptions, mailing lists, shared bookmarks, image galleries - http://sioc-project.org/)
  18. 18. RDF/OWL- ресурсы в сети (2) • Open GUID (http://openguid.net/) • SIMILE (Semantic Interoperability of Metadata and Information in unLike Environments - http://simile.mit.edu/) • NextBio (http://www.nextbio.com/b/nextbio.nb)
  19. 19. RDF/OWL- ресурсы в сети (3) • Linking Open Data (http://esw.w3.org/topic/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData) • Wikipedia (http://www.wikipedia.org/) • Dbpedia (http://dbpedia.org/) • YAGO (http://www.mpi-inf.mpg.de/yago- naga/yago/)
  20. 20. Linked Open Data (LOD)
  21. 21. Например, проект DBpedia нацелен на извлечение структурированной информации из многоязычной веб- энциклопедии Wikipedia с помощью SPARQL-запросов. На основе обработки сниппетов (snippet) из Wikipedia построена база знаний, где хранят RDF-тройки: subject-predicate-object. Число RDF-троек сегодня превышает 274 миллиона на 30 языках, включая 415,000 категорий Wikipedia и 75,000 категорий YAGO. Онтология YAGO основана на Wikipedia и WordNet.
  22. 22. Спасибо! Сергей Яблонский serge_yablonsky@hotmail.com

×