• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Yablomsky
 

Yablomsky

on

  • 638 views

 

Statistics

Views

Total Views
638
Views on SlideShare
621
Embed Views
17

Actions

Likes
0
Downloads
8
Comments
0

2 Embeds 17

http://mathlingvo.ru 13
http://www.mathlingvo.ru 4

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Yablomsky Yablomsky Presentation Transcript

    • СЕМАНТИЧЕСКИЙ ВЕБ И WEB KNOWLEDGE MINING С.А. Яблонский, Т.А. Гаврилова Высшая школа менеджмента Санкт- Петербургского государственного университета Санкт-Петербург
    • Этапы развития WWW
    • • Web 1.0 – объединение в сети информации (этап пройден, информация постоянно пополняется); • Web 2.0 – объединение в сети людей – Social Web (пройден, социальные сети стали реальностью и стремительно растут); • Web 3.0 – объединение в сети знаний (начинается сейчас); • Web 4.0 – такое объединение в сети людей и компьютеров, когда и те и другие смогут общаться и получать знания наравне с друг другом (перспектива).
    • Tim Berners-Lee
    • Языки представления онтологий  RDF+ RDFS  OWL  Язык запросов к RDF/OWL SPARQL
    • RDFS • RDFS – язык описания словарей для RDF • RDF Schema определяет классы, свойства и другие ресурсы. • RDFS является семантическим расширением RDF.
    • Перечень классов RDFS Имя класса Пояснение rdfs:Resource Класс ресурс, включает «всё». rdfs:Literal Класс литеральных значений, текстовых строк или чисел. rdf:XMLLiteral Класс XML литералов rdfs:Class Класс классов. rdf:Property Класс RDF свойств. rdfs:Datatype Класс типов данных RDF. rdf:Statement Класс утверждений. rdf:Bag Класс неупорядоченных контейнеров. rdf:Seq Класс упорядоченных контейнеров. rdf:Alt Класс контейнеров-альтернатив. rdfs:Container Класс RDF контейнеров. rdfs:ContainerMembershipProperty Класс свойств «членства» в контейнерах, rdf:_1, rdf:_2, ..., все они являются подсвойствами свойства member( член). rdf:List Класс RDF списков.
    • Перечень свойств RDFS Имя свойства Пояснение Домен Диапазон rdf:type Субъект является экземпляром класса. rdfs:Resource rdfs:Class rdfs:subClassOf Субъект является подклассом класса. rdfs:Class rdfs:Class rdfs:subProperty Субъект является подсвойством свойства. rdf:Property rdf:Property Of rdfs:domain Домен свойства сеюъекта. rdf:Property rdfs:Class rdfs:range Диапазон свойства субъекта. rdf:Property rdfs:Class rdfs:label Человекочитаемое название субъекта. rdfs:Resource rdfs:Literal rdfs:comment Текстовое описание ресурса rdfs:Resource rdfs:Literal rdfs:member Член ресурса субъекта. rdfs:Resource rdfs:Resource rdf:first Первый элемент списка. rdf:List rdfs:Resource rdf:rest Оставшийся за первым элементом «хвост» rdf:List rdf:List списка. rdfs:seeAlso Дополнительная информация о субъекте. rdfs:Resource rdfs:Resource rdfs:isDefinedBy Определение ресурса субъекта. rdfs:Resource rdfs:Resource rdf:value Свойство, используемое для rdfs:Resource rdfs:Resource структурированных значений rdf:subject Субъект RDF утверждения (см. реификация). rdf:Statement rdfs:Resource rdf:predicate Предикат утверждения (см. реификация). rdf:Statement rdfs:Resource rdf:object Объект RDF утверждения (см. реификация). rdf:Statement rdfs:Resource
    • RDF • RDF – язык описания метаданных в Сети • Модель данных RDF – ориентированный граф • RDF граф строится на основе элементарных высказываний (триплетов) • Форма высказываний – бинарное отношение (S,P,O) • RDF чрезвычайно выразителен (кто угодно может сказать что угодно о чем угодно) • RDFS служит для определения словарей RDF.
    • Ограничение языка RDF + RDFS Целостность и непротиворечивость. RDF не запрещает делать бессмысленных утверждений или утверждений не согласующихся с другими. Вся ответственность за проверку целостности ложится на получателей (конечных пользователей) метаданных, т.е. на разработчиков приложений обрабатывающих RDF.
    • Дополнительно • упрощенные встроенные в HTML- страницы микроформаты (Microformats), • RDFa, • Embedded RDF (eRDF), • и др., широко используемые в Facebook, Yahoo! Local, блогах.
    • OWL • OWL (Web Ontology Language) – язык представления онтологий в Web. Фактически это словарь расширяющий набор терминов определенных RDFS. • OWL-онтологии могут содержать описания классов, свойств и их экземпляров.
    • Три диалекта OWL • OWL Lite (простота) • OWL DL (полнота и разрешимость) • OWL Full (выразительная мощь)
    • Языки запросов к RDF хранилищам Представление знаний в машинопонятном формате не имело бы никакого смысла, если бы к этим знаниям нельзя было обращаться, автоматически их обрабатывать и пополнять. Две близкие задачи: • Извлечение имеющихся в хранилище знаний запросами к RDF хранилищу - asking, querying. • Применение логического вывода над имеющимися знаниями (RDF-графами и онтологиями) - reasoning, entailment.
    • SPARQL Синтаксис запроса (упрощенный) SELECT <v_list> FROM <onologyURI> WHERE { <template_list>. FILTER <filter_expr> } - v_list – список имен переменных - onologyURI – ссылка на онтологию - template_list – список шаблонов - filter_expr – ограничения на значения переменных
    • OWL-S (http://www.w3.org/Submission/OWL-S/) Семантический язык разметки веб- сервисов (Web Services). Позволяет создавать семантические описания веб-сервисов, понятные для семантических веб-агентов (web agents).
    • RDF/OWL- ресурсы в сети (1) • FOAF (Friend of a Friend) (http://www.foaf- project.org/) • SIOC (Semantically-Interlinked Online Communities discussion forums,weblogs,blogrolls/feed subscriptions, mailing lists, shared bookmarks, image galleries - http://sioc-project.org/)
    • RDF/OWL- ресурсы в сети (2) • Open GUID (http://openguid.net/) • SIMILE (Semantic Interoperability of Metadata and Information in unLike Environments - http://simile.mit.edu/) • NextBio (http://www.nextbio.com/b/nextbio.nb)
    • RDF/OWL- ресурсы в сети (3) • Linking Open Data (http://esw.w3.org/topic/SweoIG/TaskForces/ CommunityProjects/LinkingOpenData) • Wikipedia (http://www.wikipedia.org/) • Dbpedia (http://dbpedia.org/) • YAGO (http://www.mpi-inf.mpg.de/yago- naga/yago/)
    • Linked Open Data (LOD)
    • Например, проект DBpedia нацелен на извлечение структурированной информации из многоязычной веб- энциклопедии Wikipedia с помощью SPARQL-запросов. На основе обработки сниппетов (snippet) из Wikipedia построена база знаний, где хранят RDF-тройки: subject-predicate-object. Число RDF-троек сегодня превышает 274 миллиона на 30 языках, включая 415,000 категорий Wikipedia и 75,000 категорий YAGO. Онтология YAGO основана на Wikipedia и WordNet.
    • Спасибо! Сергей Яблонский serge_yablonsky@hotmail.com