2. Что такое семантические технологии?
«Семантическая паутина» (Semantic Web) –
один из путей дальнейшего развития Интернета.
Основатель: Tim Berners-Lee
Стандартизация: W3C
3. Что такое семантические технологии?
Современные информационные системы
информация представляется
• в реляционной форме (таблицы)
• в поточной (гипертекст, видео и т.д.)
Семантические технологии
информацию выражается в виде набора фактов,
записываемых в форме
«подлежащее – сказуемое – определение»
Такая форма записи называется триплетом.
4. Что такое семантические технологии?
Онтология - «словарь терминов», в котором
определены все возможные виды объектов
и связей между ними.
Примеры стандартных онтологий:
• «Дублинское ядро» (Dublin Core)
• микроформаты (μF)
5. Простой пример
И.И. Иванов родился 01.01.1970
Содержание онтологии:
«человек»
«имеет имя»
«родился»
Выбор: использовать стандартную онтологию (foaf),
или создать свою.
#Иванов имеет имя «И.И. Иванов»
#Иванов родился «1970-01-01»
#Иванов – уникальный идентификатор объекта, URI
Об уникальных идентификаторах(URI) будет рассказано чуть позже
6. Что хорошего в семантических технологиях?
Микроформаты
Возможность искать структурированную информацию.
Как больше вероятность
найти нужный товар?
Вот так:
Или вот так:
Магазины должны представлять информацию в семантической форме!
7. Что такое семантические технологии?
• В семантической форме можно записать
любую информацию.
• Чем сложнее информация, тем более
развитой будет онтология.
8. Что такое семантические технологии?
Информацию, записанную в семантической форме,
удобно визуально представить в виде
математического графа.
Лучшим примером такого графа будет социальная сеть
дружит с
Иванов И.И. Петрова С.С.
дружит с нравится добавила
фото! фото
дружит с
добавил комментарий к фото
Семенов В.В.
Иванов, Петрова, фото – объекты (вершины графа).
«Дружит с», «добавила» - связи (ребра графа).
9. Что такое семантические технологии?
Все связи, существующие в социальной сети,
можно представить в виде графа гигантских размеров,
содержащего миллиарды узлов.
Цукерберг: между миллиардом пользователей соцсети установлено свыше триллиона
связей, а на серверах компании хранится более 240 миллиардов фотографий.
10. Graph Search в Facebook
В январе 2013 года Facebook представил Graph Search
– инструмент поиска по информационному графу,
которым является социальная сеть.
Цукерберг: «Система не просто выдает набор
ссылок, как Google или Yelp, а сразу отвечает на
поставленные вопросы, например: "фотографии,
которые мне нравятся", "города, в которых побывали
члены моей семьи", или "рестораны в Лондоне, где
бывали мои друзья».
Отличие семантического поиска от обычного состоит в том, что поисковая
машина учитывает смысл информации, а не просто ищет ключевые слова
11. Перейдем к технологиям
Каждый факт – ребро графа – называется
«триплетом».
RDF – язык записи триплетов.
RDF можно записывать с помощью разных синтаксисов: Turtle,
XML и т.д.
RDFS – средство записи схемы RDF (онтологии).
OWL – еще один язык записи онтологий.
SPARQL - язык запросов к данным, представленным
в виде триплетов.
12. Перейдем к технологиям
Пример SPARQL-запроса
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name ?email
WHERE {
?person a foaf:Person.
?person foaf:name ?name.
?person foaf:mbox ?email.
}
Приведенный запрос вернет имена и e-mail’ы каждого
человека в мире
foaf – одна из универсальных отнологий
13. Спасибо за внимание!
Вопросы?
Также можно обсудить в ЖЖ:
http://serge-index.livejournal.com
Проект «Бизнес Семантика»:
http://www.business-semantic.ru