Использование  данных семантического веба  поисковыми системами Владимир Горовой ВШМ СПбГУ [email_address] http://twitter....
Содержание <ul><li>Семантическая разметка </li></ul><ul><li>Использование  FOAF </li></ul><ul><li>Использование  Freebase ...
Основной тренд Поисковые системы стимулируют вебмастеров для получения семантических данных
Сниппеты
RDF Тройки ( Triples): “ Cambridge Semantics is headquartered in Massachusetts”: subject object predicate Cambridge Semant...
Микроформаты и  RDFa Аннотирование  HTML  метаданными Отличие: Жестко заданные виды метаданных в микроформатах ( hCard, hR...
RDFa
Микроформаты
Подход  Google (Rich Snippets) <ul><li>Google  сам формирует сниппеты </li></ul><ul><li>Поддержка  hReview, hCard, hProduc...
Подход  Yahoo (Search Monkey) <ul><li>Формирование сниппетов силами пользователей </li></ul><ul><li>Большой словарь для  R...
Подход Яндекса <ul><li>Сами формируем сниппеты </li></ul><ul><li>Поддержка микроформатов ( hCard, hRecipe)  и  XML- фидов ...
Адреса организаций hCard,  выгрузка в специальном формате и заполнение в Я.Вебмастере
Рецепты hRecipe  и в виде  XML- фида
Рефераты В виде  XML- фида
Словари Внимание:  microdata (html5)
Словари
Поддержка в  CMS <ul><li>Drupal ( много в модулях, обещают в ядре  Drupal 7) </li></ul><ul><li>Wordpress (XFN;  в модулях:...
Где  RDFa  и микроформаты уже есть? STW Thesaurus for Economics
FOAF FOAF (Friend of a Friend) –  онтология для описания людей, групп и отношений между ними Yandex FOAF Extension –  расш...
Использование  FOAF   API  поиска по блогам:  http://blogs.yandex.ru/search_profiles_atom.xml?text= лебедев
Использование  Freebase
Спасибо ! ? Владимир Горовой ВШМ СПбГУ [email_address] http://twitter.com/vgorovoy
Upcoming SlideShare
Loading in …5
×

Использование данных семантического веба поисковыми системами

1,000 views

Published on

Владимир Горовой
ВШМ СПбГУ

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,000
On SlideShare
0
From Embeds
0
Number of Embeds
43
Actions
Shares
0
Downloads
8
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • RDFa - расширяем
  • Все эти сниппеты из данных rdfa и микроформатов
  • W3c recommendation from 2003 The Resource Description Framework (RDF) is a family of World Wide Web Consortium (W3C) specifications originally designed as a metadata data model . It has come to be used as a general method for conceptual description or modeling of information that is implemented in web resources; using a variety of syntax formats.
  • RDFa - расширяем
  • RDFa (or Resource Description Framework - in - attributes) is a set of extensions to XHTML which is now a W3C Recommendation. RDFa uses attributes from XHTML&apos;s meta and link elements, and generalises them so that they are usable on all elements. This allows annotating XHTML markup with semantics. A simple mapping is defined so that RDF triples may be extracted. Начали в 2004, а потом: In October 2008 RDFa reached Recommendation status. [9] An additional RDFa Primer document was last updated in June 2008. [10] (The first public Working Draft dates back to March 2006.)
  • Плагин Оператор к Firefox http://www.readwriteweb.com/archives/yahoo_kelkoo_microformats.php Written by Josh Catone / March 28, 2008 10:59 AM / 7 Comments The actual number of hListing&apos;s Yahoo! put out there was 26,456,448, as well as an additional 6,500 hCard listings describing merchants. &amp;quot;This bumper injection of structured data into Kelkoo’s pages makes it ripe for re-use, be that browser extensions to draw out product information on our pages, indexing services aggregating product listings together or mashing up the data for reuse in widgets,&amp;quot; said developer Ben Ward of Yahoo! Europe.
  • Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Google сам формирует сниппеты Информация только на основе микроформатов и RDFa Поддержка hReview, hCard, hProduct, hReview_Aggregate ( не утвержден даже на microformats.org ) Свой словарь для RDFa ( http://rdf.data-vocabulary.org/rdf.xml ) Запустили только для проверенных партнеров (Yelp.com, Cnet.com, LinkedIn.com) Не влияет на ранжирование (пока) Подробные инструкции в центре вебмастера ( http://google.com/support/webmasters/bin/answer.py?answer=146645 )
  • Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  • Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  • Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  • Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  • Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  • Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  • Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  • Максим: Сам по себе микроформатированный контент распространен. Его не видно, но он есть. Его очень активно генерируют блоги, например, WordPress. Микроформат XFN — это взаимоотношения между людьми. Он входит в стандартный набор тех фич, которые, например, WordPress может генерировать при создании страниц. Миллионы фотографий на Flickr помечены тагами. Есть такой микроформат Rel-tag, который указывает, что данная ссылка является тагом. Есть миллионы страниц на Yahoo Tech, в которых внедрен микроформат hReview: на страницах описание товаров, которые предлагаются на сайтах. Сами по себе контенты в сети присутствуют. LinkedIn (hCard) Yelp ( hReview) Cnet (hReview)
  • http://api.yandex.ru/blogs/doc/search/appendices/format-atom-foaf-sample.xml поиск по ленте друзей . Передача данных в стандарте FOAF (friend of a friend) делает полнее и точнее поиск по блогохостингам и социальным сервисам, в частности ? делает возможным поиск по лентам друзей и по профилям пользователей. Сегодня стандарт Sitemaps поддерживают около 200 тыс. сайтов Рунета. Формат MediaRSS используется рядом мультимедийных хостингов, например ? YouTube. Данные о профилях пользователей в формате FOAF транслируют все крупнейшие блогохостинги русскоязычного интернета, включая Livejournal. com, Liveinternet. ru и Blogs. Mail. ru.
  • http://api.yandex.ru/blogs/doc/search/appendices/format-atom-foaf-sample.xml поиск по ленте друзей . Передача данных в стандарте FOAF (friend of a friend) делает полнее и точнее поиск по блогохостингам и социальным сервисам, в частности ? делает возможным поиск по лентам друзей и по профилям пользователей. Сегодня стандарт Sitemaps поддерживают около 200 тыс. сайтов Рунета. Формат MediaRSS используется рядом мультимедийных хостингов, например ? YouTube. Данные о профилях пользователей в формате FOAF транслируют все крупнейшие блогохостинги русскоязычного интернета, включая Livejournal. com, Liveinternet. ru и Blogs. Mail. ru.
  • http://api.yandex.ru/blogs/doc/search/appendices/format-atom-foaf-sample.xml поиск по ленте друзей . Передача данных в стандарте FOAF (friend of a friend) делает полнее и точнее поиск по блогохостингам и социальным сервисам, в частности ? делает возможным поиск по лентам друзей и по профилям пользователей. Сегодня стандарт Sitemaps поддерживают около 200 тыс. сайтов Рунета. Формат MediaRSS используется рядом мультимедийных хостингов, например ? YouTube. Данные о профилях пользователей в формате FOAF транслируют все крупнейшие блогохостинги русскоязычного интернета, включая Livejournal. com, Liveinternet. ru и Blogs. Mail. ru.
  • Использование данных семантического веба поисковыми системами

    1. 1. Использование данных семантического веба поисковыми системами Владимир Горовой ВШМ СПбГУ [email_address] http://twitter.com/vgorovoy
    2. 2. Содержание <ul><li>Семантическая разметка </li></ul><ul><li>Использование FOAF </li></ul><ul><li>Использование Freebase </li></ul>
    3. 3. Основной тренд Поисковые системы стимулируют вебмастеров для получения семантических данных
    4. 4. Сниппеты
    5. 5. RDF Тройки ( Triples): “ Cambridge Semantics is headquartered in Massachusetts”: subject object predicate Cambridge Semantics headquartered Massachusetts
    6. 6. Микроформаты и RDFa Аннотирование HTML метаданными Отличие: Жестко заданные виды метаданных в микроформатах ( hCard, hReview …) и использование словарей ( Dublin Core, словарь Гугла и т.д.) в RDFa
    7. 7. RDFa
    8. 8. Микроформаты
    9. 9. Подход Google (Rich Snippets) <ul><li>Google сам формирует сниппеты </li></ul><ul><li>Поддержка hReview, hCard, hProduct, hReview_Aggregate ( не утвержден даже на microformats.org ) </li></ul><ul><li>Свой словарь для RDFa ( http://rdf.data-vocabulary.org/rdf.xml ) </li></ul><ul><li>Запустили только для проверенных партнеров (Yelp.com, Cnet.com, LinkedIn.com) </li></ul><ul><li>Не влияет на ранжирование </li></ul>
    10. 10. Подход Yahoo (Search Monkey) <ul><li>Формирование сниппетов силами пользователей </li></ul><ul><li>Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) </li></ul><ul><li>Не влияет на ранжирование </li></ul>
    11. 11. Подход Яндекса <ul><li>Сами формируем сниппеты </li></ul><ul><li>Поддержка микроформатов ( hCard, hRecipe) и XML- фидов в специальных форматах </li></ul><ul><li>Не влияет на ранжирование </li></ul>
    12. 12. Адреса организаций hCard, выгрузка в специальном формате и заполнение в Я.Вебмастере
    13. 13. Рецепты hRecipe и в виде XML- фида
    14. 14. Рефераты В виде XML- фида
    15. 15. Словари Внимание: microdata (html5)
    16. 16. Словари
    17. 17. Поддержка в CMS <ul><li>Drupal ( много в модулях, обещают в ядре Drupal 7) </li></ul><ul><li>Wordpress (XFN; в модулях: hAtom, hCard) </li></ul><ul><li>Movable Type (XFN, hAtom; в модулях: hCard, rel-tag) </li></ul>
    18. 18. Где RDFa и микроформаты уже есть? STW Thesaurus for Economics
    19. 19. FOAF FOAF (Friend of a Friend) – онтология для описания людей, групп и отношений между ними Yandex FOAF Extension – расширение FOAF , определяющее классы для постов, комментариев, читателей и т.п. ( http://api.yandex.ru/blogs/doc/indexation/appendices/yandex-foaf-ext-rdf.xml )
    20. 20. Использование FOAF API поиска по блогам: http://blogs.yandex.ru/search_profiles_atom.xml?text= лебедев
    21. 21. Использование Freebase
    22. 22. Спасибо ! ? Владимир Горовой ВШМ СПбГУ [email_address] http://twitter.com/vgorovoy

    ×