0
От запроса до ответа 
     Тенденции в представлении 
     страницы результатов поиска 


                        Александ...
«Ты помнишь, с чего начиналось?» 
•  У кого индекс больше и свежее? 
  1997‐2005 

•  У кого спама меньше? 
  1999‐2000, 2...
Обогащение сниппетов 
Представление результатов: что было 
•  До десяти результатов поиска 
•  Заголовок и сниппет для каждого результата 
•  «С...
Незаданные вопросы о сайте: новости 

Стало 
Было 
Незаданные вопросы о сайте: адрес 

Адрес развёрнут 
Адрес свёрнут 
Каждому случаю – свой сниппет 
•  Описание из каталога 




•  Начало текста 




•  Найдено по ссылке 
ЧПУ – человеко‐понятные URLы 
•  Как было: 
  hp://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%84%D1%83%D1%81%D0%BA
   %D0%B0%D1...
Где руда для обогащения сниппетов? 
•  ФИО, организации, должности 
  уже выделяются в Новостях 

•  почтовые адреса, теле...
Мы не одиноки во Вселенной! 
•  Google: число сообщений в некоторых форумах 



•  …дата 




•  …информация третьих лиц (...
Мы не одиноки во Вселенной‐2! 
•  Yahoo:  SearchMonkey – расширенные профили LinkedIn 
Было: 



Стало: 
Мы не одиноки во Вселенной‐2.1! 
•  SearchMonkey – извлечение постов из фидов 
Было: 



Стало: 
Перед тем, как двигаться 
       дальше… 
…вспомним, что было 
Качество поиска – это качество десятки 




 1. ‐‐‐‐‐‐‐‐ ‐‐‐ ‐‐‐‐‐‐‐‐‐     Нерелевантный    1. ‐‐‐‐‐‐‐‐ ‐‐‐ ‐‐‐‐‐‐‐‐‐     ...
Парадигма перенаправления 
•  Поисковая система – умный посредник 
  перенаправляет по запросу на подходящий URL 

•  Поль...
На каждом шаге – потеря времени и сил 

                                     «ложный» или 
             неудачный запрос  ...
Все может быть проще 



    Придумать     Прочесть       Просмотреть 
     Выбрать     результаты    страницу, найти 
   ...
Парадигма ответов на вопросы 
•  Давать ответы на заданные и незаданные вопросы 
  перезадание запроса, адрес с картой и т...
Еще раз: 
     заданные и 
незаданные вопросы. 
     И недозаданные. 
В чем разница? 
Парадигма перенаправления концентрируется на 
«попадании» ответа в запрос. 
Ощущения пользователя ее не во...
Колдунщики и фишки 
Колдунщики: событийные 
•  Олимпиада‐2008 
Колдунщики: структурированные данные 
•  Новости 




•  Маркет 




•  Карты, Словари, Афиша и т.д. 
Колдунщики: ответы на вопросы 
•  Погода 
  температура кодируется цветом 




  «Недозаданный» вопрос – регион определяем...
Колдунщики: ответы на вопросы 
•  Курсы валют 




  «Недозаданный» вопрос – 
  показываем курс к самой популярной валюте 
Фишки: не ждали?! 
•  Цвета 
Снова фишки 
•  Время 




  «Недозаданный» вопрос – смотрим регион по IP 




•  График отключения горячей воды, ваш IP, ...
Помогаем 
в формулировании запроса 
       Бесплатно, 24х7 
       www.yandex.ru 
Исправление ошибок 
•  Опечатки – 5% запросов предлагаем… 




  …5% автоматически исправляем (незаданный вопрос) 




•  ...
Только где же это что‐то? 
•  запросы, связанные с вашим запросом 
Поисковые подсказки 
•  упрощают набор – раз 




•  исправляют ошибки – два 
Поисковые подсказки 
•  дают представление о спектре тем и прагматик – три 




•  «обучают» новичков, как задавать запрос...
Поиск до поиска! 
•  дают ответы с URL нужных сайтов – пять 
За пределами выдачи 
Подсветка слов, всегда доступный URL 
Изучая сайт, советоваться с поиском 
•  отзывы о странице в Баре; тИЦ как уровень доверия 
Есть ли где еще разумная жизнь? :) 
•  Google: популярные разделы сайта 
Как все это создается? 
Некоторые аспекты измерения качества 
•  Оценка страницы в целом (привлекательность выдачи) 
  колдунщик – такой же ответ,...
«…А сейчас со всей этой байдой 
  мы попытаемся взлететь…» 
Проблемы будущего 
•  Консистентность vs. Перегруженность выдачи 
•  Унификация формы ответов на разные вопросы 
  Где и в...
Александр Садовский 
руководитель отдела веб‐поиска 

эл. почта: funsad@yandex‐team.ru 
Upcoming SlideShare
Loading in...5
×

Sadovsky Poisk 2008

228

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
228
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "Sadovsky Poisk 2008"

  1. 1. От запроса до ответа  Тенденции в представлении  страницы результатов поиска  Александр Садовский  11 ноября 2008  1 
  2. 2. «Ты помнишь, с чего начиналось?»  •  У кого индекс больше и свежее?  1997‐2005  •  У кого спама меньше?  1999‐2000, 2004, 2006…  •  Поиски параллельные, ортогональные, универсальные  2001…  •  Максимум релевантности в десятке  всегда  •  Разнообразие результатов, минимум дублей и «клонов»  2002, 2008…  •  Соответствие прагматик запроса и выдачи  2007…  Что же дальше? 
  3. 3. Обогащение сниппетов 
  4. 4. Представление результатов: что было  •  До десяти результатов поиска  •  Заголовок и сниппет для каждого результата  •  «Сохраненная копия» с подсветкой слов запроса, «Еще с  сайта»  •  Размер документа, формат и тема сайта (рубрика  каталога) 
  5. 5. Незаданные вопросы о сайте: новости  Стало  Было 
  6. 6. Незаданные вопросы о сайте: адрес  Адрес развёрнут  Адрес свёрнут 
  7. 7. Каждому случаю – свой сниппет  •  Описание из каталога  •  Начало текста  •  Найдено по ссылке 
  8. 8. ЧПУ – человеко‐понятные URLы  •  Как было:    hp://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%84%D1%83%D1%81%D0%BA %D0%B0%D1%86%D0%B8%D1%8F  •  Как стало: 
  9. 9. Где руда для обогащения сниппетов?  •  ФИО, организации, должности  уже выделяются в Новостях  •  почтовые адреса, телефоны  уже показываются за ссылкой адреса  •  даты  •  цены на товары  •  типы ресурсов (магазин, энциклопедия и др.)  •  ссылки на сюжеты новостей, блоги  •  мультимедиа  и т.д. 
  10. 10. Мы не одиноки во Вселенной!  •  Google: число сообщений в некоторых форумах  •  …дата  •  …информация третьих лиц (Subscribed Links) 
  11. 11. Мы не одиноки во Вселенной‐2!  •  Yahoo:  SearchMonkey – расширенные профили LinkedIn  Было:  Стало: 
  12. 12. Мы не одиноки во Вселенной‐2.1!  •  SearchMonkey – извлечение постов из фидов  Было:  Стало: 
  13. 13. Перед тем, как двигаться  дальше… 
  14. 14. …вспомним, что было 
  15. 15. Качество поиска – это качество десятки  1. ‐‐‐‐‐‐‐‐ ‐‐‐ ‐‐‐‐‐‐‐‐‐  Нерелевантный  1. ‐‐‐‐‐‐‐‐ ‐‐‐ ‐‐‐‐‐‐‐‐‐  Полезный  2. ‐‐‐‐‐‐ ‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐  Спам  2. ‐‐‐‐‐‐ ‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐  Релевантный+  ‐‐‐‐‐‐‐ ‐‐‐‐‐ ‐‐ ‐ ‐‐‐‐‐  ‐‐‐‐‐‐‐ ‐‐‐‐‐ ‐‐ ‐ ‐‐‐‐‐  3. ‐‐‐‐ ‐‐ ‐‐‐‐‐‐ ‐‐‐‐‐‐  Релевантный+  3. ‐‐‐‐ ‐‐ ‐‐‐‐‐‐ ‐‐‐‐‐‐  Полезный  ‐‐‐‐‐ ‐‐‐‐‐ ‐‐‐‐‐‐  ‐‐‐‐‐ ‐‐‐‐‐ ‐‐‐‐‐‐  ‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐‐‐  ‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐‐‐  4. ‐‐‐‐‐‐‐ ‐‐ ‐‐ ‐‐‐‐‐‐‐‐  Нерелевантный  4. ‐‐‐‐‐‐‐ ‐‐ ‐‐ ‐‐‐‐‐‐‐‐  Релевантный+  5. ‐‐‐‐‐ ‐‐‐ ‐‐‐‐‐‐ ‐‐‐ ‐‐  Дубль  5. ‐‐‐‐‐ ‐‐‐ ‐‐‐‐‐‐ ‐‐‐ ‐‐  Релевантный+  ‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐ ‐‐‐‐  ‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐ ‐‐‐‐  Плохой поиск  Хороший поиск 
  16. 16. Парадигма перенаправления  •  Поисковая система – умный посредник  перенаправляет по запросу на подходящий URL  •  Пользователь наедине с собой  Сам выбирает запрос. Сам изучает выдачу, выбирая ответ. Сам ищет ответ на  выбранной странице. «К пуговицам (релевантности) претензии есть?!»  2007‐2008. Оказывается, жизнь есть    до запроса,    в момент выбора ответа на выдаче    и даже после клика. 
  17. 17. На каждом шаге – потеря времени и сил  «ложный» или  неудачный запрос  неполный ответ  Сканировать  Просмотреть  Придумать  результаты,  страницы, есть  запрос  выбрать нужный  ответ?  яндекс  яндек  янде  янд  ян  я 
  18. 18. Все может быть проще  Придумать  Прочесть  Просмотреть  Выбрать  результаты  страницу, найти  запрос  ответ  ответ 
  19. 19. Парадигма ответов на вопросы  •  Давать ответы на заданные и незаданные вопросы  перезадание запроса, адрес с картой и телефон по запросу с названием организации  •  Структура выдачи позволяет уже сейчас показать многие  типы ответов, не меняя привычек пользователей  Ответ – это не только факт, но и путь к нему:  •  Помогать в формулировании запроса  •  Показывать отличия между разными типами ответов  например, блоги, новости и товары размечать по‐разному  •  Помогать выбрать ссылку, богаче аннотируя результаты  •  Упрощать нахождение ответа за пределами выдачи  предугадывать не полностью заданный вопрос, указывать ответ на странице 
  20. 20. Еще раз:   заданные и  незаданные вопросы.  И недозаданные. 
  21. 21. В чем разница?  Парадигма перенаправления концентрируется на  «попадании» ответа в запрос.  Ощущения пользователя ее не волнуют.  Цель парадигмы ответчика – снизить усилия  пользователя на пути к ответу.  Экономит клики (в том числе за счет повышения релевантности) и перемещения по  странице, снижает требования к концентрации внимания.  Сменились объекты изучения:  •   информации → на восприятие ее пользователем  с •  о страницы выдачи →  на процесс удовлетворения  с информационной потребности  (от запроса до ответа) 
  22. 22. Колдунщики и фишки 
  23. 23. Колдунщики: событийные  •  Олимпиада‐2008 
  24. 24. Колдунщики: структурированные данные  •  Новости  •  Маркет  •  Карты, Словари, Афиша и т.д. 
  25. 25. Колдунщики: ответы на вопросы  •  Погода  температура кодируется цветом    «Недозаданный» вопрос – регион определяем по IP 
  26. 26. Колдунщики: ответы на вопросы  •  Курсы валют    «Недозаданный» вопрос –  показываем курс к самой популярной валюте 
  27. 27. Фишки: не ждали?!  •  Цвета 
  28. 28. Снова фишки  •  Время    «Недозаданный» вопрос – смотрим регион по IP  •  График отключения горячей воды, ваш IP,  таблица Менделеева и др. 
  29. 29. Помогаем  в формулировании запроса  Бесплатно, 24х7  www.yandex.ru 
  30. 30. Исправление ошибок  •  Опечатки – 5% запросов предлагаем…    …5% автоматически исправляем (незаданный вопрос)  •  Транслитерация, неправильная раскладка 
  31. 31. Только где же это что‐то?  •  запросы, связанные с вашим запросом 
  32. 32. Поисковые подсказки  •  упрощают набор – раз  •  исправляют ошибки – два 
  33. 33. Поисковые подсказки  •  дают представление о спектре тем и прагматик – три  •  «обучают» новичков, как задавать запрос – четыре 
  34. 34. Поиск до поиска!  •  дают ответы с URL нужных сайтов – пять 
  35. 35. За пределами выдачи 
  36. 36. Подсветка слов, всегда доступный URL 
  37. 37. Изучая сайт, советоваться с поиском  •  отзывы о странице в Баре; тИЦ как уровень доверия 
  38. 38. Есть ли где еще разумная жизнь? :)  •  Google: популярные разделы сайта 
  39. 39. Как все это создается? 
  40. 40. Некоторые аспекты измерения качества  •  Оценка страницы в целом (привлекательность выдачи)  колдунщик – такой же ответ, должен быть релевантным в соответствии с позицией  •  Распределение трафика по странице  кликабельность всех результатов, в т.ч. смежных с колдунщиками  •  Эксперименты на части аудитории  •  Оценка сниппетов включает:  •  наличие ответа на запрос  •  помощь в выборе релевантного  •  впечатление о выдаче  •  Usability‐исследования  проблема «баннерной слепоты» 
  41. 41. «…А сейчас со всей этой байдой  мы попытаемся взлететь…» 
  42. 42. Проблемы будущего  •  Консистентность vs. Перегруженность выдачи  •  Унификация формы ответов на разные вопросы  Где и в какой форме пользователь должен их ждать? «Слепота» от привычки. Скорость  восприятия.   •  Переключение «абстрактное ↔ конкретное» требует  усилий  перейти от поиска слов запроса  к чтению описания сайта или рубрики непросто;  факты могут классифицировать ответ не менее информативно, чем рубрика  •  Ветвление усилий разработчиков поиска  Рост сегментации запросов и ответов  •  конкуренция данных (решение – data mining, партнерство)  •  покрытие редких типов ответов (решение – социальный путь)  •  Следование за толпой  сокращение разнообразия запросов и ответов («богатые богатеют»). Одно из  решений – персонализация 
  43. 43. Александр Садовский  руководитель отдела веб‐поиска  эл. почта: funsad@yandex‐team.ru 
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×