SlideShare a Scribd company logo
1 of 74
Download to read offline
2
КАЧЕСТВО
ПОИСКА
И ПОИСКОВЫЕ
СИСТЕМЫ
В РУНЕТЕА Н А Л И Т И Ч ЕС К И Й ОБ ЗОР, 2 013 ГОД
АВТОРЫ ОТЧЕТА:
КОНСТАНТИН РОЩУПКИН,
ЛЮДМИЛА КУДРЯВЦЕВА,
СЕРГЕЙ ВАЛЬКОВСКИЙ
СОДЕРЖАНИЕ
	 О  ­компании «Ашманов и  ­партнеры»............................................................................... 4
ЧАСТЬ 1.
1.	 Качество поиска: критерии и  ­динамика......................................................................... 5
Независимая оценка качества поиска..................................................................................................................................................5
Что нового на Analyzethis.ru в 2013 году.............................................................................................................................................6
Как работают анализаторы качества поиска.....................................................................................................................................7
2.	 Качество поиска по  навигационным запросам.............................................................. 8
Анализатор качества навигационного поиска..................................................................................................................................9
Анализатор качества поиска периферийных сайтов.....................................................................................................................9
Анализатор качества внутрисайтовой навигации.........................................................................................................................10
Анализатор качества поиска персон....................................................................................................................................................10
Анализатор качества поиска персональных блогов....................................................................................................................12
Анализатор качества навигационного поиска в социальных сетях....................................................................................13
3.	 Качество поиска по  информационным запросам..........................................................14
Анализатор качества поиска крылатых слов...................................................................................................................................16
Анализатор качества поиска ответов..................................................................................................................................................17
Анализатор качества поиска оригиналов новостей.....................................................................................................................18
Анализатор качества поиска адресов.................................................................................................................................................19
4.	 Качество поиска по  транзакционным запросам............................................................19
Анализатор качества поиска официальных версий программного обеспечения........................................................21
Анализатор качества поиска официальных версий контента.................................................................................................22
5.	 Актуальность результатов поиска................................................................................. 23
Анализатор актуальности поиска: должности................................................................................................................................24
Анализатор актуальности поиска: телефоны...................................................................................................................................25
Анализатор скорости индексации.........................................................................................................................................................26
6.	 Полнота и  ­разнообразие результатов поиска............................................................... 27
Анализатор полноты индекса...................................................................................................................................................................28
Анализатор качества тематического поиска....................................................................................................................................29
Анализатор качества поиска омонимов.............................................................................................................................................30
Анализатор SEO-прессинга........................................................................................................................................................................31
7.	 Поиск из  ­регионов........................................................................................................... 32
Анализатор регионального поиска.......................................................................................................................................................33
Анализатор качества регионального навигационного поиска..............................................................................................34
2
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
8.	 Понимание запроса.......................................................................................................... 35
Анализатор качества подсказок.............................................................................................................................................................36
Анализатор устойчивости к опечаткам в запросе........................................................................................................................37
Анализатор запросов-синонимов...........................................................................................................................................................38
Анализатор поиска по запросам с числами.....................................................................................................................................39
Анализатор поиска моделей.....................................................................................................................................................................40
9.	 Анализаторы ошибок........................................................................................................41
Анализатор замены редких слов............................................................................................................................................................42
Анализатор замены редких фраз...........................................................................................................................................................43
Анализатор неразрывных словосочетаний........................................................................................................................................44
Анализатор поиска имен.............................................................................................................................................................................45
Анализатор грамматики..............................................................................................................................................................................46
10.	 Раздражающие факторы................................................................................................. 47
Анализатор спама в поисковой выдаче..............................................................................................................................................48
Анализатор «сайтов для взрослых» в поисковой выдаче........................................................................................................49
Анализатор качества семейного фильтра..........................................................................................................................................50
Анализатор рекламной нагрузки............................................................................................................................................................51
Анализатор порнорекламы........................................................................................................................................................................52
Анализатор вирусных угроз.......................................................................................................................................................................53
11.	 Общие ­характеристики поиска...................................................................................... 54
Асессорский анализатор.............................................................................................................................................................................55
Анализатор качества ­сниппетов.............................................................................................................................................................56
Анализатор апдейтов....................................................................................................................................................................................57
Анализатор скорости регионального поиска...................................................................................................................................58
3
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
ЧАСТЬ 2.
1.	 Основные ­события на  рынке поиска в  Рунете в  2013 году....................................... 59
Усиление государственного регулирования Рунета....................................................................................................................59
Возрастающая роль социальных сетей в экосистеме Интернета и в функционировании поисковиков..........60
Персонализация поисковых результатов...........................................................................................................................................61
Отказ поисковиков от модели «зеркало Интернета, в котором отражаются документы с сайтов»...................61
Мобильный поиск: другие проблемы, другие подходы.............................................................................................................62
Обострение конкуренции в области качества поиска................................................................................................................62
2.	 «Яндекс» в  2013  году...................................................................................................... 63
«Яндекс.Острова»............................................................................................................................................................................................63
Улучшение поиска картинок.....................................................................................................................................................................64
Продолжение работы по выходу на зарубежные рынки...........................................................................................................64
Покупка «Кинопоиска», усиление функционала, связанного с видео и кино................................................................64
Дистрибуция на мобильных платформах...........................................................................................................................................65
Ранжирование без ссылок.........................................................................................................................................................................65
Поисковое партнерство с ­Facebook.......................................................................................................................................................66
3.	 Google в  России в  2013 году.......................................................................................... 67
Новый гендиректор Google Россия........................................................................................................................................................68
Новый поисковый алгоритм Hummingbird.........................................................................................................................................68
Борьба со ссылочными биржами, в том числе российскими..................................................................................................68
Новое поколение устройств......................................................................................................................................................................69
4.	 Поиск Mail.ru в  2013 году............................................................................................... 70
Переход на собственный поиск...............................................................................................................................................................70
Ответы и информация в выдаче.............................................................................................................................................................70
Протоострова в выдаче go.mail.ru.........................................................................................................................................................70
Привлечение к сотрудничеству вебмастеров...................................................................................................................................71
Выход на глобальный рынок....................................................................................................................................................................71
Временное затишье в области дистрибуции...................................................................................................................................71
5.	 Резюме.............................................................................................................................. 72
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
4
О  ­КОМПАНИИ
«АШМАНОВ
И  ­ПАРТНЕРЫ»
Ежегодный аналитический отчет по качеству работы
поисковых систем подготовлен компанией «Ашманов
и партнеры». Материал основан на данных, получен-
ных при помощи семейства анализаторов проекта
AnalyzeThis.
Анализаторы, разработанные компанией, позволяют
с  высокой точностью оценивать, как с течением
времени меняется качество работы основных поис-
ковых систем русскоязычного сегмента Интернета.
Создание этого уникального проекта стало возможным
благодаря привлечению к работе лучших специали-
стов в  области поисковых технологий и  лингвисти-
ки, которые также занимаются реализацией новой
вьетнамской поисковой системы Wada.
Среди прочих разработок компании — сервисы, обе-
спечивающие высококачественный семантический
анализ контента. К  их числу относятся система
управления репутацией в  Интернете «Крибрум»,
технология «Семантическое зеркало» и  другие.
Компания «Ашманов и  партнеры» является одним
из  лидеров российского рынка интернет-маркетинга.
С 2001 года компания оказывает услуги по комплекс-
ному продвижению брендов в Интернете, консалтингу
и аналитике.
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
5
ЧЕМ ДАЛЬШЕ, ТЕМ ПРОЧНЕЕ ПОИСКОВЫЕ
СИСТЕМЫ УТВЕРЖДАЮТСЯ В РОЛИ НЕЗА-
МЕНИМЫХ ПОМОЩНИКОВ В ПОВСЕДНЕВ-
НОЙ ЖИЗНИ. ОТВЕТ НА ВОПРОС, РЕШЕ-
НИЕ ПРОБЛЕМЫ ИЛИ ПРОСТО ПОИСК
ИНФОРМАЦИИ — ИМЕННО К ЛЮБИМОМУ
ПОИСКОВИКУ ОБРАТИТСЯ ЧЕЛОВЕК
В ПЕРВУЮ ОЧЕРЕДЬ. НО ЕСЛИ ПРЕД-
ЛОЖЕННЫЕ РЕЗУЛЬТАТЫ ПОКАЖУТСЯ
НЕУДОВЛЕТВОРИТЕЛЬНЫМИ, ЧЕЛОВЕК
ЛЕГКО ЗАДАCТ ТОТ ЖЕ ЗАПРОС В ДРУ-
ГОМ ПОИСКОВИКЕ, КОТОРЫЙ МОЖЕТ СО
ВРЕМЕНЕМ СТАТЬ «ЛЮБИМЫМ».
НЕЗАВИСИМАЯ ОЦЕНКА
КАЧЕСТВА ПОИСКА
В условиях конкуренции качество поиска становится
особенно важным, а  значит  — и  наличие объектив-
ной его оценки. Конечно, сравнивать между собой
поисковые системы можно по  принципу «нравится /
не нравится», но гораздо интереснее выглядит сравне-
ние, проведенное с использованием анализа и оценки
результатов поиска по различным наборам запросов.
Лингвисты и  разработчики компании «Ашманов
и партнеры» создали методику, позволяющую автома-
тически оценивать поисковые системы по различным
характеристикам, и запустили летом 2007 года первые
анализаторы качества поиска на  основе технологии
сайтов-маркеров.
КАЧЕСТВО ПОИСКА:
КРИТЕРИИ
И  ­ДИНАМИКА
1.ЧАСТЬ 1
6
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
С результатом работы анализаторов можно ознакомить-
ся на  сайте проекта AnalyzeThis (www.analyzethis.ru).
Сейчас эти анализаторы — единственный независимый
тест качества поиска в Рунете. В 2010 году была запу-
щена английская версия анализаторов. Все известные
аналоги исследуют меньшее количество поисковых
систем по меньшему числу критериев.
В  2012 году сайт проекта был обновлен, анализато-
ры были разбиты на  группы, что сделало просмотр
результатов более удобным.
Сегодня на AnalyzeThis ежедневно публикуются:
ff результаты 40 анализаторов различных характе-
ристик поиска;
ff интегральный показатель качества поиска;
ff асессорские оценки результатов поиска;
ff количество переходов с результатов поиска на сайты
по данным LiveInternet.
В этом отчете изложены основные события и новости
в  жизни поисковых машин и  описаны изменения
в различных аспектах качества поиска за 2013 год.
ЧТО НОВОГО НА ANALYZETHIS.RU
В 2013 ГОДУ
В  течение 2013 года на  Analyzethis.ru появилось
шесть новых анализаторов, в нескольких анализаторах
появились новые «вкладки» (результаты измерений
дополнительных параметров). Некоторые изменения
внедрены в уже существовавшие анализаторы.
Так, анализатор поиска официальных версий был
разделен на  два анализатора: поиск программного
обеспечения и  поиск контента, в  анализаторе скоро-
сти поиска добавлены вкладки с  дополнительными
характеристиками распределения скорости загрузки,
а  в  навигационном анализаторе втрое увеличено
количество запросов.
Основным нововведением стало изменение формулы
расчета интегрального показателя качества поиска.
Если раньше в  формуле все показатели поискови-
ков нормировались в  промежутке между лучшим
и  худшим, то с  февраля нормирование происходит
от лучшего до нуля. В связи с этим на графике ана-
лизатора общего качества поиска в феврале виден
резкий скачок.
Сразу три анализатора, появившихся в 2013 году — запро-
сы с числами, поиск адресов, грамматика, — связаны
с умением поисковых машин определять тип запроса
и учитывать его при построении результатов поиска.
Как всегда, в  течение года происходило регулярное
обновление части запросов или маркеров к ним в раз-
ных анализаторах. Например, заметное синхронное
падение в  декабре 2013 всех поисковиков в  обоих
анализаторах актуальности было связано с  полным
обновлением запросов одного (должностей) и значи-
тельным — другого (телефонов).
В  2013 году поисковик Mail.ru полностью перешел
на свой поисковый движок (ранее до трети запросов
к  поисковику обрабатывалась с  помощью Google),
в связи с чем из списка анализируемых поисковиков
был убран тестовый Mail-beta.
Также стоит отметить, что с графиков качества поиска
за  2013 год в  этом отчете мы, как и  в  прошлом году,
убрали «Рамблер», так как с  лета 2011 года на  этом
портале работает поисковый движок «Яндекса»,
и результаты измерения для «Рамблера» и «Яндекса»
практически совпадают.
7
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
КАК РАБОТАЮТ АНАЛИЗАТОРЫ
КАЧЕСТВА ПОИСКА
Каждый анализатор оценивает один из  аспектов
качества поиска; большинство из них работает в авто-
матическом режиме, хотя отдельные анализаторы
требуют дополнительной ручной обработки. Анализатор
задает всем поисковикам специально подобранный
специалистами компании набор запросов, к которым
почти всегда привязан набор маркеров, по присутствию
(или отсутствию) которых в результатах поиска робот
и оценивает выдачу. Маркером может быть конкретный
сайт, страница или даже словосочетание — это зависит
от того, что именно оценивает анализатор. Поисковая
выдача по нескольким тысячам запросов фиксируется
и оценивается ежедневно.
Подробное описание работы анализаторов вы можете
найти на  сайте www.analyzethis.ru или в  виде при-
ложения к  первому аналитическому отчету «Поиск
и контекстная реклама в Рунете 2008», который можно
скачать на сайте www.ashmanov.com*.
Все результаты работы анализаторов с  момента
их публикации всегда можно посмотреть на  сайте
www.analyzethis.ru, во многих случаях статистика
доступна за 5 и более лет.
*На странице www.ashmanov.com/company/news/i64
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
8
ПОИСК ПО НАВИГАЦИОННЫМ ЗАПРО-
САМ — ЭТО ПОИСК ОПРЕДЕЛЕННЫХ
СТРАНИЦ И САЙТОВ В ИНТЕРНЕТЕ.
НАПРИМЕР, ПО ЗАПРОСУ «СБЕРБАНК»
ПОЛЬЗОВАТЕЛЬ, СКОРЕЕ ВСЕГО, ХОЧЕТ
ПОЛУЧИТЬ ССЫЛКУ НА САЙТ СБЕРБАНКА.
С ПОИСКОМ ПО ОБЫЧНЫМ НАВИГАЦИ-
ОННЫМ ЗАПРОСАМ ВСЕ ПОИСКОВИКИ
СПРАВЛЯЮТСЯ ОТЛИЧНО. ИНТЕРЕСНО
ПОСМОТРЕТЬ ЧУТЬ ГЛУБЖЕ — НАПРИ-
МЕР, НА ПОИСК ПО РЕГИОНАЛЬНЫМ
НАВИГАЦИОННЫМ ЗАПРОСАМ ИЛИ
НА ВНУТРИСАЙТОВУЮ НАВИГАЦИЮ.
2.
КАЧЕСТВО ПОИСКА
ПО  НАВИГАЦИОН-
НЫМ ЗАПРОСАМ
9
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР КАЧЕСТВА
НАВИГАЦИОННОГО ПОИСКА
Навигационный поиск уже давно не является проблемой
для поисковых машин. Накопленные данные о кликах
пользователей позволяют выдавать ссылку на нужный
сайт в ответ на почти любой навигационный запрос.
В начале сентября 2013 года был полностью заменен
набор запросов анализатора, кроме того, количество
запросов было увеличено в три раза. В наборе появи-
лись запросы с опечатками, неофициальные названия
и названия сайтов в русской транскрипции.
Тем не менее, качество навигационного поиска, измерен-
ное анализаторами, у основных поисковиков Рунета —
«Яндекса», Google и  Mail.ru  — почти не  изменилось
и  по-прежнему редко опускается ниже 99% (рис. 1).
Качество «навигации» в Yahoo, в среднем, равно при-
мерно 97%, а в Bing этот показатель еще немного ниже.
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА
ПЕРИФЕРИЙНЫХ САЙТОВ
Периферийные сайты — это малоизвестные, небольшие
сайты, чаще всего, региональные. Качество поиска таких
сайтов по навигационным запросам, очевидно, будет
ниже, но  тем интереснее посмотреть на  результаты
соответствующего анализатора (рис. 2).
Рисунок 1. Качество навигационного поиска
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь
100
95
90
85
80
%
10
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Рисунок 2. Качество поиска периферийных сайтов
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь
100
80
60
40
20
%
Здесь у поисковиков осталось гораздо больше места
для  роста, и  действительно, небольшими темпами,
но на протяжении всего 2013 года растут результаты
«Яндекса», Google и  Mail.ru в  анализаторе качества
поиска периферийный сайтов. Косвенно это может быть
связано с увеличением полноты индекса (мы посмотрим
на это позже) и с постепенным накоплением данных
о поведении пользователей в результатах поиска.
АНАЛИЗАТОР КАЧЕСТВА
ВНУТРИСАЙТОВОЙ НАВИГАЦИИ
Анализатор качества внутрисайтовой навигации оцени-
вает, насколько успешно поисковики понимают запросы,
направленныена поископределеннойстраницы(раздела)
сайта. Если пользователь указал, что конкретно ему
нужно на сайте, то главная страница будет почти столь
же нерелевантна, сколь любые другие. Зато нередко
удачным решением является показ сайтлинков — ссылок
на разделы сайта под ссылкой на основную страницу.
Лучше всех ссылки на разделы сайтов находит Google,
хотя его отрыв от «Яндекса» в 2013 году заметно сокра-
тился (рис. 3). В конце года значительно улучшил внутри­
сайтовуюнавигациюMail.ru.Yahooпоказываетрезультаты,
сравнимые с «Яндексом», а иногда и превосходящие его.
АНАЛИЗАТОР КАЧЕСТВА
ПОИСКА ПЕРСОН
Три самых популярных поисковика в  Рунете почти
одинаково хорошо справляются с поиском персональ-
ных сайтов (рис. 4), хотя первую половину 2013 года
с небольшим отрывом все же лидировал «Яндекс».
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
11
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Рисунок 3. Качество внутрисайтовой навигации
Рисунок 4. Качество поиска персон
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь
100
80
60
40
100
80
60
40
20
%
%
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
12
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ПЕРСОНАЛЬНЫХ БЛОГОВ
По принципу работы этот анализатор похож на анали-
затор качества поиска персональных сайтов: по запросу,
состоящему из имени и фамилии, поисковики должны
найти на первом месте блог человека, по крайней мере,
если именно этот блог — основная форма присутствия
человека в Интернете.
В феврале 2013 года запросы этого анализатора были
заменены на  более сложные: разыскиваются менее
известные люди, а  названия их блогов мало похожи
на их фамилии.
В  результате на  графике видно синхронное падение
ведущих поисковиков (рис. 5). Очевидно, что нахож-
дение блогов оказалось более сложной задачей, чем
поиск персональных сайтов: ни  одному поисковику
не удается найти более 80% блогов. «Яндексу» почти
весь год удавалось удерживать слабое лидерство,
хотя в  конце года Mail.ru приблизился к  нему почти
вплотную.
Рисунок 5. Качество поиска персональных блогов
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь
100
90
80
70
60
50
%
13
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Рисунок 6. Качество навигационного поиска в социальных сетях
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Август Сентябрь Октябрь Ноябрь Декабрь
100
80
60
40
20
0
%
АНАЛИЗАТОР КАЧЕСТВА НАВИГАЦИОННОГО ПОИСКА В СОЦИАЛЬНЫХ СЕТЯХ
Аудитория социальных сетей постоянно растет, и боль-
шинство пользователей Интернета так или иначе ими
пользуются. Вслед за пользователями туда переезжают
и представители бизнеса, и чем дальше, тем больше
примеров, когда бизнес не создает собственный сайт,
а использует группы и сообщества в соцсетях как свое
единственное представительство в Интернете.
В определенный момент таких примеров накопилось
достаточно, и в августе 2013 года был создан анализатор
качества навигационного поиска в социальных сетях.
Он оценивает умение поисковиков находить ссылки
на  официальные страницы организаций в  соцсетях
по названию компаний.
Оказалось, что «Яндекс» и  Google очень хорошо
справляются с  этой разновидностью навигационного
поиска (рис. 6), хотя примечательно, что начиная с лета
качество поиска постепенно снижалось и  достигло
уровня в 90%.
Куда более интересен скачок качества этого аспекта
поиска у Mail.ru. Можно предположить, что разработ-
чики в своем время не уделяли поиску в социальных
сетях достаточно внимания, но за несколько месяцев
работы анализатора смогли обучить поисковые алго-
ритмы и достичь приемлемого качества.
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
14
3.
КАЧЕСТВО ПОИСКА
ПО  ИНФОРМАЦИОН-
НЫМ ЗАПРОСАМ
ИНФОРМАЦИОННЫМИ ЗАПРОСАМИ НАЗЫ-
ВАЮТ ТЕ, С ПОМОЩЬЮ КОТОРЫХ ПОЛЬ-
ЗОВАТЕЛЬ ПЫТАЕТСЯ НАЙТИ КАКУЮ-ТО
ИНФОРМАЦИЮ: ОТВЕТ НА ВОПРОС, РЕШЕ-
НИЕ ПРОБЛЕМЫ, КАКОЙ-НИБУДЬ ТЕКСТ
И Т. П. УЖЕ ИЗ ЭТОГО ОПРЕДЕЛЕНИЯ
ВИДНО, ЧТО ТАКИЕ ЗАПРОСЫ БЫВАЮТ
ОЧЕНЬ РАЗНЫМИ, А ИХ ФОРМУЛИРОВКИ
НЕРЕДКО ДОВОЛЬНО РАСПЛЫВЧАТЫ.
СРЕДИ ПОИСКОВЫХ ЗАПРОСОВ ИНФОРМА-
ЦИОННЫЕ ВСТРЕЧАЮТСЯ ЧАЩЕ ВСЕГО.
Поскольку информационный поиск очень разнообразен,
оценить его качество достаточно сложно. В  большой
степени эту задачу решает асессорский анализатор: как
и  в  поиске в  целом, информационные запросы в  нем
преобладают. Но  оценить отдельные аспекты инфор-
мационного поиска можно, и  это делают анализаторы
соответствующей группы.
15
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
20
0
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ЦИТАТ
Цитатный поиск — один из самых простых для оцени-
вания аспектов информационного поиска. Если запрос
является точной цитатой из некоторого произведения,
по нему обязательно должен находиться либо источник
цитаты (полный текст произведения), либо хотя бы
название и автор. На сайте analyzethis.ru на вкладках
анализатора можно видеть, насколько часто поисковики
находят и  то и  другое по  отдельности, а  суммарный
результат анализатора  — доля найденных страниц,
где присутствует хотя бы что-нибудь одно.
Поисковики Рунета достаточно хорошо справляются
с  цитатным поиском, хотя еще есть что совершен-
ствовать (рис. 7). В  2013 году наибольших успехов
в этой области добился Mail.ru, занимающий с апреля
первое место.
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Рисунок 7. Анализатор качества поиска цитат
16
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА КРЫЛАТЫХ СЛОВ
Очевидно, что вводя в  поисковую строку какую-то
крылатую фразу, пользователь хочет узнать толкование
фразы или ее происхождение (автора и название про-
изведения, если это цитата из литературного произве-
дения), а не найти кучу текстов, где она используется.
Анализатор качества поиска крылатых фраз оценивает
поисковики по тому, какая доля найденных по таким
запросам страниц содержит указание на происхожде-
ние фразы (засчитываются как автор и название, так
и исходный текст произведения).
Примерно на  95% страниц из  результатов поиска
«Яндекса», Google и Mail.ru находятся нужные тексты
или ответы. Очень плохо с  поиском крылатых слов
у  Bing, ситуация ухудшается на  протяжении всего
2013 года.
Рисунок 8. Анализатор качества поиска крылатых слов
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
20
17
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Рисунок 9. Анализатор качества поиска ответов
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
60
40
20
0
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОТВЕТОВ
Одно из  важнейших умений любого поисковика  —
находить ответы на заданные вопросы. Для этого ана-
лизатора подобраны запросы, подразумевающие явный
ответ сразу на странице результатов поиска. Поэтому
результат анализатора зависит от того, насколько высоко
расположен сниппет с правильным ответом («хелперы»
засчитываются как первая позиция). Дополнительные
вкладки проверяют, в  том числе, и  наличие ответов
на страницах, найденных поисковиком.
По  результатам видно, что поисковикам есть что
улучшить в  этом аспекте поиска: качество показа
ответов на  вопросы можно оценить не  больше,
чем на  80% (рис. 9). Заметим, что в  поиске Mail.ru
в течение года ситуация даже немного ухудшалась.
В  то же время, четвертая вкладка анализатора
(на  сайте analyzethis.ru) говорит, что в  результатах
поиска лидеров ответы примерно на 95% вопросов
так или иначе найдутся.
18
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Рисунок 10. Анализатор качества поиска оригиналов
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
20
0
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОРИГИНАЛОВ НОВОСТЕЙ
Редкий владелец сайта будет обрадован, когда ори-
гинальный текст, опубликованный им на своем сайте,
оказывается без разрешения опубликован где-то
еще. Еще хуже, если при этом поисковые системы
показывают этот сворованный текст в  результатах
поиска выше оригинала. К сожалению, это очень рас-
пространенное явление.
Запросы созданного нами анализатора  — цитаты
из  текстов, сайт-первоисточник которых достоверно
известен. Анализатор ежедневно проверяет позиции
этих сайтов в  выдаче и  оценивает долю запросов,
по которым оригиналы находятся выше копий.
Лучше, чем в  других поисковиках, с  нахождением
оригиналов справляется Google (рис. 10). Удивительно,
но  Yahoo в  сентябре удалось обогнать и  «Яндекс»,
и Mail.ru, выйдя на второе место. К сожалению, каче-
ство поиска оригиналов обоих российских поисковиков
в течение года немного ухудшалось. Впрочем, с октября
у «Яндекса» наблюдается постепенное улучшение. Это
может быть связано с тем, что в конце октября было
снятоограничениена ТИЦдля программы«Оригинальные
тексты» (эта программа дает вебмастеру любого сайта
возможность до публикации на своем сайте загрузить
текст длиной не  менее 500 знаков в  базу «Яндекса»,
сообщив таким образом, какой именно сайт будет
для него первоисточником).
19
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА АДРЕСОВ
Весной 2013 года был запущен пятый анализатор
информационного поиска, оценивающий качество
нахождения адреса организации по  ее названию
и  географическому ориентиру. Очевидно, что поиск
адреса — достаточно частая ситуация, а значит, уме-
ние его находить довольно важно для  поисковиков.
Анализатор оценивает, насколько высоко поисковики
показывают нужный адрес на  странице выдачи, т.е.
в  хелперах и  сниппетах. Дополнительная вкладка
оценивает наличие адресов на найденных страницах.
Дела у поисковиков здесь обстоят не лучшим образом.
С момента публикации анализатора результаты лиде-
ров не только не росли, но даже немного снижались
(рис. 11). В итоге к концу года на первое место вышел
Google, но и его результат — всего 78%.
Рисунок 11. Анализатор качества поиска адресов
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
20
0
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
20
КАЧЕСТВО ПОИСКА
ПО  ТРАНЗАКЦИОН-
НЫМ ЗАПРОСАМ
СУЩЕСТВУЕТ ОЧЕНЬ МНОГО ВАРИ-
АНТОВ ТРАНЗАКЦИОННЫХ ЗАПРОСОВ.
ЭТО МОЖЕТ БЫТЬ ПОИСК ПЕСНИ ИЛИ
ФИЛЬМА, А МОЖЕТ — ДОСТАВКИ ЦВЕ-
ТОВ. ВСЕ ЭТИ ЗАПРОСЫ ОБЪЕДИНЯЕТ ТО,
ЧТО ОНИ ПОДРАЗУМЕВАЮТ КАКОЕ-ЛИБО
ДЕЙСТВИЕ: «СКАЧАТЬ», «ПОСЛУШАТЬ»,
«КУПИТЬ» И ПР.
Первый анализатор качества транзакционного поис-
ка появился в  конце 2012 года. По  своей сути это
навигационный анализатор, хотя речь и  идет о  тран-
закционных запросах. В начале 2013 этот анализатор
был разделен на два разных.
4.
21
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОФИЦИАЛЬНЫХ ВЕРСИЙ
ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
Анализатор качества поиска официальных версий ПО
оценивает способность поисковиков находить ссылки
на  официальные сайты разработчиков, где популяр-
ные программы можно скачать безопасно и легально.
Основная задача поисковиков — поставить эти сайты
выше сайтов-паразитов, собирающих трафик по таким
запросам. На  подобных сайтах пользователю будут
не только навязчиво показывать порой очень раздра-
жающую рекламу, но и могут при скачивании заразить
его компьютер различными вирусами.
С марта 2013 года, когда этот анализатор стал существо-
вать отдельно, поисковые машины улучшали качество
поиска официальных версий по  запросам, подраз-
умевающим скачиванием программ. У тройки лидеров
качество приблизилось к 85% (рис. 12). Интересно, что
Mail.ru, испытывавший проблемы с такими запросами
в течение года, смог к ноябрю снова догнать «Яндекс»
и Google.
Рисунок 12. Анализатор качества поиска официальных версий
программного  обеспечения
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
90
75
60
45
30
22
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОФИЦИАЛЬНЫХ ВЕРСИЙ КОНТЕНТА
Аналогичные проблемы возникают и  при поиске
контента: способность находить среди горы мусора
и сомнительных сайтов ссылки на официальные (или
хотя бы легальные) источники аудио и видео контен-
та и  ставить их на  первые места в  выдаче является
важным умением поисковика.
Анализатор официальных версий контента унаследовал
всю историю единого анализатора официальных версий,
существовавшего до марта 2013. Поэтому на его гра-
фике (рис. 13) заметно синхронное падение результатов
всех поисковиков в апреле: поиск легального контента
оказался гораздо более сложной задачей, чем поиск
сайтов разработчиков ПО.
Такие результаты показывают, что разделение
анализатора было правильным решением, ведь
новый анализатор отлично подчеркивает проблему.
Поисковики пока плохо справляются с  тысячами
сайтов-пустышек, на которых размещен нелегальный
контент, со всех сторон обвешанный рекламными
блоками. Более половины сайтов производителей
контента (киностудий, музыкальных групп и  т.  д.)
им вовсе неизвестны.
Рисунок 13. Анализатор качества поиска официальных версий контента
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
60
40
20
0
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
23
5.
ОТВЕТ ПОИСКОВОЙ МАШИНЫ НА ЗАПРОС
ДОЛЖЕН БЫТЬ НЕ ПРОСТО РЕЛЕВАНТНЫМ,
НО И АКТУАЛЬНЫМ. ПОИСКОВЫЕ РОБОТЫ
ДОЛЖНЫ ПОСТОЯННО СЛЕДИТЬ ЗА ИЗМЕ-
НЕНИЯМИ В ИНТЕРНЕТЕ И ОБНОВЛЯТЬ
СВОЙ ИНДЕКС В СООТВЕТСТВИИ С НИМИ.
СВЕЖИЕ РЕЗУЛЬТАТЫ ОСОБЕННО
ВАЖНЫ, ЕСЛИ РЕЧЬ ИДЕТ ОБ ИЗМЕ-
НЕНИЯХ, ПРОИЗОШЕДШИХ НЕ ТОЛЬКО
НА ВЕБ‑СТРАНИЦЕ, НО И В ЖИЗНИ.
АКТУАЛЬНОСТЬ
РЕЗУЛЬТАТОВ
ПОИСКА
24
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР АКТУАЛЬНОСТИ ПОИСКА: ДОЛЖНОСТИ
Каждую неделю десятки крупных российских компаний
меняют отдельных топ-менеджеров — и информация
об  этом довольно быстро появляется в  Интернете.
Понятно, что чем дольше человек работает в  новой
должности, тем больше в  Интернете источников,
содержащих правильную информацию. Но  первое
время после назначения перед поисковиками стоит
непростая задача: показать именно актуальную инфор-
мацию по  запросам вроде «генеральный директор
Группы Rail Garant» или «начальник Биробиджанской
таможни». Поэтому наши специалисты регулярно обнов-
ляют запросы анализатора актуальности должностей.
Естественно, после больших обновлений результаты
всех поисковиков падают.
В декабре 2013 года в рамках очередного обновления
были заменены все запросы анализатора. Реакция
поисковиков была предсказуемой, однако падение
результатов Mail.ru превзошло все ожидания (рис.  14).
Обновление списка запросов показало, что за  год
выдача поисковиков не стала лучше в том, что касается
актуальности: показатели качества поиска вернулись
на уровни начала года.
Рисунок 14. Анализатор актуальности поиска: должности
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
70
60
50
40
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
25
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР АКТУАЛЬНОСТИ ПОИСКА: ТЕЛЕФОНЫ
Анализатор актуальности результатов поиска теле-
фонов также оценивает свежесть поисковой выдачи,
но  использует другие запросы: название организа-
ций  + нередко, слово-уточнение «телефон». Смена
телефонов — явление не самое редкое и точно очень
болезненное, поэтому поисковикам важно быстро
реагировать на изменения такого рода.
Запросы этого анализатора тоже регулярно обновля-
ются, и снова в конце года на графике видны следы
такого обновления (рис. 15). Поначалу удивляет первое
место, Bing, ведь у  этого поисковика самая низкая
скорость индексации новых страниц (мы увидим это
на  следующем графике), но  на  самом деле, он про-
сто не  находит большей части телефонов и  потому
получает оценку лишь за малое количество запросов
с разумными результатами. «Яндекс», Google и Mail.ru
все еще не могут преодолеть планку в 70%.
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
90
80
70
60
50
Рисунок 15. Анализатор актуальности поиска: телефоны
26
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР СКОРОСТИ ИНДЕКСАЦИИ
Чтобы понять, насколько быстро могут обновляться
результаты поиска, нужно оценить скорость индексации
роботами новых страниц с сайтов. Для этого был соз-
дан анализатор скорости индексации, который узнает
о  появлении свежих страниц из  файлов sitemap.xml
на крупных, часто обновляемых сайтах.
Анализатор в  течение 30 дней проверяет, находится
ли данная страница в  поиске. Интересно, что за  30
дней в  Google попадают всего в  среднем 80% новых
страниц, а в «Яндекс» — всего 65% (рис. 16). В Mail.ru
в  первом полугодии были проблемы с  индексацией
новых страниц, но к сентябрю показатели сравнялись
с «Яндексом».
Этот анализатор дополнительно показывает, какая
доля новых страниц попала в индекс в течение первых
двух дней, в течение 3—6 дней, в первые две недели.
В  2012 году за  первые два дня в  индекс попадало
всего около 40% новых страниц. В  2013 году этот
показатель у «Яндекса» и Mail.ru немного, но вырос —
примерно до  45—50%. Результаты Google довольно
сильно колеблются, но в среднем, они недалеко ушли
от показателей прошлого года.
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
20
0
Рисунок 16. Анализатор скорости индексации
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
27
6.
ПО ДАННЫМ РАЗРАБОТЧИКОВ ПОИС-
КОВЫХ МАШИН, СРЕДНЯЯ ДЛИНА
­ПОИСКОВОГО ЗАПРОСА РАСТЕТ: В ПЕР-
ВУЮ ОЧЕРЕДЬ ЭТО ОЗНАЧАЕТ, ЧТО ДОЛЯ
ЗАПРОСОВ, СОСТОЯЩИХ ИЗ НЕСКОЛЬКИХ
СЛОВ БОЛЬШЕ, ЧЕМ ОДНОСЛОВНЫХ.
При этом, например, в «Яндексе», где средняя длина
запроса — 3,4 слова, более половины всех запросов
за месяц уникальны.*
Это значит, что поисковик должен справляться с самыми
разными запросами, а не только с наиболее частыми.
Для  этого нужно уметь широко трактовать запросы,
когда их смысл неоднозначен, и иметь большой охват
(полноту индекса), чтобы находить ответ даже на самые
специфические запросы.
ПОЛНОТА
И  ­РАЗНООБРАЗИЕ
РЕЗУЛЬТАТОВ
ПОИСКА
*Источник: информационный бюллетень «Пользователи Яндекса: интересы и поисковое поведение»
http://company.yandex.ru/researches/reports/2013/ya_search_interests_2013.xml
28
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР ПОЛНОТЫ ИНДЕКСА
Размер индекса  — показатель количества сайтов,
известных поисковику. Чем он полнее, тем меньше
запросов останется без ответа. Для оценки полноты
индекса мы подбираем специальные слова, которые
редко встречаются как в  поисковых запросах, так
и  на  сайтах в  Сети. Стоит отметить, что анализатор
оценивает индекс поисковиков относительно друг
друга, поскольку у  нас нет способа узнать обо всех
страницах в Интернете. Его значения можно считать
верхней оценкой доли страниц Рунета, известных
поисковикам.
В  2013 году относительная полнота индекса Mail.ru
достигла уровня «Яндекса» (рис. 17). Полнота остальных
поисковиков относительно друг друга в течение года
почти не менялась. К сожалению, судя по результатам,
даже занимающему первое место Google известно
не более 75% русскоязычных веб-страниц.
Рисунок 17. Анализатор полноты индекса
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
60
40
20
0
29
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Рисунок 18. Анализатор качества тематического поиска
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
50
40
30
20
10
АНАЛИЗАТОР КАЧЕСТВА ТЕМАТИЧЕСКОГО ПОИСКА
Анализатор тематического поиска оценивает способность
поисковых машин находить все сайты организаций,
соответствующих конкретному запросу. Например, мы
можем наверняка знать список «Глазных клиник в Уфе»
или «Российских производителей слюды», особенно,
имеющих свои сайты, и сравнить его с тем, что выдают
поисковики в ответ на эти запросы.
Оказывается, что сайты организаций по собирательным
запросам находятся плохо: даже у  лучшего с  точки
зрения тематического поиска Google результат — всего
35%, и  он только снижается. Это может показаться
странным, но только на первый взгляд.
На  самом деле, поисковики просто не  показывают
конкретные сайты организаций в  выдаче, а  находят
сайты-агрегаторы, содержащие информацию обо всех
подходящих компаниях, в  том числе, не  имеющих
страниц в  Интернете. Мы планируем изменить прин-
ципы работы анализатора, чтобы его результаты стали
более показательными.
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
30
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОМОНИМОВ
Мы считаем, что в результатах поиска по запросу, состо-
ящему из слова, имеющего несколько разных смыслов,
должны быть представлены страницы, отвечающие всем
значениям слова. Например, запрос «авангард» может
соответствовать как банку, так и движению в искусстве,
а  в  общем случае поисковик не  может точно знать,
какое из значений интересовало пользователя.
В 2013 году поисковики продемонстрировали довольно
близкое относительно друг друга качество поиска
по запросам-омонимам (рис. 19). Но в целом, ситуация
не  идеальна: результат меньше 80% означает, что
получив запрос, имеющий пять возможных смыслов,
поисковые машины не учтут хотя бы один из них.
Рисунок 19. Анализатор качества поиска омонимов
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
75
70
65
60
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
31
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР SEO-ПРЕССИНГА
Любой вебмастер или владелец сайта заинтересован
в увеличении посещаемости своего ресурса: на этом
и построена индустрия SEO. Для продвижения сайтов
в поисковиках иногда используются общие информа-
ционные запросы, вовсе не являющиеся ни коммерче-
скими, ни  напрямую относящимися к  данному сайту.
Примеров таких запросов много: «загар», «красота»,
«цветы» и  т.  д. В  результате поисковики испытывают
так называемый SEO-прессинг по  информационным
запросам.
Впрочем, сейчас стоит говорить о  том, что этот вид
SEO-прессинга остался в прошлом. Доля коммерческих
сайтов по общим запросам в поисковиках колеблется
от  15% до  30% (рис. 20), т.е. 1—3 сайта на  страницу
выдачи. Поскольку запросы довольно общие, такие
результаты выглядят вполне адекватно. Более того,
поисковики настолько хорошо справились с  этим
явлением, что мы приняли решение закрыть анали-
затор SEO-прессинга — впервые в истории проекта.
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
30
25
20
15
10
Рисунок 20. Анализатор уровня SEO-прессинга
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
32
7.
ПОИСК
ИЗ  ­РЕГИОНОВ
В 2010 ГОДУ «ЯНДЕКС» ПРЕДСТАВИЛ
ИССЛЕДОВАНИЕ РЕГИОНАЛЬНЫХ
ОСОБЕННОСТЕЙ ПОИСКА, В КОТОРОМ
ОТМЕЧАЛОСЬ, ЧТО ПРИМЕРНО 16%
ЗАПРОСОВ К ПОИСКОВИКУ ЯВЛЯЮТСЯ
РЕГИОНАЛЬНЫМИ, Т.Е. ВЫДАЧУ ПО НИМ
НУЖНО СТРОИТЬ ИСХОДЯ ИЗ ТОГО,
В КАКОМ ГОРОДЕ БЫЛ СДЕЛАН ЗАПРОС.
ЭТО ОЧЕНЬ ЗАМЕТНАЯ ДОЛЯ, КОТОРАЯ
С ТЕХ ПОР ЛИШЬ ПРОДОЛЖАЕТ РАСТИ.
ПОЭТОМУ КАЧЕСТВО ПОИСКА В РЕГИО-
НАХ — ДОСТАТОЧНО ВАЖНЫЙ АСПЕКТ.
33
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
60
40
20
0
АНАЛИЗАТОР РЕГИОНАЛЬНОГО ПОИСКА
Анализатор регионального поиска подсчитывает долю
региональных страниц в выдаче по таким информацион-
ным запросам, для которых географическое положение
пользователя очевидно значимо (например, «адреса
зоомагазинов» или «роллы доставка»).
Этот анализатор собирает данные с 2010 года, и все это
время было видно, что у Google в русском Интернете
очень плохо с геозависимостью: выдача несущественно
подстраивается под регион пользователя.
За  2013 год Google удалось значительно улучшить
этот аспект поиска: в  апреле он совершил скачок
более чем в  два раза, после чего продолжил рост.
Тем не менее, здесь он по-прежнему заметно отстает
от лидеров — «Яндекса» и Mail.ru.
Рисунок 21. Анализатор качества регионального поиска
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
34
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР КАЧЕСТВА РЕГИОНАЛЬНОГО НАВИГАЦИОННОГО ПОИСКА
Этотанализатор,каки общийанализаторнавигационного
поиска, проверяет нахождение сайта организации по ее
названию. Отличие же состоит в том, что должна найтись
страница регионального отделения или региональной
организации — своя для каждого из регионов. Например,
по запросу «избирательная комиссия» в Казани и Уфе
нужно показывать разные сайты.
Разумеется, поисковики, в основном, справляются с этой
задачей лучше, чем с  простым геопоиском: нужные
сайты известны и посещаемы, помогает и статистика
поведения пользователей. Только у  Mail.ru результа-
ты в  этом анализаторе ниже, но  и  они весь 2013 год
улучшались и  к  концу года достигли показателей
Google (рис. 22).
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
20
0
Рисунок 22. Качество регионального навигационного поиска
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
35
8.
ПОНИМАНИЕ
ЗАПРОСА
В ЭТОЙ ГРУППЕ ОБЪЕДИНЕНЫ АНАЛИ-
ЗАТОРЫ, ОЦЕНИВАЮЩИЕ, НАСКОЛЬКО
ПОИСКОВИКУ УДАЕТСЯ УГАДЫВАТЬ
НАМЕРЕНИЯ ПОЛЬЗОВАТЕЛЯ, КАКОЙ
БЫ СЛОЖНОЙ НИ БЫЛА ЭТА ЗАДАЧА.
КОНЕЧНО, ОТ ПОИСКОВИКОВ ТРУДНО
ТРЕБОВАТЬ ПОНИМАНИЯ СУТИ ФРАЗ
И СМЫСЛА СЛОВ, НО ПОДСКАЗАТЬ,
ИСПРАВИТЬ ОШИБКУ ТАМ, ГДЕ ЭТО
НУЖНО, ИЛИ СВЯЗАТЬ МЕЖДУ СОБОЙ
ПОХОЖИЕ ЗАПРОСЫ — ВСЕ ЭТО
­ПОИСКОВЫМ МАШИНАМ УЖЕ ПО СИЛАМ.
36
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
■ Bing ■ Google ■ Mail ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
95
90
85
80
АНАЛИЗАТОР КАЧЕСТВА ПОДСКАЗОК
Когда пользователь вводит поисковый запрос с  опе-
чаткой, поисковик должен это понять, или хотя бы
предположить и либо сформировать выдачу с добав-
лением найденного по  исправленному запросу, либо
полностью заменить запрос на правильный.
Анализатор качества подсказок оценивает количество
правильных подсказок (как в виде предположений, так
и  в  виде замен запроса), которые предлагает поис-
ковик, если задать запрос с ошибкой.
Три лидирующих поисковика очень хорошо коррек-
тируют ошибки пользователей: в  96 случаях из  100
им удается заметить и  исправить опечатку (рис. 23).
Результаты отстающего Bing не намного хуже.
Рисунок 23. Качество подсказок в  поиске
37
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
АНАЛИЗАТОР УСТОЙЧИВОСТИ К ОПЕЧАТКАМ В ЗАПРОСЕ
Если запрос с  опечаткой становится полностью бес-
смысленным, очевидно, что выдача по  нему должна
совпадать с выдачей по аналогичному вопросу, задан-
ному без ошибок. Анализатор сравнивает выдачу
по  ошибочному и  по  правильному запросам, считая
долю совпадающих страниц (чем больше, тем лучше).
В «Яндексе», Google и Mail.ru показатели практически
одинаковые: выдачи по запросам с ошибкой и без нее
совпадают на 95% (рис. 24).
Рисунок 24. Устойчивость к  опечаткам
38
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
70
60
50
Рисунок 25. Уровень похожести выдачи по  запросам-синонимам
АНАЛИЗАТОР ЗАПРОСОВ-СИНОНИМОВ
Под  запросами-синонимами мы понимаем в  первую
очередь не однословные запросы, которые являются
синонимичными, а  запросы, которые очень похожи
по сути, но различаются какой-нибудь мелочью: пере-
становкой слов, использованием сокращений вместо
слов, транслитерацией, добавлением бессмысленных
слов. В  таких случаях естественно ожидать, что раз-
личия в выдаче тоже будут минимальными, например,
по  запросам «годовщины свадьбы» и  «свадебные
годовщины», «карта города санкт петербург» и «карта
спб», «ремонт автомобилей мерседес» и «mercedes benz
ремонт». Анализатор оценивает, насколько совпадают
выдачи по таким парам запросов.
На графике (рис. 25) видно, что и у Google и у «Яндекса»
доля различных страниц в выдаче постепенно стано-
вится меньше, приближаясь к одной трети (четверти
в случае Google).
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
39
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
Сентябрь Октябрь Ноябрь Декабрь%
80
60
40
20
0
Рисунок 26. Качество поиска по  запросам с  числами
АНАЛИЗАТОР ПОИСКА ПО ЗАПРОСАМ С ЧИСЛАМИ
Группа поисковых запросов, в  которых встречаются
числа, достаточно велика. Очевидно, что поисковые
машины не  могут уделять числам мало внимания;
напротив, они должны обрабатывать такие запросы
с  повышенным вниманием. Ведь запросы «iphone 5»
и  «iphone 4»  — это принципиально разные запро-
сы, а  в  запросе «новопассит 200 мл цена» число 200
не должно путаться с ценой.
В  сентябре 2013 года мы добавили сразу два ана-
лизатора, отражающие умения поисковиков в  этой
области: анализатор поиска по  запросам с  числами
и анализатор поиска моделей.
Анализатор поиска по запросам с числами проверяет
каждую страницу из результатов поиска, чтобы понять
контекст вхождения числа из  запроса в  текст стра-
ницы. Чем больше доля страниц, где число найдено
«по делу», тем лучше.
Оказалось, что даже у лидеров числа из запроса
встречаются в неправильном контексте на 20—30%
страниц, а иногда и просто случайно (рис. 26). С боль-
шой долей вероятности такие ответы можно, конечно,
считать нерелевантными.
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
40
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР ПОИСКА МОДЕЛЕЙ
Названия моделей — достаточно устойчивые сочета-
ния, особенно в Интернете, в связи с чем этот, по сути,
частный случай поиска по  запросам с  числами был
выделен в  отдельный анализатор. И  действительно,
с  поиском конкретных моделей техники или това-
ров поисковики ожидаемо справляются лучше, чем
по запросам с числами в целом.
В 85% случаев «Яндекс», Mail.ru и Bing находят именно
нужные модели, а  в  Google показатель даже выше
92% (рис. 27).
Рисунок 27. Качество поиска моделей
Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
41
9.
АНАЛИЗАТОРЫ
ОШИБОК
ОШИБКИ ПОИСКОВЫХ СИСТЕМ — ЭТО
В ПЕРВУЮ ОЧЕРЕДЬ ОБРАТНАЯ СТОРОНА
РАБОТЫ ПО ИНТЕРПРЕТАЦИИ САМЫХ
РАЗНООБРАЗНЫХ ЗАПРОСОВ ПОЛЬЗО-
ВАТЕЛЕЙ. ТАКИЕ ОШИБКИ МОГУТ БЫТЬ
ДОСТАТОЧНО СМЕШНЫМИ, НО НЕРЕДКО
МОГУТ И РАЗДРАЖАТЬ ПОЛЬЗОВАТЕЛЯ,
ОСОБЕННО ЕСЛИ ИЗ-ЗА НИХ ЕМУ НЕ УДА-
ЕТСЯ НАЙТИ НУЖНУЮ ИНФОРМАЦИЮ.
ЕСЛИ ГРУБЫХ ОШИБОК СТАНОВИТСЯ
СЛИШКОМ МНОГО, ПОЛЬЗОВАТЕЛЬ
МОЖЕТ ПЕРЕЙТИ НА ДРУГОЙ ПОИС-
КОВИК, ПОЭТОМУ РАЗРАБОТЧИКАМ
ВАЖНО СНИЗИТЬ КОЛИЧЕСТВО ОШИБОК
ДО ­ПРЕДЕЛА.
42
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
20
Рисунок 28. Количество ошибочных замен редких слов
АНАЛИЗАТОР ЗАМЕНЫ РЕДКИХ СЛОВ
Создавая анализатор редких запросов, мы отобра-
ли малоизвестные, но  существующие в  том числе
и  в  Интернете слова, и  оценили, насколько часто
поисковики неоправданно заменяют их похожими,
но более частотными. Анализатор проверяет наличие
искомых слов в показанных поисковиками сниппетах
и вычисляет долю тех, где нужное слово не встретилось.
Дополнительно вычисляется количество случаев, где
поисковик прямо заменил или предложил заменить
корректный с  точки зрения потенциального пользо-
вателя запрос.
К сожалению, в «Яндексе» и Mail.ru доля сниппетов
без искомого слова очень высока  — около 70%
(рис.  28). Google здесь смотрится лучше других,
но и его показатели не слишком удовлетворительны:
в 40% случаев сниппет не содержит искомого слова,
что часто означает некорректное исправление поис-
кового запроса.
43
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
100
80
60
40
20
Рисунок 29. Количество ошибочных замен редких фраз
АНАЛИЗАТОР ЗАМЕНЫ РЕДКИХ ФРАЗ
Если исправления запросов из одного малочастотного
слова можно объяснить тем, что вероятность ошибки
пользователя не намного меньше вероятности ввода
столь редкого запроса, то к словосочетаниям подоб-
ное объяснение не применимо. При этом поисковики
даже в многословных запросах часто заменяют слова,
которые кажутся им слишком редкими. Ошибочность
такой замены обычно видна невооруженным взгля-
дом (сравните результаты по  фразам «сверчок ахе-
та» и  «сверчок ах эта», предлагаемые «Яндексом»).
Разумеется, запрос в этом случае полностью теряет
смысл, а  это может довольно сильно раздражать
пользователей.
В  целом, ситуация здесь такая же, как и  с  ошибка-
ми в  редких словах: меньше всех ошибается Google,
результаты «Яндекс» и  Mail.ru примерно одинаковы
(рис.  29). При этом результаты поисковиков пред-
сказуемо лучше, чем в случае однословных запросов.
44
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР НЕРАЗРЫВНЫХ СЛОВОСОЧЕТАНИЙ
Словосочетания в поисковых запросах требуют особой
аккуратности при обработке поисковиками. С  одной
стороны, иногда отдельные слова полезно игнори-
ровать, с  другой  — необходимо уметь распознавать
сочетания слов, которые нельзя разделять.
Запросами этого анализатора являются словосочетания,
которые имеют конкретный смысл, теряющийся при
исключении любого из слов. Он оценивает, насколько
часто поисковикам удается сохранить словосочетание,
а с ним — и смысл запроса.
Возможно, специфика сложного русского языка
в данном случае сыграла Google на руку: он сохраняет
смысл неразрывных словосочетаний в  60% случаев,
в то время как «Яндекс» — только в 40% (рис. 30).
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
60
40
20
0
Рисунок 30. Качество поиска неразрывных словосочетаний
45
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР ПОИСКА ИМЕН
Сочетание имени и  фамилии  — частный случай при-
мера, когда нельзя разбить запрос на части, не поте-
ряв смысл. Однако мы выделили подобные запросы
в отдельный анализатор. Специальные запросы, конечно,
провоцируют поисковики на  ошибки, но  это лишь
способ подчеркнуть существующую проблему. Нужный
человек, обнаруженный в  результатах поиска,  — это
плюс для  поисковика, а  найденные однофамильцы,
тезки и прочие — очевидно, минус.
Лучше всех с поиском по именам справляется Google,
но  и  у  него всего 70% верных ответов (рис. 31). Чуть
меньше их у «Яндекса» — 65%. Удивительно, что качество
поиска имен в  поисковиках-лидерах в  течение года
только падало. Стабильно улучшает свои показатели
лишь поиск Mail.ru.
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
60
40
20
0
Рисунок 31. Качество поиска имен
46
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР ГРАММАТИКИ
Анализатор различения форм слов — один из самых
сложных среди созданных нами. Он появился в конце
февраля 2013 года, чтобы проиллюстрировать, что чем
умнее поисковая машина, тем больше в  ней будет
и ошибок, вызванных ошибочной трактовкой запроса.
«Анализатор грамматики»  — условное название.
Проверяется, конечно, не полная грамматика, а лишь
соответствие найденной конструкции  — исходной.
Например, по  запросу «двигатели на  паромах» поль-
зователь точно не хочет увидеть сайт про мойку дви-
гателя паром, а поисковики вопреки грамматическому
здравому смыслу все равно добавляют эти сайты
в результаты поиска.
Как видим, у  Google опять результаты лучше,
чем у  остальных  — более 60% правильно учтен-
ных форм слов (рис. 32), тогда как у  «Яндекса»
и  Mail.ru  — всего  40%.
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
80
60
40
20
0
Рисунок 32. Качество различения форм слов в  поиске
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
47
В ТО ВРЕМЯ КАК СМЫСЛОВЫЕ ОШИБКИ
ПОИСКОВИКА МОГУТ КАЗАТЬСЯ ПОЛЬ-
ЗОВАТЕЛЯМ ЗАБАВНЫМИ, ЕСТЬ ВЕЩИ,
КОТОРЫЕ НЕ ВЫЗЫВАЮТ НИЧЕГО, КРОМЕ
РАЗДРАЖЕНИЯ. РЕЧЬ ИДЕТ В ПЕРВУЮ
ОЧЕРЕДЬ О ПОКАЗЕ ЗАВЕДОМО БЕС-
СМЫСЛЕННОГО, НЕПРИЯТНОГО ИЛИ
ДАЖЕ ОПАСНОГО КОНТЕНТА В РЕЗУЛЬ-
ТАТАХ ПОИСКА. ДЛЯ РАБОТЫ НЕСКОЛЬ-
КИХ АНАЛИЗАТОРОВ ЭТОЙ ГРУППЫ
ИСПОЛЬЗУЮТСЯ СПЕЦИАЛЬНЫЕ ТЕХНО-
ЛОГИИ, РАЗРАБОТАННЫЕ КОМПАНИЕЙ
«АШМАНОВ И ПАРТНЕРЫ», НАПРИМЕР,
РАСПОЗНАВАНИЕ И КЛАССИФИКАЦИЯ
ПОИСКОВОГО СПАМА.
РАЗДРАЖАЮЩИЕ
ФАКТОРЫ
10.
48
КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ
АНАЛИЗАТОР СПАМА В ПОИСКОВОЙ ВЫДАЧЕ
Поисковый спам используют недобросовестные веб-
мастера, чтобы получить дополнительные переходы
на свой сайт из результатов поиска. Очень часто поль-
зователь не  может понять, что найденная страница
совершенно бесполезна, пока не  перейдет на  нее
из результатов поиска.
Типов поискового спама достаточно много (дорвей,
спам-каталог, псевдосайт и  т.  п.). Они различаются
используемыми методами, но  их все объединяет то,
что они созданы в  расчете на  роботов поисковых
машин, а не на людей.
Вычищение спама из  выдачи поисковиков проходит
с  переменным успехом. Например, Google удалось
за  2013 год снизить количество спама с  3% до  1,6%.
А вот в «Яндексе» количество явного спама наоборот
выросло до 2% по сравнению с 1% в начале года (рис. 33).
■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь%
8
6
4
2
0
Рисунок 33. Уровень поискового спама
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014
Aip otchet search_2014

More Related Content

Viewers also liked

поиск информации с использованием компьютера на зачёт
поиск информации с использованием компьютера на зачётпоиск информации с использованием компьютера на зачёт
поиск информации с использованием компьютера на зачётvfhbzgjnfgrbyf123456
 
информационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетинформационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетInno4ka2323
 
Search systems
Search systemsSearch systems
Search systemsKuznecov
 
информатика!!!!!!
информатика!!!!!!информатика!!!!!!
информатика!!!!!!Madischka
 
02 классификация документов
02 классификация документов02 классификация документов
02 классификация документовLidia Pivovarova
 
01 информационный поиск
01 информационный поиск01 информационный поиск
01 информационный поискLidia Pivovarova
 
методы поиска инф. в интернет
методы поиска инф. в интернетметоды поиска инф. в интернет
методы поиска инф. в интернетOlena Bashun
 
поисковые системы презентация ученика
поисковые системы презентация ученикапоисковые системы презентация ученика
поисковые системы презентация ученикаKuznecov
 
Поиск информации в интернете при помощи поисковых систем
Поиск информации в интернете при помощи поисковых системПоиск информации в интернете при помощи поисковых систем
Поиск информации в интернете при помощи поисковых системwerro33
 
информационный поиск в интернет
информационный поиск в интернет информационный поиск в интернет
информационный поиск в интернет Savua
 

Viewers also liked (12)

Open data
Open dataOpen data
Open data
 
поиск информации с использованием компьютера на зачёт
поиск информации с использованием компьютера на зачётпоиск информации с использованием компьютера на зачёт
поиск информации с использованием компьютера на зачёт
 
информационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернетинформационные и информационно поисковые системы интернет
информационные и информационно поисковые системы интернет
 
Как устроены поисковые системы
Как устроены поисковые системыКак устроены поисковые системы
Как устроены поисковые системы
 
Search systems
Search systemsSearch systems
Search systems
 
информатика!!!!!!
информатика!!!!!!информатика!!!!!!
информатика!!!!!!
 
02 классификация документов
02 классификация документов02 классификация документов
02 классификация документов
 
01 информационный поиск
01 информационный поиск01 информационный поиск
01 информационный поиск
 
методы поиска инф. в интернет
методы поиска инф. в интернетметоды поиска инф. в интернет
методы поиска инф. в интернет
 
поисковые системы презентация ученика
поисковые системы презентация ученикапоисковые системы презентация ученика
поисковые системы презентация ученика
 
Поиск информации в интернете при помощи поисковых систем
Поиск информации в интернете при помощи поисковых системПоиск информации в интернете при помощи поисковых систем
Поиск информации в интернете при помощи поисковых систем
 
информационный поиск в интернет
информационный поиск в интернет информационный поиск в интернет
информационный поиск в интернет
 

Similar to Aip otchet search_2014

Часть 1. диагностика работы правоохранительных органов РФ и выполнения ими по...
Часть 1. диагностика работы правоохранительных органов РФ и выполнения ими по...Часть 1. диагностика работы правоохранительных органов РФ и выполнения ими по...
Часть 1. диагностика работы правоохранительных органов РФ и выполнения ими по...KomitetGI
 
Оценка сайтов органов государственного и муниципального управления Алтайского...
Оценка сайтов органов государственного и муниципального управления Алтайского...Оценка сайтов органов государственного и муниципального управления Алтайского...
Оценка сайтов органов государственного и муниципального управления Алтайского...Anna Milyukova
 
Техническое задание на разработку АС "Контроль доступа"
Техническое задание на разработку АС "Контроль доступа"Техническое задание на разработку АС "Контроль доступа"
Техническое задание на разработку АС "Контроль доступа"Anatoly Simkin
 
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным  спектром и электромагнитная совместимость радиосистемУправление радиочастотным  спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистемSergey Vyazelenko
 
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем latokar
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)Masen Rollins
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)vikmanam45
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)unigujjar
 
Методические рекомендации по использованию Единой системы идентификации и аут...
Методические рекомендации по использованию Единой системы идентификации и аут...Методические рекомендации по использованию Единой системы идентификации и аут...
Методические рекомендации по использованию Единой системы идентификации и аут...Victor Gridnev
 

Similar to Aip otchet search_2014 (9)

Часть 1. диагностика работы правоохранительных органов РФ и выполнения ими по...
Часть 1. диагностика работы правоохранительных органов РФ и выполнения ими по...Часть 1. диагностика работы правоохранительных органов РФ и выполнения ими по...
Часть 1. диагностика работы правоохранительных органов РФ и выполнения ими по...
 
Оценка сайтов органов государственного и муниципального управления Алтайского...
Оценка сайтов органов государственного и муниципального управления Алтайского...Оценка сайтов органов государственного и муниципального управления Алтайского...
Оценка сайтов органов государственного и муниципального управления Алтайского...
 
Техническое задание на разработку АС "Контроль доступа"
Техническое задание на разработку АС "Контроль доступа"Техническое задание на разработку АС "Контроль доступа"
Техническое задание на разработку АС "Контроль доступа"
 
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным  спектром и электромагнитная совместимость радиосистемУправление радиочастотным  спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
 
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)
 
Методические рекомендации по использованию Единой системы идентификации и аут...
Методические рекомендации по использованию Единой системы идентификации и аут...Методические рекомендации по использованию Единой системы идентификации и аут...
Методические рекомендации по использованию Единой системы идентификации и аут...
 

Aip otchet search_2014

  • 1. 2 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕА Н А Л И Т И Ч ЕС К И Й ОБ ЗОР, 2 013 ГОД АВТОРЫ ОТЧЕТА: КОНСТАНТИН РОЩУПКИН, ЛЮДМИЛА КУДРЯВЦЕВА, СЕРГЕЙ ВАЛЬКОВСКИЙ
  • 2. СОДЕРЖАНИЕ О  ­компании «Ашманов и  ­партнеры»............................................................................... 4 ЧАСТЬ 1. 1. Качество поиска: критерии и  ­динамика......................................................................... 5 Независимая оценка качества поиска..................................................................................................................................................5 Что нового на Analyzethis.ru в 2013 году.............................................................................................................................................6 Как работают анализаторы качества поиска.....................................................................................................................................7 2. Качество поиска по  навигационным запросам.............................................................. 8 Анализатор качества навигационного поиска..................................................................................................................................9 Анализатор качества поиска периферийных сайтов.....................................................................................................................9 Анализатор качества внутрисайтовой навигации.........................................................................................................................10 Анализатор качества поиска персон....................................................................................................................................................10 Анализатор качества поиска персональных блогов....................................................................................................................12 Анализатор качества навигационного поиска в социальных сетях....................................................................................13 3. Качество поиска по  информационным запросам..........................................................14 Анализатор качества поиска крылатых слов...................................................................................................................................16 Анализатор качества поиска ответов..................................................................................................................................................17 Анализатор качества поиска оригиналов новостей.....................................................................................................................18 Анализатор качества поиска адресов.................................................................................................................................................19 4. Качество поиска по  транзакционным запросам............................................................19 Анализатор качества поиска официальных версий программного обеспечения........................................................21 Анализатор качества поиска официальных версий контента.................................................................................................22 5. Актуальность результатов поиска................................................................................. 23 Анализатор актуальности поиска: должности................................................................................................................................24 Анализатор актуальности поиска: телефоны...................................................................................................................................25 Анализатор скорости индексации.........................................................................................................................................................26 6. Полнота и  ­разнообразие результатов поиска............................................................... 27 Анализатор полноты индекса...................................................................................................................................................................28 Анализатор качества тематического поиска....................................................................................................................................29 Анализатор качества поиска омонимов.............................................................................................................................................30 Анализатор SEO-прессинга........................................................................................................................................................................31 7. Поиск из  ­регионов........................................................................................................... 32 Анализатор регионального поиска.......................................................................................................................................................33 Анализатор качества регионального навигационного поиска..............................................................................................34
  • 3. 2 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 8. Понимание запроса.......................................................................................................... 35 Анализатор качества подсказок.............................................................................................................................................................36 Анализатор устойчивости к опечаткам в запросе........................................................................................................................37 Анализатор запросов-синонимов...........................................................................................................................................................38 Анализатор поиска по запросам с числами.....................................................................................................................................39 Анализатор поиска моделей.....................................................................................................................................................................40 9. Анализаторы ошибок........................................................................................................41 Анализатор замены редких слов............................................................................................................................................................42 Анализатор замены редких фраз...........................................................................................................................................................43 Анализатор неразрывных словосочетаний........................................................................................................................................44 Анализатор поиска имен.............................................................................................................................................................................45 Анализатор грамматики..............................................................................................................................................................................46 10. Раздражающие факторы................................................................................................. 47 Анализатор спама в поисковой выдаче..............................................................................................................................................48 Анализатор «сайтов для взрослых» в поисковой выдаче........................................................................................................49 Анализатор качества семейного фильтра..........................................................................................................................................50 Анализатор рекламной нагрузки............................................................................................................................................................51 Анализатор порнорекламы........................................................................................................................................................................52 Анализатор вирусных угроз.......................................................................................................................................................................53 11. Общие ­характеристики поиска...................................................................................... 54 Асессорский анализатор.............................................................................................................................................................................55 Анализатор качества ­сниппетов.............................................................................................................................................................56 Анализатор апдейтов....................................................................................................................................................................................57 Анализатор скорости регионального поиска...................................................................................................................................58
  • 4. 3 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ ЧАСТЬ 2. 1. Основные ­события на  рынке поиска в  Рунете в  2013 году....................................... 59 Усиление государственного регулирования Рунета....................................................................................................................59 Возрастающая роль социальных сетей в экосистеме Интернета и в функционировании поисковиков..........60 Персонализация поисковых результатов...........................................................................................................................................61 Отказ поисковиков от модели «зеркало Интернета, в котором отражаются документы с сайтов»...................61 Мобильный поиск: другие проблемы, другие подходы.............................................................................................................62 Обострение конкуренции в области качества поиска................................................................................................................62 2. «Яндекс» в  2013  году...................................................................................................... 63 «Яндекс.Острова»............................................................................................................................................................................................63 Улучшение поиска картинок.....................................................................................................................................................................64 Продолжение работы по выходу на зарубежные рынки...........................................................................................................64 Покупка «Кинопоиска», усиление функционала, связанного с видео и кино................................................................64 Дистрибуция на мобильных платформах...........................................................................................................................................65 Ранжирование без ссылок.........................................................................................................................................................................65 Поисковое партнерство с ­Facebook.......................................................................................................................................................66 3. Google в  России в  2013 году.......................................................................................... 67 Новый гендиректор Google Россия........................................................................................................................................................68 Новый поисковый алгоритм Hummingbird.........................................................................................................................................68 Борьба со ссылочными биржами, в том числе российскими..................................................................................................68 Новое поколение устройств......................................................................................................................................................................69 4. Поиск Mail.ru в  2013 году............................................................................................... 70 Переход на собственный поиск...............................................................................................................................................................70 Ответы и информация в выдаче.............................................................................................................................................................70 Протоострова в выдаче go.mail.ru.........................................................................................................................................................70 Привлечение к сотрудничеству вебмастеров...................................................................................................................................71 Выход на глобальный рынок....................................................................................................................................................................71 Временное затишье в области дистрибуции...................................................................................................................................71 5. Резюме.............................................................................................................................. 72
  • 5. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 4 О  ­КОМПАНИИ «АШМАНОВ И  ­ПАРТНЕРЫ» Ежегодный аналитический отчет по качеству работы поисковых систем подготовлен компанией «Ашманов и партнеры». Материал основан на данных, получен- ных при помощи семейства анализаторов проекта AnalyzeThis. Анализаторы, разработанные компанией, позволяют с  высокой точностью оценивать, как с течением времени меняется качество работы основных поис- ковых систем русскоязычного сегмента Интернета. Создание этого уникального проекта стало возможным благодаря привлечению к работе лучших специали- стов в  области поисковых технологий и  лингвисти- ки, которые также занимаются реализацией новой вьетнамской поисковой системы Wada. Среди прочих разработок компании — сервисы, обе- спечивающие высококачественный семантический анализ контента. К  их числу относятся система управления репутацией в  Интернете «Крибрум», технология «Семантическое зеркало» и  другие. Компания «Ашманов и  партнеры» является одним из  лидеров российского рынка интернет-маркетинга. С 2001 года компания оказывает услуги по комплекс- ному продвижению брендов в Интернете, консалтингу и аналитике.
  • 6. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 5 ЧЕМ ДАЛЬШЕ, ТЕМ ПРОЧНЕЕ ПОИСКОВЫЕ СИСТЕМЫ УТВЕРЖДАЮТСЯ В РОЛИ НЕЗА- МЕНИМЫХ ПОМОЩНИКОВ В ПОВСЕДНЕВ- НОЙ ЖИЗНИ. ОТВЕТ НА ВОПРОС, РЕШЕ- НИЕ ПРОБЛЕМЫ ИЛИ ПРОСТО ПОИСК ИНФОРМАЦИИ — ИМЕННО К ЛЮБИМОМУ ПОИСКОВИКУ ОБРАТИТСЯ ЧЕЛОВЕК В ПЕРВУЮ ОЧЕРЕДЬ. НО ЕСЛИ ПРЕД- ЛОЖЕННЫЕ РЕЗУЛЬТАТЫ ПОКАЖУТСЯ НЕУДОВЛЕТВОРИТЕЛЬНЫМИ, ЧЕЛОВЕК ЛЕГКО ЗАДАCТ ТОТ ЖЕ ЗАПРОС В ДРУ- ГОМ ПОИСКОВИКЕ, КОТОРЫЙ МОЖЕТ СО ВРЕМЕНЕМ СТАТЬ «ЛЮБИМЫМ». НЕЗАВИСИМАЯ ОЦЕНКА КАЧЕСТВА ПОИСКА В условиях конкуренции качество поиска становится особенно важным, а  значит  — и  наличие объектив- ной его оценки. Конечно, сравнивать между собой поисковые системы можно по  принципу «нравится / не нравится», но гораздо интереснее выглядит сравне- ние, проведенное с использованием анализа и оценки результатов поиска по различным наборам запросов. Лингвисты и  разработчики компании «Ашманов и партнеры» создали методику, позволяющую автома- тически оценивать поисковые системы по различным характеристикам, и запустили летом 2007 года первые анализаторы качества поиска на  основе технологии сайтов-маркеров. КАЧЕСТВО ПОИСКА: КРИТЕРИИ И  ­ДИНАМИКА 1.ЧАСТЬ 1
  • 7. 6 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ С результатом работы анализаторов можно ознакомить- ся на  сайте проекта AnalyzeThis (www.analyzethis.ru). Сейчас эти анализаторы — единственный независимый тест качества поиска в Рунете. В 2010 году была запу- щена английская версия анализаторов. Все известные аналоги исследуют меньшее количество поисковых систем по меньшему числу критериев. В  2012 году сайт проекта был обновлен, анализато- ры были разбиты на  группы, что сделало просмотр результатов более удобным. Сегодня на AnalyzeThis ежедневно публикуются: ff результаты 40 анализаторов различных характе- ристик поиска; ff интегральный показатель качества поиска; ff асессорские оценки результатов поиска; ff количество переходов с результатов поиска на сайты по данным LiveInternet. В этом отчете изложены основные события и новости в  жизни поисковых машин и  описаны изменения в различных аспектах качества поиска за 2013 год. ЧТО НОВОГО НА ANALYZETHIS.RU В 2013 ГОДУ В  течение 2013 года на  Analyzethis.ru появилось шесть новых анализаторов, в нескольких анализаторах появились новые «вкладки» (результаты измерений дополнительных параметров). Некоторые изменения внедрены в уже существовавшие анализаторы. Так, анализатор поиска официальных версий был разделен на  два анализатора: поиск программного обеспечения и  поиск контента, в  анализаторе скоро- сти поиска добавлены вкладки с  дополнительными характеристиками распределения скорости загрузки, а  в  навигационном анализаторе втрое увеличено количество запросов. Основным нововведением стало изменение формулы расчета интегрального показателя качества поиска. Если раньше в  формуле все показатели поискови- ков нормировались в  промежутке между лучшим и  худшим, то с  февраля нормирование происходит от лучшего до нуля. В связи с этим на графике ана- лизатора общего качества поиска в феврале виден резкий скачок. Сразу три анализатора, появившихся в 2013 году — запро- сы с числами, поиск адресов, грамматика, — связаны с умением поисковых машин определять тип запроса и учитывать его при построении результатов поиска. Как всегда, в  течение года происходило регулярное обновление части запросов или маркеров к ним в раз- ных анализаторах. Например, заметное синхронное падение в  декабре 2013 всех поисковиков в  обоих анализаторах актуальности было связано с  полным обновлением запросов одного (должностей) и значи- тельным — другого (телефонов). В  2013 году поисковик Mail.ru полностью перешел на свой поисковый движок (ранее до трети запросов к  поисковику обрабатывалась с  помощью Google), в связи с чем из списка анализируемых поисковиков был убран тестовый Mail-beta. Также стоит отметить, что с графиков качества поиска за  2013 год в  этом отчете мы, как и  в  прошлом году, убрали «Рамблер», так как с  лета 2011 года на  этом портале работает поисковый движок «Яндекса», и результаты измерения для «Рамблера» и «Яндекса» практически совпадают.
  • 8. 7 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ КАК РАБОТАЮТ АНАЛИЗАТОРЫ КАЧЕСТВА ПОИСКА Каждый анализатор оценивает один из  аспектов качества поиска; большинство из них работает в авто- матическом режиме, хотя отдельные анализаторы требуют дополнительной ручной обработки. Анализатор задает всем поисковикам специально подобранный специалистами компании набор запросов, к которым почти всегда привязан набор маркеров, по присутствию (или отсутствию) которых в результатах поиска робот и оценивает выдачу. Маркером может быть конкретный сайт, страница или даже словосочетание — это зависит от того, что именно оценивает анализатор. Поисковая выдача по нескольким тысячам запросов фиксируется и оценивается ежедневно. Подробное описание работы анализаторов вы можете найти на  сайте www.analyzethis.ru или в  виде при- ложения к  первому аналитическому отчету «Поиск и контекстная реклама в Рунете 2008», который можно скачать на сайте www.ashmanov.com*. Все результаты работы анализаторов с  момента их публикации всегда можно посмотреть на  сайте www.analyzethis.ru, во многих случаях статистика доступна за 5 и более лет. *На странице www.ashmanov.com/company/news/i64
  • 9. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 8 ПОИСК ПО НАВИГАЦИОННЫМ ЗАПРО- САМ — ЭТО ПОИСК ОПРЕДЕЛЕННЫХ СТРАНИЦ И САЙТОВ В ИНТЕРНЕТЕ. НАПРИМЕР, ПО ЗАПРОСУ «СБЕРБАНК» ПОЛЬЗОВАТЕЛЬ, СКОРЕЕ ВСЕГО, ХОЧЕТ ПОЛУЧИТЬ ССЫЛКУ НА САЙТ СБЕРБАНКА. С ПОИСКОМ ПО ОБЫЧНЫМ НАВИГАЦИ- ОННЫМ ЗАПРОСАМ ВСЕ ПОИСКОВИКИ СПРАВЛЯЮТСЯ ОТЛИЧНО. ИНТЕРЕСНО ПОСМОТРЕТЬ ЧУТЬ ГЛУБЖЕ — НАПРИ- МЕР, НА ПОИСК ПО РЕГИОНАЛЬНЫМ НАВИГАЦИОННЫМ ЗАПРОСАМ ИЛИ НА ВНУТРИСАЙТОВУЮ НАВИГАЦИЮ. 2. КАЧЕСТВО ПОИСКА ПО  НАВИГАЦИОН- НЫМ ЗАПРОСАМ
  • 10. 9 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР КАЧЕСТВА НАВИГАЦИОННОГО ПОИСКА Навигационный поиск уже давно не является проблемой для поисковых машин. Накопленные данные о кликах пользователей позволяют выдавать ссылку на нужный сайт в ответ на почти любой навигационный запрос. В начале сентября 2013 года был полностью заменен набор запросов анализатора, кроме того, количество запросов было увеличено в три раза. В наборе появи- лись запросы с опечатками, неофициальные названия и названия сайтов в русской транскрипции. Тем не менее, качество навигационного поиска, измерен- ное анализаторами, у основных поисковиков Рунета — «Яндекса», Google и  Mail.ru  — почти не  изменилось и  по-прежнему редко опускается ниже 99% (рис. 1). Качество «навигации» в Yahoo, в среднем, равно при- мерно 97%, а в Bing этот показатель еще немного ниже. АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ПЕРИФЕРИЙНЫХ САЙТОВ Периферийные сайты — это малоизвестные, небольшие сайты, чаще всего, региональные. Качество поиска таких сайтов по навигационным запросам, очевидно, будет ниже, но  тем интереснее посмотреть на  результаты соответствующего анализатора (рис. 2). Рисунок 1. Качество навигационного поиска ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 95 90 85 80 %
  • 11. 10 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рисунок 2. Качество поиска периферийных сайтов Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 % Здесь у поисковиков осталось гораздо больше места для  роста, и  действительно, небольшими темпами, но на протяжении всего 2013 года растут результаты «Яндекса», Google и  Mail.ru в  анализаторе качества поиска периферийный сайтов. Косвенно это может быть связано с увеличением полноты индекса (мы посмотрим на это позже) и с постепенным накоплением данных о поведении пользователей в результатах поиска. АНАЛИЗАТОР КАЧЕСТВА ВНУТРИСАЙТОВОЙ НАВИГАЦИИ Анализатор качества внутрисайтовой навигации оцени- вает, насколько успешно поисковики понимают запросы, направленныена поископределеннойстраницы(раздела) сайта. Если пользователь указал, что конкретно ему нужно на сайте, то главная страница будет почти столь же нерелевантна, сколь любые другие. Зато нередко удачным решением является показ сайтлинков — ссылок на разделы сайта под ссылкой на основную страницу. Лучше всех ссылки на разделы сайтов находит Google, хотя его отрыв от «Яндекса» в 2013 году заметно сокра- тился (рис. 3). В конце года значительно улучшил внутри­ сайтовуюнавигациюMail.ru.Yahooпоказываетрезультаты, сравнимые с «Яндексом», а иногда и превосходящие его. АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ПЕРСОН Три самых популярных поисковика в  Рунете почти одинаково хорошо справляются с поиском персональ- ных сайтов (рис. 4), хотя первую половину 2013 года с небольшим отрывом все же лидировал «Яндекс». ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 12. 11 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рисунок 3. Качество внутрисайтовой навигации Рисунок 4. Качество поиска персон Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 100 80 60 40 20 % % ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 13. 12 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ПЕРСОНАЛЬНЫХ БЛОГОВ По принципу работы этот анализатор похож на анали- затор качества поиска персональных сайтов: по запросу, состоящему из имени и фамилии, поисковики должны найти на первом месте блог человека, по крайней мере, если именно этот блог — основная форма присутствия человека в Интернете. В феврале 2013 года запросы этого анализатора были заменены на  более сложные: разыскиваются менее известные люди, а  названия их блогов мало похожи на их фамилии. В  результате на  графике видно синхронное падение ведущих поисковиков (рис. 5). Очевидно, что нахож- дение блогов оказалось более сложной задачей, чем поиск персональных сайтов: ни  одному поисковику не удается найти более 80% блогов. «Яндексу» почти весь год удавалось удерживать слабое лидерство, хотя в  конце года Mail.ru приблизился к  нему почти вплотную. Рисунок 5. Качество поиска персональных блогов ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 90 80 70 60 50 %
  • 14. 13 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рисунок 6. Качество навигационного поиска в социальных сетях ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 0 % АНАЛИЗАТОР КАЧЕСТВА НАВИГАЦИОННОГО ПОИСКА В СОЦИАЛЬНЫХ СЕТЯХ Аудитория социальных сетей постоянно растет, и боль- шинство пользователей Интернета так или иначе ими пользуются. Вслед за пользователями туда переезжают и представители бизнеса, и чем дальше, тем больше примеров, когда бизнес не создает собственный сайт, а использует группы и сообщества в соцсетях как свое единственное представительство в Интернете. В определенный момент таких примеров накопилось достаточно, и в августе 2013 года был создан анализатор качества навигационного поиска в социальных сетях. Он оценивает умение поисковиков находить ссылки на  официальные страницы организаций в  соцсетях по названию компаний. Оказалось, что «Яндекс» и  Google очень хорошо справляются с  этой разновидностью навигационного поиска (рис. 6), хотя примечательно, что начиная с лета качество поиска постепенно снижалось и  достигло уровня в 90%. Куда более интересен скачок качества этого аспекта поиска у Mail.ru. Можно предположить, что разработ- чики в своем время не уделяли поиску в социальных сетях достаточно внимания, но за несколько месяцев работы анализатора смогли обучить поисковые алго- ритмы и достичь приемлемого качества.
  • 15. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 14 3. КАЧЕСТВО ПОИСКА ПО  ИНФОРМАЦИОН- НЫМ ЗАПРОСАМ ИНФОРМАЦИОННЫМИ ЗАПРОСАМИ НАЗЫ- ВАЮТ ТЕ, С ПОМОЩЬЮ КОТОРЫХ ПОЛЬ- ЗОВАТЕЛЬ ПЫТАЕТСЯ НАЙТИ КАКУЮ-ТО ИНФОРМАЦИЮ: ОТВЕТ НА ВОПРОС, РЕШЕ- НИЕ ПРОБЛЕМЫ, КАКОЙ-НИБУДЬ ТЕКСТ И Т. П. УЖЕ ИЗ ЭТОГО ОПРЕДЕЛЕНИЯ ВИДНО, ЧТО ТАКИЕ ЗАПРОСЫ БЫВАЮТ ОЧЕНЬ РАЗНЫМИ, А ИХ ФОРМУЛИРОВКИ НЕРЕДКО ДОВОЛЬНО РАСПЛЫВЧАТЫ. СРЕДИ ПОИСКОВЫХ ЗАПРОСОВ ИНФОРМА- ЦИОННЫЕ ВСТРЕЧАЮТСЯ ЧАЩЕ ВСЕГО. Поскольку информационный поиск очень разнообразен, оценить его качество достаточно сложно. В  большой степени эту задачу решает асессорский анализатор: как и  в  поиске в  целом, информационные запросы в  нем преобладают. Но  оценить отдельные аспекты инфор- мационного поиска можно, и  это делают анализаторы соответствующей группы.
  • 16. 15 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 20 0 АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ЦИТАТ Цитатный поиск — один из самых простых для оцени- вания аспектов информационного поиска. Если запрос является точной цитатой из некоторого произведения, по нему обязательно должен находиться либо источник цитаты (полный текст произведения), либо хотя бы название и автор. На сайте analyzethis.ru на вкладках анализатора можно видеть, насколько часто поисковики находят и  то и  другое по  отдельности, а  суммарный результат анализатора  — доля найденных страниц, где присутствует хотя бы что-нибудь одно. Поисковики Рунета достаточно хорошо справляются с  цитатным поиском, хотя еще есть что совершен- ствовать (рис. 7). В  2013 году наибольших успехов в этой области добился Mail.ru, занимающий с апреля первое место. ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Рисунок 7. Анализатор качества поиска цитат
  • 17. 16 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР КАЧЕСТВА ПОИСКА КРЫЛАТЫХ СЛОВ Очевидно, что вводя в  поисковую строку какую-то крылатую фразу, пользователь хочет узнать толкование фразы или ее происхождение (автора и название про- изведения, если это цитата из литературного произве- дения), а не найти кучу текстов, где она используется. Анализатор качества поиска крылатых фраз оценивает поисковики по тому, какая доля найденных по таким запросам страниц содержит указание на происхожде- ние фразы (засчитываются как автор и название, так и исходный текст произведения). Примерно на  95% страниц из  результатов поиска «Яндекса», Google и Mail.ru находятся нужные тексты или ответы. Очень плохо с  поиском крылатых слов у  Bing, ситуация ухудшается на  протяжении всего 2013 года. Рисунок 8. Анализатор качества поиска крылатых слов ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 20
  • 18. 17 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рисунок 9. Анализатор качества поиска ответов ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 60 40 20 0 АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОТВЕТОВ Одно из  важнейших умений любого поисковика  — находить ответы на заданные вопросы. Для этого ана- лизатора подобраны запросы, подразумевающие явный ответ сразу на странице результатов поиска. Поэтому результат анализатора зависит от того, насколько высоко расположен сниппет с правильным ответом («хелперы» засчитываются как первая позиция). Дополнительные вкладки проверяют, в  том числе, и  наличие ответов на страницах, найденных поисковиком. По  результатам видно, что поисковикам есть что улучшить в  этом аспекте поиска: качество показа ответов на  вопросы можно оценить не  больше, чем на  80% (рис. 9). Заметим, что в  поиске Mail.ru в течение года ситуация даже немного ухудшалась. В  то же время, четвертая вкладка анализатора (на  сайте analyzethis.ru) говорит, что в  результатах поиска лидеров ответы примерно на 95% вопросов так или иначе найдутся.
  • 19. 18 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рисунок 10. Анализатор качества поиска оригиналов ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 20 0 АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОРИГИНАЛОВ НОВОСТЕЙ Редкий владелец сайта будет обрадован, когда ори- гинальный текст, опубликованный им на своем сайте, оказывается без разрешения опубликован где-то еще. Еще хуже, если при этом поисковые системы показывают этот сворованный текст в  результатах поиска выше оригинала. К сожалению, это очень рас- пространенное явление. Запросы созданного нами анализатора  — цитаты из  текстов, сайт-первоисточник которых достоверно известен. Анализатор ежедневно проверяет позиции этих сайтов в  выдаче и  оценивает долю запросов, по которым оригиналы находятся выше копий. Лучше, чем в  других поисковиках, с  нахождением оригиналов справляется Google (рис. 10). Удивительно, но  Yahoo в  сентябре удалось обогнать и  «Яндекс», и Mail.ru, выйдя на второе место. К сожалению, каче- ство поиска оригиналов обоих российских поисковиков в течение года немного ухудшалось. Впрочем, с октября у «Яндекса» наблюдается постепенное улучшение. Это может быть связано с тем, что в конце октября было снятоограничениена ТИЦдля программы«Оригинальные тексты» (эта программа дает вебмастеру любого сайта возможность до публикации на своем сайте загрузить текст длиной не  менее 500 знаков в  базу «Яндекса», сообщив таким образом, какой именно сайт будет для него первоисточником).
  • 20. 19 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР КАЧЕСТВА ПОИСКА АДРЕСОВ Весной 2013 года был запущен пятый анализатор информационного поиска, оценивающий качество нахождения адреса организации по  ее названию и  географическому ориентиру. Очевидно, что поиск адреса — достаточно частая ситуация, а значит, уме- ние его находить довольно важно для  поисковиков. Анализатор оценивает, насколько высоко поисковики показывают нужный адрес на  странице выдачи, т.е. в  хелперах и  сниппетах. Дополнительная вкладка оценивает наличие адресов на найденных страницах. Дела у поисковиков здесь обстоят не лучшим образом. С момента публикации анализатора результаты лиде- ров не только не росли, но даже немного снижались (рис. 11). В итоге к концу года на первое место вышел Google, но и его результат — всего 78%. Рисунок 11. Анализатор качества поиска адресов ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 20 0
  • 21. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 20 КАЧЕСТВО ПОИСКА ПО  ТРАНЗАКЦИОН- НЫМ ЗАПРОСАМ СУЩЕСТВУЕТ ОЧЕНЬ МНОГО ВАРИ- АНТОВ ТРАНЗАКЦИОННЫХ ЗАПРОСОВ. ЭТО МОЖЕТ БЫТЬ ПОИСК ПЕСНИ ИЛИ ФИЛЬМА, А МОЖЕТ — ДОСТАВКИ ЦВЕ- ТОВ. ВСЕ ЭТИ ЗАПРОСЫ ОБЪЕДИНЯЕТ ТО, ЧТО ОНИ ПОДРАЗУМЕВАЮТ КАКОЕ-ЛИБО ДЕЙСТВИЕ: «СКАЧАТЬ», «ПОСЛУШАТЬ», «КУПИТЬ» И ПР. Первый анализатор качества транзакционного поис- ка появился в  конце 2012 года. По  своей сути это навигационный анализатор, хотя речь и  идет о  тран- закционных запросах. В начале 2013 этот анализатор был разделен на два разных. 4.
  • 22. 21 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОФИЦИАЛЬНЫХ ВЕРСИЙ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ Анализатор качества поиска официальных версий ПО оценивает способность поисковиков находить ссылки на  официальные сайты разработчиков, где популяр- ные программы можно скачать безопасно и легально. Основная задача поисковиков — поставить эти сайты выше сайтов-паразитов, собирающих трафик по таким запросам. На  подобных сайтах пользователю будут не только навязчиво показывать порой очень раздра- жающую рекламу, но и могут при скачивании заразить его компьютер различными вирусами. С марта 2013 года, когда этот анализатор стал существо- вать отдельно, поисковые машины улучшали качество поиска официальных версий по  запросам, подраз- умевающим скачиванием программ. У тройки лидеров качество приблизилось к 85% (рис. 12). Интересно, что Mail.ru, испытывавший проблемы с такими запросами в течение года, смог к ноябрю снова догнать «Яндекс» и Google. Рисунок 12. Анализатор качества поиска официальных версий программного  обеспечения ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 90 75 60 45 30
  • 23. 22 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОФИЦИАЛЬНЫХ ВЕРСИЙ КОНТЕНТА Аналогичные проблемы возникают и  при поиске контента: способность находить среди горы мусора и сомнительных сайтов ссылки на официальные (или хотя бы легальные) источники аудио и видео контен- та и  ставить их на  первые места в  выдаче является важным умением поисковика. Анализатор официальных версий контента унаследовал всю историю единого анализатора официальных версий, существовавшего до марта 2013. Поэтому на его гра- фике (рис. 13) заметно синхронное падение результатов всех поисковиков в апреле: поиск легального контента оказался гораздо более сложной задачей, чем поиск сайтов разработчиков ПО. Такие результаты показывают, что разделение анализатора было правильным решением, ведь новый анализатор отлично подчеркивает проблему. Поисковики пока плохо справляются с  тысячами сайтов-пустышек, на которых размещен нелегальный контент, со всех сторон обвешанный рекламными блоками. Более половины сайтов производителей контента (киностудий, музыкальных групп и  т.  д.) им вовсе неизвестны. Рисунок 13. Анализатор качества поиска официальных версий контента ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 60 40 20 0
  • 24. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 23 5. ОТВЕТ ПОИСКОВОЙ МАШИНЫ НА ЗАПРОС ДОЛЖЕН БЫТЬ НЕ ПРОСТО РЕЛЕВАНТНЫМ, НО И АКТУАЛЬНЫМ. ПОИСКОВЫЕ РОБОТЫ ДОЛЖНЫ ПОСТОЯННО СЛЕДИТЬ ЗА ИЗМЕ- НЕНИЯМИ В ИНТЕРНЕТЕ И ОБНОВЛЯТЬ СВОЙ ИНДЕКС В СООТВЕТСТВИИ С НИМИ. СВЕЖИЕ РЕЗУЛЬТАТЫ ОСОБЕННО ВАЖНЫ, ЕСЛИ РЕЧЬ ИДЕТ ОБ ИЗМЕ- НЕНИЯХ, ПРОИЗОШЕДШИХ НЕ ТОЛЬКО НА ВЕБ‑СТРАНИЦЕ, НО И В ЖИЗНИ. АКТУАЛЬНОСТЬ РЕЗУЛЬТАТОВ ПОИСКА
  • 25. 24 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР АКТУАЛЬНОСТИ ПОИСКА: ДОЛЖНОСТИ Каждую неделю десятки крупных российских компаний меняют отдельных топ-менеджеров — и информация об  этом довольно быстро появляется в  Интернете. Понятно, что чем дольше человек работает в  новой должности, тем больше в  Интернете источников, содержащих правильную информацию. Но  первое время после назначения перед поисковиками стоит непростая задача: показать именно актуальную инфор- мацию по  запросам вроде «генеральный директор Группы Rail Garant» или «начальник Биробиджанской таможни». Поэтому наши специалисты регулярно обнов- ляют запросы анализатора актуальности должностей. Естественно, после больших обновлений результаты всех поисковиков падают. В декабре 2013 года в рамках очередного обновления были заменены все запросы анализатора. Реакция поисковиков была предсказуемой, однако падение результатов Mail.ru превзошло все ожидания (рис.  14). Обновление списка запросов показало, что за  год выдача поисковиков не стала лучше в том, что касается актуальности: показатели качества поиска вернулись на уровни начала года. Рисунок 14. Анализатор актуальности поиска: должности Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 70 60 50 40 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 26. 25 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР АКТУАЛЬНОСТИ ПОИСКА: ТЕЛЕФОНЫ Анализатор актуальности результатов поиска теле- фонов также оценивает свежесть поисковой выдачи, но  использует другие запросы: название организа- ций  + нередко, слово-уточнение «телефон». Смена телефонов — явление не самое редкое и точно очень болезненное, поэтому поисковикам важно быстро реагировать на изменения такого рода. Запросы этого анализатора тоже регулярно обновля- ются, и снова в конце года на графике видны следы такого обновления (рис. 15). Поначалу удивляет первое место, Bing, ведь у  этого поисковика самая низкая скорость индексации новых страниц (мы увидим это на  следующем графике), но  на  самом деле, он про- сто не  находит большей части телефонов и  потому получает оценку лишь за малое количество запросов с разумными результатами. «Яндекс», Google и Mail.ru все еще не могут преодолеть планку в 70%. ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 90 80 70 60 50 Рисунок 15. Анализатор актуальности поиска: телефоны
  • 27. 26 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР СКОРОСТИ ИНДЕКСАЦИИ Чтобы понять, насколько быстро могут обновляться результаты поиска, нужно оценить скорость индексации роботами новых страниц с сайтов. Для этого был соз- дан анализатор скорости индексации, который узнает о  появлении свежих страниц из  файлов sitemap.xml на крупных, часто обновляемых сайтах. Анализатор в  течение 30 дней проверяет, находится ли данная страница в  поиске. Интересно, что за  30 дней в  Google попадают всего в  среднем 80% новых страниц, а в «Яндекс» — всего 65% (рис. 16). В Mail.ru в  первом полугодии были проблемы с  индексацией новых страниц, но к сентябрю показатели сравнялись с «Яндексом». Этот анализатор дополнительно показывает, какая доля новых страниц попала в индекс в течение первых двух дней, в течение 3—6 дней, в первые две недели. В  2012 году за  первые два дня в  индекс попадало всего около 40% новых страниц. В  2013 году этот показатель у «Яндекса» и Mail.ru немного, но вырос — примерно до  45—50%. Результаты Google довольно сильно колеблются, но в среднем, они недалеко ушли от показателей прошлого года. ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 20 0 Рисунок 16. Анализатор скорости индексации
  • 28. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 27 6. ПО ДАННЫМ РАЗРАБОТЧИКОВ ПОИС- КОВЫХ МАШИН, СРЕДНЯЯ ДЛИНА ­ПОИСКОВОГО ЗАПРОСА РАСТЕТ: В ПЕР- ВУЮ ОЧЕРЕДЬ ЭТО ОЗНАЧАЕТ, ЧТО ДОЛЯ ЗАПРОСОВ, СОСТОЯЩИХ ИЗ НЕСКОЛЬКИХ СЛОВ БОЛЬШЕ, ЧЕМ ОДНОСЛОВНЫХ. При этом, например, в «Яндексе», где средняя длина запроса — 3,4 слова, более половины всех запросов за месяц уникальны.* Это значит, что поисковик должен справляться с самыми разными запросами, а не только с наиболее частыми. Для  этого нужно уметь широко трактовать запросы, когда их смысл неоднозначен, и иметь большой охват (полноту индекса), чтобы находить ответ даже на самые специфические запросы. ПОЛНОТА И  ­РАЗНООБРАЗИЕ РЕЗУЛЬТАТОВ ПОИСКА *Источник: информационный бюллетень «Пользователи Яндекса: интересы и поисковое поведение» http://company.yandex.ru/researches/reports/2013/ya_search_interests_2013.xml
  • 29. 28 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР ПОЛНОТЫ ИНДЕКСА Размер индекса  — показатель количества сайтов, известных поисковику. Чем он полнее, тем меньше запросов останется без ответа. Для оценки полноты индекса мы подбираем специальные слова, которые редко встречаются как в  поисковых запросах, так и  на  сайтах в  Сети. Стоит отметить, что анализатор оценивает индекс поисковиков относительно друг друга, поскольку у  нас нет способа узнать обо всех страницах в Интернете. Его значения можно считать верхней оценкой доли страниц Рунета, известных поисковикам. В  2013 году относительная полнота индекса Mail.ru достигла уровня «Яндекса» (рис. 17). Полнота остальных поисковиков относительно друг друга в течение года почти не менялась. К сожалению, судя по результатам, даже занимающему первое место Google известно не более 75% русскоязычных веб-страниц. Рисунок 17. Анализатор полноты индекса ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 60 40 20 0
  • 30. 29 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рисунок 18. Анализатор качества тематического поиска Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 50 40 30 20 10 АНАЛИЗАТОР КАЧЕСТВА ТЕМАТИЧЕСКОГО ПОИСКА Анализатор тематического поиска оценивает способность поисковых машин находить все сайты организаций, соответствующих конкретному запросу. Например, мы можем наверняка знать список «Глазных клиник в Уфе» или «Российских производителей слюды», особенно, имеющих свои сайты, и сравнить его с тем, что выдают поисковики в ответ на эти запросы. Оказывается, что сайты организаций по собирательным запросам находятся плохо: даже у  лучшего с  точки зрения тематического поиска Google результат — всего 35%, и  он только снижается. Это может показаться странным, но только на первый взгляд. На  самом деле, поисковики просто не  показывают конкретные сайты организаций в  выдаче, а  находят сайты-агрегаторы, содержащие информацию обо всех подходящих компаниях, в  том числе, не  имеющих страниц в  Интернете. Мы планируем изменить прин- ципы работы анализатора, чтобы его результаты стали более показательными. ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 31. 30 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР КАЧЕСТВА ПОИСКА ОМОНИМОВ Мы считаем, что в результатах поиска по запросу, состо- ящему из слова, имеющего несколько разных смыслов, должны быть представлены страницы, отвечающие всем значениям слова. Например, запрос «авангард» может соответствовать как банку, так и движению в искусстве, а  в  общем случае поисковик не  может точно знать, какое из значений интересовало пользователя. В 2013 году поисковики продемонстрировали довольно близкое относительно друг друга качество поиска по запросам-омонимам (рис. 19). Но в целом, ситуация не  идеальна: результат меньше 80% означает, что получив запрос, имеющий пять возможных смыслов, поисковые машины не учтут хотя бы один из них. Рисунок 19. Анализатор качества поиска омонимов Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 75 70 65 60 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 32. 31 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР SEO-ПРЕССИНГА Любой вебмастер или владелец сайта заинтересован в увеличении посещаемости своего ресурса: на этом и построена индустрия SEO. Для продвижения сайтов в поисковиках иногда используются общие информа- ционные запросы, вовсе не являющиеся ни коммерче- скими, ни  напрямую относящимися к  данному сайту. Примеров таких запросов много: «загар», «красота», «цветы» и  т.  д. В  результате поисковики испытывают так называемый SEO-прессинг по  информационным запросам. Впрочем, сейчас стоит говорить о  том, что этот вид SEO-прессинга остался в прошлом. Доля коммерческих сайтов по общим запросам в поисковиках колеблется от  15% до  30% (рис. 20), т.е. 1—3 сайта на  страницу выдачи. Поскольку запросы довольно общие, такие результаты выглядят вполне адекватно. Более того, поисковики настолько хорошо справились с  этим явлением, что мы приняли решение закрыть анали- затор SEO-прессинга — впервые в истории проекта. ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 30 25 20 15 10 Рисунок 20. Анализатор уровня SEO-прессинга
  • 33. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 32 7. ПОИСК ИЗ  ­РЕГИОНОВ В 2010 ГОДУ «ЯНДЕКС» ПРЕДСТАВИЛ ИССЛЕДОВАНИЕ РЕГИОНАЛЬНЫХ ОСОБЕННОСТЕЙ ПОИСКА, В КОТОРОМ ОТМЕЧАЛОСЬ, ЧТО ПРИМЕРНО 16% ЗАПРОСОВ К ПОИСКОВИКУ ЯВЛЯЮТСЯ РЕГИОНАЛЬНЫМИ, Т.Е. ВЫДАЧУ ПО НИМ НУЖНО СТРОИТЬ ИСХОДЯ ИЗ ТОГО, В КАКОМ ГОРОДЕ БЫЛ СДЕЛАН ЗАПРОС. ЭТО ОЧЕНЬ ЗАМЕТНАЯ ДОЛЯ, КОТОРАЯ С ТЕХ ПОР ЛИШЬ ПРОДОЛЖАЕТ РАСТИ. ПОЭТОМУ КАЧЕСТВО ПОИСКА В РЕГИО- НАХ — ДОСТАТОЧНО ВАЖНЫЙ АСПЕКТ.
  • 34. 33 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 60 40 20 0 АНАЛИЗАТОР РЕГИОНАЛЬНОГО ПОИСКА Анализатор регионального поиска подсчитывает долю региональных страниц в выдаче по таким информацион- ным запросам, для которых географическое положение пользователя очевидно значимо (например, «адреса зоомагазинов» или «роллы доставка»). Этот анализатор собирает данные с 2010 года, и все это время было видно, что у Google в русском Интернете очень плохо с геозависимостью: выдача несущественно подстраивается под регион пользователя. За  2013 год Google удалось значительно улучшить этот аспект поиска: в  апреле он совершил скачок более чем в  два раза, после чего продолжил рост. Тем не менее, здесь он по-прежнему заметно отстает от лидеров — «Яндекса» и Mail.ru. Рисунок 21. Анализатор качества регионального поиска ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 35. 34 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР КАЧЕСТВА РЕГИОНАЛЬНОГО НАВИГАЦИОННОГО ПОИСКА Этотанализатор,каки общийанализаторнавигационного поиска, проверяет нахождение сайта организации по ее названию. Отличие же состоит в том, что должна найтись страница регионального отделения или региональной организации — своя для каждого из регионов. Например, по запросу «избирательная комиссия» в Казани и Уфе нужно показывать разные сайты. Разумеется, поисковики, в основном, справляются с этой задачей лучше, чем с  простым геопоиском: нужные сайты известны и посещаемы, помогает и статистика поведения пользователей. Только у  Mail.ru результа- ты в  этом анализаторе ниже, но  и  они весь 2013 год улучшались и  к  концу года достигли показателей Google (рис. 22). Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 20 0 Рисунок 22. Качество регионального навигационного поиска ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 36. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 35 8. ПОНИМАНИЕ ЗАПРОСА В ЭТОЙ ГРУППЕ ОБЪЕДИНЕНЫ АНАЛИ- ЗАТОРЫ, ОЦЕНИВАЮЩИЕ, НАСКОЛЬКО ПОИСКОВИКУ УДАЕТСЯ УГАДЫВАТЬ НАМЕРЕНИЯ ПОЛЬЗОВАТЕЛЯ, КАКОЙ БЫ СЛОЖНОЙ НИ БЫЛА ЭТА ЗАДАЧА. КОНЕЧНО, ОТ ПОИСКОВИКОВ ТРУДНО ТРЕБОВАТЬ ПОНИМАНИЯ СУТИ ФРАЗ И СМЫСЛА СЛОВ, НО ПОДСКАЗАТЬ, ИСПРАВИТЬ ОШИБКУ ТАМ, ГДЕ ЭТО НУЖНО, ИЛИ СВЯЗАТЬ МЕЖДУ СОБОЙ ПОХОЖИЕ ЗАПРОСЫ — ВСЕ ЭТО ­ПОИСКОВЫМ МАШИНАМ УЖЕ ПО СИЛАМ.
  • 37. 36 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ ■ Bing ■ Google ■ Mail ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 95 90 85 80 АНАЛИЗАТОР КАЧЕСТВА ПОДСКАЗОК Когда пользователь вводит поисковый запрос с  опе- чаткой, поисковик должен это понять, или хотя бы предположить и либо сформировать выдачу с добав- лением найденного по  исправленному запросу, либо полностью заменить запрос на правильный. Анализатор качества подсказок оценивает количество правильных подсказок (как в виде предположений, так и  в  виде замен запроса), которые предлагает поис- ковик, если задать запрос с ошибкой. Три лидирующих поисковика очень хорошо коррек- тируют ошибки пользователей: в  96 случаях из  100 им удается заметить и  исправить опечатку (рис. 23). Результаты отстающего Bing не намного хуже. Рисунок 23. Качество подсказок в  поиске
  • 38. 37 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex АНАЛИЗАТОР УСТОЙЧИВОСТИ К ОПЕЧАТКАМ В ЗАПРОСЕ Если запрос с  опечаткой становится полностью бес- смысленным, очевидно, что выдача по  нему должна совпадать с выдачей по аналогичному вопросу, задан- ному без ошибок. Анализатор сравнивает выдачу по  ошибочному и  по  правильному запросам, считая долю совпадающих страниц (чем больше, тем лучше). В «Яндексе», Google и Mail.ru показатели практически одинаковые: выдачи по запросам с ошибкой и без нее совпадают на 95% (рис. 24). Рисунок 24. Устойчивость к  опечаткам
  • 39. 38 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 70 60 50 Рисунок 25. Уровень похожести выдачи по  запросам-синонимам АНАЛИЗАТОР ЗАПРОСОВ-СИНОНИМОВ Под  запросами-синонимами мы понимаем в  первую очередь не однословные запросы, которые являются синонимичными, а  запросы, которые очень похожи по сути, но различаются какой-нибудь мелочью: пере- становкой слов, использованием сокращений вместо слов, транслитерацией, добавлением бессмысленных слов. В  таких случаях естественно ожидать, что раз- личия в выдаче тоже будут минимальными, например, по  запросам «годовщины свадьбы» и  «свадебные годовщины», «карта города санкт петербург» и «карта спб», «ремонт автомобилей мерседес» и «mercedes benz ремонт». Анализатор оценивает, насколько совпадают выдачи по таким парам запросов. На графике (рис. 25) видно, что и у Google и у «Яндекса» доля различных страниц в выдаче постепенно стано- вится меньше, приближаясь к одной трети (четверти в случае Google). ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 40. 39 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Сентябрь Октябрь Ноябрь Декабрь% 80 60 40 20 0 Рисунок 26. Качество поиска по  запросам с  числами АНАЛИЗАТОР ПОИСКА ПО ЗАПРОСАМ С ЧИСЛАМИ Группа поисковых запросов, в  которых встречаются числа, достаточно велика. Очевидно, что поисковые машины не  могут уделять числам мало внимания; напротив, они должны обрабатывать такие запросы с  повышенным вниманием. Ведь запросы «iphone 5» и  «iphone 4»  — это принципиально разные запро- сы, а  в  запросе «новопассит 200 мл цена» число 200 не должно путаться с ценой. В  сентябре 2013 года мы добавили сразу два ана- лизатора, отражающие умения поисковиков в  этой области: анализатор поиска по  запросам с  числами и анализатор поиска моделей. Анализатор поиска по запросам с числами проверяет каждую страницу из результатов поиска, чтобы понять контекст вхождения числа из  запроса в  текст стра- ницы. Чем больше доля страниц, где число найдено «по делу», тем лучше. Оказалось, что даже у лидеров числа из запроса встречаются в неправильном контексте на 20—30% страниц, а иногда и просто случайно (рис. 26). С боль- шой долей вероятности такие ответы можно, конечно, считать нерелевантными. ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 41. 40 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР ПОИСКА МОДЕЛЕЙ Названия моделей — достаточно устойчивые сочета- ния, особенно в Интернете, в связи с чем этот, по сути, частный случай поиска по  запросам с  числами был выделен в  отдельный анализатор. И  действительно, с  поиском конкретных моделей техники или това- ров поисковики ожидаемо справляются лучше, чем по запросам с числами в целом. В 85% случаев «Яндекс», Mail.ru и Bing находят именно нужные модели, а  в  Google показатель даже выше 92% (рис. 27). Рисунок 27. Качество поиска моделей Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 42. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 41 9. АНАЛИЗАТОРЫ ОШИБОК ОШИБКИ ПОИСКОВЫХ СИСТЕМ — ЭТО В ПЕРВУЮ ОЧЕРЕДЬ ОБРАТНАЯ СТОРОНА РАБОТЫ ПО ИНТЕРПРЕТАЦИИ САМЫХ РАЗНООБРАЗНЫХ ЗАПРОСОВ ПОЛЬЗО- ВАТЕЛЕЙ. ТАКИЕ ОШИБКИ МОГУТ БЫТЬ ДОСТАТОЧНО СМЕШНЫМИ, НО НЕРЕДКО МОГУТ И РАЗДРАЖАТЬ ПОЛЬЗОВАТЕЛЯ, ОСОБЕННО ЕСЛИ ИЗ-ЗА НИХ ЕМУ НЕ УДА- ЕТСЯ НАЙТИ НУЖНУЮ ИНФОРМАЦИЮ. ЕСЛИ ГРУБЫХ ОШИБОК СТАНОВИТСЯ СЛИШКОМ МНОГО, ПОЛЬЗОВАТЕЛЬ МОЖЕТ ПЕРЕЙТИ НА ДРУГОЙ ПОИС- КОВИК, ПОЭТОМУ РАЗРАБОТЧИКАМ ВАЖНО СНИЗИТЬ КОЛИЧЕСТВО ОШИБОК ДО ­ПРЕДЕЛА.
  • 43. 42 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 20 Рисунок 28. Количество ошибочных замен редких слов АНАЛИЗАТОР ЗАМЕНЫ РЕДКИХ СЛОВ Создавая анализатор редких запросов, мы отобра- ли малоизвестные, но  существующие в  том числе и  в  Интернете слова, и  оценили, насколько часто поисковики неоправданно заменяют их похожими, но более частотными. Анализатор проверяет наличие искомых слов в показанных поисковиками сниппетах и вычисляет долю тех, где нужное слово не встретилось. Дополнительно вычисляется количество случаев, где поисковик прямо заменил или предложил заменить корректный с  точки зрения потенциального пользо- вателя запрос. К сожалению, в «Яндексе» и Mail.ru доля сниппетов без искомого слова очень высока  — около 70% (рис.  28). Google здесь смотрится лучше других, но и его показатели не слишком удовлетворительны: в 40% случаев сниппет не содержит искомого слова, что часто означает некорректное исправление поис- кового запроса.
  • 44. 43 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 100 80 60 40 20 Рисунок 29. Количество ошибочных замен редких фраз АНАЛИЗАТОР ЗАМЕНЫ РЕДКИХ ФРАЗ Если исправления запросов из одного малочастотного слова можно объяснить тем, что вероятность ошибки пользователя не намного меньше вероятности ввода столь редкого запроса, то к словосочетаниям подоб- ное объяснение не применимо. При этом поисковики даже в многословных запросах часто заменяют слова, которые кажутся им слишком редкими. Ошибочность такой замены обычно видна невооруженным взгля- дом (сравните результаты по  фразам «сверчок ахе- та» и  «сверчок ах эта», предлагаемые «Яндексом»). Разумеется, запрос в этом случае полностью теряет смысл, а  это может довольно сильно раздражать пользователей. В  целом, ситуация здесь такая же, как и  с  ошибка- ми в  редких словах: меньше всех ошибается Google, результаты «Яндекс» и  Mail.ru примерно одинаковы (рис.  29). При этом результаты поисковиков пред- сказуемо лучше, чем в случае однословных запросов.
  • 45. 44 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР НЕРАЗРЫВНЫХ СЛОВОСОЧЕТАНИЙ Словосочетания в поисковых запросах требуют особой аккуратности при обработке поисковиками. С  одной стороны, иногда отдельные слова полезно игнори- ровать, с  другой  — необходимо уметь распознавать сочетания слов, которые нельзя разделять. Запросами этого анализатора являются словосочетания, которые имеют конкретный смысл, теряющийся при исключении любого из слов. Он оценивает, насколько часто поисковикам удается сохранить словосочетание, а с ним — и смысл запроса. Возможно, специфика сложного русского языка в данном случае сыграла Google на руку: он сохраняет смысл неразрывных словосочетаний в  60% случаев, в то время как «Яндекс» — только в 40% (рис. 30). ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 60 40 20 0 Рисунок 30. Качество поиска неразрывных словосочетаний
  • 46. 45 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР ПОИСКА ИМЕН Сочетание имени и  фамилии  — частный случай при- мера, когда нельзя разбить запрос на части, не поте- ряв смысл. Однако мы выделили подобные запросы в отдельный анализатор. Специальные запросы, конечно, провоцируют поисковики на  ошибки, но  это лишь способ подчеркнуть существующую проблему. Нужный человек, обнаруженный в  результатах поиска,  — это плюс для  поисковика, а  найденные однофамильцы, тезки и прочие — очевидно, минус. Лучше всех с поиском по именам справляется Google, но  и  у  него всего 70% верных ответов (рис. 31). Чуть меньше их у «Яндекса» — 65%. Удивительно, что качество поиска имен в  поисковиках-лидерах в  течение года только падало. Стабильно улучшает свои показатели лишь поиск Mail.ru. ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 60 40 20 0 Рисунок 31. Качество поиска имен
  • 47. 46 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР ГРАММАТИКИ Анализатор различения форм слов — один из самых сложных среди созданных нами. Он появился в конце февраля 2013 года, чтобы проиллюстрировать, что чем умнее поисковая машина, тем больше в  ней будет и ошибок, вызванных ошибочной трактовкой запроса. «Анализатор грамматики»  — условное название. Проверяется, конечно, не полная грамматика, а лишь соответствие найденной конструкции  — исходной. Например, по  запросу «двигатели на  паромах» поль- зователь точно не хочет увидеть сайт про мойку дви- гателя паром, а поисковики вопреки грамматическому здравому смыслу все равно добавляют эти сайты в результаты поиска. Как видим, у  Google опять результаты лучше, чем у  остальных  — более 60% правильно учтен- ных форм слов (рис. 32), тогда как у  «Яндекса» и  Mail.ru  — всего  40%. ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 80 60 40 20 0 Рисунок 32. Качество различения форм слов в  поиске
  • 48. КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 47 В ТО ВРЕМЯ КАК СМЫСЛОВЫЕ ОШИБКИ ПОИСКОВИКА МОГУТ КАЗАТЬСЯ ПОЛЬ- ЗОВАТЕЛЯМ ЗАБАВНЫМИ, ЕСТЬ ВЕЩИ, КОТОРЫЕ НЕ ВЫЗЫВАЮТ НИЧЕГО, КРОМЕ РАЗДРАЖЕНИЯ. РЕЧЬ ИДЕТ В ПЕРВУЮ ОЧЕРЕДЬ О ПОКАЗЕ ЗАВЕДОМО БЕС- СМЫСЛЕННОГО, НЕПРИЯТНОГО ИЛИ ДАЖЕ ОПАСНОГО КОНТЕНТА В РЕЗУЛЬ- ТАТАХ ПОИСКА. ДЛЯ РАБОТЫ НЕСКОЛЬ- КИХ АНАЛИЗАТОРОВ ЭТОЙ ГРУППЫ ИСПОЛЬЗУЮТСЯ СПЕЦИАЛЬНЫЕ ТЕХНО- ЛОГИИ, РАЗРАБОТАННЫЕ КОМПАНИЕЙ «АШМАНОВ И ПАРТНЕРЫ», НАПРИМЕР, РАСПОЗНАВАНИЕ И КЛАССИФИКАЦИЯ ПОИСКОВОГО СПАМА. РАЗДРАЖАЮЩИЕ ФАКТОРЫ 10.
  • 49. 48 КАЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИЗАТОР СПАМА В ПОИСКОВОЙ ВЫДАЧЕ Поисковый спам используют недобросовестные веб- мастера, чтобы получить дополнительные переходы на свой сайт из результатов поиска. Очень часто поль- зователь не  может понять, что найденная страница совершенно бесполезна, пока не  перейдет на  нее из результатов поиска. Типов поискового спама достаточно много (дорвей, спам-каталог, псевдосайт и  т.  п.). Они различаются используемыми методами, но  их все объединяет то, что они созданы в  расчете на  роботов поисковых машин, а не на людей. Вычищение спама из  выдачи поисковиков проходит с  переменным успехом. Например, Google удалось за  2013 год снизить количество спама с  3% до  1,6%. А вот в «Яндексе» количество явного спама наоборот выросло до 2% по сравнению с 1% в начале года (рис. 33). ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь% 8 6 4 2 0 Рисунок 33. Уровень поискового спама