КАЧЕСТВО ПОИСК А
    И ПОИСКОВЫЕ
    СИСТЕМЫ В РУНЕТЕ
    АНАЛИТИЧЕСКИЙ ОТЧЕТ, 2012 ГОД



2




    АВТОРЫ ОТЧЕТА:
    КОНСТАНТИН РОЩУПКИН,
    ЛЮДМИЛА КУДРЯВЦЕВА,
    СЕРГЕЙ ВАЛЬКОВСКИЙ
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ



       СОДЕРЖАНИЕ
       	     О компании «Ашманов и партнеры»..........................................................................4

       ЧАСТЬ 1
       1.	   Качество поиска: критерии и динамика.....................................................................5
                              ­
             Независимая оценка качества поиска...................................................................................................... 5
             Что нового на Analyzethis.ru в 2012 году.................................................................................................. 6
             Как работают анализаторы качества поиска............................................................................................ 7
       2.	   Качество поиска по навигационным запросам........................................................8
       3.	   Качество поиска по информационным запросам.................................................12
             Асессорский анализатор.......................................................................................................................... 12
             Ответы на вопросы................................................................................................................................... 12
             Цитаты и крылатые слова........................................................................................................................ 13
             Оригинальные источники информации................................................................................................. 14
       4.	   Качество поиска по транзакционным ­ апросам....................................................16
                                               з
       5.	   Актуальность результатов поиска...............................................................................18
             Актуальность должностей и телефонов................................................................................................. 18
             Скорость индексации............................................................................................................................... 19
2
       6.	   Полнота и ­ азнообразие результатов поиска.........................................................21
                       р
             Омонимы................................................................................................................................................... 21
             Давление оптимизаторов........................................................................................................................ 21
             Тематический поиск................................................................................................................................. 22
             Полнота индекса....................................................................................................................................... 22
       7.	   Поиск из ­ егионов........................................................................................................... 25
                      р
             Регионально-навигационный анализатор.............................................................................................. 25
             Анализатор регионального поиска......................................................................................................... 26
       8.	   Понимание запроса........................................................................................................ 28
             Качество подсказок.................................................................................................................................. 28
             Устойчивость к опечаткам....................................................................................................................... 28
       9.	   Анализаторы ошибок......................................................................................................31
       10.	 Анализаторы раздражающих факторов................................................................. 35
             Поисковый спам....................................................................................................................................... 35
             Уровень порнографии.............................................................................................................................. 35
             Качество семейного фильтра.................................................................................................................. 36
             Количество рекламы................................................................................................................................ 36
             Количество вирусов.................................................................................................................................. 37
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




11.	 Общие характеристики поиска................................................................................... 40
       Скорость поиска.......................................................................................................................................40
       Апдейты.....................................................................................................................................................40
       Качество сниппетов.................................................................................................................................. 41

ЧАСТЬ 2
1.	    Основные события на рынке поиска в Рунете в 2012 году............................... 44
       Политизация Рунета и рост участия государства в его развитии........................................................44
       Рост использования Интернета с мобильных устройств....................................................................... 45
       Обострение соперничества в области дистрибуции сервисов............................................................ 45
       Персонализация поиска...........................................................................................................................46
       Интеграция социальных сетей в поисковые системы...........................................................................46
2.	    «Яндекс» в 2012 году.......................................................................................................47
       Отношения с государством..................................................................................................................... 47
       Реформа структуры управления в компании......................................................................................... 47
       Программа ПСИ........................................................................................................................................48
       Мобильные сервисы, связанные с поиском...........................................................................................48
       Персонализация результатов поиска......................................................................................................48
       Развитие микроразметки......................................................................................................................... 49
                                                                                                                                                                        3
       Поисковые сервисы для научных проектов........................................................................................... 49
       Мировая экспансия.................................................................................................................................. 49
3.	    Google в 2012 году........................................................................................................... 50
       Новая глобальная стратегия.................................................................................................................... 50
       Застой на российском рынке................................................................................................................... 51
       Персонализация поиска........................................................................................................................... 52
       Семантический поиск и факты в выдаче............................................................................................... 52
       Скандалы................................................................................................................................................... 53
4.	    Поиск Mail.ru в 2012 году.............................................................................................. 54
       Поиск для мобильных устройств............................................................................................................ 54
       Знания в выдаче....................................................................................................................................... 54
       Свой «Матрикснет»................................................................................................................................... 55
       Поиск по новостям и региональность.................................................................................................... 55
       Инструментарий для вебмастера............................................................................................................ 55
5.	    Социальные сети как игроки поискового рынка.................................................. 56
       Слухи о поиске Facebook......................................................................................................................... 56
       Расширение функционала поиска «ВКонтакте»..................................................................................... 57
6.	    Выводы................................................................................................................................ 58
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




О КОМПАНИИ
«АШМАНОВ
И ПАРТНЕРЫ»
4

       Ежегодный аналитический отчет по качеству          Среди прочих разработок компании — сервисы,
       работы поисковых систем подготовлен компа-         обеспечивающие высококачественный семантиче-
       нией «Ашманов и партнеры». Материал основан        ский анализ контента. К их числу относятся система
       на данных, полученных при помощи семейства         управления репутацией в Интернете «Крибрум»,
       анализаторов проекта AnalyzeThis.                  технология «Семантическое зеркало» и другие.

       Анализаторы, разработанные компанией, позволя-     Компания «Ашманов и партнеры» является одним
       ют с высокой точностью оценивать, как с течением   из лидеров российского рынка интернет-маркетинга.
       времени меняется качество работы основных          С 2001 года компания оказывает услуги по ком-
       поисковых сис тем русскоязычного сегмента          плексному продвижению брендов в Интернете,
       Интернета.                                         консалтингу и аналитике.

       Создание этого уникального проекта стало воз-
       можным благодаря привлечению к работе лучших
       специалистов в области поисковых технологий
       и лингвистики, которые также занимаются реа-
       лизацией новой вьетнамской поисковой системы
       Wada.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




ЧАСТЬ 1
                                                1.   КАЧЕСТВО
                                                     ПОИСКА:
                                                    ­К РИТЕРИИ
                                                     И ДИНАМИКА
                                                                                                 5

ЗНАЧИМОСТЬ И ПОПУЛЯРНОСТЬ                       и объективное сравнение различных параме-
ПОИСКОВЫХ СИСТЕМ В РОССИЙСКОМ                   тров работы поисковиков может представлять
СЕГМЕНТЕ ИНТЕРНЕТА РАСТЕТ ПО МЕРЕ               большой интерес не только для пользователей,
УВЕЛИЧЕНИЯ КОЛИЧЕСТВА ПОЛЬ-                     но и для специалистов, так или иначе связанных
ЗОВАТЕЛЕЙ И САЙТОВ. ПРИ ЭТОМ                    с индустрией интернет-поиска.
ПОВЫШАЕТСЯ И ТРЕБОВАТЕЛЬНОСТЬ
ПОЛЬЗОВАТЕЛЕЙ, КОТОРЫМ НЕРЕДКО                  В 2007 году специалисты компании «Ашманов
ОК АЗЫВАЮТСЯ ВА ЖНЫ ДА ЖЕ,                      и партнеры» разработали методику, позволяющую
НА ПЕРВЫЙ ВЗГЛЯД, НЕСУЩЕСТВЕН-                  автоматически оценивать различные аспекты
НЫЕ НЮАНСЫ РАБОТЫ ­ ОИСКОВИКОВ.
                    П                           работы поисковых систем и запустили проект
                                                AnalyzeThis (www.analyzethis.ru).

НЕЗАВИСИМАЯ ОЦЕНКА                              Сегодня AnalyzeThis — единственный независимый
КАЧЕСТВА ПОИСКА                                 источник достоверной информации о плюсах
                                                и минусах поисковиков Рунета. Существующие
Сами пользователи зачастую оценивают поис-      на западном рынке аналоги исследуют меньшее
ковые системы весьма субъективно, во многом —   количество поисковых систем по меньшему числу
под влиянием привычек. Потому качественное      критериев.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




       В состав AnalyzeThis входит 37 анализаторов, оце-   AnalyzeThis сравнивает все ведущие поисковики
       нивающих качество работы поисковиков Рунета         Рунета: Google, «Яндекс», Mail.ru, «Рамблер», Bing
       с разных точек зрения. Несмотря на то, что каждый   и Yahoo. С 2012 года из числа оцениваемых поис-
       анализатор соответствует конкретному аспекту,       ковиков исключен «Апорт», работающий на поис-
       некоторые из них весьма похожи. В то же время,      ковых алгоритмах «Яндекса».
       внутри одного анализатора может проводиться
       вычисление достаточно разных параметров. В таких    В этом отчете из графиков исключен и «Рамблер»,
       случаях у анализаторов появляются «вкладки».        чей поиск также обеспечивается «Яндексом», хотя
       Например, в Анализаторе поиска крылатых слов        выдача поисковиков иногда различается. Именно
       проверяется нахождение как текста, откуда пошло     поэтому, в частности, на сайте проекта оценки
       выражение, так и просто его названия и автора.      «Рамблера» пока остаются.

       Кроме того, у проекта есть особый анализатор,       Отдельный интерес представляют результаты
       не имеющий прямого отношения к работе поис-         поиска Mail.ru, чья выдача примерно на 60%
       ковиков, но отражающий ситуацию в сфере поис-       обеспечивается алгоритмами Google, в остальном
       ка в целом. Речь идет об Анализаторе переходов,     же — собственным движком. Доля этого поисковика
       вычисляющем количество переходов на различные       на рынке достаточно высока, а качество поиска,
       сайты со страниц поисковой выдачи, для чего         по нашим оценкам, заметно растет.
       используются данные счетчиков LiveInternet.

6      Наконец, AnalyzeThis предлагает целых два, пусть    ЧТО НОВОГО НА ANALYZETHIS.RU
       и не окончательных, ответа на вопрос, какой         В 2012 ГОДУ
       поисковик лучше. Этой цели служат Асессорский
       анализатор и Сводный показатель качества поиска.    Проект AnalyzeThis не стоит на месте: помимо
                                                           постоянного обновления и поддержки имеющихся
       Результаты первого — средние оценки выдачи,         анализаторов, регулярно появляются новые исследу-
       поставленные специально обученными людьми           емые параметры качества поиска, разрабатываются
       за релевантность и качество выданных поисковиком    новые алгоритмы и возможности.
       страниц; именно таким образом оценивают свою
       работу сами разработчики поисковиков.               Основным событием в работе проекта в 2012 году
                                                           стал произошедший в декабре запуск нового сайта
       Второе значение — сведение результатов всех         проекта. Обновление сайта было связано пре-
       качественных анализаторов в единый численный        имущественно с резким увеличением количества
       показатель с использованием нормировки и наших      анализаторов.
       представлений о значимости отдельных граней
       работы поиска. Стоит отметить, что коэффици-        Одним из результатов стало разделение ана-
       енты для вычисления этого параметра каждый          лизаторов на тематические группы в соответ-
       пользователь может изменить в соответствии со       ствии с оцениваемым аспектом поиска, при-
       своими представлениями о значимости конкрет-        чем для каждой группы вычисляется сводный
       ных показателей.                                    показатель качества. Как и в случае общего
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




сводного показателя, пользователи могут сами         Ежедневно каждый из поисковиков получает
определить значимость любого из входящих             по несколько тысяч запросов от анализаторов
в группу анализаторов.                               проекта.

Важным нововведением стал запуск Асессорского        Подробное описание работы анализаторов в целом
анализатора. Содержащий исключительно ручные         можно найти на сайте проекта (www.analyzethis.ru).
оценки, он стал альтернативным способом опреде-      Методы работы каждого из них описаны на соот-
ления «лучшего поисковика», учитывающим такие        ветствующих страницах портала. Результаты оценки
сложно оцениваемые автоматикой параметры,            поисковиков в любом из анализаторов доступны
как релевантность выдачи и качество страниц.         с момента его запуска, т.е. для части из них —
                                                     с 2007 года.
Одновременно с асессорским был запущен и пер-
вый анализатор, изучающий качество сниппетов.        В этом отчете изложены главные события в жизни
Пока что фрагменты страниц, представленные           поисковых машин и приведены изменения, про-
на странице выдачи, оцениваются только вручную.      изошедшие с разнообразными аспектами качества
                                                     поиска в 2012 году. Основная часть исследования
Наконец, целая серия «анализаторов ошибок»,          опирается на результаты работы анализаторов.
появившаяся в прошедшем году, заостряет вни-
мание на обратной стороне совершенствования
алгоритмов поисковиков, отвечающих за понима-
ние запроса. Неоправданные замены и деление                                                               7
неделимого — первые последствия этого процесса,
которые команде проекта удалось исследовать.


КАК РАБОТАЮТ АНАЛИЗАТОРЫ
КАЧЕСТВА ПОИСКА
Методика работы анализаторов весьма разнообраз-
на: от ручной оценки всех результатов до автомати-
ческой проверки наличия в выдаче нужного сайта.

Большая часть анализаторов использует систему
маркеров — элементов, соответствующих конкрет-
ным запросам (слова, веб-адреса, тексты). Маркеры
подбираются специалистами компании вместе
с запросами, после чего программе остается лишь
проверить наличие соответствующего маркера
в выдаче поисковика по запросу, реже — на самих
страницах, найденных поисковиком.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




2.
КАЧЕСТВО ПОИСКА
ПО НАВИГАЦИОН-
НЫМ ЗАПРОСАМ
8

       ЦЕЛЬ НАВИГАЦИОННЫХ ЗАПРОСОВ —                         Несмотря на то, что конкретный пользователь
       ПОИСК ОПРЕДЕЛЕННЫХ СТРАНИЦ                            может искать и другую информацию, соответству-
       В ИНТЕРНЕТЕ. ОСНОВНЫМИ СЛОЖНО-                        ющую запросу, показать официальную страницу
       СТЯМИ ЗДЕСЬ ЯВЛЯЮТСЯ РЕГИОНА ЛЬ-                      в выдаче принципиально важно. В большин-
       НАЯ НАВИГАЦИЯ (ПОИСК ПО ГЕО-                          стве случаев поисковики с такими запросами
       ЗАВИСИМЫМ ЗАПРОСАМ) И ПОИСК                          ­с правляются.
       ВНУ ТРЕННИХ СТРАНИЦ САЙТОВ.
                                                            Данные анализаторов показывают, что лишь у Google
       Навигационные запросы при этом могут быть            поиск внутренних страниц сайтов (внутрисайтовая
       довольно разнообразны: от поиска сайта круп-         навигация, рис. 5) находится на соответствующем
       ной корпорации (запрос сбербанк с целью найти        уровне — около 90%.
       sberbank.ru) до поиска конкретной страницы
       (озон аудио­к ниги, чтобы найти www.ozon.ru/         По остальным навигационным запросам результа-
       context/audiobook), от поиска блога с многоты-       ты всех поисковиков превышают 90% при поиске
       сячной аудиторией (татьяна толстая, чтобы найти      крупных организаций (рис. 1) и известных владель-
       tanyant.livejournal.com) до поиска сайта маленькой   цев персональных сайтов (рис. 2); и 80% — при
       региональной школы (моу сош 1 азнакаево, чтобы       поиске персональных блогов (рис. 3) и некрупных
       найти azn1.ucoz.ru).                                 региональных организаций (рис. 4).
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 1.  ысочайшее качество поиска по навигационным запросам
           В
           в поисковиках Рунета в 2012 году

   %     Январь   Февраль   Март   Апрель   Май    Июнь      Июль    Август   Сентябрь   Октябрь   Ноябрь   Декабрь

  100




   95




   90




   85




   80


        ■ Bing                ■ Google            ■ Mail                 ■ Yahoo                   ■ Yandex
                                                                                                                      9

Здесь следует сделать оговорку, что «все поискови-         Тройка лидеров сейчас регулярно получает стопро-
ки» употребляется в значении «все, кроме Yahoo»,           центные результаты, да и остальные недалеко от них
результаты которого заметно — и не в лучшую                ушли. Столь высокое качество поиска, восприни-
сторону — выделяются на фоне остальных. Дело               маемое сейчас как должное, на момент создания
скорее не в реальном качестве работы этого поис-           анализатора в 2007 году казалось недостижимым:
ковика, а в технических проблемах, с которыми              результаты варьировались от 90% до 30%. Этот
сталкиваются наши анализаторы при попытке                  рост легко проследить на графике анализатора
получить от Yahoo осмысленные результаты поиска.           «за все время» на analyzethis.ru.
К сожалению, те же проблемы испытывают и ана-
лизаторы других групп.

Поиск Yahoo действительно в большинстве слу-
чаев уступает конкурентам. Тем не менее, о его
реальном уровне стоит судить по высшим точкам
графиков его результатов: именно они соответствуют
моментам, когда выдача, получаемая анализатора-
ми, соответствовала тому, что видят пользователи
этого сервиса.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 2. Качество поиска персональных сайтов Рунета в 2012 году


          %     Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         100




         90




         80




          70




         60



10        Рис. 3.  ачество поиска персональных блогов по имени автора в 2012 году
                  К


          %     Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         100


         90


         80


          70


         60


         50


         40


               ■ Bing                ■ Google            ■ Mail              ■ Yahoo                   ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




 Рис. 4.  ачество поиска периферийных сайтов — сайтов некрупных,
         К
         часто региональных организаций, на которые мало ссылок,
         что усложняет их поиск. Анализатор создан летом 2012 года

 %             Август             Сентябрь          Октябрь              Ноябрь              Декабрь

100


90


80


 70


60


50


40

 Рис. 5.  ачество поиска внутренних страниц сайтов.
         К                                                                                                  11
         Анализатор, появившийся весной 2012 года

 %      Март        Апрель    Май        Июнь   Июль      Август   Сентябрь    Октябрь   Ноябрь   Декабрь

100


90


80


 70


60


50


40


      ■ Bing                 ■ Google           ■ Mail               ■ Yahoo                ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




3.
КАЧЕСТВО ПОИСКА
ПО ИНФОРМАЦИ-
ОННЫМ ЗАПРОСАМ
12

       К ИНФОРМАЦИОННОМУ ПОИСКУ                          информационными запросами (например, как
       ОТНОСИТСЯ ОЧЕНЬ ШИРОКИЙ                           оформить расписку, оценки около 0,9) и заметно
       К ЛАСС ЗАПРОСОВ, А ПОТОМУ ТАКИЕ                   хуже — с другими (близкие по смыслу слова к слову
       ЗАПРОСЫ ПРЕОБЛА ДАЮТ В ОБЩЕЙ                      «запас», оценки около 0,4).
       МАССЕ. АНА ЛИЗАТОРЫ ИЗУЧАЮТ
       К АЧЕСТВО ЦИТАТНОГО ПОИСК А
       И ПОИСК А КРЫЛАТЫХ СЛОВ, К АЧЕ-                   ОТВЕТЫ НА ВОПРОСЫ
       СТВО ПОИСК А ОРИГИНА ЛОВ ТЕКСТОВ
       И К АЧЕСТВО ОТВЕТОВ НА ВОПРОСЫ.                   Похожая ситуация наблюдается и в Анализаторе
                                                         ответов на вопросы. Список вопросов был специ-
                                                         ально подобран так, чтобы включать как «простые»
       АСЕССОРСКИЙ АНАЛИЗАТОР                            для ответа, так и более сложные. Сам анализатор
                                                         проверяет, насколько качественно поисковики
       Преобладание информационных запросов в общей      отвечают на вопросы (как явные, так и подраз-
       массе нашло свое отражение в Асессорском ана-     умеваемые), содержащиеся в запросе.
       лизаторе, где подобных запросов тоже боль-
       шинство. В результатах этого анализатора видно,   Оценки поисковиков вычисляются с четырьмя
       как поисковики хорошо справляются с одними        различными степенями строгости (ответы на най-
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 6.  ачество поиска ответов на вопросы в сниппетах поисковой выдачи
           К
           в 2012 году, с учетом позиций

   %    Январь   Февраль   Март   Апрель   Май     Июнь     Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

  80




  60




  40




  20




   0


       ■ Bing                ■ Google            ■ Mail                ■ Yahoo                   ■ Yandex
                                                                                                                    13

денных страницах или в найденных сниппетах,               были добавлены (и сделаны основными) вкладки,
и эти же параметры с учетом позиций). Поскольку           показывающие количество не только встречен-
очевидно, что в идеальной ситуации поисковик              ных в результатах поиска кусков исходных про-
должен выдавать правильный ответ на самой                 изведений, но и просто упоминаний названия
странице выдачи, и чем выше, тем лучше, оценка            и автора этих текстов.
именно этого параметра является основной.
                                                          С момента введения этих изменений результаты
Результаты всех поисковиков в течение 2012 года           ведущих поисковиков в обоих анализаторах
улучшались, однако значения вокруг 76% оставляют          были весьма стабильны: около 85% в цитатном
немало пространства для роста (рис. 6).                   (рис. 7) и около 95% в анализаторе поиска
                                                          крылатых слов (рис. 8). В обоих случаях наблю-
                                                          дался постепенный небольшой рост показателей
ЦИТАТЫ И КРЫЛАТЫЕ СЛОВА                                   «Яндекса», чу ть более заметный — у Mail.ru,
                                                          и весьма резкий — y Bing.
Анализаторы «Поиск цитат» и «Поиск крылатых
слов» исследуют другие аспекты информаци-
онного поиска — поиск источников цитаты или
выражения соответственно. Летом в оба из них
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 7.  ачество поиска цитат в поисковиках Рунета, с июня 2012 года —
                  К
                  новый метод анализа с учетом поиска источника цитаты

          %         Июнь      Июль         Август       Сентябрь       Октябрь       Ноябрь       Декабрь

         100



         80



         60



         40



         20



          0


               ■ Bing           ■ Google            ■ Mail                ■ Yahoo             ■ Yandex
14

       ОРИГИНАЛЬНЫЕ                                          Неожиданно слабые результаты поиска Mail.ru
       ИСТОЧНИКИ ИНФОРМАЦИИ                                  объясняются, вероятно, невысокой полнотой
                                                             индекса и сравнительно низкой скоростью индек-
       Не столько важный для пользователей поиска,           сации сайтов. Тем не менее, во втором полугодии
       сколько имеющий общее значение параметр —             2012 года этот поисковик показал серьезный
       умение выбирать сайт-первоисточник для рас-           рост (рис. 9).
       пространенного в Интернете текста. Анализатор
       оригиналов проверяет эту способность поисковых
       систем на примере новостных текстов, происхож-
       дение которых достоверно известно.

       Результаты работы анализатора показывают, что
       с самого начала 2012 года Google радикально
       улучшил этот аспект своей работы. В результате
       лидировавший предыдущие полтора года «Яндекс»
       был вытеснен с первой позиции. Впрочем, рос-
       сийская поисковая система тоже улучшила свои
       позиции по этому показателю.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




 Рис. 8.  ачество поиска крылатых слов, с июня 2012 года —
         К
         новый метод анализа с учетом поиска первоисточника

 %         Июнь           Июль            Август      Сентябрь       Октябрь            Ноябрь         Декабрь

100




80




60




40




20



 Рис. 9.  ачество поиска оригиналов новостей в поисковиках Рунета
         К                                                                                                           15
         в 2012 году

 %     Январь   Февраль   Март   Апрель      Май    Июнь    Июль    Август   Сентябрь   Октябрь   Ноябрь   Декабрь

80




60




40




20




 0


      ■ Bing                ■ Google               ■ Mail               ■ Yahoo                   ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




4.
КАЧЕСТВО ПОИСКА
ПО ТРАНЗАКЦИОН-
НЫМ ­ЗАПРОСАМ
16

      ТРАНЗАКЦИОННЫМИ НАЗЫВАЮТ                            запросам. Дополнительно учитываются и позиции,
      ЗАПРОСЫ, КОТОРЫЕ ПОДРАЗУМЕВАЮТ                      на которых найдены эталонные версии файлов.
      КАКОЕ-ЛИБО КОНКРЕТНОЕ ДЕЙСТВИЕ —
      ЗАГРУЗКУ ФАЙЛОВ, ПОКУПКУ БИЛЕТОВ,                   Результаты поисковиков в этом виде поиска оставля-
      ПРОСЛУШИВАНИЕ МУЗЫКИ И ПР.                          ют желать лучшего (рис. 10). В среднем поисковики
                                                          находят официальные источники для скачивания
                                                          контента всего в 50—55% случаев, а с учетом пози-
       В конце 2012 года в проекте AnalyzeThis появился   ции, на которой найден сайт, еще хуже – менее
       Анализатор поиска официальных версий, первым       чем в 53% случаев.
       исследующий качество поиска по транзакцион-
       ным запросам.                                      Это отчасти связано с популярностью порталов-
                                                          агрегаторов, которые одновременно хранят много
       В настоящий момент речь идет о получении           версий продуктов, пусть и неофициальных.
       доступа к определенному контенту (програм-
       мы, музыка, фильмы), про который заведомо          Лучше всего с транзакционными запросами обсто-
       известно, что в Интернете он доступен легально.    ят дела у Google, чуть хуже — у «Яндекса». Поиск
       Поэтому анализатор проверяет, что именно эти       Mail.ru в декабре значительно улучшил качество
       легальные версии находятся по соответствующим      поиска по транзакционным запросам.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 10.  ачество поиска официальных версий в поисковиках Рунета,
            К
            анализатор создан осенью 2012 года

   %              Октябрь                        Ноябрь                        Декабрь

  60




  50




  40




  30




  20


       ■ Bing               ■ Google         ■ Mail              ■ Yahoo            ■ Yandex
                                                                                                     17

Стоит отдельно отметить, что результаты поиска
программного обеспечения по транзакционным
запросам заметно выше, чем результаты поиска
музыки и фильмов. Вероятно, в дальнейшем эти
два вида контента будут разведены по разным
анализаторам.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




5.
АКТУАЛЬНОСТЬ
РЕЗУЛЬТАТОВ
ПОИСКА
18

      ОДНИМ ИЗ ВА ЖНЕЙШИХ ТРЕБО-                          ответ, к общему числу документов с правильным
      ВАНИЙ К ИНФОРМАЦИОННОМУ                             и неправильным ответами.
      ПОИСКУ ЯВЛЯЕТСЯ АКТ УА ЛЬНОСТЬ
      ЕГО РЕЗУЛЬТАТОВ. АНА ЛИЗАТОРЫ                       Разумеется, с течением времени все больше стра-
      ЭТОЙ ГРУППЫ ПРИЗВАНЫ ПОК А-                         ниц содержат правильные ответы, и все меньше —
      ЗАТЬ, НАСКОЛЬКО БЫСТРО ПОИС-                        неправильные, поэтому рост результатов в этом
      КОВИКИ РЕАГИРУЮТ НА ПРОИЗО-                         анализаторе естественен.
      ШЕДШИЕ ИЗМЕНЕНИЯ, К АК В ЖИЗНИ,
      ТАК И В СЕТИ.                                       Поскольку специалисты проекта регулярно заменяют
                                                          наборы запросов этих анализаторов, на графиках
                                                          образуются временные скачки вниз, после которых
       АКТУАЛЬНОСТЬ ДОЛЖНОСТЕЙ                            поисковики возвращают утраченные позиции.
       И ТЕЛЕФОНОВ
                                                          Таким образом, чтобы проследить, как меняется
       В настоящий момент доступны анализаторы акту-      актуальность выдачи поисковиков, стоит смотреть
       альности должностей (рис. 11) и актуальности       на минимумы графиков — и здесь прогресс заметен
       телефонов (рис. 12). Оба они вычисляют отношение   только у Mail.ru. Впрочем, это пока не помогло ему
       количества документов, содержащих правильный       обогнать «Яндекс» и Google.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 11.  ктуальность поиска по должностям в поисковиках Рунета
            А
            в 2012 году

   %    Январь   Февраль   Март   Апрель   Май    Июнь     Июль    Август   Сентябрь   Октябрь   Ноябрь   Декабрь

  85

  80

  75

  70

  65

  60

  55

  50


       ■ Bing                ■ Google            ■ Mail                ■ Yahoo                   ■ Yandex
                                                                                                                    19

СКОРОСТЬ ИНДЕКСАЦИИ                                       Стоит отметить, что незначительное ухудшение
                                                          результатов Google, заметное улучшение Mail.ru
Другим способом оценки актуальности поисковой             и возвращение «Яндекса» к уровню конца 2011
выдачи является изучения скорости индексации              года позволило всем троим лидерам оказать-
каждого из поисковиков. Для этого был создан              ся в шаге друг от друга по критерию скорости
специальный анализатор, работающий на осно-               индексации (рис. 13).
ве публикуемых крупными доменами файлов
sitemap.xml.

Как только на домене появляется новая страни-
ца, она добавляется в анализатор, после чего
определяется, на какой день после появления
страницы она попала в индексы каждого из поис-
ковиков. На сайте также доступны оценки того,
какая доля новых страниц попадает в индекс
в первый, второй и т. д. день. Так, оказалось,
что лишь около 40% страниц попадают в индекс
в первые два дня!
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 12. Актуальность поиска по телефонам в поисковиках Рунета
                   
                   в 2012 году

          %     Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         90




         80




          70




         60




         50



20        Рис. 13.  ачественная оценка скорости индексации новых страниц
                   К
                   поисковиками Рунета в 2012 году

          %     Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         100



         80



         60



         40



         20



          0


               ■ Bing                ■ Google            ■ Mail              ■ Yahoo                   ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




                                                        6.
                                                        ПОЛНОТА
                                                        И ­РАЗНООБРАЗИЕ
                                                        РЕЗУЛЬТАТОВ
                                                        ПОИСКА
                                                                                                        21

ТРЕБОВАНИЯ К ТОМУ, К АК ДОЛЖНА                      ОМОНИМЫ
ВЫГЛЯДЕТЬ ВЫДАЧА ПОИСКОВИКОВ,
ЗАВИСЯТ ОТ ТИПА ЗАПРОСА, КОТО-                      Количество различных смыслов, которые предлагают
РЫЙ МОЖЕТ БЫТЬ РЕДКИМ ИЛИ,                          поисковики по неоднозначным запросам, вычисляется
НАПРОТИВ, МНОГОЗНАЧНЫМ.                             в Анализаторе омонимов. Вот пример такого запро-
                                                    са: зенит — футбольный клуб, банк и фотоаппарат.
Так, если запросу соответствует лишь ограниченное
количество документов или объектов, необходимо      Результаты всех поисковиков здесь очень близки
показать их все. В то же время, по многозначному    (рис. 14), но для повышения разнообразия выдачи
запросу стоит выдать как можно более разно­         еще есть около 20 процентных пунктов.
образные результаты поиска, чтобы угодить любому
из пользователей вне зависимости от того, что
именно он имел в виду. При этом важно обратить      ДАВЛЕНИЕ ОПТИМИЗАТОРОВ
внимание на возможные трактовки запроса.
                                                    Анализатор SEO-прессинга вычисляет показате-
Разнообразие результатов поиска оценивается по      ли наполненности выдачи коммерческими стра-
разным параметрам: тематический поиск, поиск        ницами по запросам, не являющимся очевидно
омонимов, преобладание коммерческих сайтов.         коммерческими.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 14.  тепень разнообразия поисковой выдачи по запросам-омонимам
                   С
                   в поисковиках Рунета в 2012 году

          %     Январь   Февраль   Март   Апрель   Май    Июнь      Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         80




          70




         60




         50


               ■ Bing                ■ Google            ■ Mail                ■ Yahoo                   ■ Yandex
22

       Стоит отметить, что уровень от 20 до 30% у всех            которым может лишь ограниченное количество
       поисковиков (рис. 15) свидетельствует об адек-             объектов (например, музеи Омска).
       ватной доле коммерческих сайтов в выдаче. Тем
       не менее, речь может идти о простом устаревании            Особый интерес в связи с этим анализатором пред-
       тем, по которым созданы запросы анализатора,               ставляет тот факт, что в конце 2012 года Mail.ru
       а также о том, что в связи с постоянным развитием          за счет серьезного рывка обогнал по качеству этой
       методов работы оптимизаторов SEO-прессинг стал             стороны поиска своих конкурентов (рис. 16).
       менее агрессивным, но более вариативным.

                                                                  ПОЛНОТА ИНДЕКСА
       ТЕМАТИЧЕСКИЙ ПОИСК
                                                                  Одним из важнейших критериев качества поиско-
       Тематический анализатор проверяет, попадают ли             вика является полнота индекса, ведь чем больше
       официальные сайты искомых объектов в выдачу                страниц известно системе, тем больше запросов
       по соответствующему запросу.                               получат релевантные ответы.

       Для создания анализатора специалисты компании              Анализатор полноты сравнивает размеры индекса
       подбирали тематические запросы, соответствовать            поисковиков, используя очень редкие слова, встре-
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 15. Уровень «коммерции» в выдаче поисковиков Рунета в 2012 году


   %     Январь   Февраль   Март   Апрель   Май     Июнь   Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

  35



  30



  25



  20



   15



   10


        ■ Bing                ■ Google            ■ Mail              ■ Yahoo                   ■ Yandex
                                                                                                                   23

чающиеся в Интернете лишь на нескольких десятках
страниц. Таким образом достигается возможность
посчитать все страницы с определенным словом,
найденные конкретным поисковиком.

В 2012 году полнота индекса Google впервые стала
больше, чем у «Яндекса», а в определенные моменты
года — существенно ее превышала (рис. 17). В то
же время, полнота других иностранных поиско-
виков — Bing и Yahoo — остается крайне низкой.

Здесь же стоит обратить внимание на пока весьма
заметное отставание от лидеров Mail.ru. Вероятно,
это может оказывать влияние и на другие аспекты
работы этого поисковика.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 16. Качество тематического поиска в поисковиках Рунета в 2012 году


          %    Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         40




         30




         20




         10



24        Рис. 17. Полнота индекса поисковиков Рунета в 2012 году


          %    Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         80




         60




         40




         20




          0


              ■ Bing                ■ Google            ■ Mail              ■ Yahoo                   ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




                                                    7.
                                                        ПОИСК
                                                        ИЗ ­РЕГИОНОВ
                                                                                                         25

ПО ДАННЫМ «ЯНДЕКСА», ДОЛЯ ГЕО-                      Проект AnalyzeThis обладает специальной инфра-
ЗАВИСИМЫХ ЗАПРОСОВ СОСТАВЛЯЕТ                       структурой для оценки связанных с геозависи-
ДО 30%, ПОЭТОМУ УМЕНИЕ РАБОТАТЬ                     мостью аспектов поиска; кроме Москвы серверы
С НИМИ ЯВЛЯЕТСЯ ОДНИМ ИЗ ВА Ж-                      находятся в девяти городах России, от Владивостока
НЕЙШИХ ДЛЯ ПОИСКОВОЙ СИСТЕМЫ.                       до Краснодара; именно с них ежедневно задаются
                                                    запросы соответствующих анализаторов.

Одним из важных параметров поискового запроса
является геозависимость — или, наоборот, гео-       РЕГИОНАЛЬНО-НАВИГАЦИОННЫЙ
независимость. Очевидно, что результаты поиска      АНАЛИЗАТОР
по запросам вроде верховный суд россии или
рецепт суши не должны зависеть от того, из какого   Задачей Анализатора региональной навигации
города они заданы.                                  является проверка того факта, что по запросам,
                                                    нацеленным на поиск конкретной организации,
В то же время, для таких запросов как городской     находятся именно соответствующие региону стра-
суд или доставка суши расположение пользователя     ницы (региональные отделения партий, органы
становится принципиальным: кому в Новосибирске      власти субъектов федерации, региональные
интересна доставка суши в Новгороде?                порталы СМИ и т. д.).
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 18. Качество регионального навигационного поиска в поисковиках
                   
                   Рунета в 2012 году

          %    Январь   Февраль   Март   Апрель   Май    Июнь      Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         80




         60




         40




         20




          0


              ■ Bing                ■ Google            ■ Mail                ■ Yahoo                   ■ Yandex
26

       Здесь, в отличие от обычных навигационных ана-            ветствуют региону, но запросы в нем не подраз-
       лизаторов, не всегда важно показать искомую               умевают нахождения конкретных сайтов.
       страницу первой (выше может быть, например,
       основной сайт соответствующей организации),               Результаты проверяются по наличию в сниппетах
       но наличие региональной страницы в первой                 ключевых слов: названия города или региона,
       десятке безусловно необходимо.                            правильного телефонного кода и т. п. Таким
                                                                 образом подчеркивается не только важность
       Однако справляются с этой задачей поисковики              нахож дения результата из нужного региона,
       пока не блестяще: лучшие усредненные по всем              но и необходимость сделать региональную при-
       городам результаты — у «Яндекса» и Google —               надлежность страниц заметной.
       в районе 70% (рис. 18).
                                                                 В отличие от предыдущего анализатора, здесь рас-
                                                                 сматриваются в том числе и запросы из Москвы.
       АНАЛИЗАТОР                                                Как оказалось, и в этом случае существенная
       РЕГИОНАЛЬНОГО ПОИСКА                                      часть результатов относится к другим регионам.

       Анализатор регионального поиска также проверяет,          Стоит отметить превосходство «Яндекса» в этом
       что найденные поисковиками страницы соот-                 аспекте поиска — как в целом (рис. 19), так
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 19.  ревосходство «Яндекса» и рост Mail.ru в региональном поиске
            П
            в 2012 году

   %    Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

  80




  60




  40




  20




   0


       ■ Bing                ■ Google            ■ Mail              ■ Yahoo                   ■ Yandex
                                                                                                                  27

и в отдельных городах. Соответствующие графики
доступны на сайте analyzethis.ru.

Главной тенденцией в региональном поиске
в 2012 году стал заметный прогресс Mail.ru,
позволивший ему уже сейчас навязывать лидерам
борьбу, а по отдельным параметрам — и опе-
режать их.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




8.
ПОНИМАНИЕ
ЗАПРОСА
28

       РОБОТ НЕ ВСЕГДА МОЖЕТ ОТЛИЧИТЬ                       Безусловно, обратной стороной подобных действий
       КОРРЕКТНЫЙ ЗАПРОС ОТ НЕКОР-                          является появление ошибок интерпретации запроса,
       РЕКТНОГО. ПОЯВЛЕНИЕ ОШИБОК                           для изучения которых в 2012 году появилась целая
       ИНТЕРПРЕТАЦИИ ЗАПРОСОВ ПРИВЕЛО                       группа анализаторов. Однако ситуации, где коррекция
       К СОЗДАНИЮ В 2012 ГОДУ НОВОЙ                         заданного запроса необходима, встречаются куда чаще.
       ГРУППЫ АНА ЛИЗАТОРОВ.

                                                            УСТОЙЧИВОСТЬ К ОПЕЧАТКАМ
       КАЧЕСТВО ПОДСКАЗОК
                                                            Анализаторы ежедневно задают поисковикам
       К сожалению, задача оценить с помощью робота,        несколько сотен запросов с заведомыми опечат-
       насколько хорошо другой робот понимает человека,     ками, после чего вычисляют:
       пока не представляется решаемой. В то же время,
       некоторые параметры понимания достаточно легко       ff насколько часто были предложены (или даже
       проверить. Так, предложение человеку чуть изменить      произведены) правильные замены запроса;
       свой запрос, а иногда и автоматическое его изме-
       нение для достижения лучших результатов давно        ff насколько часто правильная форма встретилась
       стало одной из привычных функций поисковика.            в результатах поиска.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 20.  ысокий уровень качества подсказок в поисковиках Рунета
            В
            в 2012 году

   %    Январь   Февраль   Март   Апрель   Май   Июнь   Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

  100



  80



  60



  40



  20



   0



                                                                                                                29

Стоит отметить, что результаты по обоим параме-
трам недалеки от идеальных: более 90% у тройки
лидеров. Причем если предлагать качественные
подсказки поисковики умеют давно (рис. 20), то
умение находить при этом правильные формы в 2012
году заметно улучшилось (рис. 21). Отставание
Yahoo и Bing от лидеров заметно в обоих случаях,
и особенно — при поиске правильных слов.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 21.  овышение устойчивости к опечаткам поисковиков Рунета
                   П
                   в 2012 году

          %     Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         100




         80




         60




         40




         20


               ■ Bing                ■ Google            ■ Mail              ■ Yahoo                   ■ Yandex
30
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




                                                      9.
                                                       АНАЛИЗАТОРЫ
                                                       ОШИБОК
                                                                                                          31

ОБРАТНОЙ С ТОРОНОЙ ВЫСО-                          ошибок обычно превышают 50% (рис. 22 для слов
ЧАЙШИХ РЕ ЗУЛЬТАТОВ, ДЕМОН-                       и рис. 23 для фраз).
С ТРИРУЕМЫХ ПОИСКОВИК АМИ
В ПОНИМАНИИ ЗАПРОС А, ЯВЛЯЕ ТС Я                  Одной из распространенных ошибок является раз-
ПОЯВЛЕНИЕ БОЛЬШОГО КОЛИЧЕ-                        биение запроса на отдельные слова. Анализатор
С ТВА ОШИБОЧНЫХ ИНТЕРПРЕ ТАЦИЙ                    поиска имен (рис. 24) подчеркивает проблему
ПОИСКОВЫХ ЗАПРОСОВ. ДОПУ-                         на примере запросов, состоящих из имени и фами-
СК АЕМЫЕ ОШИБКИ ПОРОЙ МОГ У Т                     лии: поисковики регулярно находят страницы,
ПОК А ЗАТЬС Я СМЕШНЫМИ, А МОГ У Т                 где есть и имя, и фамилия из запроса, но отно-
И РА ЗДРА Ж АТЬ.                                  сящиеся к разным людям. Разумеется, подобные
                                                  действия ничуть не приближают пользователя
При вводе в поисковую строку достаточно редких    к поставленной цели.
слов (например, ботник, изоиония, магнитохрон)
или словосочетаний с редкими словами (например,   На графике (рис. 22) видно, что у Mail.ru и «Яндекса»
аэропорт гуари или княжество тубот) поисковики    очень высокая доля ошибок при замене редких
автоматически исправляют ошибочное на их взгляд   слов — больше 60%. У Google чуть лучше — менее
слово на более распространенное, но имеющее       50%. Но хуже всего у Yahoo — почти 90% таких
мало отношения к предмету поиска. Доли таких      ошибок.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 22. Уровень ошибочных замен редких слов в поисковиках Рунета
                   
                   (данные собираются с июня 2012 года)

          %         Июнь        Июль         Август        Сентябрь      Октябрь      Ноябрь       Декабрь

         100




         80




         60




         40




         20


               ■ Bing             ■ Google            ■ Mail                ■ Yahoo            ■ Yandex
32

       Меньше всего ошибок при замене редких фраз              Созданная в 2012 году группа «анализаторов оши-
       допускает Google — около 30%, хотя за послед-           бок» сразу же подчеркнула серьезную проблему
       ние несколько месяцев ситуация ухудшилась               в качестве работы поисковых систем. Работы
       (рис. 23). Совсем плохо с такими ошибками               по нахождению и систематизации других видов
       в поиске Yahoo — 85% ошибок. «Яндекс» и Mail.ru         ошибок в проекте AnalyzeThis будут продолжены.
       допускают ошибки при поиске редких фраз при-
       мерно в 60% случаев.

       Впрочем, словосочетания, не являющиеся именами,
       поисковики разбивают даже чаще. По отдельным
       сложным запросам можно не найти ни одной
       страницы, где связность была бы сохранена. И это
       при том, что такие документы заведомо есть.
       Google сохраняет связность примерно 60% сло-
       восочетаний, выступая, таким образом, заметно
       лучше конкурентов (рис. 25). Однако и ему есть
       куда расти. У «Яндекса» и Mail.ru результаты при-
       мерно одинаковы — около 40%.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




 Рис. 23. Уровень ошибочных замен словосочетаний, содержащих редкие
          
          слова, в поисковиках Рунета (данные собираются с августа 2012 года)

 %             Август        Сентябрь       Октябрь             Ноябрь           Декабрь

100




80




60




40




20



 Рис. 24.  ачество поиска имен в поисковиках Рунета
          К                                                                                      33
          (данные собираются с августа 2012 года)

 %             Август        Сентябрь       Октябрь             Ноябрь           Декабрь

80




60




40




20




 0


      ■ Bing            ■ Google        ■ Mail               ■ Yahoo           ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 25. Качество поиска неразрывных словосочетаний в поисковиках
                   
                   Рунета (данные собираются с октября 2012 года)

          %            Октябрь                   Ноябрь                Декабрь

         70

         60

         50

         40

         30

         20

         10

          0


              ■ Bing             ■ Google           ■ Mail   ■ Yahoo             ■ Yandex
34
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




                                                  10.
                                                      АНАЛИЗАТОРЫ
                                                      РАЗДРАЖАЮЩИХ
                                                      ФАКТОРОВ
                                                                                                     35

ПОЛЬЗОВАТЕЛИ Ж ДУ Т ОТ ПОИС-                      Интересной тенденцией является рост за второе
КОВИКОВ ВЫДАЧИ НА ВЕРХНИХ                         полугодие 2012 года показателей почти на 10%
ПОЗИЦИЯХ БОЛЕЕ К АЧЕСТВЕННЫХ                      у всех поисковых систем (рис. 26).
САЙТОВ, С МЕНЬШИМ КОЛИЧЕСТВОМ
РЕК ЛАМЫ, БЕЗ ВИРУСОВ И ПОРНО-                    В среднем «Яндексу» и Google удается удержи-
ГРАФИЧЕСКИХ БАННЕРОВ. ДЕЙСТВИЯ                    вать уровень поискового спама в пределах 6—7%.
ПОИСКОВИКОВ В ЭТОМ НАПРАВЛЕ-                      В Mail.ru поискового спама чуть больше, особенно
НИИ ДОСТАТОЧНО ЭФФЕКТИВНЫ,                        заметен прорыв в сентябре-ноябре, когда спам был
НО НЕ БЕЗОШИБОЧНЫ.                                заметен в 11% случаев.


ПОИСКОВЫЙ СПАМ                                    УРОВЕНЬ ПОРНОГРАФИИ
Специалисты компании «Ашманов и партнеры»         Важным результатом 2012 года стало резкое
плотно занимаются изучением и классификацией      уменьшение весной количества материалов
поискового спама, что позволяет соответствующе-   для взрослых в выдаче Google по «обычным»,
му анализатору оценивать долю этого серьезного    т.е. не подразумевающим однозначного пор-
раздражителя в выдаче каждого из поисковиков.     нографического контекста, запросам. Теперь
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 26. Количество поискового спама в поисковиках Рунета в 2012 году


          %     Январь   Февраль   Март   Апрель   Май       Июнь     Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

          20




          15




          10




           5


               ■ Bing                ■ Google            ■ Mail                  ■ Yahoo                   ■ Yandex
36

       его результаты находятся на уровне «Яндекса»                 КАЧЕСТВО СЕМЕЙНОГО ФИЛЬТРА
       и Mail.ru (рис. 27). В «Яндексе» и Mail.ru сайты
       для взрослых нежелательно встречаются в 6%                   При включенном «семейном фильтре» поисковики
       случаев.                                                     пока не научились достигать нулевых результатов,
                                                                    хотя качество фильтров за 2012 год немного улуч-
       Результаты работы анализатора качества семейного             шилось (рис. 28). Учитывая, что не ожидаемое
       фильтра показывают, что даже при жесткой филь-               пользователем порно является очень сильным раз-
       трации сайты для взрослых все равно появляются               дражающим фактором, назвать текущие результаты
       в поисковой выдаче.                                          приемлемыми все еще нельзя.

       Таких сайтов в наиболее популярных поисковых
       системах очень мало: в «Яндексе» — менее 1%,                 КОЛИЧЕСТВО РЕКЛАМЫ
       в Google — также примерно на уровне 1%. Чуть
       больше их в Mail.ru — в течение года было в среднем          Показатели рекламной нагрузки за 2012 год прак-
       3%, а к концу года уменьшилось до 1,43%.                     тически не изменились для всех поисковиков,
                                                                    хотя в течение года можно наблюдать синхрон-
       В Bing и Yahoo опасно много порносайтов в резуль-            ные скачки и падения (рис. 29). Сейчас средняя
       татах поиска.                                                рекламная загруженность страниц, находимых
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 27.  оличество «сайтов для взрослых» в выдаче по не явно
            К
            порнографическим запросам поисковиков Рунета в 2012 году

   %    Январь   Февраль   Март   Апрель   Май    Июнь      Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

  40




  30




  20




  10




   0


       ■ Bing                ■ Google            ■ Mail                ■ Yahoo                   ■ Yandex
                                                                                                                    37

лидерами поиска, оценивается в 10‑12 баллов.              но опасных сайтов из выдачи, по крайней мере,
Это соответствует одному большому рекламному              из первой ее страницы. Стоит признать, что таких
баннеру и одному-двум маленьким.                          сайтов и сейчас менее процента в выдаче абсо-
                                                          лютно всех поисковиков, причем их результаты
Количество порнорекламы за прошедший год еще              весьма близки (рис. 31).
немного уменьшилось. Любопытными и в этом слу-
чае являются почти синхронные скачки результатов
лидеров (рис. 30).


КОЛИЧЕСТВО ВИРУСОВ
Вероятно, самый опасный вид нежелательного
контента на страницах — вирусы. Несмотря на то,
что поисковики стараются предупреждать о воз-
можности заражения на сайте, одних предупреж-
дений часто оказывается недостаточно. Поэтому
желательным является исключение потенциаль-
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 28.  ачество работы семейного фильтра поисковиков Рунета
                   К
                   в 2012 году

          %    Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         40




         30




         20




         10




          0



38        Рис. 29.  ровень рекламной нагрузки на сайтах из поисковой выдачи
                   У
                   поисковиков Рунета в 2012 году

          %    Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         15




         10




          5


              ■ Bing                ■ Google            ■ Mail              ■ Yahoo                   ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




Рис. 30.  ровень порнорекламы на сайтах из поисковой выдачи
         У
         в поисковиках Рунета в 2012 году

 %     Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

3,5

3,0

2,5

2,0

1,5

1,0

0,5

 0



Рис. 31. Доля сайтов с вирусными угрозами в выдаче поисковиков Рунета                                            39
в 2012 году

 %     Январь   Февраль   Март   Апрель   Май    Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

2,5



2,0



1,5



1,0



0,5



 0


      ■ Bing                ■ Google            ■ Mail              ■ Yahoo                   ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




11.
ОБЩИЕ ХАРАКТЕ-
РИСТИКИ ПОИСКА
40

        В 2012 ГОДУ НА ANALYZETHIS.RU                        загрузки в среднем по всем запросам и различным
        ПОЯВИЛОСЬ НЕСКОЛЬКО НОВЫХ                            городам. Значения вычисляются в момент получения
        А
        ­ НА ЛИЗАТОРОВ, ДАЮЩИХ ПРЕД-                         результатов Анализатора регионального поиска.
       СТАВЛЕНИЕ О НЕКОТОРЫХ ДОПОЛ-
        НИТЕЛЬНЫХ ПАРАМЕТРА Х РАБОТЫ                         В 2012 году все поисковики загружают результаты
       ­П ОИСКОВЫХ СИСТЕМ.                                   менее чем за секунду, самые быстрые — Google
                                                             и Mail.ru (рис. 32).

       СКОРОСТЬ ПОИСКА
                                                             АПДЕЙТЫ
       Одним из параметров, влияющих на отношение
       пользователя к поисковой системе, является скорость   Анализатор апдейтов — обновлений поисковой выда-
       выдачи ей результатов поиска. Конечно, в случае       чи — сравнивает выдачу поисковиков за последние
       медленного соединения пользователя с Интернетом       два дня. В случае большого обновления индекса
       это не слишком важно. Однако с ростом числа           количество изменений будет бросаться в глаза
       пользователей высокоскоростных каналов подклю-        на графике этого анализатора. Его результаты —
       чения скорость становится все более актуальной.       не оценочная характеристика, это лишь дополни-
       Анализатор скорости поиска рассчитывает время         тельная информация о работе различных систем.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   Рис. 32. Среднее время загрузки результатов поиска в поисковиках Рунета
            
            в 2012 году

  Сек.    Январь   Февраль   Март   Апрель   Май    Июнь      Июль    Август   Сентябрь   Октябрь   Ноябрь   Декабрь

  1,2



  1,0



  0,8



  0,6



  0,4



  0,2


         ■ Bing                ■ Google            ■ Mail                 ■ Yahoo                   ■ Yandex
                                                                                                                       41

Как можно видеть на графике (рис. 33), лиде-                по отдельным параметрам); Yahoo и Bing пока
ры поиска в 2012 году придерживались ров-                   заметно не дотягивают до их уровня.
ного и незначительного уровня ежедневных
обновлений.
                                                            КАЧЕСТВО СНИППЕТОВ
С лета 2012 года специально обученные люди
(асессоры) ежедневно изучают страницы, полу-                Дополнительно асессоры оценивают качество
ченные различными поисковиками по сотне подо-               сниппетов, выдаваемых поисковиками к изучаемой
бранных запросов, и оценивают их с точки зрения             странице: их соответствие странице, заголовки,
релевантности и качества.                                   качество текстов и состав. Строгие асессорские
                                                            инструкции и методика работы позволяют сохранять
Любопытно, что за второе полугодие 2012 года                объективность даже ручных оценок.
«Яндекс», пусть и совсем незначительно, но смог
обогнать Google по качеству асессорских оценок.             На графиках видно, что качество сниппетов всех
Впрочем, анализатор скорее иллюстрирует общую               поисковиков постепенно растет (рис. 34), в то время
ситуацию с качеством поиска в Рунете: «Яндекс»              как качество выдачи меняется разнонаправленно,
и Google лидируют, находясь близко друг к дру-              хоть и незначительно (рис. 35).
гу, Mail.ru стремительно догоняет (уже обогнав
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




          Рис. 33. Уровень апдейтов в поисковиках Рунета в 2012 году


          %     Январь    Февраль   Март   Апрель   Май     Июнь    Июль   Август   Сентябрь   Октябрь   Ноябрь   Декабрь

         30




         20




          10




          0



42        Рис. 34.  ачество сниппетов в выдаче поисковиков Рунета
                   К
                   (данные собираются с июля 2012 года)

       баллы            Июль           Август         Сентябрь        Октябрь             Ноябрь             Декабрь

        0,90




        0,85




        0,80




        0,75




        0,70


               ■ Bing                 ■ Google             ■ Mail               ■ Yahoo                  ■ Yandex
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




  Рис. 35. Асессорские оценки поиска, июль-декабрь 2012 года
           
           (данные собираются с июля 2012 года)

  %             Июль    Август    Сентябрь      Октябрь             Ноябрь      Декабрь

0,80




0,75




0,70




0,65




0,60


       ■ Bing          ■ Google        ■ Mail             ■ Yahoo            ■ Yandex
                                                                                           43
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




1.
ОСНОВНЫЕ СОБЫ-
                                                       ЧАСТЬ 2

ТИЯ НА РЫНКЕ
ПОИСКА В РУНЕТЕ
В 2012 ГОДУ
44

       ПРОШЕДШИЙ ГОД БЫЛ ОТМЕ-                         Закон вступил в силу 1 сентября 2012 года, а 1 ноя-
      ЧЕН РОС ТОМ ИСПОЛЬЗОВАНИЯ                        бря заработал «Единый реестр запрещенных сай-
       И
       ­ НТЕРНЕТ-СЕРВИСОВ К АК ИНС ТРУ-                тов» — список ресурсов, содержащих запрещенную
       МЕНТОВ ГРА Ж Д АНСКОЙ И ПОЛИ-                   к распространению в России информацию. Сайт
      ТИЧЕСКОЙ АКТИВНОС ТИ, А ТАК ЖЕ                   может попасть в реестр, если на него пожаловались
       МНОЖЕС ТВОМ РЕГ УЛЯЦИОН-                        пользователи.
       НЫХ ИНИЦИАТИВ СО С ТОРОНЫ
      ­Г ОС УД АРС ТВА.                                30 ноября ответственный за ведение реестра
                                                       Роскомнадзор сообщил, что ему поступают жалобы
                                                       на поисковые системы. Однако ведомство считает,
       ПОЛИТИЗАЦИЯ РУНЕТА                              что поисковики не являются владельцами или про-
       И РОСТ УЧАСТИЯ ГОСУДАРСТВА                      вайдерами запрещенных сайтов, поэтому в «черный
       В ЕГО РАЗВИТИИ                                  список» внесены быть не могут.

      Особенно важным для поисковиков стало принятие   За кэшированный контент в поисковом индек-
      Федерального закона Российской Федерации № 436   се сервисы тоже ответс твеннос ти не несу т.
      «О защите детей от информации, причиняющей       Од нако д а же с ай т ы с «и н дул ь г е н ц ия м и»
      вред их здоровью и развитию».                    в ноябре-декабре периодически оказывались
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




з
­ аблокированными. Роскомнадзор объяснял эти            Развитие мобильного поиска «Яндекса» и Google
случаи техническими сбоями.                             объединяет как минимум одно магистральное
                                                        направление: в «Яндексе» его называют «интентный
Еще до того как вышеупомянутый закон вступил в силу,    поиск», подразумевая стремление показывать поль-
летом 2012 года «Яндекс» выступил с протестом про-      зователю не выдачу, а готовый ответ, информацию,
тив «черного списка». Кроме него подобными акци-        соответствующую его намерениям и потребностям.
ями отметились «Википедия», «ВКонтакте», «Живой
Журнал». Google написал в корпоративном блоге пост
о том, что новый закон угрожает свободному Интернету.   ОБОСТРЕНИЕ СОПЕРНИЧЕСТВА
Он же в декабре собирал подписи «против цензуры         В ОБЛАСТИ ДИСТРИБУЦИИ
в Интернете» с целью воспрепятствовать изменению        СЕРВИСОВ
регламента Международного союза электросвязи.
По мнению Google, поправки в регламент оправдали        Дистрибуция сервисов — еще одна тенденция,
бы государственную цензуру Интернета во множестве       которая стала заметной в 2011 году и особенно
стран. Заседание МСЭ состоялось 15 декабря 2012         актуальной — в 2012 году. Представители поис-
года, поправки были приняты.                            ковых систем признают: в области качества поиска
                                                        конкуренты на рынке практически не отстают друг
ФЗ №436 содержит в себе еще одну потенциальную          от друга. Поэтому особенно важной стала способ-
проблему для поисковиков. Он требует снабжать           ность заключать партнерства и интегрировать
любую информацию метками, указывающими                  свои технологии в другие сервисы и на сторонние
ограничения по возрасту. Поисковики не могут            сайты, завоевывая таким образом аудиторию.          45
маркировать ссылки в своей выдаче, так как не спо-
собны сами определить, какой возрастной категории       В 2012 году в гонку дистрибуции активно вклю-
соответствует информация о странице. Технологий         чилась Mail.ru Group, которая снова озвучила
и инструкций, позволяющих сайтам передавать             амбициозные цели по развитию и продвижению
поисковым роботам эту информацию, тоже пока нет.        собственного поиска. Дистрибуция поиска этой
                                                        компанией признавалась некоторыми экспертами
                                                        самой агрессивной.
РОСТ ИСПОЛЬЗОВАНИЯ
ИНТЕРНЕТА С МОБИЛЬНЫХ                                   Google оказался в наиболее удачной позиции
УСТРОЙСТВ                                               благодаря популярности своего браузера Chrome.
                                                        Летом 2012 года он подписал соглашение с Mozilla
По статистике LiveInternet, с устройств на Android      Firefox и стал в этом браузере поисковой системой
и с телефонов iPhone на сайты Рунета в январе 2012      по умолчанию минимум на три следующих года.
года совершалось 2,7% и 1,6% всех переходов             За это Google будет выплачивать Mozilla почти
соответственно, а в декабре — 9,1% и 3,7% соответ-      $300 млн ежегодно.
ственно. Тенденция была заметна давно, но в 2012
году «Яндекс» особенно энергично взялся за раз-         «Яндекс» был вынужден догонять обоих соперников —
витие мобильных сервисов, запустив и улучшив            более агрессивного и более успешного. В 2012 году
множество приложений для различных устройств.           компания обновила свою политику дистрибуции —
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




       принципы сотрудничества с компаниями и отбора        с информационными сервисами, подстраивающи-
       продуктов для включения в них своих сервисов.        мися под пользователя.

       В сентябре 2012 года Аркадий Волож презентовал       О конкретных шагах в этой области каждой из поис-
       собственный браузер «Яндекса», созданный на основе   ковых систем мы поговорим подробнее в посвя-
       Google Chromium. Незадолго до этого Mail.ru Group    щенных им главах обзора.
       сообщила о начале тестирования своего социального
       браузера «Амиго». «Яндекс.Бар» перестал существо-
       вать — вместо него появились «Элементы» — набор      ИНТЕГРАЦИЯ СОЦИАЛЬНЫХ СЕТЕЙ
       дополнений, адаптированных под разные браузеры       В ПОИСКОВЫЕ СИСТЕМЫ
       и предоставляющих доступ к ресурсам «Яндекса».
                                                            Продолжается интеграция пользовательских связей
       В феврале «Яндекс» договорился о совместной          и контента из социальных сетей в поисковую выдачу.
       дистрибуции со Skype, а осенью — о предоставле-      Представители социальных сетей активно продают
       нии своей технологии для поиска по картам Apple      свои рекламные возможности, запускают новый
       в iPhone, iPad и iPod.                               функционал, обучают рекламодателей пользоваться
                                                            им. В декабре «ВКонтакте» запустил рекламную
       В ноябре стало известно, что «Яндекс» станет поис-   сеть, в которую пока принимаются только прило-
       ком по умолчанию в смартфонах Nokia, Samsung         жения этой же социальной сети, но в ближайшем
       и HTC на Windows Phone, которые будут прода-         будущем начнут подключаться сторонние сайты.
46     ваться в России.
                                                            С весны 2012 года крупные игроки рекламного
                                                            рынка Рунета тестируют покупку и продажу рекламы
       ПЕРСОНАЛИЗАЦИЯ ПОИСКА                                по модели RTB. «Яндекс» к осени 2012 года разра-
                                                            ботал технологический стек для RTB — аукционный
       Технологии подстройки поисковой выдачи под кон-      движок для сайтов, SSP и DSP-платформы, «кру-
       кретного пользователя давно числились среди люби-    тилку» баннеров, платформу обработки данных
       мых тем при обсуждении будущего поисковиков.         для показа рекламы. Частью этой платформы
       В 2012 году такие технологии стали настоящим.        стала технология «Крипта», которая анализирует
                                                            поведение пользователей в Интернете и определяет
       «Яндекс» весь 2012 год персонализировал поиско-      их социально-демографические характеристики.
       вые подсказки, а в декабре запустил новый поис-
       ковый движок «Калининград», персонализирующий        Google объявил о скором запуске на российском
       и результаты поиска.                                 рынке своей RTB-площадки Ad Exchange, которая
                                                            организует взаимодействие AdWords и AdSense
       Google работал над персонализацией выдачи            на основе статического аукциона, а также глобаль-
       с помощью своей социальной сети Google+. Даже        ной платформы DoubleClick Digital Marketing. Эта
       «Рамблер», который еще в прошлом году покинул        платформа объединит сервисы для размещения
       ряды поисковых компаний, запустил в декабре          и анализа разных типов рекламы: контекстной,
       новую — персонализированную — главную страницу       дисплейной, в видео, в социальных сетях.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




                                                       2.
                                                         «ЯНДЕКС»
                                                         В 2012 ГОДУ
                                                                                                       47

К АК И ВЕСЬ РУНЕТ, «ЯНДЕКС» В 2012                   народных биржах должны были бы одобряться
ГОДУ ОЩУ ТИЛ НА СЕБЕ ПОВЫ-                           государством; однако этого не произошло.
ШЕННОЕ ВНИМАНИЕ С АМЫХ РА З-
НЫХ ГОС УД АРС ТВЕННЫХ ОРГАНОВ                       Зимой 2012 года «Яндекс.Деньги» и «Сбербанк»
И С ТРУКТ УР.                                        создали совместное предприятие, а вскоре после
                                                     объявления об этом премьер-министр Дмитрий
                                                     Медведев посетил офис «Яндекса», где ему пока-
ОТНОШЕНИЯ С ГОСУДАРСТВОМ                             зали поиск, карты и браузер.

Летом депутаты Госдумы предложили внести в спи-
сок объектов стратегического значения крупные рос-   РЕФОРМА СТРУКТУРЫ
сийские интернет-компании: «Яндекс», «ВКонтакте»,    УПРАВЛЕНИЯ В КОМПАНИИ
Mail.ru Group и другие, чьи сайты посещают более
20 млн пользователей в месяц.                        В марте «Яндекс» сообщил об изменении организа-
                                                     ции взаимодействия разработчиков и менеджеров.
Если бы законопроект был принят, покупка более       Представители компании так прокомментировали
10% акций таких компаний иностранным инвестором      реструктуризацию: «Ориентация на продукт при-
или размещение акций таких компаний на между-        ведет к тому, что фактически внутри «Яндекса»
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




       появится много стартапов; каждый продукт внутри          МОБИЛЬНЫЕ СЕРВИСЫ,
       любого большого продуктового направления — это           СВЯЗАННЫЕ С ПОИСКОМ
       своеобразный стартап.
                                                                Результаты появившегося в 2011 году поиска
       Вокруг продуктов будет организованная струк-             «Яндекса» по приложениям (appsearch.yandex.ru)
       тура, благодаря которой в компании из 4000               стали подмешиваться в основную выдачу. В марте
       человек можно поддерживать порядок со всеми              владельцы устройств на Android получили воз-
       сопутствующими ему вещами, такими как общее              можность использовать системную оболочку Shell,
       планирование, например.                                  в которую встроены поиск и сервисы «Яндекса».

       Другими словами, менеджер сервиса полностью              Летом поисковое приложение «Яндекса» под Android
       отвечает за свой кусок — по сути, у него свой стартап.   научилось давать пользователю готовый ответ —
       При этом он находится внутри большой системы             например, прогноз погоды по запросу «погода»
       и пользуется преимуществами всей инфраструкту-           или адреса заведений на карте по запросу «кафе».
       ры компании». Реструктуризация сопровождалась
       слухами о заметных кадровых потерях.                     В ноябре появилось новое поисковое приложение
                                                                для iPad. Оно тоже умеет давать готовые ответы.
                                                                Выпустил «Яндекс» и приложение, позволяющее
       ПРОГРАММА ПСИ                                            управлять с iPhone кампаниями «Директа».

48     В феврале «Яндекс» объявил о старте «Программы
       ПСИ» — «Поиска по социальному Интернету».                ПЕРСОНАЛИЗАЦИЯ
       Цель программы — улучшение качества поис-                РЕЗУЛЬТАТОВ ПОИСКА
       ка с помощью контента из социальных сетей.
       В рамках программы был запущен поиск людей.              В декабре 2012 года «Яндекс» объявил о запуске
       На отдельном домене people.yandex.ru появился            новой поисковой платформы «Калининград»,
       сервис для поиска людей в соцсетях по имени,             которая обеспечивает пользователям персонали-
       возрасту, месту жительства, учебы и работы.              зацию поиска. Сообщается, что новая технология
       В «большом» поиске по запросам, содержащим               анализирует поведение пользователя, учитывает
       имена и фамилии, также стали обильно появляться          информацию о нем и его интересы при форми-
       профили из соцсетей.                                     ровании выдачи и улучшает качество ответов
                                                                на 75—80% запросов.
       Другой запуск в рамках социального поиска —
       поиск по контенту «Твиттера». Социальная сеть            К персонализации «Яндекс» шел давно, начав
       предоставила «Яндексу» полный доступ к сво-              в 2011 году с учета местоположения и языковых
       им данным, которого в прошлом году лишился               предпочтений пользователя. Важным направлени-
       Google. Содержимое из «Твиттера» подмешивается           ем работы над персонализацией стало улучшение
       в результаты «большого поиска» и доступно в поис-        поисковых подсказок. Подсказки начали учитывать
       ке по блогам. Его также можно искать отдельно            предыдущие запросы в рамках той же сессии,
       с помощью twitter.yandex.ru.                             показывать пользователю сайты, на которые он
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




часто заходит. Персонализированные подсказки       В июне 2012 года «Яндекс» приобрел долю в компа-
появились на картах «Яндекса».                     нии «Сейсмотек» и предоставил ей свои технологии
                                                   и ресурсы для обработки данных сейсморазведки,
Повысилась и не связанная с персонализацией        получаемых в ходе поиска месторождений нефти
функциональность подсказок. В рамках программы     и газа.
«интентный поиск» подсказки были обучены сразу
выдавать цифры и факты: коды городов, валюты,
химические формулы, имена знаменитых людей         МИРОВАЯ ЭКСПАНСИЯ
и другую информацию. А если к англоязычному
запросу добавить слово «перевод», то перевод       В 2011 году «Яндекс» открыл офис в Стамбуле
запроса появится прямо в подсказке.                и портал с сервисами, рассчитанными на турец-
                                                   кую аудиторию. В 2012 году экспансия в дальнее
                                                   зарубежье продолжилась. Были открыты офисы
РАЗВИТИЕ МИКРОРАЗМЕТКИ                             по продаже и продвижению рекламных продуктов
                                                   в Цюрихе и Люцерне (Швейцария). Люцернский
Объявив о поддержке Schema.org в конце 2011        офис возглавил Бернар Люке, который до этого
года, специалисты компании «Яндекс» включились     был гендиректором онлайн-супермаркета Ozon.ru.
в деятельность международной рабочей группы.       В январе 2012 года компания приобрела карты
В 2012 году они внесли предложение об улучшении    от ведущего мирового поставщика картографи-
формата для навигационных цепочек, поучаство-      ческих данных, компании NAVTEQ. Эти карты
вали в создании спецификации формата разметки      будут использованы для создания подробной          49
ТВ- и радиопрограмм и предложили новый формат      карты мира на «Яндекс.Картах».
для указания целевой аудитории сайта.

Компания также поучаствовала в ряде тематических
международных конференций. Летом 2012 года
в «Яндекс.Вебмастер» был добавлен валидатор
микроразметки.


ПОИСКОВЫЕ СЕРВИСЫ
ДЛЯ НАУЧНЫХ ПРОЕКТОВ
В марте 2012 года «Яндекс» объявил о сотрудни-
честве с CERN — Европейским центром ядерных
исследований. «Яндекс» создал поиск по собы-
тиям — данным о поведении частиц в процессе
экспериментов. Компания также представила мощ-
ности для обработки и хранения информации,
полученной в ходе экспериментов.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




3.
GOOGLE
В 2012 ГОДУ
50

       В 2012 ГОДУ КОМПАНИЯ GOOGLE                       Пейдж выделил следующие магистральные направ-
       ПРОВЕЛА МАСШТАБНУЮ РЕОР-                          ления работы:
       ГАНИЗАЦИЮ И СДЕЛА ЛА СТАВКУ
       НА ­ ЕРСОНА ЛИЗАЦИЮ ПОИСК А.
          П                                              ff Сделать использование сервисов Google более
                                                            простым, интуитивным. Люди не хотят прила-
                                                            гать лишних усилий, у них должно оставаться
       НОВАЯ ГЛОБАЛЬНАЯ СТРАТЕГИЯ                           ощущение, что с помощью Google проблемы
                                                            решаются сами.
       В апреле 2012 года Ларри Пейдж, занявший за год
       до этого должность CEO Google, опубликовал        ff Научить поиск понимать различия между людьми
       в разделе «для инвесторов» корпоративного            и отношения между ними. Выдача должна быть
       сайта документ об обновлении долгосрочной            персональной, человек должен иметь возмож-
       стратегии компании. Пейдж отметил, что уже           ность найти по имени и фамилии своего друга,
       в 2011 году началась работа по фокусированию         а не тысячи его тезок.
       на ключевых для Google направлениях, и эта
       работа продолжится. Реорганизация сопрово-        ff Научить поиск решать задачи человека, выдавать
       ждалась «большой чисткой» — закрылись десятки        готовые ответы, а не набор ссылок, по которым
       неприоритетных сервисов.                             таковой может найтись. Если пользователь спраши-
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




   вает погоду, ему нужны не сайты о погоде, а ответ   Особенно активно развивались геоинформаци-
   о том, какая температура на улице. Путь к реше-     онные продукты:
   нию этой задачи лежит через сотрудничество
   с сервисами, владеющими данными. Например,          ff добавились детализированные карты 45 россий-
   в 2011 году Google научился искать авиабилеты          ских городов и панорамы 53 новых объектов;
   благодаря сотрудничеству с ITA Software.
                                                       ff панорамы российских городов начали появляться
ff Продолжать заниматься сервисами для мобиль-            в картах Google именно в 2012 году: первыми
   ных устройств.                                         стали панорамы Москвы и Петербурга.

ff Сочетать краткосрочную и долгосрочную стра-         Кроме того, открылась русскоязычная версия мага-
   тегию: развитие сервисов, которые дают деньги,      зина контента и приложений Google Play.
   и инвестиции в инновационные разработки,
   которые изменят будущее.                            Главным направлением в работе российского
                                                       Google стало зак лючение партнерских согла-
ff Зарабатывать любовь и доверие у пользовате-         шений и проведение мероприятий по популя-
   лей и партнеров. Любовь — следствие удобства        ризации продуктов компании среди различных
   и стабильной работы сервисов. Доверие нужно,        категорий пользователей. В ноябре в Москве
   чтобы пользователи не боялись хранить личную        появилась «Академия преподавателей Google»,
   и деловую информацию у Google.                      где работников сферы образования учат внедрять
                                                       сервисы и продукты Google в учебный процесс.       51
                                                       Были организованы семинары по использованию
ЗАСТОЙ НА РОССИЙСКОМ РЫНКЕ                             Google+ для бизнеса.

В российском подразделении Google в 2012 году          Особого интереса Google в этом году удостоились
жизнь замерла. Летом гендиректор Google Россия         российские регионы. Совместно с администра-
Владимир Долгов ушел развивать в нашей стране          цией Костромской области Google представил
eBay. В августе генеральный директор появился          проект «Кострома: Цифровое Преображение»,
у ООО «Гугл»: им стал Евгений Ильницкий, он            цель которого — повышение интереса туристов
отвечает за деятельность компании как юридиче-         к Костроме. Специалисты Google дали рекомен-
ского лица, но не является главой Google в России.     дации по доработке сайта области, разработали
                                                       рекламную кампанию в AdWords, завели городу
Новости продуктов Google, касающиеся российского       аккаунты в Google+ и YouTube. Для детей Google
рынка, были связаны в основном с локализацией.         устроил конкурс дудлов, изображающих их род-
В поиске на русском языке стал доступен Knowledge      ной город.
Graph — выдача параллельно со ссылками фактов
и другой информации, связанной с запросом (годы        Совместно с правительством нижегородской
жизни царей, карты городов, афиша театров и т. п.).    области Google запустил программу «Понятный
На Youtube заработало автоматическое формиро-          Интернет» — пособие по сервисам Google для пожи-
вание субтитров на русском языке.                      лых людей.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




       ПЕРСОНАЛИЗАЦИЯ ПОИСКА                                  СЕМАНТИЧЕСКИЙ ПОИСК
                                                              И ФАКТЫ В ВЫДАЧЕ
       Весь 2012 год Google развивал свой социальный
       сервис и интегрировал его с остальными. Руководство    В марте Google объявил, что собирается перера-
       Google+ предлагает понимать этот продукт как соци-     ботать свои поисковые технологии, внеся в них
       альный слой, объединяющий все сервисы Google.          самые значительные изменения за всю историю
       Пользователей энергично стимулируют заводить           компании:
       аккаунты в Google+, использование некоторых
       продуктов Google без этого невозможно. Например,       ff поиск станет семантическим — научится пони-
       с ноября пользователь, удаливший аккаунт на Google+,      мать смысл запроса, его контекст, вопросы
       лишается доступа к своему каналу на YouTube.              на естественном языке, определять связанные
                                                                 с ним понятия;
       Интеграция Google+ с поиском началась в январе
       2012 года запуском программы «Search Plus Your         ff запросы будут сопоставляться с «сущностями»
       World». В выдаче появился персональный контент            из базы знаний, которую Google собирал пре-
       пользователя из Google+: его собственные фото,            дыдущие два года;
       посты его друзей по связанной с запросом тема-
       тике, личная информация пользователей и друзей.        ff база содержит сотни миллионов единиц инфор-
                                                                 мации о людях, местах и других вещах;
       Прямо в подсказках при поиске по именам стали
52     появляться ссылки на профили друзей, при поиске        ff специальный алгоритм будет распознавать и оце-
       по названиям брендов — ссылки на их страницы              нивать информацию на проиндексированных
       в Google+ с возможностью там же, в выдаче,                веб-сайтах на предмет ценности для показа
       подписаться на страницу. Многозначные запросы             в поисковых результатах.
       Google научился понимать с учетом того, какое
       значение наиболее релевантно для пользователя.         В Google надеются, что благодаря семантическому
                                                              поиску люди будут проводить больше времени
       Помимо Google+ к персонализации поиска были            на сайте поисковика, что позволит ему конкури-
       подключены Gmail, календарь и Google Drive —           ровать по этому критерию с социальными сетями.
       облачное хранилище файлов и документов,
       которое появилось в 2012 году, поглотив Google         В мае 2012 года начались первые эксперименты
       Docs. В результате в выдаче поисковой системы          по показу пользователям новой выдачи. Результаты
       по отдельным запросам стало возможно увидеть           работы семантического движка показывались
       собственные документы, письма из Gmail и события       в правой половине экрана, параллельно со списком
       из календаря Google.                                   ссылок. Пользователь может предлагать Google
                                                              поправки к выдаваемой информации, отмечая
       В декабре 2012 года пользователи заметили, что         факты, которые считает неверными.
       Google тестирует отображение личной инфор-
       мации пользователя из сервисов Ticketmaster            К декабрю 2012 года «Граф Знаний» появился
       и Eventbrite.                                          в поиске на итальянском, французском, японском
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




и русском языках. Англоязычные пользователи          В конце февраля стало известно, что Google обходит
получили его еще осенью.                             настройки cookie в браузере Safari, разрешая своим
                                                     сервисам оставлять у пользователя cookie, даже
Локализация «Графа Знаний» представляет, по сло-     если он заблокировал эту возможность. Подобным
вам разработчиков Google, отдельную пробле-          образом cookie оставлял Google+ и рекламные сер-
му — ввиду разницы менталитетов и культур            висы. Одновременно с этим команда разработчиков
в разных языках одни и те же слова могут иметь       Google Chrome работала с Apple, консультируя их
разный смысл.                                        по поводу устранения этой возможности.

                                                     В июне поиск товаров Google Product Search был
СКАНДАЛЫ                                             переименован в Google Shopping и стал платным
                                                     для магазинов. Выдача Product Search подмеши-
Начало 2012 года выдалось у Google богатым           вается в основную выдачу поисковика по товар-
на события, вызвавшие шум в прессе и негатив-        ным запросам, поэтому Google обвинили в том,
ный отклик общественности.                           что у него в выдаче появились проплаченные
                                                     результаты. В декабре еще один продукт — Google
Сначала обнаружилось, что Google не закрыл           Apps — стал платным, вызвав неудовольствие части
от индексации ссылки на страницу загрузки браузе-    пользователей.
ра Chrome в рекламных постах, которые компания
оплачивала блоггерам. Получилось, что Google
сам делает то, с чем давно боролся, — покупает                                                            53
ссылки для влияния на ранжирование. Компания
наказала сама себя за нарушение собственных
правил — забанила в поиске страницу загрузки
Chrome на два месяца.

В середине января кенийский каталог бизнес-
организаций Mocality пожаловался на то, что
Google уводит у него клиентов путем «холодных
звонков». Сотрудники Google звонили в компании
и говорили, что Mocality берет деньги за свои
услуги — это утверждение не соответствовало
действительности.

В том же месяце обнаружилось, что сотрудники
Google намеренно портят карты проекта Open Street
Maps, удаляя или искажая геоинформацию. В февра-
ле сотрудник Google написал на форуме, что если вы
высоко ранжируетесь в Google, не покупая рекламу,
то это ошибка, которую Google пытается исправить.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




4.
ПОИСК MAIL.RU
В 2012 ГОДУ
54

      СОЗДАТЕЛИ ПОИСКОВОЙ СИСТЕМЫ                      пен голосовой ввод поискового запроса, причем
      MAIL.RU В 2012 ГОДУ СУЩЕСТВЕННО                  для распознавания голоса применяется технология
      ОБНОВИЛИ ТЕХНОЛОГИЧЕСКУЮ ПЛАТ-                   компании Nuance, которую использует и Apple.
      ФОРМУ И ПРОДЕМОНСТРИРОВА ЛИ
      УМЕНИЕ СЛЕДИТЬ ЗА ГОРЯЧИМИ
      ТРЕНДАМИ РЫНК А.                                 ЗНАНИЯ В ВЫДАЧЕ
                                                       На запрос, требующий конкретной информации
       ПОИСК ДЛЯ МОБИЛЬНЫХ                             и фактов для принятия решений, поиск Mail.ru
       УСТРОЙСТВ                                       стремится давать пользователю ответ сразу на стра-
                                                       нице результатов. В этом поисковая система похожа
      В 2012 году команда поиска Mail.ru занималась    на Google и «Яндекс».
      модернизацией своего сервиса: приводила его
      в соответствие с духом времени и снабжала        Основной базой знаний для Mail.ru являются мно-
      «джентльменским набором» функций, обязательных   гочисленные контентные проекты Mail.ru Group.
      для популярного поисковика. Появилась мобиль-    Благодаря им пользователи могут получать в выда-
      ная версия веб-поиска и поисковые приложения     че информацию о лекарствах, государственных
      для разных платформ. В приложениях стал досту-   праздниках, фильмах в прокате, читать гороскопы,
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




видеть предложения по продаже автомобилей.           поиска стала учитывать региональную специфику
Из «Википедии» извлекаются ответы на вопросы         сайтов. Команда поиска заявила, что улучшить
вида «год рождения Пушкина», «высота Пизанской       качество регионального поиска помогли 445 новых
башни» и т. п.                                       факторов ранжирования.

По запросам, представляющим собой вопросы
на естественном языке, в выдачу подмешивается        ИНСТРУМЕНТАРИЙ
содержимое «Ответов@Mail.ru».                        ДЛЯ ВЕБМАСТЕРА
                                                     В ноябре 2012 года на конференции Optimization-2012
СВОЙ «МАТРИКСНЕТ»                                    было объявлено о запуске сервиса для владель-
                                                     цев и оптимизаторов сайтов — webmaster.mail.ru.
В феврале Mail.ru объявил о начале открытого         В «Кабинете Вебмастера» они могут посмотреть
тестирования собственной технологии машин-           входящие ссылки на сайт, запросы, по которым
ного обучения поиска. Такая технология рабо-         приходят пользователи, какие страницы проиндек-
тает у «Яндекса» с 2009 года и носит название        сированы, какие из них каким запросам релевантны,
«Матрикснет». Mail.ru тестирует свою версию машин-   какие страницы «Поиск Mail.ru» считает хорошими
ного обучения на домене o.go.mail.ru.                и по каким запросам. В ближайшее время появятся
                                                     и другие инструменты.
Эта версия работает следующим образом: специ-
ально нанятые люди оценивают качество выдачи         Было объявлено, что вебмастера получат доступ         55
по разным запросам, алгоритмы анализируют            к поведенческим факторам ранжирования — данным
их оценки и делают выводы о том, какая выдача        о привлекательности сниппета и средней удовлет-
кажется людям качественной и полезной, а какая —     воренности пользователей сайтом. Эта информация
нет. На основании этого анализа динамически          позволит понять, насколько содержание документа
изменяется формула ранжирования сайтов.              соответствует тому, что пользователь ожидает
                                                     увидеть по заданному запросу.

ПОИСК ПО НОВОСТЯМ
И РЕГИОНАЛЬНОСТЬ
В 2012 году команда поиска энергично совершен-
ствовала поиск по новостям. Результаты поиска
стали выдаваться в виде сюжетов, с группировкой
публикаций из разных изданий на одну и ту же тему.

Выдачу поиска по новостям можно отфильтровать
по категориям (политика, экономика и т. д.). Позже
появился еще один фильтр — по регионам. Тогда
же, в середине осени, новая версия основного
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




5.
СОЦИАЛЬНЫЕ
СЕТИ КАК ИГРОКИ
ПОИСКОВОГО
РЫНКА
56

       ПОК А «ВКОНТАКТЕ» ЗАНИМА ЛИСЬ                      ные из Facebook. В самом Facebook, на дополни-
       НАРАЩИВАНИЕМ ФУНКЦИОНА ЛЬ-                         тельной странице поиска, есть фильтр «найдено
       НОСТИ ПОИСК А, FACEBOOK СДЕЛА ЛИ                   в Интернете», который демонстрирует выдачу Bing.
       СТАВКУ НА СОЦИА ЛЬНЫЙ ГРАФ
       И ДОБАВИЛИ ПОИСКОВУЮ РЕК ЛАМУ.                     В сентябре Марк Цукерберг рассказал журнали-
                                                          стам, что к поиску Facebook задается миллиард
                                                          запросов в день, что над разработкой поиска уже
       СЛУХИ О ПОИСКЕ FACEBOOK                            работает команда специалистов, и что появление
                                                          поискового продукта — вопрос времени. Эту
       Во второй половине 2012 года зарубежные хай-       команду поисковых инженеров, состоящую из 24
       тек-издания регулярно публиковали материалы        человек, возглавляет Ларс Расмуссен, который
       о готовящемся поиске Facebook. Материалы можно     пришел из Google.
       сгруппировать на основании двух сюжетных линий:
       переговоры с Microsoft и собственная разработка.   Бета-версия поиска Facebook была анонсирована
                                                          и запущена в тестирование в январе 2013 года.
       С поисковой системой Bing компания Facebook        Проект, получивший название Graph Search, выпол-
       сотрудничает с 2010 года. В частности, Bing        няет поиск с учетом накопленной информации
       включает в результаты поиска социальные дан-       о пользователе.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




В августе 2012 года у Facebook появилась «поиско-
вая реклама» — возможность для компаний купить
подсказку-ссылку на свою страницу в Facebook,
которая будет появляться по нужным запросам.
Релевантности и вообще какой-то связи спонси-
рованной подсказки с самим запросом Facebook
от рекламодателя не требует.


РАСШИРЕНИЕ ФУНКЦИОНАЛА
ПОИСКА «ВКОНТАКТЕ»
В отличие от своего американского аналога,
«ВКонтакте» уже несколько лет развивает соб-
ственную поисковую технологию. Поиск «ВКонтакте»
умеет искать людей, сообщества, аудио- и видео-
записи; кроме того, поддерживает поиск по текстам
пользовательских постов и публичных страниц.

Пользователям доступен поиск по собственным запи-
сям или по записям любого другого пользователя.                                                 57
В декабре у «ВКонтакте» появился расширенный
поиск по новостям (постам пользователей и стра-
ниц). Он научился учитывать количество «лайков»,
применять геолокацию, искать отдельно по постам
и комментариям, искать ссылки на внешние сайты
или на контент самой соцсети.

Цель нововведения, по словам руководства соцсе-
ти, — увеличить активность пользователей в области
поиска по постам. Количество запросов к поиску
«ВКонтакте» оценивается приблизительно как
100—200 млрд запросов в год. Это число учитывает
только незакэшированные запросы.
К АЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ




6.
ВЫВОДЫ
58

       Итак, основными тенденциями развития рынка поис-    ff не просто адаптация интерфейсов под мобиль-
       ка в Рунете в 2012 году можно считать следующие:       ные устройства, но и создание продуктов, учиты-
                                                              вающих особенности использования Интернета
      ff активное государственное регулирование               с таких устройств;
         интернет-рынка;
                                                           ff превращение дистрибуции поиска в главное
      ff учет в поиске персонального поведения и потреб-      средство борьбы за рынок и вытекающая из этого
         ностей пользователя, его связей в социальных         необходимость заключать партнерства с произ-
         сетях;                                               водителями софта, сервисов и устройств.

      ff стремление поисковиков отвечать на вопро-
         сы пользователей, выдавать сразу полезную
         информацию, а не список страниц, на которых
         ее можно найти;

      ff стремление поисковых компаний выйти за преде-
         лы веб-поиска и открыть новые области при-
         менения своих технологий;
1




    МОСКВА, 2013
«АШМАНОВ И ПАРТНЕРЫ»
ВСЕ ПРАВА ЗАЩИЩЕНЫ.

Качество поиска и поисковые системы в Рунете 2012

  • 1.
    КАЧЕСТВО ПОИСК А И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ АНАЛИТИЧЕСКИЙ ОТЧЕТ, 2012 ГОД 2 АВТОРЫ ОТЧЕТА: КОНСТАНТИН РОЩУПКИН, ЛЮДМИЛА КУДРЯВЦЕВА, СЕРГЕЙ ВАЛЬКОВСКИЙ
  • 2.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ СОДЕРЖАНИЕ О компании «Ашманов и партнеры»..........................................................................4 ЧАСТЬ 1 1. Качество поиска: критерии и динамика.....................................................................5 ­ Независимая оценка качества поиска...................................................................................................... 5 Что нового на Analyzethis.ru в 2012 году.................................................................................................. 6 Как работают анализаторы качества поиска............................................................................................ 7 2. Качество поиска по навигационным запросам........................................................8 3. Качество поиска по информационным запросам.................................................12 Асессорский анализатор.......................................................................................................................... 12 Ответы на вопросы................................................................................................................................... 12 Цитаты и крылатые слова........................................................................................................................ 13 Оригинальные источники информации................................................................................................. 14 4. Качество поиска по транзакционным ­ апросам....................................................16 з 5. Актуальность результатов поиска...............................................................................18 Актуальность должностей и телефонов................................................................................................. 18 Скорость индексации............................................................................................................................... 19 2 6. Полнота и ­ азнообразие результатов поиска.........................................................21 р Омонимы................................................................................................................................................... 21 Давление оптимизаторов........................................................................................................................ 21 Тематический поиск................................................................................................................................. 22 Полнота индекса....................................................................................................................................... 22 7. Поиск из ­ егионов........................................................................................................... 25 р Регионально-навигационный анализатор.............................................................................................. 25 Анализатор регионального поиска......................................................................................................... 26 8. Понимание запроса........................................................................................................ 28 Качество подсказок.................................................................................................................................. 28 Устойчивость к опечаткам....................................................................................................................... 28 9. Анализаторы ошибок......................................................................................................31 10. Анализаторы раздражающих факторов................................................................. 35 Поисковый спам....................................................................................................................................... 35 Уровень порнографии.............................................................................................................................. 35 Качество семейного фильтра.................................................................................................................. 36 Количество рекламы................................................................................................................................ 36 Количество вирусов.................................................................................................................................. 37
  • 3.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 11. Общие характеристики поиска................................................................................... 40 Скорость поиска.......................................................................................................................................40 Апдейты.....................................................................................................................................................40 Качество сниппетов.................................................................................................................................. 41 ЧАСТЬ 2 1. Основные события на рынке поиска в Рунете в 2012 году............................... 44 Политизация Рунета и рост участия государства в его развитии........................................................44 Рост использования Интернета с мобильных устройств....................................................................... 45 Обострение соперничества в области дистрибуции сервисов............................................................ 45 Персонализация поиска...........................................................................................................................46 Интеграция социальных сетей в поисковые системы...........................................................................46 2. «Яндекс» в 2012 году.......................................................................................................47 Отношения с государством..................................................................................................................... 47 Реформа структуры управления в компании......................................................................................... 47 Программа ПСИ........................................................................................................................................48 Мобильные сервисы, связанные с поиском...........................................................................................48 Персонализация результатов поиска......................................................................................................48 Развитие микроразметки......................................................................................................................... 49 3 Поисковые сервисы для научных проектов........................................................................................... 49 Мировая экспансия.................................................................................................................................. 49 3. Google в 2012 году........................................................................................................... 50 Новая глобальная стратегия.................................................................................................................... 50 Застой на российском рынке................................................................................................................... 51 Персонализация поиска........................................................................................................................... 52 Семантический поиск и факты в выдаче............................................................................................... 52 Скандалы................................................................................................................................................... 53 4. Поиск Mail.ru в 2012 году.............................................................................................. 54 Поиск для мобильных устройств............................................................................................................ 54 Знания в выдаче....................................................................................................................................... 54 Свой «Матрикснет»................................................................................................................................... 55 Поиск по новостям и региональность.................................................................................................... 55 Инструментарий для вебмастера............................................................................................................ 55 5. Социальные сети как игроки поискового рынка.................................................. 56 Слухи о поиске Facebook......................................................................................................................... 56 Расширение функционала поиска «ВКонтакте»..................................................................................... 57 6. Выводы................................................................................................................................ 58
  • 4.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ О КОМПАНИИ «АШМАНОВ И ПАРТНЕРЫ» 4 Ежегодный аналитический отчет по качеству Среди прочих разработок компании — сервисы, работы поисковых систем подготовлен компа- обеспечивающие высококачественный семантиче- нией «Ашманов и партнеры». Материал основан ский анализ контента. К их числу относятся система на данных, полученных при помощи семейства управления репутацией в Интернете «Крибрум», анализаторов проекта AnalyzeThis. технология «Семантическое зеркало» и другие. Анализаторы, разработанные компанией, позволя- Компания «Ашманов и партнеры» является одним ют с высокой точностью оценивать, как с течением из лидеров российского рынка интернет-маркетинга. времени меняется качество работы основных С 2001 года компания оказывает услуги по ком- поисковых сис тем русскоязычного сегмента плексному продвижению брендов в Интернете, Интернета. консалтингу и аналитике. Создание этого уникального проекта стало воз- можным благодаря привлечению к работе лучших специалистов в области поисковых технологий и лингвистики, которые также занимаются реа- лизацией новой вьетнамской поисковой системы Wada.
  • 5.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ ЧАСТЬ 1 1. КАЧЕСТВО ПОИСКА: ­К РИТЕРИИ И ДИНАМИКА 5 ЗНАЧИМОСТЬ И ПОПУЛЯРНОСТЬ и объективное сравнение различных параме- ПОИСКОВЫХ СИСТЕМ В РОССИЙСКОМ тров работы поисковиков может представлять СЕГМЕНТЕ ИНТЕРНЕТА РАСТЕТ ПО МЕРЕ большой интерес не только для пользователей, УВЕЛИЧЕНИЯ КОЛИЧЕСТВА ПОЛЬ- но и для специалистов, так или иначе связанных ЗОВАТЕЛЕЙ И САЙТОВ. ПРИ ЭТОМ с индустрией интернет-поиска. ПОВЫШАЕТСЯ И ТРЕБОВАТЕЛЬНОСТЬ ПОЛЬЗОВАТЕЛЕЙ, КОТОРЫМ НЕРЕДКО В 2007 году специалисты компании «Ашманов ОК АЗЫВАЮТСЯ ВА ЖНЫ ДА ЖЕ, и партнеры» разработали методику, позволяющую НА ПЕРВЫЙ ВЗГЛЯД, НЕСУЩЕСТВЕН- автоматически оценивать различные аспекты НЫЕ НЮАНСЫ РАБОТЫ ­ ОИСКОВИКОВ. П работы поисковых систем и запустили проект AnalyzeThis (www.analyzethis.ru). НЕЗАВИСИМАЯ ОЦЕНКА Сегодня AnalyzeThis — единственный независимый КАЧЕСТВА ПОИСКА источник достоверной информации о плюсах и минусах поисковиков Рунета. Существующие Сами пользователи зачастую оценивают поис- на западном рынке аналоги исследуют меньшее ковые системы весьма субъективно, во многом — количество поисковых систем по меньшему числу под влиянием привычек. Потому качественное критериев.
  • 6.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ В состав AnalyzeThis входит 37 анализаторов, оце- AnalyzeThis сравнивает все ведущие поисковики нивающих качество работы поисковиков Рунета Рунета: Google, «Яндекс», Mail.ru, «Рамблер», Bing с разных точек зрения. Несмотря на то, что каждый и Yahoo. С 2012 года из числа оцениваемых поис- анализатор соответствует конкретному аспекту, ковиков исключен «Апорт», работающий на поис- некоторые из них весьма похожи. В то же время, ковых алгоритмах «Яндекса». внутри одного анализатора может проводиться вычисление достаточно разных параметров. В таких В этом отчете из графиков исключен и «Рамблер», случаях у анализаторов появляются «вкладки». чей поиск также обеспечивается «Яндексом», хотя Например, в Анализаторе поиска крылатых слов выдача поисковиков иногда различается. Именно проверяется нахождение как текста, откуда пошло поэтому, в частности, на сайте проекта оценки выражение, так и просто его названия и автора. «Рамблера» пока остаются. Кроме того, у проекта есть особый анализатор, Отдельный интерес представляют результаты не имеющий прямого отношения к работе поис- поиска Mail.ru, чья выдача примерно на 60% ковиков, но отражающий ситуацию в сфере поис- обеспечивается алгоритмами Google, в остальном ка в целом. Речь идет об Анализаторе переходов, же — собственным движком. Доля этого поисковика вычисляющем количество переходов на различные на рынке достаточно высока, а качество поиска, сайты со страниц поисковой выдачи, для чего по нашим оценкам, заметно растет. используются данные счетчиков LiveInternet. 6 Наконец, AnalyzeThis предлагает целых два, пусть ЧТО НОВОГО НА ANALYZETHIS.RU и не окончательных, ответа на вопрос, какой В 2012 ГОДУ поисковик лучше. Этой цели служат Асессорский анализатор и Сводный показатель качества поиска. Проект AnalyzeThis не стоит на месте: помимо постоянного обновления и поддержки имеющихся Результаты первого — средние оценки выдачи, анализаторов, регулярно появляются новые исследу- поставленные специально обученными людьми емые параметры качества поиска, разрабатываются за релевантность и качество выданных поисковиком новые алгоритмы и возможности. страниц; именно таким образом оценивают свою работу сами разработчики поисковиков. Основным событием в работе проекта в 2012 году стал произошедший в декабре запуск нового сайта Второе значение — сведение результатов всех проекта. Обновление сайта было связано пре- качественных анализаторов в единый численный имущественно с резким увеличением количества показатель с использованием нормировки и наших анализаторов. представлений о значимости отдельных граней работы поиска. Стоит отметить, что коэффици- Одним из результатов стало разделение ана- енты для вычисления этого параметра каждый лизаторов на тематические группы в соответ- пользователь может изменить в соответствии со ствии с оцениваемым аспектом поиска, при- своими представлениями о значимости конкрет- чем для каждой группы вычисляется сводный ных показателей. показатель качества. Как и в случае общего
  • 7.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ сводного показателя, пользователи могут сами Ежедневно каждый из поисковиков получает определить значимость любого из входящих по несколько тысяч запросов от анализаторов в группу анализаторов. проекта. Важным нововведением стал запуск Асессорского Подробное описание работы анализаторов в целом анализатора. Содержащий исключительно ручные можно найти на сайте проекта (www.analyzethis.ru). оценки, он стал альтернативным способом опреде- Методы работы каждого из них описаны на соот- ления «лучшего поисковика», учитывающим такие ветствующих страницах портала. Результаты оценки сложно оцениваемые автоматикой параметры, поисковиков в любом из анализаторов доступны как релевантность выдачи и качество страниц. с момента его запуска, т.е. для части из них — с 2007 года. Одновременно с асессорским был запущен и пер- вый анализатор, изучающий качество сниппетов. В этом отчете изложены главные события в жизни Пока что фрагменты страниц, представленные поисковых машин и приведены изменения, про- на странице выдачи, оцениваются только вручную. изошедшие с разнообразными аспектами качества поиска в 2012 году. Основная часть исследования Наконец, целая серия «анализаторов ошибок», опирается на результаты работы анализаторов. появившаяся в прошедшем году, заостряет вни- мание на обратной стороне совершенствования алгоритмов поисковиков, отвечающих за понима- ние запроса. Неоправданные замены и деление 7 неделимого — первые последствия этого процесса, которые команде проекта удалось исследовать. КАК РАБОТАЮТ АНАЛИЗАТОРЫ КАЧЕСТВА ПОИСКА Методика работы анализаторов весьма разнообраз- на: от ручной оценки всех результатов до автомати- ческой проверки наличия в выдаче нужного сайта. Большая часть анализаторов использует систему маркеров — элементов, соответствующих конкрет- ным запросам (слова, веб-адреса, тексты). Маркеры подбираются специалистами компании вместе с запросами, после чего программе остается лишь проверить наличие соответствующего маркера в выдаче поисковика по запросу, реже — на самих страницах, найденных поисковиком.
  • 8.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 2. КАЧЕСТВО ПОИСКА ПО НАВИГАЦИОН- НЫМ ЗАПРОСАМ 8 ЦЕЛЬ НАВИГАЦИОННЫХ ЗАПРОСОВ — Несмотря на то, что конкретный пользователь ПОИСК ОПРЕДЕЛЕННЫХ СТРАНИЦ может искать и другую информацию, соответству- В ИНТЕРНЕТЕ. ОСНОВНЫМИ СЛОЖНО- ющую запросу, показать официальную страницу СТЯМИ ЗДЕСЬ ЯВЛЯЮТСЯ РЕГИОНА ЛЬ- в выдаче принципиально важно. В большин- НАЯ НАВИГАЦИЯ (ПОИСК ПО ГЕО- стве случаев поисковики с такими запросами ЗАВИСИМЫМ ЗАПРОСАМ) И ПОИСК ­с правляются. ВНУ ТРЕННИХ СТРАНИЦ САЙТОВ. Данные анализаторов показывают, что лишь у Google Навигационные запросы при этом могут быть поиск внутренних страниц сайтов (внутрисайтовая довольно разнообразны: от поиска сайта круп- навигация, рис. 5) находится на соответствующем ной корпорации (запрос сбербанк с целью найти уровне — около 90%. sberbank.ru) до поиска конкретной страницы (озон аудио­к ниги, чтобы найти www.ozon.ru/ По остальным навигационным запросам результа- context/audiobook), от поиска блога с многоты- ты всех поисковиков превышают 90% при поиске сячной аудиторией (татьяна толстая, чтобы найти крупных организаций (рис. 1) и известных владель- tanyant.livejournal.com) до поиска сайта маленькой цев персональных сайтов (рис. 2); и 80% — при региональной школы (моу сош 1 азнакаево, чтобы поиске персональных блогов (рис. 3) и некрупных найти azn1.ucoz.ru). региональных организаций (рис. 4).
  • 9.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 1. ысочайшее качество поиска по навигационным запросам В в поисковиках Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 95 90 85 80 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 9 Здесь следует сделать оговорку, что «все поискови- Тройка лидеров сейчас регулярно получает стопро- ки» употребляется в значении «все, кроме Yahoo», центные результаты, да и остальные недалеко от них результаты которого заметно — и не в лучшую ушли. Столь высокое качество поиска, восприни- сторону — выделяются на фоне остальных. Дело маемое сейчас как должное, на момент создания скорее не в реальном качестве работы этого поис- анализатора в 2007 году казалось недостижимым: ковика, а в технических проблемах, с которыми результаты варьировались от 90% до 30%. Этот сталкиваются наши анализаторы при попытке рост легко проследить на графике анализатора получить от Yahoo осмысленные результаты поиска. «за все время» на analyzethis.ru. К сожалению, те же проблемы испытывают и ана- лизаторы других групп. Поиск Yahoo действительно в большинстве слу- чаев уступает конкурентам. Тем не менее, о его реальном уровне стоит судить по высшим точкам графиков его результатов: именно они соответствуют моментам, когда выдача, получаемая анализатора- ми, соответствовала тому, что видят пользователи этого сервиса.
  • 10.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 2. Качество поиска персональных сайтов Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 90 80 70 60 10 Рис. 3. ачество поиска персональных блогов по имени автора в 2012 году К % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 90 80 70 60 50 40 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 11.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 4. ачество поиска периферийных сайтов — сайтов некрупных, К часто региональных организаций, на которые мало ссылок, что усложняет их поиск. Анализатор создан летом 2012 года % Август Сентябрь Октябрь Ноябрь Декабрь 100 90 80 70 60 50 40 Рис. 5. ачество поиска внутренних страниц сайтов. К 11 Анализатор, появившийся весной 2012 года % Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 90 80 70 60 50 40 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 12.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 3. КАЧЕСТВО ПОИСКА ПО ИНФОРМАЦИ- ОННЫМ ЗАПРОСАМ 12 К ИНФОРМАЦИОННОМУ ПОИСКУ информационными запросами (например, как ОТНОСИТСЯ ОЧЕНЬ ШИРОКИЙ оформить расписку, оценки около 0,9) и заметно К ЛАСС ЗАПРОСОВ, А ПОТОМУ ТАКИЕ хуже — с другими (близкие по смыслу слова к слову ЗАПРОСЫ ПРЕОБЛА ДАЮТ В ОБЩЕЙ «запас», оценки около 0,4). МАССЕ. АНА ЛИЗАТОРЫ ИЗУЧАЮТ К АЧЕСТВО ЦИТАТНОГО ПОИСК А И ПОИСК А КРЫЛАТЫХ СЛОВ, К АЧЕ- ОТВЕТЫ НА ВОПРОСЫ СТВО ПОИСК А ОРИГИНА ЛОВ ТЕКСТОВ И К АЧЕСТВО ОТВЕТОВ НА ВОПРОСЫ. Похожая ситуация наблюдается и в Анализаторе ответов на вопросы. Список вопросов был специ- ально подобран так, чтобы включать как «простые» АСЕССОРСКИЙ АНАЛИЗАТОР для ответа, так и более сложные. Сам анализатор проверяет, насколько качественно поисковики Преобладание информационных запросов в общей отвечают на вопросы (как явные, так и подраз- массе нашло свое отражение в Асессорском ана- умеваемые), содержащиеся в запросе. лизаторе, где подобных запросов тоже боль- шинство. В результатах этого анализатора видно, Оценки поисковиков вычисляются с четырьмя как поисковики хорошо справляются с одними различными степенями строгости (ответы на най-
  • 13.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 6. ачество поиска ответов на вопросы в сниппетах поисковой выдачи К в 2012 году, с учетом позиций % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 80 60 40 20 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 13 денных страницах или в найденных сниппетах, были добавлены (и сделаны основными) вкладки, и эти же параметры с учетом позиций). Поскольку показывающие количество не только встречен- очевидно, что в идеальной ситуации поисковик ных в результатах поиска кусков исходных про- должен выдавать правильный ответ на самой изведений, но и просто упоминаний названия странице выдачи, и чем выше, тем лучше, оценка и автора этих текстов. именно этого параметра является основной. С момента введения этих изменений результаты Результаты всех поисковиков в течение 2012 года ведущих поисковиков в обоих анализаторах улучшались, однако значения вокруг 76% оставляют были весьма стабильны: около 85% в цитатном немало пространства для роста (рис. 6). (рис. 7) и около 95% в анализаторе поиска крылатых слов (рис. 8). В обоих случаях наблю- дался постепенный небольшой рост показателей ЦИТАТЫ И КРЫЛАТЫЕ СЛОВА «Яндекса», чу ть более заметный — у Mail.ru, и весьма резкий — y Bing. Анализаторы «Поиск цитат» и «Поиск крылатых слов» исследуют другие аспекты информаци- онного поиска — поиск источников цитаты или выражения соответственно. Летом в оба из них
  • 14.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 7. ачество поиска цитат в поисковиках Рунета, с июня 2012 года — К новый метод анализа с учетом поиска источника цитаты % Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 14 ОРИГИНАЛЬНЫЕ Неожиданно слабые результаты поиска Mail.ru ИСТОЧНИКИ ИНФОРМАЦИИ объясняются, вероятно, невысокой полнотой индекса и сравнительно низкой скоростью индек- Не столько важный для пользователей поиска, сации сайтов. Тем не менее, во втором полугодии сколько имеющий общее значение параметр — 2012 года этот поисковик показал серьезный умение выбирать сайт-первоисточник для рас- рост (рис. 9). пространенного в Интернете текста. Анализатор оригиналов проверяет эту способность поисковых систем на примере новостных текстов, происхож- дение которых достоверно известно. Результаты работы анализатора показывают, что с самого начала 2012 года Google радикально улучшил этот аспект своей работы. В результате лидировавший предыдущие полтора года «Яндекс» был вытеснен с первой позиции. Впрочем, рос- сийская поисковая система тоже улучшила свои позиции по этому показателю.
  • 15.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 8. ачество поиска крылатых слов, с июня 2012 года — К новый метод анализа с учетом поиска первоисточника % Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 Рис. 9. ачество поиска оригиналов новостей в поисковиках Рунета К 15 в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 80 60 40 20 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 16.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 4. КАЧЕСТВО ПОИСКА ПО ТРАНЗАКЦИОН- НЫМ ­ЗАПРОСАМ 16 ТРАНЗАКЦИОННЫМИ НАЗЫВАЮТ запросам. Дополнительно учитываются и позиции, ЗАПРОСЫ, КОТОРЫЕ ПОДРАЗУМЕВАЮТ на которых найдены эталонные версии файлов. КАКОЕ-ЛИБО КОНКРЕТНОЕ ДЕЙСТВИЕ — ЗАГРУЗКУ ФАЙЛОВ, ПОКУПКУ БИЛЕТОВ, Результаты поисковиков в этом виде поиска оставля- ПРОСЛУШИВАНИЕ МУЗЫКИ И ПР. ют желать лучшего (рис. 10). В среднем поисковики находят официальные источники для скачивания контента всего в 50—55% случаев, а с учетом пози- В конце 2012 года в проекте AnalyzeThis появился ции, на которой найден сайт, еще хуже – менее Анализатор поиска официальных версий, первым чем в 53% случаев. исследующий качество поиска по транзакцион- ным запросам. Это отчасти связано с популярностью порталов- агрегаторов, которые одновременно хранят много В настоящий момент речь идет о получении версий продуктов, пусть и неофициальных. доступа к определенному контенту (програм- мы, музыка, фильмы), про который заведомо Лучше всего с транзакционными запросами обсто- известно, что в Интернете он доступен легально. ят дела у Google, чуть хуже — у «Яндекса». Поиск Поэтому анализатор проверяет, что именно эти Mail.ru в декабре значительно улучшил качество легальные версии находятся по соответствующим поиска по транзакционным запросам.
  • 17.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 10. ачество поиска официальных версий в поисковиках Рунета, К анализатор создан осенью 2012 года % Октябрь Ноябрь Декабрь 60 50 40 30 20 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 17 Стоит отдельно отметить, что результаты поиска программного обеспечения по транзакционным запросам заметно выше, чем результаты поиска музыки и фильмов. Вероятно, в дальнейшем эти два вида контента будут разведены по разным анализаторам.
  • 18.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 5. АКТУАЛЬНОСТЬ РЕЗУЛЬТАТОВ ПОИСКА 18 ОДНИМ ИЗ ВА ЖНЕЙШИХ ТРЕБО- ответ, к общему числу документов с правильным ВАНИЙ К ИНФОРМАЦИОННОМУ и неправильным ответами. ПОИСКУ ЯВЛЯЕТСЯ АКТ УА ЛЬНОСТЬ ЕГО РЕЗУЛЬТАТОВ. АНА ЛИЗАТОРЫ Разумеется, с течением времени все больше стра- ЭТОЙ ГРУППЫ ПРИЗВАНЫ ПОК А- ниц содержат правильные ответы, и все меньше — ЗАТЬ, НАСКОЛЬКО БЫСТРО ПОИС- неправильные, поэтому рост результатов в этом КОВИКИ РЕАГИРУЮТ НА ПРОИЗО- анализаторе естественен. ШЕДШИЕ ИЗМЕНЕНИЯ, К АК В ЖИЗНИ, ТАК И В СЕТИ. Поскольку специалисты проекта регулярно заменяют наборы запросов этих анализаторов, на графиках образуются временные скачки вниз, после которых АКТУАЛЬНОСТЬ ДОЛЖНОСТЕЙ поисковики возвращают утраченные позиции. И ТЕЛЕФОНОВ Таким образом, чтобы проследить, как меняется В настоящий момент доступны анализаторы акту- актуальность выдачи поисковиков, стоит смотреть альности должностей (рис. 11) и актуальности на минимумы графиков — и здесь прогресс заметен телефонов (рис. 12). Оба они вычисляют отношение только у Mail.ru. Впрочем, это пока не помогло ему количества документов, содержащих правильный обогнать «Яндекс» и Google.
  • 19.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 11. ктуальность поиска по должностям в поисковиках Рунета А в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 85 80 75 70 65 60 55 50 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 19 СКОРОСТЬ ИНДЕКСАЦИИ Стоит отметить, что незначительное ухудшение результатов Google, заметное улучшение Mail.ru Другим способом оценки актуальности поисковой и возвращение «Яндекса» к уровню конца 2011 выдачи является изучения скорости индексации года позволило всем троим лидерам оказать- каждого из поисковиков. Для этого был создан ся в шаге друг от друга по критерию скорости специальный анализатор, работающий на осно- индексации (рис. 13). ве публикуемых крупными доменами файлов sitemap.xml. Как только на домене появляется новая страни- ца, она добавляется в анализатор, после чего определяется, на какой день после появления страницы она попала в индексы каждого из поис- ковиков. На сайте также доступны оценки того, какая доля новых страниц попадает в индекс в первый, второй и т. д. день. Так, оказалось, что лишь около 40% страниц попадают в индекс в первые два дня!
  • 20.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 12. Актуальность поиска по телефонам в поисковиках Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 90 80 70 60 50 20 Рис. 13. ачественная оценка скорости индексации новых страниц К поисковиками Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 21.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 6. ПОЛНОТА И ­РАЗНООБРАЗИЕ РЕЗУЛЬТАТОВ ПОИСКА 21 ТРЕБОВАНИЯ К ТОМУ, К АК ДОЛЖНА ОМОНИМЫ ВЫГЛЯДЕТЬ ВЫДАЧА ПОИСКОВИКОВ, ЗАВИСЯТ ОТ ТИПА ЗАПРОСА, КОТО- Количество различных смыслов, которые предлагают РЫЙ МОЖЕТ БЫТЬ РЕДКИМ ИЛИ, поисковики по неоднозначным запросам, вычисляется НАПРОТИВ, МНОГОЗНАЧНЫМ. в Анализаторе омонимов. Вот пример такого запро- са: зенит — футбольный клуб, банк и фотоаппарат. Так, если запросу соответствует лишь ограниченное количество документов или объектов, необходимо Результаты всех поисковиков здесь очень близки показать их все. В то же время, по многозначному (рис. 14), но для повышения разнообразия выдачи запросу стоит выдать как можно более разно­ еще есть около 20 процентных пунктов. образные результаты поиска, чтобы угодить любому из пользователей вне зависимости от того, что именно он имел в виду. При этом важно обратить ДАВЛЕНИЕ ОПТИМИЗАТОРОВ внимание на возможные трактовки запроса. Анализатор SEO-прессинга вычисляет показате- Разнообразие результатов поиска оценивается по ли наполненности выдачи коммерческими стра- разным параметрам: тематический поиск, поиск ницами по запросам, не являющимся очевидно омонимов, преобладание коммерческих сайтов. коммерческими.
  • 22.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 14. тепень разнообразия поисковой выдачи по запросам-омонимам С в поисковиках Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 80 70 60 50 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 22 Стоит отметить, что уровень от 20 до 30% у всех которым может лишь ограниченное количество поисковиков (рис. 15) свидетельствует об адек- объектов (например, музеи Омска). ватной доле коммерческих сайтов в выдаче. Тем не менее, речь может идти о простом устаревании Особый интерес в связи с этим анализатором пред- тем, по которым созданы запросы анализатора, ставляет тот факт, что в конце 2012 года Mail.ru а также о том, что в связи с постоянным развитием за счет серьезного рывка обогнал по качеству этой методов работы оптимизаторов SEO-прессинг стал стороны поиска своих конкурентов (рис. 16). менее агрессивным, но более вариативным. ПОЛНОТА ИНДЕКСА ТЕМАТИЧЕСКИЙ ПОИСК Одним из важнейших критериев качества поиско- Тематический анализатор проверяет, попадают ли вика является полнота индекса, ведь чем больше официальные сайты искомых объектов в выдачу страниц известно системе, тем больше запросов по соответствующему запросу. получат релевантные ответы. Для создания анализатора специалисты компании Анализатор полноты сравнивает размеры индекса подбирали тематические запросы, соответствовать поисковиков, используя очень редкие слова, встре-
  • 23.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 15. Уровень «коммерции» в выдаче поисковиков Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 35 30 25 20 15 10 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 23 чающиеся в Интернете лишь на нескольких десятках страниц. Таким образом достигается возможность посчитать все страницы с определенным словом, найденные конкретным поисковиком. В 2012 году полнота индекса Google впервые стала больше, чем у «Яндекса», а в определенные моменты года — существенно ее превышала (рис. 17). В то же время, полнота других иностранных поиско- виков — Bing и Yahoo — остается крайне низкой. Здесь же стоит обратить внимание на пока весьма заметное отставание от лидеров Mail.ru. Вероятно, это может оказывать влияние и на другие аспекты работы этого поисковика.
  • 24.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 16. Качество тематического поиска в поисковиках Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 40 30 20 10 24 Рис. 17. Полнота индекса поисковиков Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 80 60 40 20 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 25.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 7. ПОИСК ИЗ ­РЕГИОНОВ 25 ПО ДАННЫМ «ЯНДЕКСА», ДОЛЯ ГЕО- Проект AnalyzeThis обладает специальной инфра- ЗАВИСИМЫХ ЗАПРОСОВ СОСТАВЛЯЕТ структурой для оценки связанных с геозависи- ДО 30%, ПОЭТОМУ УМЕНИЕ РАБОТАТЬ мостью аспектов поиска; кроме Москвы серверы С НИМИ ЯВЛЯЕТСЯ ОДНИМ ИЗ ВА Ж- находятся в девяти городах России, от Владивостока НЕЙШИХ ДЛЯ ПОИСКОВОЙ СИСТЕМЫ. до Краснодара; именно с них ежедневно задаются запросы соответствующих анализаторов. Одним из важных параметров поискового запроса является геозависимость — или, наоборот, гео- РЕГИОНАЛЬНО-НАВИГАЦИОННЫЙ независимость. Очевидно, что результаты поиска АНАЛИЗАТОР по запросам вроде верховный суд россии или рецепт суши не должны зависеть от того, из какого Задачей Анализатора региональной навигации города они заданы. является проверка того факта, что по запросам, нацеленным на поиск конкретной организации, В то же время, для таких запросов как городской находятся именно соответствующие региону стра- суд или доставка суши расположение пользователя ницы (региональные отделения партий, органы становится принципиальным: кому в Новосибирске власти субъектов федерации, региональные интересна доставка суши в Новгороде? порталы СМИ и т. д.).
  • 26.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 18. Качество регионального навигационного поиска в поисковиках Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 80 60 40 20 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 26 Здесь, в отличие от обычных навигационных ана- ветствуют региону, но запросы в нем не подраз- лизаторов, не всегда важно показать искомую умевают нахождения конкретных сайтов. страницу первой (выше может быть, например, основной сайт соответствующей организации), Результаты проверяются по наличию в сниппетах но наличие региональной страницы в первой ключевых слов: названия города или региона, десятке безусловно необходимо. правильного телефонного кода и т. п. Таким образом подчеркивается не только важность Однако справляются с этой задачей поисковики нахож дения результата из нужного региона, пока не блестяще: лучшие усредненные по всем но и необходимость сделать региональную при- городам результаты — у «Яндекса» и Google — надлежность страниц заметной. в районе 70% (рис. 18). В отличие от предыдущего анализатора, здесь рас- сматриваются в том числе и запросы из Москвы. АНАЛИЗАТОР Как оказалось, и в этом случае существенная РЕГИОНАЛЬНОГО ПОИСКА часть результатов относится к другим регионам. Анализатор регионального поиска также проверяет, Стоит отметить превосходство «Яндекса» в этом что найденные поисковиками страницы соот- аспекте поиска — как в целом (рис. 19), так
  • 27.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 19. ревосходство «Яндекса» и рост Mail.ru в региональном поиске П в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 80 60 40 20 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 27 и в отдельных городах. Соответствующие графики доступны на сайте analyzethis.ru. Главной тенденцией в региональном поиске в 2012 году стал заметный прогресс Mail.ru, позволивший ему уже сейчас навязывать лидерам борьбу, а по отдельным параметрам — и опе- режать их.
  • 28.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 8. ПОНИМАНИЕ ЗАПРОСА 28 РОБОТ НЕ ВСЕГДА МОЖЕТ ОТЛИЧИТЬ Безусловно, обратной стороной подобных действий КОРРЕКТНЫЙ ЗАПРОС ОТ НЕКОР- является появление ошибок интерпретации запроса, РЕКТНОГО. ПОЯВЛЕНИЕ ОШИБОК для изучения которых в 2012 году появилась целая ИНТЕРПРЕТАЦИИ ЗАПРОСОВ ПРИВЕЛО группа анализаторов. Однако ситуации, где коррекция К СОЗДАНИЮ В 2012 ГОДУ НОВОЙ заданного запроса необходима, встречаются куда чаще. ГРУППЫ АНА ЛИЗАТОРОВ. УСТОЙЧИВОСТЬ К ОПЕЧАТКАМ КАЧЕСТВО ПОДСКАЗОК Анализаторы ежедневно задают поисковикам К сожалению, задача оценить с помощью робота, несколько сотен запросов с заведомыми опечат- насколько хорошо другой робот понимает человека, ками, после чего вычисляют: пока не представляется решаемой. В то же время, некоторые параметры понимания достаточно легко ff насколько часто были предложены (или даже проверить. Так, предложение человеку чуть изменить произведены) правильные замены запроса; свой запрос, а иногда и автоматическое его изме- нение для достижения лучших результатов давно ff насколько часто правильная форма встретилась стало одной из привычных функций поисковика. в результатах поиска.
  • 29.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 20. ысокий уровень качества подсказок в поисковиках Рунета В в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 0 29 Стоит отметить, что результаты по обоим параме- трам недалеки от идеальных: более 90% у тройки лидеров. Причем если предлагать качественные подсказки поисковики умеют давно (рис. 20), то умение находить при этом правильные формы в 2012 году заметно улучшилось (рис. 21). Отставание Yahoo и Bing от лидеров заметно в обоих случаях, и особенно — при поиске правильных слов.
  • 30.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 21. овышение устойчивости к опечаткам поисковиков Рунета П в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 30
  • 31.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 9. АНАЛИЗАТОРЫ ОШИБОК 31 ОБРАТНОЙ С ТОРОНОЙ ВЫСО- ошибок обычно превышают 50% (рис. 22 для слов ЧАЙШИХ РЕ ЗУЛЬТАТОВ, ДЕМОН- и рис. 23 для фраз). С ТРИРУЕМЫХ ПОИСКОВИК АМИ В ПОНИМАНИИ ЗАПРОС А, ЯВЛЯЕ ТС Я Одной из распространенных ошибок является раз- ПОЯВЛЕНИЕ БОЛЬШОГО КОЛИЧЕ- биение запроса на отдельные слова. Анализатор С ТВА ОШИБОЧНЫХ ИНТЕРПРЕ ТАЦИЙ поиска имен (рис. 24) подчеркивает проблему ПОИСКОВЫХ ЗАПРОСОВ. ДОПУ- на примере запросов, состоящих из имени и фами- СК АЕМЫЕ ОШИБКИ ПОРОЙ МОГ У Т лии: поисковики регулярно находят страницы, ПОК А ЗАТЬС Я СМЕШНЫМИ, А МОГ У Т где есть и имя, и фамилия из запроса, но отно- И РА ЗДРА Ж АТЬ. сящиеся к разным людям. Разумеется, подобные действия ничуть не приближают пользователя При вводе в поисковую строку достаточно редких к поставленной цели. слов (например, ботник, изоиония, магнитохрон) или словосочетаний с редкими словами (например, На графике (рис. 22) видно, что у Mail.ru и «Яндекса» аэропорт гуари или княжество тубот) поисковики очень высокая доля ошибок при замене редких автоматически исправляют ошибочное на их взгляд слов — больше 60%. У Google чуть лучше — менее слово на более распространенное, но имеющее 50%. Но хуже всего у Yahoo — почти 90% таких мало отношения к предмету поиска. Доли таких ошибок.
  • 32.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 22. Уровень ошибочных замен редких слов в поисковиках Рунета (данные собираются с июня 2012 года) % Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 32 Меньше всего ошибок при замене редких фраз Созданная в 2012 году группа «анализаторов оши- допускает Google — около 30%, хотя за послед- бок» сразу же подчеркнула серьезную проблему ние несколько месяцев ситуация ухудшилась в качестве работы поисковых систем. Работы (рис. 23). Совсем плохо с такими ошибками по нахождению и систематизации других видов в поиске Yahoo — 85% ошибок. «Яндекс» и Mail.ru ошибок в проекте AnalyzeThis будут продолжены. допускают ошибки при поиске редких фраз при- мерно в 60% случаев. Впрочем, словосочетания, не являющиеся именами, поисковики разбивают даже чаще. По отдельным сложным запросам можно не найти ни одной страницы, где связность была бы сохранена. И это при том, что такие документы заведомо есть. Google сохраняет связность примерно 60% сло- восочетаний, выступая, таким образом, заметно лучше конкурентов (рис. 25). Однако и ему есть куда расти. У «Яндекса» и Mail.ru результаты при- мерно одинаковы — около 40%.
  • 33.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 23. Уровень ошибочных замен словосочетаний, содержащих редкие слова, в поисковиках Рунета (данные собираются с августа 2012 года) % Август Сентябрь Октябрь Ноябрь Декабрь 100 80 60 40 20 Рис. 24. ачество поиска имен в поисковиках Рунета К 33 (данные собираются с августа 2012 года) % Август Сентябрь Октябрь Ноябрь Декабрь 80 60 40 20 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 34.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 25. Качество поиска неразрывных словосочетаний в поисковиках Рунета (данные собираются с октября 2012 года) % Октябрь Ноябрь Декабрь 70 60 50 40 30 20 10 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 34
  • 35.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 10. АНАЛИЗАТОРЫ РАЗДРАЖАЮЩИХ ФАКТОРОВ 35 ПОЛЬЗОВАТЕЛИ Ж ДУ Т ОТ ПОИС- Интересной тенденцией является рост за второе КОВИКОВ ВЫДАЧИ НА ВЕРХНИХ полугодие 2012 года показателей почти на 10% ПОЗИЦИЯХ БОЛЕЕ К АЧЕСТВЕННЫХ у всех поисковых систем (рис. 26). САЙТОВ, С МЕНЬШИМ КОЛИЧЕСТВОМ РЕК ЛАМЫ, БЕЗ ВИРУСОВ И ПОРНО- В среднем «Яндексу» и Google удается удержи- ГРАФИЧЕСКИХ БАННЕРОВ. ДЕЙСТВИЯ вать уровень поискового спама в пределах 6—7%. ПОИСКОВИКОВ В ЭТОМ НАПРАВЛЕ- В Mail.ru поискового спама чуть больше, особенно НИИ ДОСТАТОЧНО ЭФФЕКТИВНЫ, заметен прорыв в сентябре-ноябре, когда спам был НО НЕ БЕЗОШИБОЧНЫ. заметен в 11% случаев. ПОИСКОВЫЙ СПАМ УРОВЕНЬ ПОРНОГРАФИИ Специалисты компании «Ашманов и партнеры» Важным результатом 2012 года стало резкое плотно занимаются изучением и классификацией уменьшение весной количества материалов поискового спама, что позволяет соответствующе- для взрослых в выдаче Google по «обычным», му анализатору оценивать долю этого серьезного т.е. не подразумевающим однозначного пор- раздражителя в выдаче каждого из поисковиков. нографического контекста, запросам. Теперь
  • 36.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 26. Количество поискового спама в поисковиках Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 20 15 10 5 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 36 его результаты находятся на уровне «Яндекса» КАЧЕСТВО СЕМЕЙНОГО ФИЛЬТРА и Mail.ru (рис. 27). В «Яндексе» и Mail.ru сайты для взрослых нежелательно встречаются в 6% При включенном «семейном фильтре» поисковики случаев. пока не научились достигать нулевых результатов, хотя качество фильтров за 2012 год немного улуч- Результаты работы анализатора качества семейного шилось (рис. 28). Учитывая, что не ожидаемое фильтра показывают, что даже при жесткой филь- пользователем порно является очень сильным раз- трации сайты для взрослых все равно появляются дражающим фактором, назвать текущие результаты в поисковой выдаче. приемлемыми все еще нельзя. Таких сайтов в наиболее популярных поисковых системах очень мало: в «Яндексе» — менее 1%, КОЛИЧЕСТВО РЕКЛАМЫ в Google — также примерно на уровне 1%. Чуть больше их в Mail.ru — в течение года было в среднем Показатели рекламной нагрузки за 2012 год прак- 3%, а к концу года уменьшилось до 1,43%. тически не изменились для всех поисковиков, хотя в течение года можно наблюдать синхрон- В Bing и Yahoo опасно много порносайтов в резуль- ные скачки и падения (рис. 29). Сейчас средняя татах поиска. рекламная загруженность страниц, находимых
  • 37.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 27. оличество «сайтов для взрослых» в выдаче по не явно К порнографическим запросам поисковиков Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 40 30 20 10 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 37 лидерами поиска, оценивается в 10‑12 баллов. но опасных сайтов из выдачи, по крайней мере, Это соответствует одному большому рекламному из первой ее страницы. Стоит признать, что таких баннеру и одному-двум маленьким. сайтов и сейчас менее процента в выдаче абсо- лютно всех поисковиков, причем их результаты Количество порнорекламы за прошедший год еще весьма близки (рис. 31). немного уменьшилось. Любопытными и в этом слу- чае являются почти синхронные скачки результатов лидеров (рис. 30). КОЛИЧЕСТВО ВИРУСОВ Вероятно, самый опасный вид нежелательного контента на страницах — вирусы. Несмотря на то, что поисковики стараются предупреждать о воз- можности заражения на сайте, одних предупреж- дений часто оказывается недостаточно. Поэтому желательным является исключение потенциаль-
  • 38.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 28. ачество работы семейного фильтра поисковиков Рунета К в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 40 30 20 10 0 38 Рис. 29. ровень рекламной нагрузки на сайтах из поисковой выдачи У поисковиков Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 15 10 5 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 39.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 30. ровень порнорекламы на сайтах из поисковой выдачи У в поисковиках Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 3,5 3,0 2,5 2,0 1,5 1,0 0,5 0 Рис. 31. Доля сайтов с вирусными угрозами в выдаче поисковиков Рунета 39 в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 2,5 2,0 1,5 1,0 0,5 0 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 40.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 11. ОБЩИЕ ХАРАКТЕ- РИСТИКИ ПОИСКА 40 В 2012 ГОДУ НА ANALYZETHIS.RU загрузки в среднем по всем запросам и различным ПОЯВИЛОСЬ НЕСКОЛЬКО НОВЫХ городам. Значения вычисляются в момент получения А ­ НА ЛИЗАТОРОВ, ДАЮЩИХ ПРЕД- результатов Анализатора регионального поиска. СТАВЛЕНИЕ О НЕКОТОРЫХ ДОПОЛ- НИТЕЛЬНЫХ ПАРАМЕТРА Х РАБОТЫ В 2012 году все поисковики загружают результаты ­П ОИСКОВЫХ СИСТЕМ. менее чем за секунду, самые быстрые — Google и Mail.ru (рис. 32). СКОРОСТЬ ПОИСКА АПДЕЙТЫ Одним из параметров, влияющих на отношение пользователя к поисковой системе, является скорость Анализатор апдейтов — обновлений поисковой выда- выдачи ей результатов поиска. Конечно, в случае чи — сравнивает выдачу поисковиков за последние медленного соединения пользователя с Интернетом два дня. В случае большого обновления индекса это не слишком важно. Однако с ростом числа количество изменений будет бросаться в глаза пользователей высокоскоростных каналов подклю- на графике этого анализатора. Его результаты — чения скорость становится все более актуальной. не оценочная характеристика, это лишь дополни- Анализатор скорости поиска рассчитывает время тельная информация о работе различных систем.
  • 41.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 32. Среднее время загрузки результатов поиска в поисковиках Рунета в 2012 году Сек. Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 1,2 1,0 0,8 0,6 0,4 0,2 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 41 Как можно видеть на графике (рис. 33), лиде- по отдельным параметрам); Yahoo и Bing пока ры поиска в 2012 году придерживались ров- заметно не дотягивают до их уровня. ного и незначительного уровня ежедневных обновлений. КАЧЕСТВО СНИППЕТОВ С лета 2012 года специально обученные люди (асессоры) ежедневно изучают страницы, полу- Дополнительно асессоры оценивают качество ченные различными поисковиками по сотне подо- сниппетов, выдаваемых поисковиками к изучаемой бранных запросов, и оценивают их с точки зрения странице: их соответствие странице, заголовки, релевантности и качества. качество текстов и состав. Строгие асессорские инструкции и методика работы позволяют сохранять Любопытно, что за второе полугодие 2012 года объективность даже ручных оценок. «Яндекс», пусть и совсем незначительно, но смог обогнать Google по качеству асессорских оценок. На графиках видно, что качество сниппетов всех Впрочем, анализатор скорее иллюстрирует общую поисковиков постепенно растет (рис. 34), в то время ситуацию с качеством поиска в Рунете: «Яндекс» как качество выдачи меняется разнонаправленно, и Google лидируют, находясь близко друг к дру- хоть и незначительно (рис. 35). гу, Mail.ru стремительно догоняет (уже обогнав
  • 42.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 33. Уровень апдейтов в поисковиках Рунета в 2012 году % Январь Февраль Март Апрель Май Июнь Июль Август Сентябрь Октябрь Ноябрь Декабрь 30 20 10 0 42 Рис. 34. ачество сниппетов в выдаче поисковиков Рунета К (данные собираются с июля 2012 года) баллы Июль Август Сентябрь Октябрь Ноябрь Декабрь 0,90 0,85 0,80 0,75 0,70 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex
  • 43.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ Рис. 35. Асессорские оценки поиска, июль-декабрь 2012 года (данные собираются с июля 2012 года) % Июль Август Сентябрь Октябрь Ноябрь Декабрь 0,80 0,75 0,70 0,65 0,60 ■ Bing ■ Google ■ Mail ■ Yahoo ■ Yandex 43
  • 44.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 1. ОСНОВНЫЕ СОБЫ- ЧАСТЬ 2 ТИЯ НА РЫНКЕ ПОИСКА В РУНЕТЕ В 2012 ГОДУ 44 ПРОШЕДШИЙ ГОД БЫЛ ОТМЕ- Закон вступил в силу 1 сентября 2012 года, а 1 ноя- ЧЕН РОС ТОМ ИСПОЛЬЗОВАНИЯ бря заработал «Единый реестр запрещенных сай- И ­ НТЕРНЕТ-СЕРВИСОВ К АК ИНС ТРУ- тов» — список ресурсов, содержащих запрещенную МЕНТОВ ГРА Ж Д АНСКОЙ И ПОЛИ- к распространению в России информацию. Сайт ТИЧЕСКОЙ АКТИВНОС ТИ, А ТАК ЖЕ может попасть в реестр, если на него пожаловались МНОЖЕС ТВОМ РЕГ УЛЯЦИОН- пользователи. НЫХ ИНИЦИАТИВ СО С ТОРОНЫ ­Г ОС УД АРС ТВА. 30 ноября ответственный за ведение реестра Роскомнадзор сообщил, что ему поступают жалобы на поисковые системы. Однако ведомство считает, ПОЛИТИЗАЦИЯ РУНЕТА что поисковики не являются владельцами или про- И РОСТ УЧАСТИЯ ГОСУДАРСТВА вайдерами запрещенных сайтов, поэтому в «черный В ЕГО РАЗВИТИИ список» внесены быть не могут. Особенно важным для поисковиков стало принятие За кэшированный контент в поисковом индек- Федерального закона Российской Федерации № 436 се сервисы тоже ответс твеннос ти не несу т. «О защите детей от информации, причиняющей Од нако д а же с ай т ы с «и н дул ь г е н ц ия м и» вред их здоровью и развитию». в ноябре-декабре периодически оказывались
  • 45.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ з ­ аблокированными. Роскомнадзор объяснял эти Развитие мобильного поиска «Яндекса» и Google случаи техническими сбоями. объединяет как минимум одно магистральное направление: в «Яндексе» его называют «интентный Еще до того как вышеупомянутый закон вступил в силу, поиск», подразумевая стремление показывать поль- летом 2012 года «Яндекс» выступил с протестом про- зователю не выдачу, а готовый ответ, информацию, тив «черного списка». Кроме него подобными акци- соответствующую его намерениям и потребностям. ями отметились «Википедия», «ВКонтакте», «Живой Журнал». Google написал в корпоративном блоге пост о том, что новый закон угрожает свободному Интернету. ОБОСТРЕНИЕ СОПЕРНИЧЕСТВА Он же в декабре собирал подписи «против цензуры В ОБЛАСТИ ДИСТРИБУЦИИ в Интернете» с целью воспрепятствовать изменению СЕРВИСОВ регламента Международного союза электросвязи. По мнению Google, поправки в регламент оправдали Дистрибуция сервисов — еще одна тенденция, бы государственную цензуру Интернета во множестве которая стала заметной в 2011 году и особенно стран. Заседание МСЭ состоялось 15 декабря 2012 актуальной — в 2012 году. Представители поис- года, поправки были приняты. ковых систем признают: в области качества поиска конкуренты на рынке практически не отстают друг ФЗ №436 содержит в себе еще одну потенциальную от друга. Поэтому особенно важной стала способ- проблему для поисковиков. Он требует снабжать ность заключать партнерства и интегрировать любую информацию метками, указывающими свои технологии в другие сервисы и на сторонние ограничения по возрасту. Поисковики не могут сайты, завоевывая таким образом аудиторию. 45 маркировать ссылки в своей выдаче, так как не спо- собны сами определить, какой возрастной категории В 2012 году в гонку дистрибуции активно вклю- соответствует информация о странице. Технологий чилась Mail.ru Group, которая снова озвучила и инструкций, позволяющих сайтам передавать амбициозные цели по развитию и продвижению поисковым роботам эту информацию, тоже пока нет. собственного поиска. Дистрибуция поиска этой компанией признавалась некоторыми экспертами самой агрессивной. РОСТ ИСПОЛЬЗОВАНИЯ ИНТЕРНЕТА С МОБИЛЬНЫХ Google оказался в наиболее удачной позиции УСТРОЙСТВ благодаря популярности своего браузера Chrome. Летом 2012 года он подписал соглашение с Mozilla По статистике LiveInternet, с устройств на Android Firefox и стал в этом браузере поисковой системой и с телефонов iPhone на сайты Рунета в январе 2012 по умолчанию минимум на три следующих года. года совершалось 2,7% и 1,6% всех переходов За это Google будет выплачивать Mozilla почти соответственно, а в декабре — 9,1% и 3,7% соответ- $300 млн ежегодно. ственно. Тенденция была заметна давно, но в 2012 году «Яндекс» особенно энергично взялся за раз- «Яндекс» был вынужден догонять обоих соперников — витие мобильных сервисов, запустив и улучшив более агрессивного и более успешного. В 2012 году множество приложений для различных устройств. компания обновила свою политику дистрибуции —
  • 46.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ принципы сотрудничества с компаниями и отбора с информационными сервисами, подстраивающи- продуктов для включения в них своих сервисов. мися под пользователя. В сентябре 2012 года Аркадий Волож презентовал О конкретных шагах в этой области каждой из поис- собственный браузер «Яндекса», созданный на основе ковых систем мы поговорим подробнее в посвя- Google Chromium. Незадолго до этого Mail.ru Group щенных им главах обзора. сообщила о начале тестирования своего социального браузера «Амиго». «Яндекс.Бар» перестал существо- вать — вместо него появились «Элементы» — набор ИНТЕГРАЦИЯ СОЦИАЛЬНЫХ СЕТЕЙ дополнений, адаптированных под разные браузеры В ПОИСКОВЫЕ СИСТЕМЫ и предоставляющих доступ к ресурсам «Яндекса». Продолжается интеграция пользовательских связей В феврале «Яндекс» договорился о совместной и контента из социальных сетей в поисковую выдачу. дистрибуции со Skype, а осенью — о предоставле- Представители социальных сетей активно продают нии своей технологии для поиска по картам Apple свои рекламные возможности, запускают новый в iPhone, iPad и iPod. функционал, обучают рекламодателей пользоваться им. В декабре «ВКонтакте» запустил рекламную В ноябре стало известно, что «Яндекс» станет поис- сеть, в которую пока принимаются только прило- ком по умолчанию в смартфонах Nokia, Samsung жения этой же социальной сети, но в ближайшем и HTC на Windows Phone, которые будут прода- будущем начнут подключаться сторонние сайты. 46 ваться в России. С весны 2012 года крупные игроки рекламного рынка Рунета тестируют покупку и продажу рекламы ПЕРСОНАЛИЗАЦИЯ ПОИСКА по модели RTB. «Яндекс» к осени 2012 года разра- ботал технологический стек для RTB — аукционный Технологии подстройки поисковой выдачи под кон- движок для сайтов, SSP и DSP-платформы, «кру- кретного пользователя давно числились среди люби- тилку» баннеров, платформу обработки данных мых тем при обсуждении будущего поисковиков. для показа рекламы. Частью этой платформы В 2012 году такие технологии стали настоящим. стала технология «Крипта», которая анализирует поведение пользователей в Интернете и определяет «Яндекс» весь 2012 год персонализировал поиско- их социально-демографические характеристики. вые подсказки, а в декабре запустил новый поис- ковый движок «Калининград», персонализирующий Google объявил о скором запуске на российском и результаты поиска. рынке своей RTB-площадки Ad Exchange, которая организует взаимодействие AdWords и AdSense Google работал над персонализацией выдачи на основе статического аукциона, а также глобаль- с помощью своей социальной сети Google+. Даже ной платформы DoubleClick Digital Marketing. Эта «Рамблер», который еще в прошлом году покинул платформа объединит сервисы для размещения ряды поисковых компаний, запустил в декабре и анализа разных типов рекламы: контекстной, новую — персонализированную — главную страницу дисплейной, в видео, в социальных сетях.
  • 47.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 2. «ЯНДЕКС» В 2012 ГОДУ 47 К АК И ВЕСЬ РУНЕТ, «ЯНДЕКС» В 2012 народных биржах должны были бы одобряться ГОДУ ОЩУ ТИЛ НА СЕБЕ ПОВЫ- государством; однако этого не произошло. ШЕННОЕ ВНИМАНИЕ С АМЫХ РА З- НЫХ ГОС УД АРС ТВЕННЫХ ОРГАНОВ Зимой 2012 года «Яндекс.Деньги» и «Сбербанк» И С ТРУКТ УР. создали совместное предприятие, а вскоре после объявления об этом премьер-министр Дмитрий Медведев посетил офис «Яндекса», где ему пока- ОТНОШЕНИЯ С ГОСУДАРСТВОМ зали поиск, карты и браузер. Летом депутаты Госдумы предложили внести в спи- сок объектов стратегического значения крупные рос- РЕФОРМА СТРУКТУРЫ сийские интернет-компании: «Яндекс», «ВКонтакте», УПРАВЛЕНИЯ В КОМПАНИИ Mail.ru Group и другие, чьи сайты посещают более 20 млн пользователей в месяц. В марте «Яндекс» сообщил об изменении организа- ции взаимодействия разработчиков и менеджеров. Если бы законопроект был принят, покупка более Представители компании так прокомментировали 10% акций таких компаний иностранным инвестором реструктуризацию: «Ориентация на продукт при- или размещение акций таких компаний на между- ведет к тому, что фактически внутри «Яндекса»
  • 48.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ появится много стартапов; каждый продукт внутри МОБИЛЬНЫЕ СЕРВИСЫ, любого большого продуктового направления — это СВЯЗАННЫЕ С ПОИСКОМ своеобразный стартап. Результаты появившегося в 2011 году поиска Вокруг продуктов будет организованная струк- «Яндекса» по приложениям (appsearch.yandex.ru) тура, благодаря которой в компании из 4000 стали подмешиваться в основную выдачу. В марте человек можно поддерживать порядок со всеми владельцы устройств на Android получили воз- сопутствующими ему вещами, такими как общее можность использовать системную оболочку Shell, планирование, например. в которую встроены поиск и сервисы «Яндекса». Другими словами, менеджер сервиса полностью Летом поисковое приложение «Яндекса» под Android отвечает за свой кусок — по сути, у него свой стартап. научилось давать пользователю готовый ответ — При этом он находится внутри большой системы например, прогноз погоды по запросу «погода» и пользуется преимуществами всей инфраструкту- или адреса заведений на карте по запросу «кафе». ры компании». Реструктуризация сопровождалась слухами о заметных кадровых потерях. В ноябре появилось новое поисковое приложение для iPad. Оно тоже умеет давать готовые ответы. Выпустил «Яндекс» и приложение, позволяющее ПРОГРАММА ПСИ управлять с iPhone кампаниями «Директа». 48 В феврале «Яндекс» объявил о старте «Программы ПСИ» — «Поиска по социальному Интернету». ПЕРСОНАЛИЗАЦИЯ Цель программы — улучшение качества поис- РЕЗУЛЬТАТОВ ПОИСКА ка с помощью контента из социальных сетей. В рамках программы был запущен поиск людей. В декабре 2012 года «Яндекс» объявил о запуске На отдельном домене people.yandex.ru появился новой поисковой платформы «Калининград», сервис для поиска людей в соцсетях по имени, которая обеспечивает пользователям персонали- возрасту, месту жительства, учебы и работы. зацию поиска. Сообщается, что новая технология В «большом» поиске по запросам, содержащим анализирует поведение пользователя, учитывает имена и фамилии, также стали обильно появляться информацию о нем и его интересы при форми- профили из соцсетей. ровании выдачи и улучшает качество ответов на 75—80% запросов. Другой запуск в рамках социального поиска — поиск по контенту «Твиттера». Социальная сеть К персонализации «Яндекс» шел давно, начав предоставила «Яндексу» полный доступ к сво- в 2011 году с учета местоположения и языковых им данным, которого в прошлом году лишился предпочтений пользователя. Важным направлени- Google. Содержимое из «Твиттера» подмешивается ем работы над персонализацией стало улучшение в результаты «большого поиска» и доступно в поис- поисковых подсказок. Подсказки начали учитывать ке по блогам. Его также можно искать отдельно предыдущие запросы в рамках той же сессии, с помощью twitter.yandex.ru. показывать пользователю сайты, на которые он
  • 49.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ часто заходит. Персонализированные подсказки В июне 2012 года «Яндекс» приобрел долю в компа- появились на картах «Яндекса». нии «Сейсмотек» и предоставил ей свои технологии и ресурсы для обработки данных сейсморазведки, Повысилась и не связанная с персонализацией получаемых в ходе поиска месторождений нефти функциональность подсказок. В рамках программы и газа. «интентный поиск» подсказки были обучены сразу выдавать цифры и факты: коды городов, валюты, химические формулы, имена знаменитых людей МИРОВАЯ ЭКСПАНСИЯ и другую информацию. А если к англоязычному запросу добавить слово «перевод», то перевод В 2011 году «Яндекс» открыл офис в Стамбуле запроса появится прямо в подсказке. и портал с сервисами, рассчитанными на турец- кую аудиторию. В 2012 году экспансия в дальнее зарубежье продолжилась. Были открыты офисы РАЗВИТИЕ МИКРОРАЗМЕТКИ по продаже и продвижению рекламных продуктов в Цюрихе и Люцерне (Швейцария). Люцернский Объявив о поддержке Schema.org в конце 2011 офис возглавил Бернар Люке, который до этого года, специалисты компании «Яндекс» включились был гендиректором онлайн-супермаркета Ozon.ru. в деятельность международной рабочей группы. В январе 2012 года компания приобрела карты В 2012 году они внесли предложение об улучшении от ведущего мирового поставщика картографи- формата для навигационных цепочек, поучаство- ческих данных, компании NAVTEQ. Эти карты вали в создании спецификации формата разметки будут использованы для создания подробной 49 ТВ- и радиопрограмм и предложили новый формат карты мира на «Яндекс.Картах». для указания целевой аудитории сайта. Компания также поучаствовала в ряде тематических международных конференций. Летом 2012 года в «Яндекс.Вебмастер» был добавлен валидатор микроразметки. ПОИСКОВЫЕ СЕРВИСЫ ДЛЯ НАУЧНЫХ ПРОЕКТОВ В марте 2012 года «Яндекс» объявил о сотрудни- честве с CERN — Европейским центром ядерных исследований. «Яндекс» создал поиск по собы- тиям — данным о поведении частиц в процессе экспериментов. Компания также представила мощ- ности для обработки и хранения информации, полученной в ходе экспериментов.
  • 50.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 3. GOOGLE В 2012 ГОДУ 50 В 2012 ГОДУ КОМПАНИЯ GOOGLE Пейдж выделил следующие магистральные направ- ПРОВЕЛА МАСШТАБНУЮ РЕОР- ления работы: ГАНИЗАЦИЮ И СДЕЛА ЛА СТАВКУ НА ­ ЕРСОНА ЛИЗАЦИЮ ПОИСК А. П ff Сделать использование сервисов Google более простым, интуитивным. Люди не хотят прила- гать лишних усилий, у них должно оставаться НОВАЯ ГЛОБАЛЬНАЯ СТРАТЕГИЯ ощущение, что с помощью Google проблемы решаются сами. В апреле 2012 года Ларри Пейдж, занявший за год до этого должность CEO Google, опубликовал ff Научить поиск понимать различия между людьми в разделе «для инвесторов» корпоративного и отношения между ними. Выдача должна быть сайта документ об обновлении долгосрочной персональной, человек должен иметь возмож- стратегии компании. Пейдж отметил, что уже ность найти по имени и фамилии своего друга, в 2011 году началась работа по фокусированию а не тысячи его тезок. на ключевых для Google направлениях, и эта работа продолжится. Реорганизация сопрово- ff Научить поиск решать задачи человека, выдавать ждалась «большой чисткой» — закрылись десятки готовые ответы, а не набор ссылок, по которым неприоритетных сервисов. таковой может найтись. Если пользователь спраши-
  • 51.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ вает погоду, ему нужны не сайты о погоде, а ответ Особенно активно развивались геоинформаци- о том, какая температура на улице. Путь к реше- онные продукты: нию этой задачи лежит через сотрудничество с сервисами, владеющими данными. Например, ff добавились детализированные карты 45 россий- в 2011 году Google научился искать авиабилеты ских городов и панорамы 53 новых объектов; благодаря сотрудничеству с ITA Software. ff панорамы российских городов начали появляться ff Продолжать заниматься сервисами для мобиль- в картах Google именно в 2012 году: первыми ных устройств. стали панорамы Москвы и Петербурга. ff Сочетать краткосрочную и долгосрочную стра- Кроме того, открылась русскоязычная версия мага- тегию: развитие сервисов, которые дают деньги, зина контента и приложений Google Play. и инвестиции в инновационные разработки, которые изменят будущее. Главным направлением в работе российского Google стало зак лючение партнерских согла- ff Зарабатывать любовь и доверие у пользовате- шений и проведение мероприятий по популя- лей и партнеров. Любовь — следствие удобства ризации продуктов компании среди различных и стабильной работы сервисов. Доверие нужно, категорий пользователей. В ноябре в Москве чтобы пользователи не боялись хранить личную появилась «Академия преподавателей Google», и деловую информацию у Google. где работников сферы образования учат внедрять сервисы и продукты Google в учебный процесс. 51 Были организованы семинары по использованию ЗАСТОЙ НА РОССИЙСКОМ РЫНКЕ Google+ для бизнеса. В российском подразделении Google в 2012 году Особого интереса Google в этом году удостоились жизнь замерла. Летом гендиректор Google Россия российские регионы. Совместно с администра- Владимир Долгов ушел развивать в нашей стране цией Костромской области Google представил eBay. В августе генеральный директор появился проект «Кострома: Цифровое Преображение», у ООО «Гугл»: им стал Евгений Ильницкий, он цель которого — повышение интереса туристов отвечает за деятельность компании как юридиче- к Костроме. Специалисты Google дали рекомен- ского лица, но не является главой Google в России. дации по доработке сайта области, разработали рекламную кампанию в AdWords, завели городу Новости продуктов Google, касающиеся российского аккаунты в Google+ и YouTube. Для детей Google рынка, были связаны в основном с локализацией. устроил конкурс дудлов, изображающих их род- В поиске на русском языке стал доступен Knowledge ной город. Graph — выдача параллельно со ссылками фактов и другой информации, связанной с запросом (годы Совместно с правительством нижегородской жизни царей, карты городов, афиша театров и т. п.). области Google запустил программу «Понятный На Youtube заработало автоматическое формиро- Интернет» — пособие по сервисам Google для пожи- вание субтитров на русском языке. лых людей.
  • 52.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ ПЕРСОНАЛИЗАЦИЯ ПОИСКА СЕМАНТИЧЕСКИЙ ПОИСК И ФАКТЫ В ВЫДАЧЕ Весь 2012 год Google развивал свой социальный сервис и интегрировал его с остальными. Руководство В марте Google объявил, что собирается перера- Google+ предлагает понимать этот продукт как соци- ботать свои поисковые технологии, внеся в них альный слой, объединяющий все сервисы Google. самые значительные изменения за всю историю Пользователей энергично стимулируют заводить компании: аккаунты в Google+, использование некоторых продуктов Google без этого невозможно. Например, ff поиск станет семантическим — научится пони- с ноября пользователь, удаливший аккаунт на Google+, мать смысл запроса, его контекст, вопросы лишается доступа к своему каналу на YouTube. на естественном языке, определять связанные с ним понятия; Интеграция Google+ с поиском началась в январе 2012 года запуском программы «Search Plus Your ff запросы будут сопоставляться с «сущностями» World». В выдаче появился персональный контент из базы знаний, которую Google собирал пре- пользователя из Google+: его собственные фото, дыдущие два года; посты его друзей по связанной с запросом тема- тике, личная информация пользователей и друзей. ff база содержит сотни миллионов единиц инфор- мации о людях, местах и других вещах; Прямо в подсказках при поиске по именам стали 52 появляться ссылки на профили друзей, при поиске ff специальный алгоритм будет распознавать и оце- по названиям брендов — ссылки на их страницы нивать информацию на проиндексированных в Google+ с возможностью там же, в выдаче, веб-сайтах на предмет ценности для показа подписаться на страницу. Многозначные запросы в поисковых результатах. Google научился понимать с учетом того, какое значение наиболее релевантно для пользователя. В Google надеются, что благодаря семантическому поиску люди будут проводить больше времени Помимо Google+ к персонализации поиска были на сайте поисковика, что позволит ему конкури- подключены Gmail, календарь и Google Drive — ровать по этому критерию с социальными сетями. облачное хранилище файлов и документов, которое появилось в 2012 году, поглотив Google В мае 2012 года начались первые эксперименты Docs. В результате в выдаче поисковой системы по показу пользователям новой выдачи. Результаты по отдельным запросам стало возможно увидеть работы семантического движка показывались собственные документы, письма из Gmail и события в правой половине экрана, параллельно со списком из календаря Google. ссылок. Пользователь может предлагать Google поправки к выдаваемой информации, отмечая В декабре 2012 года пользователи заметили, что факты, которые считает неверными. Google тестирует отображение личной инфор- мации пользователя из сервисов Ticketmaster К декабрю 2012 года «Граф Знаний» появился и Eventbrite. в поиске на итальянском, французском, японском
  • 53.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ и русском языках. Англоязычные пользователи В конце февраля стало известно, что Google обходит получили его еще осенью. настройки cookie в браузере Safari, разрешая своим сервисам оставлять у пользователя cookie, даже Локализация «Графа Знаний» представляет, по сло- если он заблокировал эту возможность. Подобным вам разработчиков Google, отдельную пробле- образом cookie оставлял Google+ и рекламные сер- му — ввиду разницы менталитетов и культур висы. Одновременно с этим команда разработчиков в разных языках одни и те же слова могут иметь Google Chrome работала с Apple, консультируя их разный смысл. по поводу устранения этой возможности. В июне поиск товаров Google Product Search был СКАНДАЛЫ переименован в Google Shopping и стал платным для магазинов. Выдача Product Search подмеши- Начало 2012 года выдалось у Google богатым вается в основную выдачу поисковика по товар- на события, вызвавшие шум в прессе и негатив- ным запросам, поэтому Google обвинили в том, ный отклик общественности. что у него в выдаче появились проплаченные результаты. В декабре еще один продукт — Google Сначала обнаружилось, что Google не закрыл Apps — стал платным, вызвав неудовольствие части от индексации ссылки на страницу загрузки браузе- пользователей. ра Chrome в рекламных постах, которые компания оплачивала блоггерам. Получилось, что Google сам делает то, с чем давно боролся, — покупает 53 ссылки для влияния на ранжирование. Компания наказала сама себя за нарушение собственных правил — забанила в поиске страницу загрузки Chrome на два месяца. В середине января кенийский каталог бизнес- организаций Mocality пожаловался на то, что Google уводит у него клиентов путем «холодных звонков». Сотрудники Google звонили в компании и говорили, что Mocality берет деньги за свои услуги — это утверждение не соответствовало действительности. В том же месяце обнаружилось, что сотрудники Google намеренно портят карты проекта Open Street Maps, удаляя или искажая геоинформацию. В февра- ле сотрудник Google написал на форуме, что если вы высоко ранжируетесь в Google, не покупая рекламу, то это ошибка, которую Google пытается исправить.
  • 54.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 4. ПОИСК MAIL.RU В 2012 ГОДУ 54 СОЗДАТЕЛИ ПОИСКОВОЙ СИСТЕМЫ пен голосовой ввод поискового запроса, причем MAIL.RU В 2012 ГОДУ СУЩЕСТВЕННО для распознавания голоса применяется технология ОБНОВИЛИ ТЕХНОЛОГИЧЕСКУЮ ПЛАТ- компании Nuance, которую использует и Apple. ФОРМУ И ПРОДЕМОНСТРИРОВА ЛИ УМЕНИЕ СЛЕДИТЬ ЗА ГОРЯЧИМИ ТРЕНДАМИ РЫНК А. ЗНАНИЯ В ВЫДАЧЕ На запрос, требующий конкретной информации ПОИСК ДЛЯ МОБИЛЬНЫХ и фактов для принятия решений, поиск Mail.ru УСТРОЙСТВ стремится давать пользователю ответ сразу на стра- нице результатов. В этом поисковая система похожа В 2012 году команда поиска Mail.ru занималась на Google и «Яндекс». модернизацией своего сервиса: приводила его в соответствие с духом времени и снабжала Основной базой знаний для Mail.ru являются мно- «джентльменским набором» функций, обязательных гочисленные контентные проекты Mail.ru Group. для популярного поисковика. Появилась мобиль- Благодаря им пользователи могут получать в выда- ная версия веб-поиска и поисковые приложения че информацию о лекарствах, государственных для разных платформ. В приложениях стал досту- праздниках, фильмах в прокате, читать гороскопы,
  • 55.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ видеть предложения по продаже автомобилей. поиска стала учитывать региональную специфику Из «Википедии» извлекаются ответы на вопросы сайтов. Команда поиска заявила, что улучшить вида «год рождения Пушкина», «высота Пизанской качество регионального поиска помогли 445 новых башни» и т. п. факторов ранжирования. По запросам, представляющим собой вопросы на естественном языке, в выдачу подмешивается ИНСТРУМЕНТАРИЙ содержимое «Ответов@Mail.ru». ДЛЯ ВЕБМАСТЕРА В ноябре 2012 года на конференции Optimization-2012 СВОЙ «МАТРИКСНЕТ» было объявлено о запуске сервиса для владель- цев и оптимизаторов сайтов — webmaster.mail.ru. В феврале Mail.ru объявил о начале открытого В «Кабинете Вебмастера» они могут посмотреть тестирования собственной технологии машин- входящие ссылки на сайт, запросы, по которым ного обучения поиска. Такая технология рабо- приходят пользователи, какие страницы проиндек- тает у «Яндекса» с 2009 года и носит название сированы, какие из них каким запросам релевантны, «Матрикснет». Mail.ru тестирует свою версию машин- какие страницы «Поиск Mail.ru» считает хорошими ного обучения на домене o.go.mail.ru. и по каким запросам. В ближайшее время появятся и другие инструменты. Эта версия работает следующим образом: специ- ально нанятые люди оценивают качество выдачи Было объявлено, что вебмастера получат доступ 55 по разным запросам, алгоритмы анализируют к поведенческим факторам ранжирования — данным их оценки и делают выводы о том, какая выдача о привлекательности сниппета и средней удовлет- кажется людям качественной и полезной, а какая — воренности пользователей сайтом. Эта информация нет. На основании этого анализа динамически позволит понять, насколько содержание документа изменяется формула ранжирования сайтов. соответствует тому, что пользователь ожидает увидеть по заданному запросу. ПОИСК ПО НОВОСТЯМ И РЕГИОНАЛЬНОСТЬ В 2012 году команда поиска энергично совершен- ствовала поиск по новостям. Результаты поиска стали выдаваться в виде сюжетов, с группировкой публикаций из разных изданий на одну и ту же тему. Выдачу поиска по новостям можно отфильтровать по категориям (политика, экономика и т. д.). Позже появился еще один фильтр — по регионам. Тогда же, в середине осени, новая версия основного
  • 56.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 5. СОЦИАЛЬНЫЕ СЕТИ КАК ИГРОКИ ПОИСКОВОГО РЫНКА 56 ПОК А «ВКОНТАКТЕ» ЗАНИМА ЛИСЬ ные из Facebook. В самом Facebook, на дополни- НАРАЩИВАНИЕМ ФУНКЦИОНА ЛЬ- тельной странице поиска, есть фильтр «найдено НОСТИ ПОИСК А, FACEBOOK СДЕЛА ЛИ в Интернете», который демонстрирует выдачу Bing. СТАВКУ НА СОЦИА ЛЬНЫЙ ГРАФ И ДОБАВИЛИ ПОИСКОВУЮ РЕК ЛАМУ. В сентябре Марк Цукерберг рассказал журнали- стам, что к поиску Facebook задается миллиард запросов в день, что над разработкой поиска уже СЛУХИ О ПОИСКЕ FACEBOOK работает команда специалистов, и что появление поискового продукта — вопрос времени. Эту Во второй половине 2012 года зарубежные хай- команду поисковых инженеров, состоящую из 24 тек-издания регулярно публиковали материалы человек, возглавляет Ларс Расмуссен, который о готовящемся поиске Facebook. Материалы можно пришел из Google. сгруппировать на основании двух сюжетных линий: переговоры с Microsoft и собственная разработка. Бета-версия поиска Facebook была анонсирована и запущена в тестирование в январе 2013 года. С поисковой системой Bing компания Facebook Проект, получивший название Graph Search, выпол- сотрудничает с 2010 года. В частности, Bing няет поиск с учетом накопленной информации включает в результаты поиска социальные дан- о пользователе.
  • 57.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ В августе 2012 года у Facebook появилась «поиско- вая реклама» — возможность для компаний купить подсказку-ссылку на свою страницу в Facebook, которая будет появляться по нужным запросам. Релевантности и вообще какой-то связи спонси- рованной подсказки с самим запросом Facebook от рекламодателя не требует. РАСШИРЕНИЕ ФУНКЦИОНАЛА ПОИСКА «ВКОНТАКТЕ» В отличие от своего американского аналога, «ВКонтакте» уже несколько лет развивает соб- ственную поисковую технологию. Поиск «ВКонтакте» умеет искать людей, сообщества, аудио- и видео- записи; кроме того, поддерживает поиск по текстам пользовательских постов и публичных страниц. Пользователям доступен поиск по собственным запи- сям или по записям любого другого пользователя. 57 В декабре у «ВКонтакте» появился расширенный поиск по новостям (постам пользователей и стра- ниц). Он научился учитывать количество «лайков», применять геолокацию, искать отдельно по постам и комментариям, искать ссылки на внешние сайты или на контент самой соцсети. Цель нововведения, по словам руководства соцсе- ти, — увеличить активность пользователей в области поиска по постам. Количество запросов к поиску «ВКонтакте» оценивается приблизительно как 100—200 млрд запросов в год. Это число учитывает только незакэшированные запросы.
  • 58.
    К АЧЕСТВО ПОИСКА И ПОИСКОВЫЕ СИСТЕМЫ В РУНЕТЕ 6. ВЫВОДЫ 58 Итак, основными тенденциями развития рынка поис- ff не просто адаптация интерфейсов под мобиль- ка в Рунете в 2012 году можно считать следующие: ные устройства, но и создание продуктов, учиты- вающих особенности использования Интернета ff активное государственное регулирование с таких устройств; интернет-рынка; ff превращение дистрибуции поиска в главное ff учет в поиске персонального поведения и потреб- средство борьбы за рынок и вытекающая из этого ностей пользователя, его связей в социальных необходимость заключать партнерства с произ- сетях; водителями софта, сервисов и устройств. ff стремление поисковиков отвечать на вопро- сы пользователей, выдавать сразу полезную информацию, а не список страниц, на которых ее можно найти; ff стремление поисковых компаний выйти за преде- лы веб-поиска и открыть новые области при- менения своих технологий;
  • 59.
    1 МОСКВА, 2013 «АШМАНОВ И ПАРТНЕРЫ» ВСЕ ПРАВА ЗАЩИЩЕНЫ.