4. “Localized CAPTCHA Testing on Users and Farms”,
Ekaterina Gladkikh, Kirill Nikolaev, Mikhail Nikitin, Yandex
Every day Yandex serves over 200 mln of user
requests. Additionally, from 30 to 40 mln searches
are made by various automated search bots, as
estimated by the company’s proprietary bot
detection algorithms.
Сколько роботов в поиске?
5. Вордстат?! :)
При доле коммерческого
трафика ~8% на коммерческие
запросы приходится всего ~16
mln запросов в сутки**.
При этом роботы генерируют
30-40 mln ежесуточно.
* Из отношения величины поискового
трафика на категорию “Товары и услуги” к
суммарному в рейтинге Liveinternet.ru
** В допущении, что кликогенерация по
коммерческим запросам примерно
соответствует средней по всему потоку
запросов.
6. Multi-armed bandits @Yandex
“Gathering additional feedback on search results
by multi-armed bandits with respect to
production ranking”,
Alexandr Vorobev, Damien Lefortier, Gleb Gusev, Pavel
Serdyukov, Yandex
12. Возраст домена vs прирост в индексе
Да, в выборке из ~80 тысяч
коммерческих сайтов есть
36, зарегистрированных в
80-х:
ge.com, ibm.com,
boeing.com, mit.edu, hp.com,
intel.com, polaroid.com,
ericsson.com, ford.com,
bbc.com, philips.com,
sony.com, oracle.com и
другие :)