Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Как работают поисковые системы

242 views

Published on

Презентация доклада на конференции «OpenIT».
Спикер: Мухаммад Муратов — Project Manager, Netpeak.
Алматы, 14 оноября, 2016.

Published in: Marketing
  • Be the first to comment

  • Be the first to like this

Как работают поисковые системы

  1. 1. Мухаммад Муратов Как работают ПС. Что такое SEO
  2. 2. Главная задача ПС Дать пользователю решение его задачи/проблемы. !Внимание! Поисковый запрос не равен задача.
  3. 3. Какие еще задачи решает ПС - Поиск новых и обновление старых документов - Обработка документов (индексация, кластеризация, фильтрация...) - Обработка запросов пользователей - Ранжированный поиск
  4. 4. Как работает современный поиск
  5. 5. Краулинг Где ПС берет новые документы для сканирования? - Логи браузеров. - Бары / расширения. - Системы аналитики. - Автоматическое сканирование. - Ручное добавление (addURL). - Соцсети. - Переход по внешней ссылке.
  6. 6. Что такое пауки и как они работают Поисковый робот - программа, являющаяся составной частью поисковой системы и предназначенная для перебора страниц Интернета с целью занесения информации о них в базу данных поисковика
  7. 7. Названия роботов популярных ПС Поисковые роботы Google - Робот Googlebot (веб-поиск Google) - Googlebot News - Googlebot Images - Googlebot Video - Google Mobile Все роботы Google Поисковые роботы Yandex - Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots) - основной индексирующий робот; - Mozilla/5.0 (compatible; YandexImages/3.0; +http://yandex.com/bots) - индексатор Яндекс.Картинок; - Mozilla/5.0 (compatible; YandexVideo/3.0; +http://yandex.com/bots) - индексатор Яндекс.Видео; - Mozilla/5.0 (compatible; YandexMedia/3.0; +http://yandex.com/bots) - робот, индексирующий мультимедийные данные;
  8. 8. Бюджет краулинга У паука есть Краулинговый бюджет - число, которое определяет: - Какое количество документов с данного хоста может быть в принципе включено в индекс. При достижении данного порога, документы с заданного сайта далее не включаются в индекс. - Какое количество документов может быть просканировано за один заход паука поисковой системы.
  9. 9. Задачи паука - Проверка страницы на новый контент (if-modified- since) - Проверка и выполнение* инструкций ● robots.txt ● sitemap.xml ● http-head ● Мета-теги
  10. 10. Краулинг
  11. 11. Индексатор Фильтрует: ⁻ Спам ⁻ Вирус на странице ⁻ Ошибка ⁻ Не важные страницы ⁻ Дубли Определяет дубли: ⁻ Аффилиат ⁻ Внутренние / внешние ⁻ Поиск нечетких дубликатов
  12. 12. Индексация Обработка и сохранение данных: ⁻ Обратный индекс ⁻ Текстовый индекс ⁻ Кэш страницы
  13. 13. Индексация
  14. 14. Обработка запроса пользователя
  15. 15. Ранжирование 200+ факторов Машинное обучение Регулярные изменения алгоритмов
  16. 16. Факторы ранжирования Пример ФР http://seoprofy.ua/blog/prodvizhenie-sajtov/200-google-factors
  17. 17. Факторы ранжирования
  18. 18. Факторы ранжирования
  19. 19. Факторы ранжирования
  20. 20. Факторы ранжирования
  21. 21. Факторы ранжирования
  22. 22. Факторы ранжирования
  23. 23. Факторы ранжирования
  24. 24. Факторы ранжирования
  25. 25. Факторы ранжирования
  26. 26. Факторы ранжирования
  27. 27. Главный фактор Какой самый главный фактор? Все! Мы должны работать комплексно
  28. 28. Ранжирование
  29. 29. Как работает современный поиск Краткая схема тут: http://www.google.com/insidesearch/howsearchworks/thestory/ How Search Works by Matt Cutts How does Google Search work? Matt Cutts whiteboard А если совсем интересно: вебинар MrBubu
  30. 30. Оценка качества поиска. Асессоры Критерии качества Google
  31. 31. Спасибо за внимание
  32. 32. Узнайте больше об интернет-маркетинге

×