SlideShare a Scribd company logo
1 of 22
Алгоритм HITS
Евгений Федулов,
Руководитель отдела интернет маркетинга
Евгений Федулов
Евгений Федулов
 В SEO с 2008 года
 Опыт работы – как на стороне клиента, так и на
стороне исполнителя.
 Поисковое продвижение сети магазинов
спортивного питания POWER-WAY, организация
внутреннего отдела продвижения группы компаний
RESTEC
 Выпускник второго потока курсов ТопЭксперт
ТопЭксперт – это
 Учебный центр по SEO с
эффективной программой
обучения.
 Образовательный сайт,
содержащий справочную
информацию.
 Группа экспертов,
оказывающих услуги аудита,
консультаций и продвижения
сайтов.
Евгений Федулов
Миссия
Повышать квалификацию участников отрасли интернет-маркетинга,
соединяя специалистов, экспертов и работодателей в образовательную
среду и упорядочивая и структурируя информацию в доступные
масштабируемые образовательные продукты, адаптированные для
дистанционного обучения.
• Для специалистов: предоставить возможность получения доступного
дистанционного профессионального образования в сфере IT.
• Для компаний: поставлять квалифицированные кадры, обучать
сотрудников.
• Для экспертов: предоставить возможность экспертам быть понятыми и
услышанными, способствовать повышению дохода и востребованности.
• Для технологий: создать среду для роста специалистов, способных
создавать новые технологии.
Евгений Федулов
Разобрать основы работы алгоритма HITS
Расширить представления слушателей о работе поисковой
системы
Цели вебинара
Евгений Федулов
Кому будет полезен этот вебинар
Начинающим SEO оптимизаторам
Евгений Федулов
Евгений Федулов
Основные проблемы поиска
• Огромный объем доступной информации
• Расплывчатость большинства запросов пользователей
• Неготовность пользователей долго анализировать результаты поиска
Основа работы поиска
Задачей ядра поисковых роботов
является обход Веб-графа
определенным образом с целью сбора
информации, выявление
структуры и вычисление полезности
информационных ресурсов в
Веб-пространстве, а также передача
собранной информации для
анализа другим приложениям поисковых
систем.
Евгений Федулов
То есть можно сказать что информация собирается и анализируется по ряду
факторов, которые можно отметить как внешние, то есть зависящие от
положения сайта некоем ссылочном графе пространства Веба.
Внутренние обусловленные содержанием самих веб ресурсов, а также поведение
пользователей на них.
Базовые алгоритмы поиска
Page Rank
Евгений Федулов
PageRank — это алгоритм, позволяющий оценить, насколько данная
интернет-страница популярна, то
есть это функция от интернет-страницы, которую можно сосчитать заранее.
Сергей Брин в 1998 году предложил следующую идею: определять рейтинг
страницы через количество
ведущих на нее ссылок и рейтинг ссылающихся страниц.
Google PageRank учитывает не все ссылки. Поисковая система
отфильтровывает ссылки с искусственно созданных сайтов, специально
предназначенных для скопления ссылок. Некоторые ссылки могут не
только не учитываться, но и отрицательно сказаться на ранжировании
ссылающегося сайта.
Основным недостатком PageRank является отсутствие учёта тематичности
ссылающихся друг на друга документов.
Алгоритм HITS
Евгений Федулов
В алгоритме HITS появляется возможность анализировать граф ссылок
между Web-документами и выделять два типа наиболее значимых
документов.
Определение значимости документа базируется на следующем
предположении о семантике ссылок между документами: когда человек
размещает в своем документе p ссылку на другой документ q, то он
отмечает значимость документа q в контексте документа p и то,
что читателю документа p возможно будет интересен документ q.
Отличие HITS от PageRank
PageRank подсчитывает общий "авторитет" документа, в то
время как HITS определяет "авторитет" документа для
конкретной темы.
Как может выглядеть ссылочный
граф связей между документами
Евгений Федулов
Алгоритм HITS
Евгений Федулов
Как уже было отмечено выше, в HITS мы рассматриваем две разные роли страниц
Первая это роль первоисточника, характеризующую ценность информации на
этой странице, и роль посредника, характеризующую ценность информации на
страницах, доступных по ссылкам с этой страницы.
Такой подход мотивирован наличием в Веб большого числа тематических
сообществ, т.е. наборов страниц близкой тематики, которые
сильно связаны друг с другом ссылками.
Типичный вид такого сообщества приведен на следующем слайде.
Алгоритм HITS
Евгений Федулов
Структура тематического
сообщества. Слева – ярко
выраженные посредники, справа –
хорошие первоисточники.
Выделение ролей наиболее
осмыслено в рамках некоторого
локального тематического контекста
(т.е. полезность страницы как
первоисточника)
Построение подграфа Веб
Евгений Федулов
Процедура построения подграфа Веб опирается на использование
какой-нибудь поисковой системы для Веб с относительно хорошим покрытием
индекса. По исходному запросу подграф строится следующим образом:
Построение Root set и построение base set.
Построение RootSet
Евгений Федулов
Это множество формируется из k (обычно порядка 200) первых
результатов, возвращенных используемой поисковой системой для
исходного запроса.
Построение Base set
Евгений Федулов
Это множество получается при помощи расширения RootSet за счет
окрестностей страниц из RootSet. Таким образом добавляются страницы,
которые содержат ссылки на страницы из RootSet или, наоборот, ссылки на
которые содержатся в каких-нибудь страницах из RootSet. Для обнаружения
страниц первого вида (т.е. страниц с входящими ссылками) также используются
возможности поисковой системы общего назначения. При этом из
вычислительных соображений обычно ограничивают максимальное число d
учитываемых.
Искомый подграф Веб, который далее используется для вычисления
рангов страниц, получается сужением полного графа Веб на BaseSet, из
которого удалены все внутридоменные ссылки. Удаление внутридоменных
ссылок – это простейшая эвристика для подавления навигационных и
протекционных ссылок, которые вызывают искажение результатов
ранжирования.
Взаимосвязь между множествами BaseSet и RootSet проиллюстрирована на
следующем слайде.
Построение Base set
Евгений Федулов
BaseSet. Жирные стрелки –
ссылки, которые участвовали в его
образовании.
Неформально понятно, что
страница является хорошим
посредником, если
она содержит ссылки на ценные
первоисточники, и наоборот,
страница является хорошим
первоисточником, если она
упоминается хорошими
посредниками.
Вычисление рангов страниц Веб
Евгений Федулов
Нахождение наиболее значимых страниц осуществляется следующим
образом. Наиболее значимыми страницами предложено считать те, на которые
больше всего ссылаются другие значимые страницы, такие страницы будем
называть авторитетными страницами
Авторитетные страницы являются наиболее значимыми в рамках
заданной темы запроса, поэтому на них часто ссылаются другие страницы,
относящиеся к данной теме. Это свойство позволяет выявить
страницы которые ссылаются на несколько авторитетных страниц,
относящихся к одной теме. Вместе оба типа значимых страниц образуют
взаимно усиливающееся отношение (mutually reinforcing relationship), т.е.
хорошая авторитетная страница ссылается на много индексных страниц и
хорошая индексная страница ссылается на много авторитетных страниц.
Недостатки Hits
Евгений Федулов
Проблема смещения тематики
Алгоритм Клейнберга он же hits может повысить качество ранжирования не
только за счет переупорядочивания страниц, которые обнаружила поиско-
вая система. При построении BaseSet в него могут попасть (и затем быть
высоко ранжированными) страницы, которые поисковая система вообще
не считает релевантными из-за того, что они по тем или иным причинам не
содержат слова из запроса.
Однако, именно эта особенность алгоритма обуславливает и отсутствие
стабильности качества результатов HITS.
В том случае, когда в BaseSet попадает много страниц на другие
темы, и сообщество, соответствующее исходной теме, не является доминирующим,
это свойство обуславливает присвоение наивысших рангов страницам на другую
тему.
Такой эффект получил название смещения тематики (topic drift).
Обычно такое смещение происходит в направлении более широкой
предметной области (или лучше представленной в Веб). Например, запрос
«WWW conferences» имеет тенденцию смещаться к теме «WWW».
Модификации HITS
Евгений Федулов
На сегодняшний день известно довольно много модификаций HITS,
которые условно можно разделить на три группы. К первой относятся над-
стройки над HITS, которые, например, предлагают изменить построение связей, но
не меняют принцип ранжирования.
Ко второй группе относятся попытки изменить сам алгоритм – на-
пример, используя вероятностный подход .
Последнюю группу составляют методы, которые допускают, что
самое крупное обнаруженное сообщество не является самым ценным, и
пытаются автоматически определить наиболее полезное сообщество среди
всех обнаруженных. Так, например, Клейнберг пробовал оценивать ценность
сообщества как суммарную близость нескольких наиболее важных
документов из сообщества к исходному запросу.
Леонид Гроховский
http://topexpert.pro/seo-kurs.html
Леонид Гроховский
Изучайте, внедряйте,
зарабатывайте!»
Леонид Гроховский, руководитель учебного центра ТопЭксперт
• grohovskiy@yandex.ru
• skype:grohovskiy
• http://гроховский.рф/
«

More Related Content

What's hot

Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар ПолехУрок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар ПолехЛеонид Гроховский
 
Вебинар "Продвижение молодого сайта"
Вебинар "Продвижение молодого сайта"Вебинар "Продвижение молодого сайта"
Вебинар "Продвижение молодого сайта"seeduru
 
Footprint Factory - Nazapad 4
Footprint Factory - Nazapad 4Footprint Factory - Nazapad 4
Footprint Factory - Nazapad 4Andrey Kapeltsov
 
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".seeduru
 
Зачем нужно продвижение сайтов. SEO для клиентов
Зачем нужно продвижение сайтов. SEO для клиентовЗачем нужно продвижение сайтов. SEO для клиентов
Зачем нужно продвижение сайтов. SEO для клиентовSEO-Интеллект
 
Как создавать и дистрибутировать текстовый контент в 2017
Как создавать и дистрибутировать текстовый контент в 2017Как создавать и дистрибутировать текстовый контент в 2017
Как создавать и дистрибутировать текстовый контент в 2017collaborator.pro
 
Как настроить систему контент-маркетинга внутри компании
Как настроить систему контент-маркетинга внутри компанииКак настроить систему контент-маркетинга внутри компании
Как настроить систему контент-маркетинга внутри компанииSeoProfy Presentations
 
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".seeduru
 
Урок 1: Как устроена поисковая система - Леонид Гроховский
Урок 1: Как устроена поисковая система - Леонид ГроховскийУрок 1: Как устроена поисковая система - Леонид Гроховский
Урок 1: Как устроена поисковая система - Леонид ГроховскийЛеонид Гроховский
 
Тачалова Александра. PR стратегии, которые приносят продажи
Тачалова Александра. PR стратегии, которые приносят продажиТачалова Александра. PR стратегии, которые приносят продажи
Тачалова Александра. PR стратегии, которые приносят продажиДмитрий Шахов
 
Презентация Александра Тачалова для NaZapad 3
Презентация Александра Тачалова для NaZapad 3Презентация Александра Тачалова для NaZapad 3
Презентация Александра Тачалова для NaZapad 3NaZapad
 
Урок 23: Операторы поиска - Леонид Гроховский
Урок 23: Операторы поиска - Леонид ГроховскийУрок 23: Операторы поиска - Леонид Гроховский
Урок 23: Операторы поиска - Леонид ГроховскийЛеонид Гроховский
 
Seo для брендов или как собрать сообщество. Кейс svitmam.ua
Seo для брендов или как собрать сообщество. Кейс svitmam.uaSeo для брендов или как собрать сообщество. Кейс svitmam.ua
Seo для брендов или как собрать сообщество. Кейс svitmam.uaАртём Гидин
 
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...NaZapad
 
Топ SEO стратегии 2021: Набор полезных фишек по выбору стратегии
Топ SEO стратегии 2021: Набор полезных фишек по выбору стратегииТоп SEO стратегии 2021: Набор полезных фишек по выбору стратегии
Топ SEO стратегии 2021: Набор полезных фишек по выбору стратегииNaZapad
 
Кейсы белых SEO-стратегий
Кейсы белых SEO-стратегийКейсы белых SEO-стратегий
Кейсы белых SEO-стратегийАртём Гидин
 

What's hot (20)

Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар ПолехУрок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
Урок 2-3: Всё о запросах пользователя, очистка и группировка - Эдгар Полех
 
Вебинар "Продвижение молодого сайта"
Вебинар "Продвижение молодого сайта"Вебинар "Продвижение молодого сайта"
Вебинар "Продвижение молодого сайта"
 
Footprint Factory - Nazapad 4
Footprint Factory - Nazapad 4Footprint Factory - Nazapad 4
Footprint Factory - Nazapad 4
 
SEO-аудит своими руками. Вебинар WebPromoExperts #106
SEO-аудит своими руками. Вебинар WebPromoExperts #106SEO-аудит своими руками. Вебинар WebPromoExperts #106
SEO-аудит своими руками. Вебинар WebPromoExperts #106
 
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
Вебинар "Технический аудит сайта. ТОП 10-ошибок, которые лучше не совершать".
 
Зачем нужно продвижение сайтов. SEO для клиентов
Зачем нужно продвижение сайтов. SEO для клиентовЗачем нужно продвижение сайтов. SEO для клиентов
Зачем нужно продвижение сайтов. SEO для клиентов
 
Как создавать и дистрибутировать текстовый контент в 2017
Как создавать и дистрибутировать текстовый контент в 2017Как создавать и дистрибутировать текстовый контент в 2017
Как создавать и дистрибутировать текстовый контент в 2017
 
О компании
О компанииО компании
О компании
 
Как настроить систему контент-маркетинга внутри компании
Как настроить систему контент-маркетинга внутри компанииКак настроить систему контент-маркетинга внутри компании
Как настроить систему контент-маркетинга внутри компании
 
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".
Вебинар "SEO-анализ конкурентов. Удачные решения для достижения ТОПа".
 
Урок 1: Как устроена поисковая система - Леонид Гроховский
Урок 1: Как устроена поисковая система - Леонид ГроховскийУрок 1: Как устроена поисковая система - Леонид Гроховский
Урок 1: Как устроена поисковая система - Леонид Гроховский
 
Лекция по SEO
Лекция по SEOЛекция по SEO
Лекция по SEO
 
Тачалова Александра. PR стратегии, которые приносят продажи
Тачалова Александра. PR стратегии, которые приносят продажиТачалова Александра. PR стратегии, которые приносят продажи
Тачалова Александра. PR стратегии, которые приносят продажи
 
Презентация Александра Тачалова для NaZapad 3
Презентация Александра Тачалова для NaZapad 3Презентация Александра Тачалова для NaZapad 3
Презентация Александра Тачалова для NaZapad 3
 
Урок 23: Операторы поиска - Леонид Гроховский
Урок 23: Операторы поиска - Леонид ГроховскийУрок 23: Операторы поиска - Леонид Гроховский
Урок 23: Операторы поиска - Леонид Гроховский
 
Seo для брендов или как собрать сообщество. Кейс svitmam.ua
Seo для брендов или как собрать сообщество. Кейс svitmam.uaSeo для брендов или как собрать сообщество. Кейс svitmam.ua
Seo для брендов или как собрать сообщество. Кейс svitmam.ua
 
крауд маркетинг-как-инструмент-продвижения-под-Google-webpromoexperts
крауд маркетинг-как-инструмент-продвижения-под-Google-webpromoexpertsкрауд маркетинг-как-инструмент-продвижения-под-Google-webpromoexperts
крауд маркетинг-как-инструмент-продвижения-под-Google-webpromoexperts
 
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
Игорь Горбенко (SerpStat): 5 фишек поисковой аналитики, которыми пользуются п...
 
Топ SEO стратегии 2021: Набор полезных фишек по выбору стратегии
Топ SEO стратегии 2021: Набор полезных фишек по выбору стратегииТоп SEO стратегии 2021: Набор полезных фишек по выбору стратегии
Топ SEO стратегии 2021: Набор полезных фишек по выбору стратегии
 
Кейсы белых SEO-стратегий
Кейсы белых SEO-стратегийКейсы белых SEO-стратегий
Кейсы белых SEO-стратегий
 

Similar to Алгоритм HITS - Евгений Федулов

Продвижение сайтов
Продвижение сайтовПродвижение сайтов
Продвижение сайтовRonny_Rosenberg
 
Аудит Benjaminmoore.lviv.ua
Аудит Benjaminmoore.lviv.uaАудит Benjaminmoore.lviv.ua
Аудит Benjaminmoore.lviv.uakostetskiy
 
Введение в SEO
Введение в SEOВведение в SEO
Введение в SEOElena Lomova
 
Аудит для компании Kievpesok
Аудит для компании KievpesokАудит для компании Kievpesok
Аудит для компании Kievpesokkostetskiy
 
Артур Латыпов. SEO-взгляд изнутри, где притаились проблемы?
Артур Латыпов. SEO-взгляд изнутри, где притаились проблемы?Артур Латыпов. SEO-взгляд изнутри, где притаились проблемы?
Артур Латыпов. SEO-взгляд изнутри, где притаились проблемы?Webcom Group
 
Интернет-маркетинг для стартапа. Базовый уровень
Интернет-маркетинг для стартапа. Базовый уровеньИнтернет-маркетинг для стартапа. Базовый уровень
Интернет-маркетинг для стартапа. Базовый уровеньValentin Dombrovsky
 
Александр Кулик: «Возможности SEO-модуля для продвижения сайтов на Prom.ua»
Александр Кулик: «Возможности SEO-модуля для продвижения сайтов на Prom.ua»Александр Кулик: «Возможности SEO-модуля для продвижения сайтов на Prom.ua»
Александр Кулик: «Возможности SEO-модуля для продвижения сайтов на Prom.ua»Prom
 
Грамотная SEO-оптимизация сайта на WordPress
Грамотная SEO-оптимизация сайта на WordPressГрамотная SEO-оптимизация сайта на WordPress
Грамотная SEO-оптимизация сайта на WordPressIgor Sazonov
 
Seo-оптимизация сайта на WordPress
Seo-оптимизация сайта на WordPressSeo-оптимизация сайта на WordPress
Seo-оптимизация сайта на WordPressYulia Krilova
 
SEO сайта на Deal.by
SEO сайта на Deal.bySEO сайта на Deal.by
SEO сайта на Deal.bydealby
 
Александр Кулик: «Основы SEO и применение SEO инструментов на Prom.ua»
Александр Кулик: «Основы SEO и применение SEO инструментов на Prom.ua»Александр Кулик: «Основы SEO и применение SEO инструментов на Prom.ua»
Александр Кулик: «Основы SEO и применение SEO инструментов на Prom.ua»Prom
 
Аудит Anti stress.top
Аудит Anti stress.topАудит Anti stress.top
Аудит Anti stress.topkostetskiy
 
Возможности Seo для продвижения сайтов на Рrom.ua
Возможности Seo для продвижения сайтов на Рrom.uaВозможности Seo для продвижения сайтов на Рrom.ua
Возможности Seo для продвижения сайтов на Рrom.uaProm
 
SemBook. Глава 6. Работа со ссылками в деталях
SemBook. Глава 6. Работа со ссылками в деталяхSemBook. Глава 6. Работа со ссылками в деталях
SemBook. Глава 6. Работа со ссылками в деталяхROOKEE
 
Продвижение сайтов: ТОП ошибок SEO оптимизаторов. Латыпов Артур
Продвижение сайтов: ТОП ошибок SEO оптимизаторов. Латыпов АртурПродвижение сайтов: ТОП ошибок SEO оптимизаторов. Латыпов Артур
Продвижение сайтов: ТОП ошибок SEO оптимизаторов. Латыпов АртурSEO-Интеллект
 
Аудит Droid.dp.ua
Аудит Droid.dp.uaАудит Droid.dp.ua
Аудит Droid.dp.uakostetskiy
 
Константин Леонович. Изменение бюджетов на поисковое продвижение после ввода ...
Константин Леонович. Изменение бюджетов на поисковое продвижение после ввода ...Константин Леонович. Изменение бюджетов на поисковое продвижение после ввода ...
Константин Леонович. Изменение бюджетов на поисковое продвижение после ввода ...web2win
 
Основы SEO и применение SEO инструментов на Prom.ua
Основы SEO и применение SEO инструментов на Prom.uaОсновы SEO и применение SEO инструментов на Prom.ua
Основы SEO и применение SEO инструментов на Prom.uaProm
 
Аудит для компании Artinvest.org
Аудит для компании Artinvest.orgАудит для компании Artinvest.org
Аудит для компании Artinvest.orgkostetskiy
 

Similar to Алгоритм HITS - Евгений Федулов (20)

SEO
SEOSEO
SEO
 
Продвижение сайтов
Продвижение сайтовПродвижение сайтов
Продвижение сайтов
 
Аудит Benjaminmoore.lviv.ua
Аудит Benjaminmoore.lviv.uaАудит Benjaminmoore.lviv.ua
Аудит Benjaminmoore.lviv.ua
 
Введение в SEO
Введение в SEOВведение в SEO
Введение в SEO
 
Аудит для компании Kievpesok
Аудит для компании KievpesokАудит для компании Kievpesok
Аудит для компании Kievpesok
 
Артур Латыпов. SEO-взгляд изнутри, где притаились проблемы?
Артур Латыпов. SEO-взгляд изнутри, где притаились проблемы?Артур Латыпов. SEO-взгляд изнутри, где притаились проблемы?
Артур Латыпов. SEO-взгляд изнутри, где притаились проблемы?
 
Интернет-маркетинг для стартапа. Базовый уровень
Интернет-маркетинг для стартапа. Базовый уровеньИнтернет-маркетинг для стартапа. Базовый уровень
Интернет-маркетинг для стартапа. Базовый уровень
 
Александр Кулик: «Возможности SEO-модуля для продвижения сайтов на Prom.ua»
Александр Кулик: «Возможности SEO-модуля для продвижения сайтов на Prom.ua»Александр Кулик: «Возможности SEO-модуля для продвижения сайтов на Prom.ua»
Александр Кулик: «Возможности SEO-модуля для продвижения сайтов на Prom.ua»
 
Грамотная SEO-оптимизация сайта на WordPress
Грамотная SEO-оптимизация сайта на WordPressГрамотная SEO-оптимизация сайта на WordPress
Грамотная SEO-оптимизация сайта на WordPress
 
Seo-оптимизация сайта на WordPress
Seo-оптимизация сайта на WordPressSeo-оптимизация сайта на WordPress
Seo-оптимизация сайта на WordPress
 
SEO сайта на Deal.by
SEO сайта на Deal.bySEO сайта на Deal.by
SEO сайта на Deal.by
 
Александр Кулик: «Основы SEO и применение SEO инструментов на Prom.ua»
Александр Кулик: «Основы SEO и применение SEO инструментов на Prom.ua»Александр Кулик: «Основы SEO и применение SEO инструментов на Prom.ua»
Александр Кулик: «Основы SEO и применение SEO инструментов на Prom.ua»
 
Аудит Anti stress.top
Аудит Anti stress.topАудит Anti stress.top
Аудит Anti stress.top
 
Возможности Seo для продвижения сайтов на Рrom.ua
Возможности Seo для продвижения сайтов на Рrom.uaВозможности Seo для продвижения сайтов на Рrom.ua
Возможности Seo для продвижения сайтов на Рrom.ua
 
SemBook. Глава 6. Работа со ссылками в деталях
SemBook. Глава 6. Работа со ссылками в деталяхSemBook. Глава 6. Работа со ссылками в деталях
SemBook. Глава 6. Работа со ссылками в деталях
 
Продвижение сайтов: ТОП ошибок SEO оптимизаторов. Латыпов Артур
Продвижение сайтов: ТОП ошибок SEO оптимизаторов. Латыпов АртурПродвижение сайтов: ТОП ошибок SEO оптимизаторов. Латыпов Артур
Продвижение сайтов: ТОП ошибок SEO оптимизаторов. Латыпов Артур
 
Аудит Droid.dp.ua
Аудит Droid.dp.uaАудит Droid.dp.ua
Аудит Droid.dp.ua
 
Константин Леонович. Изменение бюджетов на поисковое продвижение после ввода ...
Константин Леонович. Изменение бюджетов на поисковое продвижение после ввода ...Константин Леонович. Изменение бюджетов на поисковое продвижение после ввода ...
Константин Леонович. Изменение бюджетов на поисковое продвижение после ввода ...
 
Основы SEO и применение SEO инструментов на Prom.ua
Основы SEO и применение SEO инструментов на Prom.uaОсновы SEO и применение SEO инструментов на Prom.ua
Основы SEO и применение SEO инструментов на Prom.ua
 
Аудит для компании Artinvest.org
Аудит для компании Artinvest.orgАудит для компании Artinvest.org
Аудит для компании Artinvest.org
 

More from Леонид Гроховский

Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeak
Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeakВеб-аналитика с Google Tag Manager, Алексей Данилин, NetPeak
Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeakЛеонид Гроховский
 
Модуль автоматической генерации страниц
Модуль автоматической генерации страницМодуль автоматической генерации страниц
Модуль автоматической генерации страницЛеонид Гроховский
 
Результаты выпускников ТопЭксперт
Результаты выпускников ТопЭкспертРезультаты выпускников ТопЭксперт
Результаты выпускников ТопЭкспертЛеонид Гроховский
 
Урок 91: Социальные и поведенческие факторы - Морозов Роман
Урок 91: Социальные и поведенческие факторы - Морозов РоманУрок 91: Социальные и поведенческие факторы - Морозов Роман
Урок 91: Социальные и поведенческие факторы - Морозов РоманЛеонид Гроховский
 
Html для чайников - Евгений Концевой
Html для чайников - Евгений КонцевойHtml для чайников - Евгений Концевой
Html для чайников - Евгений КонцевойЛеонид Гроховский
 
Урок 89: Микроформаты - Евгений Концевой
Урок 89: Микроформаты - Евгений КонцевойУрок 89: Микроформаты - Евгений Концевой
Урок 89: Микроформаты - Евгений КонцевойЛеонид Гроховский
 
Чек-лист для успешного продвижения информационного проекта
Чек-лист для успешного продвижения информационного проектаЧек-лист для успешного продвижения информационного проекта
Чек-лист для успешного продвижения информационного проектаЛеонид Гроховский
 
Урок 34: Поиск дублирующихся страниц - Олег Шестаков
Урок 34: Поиск дублирующихся страниц - Олег ШестаковУрок 34: Поиск дублирующихся страниц - Олег Шестаков
Урок 34: Поиск дублирующихся страниц - Олег ШестаковЛеонид Гроховский
 
Урок 24: Проектирование сайта - Лукьянчук Алексей
Урок 24: Проектирование сайта - Лукьянчук АлексейУрок 24: Проектирование сайта - Лукьянчук Алексей
Урок 24: Проектирование сайта - Лукьянчук АлексейЛеонид Гроховский
 
Урок 30: Создание сайта - Лукьянчук Алексей
Урок 30: Создание сайта - Лукьянчук АлексейУрок 30: Создание сайта - Лукьянчук Алексей
Урок 30: Создание сайта - Лукьянчук АлексейЛеонид Гроховский
 
Урок 36: Хостинг: устройство, технологии - Лукьянчук Алексей
Урок 36: Хостинг: устройство, технологии - Лукьянчук АлексейУрок 36: Хостинг: устройство, технологии - Лукьянчук Алексей
Урок 36: Хостинг: устройство, технологии - Лукьянчук АлексейЛеонид Гроховский
 
Урок 25: Как на самом деле проверить индексацию каждой страницы - Олег Шестаков
Урок 25: Как на самом деле проверить индексацию каждой страницы - Олег ШестаковУрок 25: Как на самом деле проверить индексацию каждой страницы - Олег Шестаков
Урок 25: Как на самом деле проверить индексацию каждой страницы - Олег ШестаковЛеонид Гроховский
 
Урок 29: Перелинковка - Евгений Концевой
Урок 29: Перелинковка - Евгений КонцевойУрок 29: Перелинковка - Евгений Концевой
Урок 29: Перелинковка - Евгений КонцевойЛеонид Гроховский
 
Урок 22: Веб аналитика - Алексей Лукьянчук
Урок 22: Веб аналитика - Алексей ЛукьянчукУрок 22: Веб аналитика - Алексей Лукьянчук
Урок 22: Веб аналитика - Алексей ЛукьянчукЛеонид Гроховский
 
Урок 20: Протокол HTTP - Евгений Концевой
Урок 20: Протокол HTTP - Евгений КонцевойУрок 20: Протокол HTTP - Евгений Концевой
Урок 20: Протокол HTTP - Евгений КонцевойЛеонид Гроховский
 

More from Леонид Гроховский (20)

Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeak
Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeakВеб-аналитика с Google Tag Manager, Алексей Данилин, NetPeak
Веб-аналитика с Google Tag Manager, Алексей Данилин, NetPeak
 
Модуль автоматической генерации страниц
Модуль автоматической генерации страницМодуль автоматической генерации страниц
Модуль автоматической генерации страниц
 
Результаты выпускников ТопЭксперт
Результаты выпускников ТопЭкспертРезультаты выпускников ТопЭксперт
Результаты выпускников ТопЭксперт
 
Levitas
LevitasLevitas
Levitas
 
Урок 91: Социальные и поведенческие факторы - Морозов Роман
Урок 91: Социальные и поведенческие факторы - Морозов РоманУрок 91: Социальные и поведенческие факторы - Морозов Роман
Урок 91: Социальные и поведенческие факторы - Морозов Роман
 
Html для чайников - Евгений Концевой
Html для чайников - Евгений КонцевойHtml для чайников - Евгений Концевой
Html для чайников - Евгений Концевой
 
Seo плагины - Иванов Антон
Seo плагины - Иванов АнтонSeo плагины - Иванов Антон
Seo плагины - Иванов Антон
 
Урок 89: Микроформаты - Евгений Концевой
Урок 89: Микроформаты - Евгений КонцевойУрок 89: Микроформаты - Евгений Концевой
Урок 89: Микроформаты - Евгений Концевой
 
Чек-лист для успешного продвижения информационного проекта
Чек-лист для успешного продвижения информационного проектаЧек-лист для успешного продвижения информационного проекта
Чек-лист для успешного продвижения информационного проекта
 
Урок 34: Поиск дублирующихся страниц - Олег Шестаков
Урок 34: Поиск дублирующихся страниц - Олег ШестаковУрок 34: Поиск дублирующихся страниц - Олег Шестаков
Урок 34: Поиск дублирующихся страниц - Олег Шестаков
 
Урок 24: Проектирование сайта - Лукьянчук Алексей
Урок 24: Проектирование сайта - Лукьянчук АлексейУрок 24: Проектирование сайта - Лукьянчук Алексей
Урок 24: Проектирование сайта - Лукьянчук Алексей
 
Урок 30: Создание сайта - Лукьянчук Алексей
Урок 30: Создание сайта - Лукьянчук АлексейУрок 30: Создание сайта - Лукьянчук Алексей
Урок 30: Создание сайта - Лукьянчук Алексей
 
Урок 36: Хостинг: устройство, технологии - Лукьянчук Алексей
Урок 36: Хостинг: устройство, технологии - Лукьянчук АлексейУрок 36: Хостинг: устройство, технологии - Лукьянчук Алексей
Урок 36: Хостинг: устройство, технологии - Лукьянчук Алексей
 
Урок 25: Как на самом деле проверить индексацию каждой страницы - Олег Шестаков
Урок 25: Как на самом деле проверить индексацию каждой страницы - Олег ШестаковУрок 25: Как на самом деле проверить индексацию каждой страницы - Олег Шестаков
Урок 25: Как на самом деле проверить индексацию каждой страницы - Олег Шестаков
 
Урок 29: Перелинковка - Евгений Концевой
Урок 29: Перелинковка - Евгений КонцевойУрок 29: Перелинковка - Евгений Концевой
Урок 29: Перелинковка - Евгений Концевой
 
Урок 22: Веб аналитика - Алексей Лукьянчук
Урок 22: Веб аналитика - Алексей ЛукьянчукУрок 22: Веб аналитика - Алексей Лукьянчук
Урок 22: Веб аналитика - Алексей Лукьянчук
 
Урок 20: Протокол HTTP - Евгений Концевой
Урок 20: Протокол HTTP - Евгений КонцевойУрок 20: Протокол HTTP - Евгений Концевой
Урок 20: Протокол HTTP - Евгений Концевой
 
Урок 19: SEOHide - Антон Иванов
Урок 19: SEOHide - Антон ИвановУрок 19: SEOHide - Антон Иванов
Урок 19: SEOHide - Антон Иванов
 
Урок 18: nofollow - Антон Иванов
Урок 18: nofollow - Антон ИвановУрок 18: nofollow - Антон Иванов
Урок 18: nofollow - Антон Иванов
 
Урок 17: NOINDEX - Антон Иванов
Урок 17: NOINDEX - Антон ИвановУрок 17: NOINDEX - Антон Иванов
Урок 17: NOINDEX - Антон Иванов
 

Алгоритм HITS - Евгений Федулов

  • 1. Алгоритм HITS Евгений Федулов, Руководитель отдела интернет маркетинга
  • 2. Евгений Федулов Евгений Федулов  В SEO с 2008 года  Опыт работы – как на стороне клиента, так и на стороне исполнителя.  Поисковое продвижение сети магазинов спортивного питания POWER-WAY, организация внутреннего отдела продвижения группы компаний RESTEC  Выпускник второго потока курсов ТопЭксперт
  • 3. ТопЭксперт – это  Учебный центр по SEO с эффективной программой обучения.  Образовательный сайт, содержащий справочную информацию.  Группа экспертов, оказывающих услуги аудита, консультаций и продвижения сайтов. Евгений Федулов
  • 4. Миссия Повышать квалификацию участников отрасли интернет-маркетинга, соединяя специалистов, экспертов и работодателей в образовательную среду и упорядочивая и структурируя информацию в доступные масштабируемые образовательные продукты, адаптированные для дистанционного обучения. • Для специалистов: предоставить возможность получения доступного дистанционного профессионального образования в сфере IT. • Для компаний: поставлять квалифицированные кадры, обучать сотрудников. • Для экспертов: предоставить возможность экспертам быть понятыми и услышанными, способствовать повышению дохода и востребованности. • Для технологий: создать среду для роста специалистов, способных создавать новые технологии. Евгений Федулов
  • 5. Разобрать основы работы алгоритма HITS Расширить представления слушателей о работе поисковой системы Цели вебинара Евгений Федулов
  • 6. Кому будет полезен этот вебинар Начинающим SEO оптимизаторам Евгений Федулов
  • 7. Евгений Федулов Основные проблемы поиска • Огромный объем доступной информации • Расплывчатость большинства запросов пользователей • Неготовность пользователей долго анализировать результаты поиска
  • 8. Основа работы поиска Задачей ядра поисковых роботов является обход Веб-графа определенным образом с целью сбора информации, выявление структуры и вычисление полезности информационных ресурсов в Веб-пространстве, а также передача собранной информации для анализа другим приложениям поисковых систем. Евгений Федулов То есть можно сказать что информация собирается и анализируется по ряду факторов, которые можно отметить как внешние, то есть зависящие от положения сайта некоем ссылочном графе пространства Веба. Внутренние обусловленные содержанием самих веб ресурсов, а также поведение пользователей на них.
  • 9. Базовые алгоритмы поиска Page Rank Евгений Федулов PageRank — это алгоритм, позволяющий оценить, насколько данная интернет-страница популярна, то есть это функция от интернет-страницы, которую можно сосчитать заранее. Сергей Брин в 1998 году предложил следующую идею: определять рейтинг страницы через количество ведущих на нее ссылок и рейтинг ссылающихся страниц. Google PageRank учитывает не все ссылки. Поисковая система отфильтровывает ссылки с искусственно созданных сайтов, специально предназначенных для скопления ссылок. Некоторые ссылки могут не только не учитываться, но и отрицательно сказаться на ранжировании ссылающегося сайта. Основным недостатком PageRank является отсутствие учёта тематичности ссылающихся друг на друга документов.
  • 10. Алгоритм HITS Евгений Федулов В алгоритме HITS появляется возможность анализировать граф ссылок между Web-документами и выделять два типа наиболее значимых документов. Определение значимости документа базируется на следующем предположении о семантике ссылок между документами: когда человек размещает в своем документе p ссылку на другой документ q, то он отмечает значимость документа q в контексте документа p и то, что читателю документа p возможно будет интересен документ q. Отличие HITS от PageRank PageRank подсчитывает общий "авторитет" документа, в то время как HITS определяет "авторитет" документа для конкретной темы.
  • 11. Как может выглядеть ссылочный граф связей между документами Евгений Федулов
  • 12. Алгоритм HITS Евгений Федулов Как уже было отмечено выше, в HITS мы рассматриваем две разные роли страниц Первая это роль первоисточника, характеризующую ценность информации на этой странице, и роль посредника, характеризующую ценность информации на страницах, доступных по ссылкам с этой страницы. Такой подход мотивирован наличием в Веб большого числа тематических сообществ, т.е. наборов страниц близкой тематики, которые сильно связаны друг с другом ссылками. Типичный вид такого сообщества приведен на следующем слайде.
  • 13. Алгоритм HITS Евгений Федулов Структура тематического сообщества. Слева – ярко выраженные посредники, справа – хорошие первоисточники. Выделение ролей наиболее осмыслено в рамках некоторого локального тематического контекста (т.е. полезность страницы как первоисточника)
  • 14. Построение подграфа Веб Евгений Федулов Процедура построения подграфа Веб опирается на использование какой-нибудь поисковой системы для Веб с относительно хорошим покрытием индекса. По исходному запросу подграф строится следующим образом: Построение Root set и построение base set.
  • 15. Построение RootSet Евгений Федулов Это множество формируется из k (обычно порядка 200) первых результатов, возвращенных используемой поисковой системой для исходного запроса.
  • 16. Построение Base set Евгений Федулов Это множество получается при помощи расширения RootSet за счет окрестностей страниц из RootSet. Таким образом добавляются страницы, которые содержат ссылки на страницы из RootSet или, наоборот, ссылки на которые содержатся в каких-нибудь страницах из RootSet. Для обнаружения страниц первого вида (т.е. страниц с входящими ссылками) также используются возможности поисковой системы общего назначения. При этом из вычислительных соображений обычно ограничивают максимальное число d учитываемых. Искомый подграф Веб, который далее используется для вычисления рангов страниц, получается сужением полного графа Веб на BaseSet, из которого удалены все внутридоменные ссылки. Удаление внутридоменных ссылок – это простейшая эвристика для подавления навигационных и протекционных ссылок, которые вызывают искажение результатов ранжирования. Взаимосвязь между множествами BaseSet и RootSet проиллюстрирована на следующем слайде.
  • 17. Построение Base set Евгений Федулов BaseSet. Жирные стрелки – ссылки, которые участвовали в его образовании. Неформально понятно, что страница является хорошим посредником, если она содержит ссылки на ценные первоисточники, и наоборот, страница является хорошим первоисточником, если она упоминается хорошими посредниками.
  • 18. Вычисление рангов страниц Веб Евгений Федулов Нахождение наиболее значимых страниц осуществляется следующим образом. Наиболее значимыми страницами предложено считать те, на которые больше всего ссылаются другие значимые страницы, такие страницы будем называть авторитетными страницами Авторитетные страницы являются наиболее значимыми в рамках заданной темы запроса, поэтому на них часто ссылаются другие страницы, относящиеся к данной теме. Это свойство позволяет выявить страницы которые ссылаются на несколько авторитетных страниц, относящихся к одной теме. Вместе оба типа значимых страниц образуют взаимно усиливающееся отношение (mutually reinforcing relationship), т.е. хорошая авторитетная страница ссылается на много индексных страниц и хорошая индексная страница ссылается на много авторитетных страниц.
  • 19. Недостатки Hits Евгений Федулов Проблема смещения тематики Алгоритм Клейнберга он же hits может повысить качество ранжирования не только за счет переупорядочивания страниц, которые обнаружила поиско- вая система. При построении BaseSet в него могут попасть (и затем быть высоко ранжированными) страницы, которые поисковая система вообще не считает релевантными из-за того, что они по тем или иным причинам не содержат слова из запроса. Однако, именно эта особенность алгоритма обуславливает и отсутствие стабильности качества результатов HITS. В том случае, когда в BaseSet попадает много страниц на другие темы, и сообщество, соответствующее исходной теме, не является доминирующим, это свойство обуславливает присвоение наивысших рангов страницам на другую тему. Такой эффект получил название смещения тематики (topic drift). Обычно такое смещение происходит в направлении более широкой предметной области (или лучше представленной в Веб). Например, запрос «WWW conferences» имеет тенденцию смещаться к теме «WWW».
  • 20. Модификации HITS Евгений Федулов На сегодняшний день известно довольно много модификаций HITS, которые условно можно разделить на три группы. К первой относятся над- стройки над HITS, которые, например, предлагают изменить построение связей, но не меняют принцип ранжирования. Ко второй группе относятся попытки изменить сам алгоритм – на- пример, используя вероятностный подход . Последнюю группу составляют методы, которые допускают, что самое крупное обнаруженное сообщество не является самым ценным, и пытаются автоматически определить наиболее полезное сообщество среди всех обнаруженных. Так, например, Клейнберг пробовал оценивать ценность сообщества как суммарную близость нескольких наиболее важных документов из сообщества к исходному запросу.
  • 22. Леонид Гроховский Изучайте, внедряйте, зарабатывайте!» Леонид Гроховский, руководитель учебного центра ТопЭксперт • grohovskiy@yandex.ru • skype:grohovskiy • http://гроховский.рф/ «