1) Появление ссылочных факторов ранжирования, анкор-лист.
2) Факторы учитывающие количество и процент вхождений слов запроса
3) Какие они «хорошие» и «плохие» ссылки? Безанкорные ссылки.
4) Учёт тематики и региональной связи «донор-акцептор».
5) Возраст ссылочной массы и динамика прироста ссылок.
6) Вопросы слушателей.
В гостях: Станислав Ставский.
Видео доступно по ссылке: http://www.youtube.com/user/pixelplusru/videos
2. Что обсуждаем?
2
1. Появление ссылочных факторов ранжирования, анкор-лист
2. Факторы учитывающие количество и процент вхождений слов запроса
3. Какие они «хорошие» и «плохие» ссылки?
4. Учёт тематики и региональной связи «донор-акцептор»
5. Возраст ссылочной массы и динамика прироста ссылок
6. Вопросы слушателей
3. Ссылочные факторы
3
1. Первые упоминания PageRank в публикациях — 1998 год
2. Существует более 70 различных ссылочных факторов
3. Существенно улучшают качество ранжирования в поисковике
4. Факторы учитывающие:
• анкоры (анкор-лист)
• регион, тематику, спамность
• …
4. Статический вес PageRank
4
pi — i-ый документ в коллекции,
d — коэффициент затухания,
L(pi) — количество исходящих ссылок с узла,
N — суммарное количество документов
5. Модификации PageRank
5
Возможные модификации формулы PageRank
1. Расчет PR с учётом не всех ссылок, фильтрация:
• Спамных ссылок
• SEO-ссылок?
2. Расчет PR с различным весом у ссылок из разных кусков кода:
• Подвал
• Скрытые ссылки
3. Учёт времени появления ссылки?
7. Ссылочные Rank’и схожей модели
7
Различные Rank’и основанные на схожей модели
1. HostRank
2. TrustRank
3. SpamRank
8. Статистический антиспам
8
Выявления спама и накруток опираясь на статистические
характеристики ссылающихся документов:
• распределение по IP
• распределение по статическому весу
• распределение по тИЦ
• УВ, прочее
Группа доноров с
близкими
статистическими
характеристиками
Продвигаемый сайт
9. Динамические ссылочные: BM25
9
BM25 по анкор-листу (по словам из запроса).
В роли документа анкор-файл:
Основные параметры
q — слово запроса, D — документ, f — частота термина,
|D| — длина документа в словах,
avgdl — средняя длина документа в коллекции,
k и b — свободные коэффициенты.
10. Модификации BM25
10
Модификации формулы BM25 для анкор-листа:
1. Расчет BM25 по анкор-листу + тексту документа.
2. С учётом и без учёта синонимов.
3. С различными весами слов (в зависимости от «силы» ссылки).
12. «Хорошие» и «плохие» ссылки
12
Вопросы:
1. Бывают ли «плохие» ссылки, которые могут навредить?
2. Как найти «хорошие» ссылки? Рабочие метрики и эвристики?
3. Оценка качества ссылок по совокупности, а одиночных связей
донор-акцептор?
4. Безанкорные ссылки?
14. Учёт тематичности ссылок
14
Вопросы:
1. Всегда ли требуется учитывать тематику? Есть моно- и
политематичные ресурсы.
2. Тематические классификаторы.
Условное «пересечение» тематик
15. Учёт региональной связки
15
Региональная связка «донор-акцептор»:
1. Определение самих региональных привязок (Google).
2. Расчет ряда факторов по регионам: страна, округ, город.
3. Выявление накруток.
17. Динамика прироста ссылок
17
Вариации и параметры:
1. Учёт ссылок с вхождение слов запроса (время прироста).
2. Возможен учёт уже существующих ссылок на сайт (% прироста).
3. Время появления основных скоплений ссылок (равномерность
распределения).
18. Возраст ссылочной массы
18
Вопросы:
1. Сразу ли работает ссылка? Ссылочный апдейт или…?
2. Учёт возраста ссылочной массы: 1-3 месяца или 1-3 года?
3. Возможное «протухание» ссылок? Закупили и забыли…
19. Ссылки через редиректы
19
Интересные нюансы:
1. Существуют внутри- и внехостовые редиректы
2. Различные типы:
• Сокращалки ссылок
• Внутренние редиректы
• Внешние длинные и короткие цепочки редиректов
• Остальные
3. Возможен учёт редиректов различных типов для улучшения
ранжирования