1. Как скачать интернет и не испортить карму.
2. Статистика по ссылкам и распледеление доноров/акцепторов в глобальной базе.
3. Аномалии в ссылочном индексе и как находить "темы".
4. Что не так в вашем анализе ссылок?
7. Немного статистики
~90 млн доменов в индексе google
~180 млн c учетом поддоменов
Лидер по количеству редиректов hugedomains.com
Лидер по количеству поддоменов tumblr.com
Лидер по количеству ссылок/доменов facebook
8. Что в не индексируемой части
● Партнерки (казино, фарма и пр)
● Зеркала
● Припаркованные домены
● Пустые домены
18. Заспамленные домены
● Большое количество исходящих ссылок с одной страницы
● Спам - текст
● Ссылки на сайты с вирусами
● Заспамленный исходящих анкор-лист
Список спам доменов https://bit.ly/2XKpaVd
20. Используйте правильную метрику
● Количество ссылок - зависит от глубины парсинга и количество
сквозных ссылок
● Количество ссылающихся доменов - не учитывает блого-хостинги
● Количество ссылающихся хостов - может включать ссылки со
своего домена
hostname.domain.com
21. Не верьте в "историю ссылок"
Причины по которым ссылочный индекс может показать неверную историю:
- Сайт закрыли от индексатора
- Дата сканирования <> Дата появления
- Индексатор не смог просканировать (напр.502)