Slides from seminar devoted to improve proficiency of web designers, developers, QAs in the area of building seo-frienldy websites. The seminar took place at Zfort Group's office in Kharkov, Ukraine.
2. План доклада:
• Принципы работы поисковой системы
• Как сделать сайт доступным для ПС
• Язык запросов Google
• Последние изменения алгоритмов Google
3. Самое важное место в структуре
современного интернета занимают
поисковые системы
5. Принципы работы ПС
• Crawling – составление списка страниц
• Индексация
текста
ссылок
картинок
документов разных форматов
Глубина индексации
• Поисковая выдача
6. Мы должны решить 2 задачи:
• Позволить поисковому роботу
беспрепятственно «ходить» по сайту,
• Позволить роботу проиндексировать
страницы сайта в полном объёме.
7. Как сделать сайт доступным для ПС
• Работа с содержанием
• Meta tags
• URL
• Images
• rel=canonical, переадресация 301/302,
ошибки 404
• Robots.txt
• Schema.org
14. Meta Tags
• Title
– Уникальный
– В начале – ключевое слово
– В конце – | название сайта (компании)
– Длина – до 70 символов, включая пробелы
• Description
– Уникальный
– Длина – до 156 символов, включая пробелы
– Зачастую – это сниппет
• Keywords
• H1, H2, … H4
• <b>, <strong> для жирного шрифта
15. HTML, CSS Validity
• Google HTML/CSS Style Guide
• HTML &CSS Validation Services (W3C)
16. URL
• Keyword-rich folder structure
– www.world-animals.com/herbivore/horse
– www.world-animals.com/2/13-84
• Root domains, subfolders, subdomains
– www.world-animals.com
– www.world-animals.com/herbivore/horse
– www.herbivore.world-animals.com/horse
• Длина URL – не больше 66 символов
• Разделители в URL (отказаться от “_”)
• Минимум вложенных папок – не больше 4
17. URL
• Dynamic URLs
• Session IDs
– www.example.com/dresses/green.htm?sid=27374
– www.site.com//index.php?PHPSESSID=9ebca8bd6
2c830d3e79272b4f585ff8f
Свести к минимуму количество параметров в
динамических адресах
18. URL
• Переадресация
– www.site.com
– site.com
– www.site.com/
– www.site.com/index.htm
– Свести к одному адресу с помощью 301
редиректа
19. Images
• Текст в изображениях не индексируется
• Названия файлов
– …/black-cat.jpeg
– …/12042012.jpeg
• Размеры изображения (width/height)
• Alt
– <img src="black-cat.jpg" alt=""/> - нельзя
– <img src="black-cat.jpg" alt="Black Cat of My Friend Pete"/> -
нужно
• Title – не оставлять пустым
• Image Map
20. rel=canonical
– Canonical – предпочтительный
– <link rel="canonical"
href="http://www.example.com/product.php?item=s
wedish-fish"/> - этот код нужно добавить на
страницы-дубликаты в разделе <head>
– Link: <http://www.example.com/downloads/white-
paper.pdf>; rel="canonical" – этот код нужно
добавить в http-заголовок страницы
21. 301, 302, 404
• 301 – moved permanently – отдаёт 98% рейтинга
страницы
• 302 – moved temporally – не отдаёт рейтинг
страницы
• 404 – page not found
– Неработающая ссылка
– Удалённая страница
– Неверно набранный адрес
– Убедиться, что веб-сервер отдаёт код статуса HTTP 404
– Создать кастомную 404 Error page
– Не допустить редирект на главную страницу
22. Robots.txt
• Первый файл, который смотрит ПС
• Позволяет запретить индексацию всего
сайта, отдельных папок либо страниц
Разрешение индексации всего сайта:
User-agent: *
Disallow:
Запрет индексации всего сайта:
User-agent: *
Disallow: /
23. Robots.txt
Запрет индексации отдельных папок:
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Запрет индексации определённым роботом
отдельного файла:
User-agent: googlebot
Disallow: /cheese.htm
Мобильную версию сайта, страницы печати, результаты поиска на
сайте, личную информацию пользователей необходимо
блокировать от индексации
24. Schema.org
• Schema.org - общедоступный словарь, с
помощью которого возможно размечать
страницы для помощи ПС «осмыслить»
содержимое сайта, а также для
привлекательных и понятных результатов
поисковой выдачи.
25. Schema.org
<div>
<h1>Аватар</h1>
<span>Режиссер: Джеймс Кэмерон (род. 16 августа 1954 г.)</span>
<span>Фантастика</span>
<a href="../movies/avatar-theatrical-trailer.html">Трейлер</a> </div>
<div itemscope itemtype="http://schema.org/Movie">
<h1 itemprop="name">Аватар</h1>
<div itemprop="director" itemscope itemtype="http://schema.org/Person">
Режиссер: <span itemprop="name">Джеймс Кэмерон</span> (род. <span
itemprop="birthDate">16 августа 1954 г.</span>)
</div>
<span itemprop="genre">Фантастика</span>
<a href="../movies/avatar-theatrical-trailer.html" itemprop="trailer">Трейлер</a>
</div>
28. Язык запросов Google
• Поиск на определённом сайте “ query site:”
Новый алгоритм Google site:www.google.com
• Исключение из Google поиска “-”
Новый алгоритм –Google
• Поиск по синонимам “~”
Новый ~алгоритм Google
• Неопределённый поиск
Новый алгоритм * Google
• Поиск на выбор из вариантов “|”, “OR”
Новый алгоритм Google|Yandex, Новый алгоритм Google OR Yandex
• Значение слова "define:”
Define:алгоритм
• Поиск по определённому сайту достаточно прибавить к искомой
фразе следующий синтаксис – "site:”
site:http://www.zfort.com/web-development-process
29. Язык запросов Google
• Обратные ссылки “links:”
links:www.zfort.com
• Поиск кешированной страницы “cache:”
cache:zfort.com
• Конвертер величин
1 кг в фунтах
• Конвертер валют
1 *валюта+ в *валюта+
• Точное совпадение – “”
“Новый алгоритм Google”
• Google калькулятор
• Поиск по типам файлов “filetype:”
принципы работы ДВC filetype:doc
• Графики математических функций
32. Google Panda
• Анализ контентного наполнения ресурсов
• Поведенческие факторы
• Копированный контент
• Тексты с ошибками
• Тексты после рерайта
• Тексты после некорректного перевода
• Перебор с количеством
рекламы, нерелевантная реклама
34. Google Penguin
• Скрытый текст
• Клоакинг или скрытая переадресация
• Переспам ключевых слов
• Повторяющийся контент
(домены, поддомены, отдельные страницы)
• Участие в схемах построения ссылок
• Покупные ссылки
• Большое количество рекламы на главной
странице