SEO-Friendly Websites

Как подружиться с поисковой
         системой
План доклада:
•   Принципы работы поисковой системы
•   Как сделать сайт доступным для ПС
•   Язык запросов Google
•   Последние изменения алгоритмов Google
Самое важное место в структуре
современного интернета занимают
      поисковые системы
Наиболее популярные ПС
 (англоязычный сегмент)
Принципы работы ПС
• Crawling – составление списка страниц
• Индексация
  текста
  ссылок
  картинок
  документов разных форматов
  Глубина индексации
• Поисковая выдача
Мы должны решить 2 задачи:
• Позволить поисковому роботу
  беспрепятственно «ходить» по сайту,
• Позволить роботу проиндексировать
  страницы сайта в полном объёме.
Как сделать сайт доступным для ПС
• Работа с содержанием
• Meta tags
• URL
• Images
• rel=canonical, переадресация 301/302,
  ошибки 404
• Robots.txt
• Schema.org
Работа с содержанием
Чёткая иерархия меню
• Перелинковка
• «Хлебные крошки»
• Любая страница в 3 клика
Количество ссылок на странице
• Не больше 100 внешних ссылок
• Осторожно с количеством внутренних
  ссылок!
Ключевые слова в тексте
• Не допускайте переспам
• Не допускайте
  дублированный, копированный контент
Скорость загрузки страницы
• Оптимальная скорость загрузки страницы –
  3 секунды
• Сервисы проверки скорости: Page
  Speed, YSlow, WebPagetest, etc.
Динамический контент
• Flesh
• JavaScript

• Создавать HTML-версии динамических блоков




Использовать текстовый браузер (Lynx) для тестирования отображения
                       динамического контента
Rel=nofollow
1. <meta name="robots" content="nofollow"
   />

2. <a href="signin.php" rel="nofollow">sign
   in</a>

3. <a href="www.myspamywebsite.com"
   rel="nofollow">Click here now!</a>
Meta Tags
• Title
   –   Уникальный
   –   В начале – ключевое слово
   –   В конце – | название сайта (компании)
   –   Длина – до 70 символов, включая пробелы
• Description
   – Уникальный
   – Длина – до 156 символов, включая пробелы
   – Зачастую – это сниппет
• Keywords
• H1, H2, … H4
• <b>, <strong> для жирного шрифта
HTML, CSS Validity
• Google HTML/CSS Style Guide




• HTML &CSS Validation Services (W3C)
URL
• Keyword-rich folder structure
  – www.world-animals.com/herbivore/horse
  – www.world-animals.com/2/13-84
• Root domains, subfolders, subdomains
  – www.world-animals.com
  – www.world-animals.com/herbivore/horse
  – www.herbivore.world-animals.com/horse
• Длина URL – не больше 66 символов
• Разделители в URL (отказаться от “_”)
• Минимум вложенных папок – не больше 4
URL
• Dynamic URLs
• Session IDs
  – www.example.com/dresses/green.htm?sid=27374
  – www.site.com//index.php?PHPSESSID=9ebca8bd6
    2c830d3e79272b4f585ff8f


   Свести к минимуму количество параметров в
              динамических адресах
URL
• Переадресация
  – www.site.com
  – site.com
  – www.site.com/
  – www.site.com/index.htm

  – Свести к одному адресу с помощью 301
    редиректа
Images
• Текст в изображениях не индексируется
• Названия файлов
   – …/black-cat.jpeg
   – …/12042012.jpeg
• Размеры изображения (width/height)
• Alt

   – <img src="black-cat.jpg" alt=""/> - нельзя
   – <img src="black-cat.jpg" alt="Black Cat of My Friend Pete"/> -
     нужно
• Title – не оставлять пустым
• Image Map
rel=canonical
– Canonical – предпочтительный

– <link rel="canonical"
  href="http://www.example.com/product.php?item=s
  wedish-fish"/> - этот код нужно добавить на
  страницы-дубликаты в разделе <head>

– Link: <http://www.example.com/downloads/white-
  paper.pdf>; rel="canonical" – этот код нужно
  добавить в http-заголовок страницы
301, 302, 404
• 301 – moved permanently – отдаёт 98% рейтинга
  страницы
• 302 – moved temporally – не отдаёт рейтинг
  страницы
• 404 – page not found
  – Неработающая ссылка
  – Удалённая страница
  – Неверно набранный адрес

  – Убедиться, что веб-сервер отдаёт код статуса HTTP 404
  – Создать кастомную 404 Error page
  – Не допустить редирект на главную страницу
Robots.txt
• Первый файл, который смотрит ПС
• Позволяет запретить индексацию всего
  сайта, отдельных папок либо страниц

Разрешение индексации всего сайта:

User-agent: *
Disallow:

Запрет индексации всего сайта:

User-agent: *
Disallow: /
Robots.txt
Запрет индексации отдельных папок:

User-agent: *
Disallow: /cgi-bin/
Disallow: /images/

Запрет индексации определённым роботом
отдельного файла:

User-agent: googlebot
Disallow: /cheese.htm

   Мобильную версию сайта, страницы печати, результаты поиска на
       сайте, личную информацию пользователей необходимо
                    блокировать от индексации
Schema.org
• Schema.org - общедоступный словарь, с
  помощью которого возможно размечать
  страницы для помощи ПС «осмыслить»
  содержимое сайта, а также для
  привлекательных и понятных результатов
  поисковой выдачи.
Schema.org
<div>
<h1>Аватар</h1>
<span>Режиссер: Джеймс Кэмерон (род. 16 августа 1954 г.)</span>
<span>Фантастика</span>
<a href="../movies/avatar-theatrical-trailer.html">Трейлер</a> </div>


<div itemscope itemtype="http://schema.org/Movie">
 <h1 itemprop="name">Аватар</h1>
 <div itemprop="director" itemscope itemtype="http://schema.org/Person">
 Режиссер: <span itemprop="name">Джеймс Кэмерон</span> (род. <span
    itemprop="birthDate">16 августа 1954 г.</span>)
 </div>
 <span itemprop="genre">Фантастика</span>
 <a href="../movies/avatar-theatrical-trailer.html" itemprop="trailer">Трейлер</a>
</div>
Schema.org
Вопросы
Язык запросов Google
• Поиск на определённом сайте “ query site:”
      Новый алгоритм Google site:www.google.com
• Исключение из Google поиска “-”
       Новый алгоритм –Google
• Поиск по синонимам “~”
       Новый ~алгоритм Google
• Неопределённый поиск
       Новый алгоритм * Google
• Поиск на выбор из вариантов “|”, “OR”
       Новый алгоритм Google|Yandex, Новый алгоритм Google OR   Yandex
• Значение слова "define:”
       Define:алгоритм
• Поиск по определённому сайту достаточно прибавить к искомой
  фразе следующий синтаксис – "site:”
       site:http://www.zfort.com/web-development-process
Язык запросов Google
• Обратные ссылки “links:”
       links:www.zfort.com
• Поиск кешированной страницы “cache:”
       cache:zfort.com
• Конвертер величин
       1 кг в фунтах
• Конвертер валют
       1 *валюта+ в *валюта+
• Точное совпадение – “”
       “Новый алгоритм Google”
• Google калькулятор
• Поиск по типам файлов “filetype:”
       принципы работы ДВC filetype:doc
• Графики математических функций
Язык запросов Google
Последние алгоритмы Google
Google Panda
•   Анализ контентного наполнения ресурсов
•   Поведенческие факторы
•   Копированный контент
•   Тексты с ошибками
•   Тексты после рерайта
•   Тексты после некорректного перевода
•   Перебор с количеством
    рекламы, нерелевантная реклама
Google Penguin
Google Penguin
• Скрытый текст
• Клоакинг или скрытая переадресация
• Переспам ключевых слов
• Повторяющийся контент
  (домены, поддомены, отдельные страницы)
• Участие в схемах построения ссылок
• Покупные ссылки
• Большое количество рекламы на главной
  странице

SEO-Friendly Websites

  • 1.
    SEO-Friendly Websites Как подружитьсяс поисковой системой
  • 2.
    План доклада: • Принципы работы поисковой системы • Как сделать сайт доступным для ПС • Язык запросов Google • Последние изменения алгоритмов Google
  • 3.
    Самое важное местов структуре современного интернета занимают поисковые системы
  • 4.
    Наиболее популярные ПС (англоязычный сегмент)
  • 5.
    Принципы работы ПС •Crawling – составление списка страниц • Индексация текста ссылок картинок документов разных форматов Глубина индексации • Поисковая выдача
  • 6.
    Мы должны решить2 задачи: • Позволить поисковому роботу беспрепятственно «ходить» по сайту, • Позволить роботу проиндексировать страницы сайта в полном объёме.
  • 7.
    Как сделать сайтдоступным для ПС • Работа с содержанием • Meta tags • URL • Images • rel=canonical, переадресация 301/302, ошибки 404 • Robots.txt • Schema.org
  • 8.
    Работа с содержанием Чёткаяиерархия меню • Перелинковка • «Хлебные крошки» • Любая страница в 3 клика
  • 9.
    Количество ссылок настранице • Не больше 100 внешних ссылок • Осторожно с количеством внутренних ссылок!
  • 10.
    Ключевые слова втексте • Не допускайте переспам • Не допускайте дублированный, копированный контент
  • 11.
    Скорость загрузки страницы •Оптимальная скорость загрузки страницы – 3 секунды • Сервисы проверки скорости: Page Speed, YSlow, WebPagetest, etc.
  • 12.
    Динамический контент • Flesh •JavaScript • Создавать HTML-версии динамических блоков Использовать текстовый браузер (Lynx) для тестирования отображения динамического контента
  • 13.
    Rel=nofollow 1. <meta name="robots"content="nofollow" /> 2. <a href="signin.php" rel="nofollow">sign in</a> 3. <a href="www.myspamywebsite.com" rel="nofollow">Click here now!</a>
  • 14.
    Meta Tags • Title – Уникальный – В начале – ключевое слово – В конце – | название сайта (компании) – Длина – до 70 символов, включая пробелы • Description – Уникальный – Длина – до 156 символов, включая пробелы – Зачастую – это сниппет • Keywords • H1, H2, … H4 • <b>, <strong> для жирного шрифта
  • 15.
    HTML, CSS Validity •Google HTML/CSS Style Guide • HTML &CSS Validation Services (W3C)
  • 16.
    URL • Keyword-rich folderstructure – www.world-animals.com/herbivore/horse – www.world-animals.com/2/13-84 • Root domains, subfolders, subdomains – www.world-animals.com – www.world-animals.com/herbivore/horse – www.herbivore.world-animals.com/horse • Длина URL – не больше 66 символов • Разделители в URL (отказаться от “_”) • Минимум вложенных папок – не больше 4
  • 17.
    URL • Dynamic URLs •Session IDs – www.example.com/dresses/green.htm?sid=27374 – www.site.com//index.php?PHPSESSID=9ebca8bd6 2c830d3e79272b4f585ff8f Свести к минимуму количество параметров в динамических адресах
  • 18.
    URL • Переадресация – www.site.com – site.com – www.site.com/ – www.site.com/index.htm – Свести к одному адресу с помощью 301 редиректа
  • 19.
    Images • Текст визображениях не индексируется • Названия файлов – …/black-cat.jpeg – …/12042012.jpeg • Размеры изображения (width/height) • Alt – <img src="black-cat.jpg" alt=""/> - нельзя – <img src="black-cat.jpg" alt="Black Cat of My Friend Pete"/> - нужно • Title – не оставлять пустым • Image Map
  • 20.
    rel=canonical – Canonical –предпочтительный – <link rel="canonical" href="http://www.example.com/product.php?item=s wedish-fish"/> - этот код нужно добавить на страницы-дубликаты в разделе <head> – Link: <http://www.example.com/downloads/white- paper.pdf>; rel="canonical" – этот код нужно добавить в http-заголовок страницы
  • 21.
    301, 302, 404 •301 – moved permanently – отдаёт 98% рейтинга страницы • 302 – moved temporally – не отдаёт рейтинг страницы • 404 – page not found – Неработающая ссылка – Удалённая страница – Неверно набранный адрес – Убедиться, что веб-сервер отдаёт код статуса HTTP 404 – Создать кастомную 404 Error page – Не допустить редирект на главную страницу
  • 22.
    Robots.txt • Первый файл,который смотрит ПС • Позволяет запретить индексацию всего сайта, отдельных папок либо страниц Разрешение индексации всего сайта: User-agent: * Disallow: Запрет индексации всего сайта: User-agent: * Disallow: /
  • 23.
    Robots.txt Запрет индексации отдельныхпапок: User-agent: * Disallow: /cgi-bin/ Disallow: /images/ Запрет индексации определённым роботом отдельного файла: User-agent: googlebot Disallow: /cheese.htm Мобильную версию сайта, страницы печати, результаты поиска на сайте, личную информацию пользователей необходимо блокировать от индексации
  • 24.
    Schema.org • Schema.org -общедоступный словарь, с помощью которого возможно размечать страницы для помощи ПС «осмыслить» содержимое сайта, а также для привлекательных и понятных результатов поисковой выдачи.
  • 25.
    Schema.org <div> <h1>Аватар</h1> <span>Режиссер: Джеймс Кэмерон(род. 16 августа 1954 г.)</span> <span>Фантастика</span> <a href="../movies/avatar-theatrical-trailer.html">Трейлер</a> </div> <div itemscope itemtype="http://schema.org/Movie"> <h1 itemprop="name">Аватар</h1> <div itemprop="director" itemscope itemtype="http://schema.org/Person"> Режиссер: <span itemprop="name">Джеймс Кэмерон</span> (род. <span itemprop="birthDate">16 августа 1954 г.</span>) </div> <span itemprop="genre">Фантастика</span> <a href="../movies/avatar-theatrical-trailer.html" itemprop="trailer">Трейлер</a> </div>
  • 26.
  • 27.
  • 28.
    Язык запросов Google •Поиск на определённом сайте “ query site:” Новый алгоритм Google site:www.google.com • Исключение из Google поиска “-” Новый алгоритм –Google • Поиск по синонимам “~” Новый ~алгоритм Google • Неопределённый поиск Новый алгоритм * Google • Поиск на выбор из вариантов “|”, “OR” Новый алгоритм Google|Yandex, Новый алгоритм Google OR Yandex • Значение слова "define:” Define:алгоритм • Поиск по определённому сайту достаточно прибавить к искомой фразе следующий синтаксис – "site:” site:http://www.zfort.com/web-development-process
  • 29.
    Язык запросов Google •Обратные ссылки “links:” links:www.zfort.com • Поиск кешированной страницы “cache:” cache:zfort.com • Конвертер величин 1 кг в фунтах • Конвертер валют 1 *валюта+ в *валюта+ • Точное совпадение – “” “Новый алгоритм Google” • Google калькулятор • Поиск по типам файлов “filetype:” принципы работы ДВC filetype:doc • Графики математических функций
  • 30.
  • 31.
  • 32.
    Google Panda • Анализ контентного наполнения ресурсов • Поведенческие факторы • Копированный контент • Тексты с ошибками • Тексты после рерайта • Тексты после некорректного перевода • Перебор с количеством рекламы, нерелевантная реклама
  • 33.
  • 34.
    Google Penguin • Скрытыйтекст • Клоакинг или скрытая переадресация • Переспам ключевых слов • Повторяющийся контент (домены, поддомены, отдельные страницы) • Участие в схемах построения ссылок • Покупные ссылки • Большое количество рекламы на главной странице