• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
дублированный контент
 

дублированный контент

on

  • 1,186 views

 

Statistics

Views

Total Views
1,186
Views on SlideShare
583
Embed Views
603

Actions

Likes
0
Downloads
3
Comments
0

9 Embeds 603

http://turboseo.com.ua 211
http://www.rusfet.com 152
http://seopub.turboseo.net.ua 89
http://seopub.turboseo.com.ua 53
http://www.seopub.turboseo.com.ua 46
http://turboseo.net.ua 42
http://seoforum.turboseo.com.ua 8
http://www.seopub.turboseo.net.ua 1
http://webinar.turboseo.net.ua 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Последняя версия Панды 3.8

дублированный контент дублированный контент Presentation Transcript

  • Способы обнаружения и устранения дублированного контента Часть 1
  • Алгоритмы поисковых систем совершенствуется с каждым днемДублированный контент является проблемойSEO уже много лет.Способы обработки дублированногоконтента Google совершенствуются истановятся более сложными с каждым новымобновлением алгоритмов.Последний апдейт Panda 3.7 (Jun 9) 2
  • Что такое дублированный контент?• Дублированный контент появляется, когда любые две (или более) страниц имеют одинаковый контент. Например:• Почему же такая простая концепция создаёт так много проблем? Одна проблема в том, что люди часто делают ошибку, думая, что страница – это файл или документ, лежащий на веб сервере. Для паука (crawler) (или Googlebot`а), страница – это любой уникальный URL, который ему посчастливилось найти. Обычно это происходит с помощью внутренних или внешних ссылок. Особенно на больших, динамических сайтах, создать два URL`а которые нацелены на 3 один и тот же контент удивительно просто (и часто случайно).
  • Почему дублированный контент так важен?• Примерно в конце 2006 года, Google интегрировал дополнительные результаты обратно в основной индекс, но эти результаты по-прежнему часто фильтровались. Вы можете узнать, что страницы были отфильтрованы, когда видите следующую надпись в нижней части выдачи Google: 4
  • «Бюджет» паука• Что же происходит, когда Google проходит по такому большому количеству дублированных адресов и страниц?Страницы, которые Вы хотели бы проиндексировать могут не быть просканированы. В лучшем случае, они вероятно не будут сканироваться так часто. 5
  • «Объем» индексации• Подобным образом, нет определенного объема страниц, которые будут проиндексированы Google`ом.• Судя по всему существует некоторый динамический лимит, тем не менее, это ограничение соотносится с авторитетностью сайта.• Если Вы наполните Ваш индекс бесполезными, дублированными страницами, вы можете вытеснить более важные, глубокие страницы. Например, если Вы загружаете 1000чи результатов внутреннего поиска, Google может не проиндексировать все Ваши страницы.• Многие люди делают ошибку, думая, что чем больше страниц в индексе, тем лучше. 6
  • Три типа дублей.• Полные дублиПолные дубли эта любая страница, которая 100% идентична (по контенту) другой странице. Такие страницы отличаются по URL: 7
  • Частичные дубли• Частичные дубли отличаются от остальных страниц небольшим объемом – это может быть блок текста, картинка или даже порядок вывода контента. 8
  • Междоменные дубли• Междоменные дубликаты появляются, когда два сайта выводят один и тот же контент: 9
  • Инструменты борьбы с дублями. 10
  • 404 ошибка• Конечно, самый простой способ работы с дублированными страницами – просто удалить её и отдать 404 ошибку. Если контент действительно не несет пользы для посетителей или поиска, и когда нет сильных входящих ссылок или трафика, тогда полное удаление – идеальное решение. 11
  • 301 редирект• Другой способ удалить страницу через 301 редирект.• В отличии от 404 – 301 редирект говорит посетителям (людям и ботам), что страница перемещена на другой адрес на постоянной основе. Люди попадут прямо на новую страницу.• Для SEO, большинство входящего ссылочного авторитета так же передастся новой странице. Если ваш дублированный контент имеет постоянный адрес URL, и дубль приносит трафик и входящие ссылки, тогда 301 редирект – идеальное решение. 12
  • Robots.txt• Ещё один способ избавиться от дублей и оставить его для посетителей. Самый старый и самый простой способ избавиться от дублей. Это выглядит вот так: 13
  • Meta Robots• Вы так же можете контролировать поведение поискового робота на уровне страниц, с помощью директивы на уровне хедера известной как тег “Meta Robots”. Это выглядит вот так: 14
  • Syndication-Source• В ноябре 2010 года, Google представил набор тегов для издателей синдицированного содержания. Мета тег Syndication-Source директива может быть использована для определения оригинального источника на пере публикованной статье, как например:• Более подробно описано здесь:• http://googlenewsblog.blogspot.com/2010/11/credit-where-cre• http://www.google.com/support/news_pub/bin/answer.py?ans 15
  • Syndication-Source• Update 2/11/11: Weve had a lot of interest in these meta tags, particularly in how the syndication-source tag relates to rel=canonical. After evaluating this feedback, we’ve updated our system to use rel=canonical instead of syndication-source, if both are specified. If you know the full URL, rel=canonical is preferred, and you need not specify syndication-source. If you know a partial URL, or just the domain name, continue using syndication-source. Weve also had people ask "why metatag instead of linktag"? We actually support both forms for the tag, and you can use either. However, we believe the linktag form is more in line with the spirit of the standard, and encourage new users to implement the linktag form rather than the metatag form we originally proposed. 16
  • Rel=Canonical• В 2009 году поисковые системы объединились, чтобы создать директиву rel=Canonical. Это позволяет вебмастерам указать каноническую версию любой страницы. Тег размещается в хедере страницы (как meta robots), и вот простой пример: 17
  • Rel=Canonical в биржах ссылок• Плагин SearchStatus для Firefox 18
  • Инструмент удаления URL Google• В Google Webmaster вы можете подать запрос на удаление отдельной страницы (или директории) в ручную из индекса. Важно знать, что прежде чем подавать заявку на удалению страницы Вам необходимо соблюдать одно из этих требований: - страница должна отдавать 404 ошибку; - быть закрыта в robots.txt; - блокироваться с помощью Meta Noindex. 19
  • Блокировка параметров URL в Google Webmasters 20
  • Rel=Prev & Rel=Next• В 2011 году был введен новый инструмент для борьбы с частично дублированным контентом для борьбы с частичными дублям в случае пагинации вебстраниц (нумерации страниц). 21
  • Внутренняя перелинковка• Важно помнить, что лучший способ борьбы с дублями – это не допущение дублирования контента.• Когда вы скорректируете проблему дублированного контента, с помощью 301- редиректа или тега canonical, например. Так же важно правильно среагировать на эти действия в остальных частях сайта. 22
  • Часть 2 23
  • Примеры дублированного контента 24
  • “www” и без-wwwОчень часто встречающаяся ошибка, которая создаётполное дублирование сайта:www.site.comsite.com•Для решения данной проблемы используйте 301редирект, т.к. это лучшее решение в данном случае.•Так же Вы можете выставить предпочитаемый доменв Вашей панели Google Webmasters. Для этогонеобходимо добавить оба домена с www и без www вВашу панель Google Webmasters. 25
  • Этап разработки сайта• На этапе разработки сайта часто создаются под домены для тестирования веб сайта.site.comTest.site.comНе забывайте закрывать такой под домен, используя robots.txt. Если же он уже про индексировался, Вам скорее всего необходимо склеить данные страницы с помощью 301 редиректа или использовать мета тег Noindex. 26
  • Слеш в конце (“/”)• Технически, в протоколе HTTP – это разные адреса. Сейчас в большинстве случаев, браузеры автоматически добавляют слеш в конце такого пути. Мэт Каттс в одном из видео сообщил, что Google автоматически распознаёт такие URLы в большинстве случаев. 27
  • HTTPS• https://site.com/• http://site.com/ 28
  • Дубли главных страниц• www.site.com• www.site.com/index.htm 29
  • И другие:• ID сессии.• Интернациональные дубли• Сортировка в поиске• Фильтры в поиске• Поисковая нумерация страниц• Варианты товаров• Украденный контент 30
  • Способы нахождения дублей• Google Webmaster Tools• Команда site: в Google (по куску текста)• Просматривая сайт (опытным путем) 31
  • 18Спасибо з а внимание ! Алек сандр Тимохов Seo- ст удия Tur boSeo т ел. 093. 157. 50. 43 tim ohov@ ur boseo. com ua t . Инт ернет - аг ент ст во: - SEO ( поиск овая опт имиз ация) - к омплек сные к ампании в инт ернет - баннера и к онт ек ст - SM ( продвижение в соц. сет ях ) M ht t p: //t urbos eo. c om ua . www. t ur bos eo. com ua . 32