• Like
  • Save
Duplicate Content Seo campus 09-03-2012
Upcoming SlideShare
Loading in...5
×
 

Duplicate Content Seo campus 09-03-2012

on

  • 15,249 views

Support de la conférence d'Olivier Andrieu (Abodnance) sur le Duplicate Content au salon SEO Campus le 9 mars 2012.

Support de la conférence d'Olivier Andrieu (Abodnance) sur le Duplicate Content au salon SEO Campus le 9 mars 2012.

Statistics

Views

Total Views
15,249
Views on SlideShare
5,020
Embed Views
10,229

Actions

Likes
7
Downloads
148
Comments
0

29 Embeds 10,229

http://www.redactiweb.com 5866
http://blog.abondance.com 2095
http://www.1ere-position.fr 745
http://www.sochouette.com 532
http://www.abondance.com 373
http://www.tendances-webmarketing.com 160
http://www.rezo.biz 97
http://www.secrets2moteurs.com 94
http://www.mitambo.com 93
http://8339678696949812625_cf57a2703eb79b2b1fecae3d97f9ce54c93d4f3e.blogspot.com 36
http://www.florence-cann.com 27
https://booster-sqli.bluekiwi.net 22
http://feeds.feedburner.com 20
http://forum.utilisable.com 18
http://www.bonbudget.com 10
http://www.ziknblog.com 8
http://webcache.googleusercontent.com 6
http://us-w1.rockmelt.com 6
http://feeds2.feedburner.com 4
http://www.ig.gmodules.com 3
http://www.twylah.com 2
http://www.online-translator.com 2
http://127.0.0.1 2
http://www.netvibes.com 2
http://www.newsblur.com 2
http://www.gosme.org 1
http://www.melzoo.com 1
http://pigeindexeroff 1
https://twimg0-a.akamaihd.net 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Duplicate Content Seo campus 09-03-2012 Duplicate Content Seo campus 09-03-2012 Presentation Transcript

    • L e " D u p lic a t eC o nte nt"Olivier Andrieu (Abondance)SEO CAMPUS9 mars 2012olivier@abondance.comhttp://www.abondance.com/
    • PrésentationOlivier Andrieu (olivier@abondance.com)Basé à Heiligenstein (67140)- Premiers pas sur Internet en 1993- Création de la société Abondance en 1996- Audit, conseil, accompagnement, formations, etc.autour du référencement naturel (SEO) Lettre professionnelle "Recherche et Référencement"
    • L e " D u p lic a t e C o n t e n t " Le "duplicate content", cest quoi ?
    • Le "duplicate content", cest quoi ? La gestion du contenu dupliqué par les moteurs La notion de contenu dupliqué peut être de différents types…
    • Le "duplicate content", cest quoi ? ???
    • Le "duplicate content", cest quoi ? Il peut sagir de contenus complets ou parfois de ??? "parties de contenus"
    • Le "duplicate content", cest quoi ? Il peut sagir de contenus complets ou parfois de ??? "parties de contenus" Méthodes : Algorithme de Simhash : http://www.cs.princeton.edu/courses/archive/ spring04/cos598B/bib/CharikarEstim.pdf Indice et distance de Jaccard : http://fr.wikipedia.org/wiki/Indice_et_distance _de_Jaccard Similarité Cosinus / Indice de Tanimoto : http://fr.wikipedia.org/wiki/Similarit %C3%A9_cosinus#indice_de_Tanimoto Coefficient de Dice : http://en.wikipedia.org/wiki/Dices_coefficient
    • Le "duplicate content", cest quoi ? Canonique (loriginal)  PageRank  Date de crawl Dupliquée (la copie)  Moins de visibilité  Crawl affecté
    • L e " D u p lic a t e C o n t e n t " Les différentes formes de "duplicate content"
    • Les différentes formes de "duplicate content"1. Le DC intrasite http://www.siteweb.com/actu/france/ http://www.siteweb.com/actu/presidentielles- sarkozy-hollande.html 2012/sarkozy-hollande.html ???
    • Les différentes formes de "duplicate content"2. Le DC intersite http://www.siteweb.com/actu/france/ http://www.autresiteweb.com/actualites/ sarkozy-hollande.html sarkozy-hollande.html ???
    • Les différentes formes de "duplicate content"3. Le DC "DUST" (Duplicate URL, Same Text) ??? http://www.siteweb.com/actu/france/sarkozy-hollande/ http://siteweb.com/actu/france/sarkozy-hollande/ http://www.siteweb.com/actu/france/sarkozy-hollande http://www.siteweb.com/actu/france/sarkozy-hollande/index.html http://www.siteweb.com/actu/france/sarkozy-hollande/index.html?source=emailing&pays=fr http://www.siteweb.com/actu/france/sarkozy-hollande/index.html?pays=fr& source=emailing
    • Les différentes formes de "duplicate content"4. Le DC par similarité des Title et meta "description" ???
    • Les différentes formes de "duplicate content"5. Le DC multilingue http://www.siteweb.fr/actu/s http://www.siteweb.be/actu/ http://www.siteweb.ch/actu/ arkozy-hollande.html sarkozy-hollande.html sarkozy-hollande.html ???
    • L e " D u p lic a t e C o n t e n t " Les solutions contre le "duplicate content"
    • "Duplicate content" : les solutions1. Le DC intrasite http://www.siteweb.com/actu/france/ http://www.siteweb.com/actu/presidentielles- sarkozy-hollande.html 2012/sarkozy-hollande.html ???
    • "Duplicate content" : les solutions1. Le DC intrasite http://www.siteweb.com/actu/france/ http://www.siteweb.com/actu/presidentielles- sarkozy-hollande.html 2012/sarkozy-hollande.html 1ère solution : suffisamment modifier le second contenu pour le différencier du premier (réécriture manuelle, ajout de contenu, spinning, etc.)
    • "Duplicate content" : les solutions1. Le DC intrasite Des outils comme DuplicateContent.net (ou dautres similaires) peuvent vous aider
    • "Duplicate content" : les solutions1. Le DC intrasite http://www.siteweb.com/actu/france/ http://www.siteweb.com/actu/presidentielles- sarkozy-hollande.html 2012/sarkozy-hollande.html 2ème solution : balise "canonical" Dupliquée <link rel="canonical" href=" Canonique http://www.siteweb.com/actu/france/sarkozy-hollande.html">
    • "Duplicate content" : les solutions1. Le DC intrasite http://www.siteweb.com/actu/france/ http://www.siteweb.com/actu/presidentielles- sarkozy-hollande.html 2012/sarkozy-hollande.html 3ème solution : désindexation Disallow: http://www.siteweb.com/actu/presidentielles-2012/sarkozy-hollan html (robots.txt) Ou <meta name="robots" content="noindex,follow">
    • "Duplicate content" : les solutions1. Le DC intrasite Attention aux versions PDF de vos pages HTML (ou inversement) : http://actu.abondance.com/2011/09/google-et-lindexation-de-documents-pdf.html En revanche, un contenu traduit nentre pas en duplicate content avec loriginal…
    • "Duplicate content" : les solutions2. Le DC intersite http://www.siteweb.com/actu/france/ http://www.autresiteweb.com/actualites/ sarkozy-hollande.html sarkozy-hollande.html Même solution (mais plus compliquée) : balise "canonical" (ou réécriture ou désindexation) Dupliquée <link rel="canonical" href=" Canonique http://www.siteweb.com/actu/france/sarkozy-hollande.html">
    • "Duplicate content" : les solutions2. Le DC intersite Eviter de proposer le contenu complet de vos articles dans vos fils RSS. Proposer plutôt titre + chapo… La reprise dun fil RSS contenant titre + chapo ne constitue pas un cas de DC.
    • "Duplicate content" : les solutions3. Le DC "DUST" (Duplicate URL, Same Text) ??? http://www.siteweb.com/actu/france/sarkozy-hollande/ http://siteweb.com/actu/france/sarkozy-hollande/ http://www.siteweb.com/actu/france/sarkozy-hollande http://www.siteweb.com/actu/france/sarkozy-hollande/index.html http://www.siteweb.com/actu/france/sarkozy-hollande/index.html?source=emailing&pays=fr http://www.siteweb.com/actu/france/sarkozy-hollande/index.html?pays=fr& source=emailing
    • "Duplicate content" : les solutions3. Le DC "DUST" (Duplicate URL, Same Text) Solution : balise "canonical" <link rel="canonical" href=" http://www.siteweb.com/actu/france/sarkozy- hollande/" > http://www.siteweb.com/actu/france/sarkozy-hollande/ http://www.siteweb.com/actu/france/sarkozy-hollande http://www.siteweb.com/actu/france/sarkozy-hollande/index.html http://www.siteweb.com/actu/france/sarkozy-hollande/index.html? source=emailing
    • "Duplicate content" : les solutions3. Le DC "DUST" (Duplicate URL, Same Text) Solution : Vérifier dans les Webmaster Tools (Configuration du site > Paramètres dURL) les paramètres dURL qui peuvent générer du DC…
    • "Duplicate content" : les solutions3. Le DC "DUST" (Duplicate URL, Same Text) Solution : 1. Indiquez uniquement les URL canoniques dans votre Sitemap ! 2. Faites attention à votre linking interne : http://www.votresite.com/ vs. http://www.votresite.com 3. Vérifiez que vos URL réécrites sont redirigées en 301 : http://www.votresite.fr/index.php?id=4 301 http://www.votresite.fr/apropos.html
    • "Duplicate content" : les solutions4. Le DC par similarité des Title et meta "description" ???
    • "Duplicate content" : les solutions4. Le DC par similarité des TITLE et meta "description" Solution : 1. Vérifier dans les Webmaster Tools (Diagnostic > Suggestions HTML) 2. Corriger en différenciant suffisamment les TITLE et meta "description" de chaque page du site.
    • "Duplicate content" : les solutions5. Le DC multilingue http://www.siteweb.fr/actu/s http://www.siteweb.be/actu/ http://www.siteweb.ch/actu/ arkozy-hollande.html sarkozy-hollande.html sarkozy-hollande.html ???
    • "Duplicate content" : les solutions5. Le DC multilingue Solution : 1. Les balises multilingues http://www.siteweb.fr/actu/s http://www.siteweb.be/actu/ http://www.siteweb.ch/actu/ arkozy-hollande.html sarkozy-hollande.html sarkozy-hollande.html <link rel="alternate" <link rel="alternate" <link rel="alternate" hreflang="fr-fr" href=" hreflang="fr-be" href=" hreflang="fr-ch" href=" http://www.siteweb.fr/actu/s http://www.siteweb.fr/actu/s http://www.siteweb.fr/actu/s arkozy-hollande.html " /> arkozy-hollande.html " /> arkozy-hollande.html " />
    • "Duplicate content" : les solutions5. Le DC multilingue Solution : 2. Indiquer le pays-cible dans les Webmaster Tools (Configuration du site > Paramètres)
    • L e " D u p lic a t e C o n t e n t " Conclusion
    • Conclusion- Le DC nest pas une pénalité pour un site (sauf spamdexing :http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=66359), mais donne une moins bonne visibilité auxpages dupliquées.- Parfois le simple fait de corriger les problèmes de DC amélioregrandement un référencement.- Il nest pas nécessaire de faire une demande de reconsidérationde site à Google après avoir corrigé du DC.- Les solutions existent.- En règle générale, elles fonctionnent, mais c’est souvent trèslong ;-)- Google devrait peut-être proposer une assistance adaptée auxgros sites web à ce sujet.
    • ConclusionPetite webographie googlienne pour aller plus loin :New markup for multilingual content (05/12/2011)http://googlewebmastercentral.blogspot.com/2011/12/new-markup-for-multilingual-content.htmlMore guidance on building high-quality sites (06/05/2011)http://googlewebmastercentral.blogspot.com/2011/05/more-guidance-on-building-high-quality.htmlHandling legitimate cross-domain content duplication (15/12/2009)http://googlewebmastercentral.blogspot.com/2009/12/handling-legitimate-cross-domain.htmlReunifying duplicate content on your website (06/10/2009)http://googlewebmastercentral.blogspot.com/2009/10/reunifying-duplicate-content-on-your.htmlDuplicate content and multiple site issues (15/09/2009)http://googlewebmastercentral.blogspot.com/2009/09/duplicate-content-and-multiple-site.htmlSpecify your canonical (12/02/2009)http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.htmlDemystifying the "duplicate content penalty" (12/09/2008)http://googlewebmastercentral.blogspot.com/2008/09/demystifying-duplicate-content-penalty.htmlDuplicate content due to scrapers (09/06/2008)http://googlewebmastercentral.blogspot.com/2008/06/duplicate-content-due-to-scrapers.htmlDeftly dealing with duplicate content (18/12/2006)http://googlewebmastercentral.blogspot.com/2006/12/deftly-dealing-with-duplicate-content.htmlPlus dinfos : requête intitle:"duplicate content" site:googlewebmastercentral.blogspot.com
    • ConclusionPetite webographie non-googlienne pour aller plus loin :Similarité et Duplicate content : Lindice de Jaccardhttp://b1n.sp1n.me/seo/similarite-duplicate-content-indice-jaccard.109.htmlAlgorithme de Simhash: Script PHP de calcul de similaritéhttp://www.seoblack-inside.com/php-calcul-similaire-texte-simhash/Ne pas confondre similarité et duplication de contenus; cas d’écolehttp://www.webcontentspinning.com/ne-pas-confondre-similarite-et-duplication-de-contenus-cas-decole/Détection de duplicate contenthttp://www.webcontentspinning.com/detection/Dis papa cest quoi le duplicate content ?http://www.cyroul.com/web12/dis-papa-cest-quoi-le-duplicate-content/Vol de contenu et duplicate contenthttp://blog.axe-net.fr/duplicate-content-plagiat/Google lutte contre les scrapers et encourage la dénonciationhttp://actu.abondance.com/2011/08/google-lutte-contre-les-scrapers-et.htmlTout savoir sur le filtre Contenus Dupliqués de Googlehttp://www.webrankinfo.com/dossiers/techniques/filtre-duplicate-contentLutter contre le duplicate contenthttp://s.billard.free.fr/referencement/?2008/04/24/477-lutter-contre-le-duplicate-contentGoogle Patent Granted on Duplicate Content Detection in a Web Crawler Systemhttp://www.seobythesea.com/2009/12/google-patent-granted-on-duplicate-content-detection-in-a-web-crawler-system/Duplicate and Near Duplicate Documents Detection: A Reviewhttp://www.eurojournals.com/ejsr_32_4_08.pdfThe Illustrated Guide to Duplicate Content in the Search Engineshttp://www.seomoz.org/blog/the-illustrated-guide-to-duplicate-content-in-the-search-engines
    • L e " D u p lic a t e C o n t e n t " Merci :-) Support proposé par Olivier Andrieu - olivier@abondance.com