• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Duplicate Content (smx 2010)
 

Duplicate Content (smx 2010)

on

  • 2,649 views

Duplicate Content-Präsentation von der SMX 2010 in München von Johannes Marquart

Duplicate Content-Präsentation von der SMX 2010 in München von Johannes Marquart

Statistics

Views

Total Views
2,649
Views on SlideShare
1,613
Embed Views
1,036

Actions

Likes
3
Downloads
1
Comments
0

4 Embeds 1,036

http://www.whiteside-seo.de 636
http://www.der-internet-redakteur.de 374
http://der-internet-redakteur.de 16
http://www.slideshare.net 10

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Konzernentwicklung
  • Konzernentwicklung
  • Konzernentwicklung
  • Konzernentwicklung http://www.google.com/support/webmasters/bin/answer.py?answer=66359 http://www.seomoz.org/blog/whiteboard-friday-dealing-with-duplicate-content http://www.seomoz.org/knowledge/duplicate-content http://www.seo-theory.com/2009/02/26/duplicate-content-for-seo-and-seo-for-duplicate-content/ http://www.suchradar.de/magazin/archiv/2009/6-2009/duplicate-content-erkennen.php http://www.whiteside-seo.de/duplicate-content/
  • Konzernentwicklung http://www.google.com/support/webmasters/bin/answer.py?answer=66359 http://www.seomoz.org/blog/whiteboard-friday-dealing-with-duplicate-content http://www.seomoz.org/knowledge/duplicate-content http://www.seo-theory.com/2009/02/26/duplicate-content-for-seo-and-seo-for-duplicate-content/ http://www.suchradar.de/magazin/archiv/2009/6-2009/duplicate-content-erkennen.php http://www.whiteside-seo.de/duplicate-content/

Duplicate Content (smx 2010) Duplicate Content (smx 2010) Presentation Transcript

  • Johannes Marquart | SEO Manager Duplicate Content | 2010-03-23 | SMX München Search Engine Friendly Design
  • Johannes Marquart
    • 2006: Hitflip Media Trading GmbH
      • Einstieg ins Affiliate/SEO-Geschäft
    • 2008: SEO Manager allesklar.com AG
      • Stellenmarkt (Jobs/Lehrstellen)
      • Fahrzeugmarkt (Auto/Motorrad)
      • Freizeit (Kino/Veranstaltungen)
      • ...
      • Projektleiter/Produktmanager Mobile
    • Blog: whiteside-seo.de
  • allesklar.com AG
    • Gegründet 1996
      • 2006: Minderheitsbeteiligung GvH
    • Gründer & Vorstandsvorsitzender
      • Dr. Manfred Stegger
    • Personal & Standorte
      • 280 (2010)
      • Siegburg (HQ), Essen, Berlin
    • Portale
      • allesklar.de (1996)
      • meinestadt.de (2000)
      • meineleute.de (2007)
      • datingcafe.de (2008)
  • Agenda
    • Was ist Duplicate Content?
    • Externer DC
      • Auswirkungen & Symptome
      • Strategische Komponenten
    • Interner DC
      • Auswirkungen & Symptome
      • Risikofaktoren & Ursachen
      • Methoden & Tools
    • Empfehlungen
  • Was ist Duplicate Content?
    • Contentblöcke (Chunks)
      • die Ähnlichkeit oder Gleichheit mit anderen Inhalten
      • auf derselben oder anderen Domain aufweisen .
    • Vorkommen von DC
      • Intern (eigene (Sub)Domain)
      • Extern (fremde Domain/TLD)
    pixelio, hofschläger
  • Muss ich mir das anhören?
    • Hört sich nicht so wirklich tragisch an
      • DC ist eines der größten internen Probleme von Webseiten
      • Ohne teilweise strategische Intervention und Planung nicht in den Griff zu bekommen
    • Spoiler: Was Sie nicht wussten
      • Google legt eine Obergrenze an indexierbaren Seiten pro Domain fest
      • Interner DC füllt Ihnen diesen Topf sehr schnell auf – wichtige Seiten fallen aus dem Index
    Pixelio, hofschlaeger
  • Ist DC nicht für den Cutts?
    • Google sagt Duplicate Content ist tot?
    • „ Es gibt keine DC-Penalty“ (Sep 2008)
    • Die Ableitung vieler SEOs: „DC ist nicht mehr schlimm“ – trifft nicht zu, da es sehr wohl noch Filter gibt.
    Unsinn. mondspeer
  • DC erkennen & aufdecken
    • Google (indexierter DC)
      • Corporate Title-Abfragen
      • Abfragen über Textabschnitte
      • Indexabfragen: Omitted Results?
      • Webm. Tools Dupe Titles/Description
    • Software (Plagiatfinder)
      • Uncover (Textbroker)
      • Copyscape/Copysentry
      • Plagaware
      • Fingerprint (für Bilder)
    Pixelio, M.E. exkurs
  • Externer Duplicate Content Duplicate Content auf unterschiedliche TLDs
  • Sichtbarkeitsverluste
    • Auswirkungen solcher Schwankungen können vielseitig sein und sind u.U. schwer aufzudecken
    © sistrix.de – Sichtbarkeit de/com-Domain 2010-03-08
  • Sichtbarkeitsverluste
    • Duplicate Content als Ursache für „Ranking-Swaps“ (hier extern durch duplizierte Domains de/com)
    © sistrix.de – Sichtbarkeit de/com-Domain 2010-03-08
  • Sichtbarkeitsverluste
    • Tauschen von Sichtbarkeit ist einer der häufigsten DC-Effekte – Trafficverlust inbegriffen
    © sistrix.de – Sichtbarkeit de/com-Domain 2010-03-08
  • Handlen von externem DC
    • Mit externem DC ist vergleichsweise schnell und „einfach“ zu umzugehen
    • Bei Content-Kooperationen
      • Vertragsgestaltung
      • Kommunikation
      • Testen, Überprüfen, Kontrollieren
    • Bei Fremdeinfluss
      • Offensive Ansprache
      • Abmahnung
    Pixelio, Black Men
  • Interner Duplicate Content Duplicate Content auf der eigenen Website
  • Round Up Interner DC
    • Viele gleiche Seiten vermindern die Ranking-Qualität
      • Kein oder schlechtes Ranking für neue Seiten: Unschöne Entlohnung für Arbeit und Inhalte
      • Evtl. gar keine Indexierung durch zu viele URLs (PR-Schranke!)
    • Interner DC (Google: „gibt es nicht“)
      • Schlechtes Target
      • Vermindertes Ranking
      • Gar kein Ranking
    Pixelio, Rainer Sturm
  • Das Google-Problem
    • Google sagt zu internem DC
      • „ können wir erkennen“
      • „ fügen wir zusammen“
      • „ entscheiden wir eigenständig“
      •  Sehr fragiles Ranking-Gerüst
    • Das Problem bei diesen Aussagen
      • Google entscheidet eigenständig, welche Seite die richtige ist
      • Seiten werden u.U. zusammen-gefasst, aber gilt das auch für Power?
      • Im Zweifel rankt gar keine Seite
    Pixelio, Knipsermann
  • Google entscheidet selbst?
    • Google erklärt, dass es in der Lage ist, internen Duplicate Content zu erkennen.
    • Internen DC von Google erkennen zu lassen mag in Ordnung sein. Google sollte allerdings nicht die Entscheidung treffen, welche Seite die richtige ist.
    Im Zweifel ist Google fehlbar.
  • Problem (1): Dimensionen
    • Interne Dimensionen können mehrere Ausprägungen haben
      • Parametrisierbare Detailseiten
        • Shops, Druckausgaben etc.
      • Lokaler Content
        • Städte, Straßen etc.
      • Unkontrollierte Kategorien-Archive
        • Tags, Kategorien, Datum, Autoren
    Pixelio, knipser5
  • Beispiel (1): Dimensionen
    • Viele ähnliche Seiten fasst Google als „omitted results“ zusammen
    DC-Test meinestadt, 2010-03-20
  • Aber Obacht!
    • Nicht immer müssen omitted Results zu Beginn einer Indexierung schlecht sein.
    • Wenn der Indexierungsgrad (Anzahl der neu indexierten Seiten) bei <20% liegt, kann keine sichere Aussage getroffen werden, ob die Seiten als DC erkannt werden oder nicht.
    Google ein wenig Zeit lassen!
  • Problem (2): Strukturdefizite
    • Strukturelle Probleme können durch mangelhafte Vorbereitung, wachsende Strukturen oder Systeme entstehen
      • Fehlende Kanonisierung
        • https, www, Load-Balancing
      • Sortierungen & Paginierungen
        • Folgeseiten, Sortierungen aller Art
      • Suchen
        • Durchindexierung, Strukturmangel
      • Unkontrollierte Kategorien-Archive
        • Tags, Kategorien, Datum, Autoren
    Pixelio, knipser5
  • Beispiel (2): Strukturdefizite
    • Systematisch verursachte Defizite wie nicht kanonisches LoadBalancing erzeugen DC
    Https-Indexierung, 2010-03-20
  • Problem (3): Parameter & IDs
    • Intern genutzte Parameter können unkontrolliert zum Problem werden
      • Tracking-IDs
        • Durchschleifen von Parametern
      • Affiliate-IDs
        • Unkontrollierte Indexierung
      • Session IDs
        • Jeder Crawlvorgang erzeugt DC
      • Sonstiges Exploits
        • Unkontrollierte, offene Parameter
    Pixelio, knipser5
  • Beispiel (3): Parameter & IDs
    • Adwords-, Tracking-, Affiliate- oder sonstige Parameter sind Duplikate der Originalseite
    Analytics-Parameter, 2010-03-20
  • Na und?
    • Meine Seite taucht trotzdem im Index auf, warum sollte ich mir jetzt soviel Mühe machen?
    • Selbst wenn sich keine Ranking-Probleme innerhalb der indexierten Seiten ergeben, so existiert eine Schranke, wie viele URLs Google pro Domain in den Index aufnimmt (je nach PR).
    Crawling & Ranking bleiben aus
  • Vorbeugen & Verhindern Bestehenden Duplicate Content erkennen und ausschalten
  • Tools und Methoden (1)
    • 301 Redirect
      • Nur möglich wenn Content ungebraucht
    • Noindex
      • Mittel der Wahl für viele Symptome
    • Robots.txt
      • Nicht verwendbar für Weiterleitung von Power
    • Ajax/Javascript
      • Content-Chunks verbergen
    Pixelio, dido-ob
  • Tools und Methoden (2)
    • Rel Canonical
      • Mächtige Methode mit Einschränkungen und Risiko bei unvorsichtigem Einsatz
    • Webmastertools
      • Parameter-Ausschluss eher für Session-IDs. Vorsicht vor DC-Falle!
    • Mod Rewrite
      • Löst einige systembedingte URL-Probleme wie Caps-Sensitivität o.ä.
    • Parameter White-/Blacklists
      • Evtl. hoher Wartungsaufwand und Last
    Pixelio, dido-ob
  • Duplicate Content Matrix
    • Welche Methoden taugen für welche Fälle?
  • Content als DC-Killer
    • Unique Content
      • User Generated Content
      • Redaktionelle Aufbereitung
    • Aggregierung von (Fremd-)Content
      • Externe APIs, Partner-Koops
      • Medien (Videos, Fotos)
      • Interne Feeds syndizieren
      •  Achtung: Auch Chunks sind DC!
    • Wichtig: Unterstützung durch
      • Geschäftsmodell
      • Unternehmenskultur!
    Pixelio, oberpatscher
  • Top DC-Killer-Methode
    • Das zweitbeste Mittel, mit Duplicate Content umzugehen
    • Linkpower und Trust heben die besten Seiten in den Index (und jagen der Originalquelle u.U. die Ownership ab).
    • Interne Verlinkung kann eine ebenso hohe Rolle wie externe Verlinkung spielen (Keyword-Injektion)
    „ Du brauchst mehr Links!“ © fridaynight (ebook) mondspeer
  • 1A DC-Mittel
    • Das beste Mittel, Duplicate Content zu verhindern ist Kommunikation und Vorbereitung
    • Überdenken und konzipieren Sie Strukturen von vornherein möglichst verlust- und DC-frei.
    Gar nicht erst entstehen lassen! mondspeer
  • Empfehlungen Mit Duplicate Content im Tagesgeschäft umgehen
  • Empfehlungen (operativ)
    • Reaktiv: Operative Checkliste fürs Tagesgeschäft erstellen
      • Regelmäßig interne Daten erheben
      •  Interne Keyword-Cluster
      •  URL-Validität
      •  Eingehende Links
      •  Indexierungsdaten
      • Regelmäßig Exploits prüfen
      •  404-Logs
      •  Indexdupes, Parameter-Exploits
    Pixelio, gaston
  • Empfehlungen (strategisch)
    • Proaktiv: Nachhaltige Strukturen & Kommunikation
      • Vermeiden von URL-Änderungen
      •  Vermeidet Redirects
      • Durchgängige Tracking-Lösung
      •  Vermeidet 302 Tracking
      •  Vermeidet extens. Parameter-Einsatz
      • Konzept für Paginierung & Sortierung
      •  Vermeidet extens. Parameter-Einsatz
    Pixelio, gaston
  • Vielen Dank. @nof8 www.whiteside-seo.de/duplicate-content /
  • Exkurs: Google-Abfragen
    • site:domain.de
      • liefert alle Seiten der Domain
      •  site:google.com
    • inurl:sessionid
      • liefert den jew. URL-Bestandteil
      •  site:google.com inurl:session
    • intitle:“domainname“
      • liefert die Suche nach einem Title zurück
      •  site:google.com intitle:google
    exkurs