Jens Fauldraths Vortrag vom SEO-Day 2020 zu Google Discover, der Annotation des Leistungsreports aus der Google Search Console mit Entitäten und der Analyse des Discover-Traffics zur Steigerung des Discover-Traffics.
9. 9
▪ Anwendung in der mobilen Google App
▪ Feed zeigt aktuelle News und Beiträge
▪ Keine aktive Suche des Nutzers erforderlich
▪ Individuell anpassbar an die eigenen
Interessen
▪ Ziele von Discover
▪ Dem Nutzer relevante Informationen bieten,
bevor er danach sucht
▪ Weiterentwicklung des Google Feed mit Fokus
auf den Nutzerinteressen → auch ältere Inhalte
können angezeigt werden, wenn sie relevant sind
Und was ist dieses Discover nun?
10. 10
Woher kommt Discover denn so plötzlich?
Google Now
Aktuelle für DICH
relevante
Informationen
(z.B. Wetter,
Nachrichten, etc.)
Google Feed
Für DICH relevante
Informationen &
individuelle
Anpassung der
Schlagzeilen
Google
Feed
Google Discover
Für DICH relevante
Informationen &
individuelle Anpassung
der Schlagzeilen &
schnelles Entdecken der
Themen per Discover-
Button
11. Die Drei Säulen des Google Traffics für Verlage
In der Standard-Suche, die
Nutzer unabhängig einer
Nachrichten-Lage ausführen,
sind Evergreen-Themen
wichtig.
Gut ausgebaute Evergreen-
Themen liefern oft den Basis-
Traffic aus Google, der selten
Schwankungen unterliegt.
Wichtiger: News-Boxen in der
Standard-Suche an Top-
Positionen
Erscheinen, wenn eine Lage
vorliegt (Viele Meldungen & viele
Suchanfragen).
Aktualität sowie Autorität sind
Treiber des Erfolgs
Discover News Organische Suche
Google pusht Storys in den
eigenen News-Feed auf
Android-Devices nach Vorlieben
der Nutzer.
Vorlieben und Themen werden
anhand von Entitäten
zusammengeführt.
Publisher haben Autoritäten
für bestimmte Entitäten
(Themen)
12. Die Drei Säulen des Google Traffics für Verlage
In der Standard-Suche, die
Nutzer unabhängig einer
Nachrichten-Lage ausführen,
sind Evergreen-Themen
wichtig.
Gut ausgebaute Evergreen-
Themen liefern oft den Basis-
Traffic aus Google, der selten
Schwankungen unterliegt.
Wichtiger: News-Boxen in der
Standard-Suche an Top-
Positionen
Erscheinen, wenn eine Lage
vorliegt (Viele Meldungen & viele
Suchanfragen).
Aktualität sowie Autorität sind
Treiber des Erfolgs
Discover News Organische Suche
Google pusht Storys in den
eigenen News-Feed auf
Android-Devices nach Vorlieben
der Nutzer.
Vorlieben und Themen werden
anhand von Entitäten
zusammengeführt.
Publisher haben Autoritäten
für bestimmte Entitäten
(Themen)
14. Das klingt ja ganz interessant.
Aber woher kriege ich die
Daten?
Discover also …
15. 15
Google, gib uns Discover-Daten! Und Google so …
▪ Also gibt es jetzt zwar einen Discover Report
in der GSC
▪ Aber eben nur auf URL-Basis
16. 16
Dann probieren wir Google Analytics!
▪Aber dort gibt es kein
Discover!
▪Discover ist für
Google Analytics
Organic Search!
17. 17
▪ Discover-Traffic lässt sich z.B. mit Google
Analytics erkennen
▪ Hintergrund: Analytics aggregiert referrer-
Traffic von Google als google/organic
▪ Problem: was davon ist aus der Google Suche
und was aus Discover?
▪ Ansatz: Discover Tracking implementieren
▪ Vorgehen:
▪ Filter erstellen, der die Quelle überschreibt
▪ Mit einer Regex den Google-Referrer in mehrere
Gruppen aufteilen (z.B. nach Protokoll,
Hostname, usw.)
▪ Vollständige Liste der Referrer + Anleitung:
https://valentin.app/discover-tracking.html
Dann probieren wir Google Anlytics….
aber wie erkenne ich dann Discover Traffic?!
24. 24
Ja, wenn man sie selber baut:
Discover Datenpipeline
GSC
NLP-API
Anreicherung
(n-grams, Artikel ID, Adjektive, Verben)
…
Quellen Datawarehouse Dashboard
BigQuery
25. 25
Discover Datenpipeline
GSC Datenanreicherung
Datenhaltung &
Dashboard
URLs in Slugs zerlegen
Slugs an Google NLP-API
schicken
slug name type salience
wahlkampf-in-oklahoma-trump-nimmt-kundgebungen-trotz-covid-wieder-auf-und-droht-demonstranten wahlkampf EVENT 0,312
trump-us-regierung-klagt-gegen-veroeffentlichung-von-bolton-buch regierung ORGANIZATION 0,261
kate-middleton-prinz-william-royals-coronavirus-covid-19-grossbritannien-news-queen kate middleton PERSON 0,238
michael-wendler-irrer-plan-wird-er-der-neue-dsds-juror-rtl-xavier-naidoo michael wendler PERSON 0,188
coronavirus-in-usa-anthony-fauci-ist-trumps-berater-in-der-krise berater PERSON 0,177
API-Output:
URLs exportieren
+ weitere
Datenanreicherung
26. 26
1. Datenaggregation mit GSC
▪ Discover-Daten auf URL-Basis exportieren
2. Entitätenerkennung als erste Anreicherung
▪ URLs auf Slugs reduzieren
▪ URL-Slugs an die NLP-API senden
3. Weitere Datenanreicherung
▪ Zerlegung der URLs in n-grams
▪ Identifizierung von Artikel IDs, Adjektiven,
Verben
4. Datenbasis schaffen
▪ GSC-Daten, Entitätenerkennung, zusätzliche
Datenanreicherung zusammenführen
Quellen: GSC Daten nutzen und anreichern!
Discover-Datengrundlage
Zusätzliche
Daten-
anreicherung
Entitäten-
erkennung
mit Google
NLP API
Daten-
aggregation
mit GSC
27. 27
10+ Portale aus den IVW Top 100
720,5 Mio. Klicks seit Jahresbeginn 2020
7,1 Mrd. Impressionen seit Jahresbeginn 2020
16,7 Mio. Klicks pro Woche
164 Mio. Impressionen pro Woche
*Stand bis 25.10.2020
Unsere Datengrundlage
29. 29
Singular und Plural normalisieren ist nicht die
Stärke von Google!
Alternative Entitäten für das Selbe ist nicht der
Sinn von Entitäten!
Output aus der NLP-API: Nur eine Maschine!
30. 30
Beispiel:
Michael Wendler: Schockierende Beichte – Ex
Claudia Norberg muss nun tatsächlich ...
▪ Erkannte Entitäten:
▪ „bilder“
▪ „michael wendler claudia norberg ex frau
dschungelcamp laura mueller playboy“
Output aus der NLP-API: Nur eine Maschine!
31. 31
Beispiel eines Reichweitenportals:
Michael Wendler: Schockierende Beichte – Ex
Claudia Norberg muss nun tatsächlich ...
▪ Erkannte Entitäten:
▪ „bilder“
▪ „michael wendler claudia norberg ex frau
dschungelcamp laura mueller playboy“
Output aus der NLP-API: Nur eine Maschine!
33. 33
Ist der URL-Slug die beste Ausgangsbasis?
Vielleicht wird‘s mit Description oder Volltext
ja besser!
Das muss doch auch besser gehen!
34. 34
Michael Wendler: Schockierende Beichte – Ex
Claudia Norberg muss nun tatsächlich ...
▪ Erkannte Entitäten:
▪ „gestaendnis“
▪ „dschungelcamperin“
▪ „ex“
▪ „claudia norberg“
▪ „michael wendler“
▪ „zwei millionen“
→ es sind schonmal bessere Entitäten. Aber so
wirklich sinnvoll sind sie auch nicht …
Output aus der NLP-API - Description
35. 35
Michael Wendler: Schockierende Beichte – Ex
Claudia Norberg muss nun tatsächlich ...
▪ Erkannte Entitäten (die wichtigsten 10):
▪ „ex“
▪ „nachricht“
▪ „michael wendler“
▪ „claudia norberg“
▪ „dschungelcamperin“
▪ „gestaendnis“
▪ „foto“
▪ „beichte“
▪ „kamera“
▪ „paar“
→ Viel mehr Entitäten, aber auch nicht so richtig
sinnvoll
Output aus der NLP-API – Volltext (main content)
36. Wie gut ist die
Entitätenerkennung?
Welche Methodik eignet sich
am besten?
URL vs.
Description vs.
Volltext
37. 37
Kann ich die Entitätenerkennung verbessern?
Die Ausgangsmethodik war:
▪ URL-Slugs an die NLP-API
Auch getestet wurde:
▪ Description an die NLP-API
▪ Volltext (main content) an die NLP-API
Mit allen 3 Methoden können gute Ergebnisse in
der Entitätenerkennung erreicht werden.
Und was ist die beste Methode?
Abhängig von Ziel & Datenbasis!
Description
NLP-API
VolltextSlug
38. 38
Ziel: möglichst korrekte Entitäten
Was schicke ich wann zur NLP-API?
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Volltext Description Slug
Korrektheit der Entitätenerkennung
39. 39
Was schicke ich wann zur NLP-API?
0%
10%
20%
30%
40%
50%
60%
70%
Description Slug Volltext
Nützlichkeit der Entitätenerkennung
Ziel: möglichst nützliche Entitäten
40. 40
Welche Datenbasis habe ich?
1. Reichweitenportale
▪ Höchste Korrektheit & höchste Nützlichkeit mit
der Description-Methode
2. Qualitätsjournalismus
▪ Höchste Korrektheit mit der Volltext-Methode
▪ Höchste Nützlichkeit mit der Slug-Methode
▪ Description-Methode liefert gute Korrektheit &
Nützlichkeit
3. Mix aus beidem
▪ Höchste Korrektheit mit Volltext-Methode
▪ Höchste Nützlichkeit mit Description- & Slug-
Methode
▪ Vorteil Description-Methode: 26% höhere
Korrektheit bei gleicher Nützlichkeit
▪ Vorteil Slug-Methode: schont Ressourcen bei
sehr hoher Nützlichkeit
Was schicke ich wann zur NLP-API?
41. Unsere Gesamt-Auswertung zeigt …
Descriptions erzielen das beste Gesamt-Ergebnis aus Korrektheit & Nützlichkeit
Volltexte erzielen die korrekteste Entitätenerkennung
Slugs erzielen höchste Nützlichkeit & die Methode ist am ressourcenschonendsten
ABER: Methodik immer auf Ziele & Datenbasis abstimmen!
43. 43
Top 20 Entitäten in 2020 bis KW34 - unbereinigt:
Nicht jede Entität ist ein Interesse!
48. 48
Verben können die CTR auch beeinflussen
▪ Klicktreibend:
▪ platzen (CTR: 15,86 %)
▪ sterben (CTR: 14,10 %)
▪ kennen (CTR: 14,07 %)
▪ u.a.
▪ Klickhemmend:
▪ bestellen (5,64 %)
▪ kochen (7,95 %)
▪ steuern (8,60 %)
▪ u.a.
Ø CTR
Reichweiten-
portale
11,16 %
Ø CTR
Qualitäts-
journalismus
7,28 %
Ø CTR
Gesamt
10,66 %
▪ Hohe Schwankungsbreite
▪ Keine Empfehlung
▪ Verben stehen für Arten von Storys
▪ Als Filter nutzen und lernen
49. 49
„platzen“ unter den Top 10 Verben (nach Klicks)?!
Plötzlicher Traffic-Anstieg des Verbs „platzen“
50. 50
85 % der Klicks fallen zurück auf Daniela
Katzenberger
Ja was sind sie denn jetzt? Schwanger?
„platzen“ unter den Top 10 Verben (nach Klicks)?!
„[…] Das sympathische Paar kommt dann mit
einer neuen Staffel der Doku-Soap ins
Fernsehen.“
Ernsthaft? Das war‘s jetzt?!
52. 52
▪ Ursprünglich für Google News
▪ Spammy: Bestehende Artikel „Updaten“, weil
News-Box / Discover Ranking verloren
▪ Titel & URL ändern, Publikationsdatum
hochsetzen!
▪ Korrekt: Bestehenden Artikel erweitern, da
neue Informationen vorliegen
▪ Titel ( & URL) ändern, Updatedatum hochsetzen,
Inhalt erweitern.
▪ Sonderformat: Newsticker
▪ Bericht zu einer Lage in chronologischer
Ordnung vom neuesten zum ältesten Beitrag
→ Mischformen möglich
Republishing – Verlängerung der Haltezeit von Storys
53. 53
Republishing – Wie lange bleiben Artikel in Discover?
Qualitätsportale Reichweitenportale
▪ Republishing scheint die Haltedauer von Artikeln in Discover zu verlängern
54. 54
Republishing – Wie oft sollte man Republishen?
Qualitätsportale Reichweitenportale
▪ Effizienz sinkt, mehr als 10 Republishing-Vorgänge erscheinen ineffizient
55. 55
472 mal republished?!
Starker Abfall der Klicks pro URL konstanter Anzahl an URLs
Discover-Platzierungen haben alternative Artikel-IDs
übernommen!
57. 57
Mit Republishing…
… kann man Artikel nachträglich pushen
… kann der Artikel über einen längeren Zeitraum
besser performen
… sollte aber nur wenige Tage betrieben werden
Erkenntnisse aus unserer Datenbasis:
▪ Artikel wurden Ø 3x republished
▪ Reichweitenportale Ø 4x
▪ Qualitätsjournalismus Ø 2x
Liveticker performen kaum dauerhaft und sind
oft zu allgemein.
Republishing kann sinnvoll sein
58. 58
▪ Artikel ca. 1 Minute bis 8 Stunden alt
▪ Oft nur 1-2 Stunden in News-Boxen,
Republishing mehrmals am Tag
▪ Realtime-Traffic-Daten und schnelle
Auswertung der Platzierung in News-Boxen
notwendig
Republishing Google News vs. Discover.
▪ Artikel ca. 4 - 48 Stunden alt
▪ Republishing am Folgetag, wenn Artikel gut
gelaufen ist
▪ Tägliche Auswertung des Discover-Traffics
notwendig
59. Prozess für das Republishing & Testing entwickeln!
Anpassungen
der Metadaten
Bewertung
der Erfolge
Erweiterung
der Inhalte
Identifikation
von Themen
• Recherche und Identifikation
geeigneter Republishing-
Themen
• Anpassung von Title und
Description & Datum
• Änderung von Headlines
• Inhalte dürfen erweitert werden
• Freigabe durch Autor/ CVD muss
innerhalb kurzer Zeit erfolgen
• Bereitstellung einfacherer
Dashboards & Tools zur
Bewertung der Erfolge*
* Valentin-Discover Filter in der Webanalyse implementieren & Top Stories des Vortrags prüfen
61. Und warum nicht etwas Produktwerbung?
… vor allem Prospektinhalte laufen oft gut*
*Handelskette + Produktgattung + Produkt / Hersteller sind jeweils eigene Entitäten, die teilweise
andere Menschen ansprechen!
62. Die Drei Säulen des Google Traffics für Verlage
… und ich brauche für jede eine eigene Strategie!
In der Standard-Suche, die
Nutzer unabhängig einer
Nachrichten-Lage ausführen,
sind Evergreen-Themen
wichtig.
Gut ausgebaute Evergreen-
Themen liefern oft den Basis-
Traffic aus Google, der selten
Schwankungen unterliegt.
Wichtiger: News-Boxen in der
Standard-Suche an Top-
Positionen
Erscheinen, wenn eine Lage
vorliegt (Viele Meldungen & viele
Suchanfragen).
Aktualität sowie Autorität sind
Treiber des Erfolgs
Discover News Organische Suche
Google pusht Storys in den
eigenen News-Feed auf
Android-Devices nach Vorlieben
der Nutzer.
Vorlieben und Themen werden
anhand von Entitäten
zusammengeführt.
Publisher haben Autoritäten
für bestimmte Entitäten
(Themen)
64. Unsere Discover Learnings
Die wichtigste Erkenntnis:
Discover-Daten sind für uns kein Mythos mehr → einfach GSC Daten anreichern & los geht‘s!
Weitere wertvolle Erkenntnisse:
Korrekte Entitätenerkennung bedeutet nicht immer nützliche Entitätenerkennung.
Die richtige Vorgehensweise zur Entitätenerkennung ist abhängig von Ziel & Datenbasis.
Adjektive & Verben können stark klicktreibend wirken → wenn die Voraussetzungen stimmen.
Republishing für Discover sinnvoll, aber selten länger als 7 Tage.
65. Wie steigern Sie Ihren Discover-Traffic
Themen die für Ihr Blatt funktionieren unbedingt stärken (also immer
darüber berichten).
Formulierungen die die CTR steigern identifizieren und konsequent
verwenden. Google untersagt Klick-Bait, aber er funktioniert!
Bildsprache ebenso hinsichtlich Wirkung auf CTR testen!
Messen und lernen!
66. Noch nicht genug? Dann
Termfrequenz-Podcasts:
Online Marketing für die Ohren!
www.termfrequenz.de