SlideShare a Scribd company logo
1 of 16
Download to read offline
Von Protocol Buffer und anderen Dingen
Reverse Engineering Google SERPs
Wer ich bin
2 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Valentin Pletzer
Head of SEO @ BurdaForward
https://twitter.com/VorticonCmdr
https://www.xing.com/profile/Valentin_Pletzer
https://plus.google.com/+ValentinPletzer
valentin.pletzer@burda-forward.de
http://www.chip.de/
http://www.focus.de/
https://www.bestcheck.de
http://www.netmoms.de/
https://www.finanzen100.de/
http://www.huffingtonpost.de/
https://weather.com/de-DE
Browser-spezifisches HTML
3 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Beispiel Chrome <-> Firefox
User-spezifisches HTML
4 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Beispiel aus der Praxis: A/B-Test für „speedtest“
App Engine https://cloud.google.com/appengine/docs/standard/#trafficsplitting
Google A/B-Test reproduzieren
5 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
EditThis Cookie
• Eigentlich recht einfach: NID
• Das NID-Cookie enthält eine eindeutige ID,
über die Google Ihre bevorzugten
Einstellungen und andere Informationen
speichert, insbesondere Ihre bevorzugte
Sprache (z. B. Deutsch), wie viele
Suchergebnisse pro Seite angezeigt werden
sollen (z. B. 10 oder 20) und ob der Google
SafeSearch-Filter aktiviert sein soll.
• EditThisCookie-Extension “Für Incognito
Modus zulassen“
• Cookie laden und speichern
• Idee: Plugin mit Datenbank für NID-Cookies
Quelle: https://www.google.com/policies/technologies/types/
Location Header & Cookie
6 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
wo bin ich?
• UULE-Cookie
• x-geo-Header
• Base64-codierte Location-Daten
role: CURRENT_LOCATION
producer: DEVICE_LOCATION
radius: 65000
latlng <
latitude_e7: 374248743
longitude_e7: -1220943074
>
• 374248743 / 1e7 = 37.4248743 (lat)
• -1220943074 / 1e7 = -122.0943074 (lng)
x-geo: a
cm9sZTogQ1VSUkVOVF9MT0NBVElPTgpwcm9kdWNlcjogREVWSUNFX0xPQ
0FUSU9OCnJhZGl1czogNjUwMDAKbGF0bG5nIDwKICBsYXRpdHVkZV9lNzog
Mzc0MjQ4NzQzCiAgbG9uZ2l0dWRlX2U3OiAtMTIyMDk0MzA3NAo+
Chrome Erweiterung
7 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
gs location changer
https://chrome.google.com/webstore/detail/gs-location-changer/blpgcfdpnimjdojecbpagkllfnkajglp
Data-Attribute ved
8 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Tracking-Daten im HTML
ved deep dive
9 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Kleine Geheimnisse im Quellcode (base64)
<div data-ved="0ahUKEwiMsveD6sHZAhWEL1AKHZ47BtwQGggr"> ???
• data-* attributes allow us to store extra information on standard, semantic HTML elements without
other hacks such as non-standard attributes, extra properties on DOM, or Node.setUserData().
• Mal wieder Base64-Encoding, aber: Das erste Zeichen muss weg (die 0)
• Base64
• Zur Kodierung werden jeweils drei Byte des Bytestroms (= 24 Bit) in vier 6-Bit-Blöcke aufgeteilt.
• Falls die Gesamtanzahl der Eingabebytes nicht durch drei teilbar ist, wird der zu kodierende Text am Ende mit
aus Nullbits bestehenden Füllbytes aufgefüllt, sodass sich eine durch drei teilbare Anzahl an Bytes ergibt.
atob('ahUKEwiMsveD6sHZAhWEL1AKHZ47BtwQGggr‘)
==
ved deep dive
10 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Kleine Geheimnisse im Quellcode (protocol buffer)
• ab Mitte 2012 als nützlicher Teil des Google Referrers erkannt
• damals aber nicht wirklich „verstanden“
• August 2013 dann von Benjamin Schulz korrekt als Protocol
Buffer identifiziert
Links:
• https://moz.com/blog/decoding-googles-referral-string-or-how-i-survived-secure-search
• http://gqs-decoder.appspot.com/
• https://github.com/google/protobuf/releases
ved deep dive
11 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Procol Buffer richtig dekodieren – so geht‘s
ved deep dive
12 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Durchnummeriert – 10 blue links and more
0
1
3
0 1 2
4
13
14 15 16
17 18 19
23 23 23 23 23
24
25
25
ved Zusammenfassung
13 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Nicht perfekt aber schon recht hilfreich
• Nützlich vor allem um Ergebnis-Typen zu identifizieren
• Problematisch um Ergebnis-Position auszulesen (Featured-Snippet-Problematik)
• hveid als unbekannte Variable
Google Server
14 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
Gib mir „alle“ IP-Adressen
$ host www.google.de
www.google.de has address 172.217.19.67
www.google.de has IPv6 address 2a00:1450:4005:80b::2003
$ whois -h whois.radb.net 172.217.19.67
route: 172.217.19.0/24
descr: Google
origin: AS15169
notify: radb-contact@google.com
mnt-by: MAINT-AS15169
changed: radb-contact@google.com 20150728
source: RADB
$ whois -h whois.radb.net '!gAS15169'
A111637
66.249.64.0/20 66.249.80.0/20 74.125.57.240/29 216.239.44.0/24 216.239.45.0/24 23.251.128.0/23
23.251.128.0/24 23.251.129.0/24 23.251.130.0/23 23.251.130.0/24 23.251.131.0/24 23.251.132.0/23
23.251.132.0/24.....
=> grob 14.500 IPs mit Google Search (58 x 250)
Sind alle Google SERPs gleich
15 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH
58 IPs = 39 + 8 + 5 + 2 + 2 + 1 + 1 unterschiedliche SERPs
Setup:
• 58 IPs
• selbe Location (Berlin)
• etwa gleicher Zeitpunkt (innerhalb von 3 Minuten)
Fragen?
Danke

More Related Content

What's hot

SEOday Köln 2020 - Surprise, Surprise - 5 SEO secrets
SEOday Köln 2020 - Surprise, Surprise - 5 SEO secretsSEOday Köln 2020 - Surprise, Surprise - 5 SEO secrets
SEOday Köln 2020 - Surprise, Surprise - 5 SEO secretsBastian Grimm
 
Enhanced SEO with Machine Learning
Enhanced SEO with Machine LearningEnhanced SEO with Machine Learning
Enhanced SEO with Machine LearningMichael Weber
 
Migration Best-Practices: So gelingt der erfolgreiche Relaunch - SEOkomm 2017
Migration Best-Practices: So gelingt der erfolgreiche Relaunch - SEOkomm 2017Migration Best-Practices: So gelingt der erfolgreiche Relaunch - SEOkomm 2017
Migration Best-Practices: So gelingt der erfolgreiche Relaunch - SEOkomm 2017Bastian Grimm
 
In den richtigen Ländern ranken | Kerstin Reichert | SEOkomm 2016
 In den richtigen Ländern ranken | Kerstin Reichert | SEOkomm 2016 In den richtigen Ländern ranken | Kerstin Reichert | SEOkomm 2016
In den richtigen Ländern ranken | Kerstin Reichert | SEOkomm 2016Kerstin Reichert
 
hreflang SMX München 2016 Eoghan Henn
hreflang SMX München 2016 Eoghan Hennhreflang SMX München 2016 Eoghan Henn
hreflang SMX München 2016 Eoghan HennEoghan Henn
 
Welcome to a New Reality - SEO goes Mobile First in 2017
Welcome to a New Reality - SEO goes Mobile First in 2017Welcome to a New Reality - SEO goes Mobile First in 2017
Welcome to a New Reality - SEO goes Mobile First in 2017Bastian Grimm
 
Relaunch & SEO: Best Practice, Checklists, Stolpersteine
Relaunch & SEO: Best Practice, Checklists, StolpersteineRelaunch & SEO: Best Practice, Checklists, Stolpersteine
Relaunch & SEO: Best Practice, Checklists, StolpersteinePhilipp Klöckner
 
Mehr Pagespeed geht nicht - SEOkomm 2015
Mehr Pagespeed geht nicht - SEOkomm 2015Mehr Pagespeed geht nicht - SEOkomm 2015
Mehr Pagespeed geht nicht - SEOkomm 2015Bastian Grimm
 
Informationsarchitektur & Verlinkung - SMX München 2014
Informationsarchitektur & Verlinkung - SMX München 2014Informationsarchitektur & Verlinkung - SMX München 2014
Informationsarchitektur & Verlinkung - SMX München 2014Bastian Grimm
 
Site Speed EXTREME - SEOkomm 2014
Site Speed EXTREME - SEOkomm 2014Site Speed EXTREME - SEOkomm 2014
Site Speed EXTREME - SEOkomm 2014Bastian Grimm
 
Google Tag Manager, SEOkomm 2016
Google Tag Manager, SEOkomm 2016Google Tag Manager, SEOkomm 2016
Google Tag Manager, SEOkomm 2016Stefan David
 
SEO Campixx 2016 - Frühjahrsputz für die Website (SEO Geisterjagd)
SEO Campixx 2016 - Frühjahrsputz für die Website (SEO Geisterjagd)SEO Campixx 2016 - Frühjahrsputz für die Website (SEO Geisterjagd)
SEO Campixx 2016 - Frühjahrsputz für die Website (SEO Geisterjagd)Mario Schwertfeger
 
Welcome to a New Reality - SEO goes Mobile First in 2017
Welcome to a New Reality - SEO goes Mobile First in 2017Welcome to a New Reality - SEO goes Mobile First in 2017
Welcome to a New Reality - SEO goes Mobile First in 2017Bastian Grimm
 
Logfile-Analyse: Wo ver(sch)wendet Google Crawling-Ressourcen? | Stephan Czys...
Logfile-Analyse: Wo ver(sch)wendet Google Crawling-Ressourcen? | Stephan Czys...Logfile-Analyse: Wo ver(sch)wendet Google Crawling-Ressourcen? | Stephan Czys...
Logfile-Analyse: Wo ver(sch)wendet Google Crawling-Ressourcen? | Stephan Czys...TA Trust Agents Internet GmbH
 
WordPress SEO | Campixx 2016 | Hans Jung
WordPress SEO | Campixx 2016 | Hans JungWordPress SEO | Campixx 2016 | Hans Jung
WordPress SEO | Campixx 2016 | Hans JungHans Jung
 
Keyword Strategie: Do's & Don'ts bei der Keyword Recherche - SMX München 2017
Keyword Strategie: Do's & Don'ts bei der Keyword Recherche - SMX München 2017Keyword Strategie: Do's & Don'ts bei der Keyword Recherche - SMX München 2017
Keyword Strategie: Do's & Don'ts bei der Keyword Recherche - SMX München 2017Bastian Grimm
 
Linkrisiko Management - SEOkomm 2013
Linkrisiko Management - SEOkomm 2013Linkrisiko Management - SEOkomm 2013
Linkrisiko Management - SEOkomm 2013Bastian Grimm
 
Linkbuilding durch skalierbare Strategien und Prozesse
Linkbuilding durch skalierbare Strategien und ProzesseLinkbuilding durch skalierbare Strategien und Prozesse
Linkbuilding durch skalierbare Strategien und ProzesseDominique Seppelt
 
SEFD - Search Engine Friendly Design - SMX München 2015 Kai Spriestersbach
SEFD - Search Engine Friendly Design - SMX München 2015 Kai SpriestersbachSEFD - Search Engine Friendly Design - SMX München 2015 Kai Spriestersbach
SEFD - Search Engine Friendly Design - SMX München 2015 Kai SpriestersbachSEARCH ONE
 
Seokomm 2016 Vortrag - Räume deine Website auf
Seokomm 2016 Vortrag - Räume deine Website auf Seokomm 2016 Vortrag - Räume deine Website auf
Seokomm 2016 Vortrag - Räume deine Website auf Dominik Wojcik
 

What's hot (20)

SEOday Köln 2020 - Surprise, Surprise - 5 SEO secrets
SEOday Köln 2020 - Surprise, Surprise - 5 SEO secretsSEOday Köln 2020 - Surprise, Surprise - 5 SEO secrets
SEOday Köln 2020 - Surprise, Surprise - 5 SEO secrets
 
Enhanced SEO with Machine Learning
Enhanced SEO with Machine LearningEnhanced SEO with Machine Learning
Enhanced SEO with Machine Learning
 
Migration Best-Practices: So gelingt der erfolgreiche Relaunch - SEOkomm 2017
Migration Best-Practices: So gelingt der erfolgreiche Relaunch - SEOkomm 2017Migration Best-Practices: So gelingt der erfolgreiche Relaunch - SEOkomm 2017
Migration Best-Practices: So gelingt der erfolgreiche Relaunch - SEOkomm 2017
 
In den richtigen Ländern ranken | Kerstin Reichert | SEOkomm 2016
 In den richtigen Ländern ranken | Kerstin Reichert | SEOkomm 2016 In den richtigen Ländern ranken | Kerstin Reichert | SEOkomm 2016
In den richtigen Ländern ranken | Kerstin Reichert | SEOkomm 2016
 
hreflang SMX München 2016 Eoghan Henn
hreflang SMX München 2016 Eoghan Hennhreflang SMX München 2016 Eoghan Henn
hreflang SMX München 2016 Eoghan Henn
 
Welcome to a New Reality - SEO goes Mobile First in 2017
Welcome to a New Reality - SEO goes Mobile First in 2017Welcome to a New Reality - SEO goes Mobile First in 2017
Welcome to a New Reality - SEO goes Mobile First in 2017
 
Relaunch & SEO: Best Practice, Checklists, Stolpersteine
Relaunch & SEO: Best Practice, Checklists, StolpersteineRelaunch & SEO: Best Practice, Checklists, Stolpersteine
Relaunch & SEO: Best Practice, Checklists, Stolpersteine
 
Mehr Pagespeed geht nicht - SEOkomm 2015
Mehr Pagespeed geht nicht - SEOkomm 2015Mehr Pagespeed geht nicht - SEOkomm 2015
Mehr Pagespeed geht nicht - SEOkomm 2015
 
Informationsarchitektur & Verlinkung - SMX München 2014
Informationsarchitektur & Verlinkung - SMX München 2014Informationsarchitektur & Verlinkung - SMX München 2014
Informationsarchitektur & Verlinkung - SMX München 2014
 
Site Speed EXTREME - SEOkomm 2014
Site Speed EXTREME - SEOkomm 2014Site Speed EXTREME - SEOkomm 2014
Site Speed EXTREME - SEOkomm 2014
 
Google Tag Manager, SEOkomm 2016
Google Tag Manager, SEOkomm 2016Google Tag Manager, SEOkomm 2016
Google Tag Manager, SEOkomm 2016
 
SEO Campixx 2016 - Frühjahrsputz für die Website (SEO Geisterjagd)
SEO Campixx 2016 - Frühjahrsputz für die Website (SEO Geisterjagd)SEO Campixx 2016 - Frühjahrsputz für die Website (SEO Geisterjagd)
SEO Campixx 2016 - Frühjahrsputz für die Website (SEO Geisterjagd)
 
Welcome to a New Reality - SEO goes Mobile First in 2017
Welcome to a New Reality - SEO goes Mobile First in 2017Welcome to a New Reality - SEO goes Mobile First in 2017
Welcome to a New Reality - SEO goes Mobile First in 2017
 
Logfile-Analyse: Wo ver(sch)wendet Google Crawling-Ressourcen? | Stephan Czys...
Logfile-Analyse: Wo ver(sch)wendet Google Crawling-Ressourcen? | Stephan Czys...Logfile-Analyse: Wo ver(sch)wendet Google Crawling-Ressourcen? | Stephan Czys...
Logfile-Analyse: Wo ver(sch)wendet Google Crawling-Ressourcen? | Stephan Czys...
 
WordPress SEO | Campixx 2016 | Hans Jung
WordPress SEO | Campixx 2016 | Hans JungWordPress SEO | Campixx 2016 | Hans Jung
WordPress SEO | Campixx 2016 | Hans Jung
 
Keyword Strategie: Do's & Don'ts bei der Keyword Recherche - SMX München 2017
Keyword Strategie: Do's & Don'ts bei der Keyword Recherche - SMX München 2017Keyword Strategie: Do's & Don'ts bei der Keyword Recherche - SMX München 2017
Keyword Strategie: Do's & Don'ts bei der Keyword Recherche - SMX München 2017
 
Linkrisiko Management - SEOkomm 2013
Linkrisiko Management - SEOkomm 2013Linkrisiko Management - SEOkomm 2013
Linkrisiko Management - SEOkomm 2013
 
Linkbuilding durch skalierbare Strategien und Prozesse
Linkbuilding durch skalierbare Strategien und ProzesseLinkbuilding durch skalierbare Strategien und Prozesse
Linkbuilding durch skalierbare Strategien und Prozesse
 
SEFD - Search Engine Friendly Design - SMX München 2015 Kai Spriestersbach
SEFD - Search Engine Friendly Design - SMX München 2015 Kai SpriestersbachSEFD - Search Engine Friendly Design - SMX München 2015 Kai Spriestersbach
SEFD - Search Engine Friendly Design - SMX München 2015 Kai Spriestersbach
 
Seokomm 2016 Vortrag - Räume deine Website auf
Seokomm 2016 Vortrag - Räume deine Website auf Seokomm 2016 Vortrag - Räume deine Website auf
Seokomm 2016 Vortrag - Räume deine Website auf
 

Similar to Von Protocol Buffer und anderen Dingen

SMX München 2017: Bastian Grimm & Christian Paavo Spieker
SMX München 2017: Bastian Grimm & Christian Paavo Spieker SMX München 2017: Bastian Grimm & Christian Paavo Spieker
SMX München 2017: Bastian Grimm & Christian Paavo Spieker One Advertising AG
 
Meet Magento DE 2017 - E-Commerce mit Google – SEO für Onlineshops
Meet Magento DE 2017 - E-Commerce mit Google – SEO für OnlineshopsMeet Magento DE 2017 - E-Commerce mit Google – SEO für Onlineshops
Meet Magento DE 2017 - E-Commerce mit Google – SEO für OnlineshopsSEARCH ONE
 
E-Commerce im Großhandelsunternehmen - Von der Idee bis zur Umsetzung
E-Commerce im Großhandelsunternehmen - Von der Idee bis zur UmsetzungE-Commerce im Großhandelsunternehmen - Von der Idee bis zur Umsetzung
E-Commerce im Großhandelsunternehmen - Von der Idee bis zur UmsetzungHenrik Steffen
 
PHP-SEO Vortrag SEOCampixx 2013 von Sebastian Blum
PHP-SEO Vortrag SEOCampixx 2013 von Sebastian BlumPHP-SEO Vortrag SEOCampixx 2013 von Sebastian Blum
PHP-SEO Vortrag SEOCampixx 2013 von Sebastian BlumSebastian Blum
 
Webinar SAP/ABAP und Microsoft
Webinar  SAP/ABAP und MicrosoftWebinar  SAP/ABAP und Microsoft
Webinar SAP/ABAP und MicrosoftCadaxo GmbH
 
Reverse engineering google SERPs
Reverse engineering google SERPsReverse engineering google SERPs
Reverse engineering google SERPsValentin Pletzer
 
Crawl-Budget-Booster für eine bessere Search Engine Experience
Crawl-Budget-Booster für eine bessere Search Engine ExperienceCrawl-Budget-Booster für eine bessere Search Engine Experience
Crawl-Budget-Booster für eine bessere Search Engine ExperienceAndré Goldmann
 
Technisches SEO Campixx 2015 - Knut Barth und Matthias Plankl
Technisches SEO Campixx 2015 - Knut Barth und Matthias PlanklTechnisches SEO Campixx 2015 - Knut Barth und Matthias Plankl
Technisches SEO Campixx 2015 - Knut Barth und Matthias PlanklKnut Barth
 
SEO News Oktober 2022: Google Spam Update / Google Looker
SEO News Oktober 2022: Google Spam Update / Google LookerSEO News Oktober 2022: Google Spam Update / Google Looker
SEO News Oktober 2022: Google Spam Update / Google Lookerdiva-e
 
Google Analytics Einführung: 5 Tipps wie Du Google Analytics effektiv einsetz...
Google Analytics Einführung: 5 Tipps wie Du Google Analytics effektiv einsetz...Google Analytics Einführung: 5 Tipps wie Du Google Analytics effektiv einsetz...
Google Analytics Einführung: 5 Tipps wie Du Google Analytics effektiv einsetz...121WATT GmbH
 
Search Engine Strategies 2010 - Erfolgreiche Webseiten-Architektur
Search Engine Strategies 2010 - Erfolgreiche Webseiten-ArchitekturSearch Engine Strategies 2010 - Erfolgreiche Webseiten-Architektur
Search Engine Strategies 2010 - Erfolgreiche Webseiten-Architekturtrafficmaxx c/o construktiv GmbH
 
SEO Internationalisierung – aber richtig!
SEO Internationalisierung – aber richtig!SEO Internationalisierung – aber richtig!
SEO Internationalisierung – aber richtig!semrush_webinars
 
Do it yourself - Analyse Powertask ohne Entwickler
Do it yourself - Analyse Powertask ohne EntwicklerDo it yourself - Analyse Powertask ohne Entwickler
Do it yourself - Analyse Powertask ohne EntwicklerStephan F. Walcher
 
Blackhat Protection: Negative SEO verstehen & verhindern - SEOkomm 2012
Blackhat Protection: Negative SEO verstehen & verhindern - SEOkomm 2012Blackhat Protection: Negative SEO verstehen & verhindern - SEOkomm 2012
Blackhat Protection: Negative SEO verstehen & verhindern - SEOkomm 2012Bastian Grimm
 
Workshop Münchner Webwoche 2015: Local SEO
Workshop Münchner Webwoche 2015: Local SEOWorkshop Münchner Webwoche 2015: Local SEO
Workshop Münchner Webwoche 2015: Local SEOMario Schwertfeger
 
campixx 2018 - Tipps und Tools für KMU
campixx 2018 - Tipps und Tools für KMUcampixx 2018 - Tipps und Tools für KMU
campixx 2018 - Tipps und Tools für KMUHeiko Hoehn
 
Google Analytics Konferenz 2016: Datenqualität sichern (Bernadette Hohns & Ch...
Google Analytics Konferenz 2016: Datenqualität sichern (Bernadette Hohns & Ch...Google Analytics Konferenz 2016: Datenqualität sichern (Bernadette Hohns & Ch...
Google Analytics Konferenz 2016: Datenqualität sichern (Bernadette Hohns & Ch...e-dialog GmbH
 
Ads und Landing Pages mit CRO ideal verbinden
Ads und Landing Pages mit CRO ideal verbindenAds und Landing Pages mit CRO ideal verbinden
Ads und Landing Pages mit CRO ideal verbindenMarcel Prothmann
 

Similar to Von Protocol Buffer und anderen Dingen (20)

SMX München 2017: Bastian Grimm & Christian Paavo Spieker
SMX München 2017: Bastian Grimm & Christian Paavo Spieker SMX München 2017: Bastian Grimm & Christian Paavo Spieker
SMX München 2017: Bastian Grimm & Christian Paavo Spieker
 
Meet Magento DE 2017 - E-Commerce mit Google – SEO für Onlineshops
Meet Magento DE 2017 - E-Commerce mit Google – SEO für OnlineshopsMeet Magento DE 2017 - E-Commerce mit Google – SEO für Onlineshops
Meet Magento DE 2017 - E-Commerce mit Google – SEO für Onlineshops
 
E-Commerce im Großhandelsunternehmen - Von der Idee bis zur Umsetzung
E-Commerce im Großhandelsunternehmen - Von der Idee bis zur UmsetzungE-Commerce im Großhandelsunternehmen - Von der Idee bis zur Umsetzung
E-Commerce im Großhandelsunternehmen - Von der Idee bis zur Umsetzung
 
PHP-SEO Vortrag SEOCampixx 2013 von Sebastian Blum
PHP-SEO Vortrag SEOCampixx 2013 von Sebastian BlumPHP-SEO Vortrag SEOCampixx 2013 von Sebastian Blum
PHP-SEO Vortrag SEOCampixx 2013 von Sebastian Blum
 
Webinar SAP/ABAP und Microsoft
Webinar  SAP/ABAP und MicrosoftWebinar  SAP/ABAP und Microsoft
Webinar SAP/ABAP und Microsoft
 
Reverse engineering google SERPs
Reverse engineering google SERPsReverse engineering google SERPs
Reverse engineering google SERPs
 
Crawl-Budget-Booster für eine bessere Search Engine Experience
Crawl-Budget-Booster für eine bessere Search Engine ExperienceCrawl-Budget-Booster für eine bessere Search Engine Experience
Crawl-Budget-Booster für eine bessere Search Engine Experience
 
Technisches SEO Campixx 2015 - Knut Barth und Matthias Plankl
Technisches SEO Campixx 2015 - Knut Barth und Matthias PlanklTechnisches SEO Campixx 2015 - Knut Barth und Matthias Plankl
Technisches SEO Campixx 2015 - Knut Barth und Matthias Plankl
 
SEO News Oktober 2022: Google Spam Update / Google Looker
SEO News Oktober 2022: Google Spam Update / Google LookerSEO News Oktober 2022: Google Spam Update / Google Looker
SEO News Oktober 2022: Google Spam Update / Google Looker
 
Realtime SEO
Realtime SEORealtime SEO
Realtime SEO
 
Google Analytics Einführung: 5 Tipps wie Du Google Analytics effektiv einsetz...
Google Analytics Einführung: 5 Tipps wie Du Google Analytics effektiv einsetz...Google Analytics Einführung: 5 Tipps wie Du Google Analytics effektiv einsetz...
Google Analytics Einführung: 5 Tipps wie Du Google Analytics effektiv einsetz...
 
Search Engine Strategies 2010 - Erfolgreiche Webseiten-Architektur
Search Engine Strategies 2010 - Erfolgreiche Webseiten-ArchitekturSearch Engine Strategies 2010 - Erfolgreiche Webseiten-Architektur
Search Engine Strategies 2010 - Erfolgreiche Webseiten-Architektur
 
SEO Internationalisierung – aber richtig!
SEO Internationalisierung – aber richtig!SEO Internationalisierung – aber richtig!
SEO Internationalisierung – aber richtig!
 
Do it yourself - Analyse Powertask ohne Entwickler
Do it yourself - Analyse Powertask ohne EntwicklerDo it yourself - Analyse Powertask ohne Entwickler
Do it yourself - Analyse Powertask ohne Entwickler
 
Blackhat Protection: Negative SEO verstehen & verhindern - SEOkomm 2012
Blackhat Protection: Negative SEO verstehen & verhindern - SEOkomm 2012Blackhat Protection: Negative SEO verstehen & verhindern - SEOkomm 2012
Blackhat Protection: Negative SEO verstehen & verhindern - SEOkomm 2012
 
Workshop Münchner Webwoche 2015: Local SEO
Workshop Münchner Webwoche 2015: Local SEOWorkshop Münchner Webwoche 2015: Local SEO
Workshop Münchner Webwoche 2015: Local SEO
 
campixx 2018 - Tipps und Tools für KMU
campixx 2018 - Tipps und Tools für KMUcampixx 2018 - Tipps und Tools für KMU
campixx 2018 - Tipps und Tools für KMU
 
Tracking-Herausforderungen 2020
Tracking-Herausforderungen 2020Tracking-Herausforderungen 2020
Tracking-Herausforderungen 2020
 
Google Analytics Konferenz 2016: Datenqualität sichern (Bernadette Hohns & Ch...
Google Analytics Konferenz 2016: Datenqualität sichern (Bernadette Hohns & Ch...Google Analytics Konferenz 2016: Datenqualität sichern (Bernadette Hohns & Ch...
Google Analytics Konferenz 2016: Datenqualität sichern (Bernadette Hohns & Ch...
 
Ads und Landing Pages mit CRO ideal verbinden
Ads und Landing Pages mit CRO ideal verbindenAds und Landing Pages mit CRO ideal verbinden
Ads und Landing Pages mit CRO ideal verbinden
 

Von Protocol Buffer und anderen Dingen

  • 1. Von Protocol Buffer und anderen Dingen Reverse Engineering Google SERPs
  • 2. Wer ich bin 2 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Valentin Pletzer Head of SEO @ BurdaForward https://twitter.com/VorticonCmdr https://www.xing.com/profile/Valentin_Pletzer https://plus.google.com/+ValentinPletzer valentin.pletzer@burda-forward.de http://www.chip.de/ http://www.focus.de/ https://www.bestcheck.de http://www.netmoms.de/ https://www.finanzen100.de/ http://www.huffingtonpost.de/ https://weather.com/de-DE
  • 3. Browser-spezifisches HTML 3 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Beispiel Chrome <-> Firefox
  • 4. User-spezifisches HTML 4 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Beispiel aus der Praxis: A/B-Test für „speedtest“ App Engine https://cloud.google.com/appengine/docs/standard/#trafficsplitting
  • 5. Google A/B-Test reproduzieren 5 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH EditThis Cookie • Eigentlich recht einfach: NID • Das NID-Cookie enthält eine eindeutige ID, über die Google Ihre bevorzugten Einstellungen und andere Informationen speichert, insbesondere Ihre bevorzugte Sprache (z. B. Deutsch), wie viele Suchergebnisse pro Seite angezeigt werden sollen (z. B. 10 oder 20) und ob der Google SafeSearch-Filter aktiviert sein soll. • EditThisCookie-Extension “Für Incognito Modus zulassen“ • Cookie laden und speichern • Idee: Plugin mit Datenbank für NID-Cookies Quelle: https://www.google.com/policies/technologies/types/
  • 6. Location Header & Cookie 6 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH wo bin ich? • UULE-Cookie • x-geo-Header • Base64-codierte Location-Daten role: CURRENT_LOCATION producer: DEVICE_LOCATION radius: 65000 latlng < latitude_e7: 374248743 longitude_e7: -1220943074 > • 374248743 / 1e7 = 37.4248743 (lat) • -1220943074 / 1e7 = -122.0943074 (lng) x-geo: a cm9sZTogQ1VSUkVOVF9MT0NBVElPTgpwcm9kdWNlcjogREVWSUNFX0xPQ 0FUSU9OCnJhZGl1czogNjUwMDAKbGF0bG5nIDwKICBsYXRpdHVkZV9lNzog Mzc0MjQ4NzQzCiAgbG9uZ2l0dWRlX2U3OiAtMTIyMDk0MzA3NAo+
  • 7. Chrome Erweiterung 7 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH gs location changer https://chrome.google.com/webstore/detail/gs-location-changer/blpgcfdpnimjdojecbpagkllfnkajglp
  • 8. Data-Attribute ved 8 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Tracking-Daten im HTML
  • 9. ved deep dive 9 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Kleine Geheimnisse im Quellcode (base64) <div data-ved="0ahUKEwiMsveD6sHZAhWEL1AKHZ47BtwQGggr"> ??? • data-* attributes allow us to store extra information on standard, semantic HTML elements without other hacks such as non-standard attributes, extra properties on DOM, or Node.setUserData(). • Mal wieder Base64-Encoding, aber: Das erste Zeichen muss weg (die 0) • Base64 • Zur Kodierung werden jeweils drei Byte des Bytestroms (= 24 Bit) in vier 6-Bit-Blöcke aufgeteilt. • Falls die Gesamtanzahl der Eingabebytes nicht durch drei teilbar ist, wird der zu kodierende Text am Ende mit aus Nullbits bestehenden Füllbytes aufgefüllt, sodass sich eine durch drei teilbare Anzahl an Bytes ergibt. atob('ahUKEwiMsveD6sHZAhWEL1AKHZ47BtwQGggr‘) ==
  • 10. ved deep dive 10 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Kleine Geheimnisse im Quellcode (protocol buffer) • ab Mitte 2012 als nützlicher Teil des Google Referrers erkannt • damals aber nicht wirklich „verstanden“ • August 2013 dann von Benjamin Schulz korrekt als Protocol Buffer identifiziert Links: • https://moz.com/blog/decoding-googles-referral-string-or-how-i-survived-secure-search • http://gqs-decoder.appspot.com/ • https://github.com/google/protobuf/releases
  • 11. ved deep dive 11 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Procol Buffer richtig dekodieren – so geht‘s
  • 12. ved deep dive 12 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Durchnummeriert – 10 blue links and more 0 1 3 0 1 2 4 13 14 15 16 17 18 19 23 23 23 23 23 24 25 25
  • 13. ved Zusammenfassung 13 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Nicht perfekt aber schon recht hilfreich • Nützlich vor allem um Ergebnis-Typen zu identifizieren • Problematisch um Ergebnis-Position auszulesen (Featured-Snippet-Problematik) • hveid als unbekannte Variable
  • 14. Google Server 14 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH Gib mir „alle“ IP-Adressen $ host www.google.de www.google.de has address 172.217.19.67 www.google.de has IPv6 address 2a00:1450:4005:80b::2003 $ whois -h whois.radb.net 172.217.19.67 route: 172.217.19.0/24 descr: Google origin: AS15169 notify: radb-contact@google.com mnt-by: MAINT-AS15169 changed: radb-contact@google.com 20150728 source: RADB $ whois -h whois.radb.net '!gAS15169' A111637 66.249.64.0/20 66.249.80.0/20 74.125.57.240/29 216.239.44.0/24 216.239.45.0/24 23.251.128.0/23 23.251.128.0/24 23.251.129.0/24 23.251.130.0/23 23.251.130.0/24 23.251.131.0/24 23.251.132.0/23 23.251.132.0/24..... => grob 14.500 IPs mit Google Search (58 x 250)
  • 15. Sind alle Google SERPs gleich 15 Reverse Engineering Google SERPs | Valentin Pletzer | BurdaForward GmbH 58 IPs = 39 + 8 + 5 + 2 + 2 + 1 + 1 unterschiedliche SERPs Setup: • 58 IPs • selbe Location (Berlin) • etwa gleicher Zeitpunkt (innerhalb von 3 Minuten)