Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Enhanced SEO with Machine Learning

131 views

Published on

Some SEO-Tasks resolved with Machine Learning.

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Enhanced SEO with Machine Learning

  1. 1. Enhanced SEO with Machine Learning (ML)
  2. 2. ~ Ende 2015
  3. 3. Machine learning is a field of computer science that gives computer systems the ability to "learn" (i.e. progressively improve performance on a specific task) with data, without being explicitly programmed. Source: https://en.wikipedia.org/wiki/Machine_learning
  4. 4. Beispiel: Erkennung von Soft 404 - “Einfache” Programmierung Bewertung der gecrawlten 200er Seite - Wenn “404” oder “Error” “Not Found” in Inhalt oder Titel der Seite und - Wenn weniger als 3 Sätze auf der Seite sind und - Wenn … oder …. -> dann “Soft 404” -> andernfalls “200 OK”
  5. 5. Beispiel: Erkennung von Soft 404 - Machine Learning / Supervised Datenbeschaffung / Aufbereitung ● Crawl von 500 200er (depth first) Seiten der Top 10.000 Domains (je Sprache) ● Crawl von 404 Seiten der gleichen Domain (www.domain.de/fehler12987319) Für jede der gecrawlten Seiten ● Erkennung des Sentiments des Textes ● Anzahl der Wörter selber ● Die vorkommenden Wörter und Ihr Umfeld
  6. 6. Beispiel: Erkennung von Soft 404 - Training & Abfrage URL Inhalte Anzahl Links (ohne Boilerplate) Sentiment … (Weitere informatione n, Header, Caching…) Status Code /beispiel.html Text über Musik 200 (12) 0.1 ... 200 /fehler123.html Es ist ein Problem aufgetreten 189 (1) -0.5 ... 404 Train
  7. 7. Beispiel: Erkennung von Soft 404ern - Training & Abfrage URL Inhalte Anzahl Links (ohne Boilerplate) Sentiment … (Weitere informatione n, Header, Caching…) Status Code /beispiel.html Langer Text über Musik 200 (12) 0.1 ... 200 /fehler123.html Es ist ein Problem aufgetreten 189 (1) -0.5 ... 404 Train /seite123.html 404 Es tut uns leid... 133 (0) -0.2 ... ? Abfragemit unbekanntenDaten
  8. 8. Word2vec & andere unsupervised ML Algorithmen Train Query
  9. 9. Warum sollte sich ein SEO mit ML auseinandersetzen?
  10. 10. ML: Analyse von NDAs Quelle: https://futurism.com/ai-contracts-lawyers-lawgeex/
  11. 11. Geschwindigkeit .. while it took humans anywhere from 51 minutes to more than 2.5 hours to complete all five NDAs, the AI engine finished in 26 seconds.
  12. 12. Analysis of NDAs: The neural network boasts 94 percent accuracy (versus humans' 85 percent) Qualität
  13. 13. Analyse von Datenmengen die schwer manuell auswertbar sind
  14. 14. Google besser verstehen
  15. 15. Lösung für Kunden
  16. 16. Abstrakte Übersicht der ML Bestandteile Daten / Datenaufbereitung etc. Algorithmus & Training, Optimierung ML-Model Predictions
  17. 17. Beispiel: Content Audit
  18. 18. Ziel - Vergleich des Inhalts-Umfangs von Wettbewerber-Websites - Aufzeigen welche Inhaltsbereiche fehlen oder ausgebaut werden können
  19. 19. Daten Classification via Google Natural Language Analyze Data Content Audit Inhalte von verschiedenen Seiten extrahieren, Boilerplate entfernen Auch möglich: Nur einzelne Bereiche (Blog, Kategorien, ...) / CSV-Artikeldaten etc.
  20. 20. Daten Classification via Google Natural Language Analyze Data Content Audit Google Cloud Natural Language https://cloud.google.com/natural-language/
  21. 21. Daten Classification via Google Natural Language Analyze Data Content Audit Google Cloud Natural Language https://cloud.google.com/natural-language/
  22. 22. ML - APIs: Make predictions on existing models Daten / Datenaufbereitung etc. Algorithmus & Training, optimierung ML-Model Make Predictions
  23. 23. Daten Classification via Google Natural Language Pivot Data Content Audit Text Übersetzen ins Englische (Google Natural Language nur auf Englisch) =GOOGLETRANSLATE(A1;”DE”;”EN) Query Google Natural Language API (Spreadsheet Script) Ergebnis
  24. 24. Content Classification via Google Natural Language Analyze Data Content Audit
  25. 25. Content Classification via Google Natural Language Pivot Data Content Audit /Home & Garden/Pest Control Palmenmann: 11, 1001plants: 0, Evrgreen: 1
  26. 26. Content Classification via Google Natural Language Pivot Data Content Audit /Business & Industrial/Construction & Maintenance/Building Materials & Supplies Palmenmann: 1, 1001plants: 1, Evrgreen: 38
  27. 27. Content Kategorie mapping Content Audit Inhalte von verschiedenen Seiten extrahieren, Boilerplate entfernen Auch möglich: Nur einzelne Bereiche (Blog, Kategorien, ...) / CSV-Artikeldaten etc. Analyze Data Train ML Algo Predict Kategorie
  28. 28. Content Kategorie mapping Content Audit Kategorie mapping einer Seite (z.B. anhand der Navigation) Analyze Data Train ML Algo Predict Kategorie
  29. 29. Content Kategorie mapping Content Audit Analyze Data Train ML Algo Predict Kategorie Training des Classifiers (in diesem Fall mit Spacy / Python) https://spacy.io/
  30. 30. Content Kategorie mapping Content Audit Analyze Data Train ML Algo Predict Kategorie Für jede Unterseite / Inhalt die Kategorie bestimmen lassen
  31. 31. Content Kategorie mapping Content Audit Analyze Data Train ML Algo Predict Kategorie
  32. 32. Content Kategorie mapping Content Audit Analyze Data Train ML Algo Predict Kategorie Weitere Ausbaumöglichkeiten - Sichtbarkeitsdaten der Landing-Page URLs anreichern - Prognostizierter Traffic - CPC - Durchschnittliche Position - etc. - Analyse nur einzelner Bereiche (z.B. Blog, Produkte, FAQ etc.)
  33. 33. Beispiel: Neue Inhalte
  34. 34. Ziel Neuen Inhalt für ein Thema erstellen das alle relevanten Themengebiete bedient
  35. 35. Data ML: Clustern in Topics Analyze Data Neue Inhalte Inhalte der Top X (20) rankenden Webseiten zu einem Begriff (Einblatt) Daten aufbereiten
  36. 36. Data ML: Clustern in Topics Analyze Data Neue Inhalte Inhalte der Top X (20) rankenden Webseiten zu einem Begriff (Einblatt) Daten aufbereiten
  37. 37. Data ML: Clustern in Topics Analyze Data Neue Inhalte Inhalte der Top X (20) rankenden Webseiten zu einem Begriff (Einblatt) Daten aufbereiten
  38. 38. Data ML: Clustern in Topics Analyze Data Neue Inhalte Daten aufbereiten Inhalte in Absätze runterbrechen (meist behandelt ein Absatz ein Thema)
  39. 39. Data ML: Clustern in Topics Analyze Data Neue Inhalte Daten aufbereiten
  40. 40. Data ML: Clustern in Topics Analyze Data Neue Inhalte Daten aufbereiten Visualisiert mit pyLDAvis Giftstoff, reizung Überwintern Vermehren Giessen aronstabgewachs, aracea Kolumbien, Venezuela, Peru Luftfeuchtigkeit Blütenblatt, Blattform Schädlinge Aquarium
  41. 41. Keine Website Struktur? 427 Seiten à 20 Nachrichten = ~ 10.000 Unterseiten hinter einer Paginierung
  42. 42. Content Clustering via ML Manuell: Namen und Struktur für Cluster vergeben ML: Cluster für jedem Inhalt / URL zuweisen Struktur und Inhaltszuweisunge n vorhanden Sinnvolle Strukturen schaffen Inhalte extrahieren, Boilerplate entfernen
  43. 43. Content Clustering via ML Manuell: Namen und Struktur für Cluster vergeben ML: Cluster für jedem Inhalt / URL zuweisen Aufbereitung / Auswertung Sinnvolle Strukturen schaffen
  44. 44. Content Clustering via ML Manuell: Namen und Struktur für Cluster vergeben ML: Cluster für jedem Inhalt / URL zuweisen Struktur und Inhaltszuweisunge n vorhanden Sinnvolle Strukturen schaffen
  45. 45. Content Clustering via ML Manuell: Namen und Struktur für Cluster vergeben ML: Cluster für jedem Inhalt / URL zuweisen Struktur und Inhaltszuweisunge n vorhanden Sinnvolle Strukturen schaffen
  46. 46. Content Clustering via ML Manuell: Namen und Struktur für Cluster vergeben ML: Cluster für jedem Inhalt / URL zuweisen Struktur und Inhaltszuweisunge n vorhanden Sinnvolle Strukturen schaffen
  47. 47. Content Clustering via ML Manuell: Namen und Struktur für Cluster vergeben ML: Cluster für jedem Inhalt / URL zuweisen Struktur und Inhaltszuweisunge n vorhanden Sinnvolle Strukturen schaffen
  48. 48. Content Clustering via ML Manuell: Namen und Struktur für Cluster vergeben ML: Cluster für jedem Inhalt / URL zuweisen Struktur und Inhaltszuweisunge n vorhanden Internet Persönlichkeiten Sinnvolle Strukturen schaffen
  49. 49. Welche Keywords optimieren? Aus tausenden Keywords die auswählen, auf die man als nächstes optimiert oder für die man Inhalte erstellt.
  50. 50. Daten Model lernt Vorhersage nach Optimierung Welche Keywords optimieren ● je Keyword + eigene Position // Wettbewerber Position ○ Suchvolumen des Keywords ○ Position bei dem Keyword ○ Adwords Daten: CPC, Wettbewerb ○ Keyword Intent ○ Gefundene Zielseite: ■ Keyword im Title ■ Keyword im Inhalt ■ Keyword in Description ■ % WDF*IDF Worte des Keywords im Title ■ LDA Score des Textes zum Keyword ■ No. found Domain-Links ■ No. Found links zur URL ■ No. Found links zur URL with Keyword im Linktext ■ Internal-Link Strength ■ ...
  51. 51. Daten Model lernt Vorhersage nach Optimierung Welche Keywords optimieren
  52. 52. Daten Model lernt Vorhersage nach Optimierung Welche Keywords optimieren
  53. 53. Daten Model lernt Vorhersage nach Optimierung Welche Keywords optimieren 1 1 Überschreiben der Daten die wir optimieren können Vorhersage der Daten für dieses “optimierte” keyword
  54. 54. Daten Model lernt Vorhersage nach Optimierung Welche Keywords optimieren
  55. 55. Daten Model lernt Vorhersage nach Optimierung Welche Keywords optimieren
  56. 56. Und wie kann ich das für mich nutzen? Zeit Geld Online Kurse udacity.com udemy.com Hilfe bei konkreten Aufgabenstellungen codementor.io Ausschreiben / Freelancer: upwork.com Data Scientist Einstellen ML Plattformen bigml.com monkeylearn.com
  57. 57. Fragen? Folien, Code? In den nächsten Wochen über den Labs Newsletter: http://labs.searchviu.com
  58. 58. Vielen Dank! Get in Contact michael@searchviu.com https://www.xing.com/profile/Michael_Weber60 https://www.linkedin.com/in/weber-michael/

×