4. Machine learning is a field of computer science
that gives computer systems the ability to "learn"
(i.e. progressively improve performance on a
specific task) with data, without being explicitly
programmed.
Source: https://en.wikipedia.org/wiki/Machine_learning
5. Beispiel: Erkennung von Soft 404 - “Einfache” Programmierung
Bewertung der gecrawlten 200er Seite
- Wenn “404” oder “Error” “Not Found” in Inhalt oder Titel der Seite und
- Wenn weniger als 3 Sätze auf der Seite sind und
- Wenn … oder ….
-> dann “Soft 404”
-> andernfalls “200 OK”
6. Beispiel: Erkennung von Soft 404 - Machine Learning / Supervised
Datenbeschaffung / Aufbereitung
● Crawl von 500 200er (depth first) Seiten der Top 10.000 Domains (je
Sprache)
● Crawl von 404 Seiten der gleichen Domain (www.domain.de/fehler12987319)
Für jede der gecrawlten Seiten
● Erkennung des Sentiments des Textes
● Anzahl der Wörter selber
● Die vorkommenden Wörter und Ihr Umfeld
7. Beispiel: Erkennung von Soft 404 - Training & Abfrage
URL Inhalte Anzahl
Links (ohne
Boilerplate)
Sentiment … (Weitere
informatione
n, Header,
Caching…)
Status Code
/beispiel.html Text über Musik 200 (12) 0.1 ... 200
/fehler123.html Es ist ein Problem
aufgetreten
189 (1) -0.5 ... 404
Train
8. Beispiel: Erkennung von Soft 404ern - Training & Abfrage
URL Inhalte Anzahl
Links
(ohne
Boilerplate)
Sentiment … (Weitere
informatione
n, Header,
Caching…)
Status Code
/beispiel.html Langer Text über
Musik
200 (12) 0.1 ... 200
/fehler123.html Es ist ein
Problem
aufgetreten
189 (1) -0.5 ... 404
Train
/seite123.html 404 Es tut uns
leid...
133 (0) -0.2 ... ?
Abfragemit
unbekanntenDaten
11. ML: Analyse von NDAs
Quelle: https://futurism.com/ai-contracts-lawyers-lawgeex/
12. Geschwindigkeit
.. while it took humans anywhere from 51 minutes to more than 2.5 hours to complete all five NDAs, the AI
engine finished in 26 seconds.
13. Analysis of NDAs: The neural network boasts 94 percent accuracy (versus humans' 85 percent)
Qualität
19. Ziel
- Vergleich des Inhalts-Umfangs von
Wettbewerber-Websites
- Aufzeigen welche Inhaltsbereiche fehlen oder ausgebaut
werden können
20. Daten
Classification via
Google Natural
Language
Analyze Data
Content Audit
Inhalte von verschiedenen Seiten extrahieren, Boilerplate
entfernen
Auch möglich: Nur einzelne Bereiche (Blog, Kategorien, ...) / CSV-Artikeldaten etc.
23. ML - APIs: Make predictions on existing models
Daten / Datenaufbereitung etc.
Algorithmus & Training, optimierung
ML-Model
Make Predictions
24. Daten
Classification via
Google Natural
Language
Pivot Data
Content Audit
Text Übersetzen ins Englische (Google Natural Language nur auf Englisch)
=GOOGLETRANSLATE(A1;”DE”;”EN)
Query Google Natural Language API (Spreadsheet Script)
Ergebnis
28. Content
Kategorie
mapping
Content Audit
Inhalte von verschiedenen Seiten extrahieren, Boilerplate
entfernen
Auch möglich: Nur einzelne Bereiche (Blog, Kategorien, ...) / CSV-Artikeldaten etc.
Analyze Data
Train ML Algo
Predict Kategorie
33. Content
Kategorie
mapping
Content Audit
Analyze Data
Train ML Algo
Predict Kategorie
Weitere Ausbaumöglichkeiten
- Sichtbarkeitsdaten der Landing-Page URLs anreichern
- Prognostizierter Traffic
- CPC
- Durchschnittliche Position
- etc.
- Analyse nur einzelner Bereiche (z.B. Blog, Produkte,
FAQ etc.)
41. Data
ML: Clustern in
Topics
Analyze Data
Neue Inhalte
Daten aufbereiten
Visualisiert mit pyLDAvis
Giftstoff,
reizung
Überwintern
Vermehren
Giessen
aronstabgewachs,
aracea
Kolumbien,
Venezuela,
Peru
Luftfeuchtigkeit
Blütenblatt,
Blattform
Schädlinge
Aquarium
43. Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
Inhalte extrahieren, Boilerplate entfernen
45. Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
46. Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
47. Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
48. Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
49. Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Internet Persönlichkeiten
Sinnvolle Strukturen schaffen
50. Welche Keywords optimieren?
Aus tausenden Keywords die auswählen, auf die man als nächstes optimiert oder
für die man Inhalte erstellt.
51. Daten
Model lernt
Vorhersage nach
Optimierung
Welche Keywords optimieren
● je Keyword + eigene Position // Wettbewerber Position
○ Suchvolumen des Keywords
○ Position bei dem Keyword
○ Adwords Daten: CPC, Wettbewerb
○ Keyword Intent
○ Gefundene Zielseite:
■ Keyword im Title
■ Keyword im Inhalt
■ Keyword in Description
■ % WDF*IDF Worte des Keywords im Title
■ LDA Score des Textes zum Keyword
■ No. found Domain-Links
■ No. Found links zur URL
■ No. Found links zur URL with Keyword im Linktext
■ Internal-Link Strength
■ ...
57. Und wie kann ich das für mich nutzen?
Zeit Geld
Online Kurse
udacity.com
udemy.com
Hilfe bei konkreten
Aufgabenstellungen
codementor.io
Ausschreiben /
Freelancer:
upwork.com
Data Scientist
Einstellen
ML Plattformen
bigml.com
monkeylearn.com