Moderne Technologien machen das Sammeln riesiger Datenmengen für jedes Unternehmen (fast) zum Kinderspiel. Damit man nicht auf einem Berg letztlich ungenutzter Daten sitzen bleibt, sollte man im Rahmen einer Datenstrategie von Anfang an definieren, welche Daten für welchen Zweck und mit welchen Tools erhoben werden. Auf Basis dieser grundlegenden strategischen Überlegungen und Maßnahmen können für das Unternehmen langfristig entscheidende Wettbewerbsvorteile entstehen.
2. 05.03.2015
2
Darum eine Data Strategy
„Wir produzieren derzeit alle zwei Tage so viele Daten
wie in dem gesamten Zeitraum, begonnen bei der
Entstehung der Menschheit bis hin zum Jahr 2003.“
Erich Schmidt als CEO von Google
Techonomy Konferenz 2010
„If you went to bed last night as an industrial company,
you‘re going to wake up today as a software and
analytics company.“
Jeff Immelt als CEO von GE
„By 2018, 30% of CIOs of global organizations will
have rolled out a pan-enterprise data and analytics
strategy“
IDC Predictions 2015
Darum eine Data Strategy
0
500
1000
1500
2000
2500
3000
3500
'07 '11 '14
Big Data Markt
(10M USD)
Anzahl offene
Datenquellen
Offene Datenquellen: lod-cloud.net, Marktdaten Big Data: wikibon.org
4. 05.03.2015
4
Beispiel
• Website Nutzung
• Verrechnung
• Lagerstand
19
91
0 50 100
Daten sind fehlerhaft
Betroffen von
fehlerhaften Daten
Prozent der befragten Unternehmen
Datenqualität
Experian Marketing Services 11/2014
Datenquellen sind oft fehlerbehaftet
… und müssen geprüft werden!
5. 05.03.2015
5
Beispiel
• Veraltete Adressen
• Unterschiedliche
Schreibweisen
• Fehlerhafte Eingabe
1,1
5,8
8,4
15,5
23,4
45,8
0,0 20,0 40,0 60,0
Geographisch
Semistrukturiert
Netze
Historisch
Unstrukturiert
Strukturiert
Anteil am Datenkuchen (Prozent)
Datenbeschaffenheit
Basis Google Books Ngram Daten 2008
Daten sind sehr verschieden
… und müssen entsprechend analysiert werden!
6. 05.03.2015
6
Beispiel
• Adressen
• Text, Bilder, Videos
• Besucherströme im Jahreslauf
• Followerstrukturen in
Social Media
• E-Mails
• Bewegungsdaten
Data to Business
Business Prozesse bestimmen
Die Daten müssen entsprechend
Analyseeinheiten
transformiert werden!
Data to Business
8. 05.03.2015
8
Dateninfrastruktur
1990er: DWH alle Daten an einem Ort
→ Probleme bei Platz, Leistung,
Ausfallssicherheit
2011: Hadoop Verteiltes Speichern &
post-hoc Verarbeiten von Daten
2013: Spark Verteiltes Speichern &
ad-hoc Verarbeiten von Daten
in Echtzeit
Ganzheitliche Data Strategy
Data Strategy
??: Datenorganisation
HR: Data Science Teams
aufbauen & weiterbilden
Business Development:
Applikationen entwickeln
Alle Units: Input liefern
CxO: Sponsorship
IT: Infrastruktur bereitstellen
Legal: Datenschutz
sicherstellen
9. 05.03.2015
9
Data Strategy für Google Analytics
Implementierungselemente
Business Development
• Entwicklung Reporting-Interface
• Integration in bestehende Applikationen
IT
• Bereitstellung Infrastruktur
• Adaptierung bestehender
Deploymentszenarien (GTM)
• Datenanalysen, historische Imports, Vergleiche
Legal - Adaptierung der Cookie-Richtlinien
HR - Aufbau eines Data Science Teams begonnen
Data Strategy für Google Analytics
Vorteile
• Integrierte Datenhaltung:
• Einheitliche Definitionen (Visit, Session, …)
• Vergleichbarkeit gesichert
• Effizientere Wartbarkeit
• Zentrales Reporting:
• Alle Daten auf einen Blick
• Interne Effizienzsteigerung
• Erhöhte Kundenfreundlichkeit
10. 05.03.2015
10
Data Strategy für Google Analytics
Vorteile
• Übergreifende Analysen:
• Gesamtheitliche Sicht auf alle Daten
• Vergleiche über alle HEROLD Portale
• Bündelung des Traffics
• Schnellere, einfachere A/B-Tests
Viel Erfolg bei
Ihrem Projekt!