Effiziente Verarbeitung von großen Datenmengen
Andreas Eisenkolb

January 7, 2014

Andreas Eisenkolb

Effiziente Verarbeitung ...
Inhaltsverzeichnis

1

Big Data

2

MapReduce

Andreas Eisenkolb

Effiziente Verarbeitung von großen Datenmengen

January 7,...
Big Data

Andreas Eisenkolb

Effiziente Verarbeitung von großen Datenmengen

January 7, 2014

3 / 11
Big Data

speichert ca. 2,5 Petabytes
1 Petabyte = 1 048 576 Gigabytes
IBM Festplatten-Cluster speichert 20 Petabayte
1

1...
Was versteht man unter Big Data?

Big Data
Big Data bezeichnet große Datenmengen aus vielf¨ltigen Quellen, die mit
a
Hilfe...
Big Data Challenge

Andreas Eisenkolb

Effiziente Verarbeitung von großen Datenmengen

January 7, 2014

6 / 11
Die 4 ”Vs” von Big Data

Andreas Eisenkolb

Effiziente Verarbeitung von großen Datenmengen

January 7, 2014

7 / 11
Was ist MapReduce?

MapReduce
MapReduce ist ein vom Unternehmen Google Inc. eingef¨hrtes
u
Programmiermodell f¨r nebenl¨ufi...
Warum MapReduce?

Effiziente Verarbeitung großer Datenmengen
Einfache Benutzung (Fehlerbehandlung, Datenverteilung, etc.)

A...
MapReduce

Andreas Eisenkolb

Effiziente Verarbeitung von großen Datenmengen

January 7, 2014

10 / 11
Andreas Eisenkolb

Effiziente Verarbeitung von großen Datenmengen

January 7, 2014

11 / 11
Upcoming SlideShare
Loading in...5
×

Effiziente Verarbeitung von großen Datenmengen

190

Published on

Ein Vortrag von Andreas Eisenkolb aus dem Hauptseminar "Personalisierung mit großen Daten".

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
190
On Slideshare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
1
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Effiziente Verarbeitung von großen Datenmengen

  1. 1. Effiziente Verarbeitung von großen Datenmengen Andreas Eisenkolb January 7, 2014 Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 1 / 11
  2. 2. Inhaltsverzeichnis 1 Big Data 2 MapReduce Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 2 / 11
  3. 3. Big Data Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 3 / 11
  4. 4. Big Data speichert ca. 2,5 Petabytes 1 Petabyte = 1 048 576 Gigabytes IBM Festplatten-Cluster speichert 20 Petabayte 1 1 Quelle: http://www.dailytech.com/article.aspx?newsid=22558 Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 4 / 11
  5. 5. Was versteht man unter Big Data? Big Data Big Data bezeichnet große Datenmengen aus vielf¨ltigen Quellen, die mit a Hilfe neu entwickelter Methoden und Technologien erfasst, verteilt, gespeichert, durchsucht, analysiert und visualisiert werden k¨nnena . o a Wissenschaftliche Dienste des Deutschen Bundestages Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 5 / 11
  6. 6. Big Data Challenge Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 6 / 11
  7. 7. Die 4 ”Vs” von Big Data Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 7 / 11
  8. 8. Was ist MapReduce? MapReduce MapReduce ist ein vom Unternehmen Google Inc. eingef¨hrtes u Programmiermodell f¨r nebenl¨ufige Berechnungen uber große u a ¨ Datenmengen auf Computerclustern. Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 8 / 11
  9. 9. Warum MapReduce? Effiziente Verarbeitung großer Datenmengen Einfache Benutzung (Fehlerbehandlung, Datenverteilung, etc.) Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 9 / 11
  10. 10. MapReduce Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 10 / 11
  11. 11. Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 11 / 11
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×