13. Historie
• Michael Cox and David Ellsworth (NASA)
• “Application-controlled demand paging for out-of-
core visualization”
• 1997
14. Divide & Conquer
• Del opp til håndterlig størrelse
• Gjør beregninger
• Samle delresultater
15. Mapreduce
• Del opp data
• Gjør beregninger (Map)
• Aggregere resultateter (Reduce)
16. Unix Mapreduce
paste servers data | xargs -P6 -n2 -I% sh -c 'set -- %;
<$2 ssh $1 map' | reduce
paste servers data
xargs
Alex Schepanovski
17.
18. Map
• Del opp linjer i enkeltord
• Skriv ut hver ord og et ett-tall
• For hvert ord, legg sammen alle tall
19. Map II
Vi ser nærmere på aktuelle trender og bruksområder
samt hvilke systemer og verktøy som benyttes i ulike
kontekster
vi 1
ser 1
nærmere 1
…
20. Shuffle
Vi ser nærmere på aktuelle trender og bruksområder
samt hvilke systemer og verktøy som benyttes i ulike
kontekster
…
nærmere 1
og 1
og 1
på 1
…
21. Reduce
Vi ser nærmere på aktuelle trender og bruksområder
samt hvilke systemer og verktøy som benyttes i ulike
kontekster
…
nærmere 1
og 1, 1
på 1
…
22. Reduce
Vi ser nærmere på aktuelle trender og bruksområder
samt hvilke systemer og verktøy som benyttes i ulike
kontekster
…
nærmere 1
og 2
på 1
…
23. Indeksering
• Inputdata er alle dokumenter
• Mappere får hele dokumenter og dokument id
• Skriver ut ord og dokument id