3. Agenda
•Big Data
•Uvod u Lambda arhitekturu
•Kako razviti Lambda arhitekturu
•Nadogradnja Lambde
•Daljnji razvoj
#DSCRO
4. Ciljevi
•imati sve podatke koje tvrtka generira
•imati dostupne podatke iz okoline
•data lake – objediniti podatke
•istraživanje podataka
•obogatiti podatke
•predviđanje na temelju povijesnih podataka
•pravovremeno reagiranje na temelju podataka
#DSCRO
Big Data
8. Big Data - Kako nastaju podaci
•user -> click -> event -> new data ->
#DSCRO
9. #DSCRO
Pitanja
•Koje proizvode top korisnici kupuju?
•Koliko proizvoda top korisnici kupuju?
•Koliko korisnika ima koji cjenovni rang?
Kako razviti Lambda arhitekturu
20. •Kappa architecture
•simplifikacija Lambda arhitekture
•real-time obrada
• Jay Kreps - LinkedIn
•Apache Samza – koncipiran na YARN-u i Kafki
•Summingbird
• izrađuju se funkcije za obradu
• primjenjive u map-reduceu (batch layer) i
Apache Stormu (speed layer)
•Spark 2
#DSCRO
Daljnji razvoj
21. •implementirali:
•Yahoo, Netflix, Metamarkets
•definirao:
•Nathan Marz – Backtype, Twitter , Storm
•prednosti:
•prava informacija u pravo vrijeme
•pravodobno reagiranje na informacije
•dodatna vrijednost informacije
•informacije se dobivaju brzo (speed layer)
•informacije su točne (batch layer)
•nedostaci:
•komplekstnost izrade
•u dvije različite tehnologije se mora izraditi ista funkcija
#DSCRO
Lambda arhitektura