SlideShare a Scribd company logo
1 of 9
DATA LAKES
B2K04 – Axelle, Arno, Céleste
,
Vertaling voor “datameer”
Centrale opslagplaats die de big data van de bronen in
oorspronkelijk formaat bewaart tot dat bedrijven ze gebruiken.
Alleen maar gegevens gestructureerd, semi-gestructureerd,
ongestructureerd met flexibileit om ze in de toekomst te
gebruiken.
Nuttige inzichten voor maatwerk aan behoeften van de klant te
voldoen.
WAT?
WAT?
Het bevat honderden terabytes of petabytes om
gesimuleerde gegevens op te slaan uit operationele
bronnen, waaronder databases en SaaS-platforms.
Kan gebruikt worden als een bronplatform dat
gegevensopslag en ondersteuningstools mogelijk maakt om
gegevens te begrijpen door middel van snelle verkenning
voor geavanceerde analyses.
Door de lage kosten van dataopslag hoeft de opslag niet
direct verbonden te zijn aan een concreet doel.
VOORDELEN
 Blijft beschikbaar
 Goedkoop
 Variaties
 Gemakkelijk te gebruiken
 Vindingrijkheid
.
BEDRIJFTOEPASSINGEN
/
PRODUCTTOEPASSINGEN
 Cloud
o Zo worden databases voorzien van mogelijkheden om
ongestructureerde data te lezen en combineren met de
aanwezige gestructureerde data.
 Delta lake
o Open-sourceproject waarmee een lakehouse-
architectuur kan worden gebouwd bovenop bestaande
opslagsystemen zoals S3, ADLS, GCS en HDFS.
 Personal DataLake van Cardiff University
o Heeft tot doel big data van individuele gebruikers te
beheren door één enkel punt te bieden voor het
verzamelen, organiseren en delen van persoonlijke
gegevens.
;
 Niet disruptief in de nabije toekomst
 Primaire gebruikers blijven belangrijk omdat ze over de
juiste expertise beschikken om de date eruit te halen en je
effectief voor de organistatie in te zetten.
o Vb: Data scientist, data engineer, analist
 Helaas hebben de meeste datameren geen goed bestuur,
beschikken ze niet over de tools en vaardigheden om grote
hoeveelheden ongelijksoortige data te verwerken, en veel
hebben geen overtuigende businesscase.
 Met alle ruwe data die erin stroomt, is het ontzettend lastig
om de datakwalitiet te bepalen, laat staan te bewaken.
DISRUPTIEF?
EMERGING
TECHNOLOGY
ROADMAP
2020 – 2022
For midsize entreprises
.
GARTNER
Rood veel risico’s
 Gegevens kunnen in het datameer worden geplaatst
zonder toezicht op de inhoud.
 Zonder beschrijvende metadata en een mechanisme om
deze te onderhouden, dreigt het datameer in een
datamoeras te veranderen.
Middelgrote bol Nuttiger voor bedrijf
 Het elimineert de initiële kosten van gegevensopname,
zoals transformatie.
 Flexibiliteit en toegankelijkheid voor data-analyse.
.
1. /
2. Lamiya, F. R. (2021, 19 oktober). IT Explained: What Is a Data Lake? TechAcute.
Geraadpleegd op 1 december 2021, van https://techacute.com/data-lake/
3. Het Data Lake | Business Intelligence That Works! (z.d.). Het Data lake.
Geraadpleegd op 1 december 2021, van http://www.bithatworks.nl/datalake
4. Lamiya, F. R. (2021, 19 oktober). IT Explained: What Is a Data Lake? TechAcute.
Geraadpleegd op 1 december 2021, van https://techacute.com/data-lake/
5. Delta Lake. (2020, 23 augustus). Delta Lake - Reliable Data Lakes at Scale.
Geraadpleegd op 1 december 2021, van https://delta.io/
6. Pouw, D. (2021, 29 september). 6 redenen om géén data lake aan te leggen.
Passionned Group. Geraadpleegd op 2 december 2021, van
https://www.passionned.be/6-redenen-om-geen-data-lake-aan-te-leggen/
7. Gartner Says Beware of the Data Lake Fallacy. (2014, 28 juli). Gartner.
Geraadpleegd op 2 december 2021, van
https://www.gartner.com/en/newsroom/press-releases/2014-07-28-gartner-
says-beware-of-the-data-lake-fallacy
Ismail, N. (2018, 18 juni). Don’t drown in a data lake. Information Age.
Geraadpleegd op 2 december 2021, van https://www.information-
age.com/dont-drown-data-lake-123466667/
BRON-
VERMELDING

More Related Content

Similar to Data lakes

Efficiënt gebruik van de opslag
Efficiënt gebruik van de opslagEfficiënt gebruik van de opslag
Efficiënt gebruik van de opslagDekkinga, Ewout
 
Database Platformen Versus Etl Tools
Database Platformen Versus Etl ToolsDatabase Platformen Versus Etl Tools
Database Platformen Versus Etl ToolsAlexander van Helm
 
Business Intelligence voor Managers – Big Data zonder Warehouse (2)
Business Intelligence voor Managers – Big Data zonder Warehouse (2) Business Intelligence voor Managers – Big Data zonder Warehouse (2)
Business Intelligence voor Managers – Big Data zonder Warehouse (2) FourPoints Business Intelligence
 
Applicatierationalisatie door Masterdatamanagement
Applicatierationalisatie door MasterdatamanagementApplicatierationalisatie door Masterdatamanagement
Applicatierationalisatie door MasterdatamanagementMarc Govers
 
T2S Migratie PlatForm Brochure
T2S Migratie PlatForm BrochureT2S Migratie PlatForm Brochure
T2S Migratie PlatForm BrochureJudith de Witte
 
Gemeente Arnhem Case Study
Gemeente Arnhem Case StudyGemeente Arnhem Case Study
Gemeente Arnhem Case StudyBas Kooter
 
20130527 jill dyche - im ronald
20130527   jill dyche - im ronald20130527   jill dyche - im ronald
20130527 jill dyche - im ronaldPrudenza B.V
 
20130527 jill dyche - im ronald [Dutch]
20130527   jill dyche - im ronald [Dutch]20130527   jill dyche - im ronald [Dutch]
20130527 jill dyche - im ronald [Dutch]Prudenza B.V
 
Meet de gezondheid van de opslag
Meet de gezondheid van de opslagMeet de gezondheid van de opslag
Meet de gezondheid van de opslagDekkinga, Ewout
 
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012Marc Govers
 
Digitale delta v01 bevindingen en contouren mei2014
Digitale delta v01 bevindingen en contouren mei2014Digitale delta v01 bevindingen en contouren mei2014
Digitale delta v01 bevindingen en contouren mei2014Raymond Feron
 
220222.FederatiefDataDelen.TopsectorLogistiek.pdf
220222.FederatiefDataDelen.TopsectorLogistiek.pdf220222.FederatiefDataDelen.TopsectorLogistiek.pdf
220222.FederatiefDataDelen.TopsectorLogistiek.pdfGerard van der Hoeven
 

Similar to Data lakes (20)

Efficiënt gebruik van de opslag
Efficiënt gebruik van de opslagEfficiënt gebruik van de opslag
Efficiënt gebruik van de opslag
 
Database Platformen Versus Etl Tools
Database Platformen Versus Etl ToolsDatabase Platformen Versus Etl Tools
Database Platformen Versus Etl Tools
 
Business Intelligence voor Managers – Big Data zonder Warehouse (2)
Business Intelligence voor Managers – Big Data zonder Warehouse (2) Business Intelligence voor Managers – Big Data zonder Warehouse (2)
Business Intelligence voor Managers – Big Data zonder Warehouse (2)
 
Applicatierationalisatie door Masterdatamanagement
Applicatierationalisatie door MasterdatamanagementApplicatierationalisatie door Masterdatamanagement
Applicatierationalisatie door Masterdatamanagement
 
T2S Migratie PlatForm Brochure
T2S Migratie PlatForm BrochureT2S Migratie PlatForm Brochure
T2S Migratie PlatForm Brochure
 
Cloud data warehouse
Cloud data warehouseCloud data warehouse
Cloud data warehouse
 
Gemeente Arnhem Case Study
Gemeente Arnhem Case StudyGemeente Arnhem Case Study
Gemeente Arnhem Case Study
 
11. Wat is Big Data? En moeten we er wat mee?
11. Wat is Big Data? En moeten we er wat mee?11. Wat is Big Data? En moeten we er wat mee?
11. Wat is Big Data? En moeten we er wat mee?
 
Oracle Big Data met R Enterprise en OBIEE
Oracle Big Data met R Enterprise en OBIEEOracle Big Data met R Enterprise en OBIEE
Oracle Big Data met R Enterprise en OBIEE
 
data infrastructuur
data infrastructuurdata infrastructuur
data infrastructuur
 
20130527 jill dyche - im ronald
20130527   jill dyche - im ronald20130527   jill dyche - im ronald
20130527 jill dyche - im ronald
 
20130527 jill dyche - im ronald [Dutch]
20130527   jill dyche - im ronald [Dutch]20130527   jill dyche - im ronald [Dutch]
20130527 jill dyche - im ronald [Dutch]
 
Cloud data warehouse
Cloud data warehouseCloud data warehouse
Cloud data warehouse
 
Meet de gezondheid van de opslag
Meet de gezondheid van de opslagMeet de gezondheid van de opslag
Meet de gezondheid van de opslag
 
De Waarde van Data
De Waarde van DataDe Waarde van Data
De Waarde van Data
 
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
 
Digitale delta v01 bevindingen en contouren mei2014
Digitale delta v01 bevindingen en contouren mei2014Digitale delta v01 bevindingen en contouren mei2014
Digitale delta v01 bevindingen en contouren mei2014
 
Justitie Data Architectuurdag
Justitie Data Architectuurdag Justitie Data Architectuurdag
Justitie Data Architectuurdag
 
220222.FederatiefDataDelen.TopsectorLogistiek.pdf
220222.FederatiefDataDelen.TopsectorLogistiek.pdf220222.FederatiefDataDelen.TopsectorLogistiek.pdf
220222.FederatiefDataDelen.TopsectorLogistiek.pdf
 
Xero op hoofdlijnen
Xero op hoofdlijnenXero op hoofdlijnen
Xero op hoofdlijnen
 

Data lakes

  • 1. DATA LAKES B2K04 – Axelle, Arno, Céleste
  • 2. , Vertaling voor “datameer” Centrale opslagplaats die de big data van de bronen in oorspronkelijk formaat bewaart tot dat bedrijven ze gebruiken. Alleen maar gegevens gestructureerd, semi-gestructureerd, ongestructureerd met flexibileit om ze in de toekomst te gebruiken. Nuttige inzichten voor maatwerk aan behoeften van de klant te voldoen. WAT?
  • 3. WAT? Het bevat honderden terabytes of petabytes om gesimuleerde gegevens op te slaan uit operationele bronnen, waaronder databases en SaaS-platforms. Kan gebruikt worden als een bronplatform dat gegevensopslag en ondersteuningstools mogelijk maakt om gegevens te begrijpen door middel van snelle verkenning voor geavanceerde analyses. Door de lage kosten van dataopslag hoeft de opslag niet direct verbonden te zijn aan een concreet doel.
  • 4. VOORDELEN  Blijft beschikbaar  Goedkoop  Variaties  Gemakkelijk te gebruiken  Vindingrijkheid
  • 5. . BEDRIJFTOEPASSINGEN / PRODUCTTOEPASSINGEN  Cloud o Zo worden databases voorzien van mogelijkheden om ongestructureerde data te lezen en combineren met de aanwezige gestructureerde data.  Delta lake o Open-sourceproject waarmee een lakehouse- architectuur kan worden gebouwd bovenop bestaande opslagsystemen zoals S3, ADLS, GCS en HDFS.  Personal DataLake van Cardiff University o Heeft tot doel big data van individuele gebruikers te beheren door één enkel punt te bieden voor het verzamelen, organiseren en delen van persoonlijke gegevens.
  • 6. ;  Niet disruptief in de nabije toekomst  Primaire gebruikers blijven belangrijk omdat ze over de juiste expertise beschikken om de date eruit te halen en je effectief voor de organistatie in te zetten. o Vb: Data scientist, data engineer, analist  Helaas hebben de meeste datameren geen goed bestuur, beschikken ze niet over de tools en vaardigheden om grote hoeveelheden ongelijksoortige data te verwerken, en veel hebben geen overtuigende businesscase.  Met alle ruwe data die erin stroomt, is het ontzettend lastig om de datakwalitiet te bepalen, laat staan te bewaken. DISRUPTIEF?
  • 8. . GARTNER Rood veel risico’s  Gegevens kunnen in het datameer worden geplaatst zonder toezicht op de inhoud.  Zonder beschrijvende metadata en een mechanisme om deze te onderhouden, dreigt het datameer in een datamoeras te veranderen. Middelgrote bol Nuttiger voor bedrijf  Het elimineert de initiële kosten van gegevensopname, zoals transformatie.  Flexibiliteit en toegankelijkheid voor data-analyse.
  • 9. . 1. / 2. Lamiya, F. R. (2021, 19 oktober). IT Explained: What Is a Data Lake? TechAcute. Geraadpleegd op 1 december 2021, van https://techacute.com/data-lake/ 3. Het Data Lake | Business Intelligence That Works! (z.d.). Het Data lake. Geraadpleegd op 1 december 2021, van http://www.bithatworks.nl/datalake 4. Lamiya, F. R. (2021, 19 oktober). IT Explained: What Is a Data Lake? TechAcute. Geraadpleegd op 1 december 2021, van https://techacute.com/data-lake/ 5. Delta Lake. (2020, 23 augustus). Delta Lake - Reliable Data Lakes at Scale. Geraadpleegd op 1 december 2021, van https://delta.io/ 6. Pouw, D. (2021, 29 september). 6 redenen om géén data lake aan te leggen. Passionned Group. Geraadpleegd op 2 december 2021, van https://www.passionned.be/6-redenen-om-geen-data-lake-aan-te-leggen/ 7. Gartner Says Beware of the Data Lake Fallacy. (2014, 28 juli). Gartner. Geraadpleegd op 2 december 2021, van https://www.gartner.com/en/newsroom/press-releases/2014-07-28-gartner- says-beware-of-the-data-lake-fallacy Ismail, N. (2018, 18 juni). Don’t drown in a data lake. Information Age. Geraadpleegd op 2 december 2021, van https://www.information- age.com/dont-drown-data-lake-123466667/ BRON- VERMELDING

Editor's Notes

  1. ebeurt de opslag zonder speciale structuur. Een enorme hoeveelheid gegevens worden in ruwe en originele vorm centraal opgeslagen
  2.  Lakehouse-architectuur