SlideShare a Scribd company logo
1 of 13
Too Big to Ignore
Joshua Moesa
Rubén Middeljans
Stephan Vos
www.rubix.nl
Agenda
• Introduction
• Facts
• Definition
• Origins
• Five V’s
• Demonstration “The Visual Face of Hadoop”
• Questions?
26-4-2016
Introduction
26-4-2016
“To turn data into the right information and put it in the
right context to gain actionable insight and prediction.”
Facts
26-4-2016
Every day,
2,500,000,
000,000,
000,000 bytes
Facts
26-4-2016
Every 2 minutes,
Facts
26-4-2016
Every minute,
200 million 3 million likes
250.000 photos
500 hours
of video
3 million search
queries
420.000 tweets
Definition
Big Data is a field dedicated to the processing, storage and
analysis of large collections of data that frequently originate from
disparate sources.
26-4-2016
AnalysisProcessing Storage
Origins
Big Data emerged from a combination of business needs
and technology innovations.
26-4-2016
Analytics &
Data Science
Digitization Affordable
Technology &
Commodity
Hardware
Social Media Hyper-Connected
Communities &
Devices
Cloud
Computing
Five V’s
The characteristics that differentiate data categorized as
“Big” data are commonly known as the “Five V’s”.
26-4-2016
VelocityVolume Variety Veracity Value
“The Visual Face of Hadoop”
26-4-2016
BDD Architecture
26-4-2016
Demo
26-4-2016
Questions?
26-4-2016

More Related Content

Similar to Big Data Overview - Too Big to Ignore

How to become the best datascientist in Europe
How to become the best datascientist in EuropeHow to become the best datascientist in Europe
How to become the best datascientist in EuropeDigitYser
 
Experfy Online Course - Gain Competitive Advantage Using Microsoft Azure Data...
Experfy Online Course - Gain Competitive Advantage Using Microsoft Azure Data...Experfy Online Course - Gain Competitive Advantage Using Microsoft Azure Data...
Experfy Online Course - Gain Competitive Advantage Using Microsoft Azure Data...Experfy
 
Big Data in Action – Real-World Solution Showcase
 Big Data in Action – Real-World Solution Showcase Big Data in Action – Real-World Solution Showcase
Big Data in Action – Real-World Solution ShowcaseInside Analysis
 
Big Data Management: What's New, What's Different, and What You Need To Know
Big Data Management: What's New, What's Different, and What You Need To KnowBig Data Management: What's New, What's Different, and What You Need To Know
Big Data Management: What's New, What's Different, and What You Need To KnowSnapLogic
 
Büyük Veriyle Büyük Resmi Görmek
Büyük Veriyle Büyük Resmi GörmekBüyük Veriyle Büyük Resmi Görmek
Büyük Veriyle Büyük Resmi Görmekideaport
 
Libraries in the Big Data Era: Strategies and Challenges in Archiving and Sha...
Libraries in the Big Data Era: Strategies and Challenges in Archiving and Sha...Libraries in the Big Data Era: Strategies and Challenges in Archiving and Sha...
Libraries in the Big Data Era: Strategies and Challenges in Archiving and Sha...Peter Löwe
 
Semantically integrated Enterprise Data Lakes and Co-Evolution of Public / Pr...
Semantically integrated Enterprise Data Lakes and Co-Evolution of Public / Pr...Semantically integrated Enterprise Data Lakes and Co-Evolution of Public / Pr...
Semantically integrated Enterprise Data Lakes and Co-Evolution of Public / Pr...Linked Enterprise Date Services
 
Data Discovery vs BI Webinar
Data Discovery vs BI WebinarData Discovery vs BI Webinar
Data Discovery vs BI WebinarBirst
 
Big Data Ecosystem for Data-Driven Decision Making
Big Data Ecosystem for Data-Driven Decision MakingBig Data Ecosystem for Data-Driven Decision Making
Big Data Ecosystem for Data-Driven Decision MakingAbzetdin Adamov
 
Data Science Overview
Data Science OverviewData Science Overview
Data Science OverviewDavide Mauri
 
Health Check: Maintaining Enterprise BI
Health Check: Maintaining Enterprise BIHealth Check: Maintaining Enterprise BI
Health Check: Maintaining Enterprise BIEric Kavanagh
 
The State of the Data Warehouse in 2017 and Beyond
The State of the Data Warehouse in 2017 and BeyondThe State of the Data Warehouse in 2017 and Beyond
The State of the Data Warehouse in 2017 and BeyondSingleStore
 
Forging Cultural Change: Transforming Your Organization Into a Data-Driven Ma...
Forging Cultural Change: Transforming Your Organization Into a Data-Driven Ma...Forging Cultural Change: Transforming Your Organization Into a Data-Driven Ma...
Forging Cultural Change: Transforming Your Organization Into a Data-Driven Ma...Erika Roach
 
Analytical Innovation: How to Build the Next Generation Data Platform
Analytical Innovation: How to Build the Next Generation Data PlatformAnalytical Innovation: How to Build the Next Generation Data Platform
Analytical Innovation: How to Build the Next Generation Data PlatformVMware Tanzu
 
Business Intelligence - What is it?
Business Intelligence - What is it?Business Intelligence - What is it?
Business Intelligence - What is it?Dennis Riungu
 
Data Culture Series - Keynote & Panel - 19h May - London
Data Culture Series  - Keynote & Panel - 19h May - LondonData Culture Series  - Keynote & Panel - 19h May - London
Data Culture Series - Keynote & Panel - 19h May - LondonJonathan Woodward
 

Similar to Big Data Overview - Too Big to Ignore (20)

Using hadoop for big data
Using hadoop for big dataUsing hadoop for big data
Using hadoop for big data
 
How to become the best datascientist in Europe
How to become the best datascientist in EuropeHow to become the best datascientist in Europe
How to become the best datascientist in Europe
 
Experfy Online Course - Gain Competitive Advantage Using Microsoft Azure Data...
Experfy Online Course - Gain Competitive Advantage Using Microsoft Azure Data...Experfy Online Course - Gain Competitive Advantage Using Microsoft Azure Data...
Experfy Online Course - Gain Competitive Advantage Using Microsoft Azure Data...
 
Big Data in Action – Real-World Solution Showcase
 Big Data in Action – Real-World Solution Showcase Big Data in Action – Real-World Solution Showcase
Big Data in Action – Real-World Solution Showcase
 
Big Data Management: What's New, What's Different, and What You Need To Know
Big Data Management: What's New, What's Different, and What You Need To KnowBig Data Management: What's New, What's Different, and What You Need To Know
Big Data Management: What's New, What's Different, and What You Need To Know
 
Büyük Veriyle Büyük Resmi Görmek
Büyük Veriyle Büyük Resmi GörmekBüyük Veriyle Büyük Resmi Görmek
Büyük Veriyle Büyük Resmi Görmek
 
Libraries in the Big Data Era: Strategies and Challenges in Archiving and Sha...
Libraries in the Big Data Era: Strategies and Challenges in Archiving and Sha...Libraries in the Big Data Era: Strategies and Challenges in Archiving and Sha...
Libraries in the Big Data Era: Strategies and Challenges in Archiving and Sha...
 
Semantically integrated Enterprise Data Lakes and Co-Evolution of Public / Pr...
Semantically integrated Enterprise Data Lakes and Co-Evolution of Public / Pr...Semantically integrated Enterprise Data Lakes and Co-Evolution of Public / Pr...
Semantically integrated Enterprise Data Lakes and Co-Evolution of Public / Pr...
 
Data Discovery vs BI Webinar
Data Discovery vs BI WebinarData Discovery vs BI Webinar
Data Discovery vs BI Webinar
 
Here Comes Everything
Here Comes EverythingHere Comes Everything
Here Comes Everything
 
Big Data Ecosystem for Data-Driven Decision Making
Big Data Ecosystem for Data-Driven Decision MakingBig Data Ecosystem for Data-Driven Decision Making
Big Data Ecosystem for Data-Driven Decision Making
 
Data Science Overview
Data Science OverviewData Science Overview
Data Science Overview
 
Ds01 data science
Ds01   data scienceDs01   data science
Ds01 data science
 
Health Check: Maintaining Enterprise BI
Health Check: Maintaining Enterprise BIHealth Check: Maintaining Enterprise BI
Health Check: Maintaining Enterprise BI
 
Data Activities in Austria
Data Activities in AustriaData Activities in Austria
Data Activities in Austria
 
The State of the Data Warehouse in 2017 and Beyond
The State of the Data Warehouse in 2017 and BeyondThe State of the Data Warehouse in 2017 and Beyond
The State of the Data Warehouse in 2017 and Beyond
 
Forging Cultural Change: Transforming Your Organization Into a Data-Driven Ma...
Forging Cultural Change: Transforming Your Organization Into a Data-Driven Ma...Forging Cultural Change: Transforming Your Organization Into a Data-Driven Ma...
Forging Cultural Change: Transforming Your Organization Into a Data-Driven Ma...
 
Analytical Innovation: How to Build the Next Generation Data Platform
Analytical Innovation: How to Build the Next Generation Data PlatformAnalytical Innovation: How to Build the Next Generation Data Platform
Analytical Innovation: How to Build the Next Generation Data Platform
 
Business Intelligence - What is it?
Business Intelligence - What is it?Business Intelligence - What is it?
Business Intelligence - What is it?
 
Data Culture Series - Keynote & Panel - 19h May - London
Data Culture Series  - Keynote & Panel - 19h May - LondonData Culture Series  - Keynote & Panel - 19h May - London
Data Culture Series - Keynote & Panel - 19h May - London
 

Recently uploaded

Mature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxMature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxolyaivanovalion
 
Zuja dropshipping via API with DroFx.pptx
Zuja dropshipping via API with DroFx.pptxZuja dropshipping via API with DroFx.pptx
Zuja dropshipping via API with DroFx.pptxolyaivanovalion
 
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130Suhani Kapoor
 
Call Girls in Sarai Kale Khan Delhi 💯 Call Us 🔝9205541914 🔝( Delhi) Escorts S...
Call Girls in Sarai Kale Khan Delhi 💯 Call Us 🔝9205541914 🔝( Delhi) Escorts S...Call Girls in Sarai Kale Khan Delhi 💯 Call Us 🔝9205541914 🔝( Delhi) Escorts S...
Call Girls in Sarai Kale Khan Delhi 💯 Call Us 🔝9205541914 🔝( Delhi) Escorts S...Delhi Call girls
 
Cheap Rate Call girls Sarita Vihar Delhi 9205541914 shot 1500 night
Cheap Rate Call girls Sarita Vihar Delhi 9205541914 shot 1500 nightCheap Rate Call girls Sarita Vihar Delhi 9205541914 shot 1500 night
Cheap Rate Call girls Sarita Vihar Delhi 9205541914 shot 1500 nightDelhi Call girls
 
Smarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxSmarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxolyaivanovalion
 
Vip Model Call Girls (Delhi) Karol Bagh 9711199171✔️Body to body massage wit...
Vip Model  Call Girls (Delhi) Karol Bagh 9711199171✔️Body to body massage wit...Vip Model  Call Girls (Delhi) Karol Bagh 9711199171✔️Body to body massage wit...
Vip Model Call Girls (Delhi) Karol Bagh 9711199171✔️Body to body massage wit...shivangimorya083
 
Ravak dropshipping via API with DroFx.pptx
Ravak dropshipping via API with DroFx.pptxRavak dropshipping via API with DroFx.pptx
Ravak dropshipping via API with DroFx.pptxolyaivanovalion
 
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfMarket Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfRachmat Ramadhan H
 
VidaXL dropshipping via API with DroFx.pptx
VidaXL dropshipping via API with DroFx.pptxVidaXL dropshipping via API with DroFx.pptx
VidaXL dropshipping via API with DroFx.pptxolyaivanovalion
 
{Pooja: 9892124323 } Call Girl in Mumbai | Jas Kaur Rate 4500 Free Hotel Del...
{Pooja:  9892124323 } Call Girl in Mumbai | Jas Kaur Rate 4500 Free Hotel Del...{Pooja:  9892124323 } Call Girl in Mumbai | Jas Kaur Rate 4500 Free Hotel Del...
{Pooja: 9892124323 } Call Girl in Mumbai | Jas Kaur Rate 4500 Free Hotel Del...Pooja Nehwal
 
Data-Analysis for Chicago Crime Data 2023
Data-Analysis for Chicago Crime Data  2023Data-Analysis for Chicago Crime Data  2023
Data-Analysis for Chicago Crime Data 2023ymrp368
 
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Serviceranjana rawat
 
Generative AI on Enterprise Cloud with NiFi and Milvus
Generative AI on Enterprise Cloud with NiFi and MilvusGenerative AI on Enterprise Cloud with NiFi and Milvus
Generative AI on Enterprise Cloud with NiFi and MilvusTimothy Spann
 
Midocean dropshipping via API with DroFx
Midocean dropshipping via API with DroFxMidocean dropshipping via API with DroFx
Midocean dropshipping via API with DroFxolyaivanovalion
 
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAl Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAroojKhan71
 
Schema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfSchema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfLars Albertsson
 
Carero dropshipping via API with DroFx.pptx
Carero dropshipping via API with DroFx.pptxCarero dropshipping via API with DroFx.pptx
Carero dropshipping via API with DroFx.pptxolyaivanovalion
 

Recently uploaded (20)

Mature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxMature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptx
 
Zuja dropshipping via API with DroFx.pptx
Zuja dropshipping via API with DroFx.pptxZuja dropshipping via API with DroFx.pptx
Zuja dropshipping via API with DroFx.pptx
 
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
 
Call Girls in Sarai Kale Khan Delhi 💯 Call Us 🔝9205541914 🔝( Delhi) Escorts S...
Call Girls in Sarai Kale Khan Delhi 💯 Call Us 🔝9205541914 🔝( Delhi) Escorts S...Call Girls in Sarai Kale Khan Delhi 💯 Call Us 🔝9205541914 🔝( Delhi) Escorts S...
Call Girls in Sarai Kale Khan Delhi 💯 Call Us 🔝9205541914 🔝( Delhi) Escorts S...
 
Cheap Rate Call girls Sarita Vihar Delhi 9205541914 shot 1500 night
Cheap Rate Call girls Sarita Vihar Delhi 9205541914 shot 1500 nightCheap Rate Call girls Sarita Vihar Delhi 9205541914 shot 1500 night
Cheap Rate Call girls Sarita Vihar Delhi 9205541914 shot 1500 night
 
Smarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxSmarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptx
 
Vip Model Call Girls (Delhi) Karol Bagh 9711199171✔️Body to body massage wit...
Vip Model  Call Girls (Delhi) Karol Bagh 9711199171✔️Body to body massage wit...Vip Model  Call Girls (Delhi) Karol Bagh 9711199171✔️Body to body massage wit...
Vip Model Call Girls (Delhi) Karol Bagh 9711199171✔️Body to body massage wit...
 
Ravak dropshipping via API with DroFx.pptx
Ravak dropshipping via API with DroFx.pptxRavak dropshipping via API with DroFx.pptx
Ravak dropshipping via API with DroFx.pptx
 
Sampling (random) method and Non random.ppt
Sampling (random) method and Non random.pptSampling (random) method and Non random.ppt
Sampling (random) method and Non random.ppt
 
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfMarket Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
 
VidaXL dropshipping via API with DroFx.pptx
VidaXL dropshipping via API with DroFx.pptxVidaXL dropshipping via API with DroFx.pptx
VidaXL dropshipping via API with DroFx.pptx
 
{Pooja: 9892124323 } Call Girl in Mumbai | Jas Kaur Rate 4500 Free Hotel Del...
{Pooja:  9892124323 } Call Girl in Mumbai | Jas Kaur Rate 4500 Free Hotel Del...{Pooja:  9892124323 } Call Girl in Mumbai | Jas Kaur Rate 4500 Free Hotel Del...
{Pooja: 9892124323 } Call Girl in Mumbai | Jas Kaur Rate 4500 Free Hotel Del...
 
Data-Analysis for Chicago Crime Data 2023
Data-Analysis for Chicago Crime Data  2023Data-Analysis for Chicago Crime Data  2023
Data-Analysis for Chicago Crime Data 2023
 
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
 
Generative AI on Enterprise Cloud with NiFi and Milvus
Generative AI on Enterprise Cloud with NiFi and MilvusGenerative AI on Enterprise Cloud with NiFi and Milvus
Generative AI on Enterprise Cloud with NiFi and Milvus
 
Midocean dropshipping via API with DroFx
Midocean dropshipping via API with DroFxMidocean dropshipping via API with DroFx
Midocean dropshipping via API with DroFx
 
Delhi 99530 vip 56974 Genuine Escort Service Call Girls in Kishangarh
Delhi 99530 vip 56974 Genuine Escort Service Call Girls in  KishangarhDelhi 99530 vip 56974 Genuine Escort Service Call Girls in  Kishangarh
Delhi 99530 vip 56974 Genuine Escort Service Call Girls in Kishangarh
 
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAl Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
 
Schema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfSchema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdf
 
Carero dropshipping via API with DroFx.pptx
Carero dropshipping via API with DroFx.pptxCarero dropshipping via API with DroFx.pptx
Carero dropshipping via API with DroFx.pptx
 

Big Data Overview - Too Big to Ignore

Editor's Notes

  1. 1. “To turn data into the right information and put it in the right context to gain actionable insight and prediction. Dit is eigenlijk de essentie achter Big Data. Maar ook de visie achter data integratie. We zien de wereld veranderen naar een data-intensieve samenleving, iedereen is tegenwoordig nagenoeg continu verbonden met het internet en heeft de hele wereld letterlijk binnen handbereik, auto’s zijn verbonden en plannen zelf een onderhoudsbeurt in, maar ook de koelkast en wasmachine is always online, meters worden op afstand uitgelezen en sensoren publiceren continu data. 2. De grenzen tussen de fysieke en digitale wereld vervagen, een nieuw tijdperk is aangebroken waarin alles en iedereen continu met elkaar in verbinding staat. Het gaat hier om een explosie aan data, de opkomst van mobiliteit, Internet Of Things (IoT), sociale netwerken en cloud computing. We hebben continu data om ons heen op elk moment, alles is data. Er is zelfs data over data, of ook wel meta data genoemd. En het is alles behalve statisch, het wordt alsmaar groter, dynamischer en ongestructureerder. 3. De termen “Big Data” en “Data Science” zijn in de afgelopen jaren verheven tot buzzword. Deze introductie gaat dan ook vooral over het begrip over wat nu concreet de fundamentele aspecten zijn van Big Data. Hoe kunnen we Big Data opbreken in tastbare brokken. 4. Eén van de termen die ik gedurende mijn verdieping in Big Data tegenkwam was de term “real world situational awareness”. Dit vertaald zich naar het begrip, perceptie en bewustwording van alles dat om ons heen gebeurd. Dit geldt zowel voor fysieke tastbare zaken als informatie, maar ook patronen en relaties die hierin onverwachts ontstaan. Dit wordt gezien als het ultieme streven van de wetenschap Big Data. Kanttekening hierbij is dat we als individu of organisatie niet altijd weten hoe dit eruit ziet, of überhaupt kunnen bedenken hoe dit eruit zou moeten zien. Dit zal naar mijn mening ook de grootste uitdaging worden in de adoptie van Big Data, het beseft dat je iets niet weet. [OPTIONEEL] 4. Volgens diverse prognose zijn er in het jaar 2020 maar liefst 4 miljard mensen verbonden zijn met het internet. Daarnaast zijn er nog 25+ miljard apparaten en intelligente systemen verbonden die gezamenlijk maar liefst 50 biljoen GB data produceren, dit is 50 Zettabyte! -> (Nu 3 miljard verbonden mensen van 7.4 miljard, 235 miljoen dollar omzet, 4 miljoen apps, 5 miljard verbonden apparaten en 10 biljoen GB data.
  2. Elke dag, Creëren we 2,500,000,000,000,000,000 (2,5 quintillion) bytes aan Data. Hierin zit onder andere de data van de curiosity rover op de planeet mars tot aan jouw laatste vakantiefoto’s op Facebook. Indien we deze data op DVD’s zetten en op elkaar stapelen komen we tot de maan en terug! 80% van de data is ongestructureerd. Bedrijven en organisaties gebruiken daarin minder dan 10% van de data die ze beschikbaar hebben, en zelfs minder dan 1% van de totale data waar ze in potentie over kunnen beschikken.
  3. Dit is zoveel data, Dat we elke 2 minutes net zoveel data creëren als alle data die we ooit gecreërd hebben als mensheid tot aan het jaar 2000, en dat elke 2 minuten. Sterker nog, meer dan 90% van de data in de wereld is gecreërd in de laatste 18 maanden.
  4. Elke minuut, Versturen we 200 miljoen e-mails waarvan 67% spam. Genereren we 3 miljoen Facebook likes and uploaden we meer dan 250.000 fotos naar Facebook. Versturen we meer dan 420.000 tweets naar Twitter. Wordt er 500 uur aan video geupload naar YouTube. Het zou je 75 jaar kosten om alle video’s te bekijken die op één dag geupload worden. Verwerkt Google een gemiddelde van 40.000 zoekopdrachten. Dit maakt 3.5 miljard zoekopdrachten per dag. Hiermee staat Google absoluut op nummer 1.
  5. 1. Big Data is geen kant-en-klare oplossing (geen kwestie van Hadoop inzetten), het is een gebied of discipline dat zich toelegt op de verwerking, opslag en analyse van grote hoeveelheden data. Deze data is vaak afkomstig uit verschillende bronnen en kan diverse kenmerken hebben. 2. Big Data oplossingen zijn benodigd op het moment dat de traditionele verwerking, opslag en analyse technologieën ontoereikend zijn vanwege complexiteit of andere kenmerken van de data. In het bijzonder richt het zich op bijzondere requirements zoals het combineren van meerdere ongestructureerde datasets, het verwerken van grote hoeveelheden ongestructureerde data en het oogsten van verborgen gegevens, patronen en relaties binnen een bepaald tijdsbestek. 3. Voorbeelden Amazon is zo goed geworden in Big Data analytics (predictive variant) dat ze in staat zijn producten naar je toe te sturen alvorens je deze besteld hebt. Walmart weet bijvoorbeeld dat er meer pop tarts verkocht worden bij een stormwaarschuwing. Ze weten niet waarom, maar zorgen wel dat ze voldoende voorraad hebben en de snacks een goede plek in de winkel krijgen. New York als slimme stad is momenteel bezig met sound scaping, een verstoring van het typische stadsgeluid, zoals een pistoolschot, wordt direct doorgegeven aan de politie die er gelijk op af kunnen.
  6. 1. Analytics & Data Science Bedrijven en organisaties slaan meer data op om potentieel nieuwe inzichten te verkrijgen en daarmee een voorsprong te verkrijgen op de concurrentie. De behoefte aan techniek en technologie die hiermee gepaard gaan zijn significant toegenomen. Een voorbeeld is predictive (what-if) en prescriptive analytics op grote hoeveelheden ongestructureerde data sets. Predictive analytics: Indien een klant product A en B gekocht heeft, wat is de kans dat deze ook product C koopt? (kansberekening). Prescriptive analytics: Uit een keuze van product A, B en C, welke product zal volgende maand het beste verkopen indien we de prijs verlagen? 2. Digitization Voor veel bedrijven en organisaties hebben digitale media fysieke mediums vervangen als de facto communicatie. Gedigitaliseerde data geeft organisaties de kans om over belangrijke en nuttige informatie te beschikken. 3. Affordable Technology & Commodity Hardware Technologie met betrekking tot het de verwerking en opslag van grote hoeveelheden data is steeds betaalbaarder geworden. Het gebruik van commodity hardware maakt de adoptie van big data oplossingen toegankelijk voor bedrijven zonder een initiële grote investering te doen. 4. Social Media De opkomst van sociale media heeft klanten in staat gesteld om in near-realtime feedback te geven via open en publieke media. Deze ontwikkeling heeft bedrijven en organisaties in staat gesteld om hun strategie aan te passen op basis van de feedback. 5. Hyper-Connected Communities & Devices De brede dekking van het internet en de verspreiding van smartphones en WiFi netwerken hebben meer mensen in staat gesteld om continu actief te zijn in virtuele gemeenschappen, hetzij direct door middel van online interactie of door het gebruik van aangesloten apparaten zoals televisies, RFID, koelkasten en slimme meters. 6. Cloud Computing Ontwikkelingen op het gebied van cloud technologie hebben geleid tot het ontstaan van cloud omgevingen. Hiermee is het mogelijk om zeer schaalbare, on-demand uitvoeringsomgevingen te huren middels een zeer interessante kostenmodel (pay-as-you-go).
  7. De kenmerken die “Big” data onderscheiden zijn ook wel bekend als de “Vijf V’s”. 1. Volume (volume) Volume van de data dat verwerkt wordt door big data oplossingen. 2. Velocity (snelheid) De snelheid waarmee gegevens arriveren en mogelijk accumuleren binnen korte tijd. 3. Variety (variatie) Variatie verwijst naar de meerdere soorten en bijbehorende formaten van data dat verwerkt wordt door big data oplossingen. Deze gegevensverzamelingen kunnen zowel door de mens of computers gegenereerd zijn en kunnen een gestructureerd, semi-gestructureerd of ongestructureerde data bevatten. 4. Veracity (kwaliteit) Veracity is simpelweg de kwaliteit van de data, hoe zinvol is deze data. Binnen big data onderkennen we ruis of signaal data. Ruis data heeft aboluut geen waarde voor de business en signaal data bevat juist zinvolle informatie. 5. Value (waarde) Value is de waarde van de data voor de business, er is een directe relatie met de veracity oftewel kwaliteit van de data. Hoe zinvoller de informatie hoe te hoger de waarde is voor de business. Waarde is tevens tijdsafhankelijk en hangt daarom ook af van de tijd die benodigd is voor het verwerken van de data tot informatie. Hoe langer het duurt voor de verwerking hoe lager de waarde is voor de business, simpelweg omdat de houdbaarheid van de informatie op dat moment mogelijk is verstreken.
  8. The Visual Face of Hadoop… Waarom? Er zijn zoveel gegevens in een data lake, dat het lastig is om hier wijs uit te worden. Laat staan waarde uit te halen. Combineer dit met Data Scientists die 80% van hun tijd bezig zijn met het voorbereiden van de data en slechts nog 20% over hebben om daadwerkelijk de data te analyseren. Daarom heeft Oracle deze schil om Hadoop bedacht. Met deze schil wordt het mogelijk om data in Hadoop makkelijk en snel te visialiseren. Nu kunnen Data Scientists 20% van hun tijd besteden aan het voorbereiden van de data en 80% aan het daadwerkelijk analyseren van de data. The Visual Face of Hadoop… Why? There is a lot of (unstructured) data in your data lake and it is nog that easy to get value from all this data. Combine this with data scientist struggling 80% of their time to prepare the data they want to analyse and only 20% actually analyse this data. That’s why Oracle came up with this layer on top of Hadoop which makes it possible to visualise data quickly Now data scientist can use 20% of their time preparing the data and 80% to actually analyse the data.
  9. Oracle Big Data Discovery offers true technical innovation on Hadoop, natively leveraging the power of distributed storage and computing, across servers (or nodes), to process massive amounts of information without having to move it around. Studio is the unique web-based user interface that makes it easy for anyone to find, explore, transform, discover and share data. Dgraph server is the hybrid search-analytic database that allows users to operate on in-memory data sets for interactive performance. Data processing uses Apache Spark to profile, sample, transform and enrich massive amounts of information across all the data nodes in the Hadoop cluster. Big Data Discovery is a core component in Oracle’s overall Big Data management and analytics strategy, enabling customers to: Use Oracle R Advanced Analytics for Hadoop, for better predictive analytics Leverage Oracle Big Data SQL to query the data in HDFS without moving it at all Implement solutions on Oracle engineered systems, enabling rapid application deployment, optimized performance benefits and lower total cost of ownership
  10. Vind snel relevante data (sets) Verken de data in jouw Data Lake Transformeer en verrijk de data om het nog beter te maken Ontdek nieuwe inzichten Deel deze inzichten met jouw teams Find relevant data quickly Explore the data in your data lake Transform and enrich the data to make it more useful Discover new insights in the data Share the new insights with teams Let’s go and do a demo!