SlideShare a Scribd company logo
Linda Terlouw (linda.terlouw@icris.nl)
Tutorial
Data Science
Data Science is een vakgebied dat zich richt op het
verzamelen, organiseren en analyseren van (grote)
data sets om patronen te ontdekken.
Hadden we niet al BI?
Data Science is niet nieuw. De populariteit ervan neemt wel toe door
ontwikkelingen die de opslag en verwerking van grote datasets gemak-
kelijker maken (Big Data). Hieronder vallen bijv. NoSQL data stores en
in-memory databases.
De data scientist bestaat niet. Mensen werkzaam in data
science hebben verschillende achtergronden.
Data Analytics combineert technieken uit o.a.
de volgende vakgebieden: Statistiek, Opera-
tional research en Software engineering.
Google introduceerde PageRank; een algoritme dat keek naar “het belang” van webpagina’s.
Search engines als AltaVista gebruikten traditionele information retrieval-technieken.
Kaggle heeft een wedstrijd uitgezet om met behulp van
data science meer “te zien” dan artsen voor het voor-
komen en genezen van oogafwijkingen bij diabetici.
Met behulp van data science
kun je weten dat de klant ver-
trekt voordat hij het zelf weet.
privacy?
Tom M. Mitchell: “A computer program is said to learn
from experience E with respect to some class of tasks T
and performance measure P, if its performance at tasks in
T, as measured by P, improves with experience E”.
Machine Learning?
Overfitting
versus
underfitting
Enkele aanpakken in data science zijn:
- classificatie
- regressie
- clustering
- similarity matching
- association rule discovery
- graafanalyse
Dit is geen complete lijst!
Classificatie
voorspelt een niet-numerieke waarde
Voorbeeld
het onderscheiden van normale
en frauduleuze transacties voor
het automatisch blokkeren van
credit cards
Regressie
voorspelt een numerieke waarde
Voorbeeld
het voorspellen van het aantal
flesjes bier dat verkocht wordt
aan de hand van prijs en het
weer
Clustering
ontdekt groepen van gelijksoortige dingen
Voorbeeld
het segmenteren van klant-
groepen met verschillende
behoeftes
SIMILARITY MATCHING
voorspelt gelijksoortige producten
Voorbeeld
het voorspellen van een Net-
flix-serie op basis van eerder
kijkgedrag
Association rule discovery
bepaalt gelijkheid van dingen op basis van transacties
Voorbeeld
het bieden van gepersonaliseerde aan-
biedingen op basis van producten die
al in de kar liggen
Graafanalyse
analyseert netwerken van mensen of dingen
Voorbeeld
het vinden van fraudenetwerken
in de zorgsector
In Nederland is het nieuwe vakgebied Process Mining ontwikkeld.
Dit is Data Science toegepast op bedrijfsprocessen.
Business
Understanding
Data
Understanding
Data
Preparation
Modeling
Evaluation
Deployment
Het data science-proces is geen rechte lijn van A naar B.
Demo
Process mining as a Service: www.processminingfactory.com
www.icris.nl
linda.terlouw@icris.nl
icris
measure facts, treasure knowledge

More Related Content

Viewers also liked

Social Media Network Analysis @ Independer.nl
Social Media Network Analysis @ Independer.nlSocial Media Network Analysis @ Independer.nl
Social Media Network Analysis @ Independer.nlhekman
 
Improving Customer Experience using Analytics | MIE 2015
Improving Customer Experience using Analytics | MIE 2015Improving Customer Experience using Analytics | MIE 2015
Improving Customer Experience using Analytics | MIE 2015
Kevin Anderson
 
De Impactvolle Data Analist
De Impactvolle Data AnalistDe Impactvolle Data Analist
De Impactvolle Data Analist
Kevin Anderson
 
Visie op de toekomst van informatie
Visie op de toekomst van informatieVisie op de toekomst van informatie
Visie op de toekomst van informatie
Danny Greefhorst
 
Göteborg university(condensed)
Göteborg university(condensed)Göteborg university(condensed)
Göteborg university(condensed)
Zenodia Charpy
 
Finance in a digital world
Finance in a digital worldFinance in a digital world
Finance in a digital world
Faisal Shiraz Merchant
 
Agile Data Science 2.0 - Big Data Science Meetup
Agile Data Science 2.0 - Big Data Science MeetupAgile Data Science 2.0 - Big Data Science Meetup
Agile Data Science 2.0 - Big Data Science Meetup
Russell Jurney
 
Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)
Richard Claassens CIPPE
 
Privacy het nieuwe groen KNVI definitief
Privacy het nieuwe groen KNVI definitiefPrivacy het nieuwe groen KNVI definitief
Privacy het nieuwe groen KNVI definitief
Richard Claassens CIPPE
 
How to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your NicheHow to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your Niche
Leslie Samuel
 

Viewers also liked (10)

Social Media Network Analysis @ Independer.nl
Social Media Network Analysis @ Independer.nlSocial Media Network Analysis @ Independer.nl
Social Media Network Analysis @ Independer.nl
 
Improving Customer Experience using Analytics | MIE 2015
Improving Customer Experience using Analytics | MIE 2015Improving Customer Experience using Analytics | MIE 2015
Improving Customer Experience using Analytics | MIE 2015
 
De Impactvolle Data Analist
De Impactvolle Data AnalistDe Impactvolle Data Analist
De Impactvolle Data Analist
 
Visie op de toekomst van informatie
Visie op de toekomst van informatieVisie op de toekomst van informatie
Visie op de toekomst van informatie
 
Göteborg university(condensed)
Göteborg university(condensed)Göteborg university(condensed)
Göteborg university(condensed)
 
Finance in a digital world
Finance in a digital worldFinance in a digital world
Finance in a digital world
 
Agile Data Science 2.0 - Big Data Science Meetup
Agile Data Science 2.0 - Big Data Science MeetupAgile Data Science 2.0 - Big Data Science Meetup
Agile Data Science 2.0 - Big Data Science Meetup
 
Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)
 
Privacy het nieuwe groen KNVI definitief
Privacy het nieuwe groen KNVI definitiefPrivacy het nieuwe groen KNVI definitief
Privacy het nieuwe groen KNVI definitief
 
How to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your NicheHow to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your Niche
 

Similar to Tutorial Data Science

Whitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueWhitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueAnderson MacGyver
 
Fex 190912 - presentatie - kansen en mogelijkheden met data science door jo...
Fex   190912 - presentatie - kansen en mogelijkheden met data science door jo...Fex   190912 - presentatie - kansen en mogelijkheden met data science door jo...
Fex 190912 - presentatie - kansen en mogelijkheden met data science door jo...
Flevum
 
White paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply ChainWhite paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply Chain
Marcel Merkx
 
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)
FourPoints Business Intelligence
 
Marketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - IntroMarketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - Intro
FourPoints Business Intelligence
 
Marketing intelligence voor managers – data science proces
Marketing intelligence voor managers –  data science proces Marketing intelligence voor managers –  data science proces
Marketing intelligence voor managers – data science proces
FourPoints Business Intelligence
 
“Information driven added value” Internet of Things
“Information driven added value” Internet of Things“Information driven added value” Internet of Things
“Information driven added value” Internet of Things
Rick Bouter
 
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdfMarketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
OrangeValley
 
Augmented data discovery
Augmented data discoveryAugmented data discovery
Augmented data discovery
Jarne Vandendriessche
 
Trends voor data analyse 2014
Trends voor data analyse 2014Trends voor data analyse 2014
Trends voor data analyse 2014Johan Blomme
 
Business analysis: ontwikkeling, toepassing, ervaringen
Business analysis: ontwikkeling, toepassing, ervaringenBusiness analysis: ontwikkeling, toepassing, ervaringen
Business analysis: ontwikkeling, toepassing, ervaringen
SKA
 
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA
 
Presentatie Knowledge Graphs
Presentatie Knowledge Graphs Presentatie Knowledge Graphs
Presentatie Knowledge Graphs
EloseSioen
 
marketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodigmarketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodig
FourPoints Business Intelligence
 
Oscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieOscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieMedia Perspectives
 
Software for big data - setting the scene
Software for big data -   setting the sceneSoftware for big data -   setting the scene
Software for big data - setting the scene
Jurjen Helmus
 
SolvX whitepaper - voorspellende modellen
SolvX whitepaper - voorspellende modellenSolvX whitepaper - voorspellende modellen
SolvX whitepaper - voorspellende modellen
SolvX
 
Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis
FourPoints Business Intelligence
 
Presentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doenPresentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doen
Cmotions
 

Similar to Tutorial Data Science (20)

Whitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueWhitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-value
 
Fex 190912 - presentatie - kansen en mogelijkheden met data science door jo...
Fex   190912 - presentatie - kansen en mogelijkheden met data science door jo...Fex   190912 - presentatie - kansen en mogelijkheden met data science door jo...
Fex 190912 - presentatie - kansen en mogelijkheden met data science door jo...
 
White paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply ChainWhite paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply Chain
 
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)
 
Marketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - IntroMarketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - Intro
 
Marketing intelligence voor managers – data science proces
Marketing intelligence voor managers –  data science proces Marketing intelligence voor managers –  data science proces
Marketing intelligence voor managers – data science proces
 
“Information driven added value” Internet of Things
“Information driven added value” Internet of Things“Information driven added value” Internet of Things
“Information driven added value” Internet of Things
 
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdfMarketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
 
Augmented data discovery
Augmented data discoveryAugmented data discovery
Augmented data discovery
 
Trends voor data analyse 2014
Trends voor data analyse 2014Trends voor data analyse 2014
Trends voor data analyse 2014
 
Business analysis: ontwikkeling, toepassing, ervaringen
Business analysis: ontwikkeling, toepassing, ervaringenBusiness analysis: ontwikkeling, toepassing, ervaringen
Business analysis: ontwikkeling, toepassing, ervaringen
 
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data Governance
 
Presentatie Knowledge Graphs
Presentatie Knowledge Graphs Presentatie Knowledge Graphs
Presentatie Knowledge Graphs
 
marketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodigmarketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodig
 
Oscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieOscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data Visualisatie
 
Software for big data - setting the scene
Software for big data -   setting the sceneSoftware for big data -   setting the scene
Software for big data - setting the scene
 
SolvX whitepaper - voorspellende modellen
SolvX whitepaper - voorspellende modellenSolvX whitepaper - voorspellende modellen
SolvX whitepaper - voorspellende modellen
 
Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis
 
datadriven-education-3.0-coney
datadriven-education-3.0-coneydatadriven-education-3.0-coney
datadriven-education-3.0-coney
 
Presentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doenPresentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doen
 

More from terlouw

Slides panel IC3K 2017 Madeira
Slides panel IC3K 2017 MadeiraSlides panel IC3K 2017 Madeira
Slides panel IC3K 2017 Madeira
terlouw
 
Tutorial Mining Enterprise Ontologies
Tutorial Mining Enterprise OntologiesTutorial Mining Enterprise Ontologies
Tutorial Mining Enterprise Ontologies
terlouw
 
Slides of EEWC 2017
Slides of EEWC 2017Slides of EEWC 2017
Slides of EEWC 2017
terlouw
 
Icris VISI process miner
Icris VISI process minerIcris VISI process miner
Icris VISI process miner
terlouw
 
Poster data science
Poster data sciencePoster data science
Poster data scienceterlouw
 
Poster process mining
Poster process miningPoster process mining
Poster process miningterlouw
 
Agile SOA (Dutch)
Agile SOA (Dutch)Agile SOA (Dutch)
Agile SOA (Dutch)terlouw
 
Workshop on Service Identification Techniques
Workshop on Service Identification TechniquesWorkshop on Service Identification Techniques
Workshop on Service Identification Techniques
terlouw
 

More from terlouw (8)

Slides panel IC3K 2017 Madeira
Slides panel IC3K 2017 MadeiraSlides panel IC3K 2017 Madeira
Slides panel IC3K 2017 Madeira
 
Tutorial Mining Enterprise Ontologies
Tutorial Mining Enterprise OntologiesTutorial Mining Enterprise Ontologies
Tutorial Mining Enterprise Ontologies
 
Slides of EEWC 2017
Slides of EEWC 2017Slides of EEWC 2017
Slides of EEWC 2017
 
Icris VISI process miner
Icris VISI process minerIcris VISI process miner
Icris VISI process miner
 
Poster data science
Poster data sciencePoster data science
Poster data science
 
Poster process mining
Poster process miningPoster process mining
Poster process mining
 
Agile SOA (Dutch)
Agile SOA (Dutch)Agile SOA (Dutch)
Agile SOA (Dutch)
 
Workshop on Service Identification Techniques
Workshop on Service Identification TechniquesWorkshop on Service Identification Techniques
Workshop on Service Identification Techniques
 

Tutorial Data Science