SlideShare a Scribd company logo
Linda Terlouw (linda.terlouw@icris.nl)
Tutorial
Data Science
Data Science is een vakgebied dat zich richt op het
verzamelen, organiseren en analyseren van (grote)
data sets om patronen te ontdekken.
Hadden we niet al BI?
Data Science is niet nieuw. De populariteit ervan neemt wel toe door
ontwikkelingen die de opslag en verwerking van grote datasets gemak-
kelijker maken (Big Data). Hieronder vallen bijv. NoSQL data stores en
in-memory databases.
De data scientist bestaat niet. Mensen werkzaam in data
science hebben verschillende achtergronden.
Data Analytics combineert technieken uit o.a.
de volgende vakgebieden: Statistiek, Opera-
tional research en Software engineering.
Google introduceerde PageRank; een algoritme dat keek naar “het belang” van webpagina’s.
Search engines als AltaVista gebruikten traditionele information retrieval-technieken.
Kaggle heeft een wedstrijd uitgezet om met behulp van
data science meer “te zien” dan artsen voor het voor-
komen en genezen van oogafwijkingen bij diabetici.
Met behulp van data science
kun je weten dat de klant ver-
trekt voordat hij het zelf weet.
privacy?
Tom M. Mitchell: “A computer program is said to learn
from experience E with respect to some class of tasks T
and performance measure P, if its performance at tasks in
T, as measured by P, improves with experience E”.
Machine Learning?
Overfitting
versus
underfitting
Enkele aanpakken in data science zijn:
- classificatie
- regressie
- clustering
- similarity matching
- association rule discovery
- graafanalyse
Dit is geen complete lijst!
Classificatie
voorspelt een niet-numerieke waarde
Voorbeeld
het onderscheiden van normale
en frauduleuze transacties voor
het automatisch blokkeren van
credit cards
Regressie
voorspelt een numerieke waarde
Voorbeeld
het voorspellen van het aantal
flesjes bier dat verkocht wordt
aan de hand van prijs en het
weer
Clustering
ontdekt groepen van gelijksoortige dingen
Voorbeeld
het segmenteren van klant-
groepen met verschillende
behoeftes
SIMILARITY MATCHING
voorspelt gelijksoortige producten
Voorbeeld
het voorspellen van een Net-
flix-serie op basis van eerder
kijkgedrag
Association rule discovery
bepaalt gelijkheid van dingen op basis van transacties
Voorbeeld
het bieden van gepersonaliseerde aan-
biedingen op basis van producten die
al in de kar liggen
Graafanalyse
analyseert netwerken van mensen of dingen
Voorbeeld
het vinden van fraudenetwerken
in de zorgsector
In Nederland is het nieuwe vakgebied Process Mining ontwikkeld.
Dit is Data Science toegepast op bedrijfsprocessen.
Business
Understanding
Data
Understanding
Data
Preparation
Modeling
Evaluation
Deployment
Het data science-proces is geen rechte lijn van A naar B.
Demo
Process mining as a Service: www.processminingfactory.com
www.icris.nl
linda.terlouw@icris.nl
icris
measure facts, treasure knowledge
Ngi data science

More Related Content

Viewers also liked

Social Media Network Analysis @ Independer.nl
Social Media Network Analysis @ Independer.nlSocial Media Network Analysis @ Independer.nl
Social Media Network Analysis @ Independer.nlhekman
 
Improving Customer Experience using Analytics | MIE 2015
Improving Customer Experience using Analytics | MIE 2015Improving Customer Experience using Analytics | MIE 2015
Improving Customer Experience using Analytics | MIE 2015
Kevin Anderson
 
De Impactvolle Data Analist
De Impactvolle Data AnalistDe Impactvolle Data Analist
De Impactvolle Data Analist
Kevin Anderson
 
Göteborg university(condensed)
Göteborg university(condensed)Göteborg university(condensed)
Göteborg university(condensed)
Zenodia Charpy
 
Finance in a digital world
Finance in a digital worldFinance in a digital world
Finance in a digital world
Faisal Shiraz Merchant
 
Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)
Richard Claassens CIPPE
 
뉴스룸의 변화와 전망 - hackable newsroom
뉴스룸의 변화와 전망 - hackable newsroom뉴스룸의 변화와 전망 - hackable newsroom
뉴스룸의 변화와 전망 - hackable newsroom
Sungkyu Lee
 
Cómo eliminar el miedo.
Cómo eliminar el miedo.Cómo eliminar el miedo.
Cómo eliminar el miedo.
Alex Yanza Landi
 
從敏捷思考讀書會創業與人生
從敏捷思考讀書會創業與人生從敏捷思考讀書會創業與人生
從敏捷思考讀書會創業與人生
MaoYang Chien
 
Facebook advertising stats and trends
Facebook advertising stats and trendsFacebook advertising stats and trends
Facebook advertising stats and trends
Seavus Products
 
The Impacts of Missed Requirements in Agile Delivery
The Impacts of Missed Requirements in Agile DeliveryThe Impacts of Missed Requirements in Agile Delivery
The Impacts of Missed Requirements in Agile Delivery
Blueprint Software Systems
 
67 biotechnology2008 3
67 biotechnology2008 367 biotechnology2008 3
67 biotechnology2008 3sbarkanic
 
20161202 成大演講 自由軟體運動與社群專案
20161202 成大演講 自由軟體運動與社群專案20161202 成大演講 自由軟體運動與社群專案
20161202 成大演講 自由軟體運動與社群專案
政嘉 曾
 
Lake Louise (Alberta/Canada)
Lake Louise (Alberta/Canada)Lake Louise (Alberta/Canada)
Lake Louise (Alberta/Canada)
F. Ovies
 
Идеята за социална онтология и принципът на релевантността
Идеята за социална онтология и принципът на релевантносттаИдеята за социална онтология и принципът на релевантността
Идеята за социална онтология и принципът на релевантността
Nick Nickoloff
 
БібліоSPACE 2
БібліоSPACE 2БібліоSPACE 2
Cartaz, informativo sobre Matheus para escola
Cartaz, informativo sobre Matheus para escolaCartaz, informativo sobre Matheus para escola
Cartaz, informativo sobre Matheus para escola
Meri Sandra
 
20160218 sociale media in de kinderopvang
20160218 sociale media in de kinderopvang20160218 sociale media in de kinderopvang
20160218 sociale media in de kinderopvang
I Like Media
 
Top Issues Faced by Field Service Businesses & The Solution
Top Issues Faced by Field Service Businesses & The SolutionTop Issues Faced by Field Service Businesses & The Solution
Top Issues Faced by Field Service Businesses & The Solution
Fingent Corporation
 

Viewers also liked (20)

Social Media Network Analysis @ Independer.nl
Social Media Network Analysis @ Independer.nlSocial Media Network Analysis @ Independer.nl
Social Media Network Analysis @ Independer.nl
 
Improving Customer Experience using Analytics | MIE 2015
Improving Customer Experience using Analytics | MIE 2015Improving Customer Experience using Analytics | MIE 2015
Improving Customer Experience using Analytics | MIE 2015
 
De Impactvolle Data Analist
De Impactvolle Data AnalistDe Impactvolle Data Analist
De Impactvolle Data Analist
 
Göteborg university(condensed)
Göteborg university(condensed)Göteborg university(condensed)
Göteborg university(condensed)
 
Finance in a digital world
Finance in a digital worldFinance in a digital world
Finance in a digital world
 
Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)Benoeming van een functionaris voor gegevensbescherming (FG)
Benoeming van een functionaris voor gegevensbescherming (FG)
 
뉴스룸의 변화와 전망 - hackable newsroom
뉴스룸의 변화와 전망 - hackable newsroom뉴스룸의 변화와 전망 - hackable newsroom
뉴스룸의 변화와 전망 - hackable newsroom
 
Cómo eliminar el miedo.
Cómo eliminar el miedo.Cómo eliminar el miedo.
Cómo eliminar el miedo.
 
從敏捷思考讀書會創業與人生
從敏捷思考讀書會創業與人生從敏捷思考讀書會創業與人生
從敏捷思考讀書會創業與人生
 
Facebook advertising stats and trends
Facebook advertising stats and trendsFacebook advertising stats and trends
Facebook advertising stats and trends
 
The Impacts of Missed Requirements in Agile Delivery
The Impacts of Missed Requirements in Agile DeliveryThe Impacts of Missed Requirements in Agile Delivery
The Impacts of Missed Requirements in Agile Delivery
 
67 biotechnology2008 3
67 biotechnology2008 367 biotechnology2008 3
67 biotechnology2008 3
 
20161202 成大演講 自由軟體運動與社群專案
20161202 成大演講 自由軟體運動與社群專案20161202 成大演講 自由軟體運動與社群專案
20161202 成大演講 自由軟體運動與社群專案
 
Lake Louise (Alberta/Canada)
Lake Louise (Alberta/Canada)Lake Louise (Alberta/Canada)
Lake Louise (Alberta/Canada)
 
Идеята за социална онтология и принципът на релевантността
Идеята за социална онтология и принципът на релевантносттаИдеята за социална онтология и принципът на релевантността
Идеята за социална онтология и принципът на релевантността
 
БібліоSPACE 2
БібліоSPACE 2БібліоSPACE 2
БібліоSPACE 2
 
ZDG_CMO_folder_online_4_1
ZDG_CMO_folder_online_4_1ZDG_CMO_folder_online_4_1
ZDG_CMO_folder_online_4_1
 
Cartaz, informativo sobre Matheus para escola
Cartaz, informativo sobre Matheus para escolaCartaz, informativo sobre Matheus para escola
Cartaz, informativo sobre Matheus para escola
 
20160218 sociale media in de kinderopvang
20160218 sociale media in de kinderopvang20160218 sociale media in de kinderopvang
20160218 sociale media in de kinderopvang
 
Top Issues Faced by Field Service Businesses & The Solution
Top Issues Faced by Field Service Businesses & The SolutionTop Issues Faced by Field Service Businesses & The Solution
Top Issues Faced by Field Service Businesses & The Solution
 

Similar to Ngi data science

Whitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueWhitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueAnderson MacGyver
 
Fex 190912 - presentatie - kansen en mogelijkheden met data science door jo...
Fex   190912 - presentatie - kansen en mogelijkheden met data science door jo...Fex   190912 - presentatie - kansen en mogelijkheden met data science door jo...
Fex 190912 - presentatie - kansen en mogelijkheden met data science door jo...
Flevum
 
White paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply ChainWhite paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply Chain
Marcel Merkx
 
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)
FourPoints Business Intelligence
 
Marketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - IntroMarketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - Intro
FourPoints Business Intelligence
 
Marketing intelligence voor managers – data science proces
Marketing intelligence voor managers –  data science proces Marketing intelligence voor managers –  data science proces
Marketing intelligence voor managers – data science proces
FourPoints Business Intelligence
 
“Information driven added value” Internet of Things
“Information driven added value” Internet of Things“Information driven added value” Internet of Things
“Information driven added value” Internet of Things
Rick Bouter
 
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdfMarketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
OrangeValley
 
Augmented data discovery
Augmented data discoveryAugmented data discovery
Augmented data discovery
Jarne Vandendriessche
 
Trends voor data analyse 2014
Trends voor data analyse 2014Trends voor data analyse 2014
Trends voor data analyse 2014Johan Blomme
 
Business analysis: ontwikkeling, toepassing, ervaringen
Business analysis: ontwikkeling, toepassing, ervaringenBusiness analysis: ontwikkeling, toepassing, ervaringen
Business analysis: ontwikkeling, toepassing, ervaringen
SKA
 
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA
 
Presentatie Knowledge Graphs
Presentatie Knowledge Graphs Presentatie Knowledge Graphs
Presentatie Knowledge Graphs
EloseSioen
 
marketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodigmarketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodig
FourPoints Business Intelligence
 
Oscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieOscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieMedia Perspectives
 
Software for big data - setting the scene
Software for big data -   setting the sceneSoftware for big data -   setting the scene
Software for big data - setting the scene
Jurjen Helmus
 
SolvX whitepaper - voorspellende modellen
SolvX whitepaper - voorspellende modellenSolvX whitepaper - voorspellende modellen
SolvX whitepaper - voorspellende modellen
SolvX
 
Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis
FourPoints Business Intelligence
 
Presentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doenPresentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doen
Cmotions
 

Similar to Ngi data science (20)

Whitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-valueWhitepaper-Refining-the-new-oil-turning-data-into-value
Whitepaper-Refining-the-new-oil-turning-data-into-value
 
Fex 190912 - presentatie - kansen en mogelijkheden met data science door jo...
Fex   190912 - presentatie - kansen en mogelijkheden met data science door jo...Fex   190912 - presentatie - kansen en mogelijkheden met data science door jo...
Fex 190912 - presentatie - kansen en mogelijkheden met data science door jo...
 
White paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply ChainWhite paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply Chain
 
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)
 
Marketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - IntroMarketing intelligence voor managers – data science - Intro
Marketing intelligence voor managers – data science - Intro
 
Marketing intelligence voor managers – data science proces
Marketing intelligence voor managers –  data science proces Marketing intelligence voor managers –  data science proces
Marketing intelligence voor managers – data science proces
 
“Information driven added value” Internet of Things
“Information driven added value” Internet of Things“Information driven added value” Internet of Things
“Information driven added value” Internet of Things
 
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdfMarketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
 
Augmented data discovery
Augmented data discoveryAugmented data discovery
Augmented data discovery
 
Trends voor data analyse 2014
Trends voor data analyse 2014Trends voor data analyse 2014
Trends voor data analyse 2014
 
Business analysis: ontwikkeling, toepassing, ervaringen
Business analysis: ontwikkeling, toepassing, ervaringenBusiness analysis: ontwikkeling, toepassing, ervaringen
Business analysis: ontwikkeling, toepassing, ervaringen
 
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data Governance
 
Presentatie Knowledge Graphs
Presentatie Knowledge Graphs Presentatie Knowledge Graphs
Presentatie Knowledge Graphs
 
marketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodigmarketing intelligence voor managers - big data heeft data science nodig
marketing intelligence voor managers - big data heeft data science nodig
 
Oscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieOscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data Visualisatie
 
Software for big data - setting the scene
Software for big data -   setting the sceneSoftware for big data -   setting the scene
Software for big data - setting the scene
 
SolvX whitepaper - voorspellende modellen
SolvX whitepaper - voorspellende modellenSolvX whitepaper - voorspellende modellen
SolvX whitepaper - voorspellende modellen
 
Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis Marketing intelligence voor managers – data science exploratory analysis
Marketing intelligence voor managers – data science exploratory analysis
 
datadriven-education-3.0-coney
datadriven-education-3.0-coneydatadriven-education-3.0-coney
datadriven-education-3.0-coney
 
Presentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doenPresentatie Big data & IoT van hype naar doen
Presentatie Big data & IoT van hype naar doen
 

More from terlouw

Slides panel IC3K 2017 Madeira
Slides panel IC3K 2017 MadeiraSlides panel IC3K 2017 Madeira
Slides panel IC3K 2017 Madeira
terlouw
 
Tutorial Mining Enterprise Ontologies
Tutorial Mining Enterprise OntologiesTutorial Mining Enterprise Ontologies
Tutorial Mining Enterprise Ontologies
terlouw
 
Slides of EEWC 2017
Slides of EEWC 2017Slides of EEWC 2017
Slides of EEWC 2017
terlouw
 
Icris VISI process miner
Icris VISI process minerIcris VISI process miner
Icris VISI process miner
terlouw
 
Poster data science
Poster data sciencePoster data science
Poster data scienceterlouw
 
Poster process mining
Poster process miningPoster process mining
Poster process miningterlouw
 
Agile SOA (Dutch)
Agile SOA (Dutch)Agile SOA (Dutch)
Agile SOA (Dutch)terlouw
 
Workshop on Service Identification Techniques
Workshop on Service Identification TechniquesWorkshop on Service Identification Techniques
Workshop on Service Identification Techniques
terlouw
 

More from terlouw (8)

Slides panel IC3K 2017 Madeira
Slides panel IC3K 2017 MadeiraSlides panel IC3K 2017 Madeira
Slides panel IC3K 2017 Madeira
 
Tutorial Mining Enterprise Ontologies
Tutorial Mining Enterprise OntologiesTutorial Mining Enterprise Ontologies
Tutorial Mining Enterprise Ontologies
 
Slides of EEWC 2017
Slides of EEWC 2017Slides of EEWC 2017
Slides of EEWC 2017
 
Icris VISI process miner
Icris VISI process minerIcris VISI process miner
Icris VISI process miner
 
Poster data science
Poster data sciencePoster data science
Poster data science
 
Poster process mining
Poster process miningPoster process mining
Poster process mining
 
Agile SOA (Dutch)
Agile SOA (Dutch)Agile SOA (Dutch)
Agile SOA (Dutch)
 
Workshop on Service Identification Techniques
Workshop on Service Identification TechniquesWorkshop on Service Identification Techniques
Workshop on Service Identification Techniques
 

Ngi data science