SlideShare a Scribd company logo
1 of 42
Download to read offline
14 juni 2016
Hoe goed is mijn kansverwachting? –
Inleiding op “verificatie”
Jan Verkade
Verificatie: hoe goed is mijn verwachting?
“Verificatie is het achteraf vaststellen van de skill of
de waarde van de gemaakte verwachting.”
Allan Murphy (1993):
• Kwaliteit
• Waarde
• Consistentie
 We matchen de verwachtingen met bijbehorende
waarnemingen
 De aldus gevormde verificatie-”paren” worden
samengevat (numeriek, grafisch)
Redenen voor verificatie
1. Bestuurlijk/management:
Onderbouwen van de rationale (bijv. voor maken van verwachtingen, voor investeren in
nieuwe techniek, nieuw model etc)
2. Wetenschappelijk:
Waar kan ik verwachtingen verbeteren?
3. Economisch nut
Wat is de waarde voor de eindgebruiker?
(Jolliffe and Stephenson, 2012; Brier & Allen, 1951; Stanski et al., 1989)
Kwaliteit versus waarde van verwachtingen
• Kwaliteit: grote overeenkomst tussen verwachtingen en waarnemingen
• Waarde: eindgebruiker kan betere beslissing nemen
Klassiek voorbeeld: verwachting van zonnige dag boven de Sahara
• Kwaliteit?
• Waarde?
http://upload.wikimedia.org/wikipedia/commons/3/35/Dunes.jpg
Source: Bertrand Devouard / Florence Devouard
Welke eisen stel ik aan een deterministische verwachting?
Welke eisen stel ik aan een kansverwachting?
Welke eisen stel ik aan een kansverwachting?
• Reliability: hoe goed komen kansen overeen met waargenomen relatieve frequenties?
• Sharpness: neiging tot maken van kansverwachtingen van 0% en 100%
(er zijn er meer: zie Murphy, 1993)
Reliability
1. Helft van de waarnemingen bóven de mediaan; helft erónder
2. 50% van de waarnemingen tussen Q25 en Q75
3. 10% van de waarnemingen bóven Q90; 10% ónder Q10
4. 1% van de waarnemingen bóven Q99; 1% ónder Q1
Etc.
Sharpness
• “Scherpte”: maat voor breedte/nauwte van verwachtingsinterval
• Wat heeft de voorkeur? Onder welke voorwaarde(n)?
Sharpness
-10 -5 0 5 10
0.00.20.40.60.8 Scherpte
dichtheid
-10 -5 0 5 10
0.00.20.40.60.81.0
Scherpte
overschrijdingskans
Verification: (possible) approach
• Qualitative: “Eyeball verification”: take a look at forecasts and observations
• Summary metrics:
• Graphical verification measures
• Numerical: metrics and skill scores
Visual inspection: hydrographs
• Example: water levels at Kampen
• Interpretation:
• T0 (thick red line) always on same location
• Blue = observation
• Black/grey= forecast
• Animation:
• Time progresses; figure “moves” to the
left
• Previous T0s: thin red lines
• Forecasts become lighter with age
Visual inspection: hydrographs
• What do you notice? Think of…
• Initial conditions
• Bias
• Spread
• Reliability
Kampen: https://youtu.be/Px_zQsyQJhk
Ramspolbrug: https://youtu.be/R-7klljaOlo
Nijkerkersluis West: https://youtu.be/p8qBDQMj6Bo
Visual inspection: scatters (forecast v observation)
• All available fcst, obs pairs in a single figure
• Separate plots for separate leadtimes
• Horizontal axis: forecast
Vertical axis: observation
• Where would we like to see the points?
• Ensemble: multiple forecasts for every
observation
• Lot of points are plotted on top of one another
• transparency helps to identify this
• complicates interpretation nonetheless
Visual inspection: scatters (ensemble mean v observation)
• What do you notice?
Visual inspection: scatters (‘error’ versus observation)
• What do you notice?
• Can these forecasts be bias-corrected?
Verification: (possible) approach
• Qualitative: “Eyeball verification”: take a look at forecasts and observations
• Summary metrics:
• Graphical verification measures
• Numerical: metrics and skill scores
Reliability plots
• Reliability: correspondence of predicted probabilities with observed relative frequencies
• Graphical measure: reliability plots
• Horizontal axis: event probabilities
• Vertical axis: observed relative frequencies
• Important! How many verification pairs were used to
determine the points on the graph?
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
Forecast probability, yi
Observedrelativefrequency,o1
No skill
0.560
0.034
0.025
0.017
0.013
0.015
0.012
0.013
0.018
0.032
0.261
Flooding yes/no, 1-hour forecast
No resolution
Exercise: reliability plot
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
ObservedrelativefrequencyF[-]
Probability P [-]
Reliability plot
Data: “probability of precipitation”
• Daily precipitation over Tampere, Finland
• Categorical forecasts for each day in 2003:
• Cat0: precipitation <= 0.2mm
• Cat1: 0.3mm <= precipitation <= 4.4mm
• Cat2: precipitation >= 4.5mm
• 24- and 48-hour forecasts
• Observations in [mm]
• http://www.cawcr.gov.au/projects/verification/POP3/POP3.html
Exercise: reliability plot
• Event of interest: ‘cat0: precipitation 0.2mm or less’
• Everybody determines the location of a single plot position
• … and fills out one row in below table
P #fcst #obs=1|fcst=P F
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Category 0 precipitation ≤ 0.2 mm
Rank histograms (“Talagrand diagrams”)
Rank histograms (“Talagrand diagrams”)
• Here, we are interested in forecast quality at the 7 day / 168h lead time
• We look at multiple forecasts for which we have observations available
• Key: record between which ensemble members the observation has occurred
7 days
forecast 1
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
Talagrand diagram
forecast 3
forecast 4
forecast 2
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
Talagrand diagram
Verification: (possible) approach
• Qualitative: “Eyeball verification”: take a look at forecasts and observations
• Summary metrics:
• Graphical verification measures
• Numerical: metrics and skill scores
Brier’s probability score
• Average squared error of a probability forecast
• Example: P = .80
• Event occurs (1) or does not occur (0)
• Non-occurrence: (.8 – 0)^2 = .64
• Occurrence: (.8 – 1)^2 = .04
• Do this for every forecast, then average:
• Best possible score: 0
Worst possible score: 1
 
2
1
1
PS
N
i i
i
f o
N 
 
Scores v skill
14 juni 2016
“Scores” versus “Skill”: De tornado’s van Finley
Observation
Forecast Tornado No tornado Total
Tornado 28 72 100
No tornado 23 2680 2703
Total 51 2752 2803
Scores en “skill”
• Finley’s tornadoverwachtingen: “96.6% accuraat”
• Critici: bij standaardverwachting “geen tornado”: 98.1% accuraat
• Kwaliteit t.o.v. een baseline is belangrijk
• Best mogelijke skill score: 1
• Skill van je verwachting gelijk aan de baseline: skill = 0
• Skill van je verwachting slechter dan de baseline: skill < 0
• Geval van Finley: skill = (96.6 – 98.1) / (100 – 98.1) = -0.79
forecast score - baseline score
skill score =
perfecte forecast score - baseline score
De “contingency table” en afgeleide metrics
14 juni 2016
Metrics / contingency table
Hits 
Quiets 
Misses 
False alarms 
Metrics / contingency table
• Sommige metrics zijn gebaseerd op “contingency tables”
16 juni 2016
Observation
Forecast Flood No flood
Flood Hit False alarms
No flood Miss Quiet
De “contingency table” en kansverwachtingen
• Bij gebruik i.c.m. kansverwachtingen: “conversie” naar binaire verwachtingen door criterium toe
te passen
• In essentie beschouw je dan de kwaliteit van een beslissing
• Voorbeeld: ik waarschuw als de kans op tornado >= 60%
P(tornado) = 50%  geen waarschuwing
P(tornado) = 65%  wél waarschuwing
• Voor elk kanscriterium kun je dan een contingency table maken
Observation
Forecast Flood No flood Total
Flood Hit False alarm Σ forecast events
No flood Miss Quiet Σ forecast non-events
Total Σ events Σ non-events Σ pairs
De “contingency table”: metrics
Fractie “juiste” verwachtingen
Verhouding tussen verwachtte en waargenomen events
Fractie onterecht aangekondigde events
Fractie events die correct aangekondigd waren
%non-events waar vooraf wél voor gewaarschuwd was
hits
hit rate =
observed events


false alarms
false alarm rate =
observed non-events




false alarms
false alarm ratio =
forecasted events


forecasted events
bias score =
observed events
 

hits quiets
accuracy =
pairs
Beschikbare verificatie-software
14 juni 2016
Supplemental materials: software
• Verification package in R (UCAR) + vignette
• EVS: Ensemble Verification System (NOAA-NWS-OHD)
• MET: Model Evaluation Tools (UCAR)
• verif: Python-based forecast verification (UBC) (characteristics not yet included in below table)
characteristic R EVS MET
deterministic forecasts yes yes yes
probabilistic forecasts yes yes yes
open source yes yes yes
ensemble inputs no yes yes
spatially gridded input no no yes
GUI no yes no
Delft-FEWS-PI as input no yes no
command line yes yes yes
Afronding
14 juni 2016
One-day course on Probabilistic Forecasting
Topics:
• Introduction to uncertainty, risk and probability
• Techniques for estimating predictive hydrological uncertainty:
ensembles and post-processing
• Verification: how good is my (probabilistic) forecast?
• Forecasting applications: (i) storm surge forecasting for the North
Sea coast; (ii) fluvial forecasting in Rhine, Meuse and the EFAS
system
• Serious game: making forecast sensitive decisions
• Using probabilistic forecasts in operational practice.
• Aansluitend op Delft-FEWS gebruikersdagen: vrijdag 28 oktober
2016
• Course fee: €565
Jan Verkade
jan.verkade@deltares.nl, +31 6 5161 6107
Dank voor uw aandacht!

More Related Content

Viewers also liked

05 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturing RWZI Garmerwolde met RTC-...
05 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturing RWZI Garmerwolde met RTC-...05 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturing RWZI Garmerwolde met RTC-...
05 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturing RWZI Garmerwolde met RTC-...Deltares
 
15 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Config Review - Marc van Dijk & K...
15 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Config Review - Marc van Dijk & K...15 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Config Review - Marc van Dijk & K...
15 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Config Review - Marc van Dijk & K...Deltares
 
02 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie - Dave de Koning & Ol...
02 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie - Dave de Koning & Ol...02 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie - Dave de Koning & Ol...
02 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie - Dave de Koning & Ol...Deltares
 
13 DSD-NL 2016 - Delft-FEWS Gebruikersdag - BOS Delfland - Toon Engelberts & ...
13 DSD-NL 2016 - Delft-FEWS Gebruikersdag - BOS Delfland - Toon Engelberts & ...13 DSD-NL 2016 - Delft-FEWS Gebruikersdag - BOS Delfland - Toon Engelberts & ...
13 DSD-NL 2016 - Delft-FEWS Gebruikersdag - BOS Delfland - Toon Engelberts & ...Deltares
 
01 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Welkom - Simone van Schijndel, De...
01 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Welkom - Simone van Schijndel, De...01 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Welkom - Simone van Schijndel, De...
01 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Welkom - Simone van Schijndel, De...Deltares
 
09 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie parallele sessies - G...
09 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie parallele sessies - G...09 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie parallele sessies - G...
09 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie parallele sessies - G...Deltares
 
11 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Single Point Of Configuration - E...
11 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Single Point Of Configuration - E...11 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Single Point Of Configuration - E...
11 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Single Point Of Configuration - E...Deltares
 
12 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ins en Outs Delft-FEWS - Marc Phi...
12 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ins en Outs Delft-FEWS - Marc Phi...12 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ins en Outs Delft-FEWS - Marc Phi...
12 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ins en Outs Delft-FEWS - Marc Phi...Deltares
 
06 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturen op energie - Chris Smit, H...
06 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturen op energie - Chris Smit, H...06 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturen op energie - Chris Smit, H...
06 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturen op energie - Chris Smit, H...Deltares
 
04 DSD-NL 2016 - Delft-FEWS Gebruikersdag - 2016 Digitale Delta - Arnold Lobb...
04 DSD-NL 2016 - Delft-FEWS Gebruikersdag - 2016 Digitale Delta - Arnold Lobb...04 DSD-NL 2016 - Delft-FEWS Gebruikersdag - 2016 Digitale Delta - Arnold Lobb...
04 DSD-NL 2016 - Delft-FEWS Gebruikersdag - 2016 Digitale Delta - Arnold Lobb...Deltares
 
10 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ontsluiting van data via Delft-FE...
10 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ontsluiting van data via Delft-FE...10 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ontsluiting van data via Delft-FE...
10 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ontsluiting van data via Delft-FE...Deltares
 
07 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Operationele applicatie zwemveili...
07 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Operationele applicatie zwemveili...07 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Operationele applicatie zwemveili...
07 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Operationele applicatie zwemveili...Deltares
 
Water werkboek met water thema werkbladen van schoolgoochelaar en buikspreker...
Water werkboek met water thema werkbladen van schoolgoochelaar en buikspreker...Water werkboek met water thema werkbladen van schoolgoochelaar en buikspreker...
Water werkboek met water thema werkbladen van schoolgoochelaar en buikspreker...André de Boer
 

Viewers also liked (13)

05 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturing RWZI Garmerwolde met RTC-...
05 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturing RWZI Garmerwolde met RTC-...05 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturing RWZI Garmerwolde met RTC-...
05 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturing RWZI Garmerwolde met RTC-...
 
15 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Config Review - Marc van Dijk & K...
15 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Config Review - Marc van Dijk & K...15 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Config Review - Marc van Dijk & K...
15 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Config Review - Marc van Dijk & K...
 
02 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie - Dave de Koning & Ol...
02 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie - Dave de Koning & Ol...02 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie - Dave de Koning & Ol...
02 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie - Dave de Koning & Ol...
 
13 DSD-NL 2016 - Delft-FEWS Gebruikersdag - BOS Delfland - Toon Engelberts & ...
13 DSD-NL 2016 - Delft-FEWS Gebruikersdag - BOS Delfland - Toon Engelberts & ...13 DSD-NL 2016 - Delft-FEWS Gebruikersdag - BOS Delfland - Toon Engelberts & ...
13 DSD-NL 2016 - Delft-FEWS Gebruikersdag - BOS Delfland - Toon Engelberts & ...
 
01 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Welkom - Simone van Schijndel, De...
01 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Welkom - Simone van Schijndel, De...01 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Welkom - Simone van Schijndel, De...
01 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Welkom - Simone van Schijndel, De...
 
09 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie parallele sessies - G...
09 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie parallele sessies - G...09 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie parallele sessies - G...
09 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Introductie parallele sessies - G...
 
11 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Single Point Of Configuration - E...
11 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Single Point Of Configuration - E...11 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Single Point Of Configuration - E...
11 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Single Point Of Configuration - E...
 
12 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ins en Outs Delft-FEWS - Marc Phi...
12 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ins en Outs Delft-FEWS - Marc Phi...12 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ins en Outs Delft-FEWS - Marc Phi...
12 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ins en Outs Delft-FEWS - Marc Phi...
 
06 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturen op energie - Chris Smit, H...
06 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturen op energie - Chris Smit, H...06 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturen op energie - Chris Smit, H...
06 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Sturen op energie - Chris Smit, H...
 
04 DSD-NL 2016 - Delft-FEWS Gebruikersdag - 2016 Digitale Delta - Arnold Lobb...
04 DSD-NL 2016 - Delft-FEWS Gebruikersdag - 2016 Digitale Delta - Arnold Lobb...04 DSD-NL 2016 - Delft-FEWS Gebruikersdag - 2016 Digitale Delta - Arnold Lobb...
04 DSD-NL 2016 - Delft-FEWS Gebruikersdag - 2016 Digitale Delta - Arnold Lobb...
 
10 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ontsluiting van data via Delft-FE...
10 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ontsluiting van data via Delft-FE...10 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ontsluiting van data via Delft-FE...
10 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Ontsluiting van data via Delft-FE...
 
07 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Operationele applicatie zwemveili...
07 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Operationele applicatie zwemveili...07 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Operationele applicatie zwemveili...
07 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Operationele applicatie zwemveili...
 
Water werkboek met water thema werkbladen van schoolgoochelaar en buikspreker...
Water werkboek met water thema werkbladen van schoolgoochelaar en buikspreker...Water werkboek met water thema werkbladen van schoolgoochelaar en buikspreker...
Water werkboek met water thema werkbladen van schoolgoochelaar en buikspreker...
 

More from Deltares

DSD-NL 2023 Ontwikkeling van een bias Kalman filter - Laagfrequente correctie...
DSD-NL 2023 Ontwikkeling van een bias Kalman filter - Laagfrequente correctie...DSD-NL 2023 Ontwikkeling van een bias Kalman filter - Laagfrequente correctie...
DSD-NL 2023 Ontwikkeling van een bias Kalman filter - Laagfrequente correctie...Deltares
 
DSD-NL 2023 Hoogwatertoetsingen met D-HYDRO Suite 1D2D - Bosch
DSD-NL 2023 Hoogwatertoetsingen met D-HYDRO Suite 1D2D - BoschDSD-NL 2023 Hoogwatertoetsingen met D-HYDRO Suite 1D2D - Bosch
DSD-NL 2023 Hoogwatertoetsingen met D-HYDRO Suite 1D2D - BoschDeltares
 
DSD-NL 2023 Hydraulisch Modelinstrumentarium Aa en Maas - de Keijzer
DSD-NL 2023 Hydraulisch Modelinstrumentarium Aa en Maas - de KeijzerDSD-NL 2023 Hydraulisch Modelinstrumentarium Aa en Maas - de Keijzer
DSD-NL 2023 Hydraulisch Modelinstrumentarium Aa en Maas - de KeijzerDeltares
 
DSD-NL 2022 D-GEO Gebruikersdag - van der Meij
DSD-NL 2022 D-GEO Gebruikersdag - van der MeijDSD-NL 2022 D-GEO Gebruikersdag - van der Meij
DSD-NL 2022 D-GEO Gebruikersdag - van der MeijDeltares
 
DSD-NL 2022 Keuzes - een workshop voor modelbouwers - Wesselius - Melsen
DSD-NL 2022 Keuzes - een workshop voor modelbouwers - Wesselius - MelsenDSD-NL 2022 Keuzes - een workshop voor modelbouwers - Wesselius - Melsen
DSD-NL 2022 Keuzes - een workshop voor modelbouwers - Wesselius - MelsenDeltares
 
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff2
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff2DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff2
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff2Deltares
 
DSD-NL 2022 Waterkwaliteitsmodellering met D-HYDRO Suite 1D2D - Meijers
DSD-NL 2022 Waterkwaliteitsmodellering met D-HYDRO Suite 1D2D - MeijersDSD-NL 2022 Waterkwaliteitsmodellering met D-HYDRO Suite 1D2D - Meijers
DSD-NL 2022 Waterkwaliteitsmodellering met D-HYDRO Suite 1D2D - MeijersDeltares
 
DSD-NL 2022 D-HYDRO Suite 1D2D, stand van zaken en vooruitblik - Verhoeven - ...
DSD-NL 2022 D-HYDRO Suite 1D2D, stand van zaken en vooruitblik - Verhoeven - ...DSD-NL 2022 D-HYDRO Suite 1D2D, stand van zaken en vooruitblik - Verhoeven - ...
DSD-NL 2022 D-HYDRO Suite 1D2D, stand van zaken en vooruitblik - Verhoeven - ...Deltares
 
DSD-NL 2022 Highlights van de zesde-generatie RWS modelschematisaties - Spruyt
DSD-NL 2022 Highlights van de zesde-generatie RWS modelschematisaties - SpruytDSD-NL 2022 Highlights van de zesde-generatie RWS modelschematisaties - Spruyt
DSD-NL 2022 Highlights van de zesde-generatie RWS modelschematisaties - SpruytDeltares
 
DSD-NL 2022 Proactief watermanagement systeem van Bangkok - Hutten
DSD-NL 2022 Proactief watermanagement systeem van Bangkok - HuttenDSD-NL 2022 Proactief watermanagement systeem van Bangkok - Hutten
DSD-NL 2022 Proactief watermanagement systeem van Bangkok - HuttenDeltares
 
DSD-NL 2022 Toetsing op wateroverlast voor de Barneveldse en Lunterse Beek - ...
DSD-NL 2022 Toetsing op wateroverlast voor de Barneveldse en Lunterse Beek - ...DSD-NL 2022 Toetsing op wateroverlast voor de Barneveldse en Lunterse Beek - ...
DSD-NL 2022 Toetsing op wateroverlast voor de Barneveldse en Lunterse Beek - ...Deltares
 
DSD-NL 2022 Overstromingsberekeningen met D-HYDRO Suite 1D2D - de Lange
DSD-NL 2022 Overstromingsberekeningen met D-HYDRO Suite 1D2D - de LangeDSD-NL 2022 Overstromingsberekeningen met D-HYDRO Suite 1D2D - de Lange
DSD-NL 2022 Overstromingsberekeningen met D-HYDRO Suite 1D2D - de LangeDeltares
 
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de GraaffDSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de GraaffDeltares
 
DSD-NL 2022 D-HYDRO Gebruikersdag - Programma - Melger
DSD-NL 2022 D-HYDRO Gebruikersdag - Programma - MelgerDSD-NL 2022 D-HYDRO Gebruikersdag - Programma - Melger
DSD-NL 2022 D-HYDRO Gebruikersdag - Programma - MelgerDeltares
 
DSD-NL 2021 Watersysteemanalyses-toetsingen - Horn, Weerts
DSD-NL 2021 Watersysteemanalyses-toetsingen - Horn, WeertsDSD-NL 2021 Watersysteemanalyses-toetsingen - Horn, Weerts
DSD-NL 2021 Watersysteemanalyses-toetsingen - Horn, WeertsDeltares
 
DSD-NL 2021 D-HyDAMO import en verificatie met D-HYDRO Suite
DSD-NL 2021 D-HyDAMO import en verificatie met D-HYDRO SuiteDSD-NL 2021 D-HyDAMO import en verificatie met D-HYDRO Suite
DSD-NL 2021 D-HyDAMO import en verificatie met D-HYDRO SuiteDeltares
 
DSD-NL 2021 Toepassing (semi-)gedistribueerde hydrologie met D-HYDRO Suite - ...
DSD-NL 2021 Toepassing (semi-)gedistribueerde hydrologie met D-HYDRO Suite - ...DSD-NL 2021 Toepassing (semi-)gedistribueerde hydrologie met D-HYDRO Suite - ...
DSD-NL 2021 Toepassing (semi-)gedistribueerde hydrologie met D-HYDRO Suite - ...Deltares
 
DSD-NL 2021 Omzetten boezemmodel WS Hunze en Aa’s van SOBEK 2 naar D-HYDRO Su...
DSD-NL 2021 Omzetten boezemmodel WS Hunze en Aa’s van SOBEK 2 naar D-HYDRO Su...DSD-NL 2021 Omzetten boezemmodel WS Hunze en Aa’s van SOBEK 2 naar D-HYDRO Su...
DSD-NL 2021 Omzetten boezemmodel WS Hunze en Aa’s van SOBEK 2 naar D-HYDRO Su...Deltares
 
DSD-NL 2021 Casus Stellendam Goeree-Overflakkee - Stigter, Coster
DSD-NL 2021 Casus Stellendam Goeree-Overflakkee - Stigter, CosterDSD-NL 2021 Casus Stellendam Goeree-Overflakkee - Stigter, Coster
DSD-NL 2021 Casus Stellendam Goeree-Overflakkee - Stigter, CosterDeltares
 
DSD-NL 2021 Casus Leiderdorp - de Waard, Vlaar
DSD-NL 2021 Casus Leiderdorp - de Waard, VlaarDSD-NL 2021 Casus Leiderdorp - de Waard, Vlaar
DSD-NL 2021 Casus Leiderdorp - de Waard, VlaarDeltares
 

More from Deltares (20)

DSD-NL 2023 Ontwikkeling van een bias Kalman filter - Laagfrequente correctie...
DSD-NL 2023 Ontwikkeling van een bias Kalman filter - Laagfrequente correctie...DSD-NL 2023 Ontwikkeling van een bias Kalman filter - Laagfrequente correctie...
DSD-NL 2023 Ontwikkeling van een bias Kalman filter - Laagfrequente correctie...
 
DSD-NL 2023 Hoogwatertoetsingen met D-HYDRO Suite 1D2D - Bosch
DSD-NL 2023 Hoogwatertoetsingen met D-HYDRO Suite 1D2D - BoschDSD-NL 2023 Hoogwatertoetsingen met D-HYDRO Suite 1D2D - Bosch
DSD-NL 2023 Hoogwatertoetsingen met D-HYDRO Suite 1D2D - Bosch
 
DSD-NL 2023 Hydraulisch Modelinstrumentarium Aa en Maas - de Keijzer
DSD-NL 2023 Hydraulisch Modelinstrumentarium Aa en Maas - de KeijzerDSD-NL 2023 Hydraulisch Modelinstrumentarium Aa en Maas - de Keijzer
DSD-NL 2023 Hydraulisch Modelinstrumentarium Aa en Maas - de Keijzer
 
DSD-NL 2022 D-GEO Gebruikersdag - van der Meij
DSD-NL 2022 D-GEO Gebruikersdag - van der MeijDSD-NL 2022 D-GEO Gebruikersdag - van der Meij
DSD-NL 2022 D-GEO Gebruikersdag - van der Meij
 
DSD-NL 2022 Keuzes - een workshop voor modelbouwers - Wesselius - Melsen
DSD-NL 2022 Keuzes - een workshop voor modelbouwers - Wesselius - MelsenDSD-NL 2022 Keuzes - een workshop voor modelbouwers - Wesselius - Melsen
DSD-NL 2022 Keuzes - een workshop voor modelbouwers - Wesselius - Melsen
 
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff2
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff2DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff2
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff2
 
DSD-NL 2022 Waterkwaliteitsmodellering met D-HYDRO Suite 1D2D - Meijers
DSD-NL 2022 Waterkwaliteitsmodellering met D-HYDRO Suite 1D2D - MeijersDSD-NL 2022 Waterkwaliteitsmodellering met D-HYDRO Suite 1D2D - Meijers
DSD-NL 2022 Waterkwaliteitsmodellering met D-HYDRO Suite 1D2D - Meijers
 
DSD-NL 2022 D-HYDRO Suite 1D2D, stand van zaken en vooruitblik - Verhoeven - ...
DSD-NL 2022 D-HYDRO Suite 1D2D, stand van zaken en vooruitblik - Verhoeven - ...DSD-NL 2022 D-HYDRO Suite 1D2D, stand van zaken en vooruitblik - Verhoeven - ...
DSD-NL 2022 D-HYDRO Suite 1D2D, stand van zaken en vooruitblik - Verhoeven - ...
 
DSD-NL 2022 Highlights van de zesde-generatie RWS modelschematisaties - Spruyt
DSD-NL 2022 Highlights van de zesde-generatie RWS modelschematisaties - SpruytDSD-NL 2022 Highlights van de zesde-generatie RWS modelschematisaties - Spruyt
DSD-NL 2022 Highlights van de zesde-generatie RWS modelschematisaties - Spruyt
 
DSD-NL 2022 Proactief watermanagement systeem van Bangkok - Hutten
DSD-NL 2022 Proactief watermanagement systeem van Bangkok - HuttenDSD-NL 2022 Proactief watermanagement systeem van Bangkok - Hutten
DSD-NL 2022 Proactief watermanagement systeem van Bangkok - Hutten
 
DSD-NL 2022 Toetsing op wateroverlast voor de Barneveldse en Lunterse Beek - ...
DSD-NL 2022 Toetsing op wateroverlast voor de Barneveldse en Lunterse Beek - ...DSD-NL 2022 Toetsing op wateroverlast voor de Barneveldse en Lunterse Beek - ...
DSD-NL 2022 Toetsing op wateroverlast voor de Barneveldse en Lunterse Beek - ...
 
DSD-NL 2022 Overstromingsberekeningen met D-HYDRO Suite 1D2D - de Lange
DSD-NL 2022 Overstromingsberekeningen met D-HYDRO Suite 1D2D - de LangeDSD-NL 2022 Overstromingsberekeningen met D-HYDRO Suite 1D2D - de Lange
DSD-NL 2022 Overstromingsberekeningen met D-HYDRO Suite 1D2D - de Lange
 
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de GraaffDSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff
DSD-NL 2022 D-HYDRO modelgeneratie in Limburg - de Graaff
 
DSD-NL 2022 D-HYDRO Gebruikersdag - Programma - Melger
DSD-NL 2022 D-HYDRO Gebruikersdag - Programma - MelgerDSD-NL 2022 D-HYDRO Gebruikersdag - Programma - Melger
DSD-NL 2022 D-HYDRO Gebruikersdag - Programma - Melger
 
DSD-NL 2021 Watersysteemanalyses-toetsingen - Horn, Weerts
DSD-NL 2021 Watersysteemanalyses-toetsingen - Horn, WeertsDSD-NL 2021 Watersysteemanalyses-toetsingen - Horn, Weerts
DSD-NL 2021 Watersysteemanalyses-toetsingen - Horn, Weerts
 
DSD-NL 2021 D-HyDAMO import en verificatie met D-HYDRO Suite
DSD-NL 2021 D-HyDAMO import en verificatie met D-HYDRO SuiteDSD-NL 2021 D-HyDAMO import en verificatie met D-HYDRO Suite
DSD-NL 2021 D-HyDAMO import en verificatie met D-HYDRO Suite
 
DSD-NL 2021 Toepassing (semi-)gedistribueerde hydrologie met D-HYDRO Suite - ...
DSD-NL 2021 Toepassing (semi-)gedistribueerde hydrologie met D-HYDRO Suite - ...DSD-NL 2021 Toepassing (semi-)gedistribueerde hydrologie met D-HYDRO Suite - ...
DSD-NL 2021 Toepassing (semi-)gedistribueerde hydrologie met D-HYDRO Suite - ...
 
DSD-NL 2021 Omzetten boezemmodel WS Hunze en Aa’s van SOBEK 2 naar D-HYDRO Su...
DSD-NL 2021 Omzetten boezemmodel WS Hunze en Aa’s van SOBEK 2 naar D-HYDRO Su...DSD-NL 2021 Omzetten boezemmodel WS Hunze en Aa’s van SOBEK 2 naar D-HYDRO Su...
DSD-NL 2021 Omzetten boezemmodel WS Hunze en Aa’s van SOBEK 2 naar D-HYDRO Su...
 
DSD-NL 2021 Casus Stellendam Goeree-Overflakkee - Stigter, Coster
DSD-NL 2021 Casus Stellendam Goeree-Overflakkee - Stigter, CosterDSD-NL 2021 Casus Stellendam Goeree-Overflakkee - Stigter, Coster
DSD-NL 2021 Casus Stellendam Goeree-Overflakkee - Stigter, Coster
 
DSD-NL 2021 Casus Leiderdorp - de Waard, Vlaar
DSD-NL 2021 Casus Leiderdorp - de Waard, VlaarDSD-NL 2021 Casus Leiderdorp - de Waard, Vlaar
DSD-NL 2021 Casus Leiderdorp - de Waard, Vlaar
 

17 DSD-NL 2016 - Delft-FEWS Gebruikersdag - Hoe goed is mijn kansverwachting - Jan Verkade, Deltares

  • 1. 14 juni 2016 Hoe goed is mijn kansverwachting? – Inleiding op “verificatie” Jan Verkade
  • 2. Verificatie: hoe goed is mijn verwachting? “Verificatie is het achteraf vaststellen van de skill of de waarde van de gemaakte verwachting.” Allan Murphy (1993): • Kwaliteit • Waarde • Consistentie  We matchen de verwachtingen met bijbehorende waarnemingen  De aldus gevormde verificatie-”paren” worden samengevat (numeriek, grafisch)
  • 3. Redenen voor verificatie 1. Bestuurlijk/management: Onderbouwen van de rationale (bijv. voor maken van verwachtingen, voor investeren in nieuwe techniek, nieuw model etc) 2. Wetenschappelijk: Waar kan ik verwachtingen verbeteren? 3. Economisch nut Wat is de waarde voor de eindgebruiker? (Jolliffe and Stephenson, 2012; Brier & Allen, 1951; Stanski et al., 1989)
  • 4. Kwaliteit versus waarde van verwachtingen • Kwaliteit: grote overeenkomst tussen verwachtingen en waarnemingen • Waarde: eindgebruiker kan betere beslissing nemen Klassiek voorbeeld: verwachting van zonnige dag boven de Sahara • Kwaliteit? • Waarde? http://upload.wikimedia.org/wikipedia/commons/3/35/Dunes.jpg Source: Bertrand Devouard / Florence Devouard
  • 5. Welke eisen stel ik aan een deterministische verwachting?
  • 6. Welke eisen stel ik aan een kansverwachting?
  • 7. Welke eisen stel ik aan een kansverwachting? • Reliability: hoe goed komen kansen overeen met waargenomen relatieve frequenties? • Sharpness: neiging tot maken van kansverwachtingen van 0% en 100% (er zijn er meer: zie Murphy, 1993)
  • 8. Reliability 1. Helft van de waarnemingen bóven de mediaan; helft erónder 2. 50% van de waarnemingen tussen Q25 en Q75 3. 10% van de waarnemingen bóven Q90; 10% ónder Q10 4. 1% van de waarnemingen bóven Q99; 1% ónder Q1 Etc.
  • 9. Sharpness • “Scherpte”: maat voor breedte/nauwte van verwachtingsinterval • Wat heeft de voorkeur? Onder welke voorwaarde(n)?
  • 10. Sharpness -10 -5 0 5 10 0.00.20.40.60.8 Scherpte dichtheid -10 -5 0 5 10 0.00.20.40.60.81.0 Scherpte overschrijdingskans
  • 11. Verification: (possible) approach • Qualitative: “Eyeball verification”: take a look at forecasts and observations • Summary metrics: • Graphical verification measures • Numerical: metrics and skill scores
  • 12. Visual inspection: hydrographs • Example: water levels at Kampen • Interpretation: • T0 (thick red line) always on same location • Blue = observation • Black/grey= forecast • Animation: • Time progresses; figure “moves” to the left • Previous T0s: thin red lines • Forecasts become lighter with age
  • 13. Visual inspection: hydrographs • What do you notice? Think of… • Initial conditions • Bias • Spread • Reliability Kampen: https://youtu.be/Px_zQsyQJhk Ramspolbrug: https://youtu.be/R-7klljaOlo Nijkerkersluis West: https://youtu.be/p8qBDQMj6Bo
  • 14. Visual inspection: scatters (forecast v observation) • All available fcst, obs pairs in a single figure • Separate plots for separate leadtimes • Horizontal axis: forecast Vertical axis: observation • Where would we like to see the points? • Ensemble: multiple forecasts for every observation • Lot of points are plotted on top of one another • transparency helps to identify this • complicates interpretation nonetheless
  • 15. Visual inspection: scatters (ensemble mean v observation) • What do you notice?
  • 16. Visual inspection: scatters (‘error’ versus observation) • What do you notice? • Can these forecasts be bias-corrected?
  • 17. Verification: (possible) approach • Qualitative: “Eyeball verification”: take a look at forecasts and observations • Summary metrics: • Graphical verification measures • Numerical: metrics and skill scores
  • 18. Reliability plots • Reliability: correspondence of predicted probabilities with observed relative frequencies • Graphical measure: reliability plots • Horizontal axis: event probabilities • Vertical axis: observed relative frequencies • Important! How many verification pairs were used to determine the points on the graph? 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 Forecast probability, yi Observedrelativefrequency,o1 No skill 0.560 0.034 0.025 0.017 0.013 0.015 0.012 0.013 0.018 0.032 0.261 Flooding yes/no, 1-hour forecast No resolution
  • 19.
  • 20. Exercise: reliability plot 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 ObservedrelativefrequencyF[-] Probability P [-] Reliability plot
  • 21. Data: “probability of precipitation” • Daily precipitation over Tampere, Finland • Categorical forecasts for each day in 2003: • Cat0: precipitation <= 0.2mm • Cat1: 0.3mm <= precipitation <= 4.4mm • Cat2: precipitation >= 4.5mm • 24- and 48-hour forecasts • Observations in [mm] • http://www.cawcr.gov.au/projects/verification/POP3/POP3.html
  • 22. Exercise: reliability plot • Event of interest: ‘cat0: precipitation 0.2mm or less’ • Everybody determines the location of a single plot position • … and fills out one row in below table P #fcst #obs=1|fcst=P F 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Category 0 precipitation ≤ 0.2 mm
  • 24. Rank histograms (“Talagrand diagrams”) • Here, we are interested in forecast quality at the 7 day / 168h lead time • We look at multiple forecasts for which we have observations available • Key: record between which ensemble members the observation has occurred 7 days
  • 25. forecast 1 0 5 10 15 20 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 Talagrand diagram forecast 3 forecast 4 forecast 2
  • 26. 0 5 10 15 20 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 Talagrand diagram
  • 27.
  • 28. Verification: (possible) approach • Qualitative: “Eyeball verification”: take a look at forecasts and observations • Summary metrics: • Graphical verification measures • Numerical: metrics and skill scores
  • 29. Brier’s probability score • Average squared error of a probability forecast • Example: P = .80 • Event occurs (1) or does not occur (0) • Non-occurrence: (.8 – 0)^2 = .64 • Occurrence: (.8 – 1)^2 = .04 • Do this for every forecast, then average: • Best possible score: 0 Worst possible score: 1   2 1 1 PS N i i i f o N   
  • 30. Scores v skill 14 juni 2016
  • 31. “Scores” versus “Skill”: De tornado’s van Finley Observation Forecast Tornado No tornado Total Tornado 28 72 100 No tornado 23 2680 2703 Total 51 2752 2803
  • 32. Scores en “skill” • Finley’s tornadoverwachtingen: “96.6% accuraat” • Critici: bij standaardverwachting “geen tornado”: 98.1% accuraat • Kwaliteit t.o.v. een baseline is belangrijk • Best mogelijke skill score: 1 • Skill van je verwachting gelijk aan de baseline: skill = 0 • Skill van je verwachting slechter dan de baseline: skill < 0 • Geval van Finley: skill = (96.6 – 98.1) / (100 – 98.1) = -0.79 forecast score - baseline score skill score = perfecte forecast score - baseline score
  • 33. De “contingency table” en afgeleide metrics 14 juni 2016
  • 34. Metrics / contingency table Hits  Quiets  Misses  False alarms 
  • 35. Metrics / contingency table • Sommige metrics zijn gebaseerd op “contingency tables” 16 juni 2016 Observation Forecast Flood No flood Flood Hit False alarms No flood Miss Quiet
  • 36. De “contingency table” en kansverwachtingen • Bij gebruik i.c.m. kansverwachtingen: “conversie” naar binaire verwachtingen door criterium toe te passen • In essentie beschouw je dan de kwaliteit van een beslissing • Voorbeeld: ik waarschuw als de kans op tornado >= 60% P(tornado) = 50%  geen waarschuwing P(tornado) = 65%  wél waarschuwing • Voor elk kanscriterium kun je dan een contingency table maken Observation Forecast Flood No flood Total Flood Hit False alarm Σ forecast events No flood Miss Quiet Σ forecast non-events Total Σ events Σ non-events Σ pairs
  • 37. De “contingency table”: metrics Fractie “juiste” verwachtingen Verhouding tussen verwachtte en waargenomen events Fractie onterecht aangekondigde events Fractie events die correct aangekondigd waren %non-events waar vooraf wél voor gewaarschuwd was hits hit rate = observed events   false alarms false alarm rate = observed non-events     false alarms false alarm ratio = forecasted events   forecasted events bias score = observed events    hits quiets accuracy = pairs
  • 39. Supplemental materials: software • Verification package in R (UCAR) + vignette • EVS: Ensemble Verification System (NOAA-NWS-OHD) • MET: Model Evaluation Tools (UCAR) • verif: Python-based forecast verification (UBC) (characteristics not yet included in below table) characteristic R EVS MET deterministic forecasts yes yes yes probabilistic forecasts yes yes yes open source yes yes yes ensemble inputs no yes yes spatially gridded input no no yes GUI no yes no Delft-FEWS-PI as input no yes no command line yes yes yes
  • 41. One-day course on Probabilistic Forecasting Topics: • Introduction to uncertainty, risk and probability • Techniques for estimating predictive hydrological uncertainty: ensembles and post-processing • Verification: how good is my (probabilistic) forecast? • Forecasting applications: (i) storm surge forecasting for the North Sea coast; (ii) fluvial forecasting in Rhine, Meuse and the EFAS system • Serious game: making forecast sensitive decisions • Using probabilistic forecasts in operational practice. • Aansluitend op Delft-FEWS gebruikersdagen: vrijdag 28 oktober 2016 • Course fee: €565
  • 42. Jan Verkade jan.verkade@deltares.nl, +31 6 5161 6107 Dank voor uw aandacht!