SlideShare a Scribd company logo
1 of 36
Download to read offline
Nasjonal risikoklassifisering
av kurver på veinettet
Kan praktisk KI hjelpe oss å prioritere?
Christian Berthelsen, Senior Data Scientist
Avdeling DIA, Statens vegvesen
KI
Litt mer nyansert oversikt over feltene innenfor KI
Mange av feltene dreier seg om helt spesifikke typer problemer
med spesifikke typer data
Mens størsteparten av maskinlæring kan brukes på helt
«klassiske data» (data i form av rader og kolonner)
* Men helst fra databaser, for de som skal jobbe med dette sin skyld
Hva slags data trenger du da?
Person Timer studert Bestått fagprøve?
1 90 Ja
2 80 Ja
3 70 Ja
4 60 Ja
5 50 Nei
6 40 Ja
7 30 Nei
8 20 Nei
9 10 Nei
10 0 Nei
Eksempel på et datasett
0 90
Timer studert
Når er det sannsynligheten er høyest for å bestå?
0
Timer studert 90
0 90
Timer studert
Usikkert
0 90
Timer studert
Ikke bestått Usikkert
0 90
Timer studert
Ikke bestått Usikkert Bestått
Dette eksemplet var for en forklaringsvariabel
Men ideelt sett har man flere
Dataene er som fotballaget som skal prøve å score mål
Viktige ting du mangler
(eller ikke har presise
nok) data om
Kompleksiteten
i målet ditt
Støy fra andre ting
enn det du har data
om, samt tilfeldig
variasjon
Det finnes også et heftig motstanderlag
Vårt mål: Estimere risiko på kurver
Evalueringsstrategi
2015 2016 2017 2018 2019 2020 2021 2022
2015 2016 2017 2018 2019 2020 2021 2022
2015 2016 2017 2018 2019 2020 2021 2022
Estimering Validering
Estimering Validering
Estimering Validering
= 3 simuleringer av ekte ytelse, som informerer oss om hvor bra dette egentlig
fungerer når en «fremtid» kommer som fasit etter estimatene er gjort
Steg 1: Samle data
Ulykkeshendelser
+
Veigeometri med kurvespesifikke beregninger
ÅDT
Andre metadata om kurve (kjørefelt, kollektivfelt etc)
Tidligere historisk ulykkesgrad i samme område
Enkle sideterreng-fakta
Steg 2: Forstå dataene
Viktig moment: Ulykker er en veldig sjelden hendelse
Sjeldne hendelser kan som regel ikke forutsies med høy sikkerhet,
det handler om å finne økt relativ sannsynlighet
Dersom du var ute i tordenvær, hvilket av stedene ville du
foretrukket å befinne deg?
Sted A Sted B
Hint: Ett av stedene har 10x lavere sannsynlighet for å bli truffet av lynet enn det andre
Sted A Sted B
1 : 100
1 : 1000
Sted A Sted B
Men til tross for økt sannsynlighet, kan vi si at det er veldig
sannsynlig at lynet vil slå ned her?
Sted A Sted B
1 : 100
1 : 1000
Om ønsket output
10x
20x
3x
1x
0.1x
1%
20%
3%
10%
0.1%
Relativ risiko Absolutt risiko Antall kurver
Veldig mange
Ganske mange
Veldig få
Ganske få
Grei mengde
Eksempler på sammenhengene algoritmene leter seg gjennom
Eksempler på sammenhengene algoritmene leter seg gjennom
Første modell finner maksimal ytelse fra bare fire variabler
Ulykkeshistorikk
Kurvelengde
ÅDT
Skarpeste kurveradius
Alternativ modell som "tvinges" vekk fra ÅDT og historikk
fokuserer mye jevnere på mange typer veigeometri og metadata
Kurvelengde
Skarpeste kurveradius
Intensitet høydedifferanse
Høydedifferanse mot nabostrekning
ÅDT
Lengde på lengste nabostrekning
Høydedifferanse til sideterreng
Intensitet på tverrfallsvariasjon
Fartsgrense
Hvorvidt kristisk tverrfall er I kurve
Intensitet I retningsendringer
Skog finnes langs kurve
Vann finnes langs kurve
Man kan illustrere ulikhetene i de to modellene slik
"Regnskapsføreren"
Bryr seg om å finne flest
fremtidige ulykker, selv om det
innebærer økt fokus på
høytrafikkerte steder med mye
tidligere ulykker. Fordi det er
«der mest skjer».
"Designeren"
Vil ikke peke på ut steder der mye
allerede er gjort, prøver å finne de
mer «overraskende» kurvene som
er farlige pga. sine geometriske
egenskaper, snarere enn ÅDT eller
historie
NB! De er ikke «bots» eller noe slikt. Hensikten med å tilskrive de en personlighet er kun ment for å lettere gi
intuisjon rundt forskjellene mellom hva de vektlegger i beregningene sine. De er bare «innpakkede matematikk-
oppskrifter» i filformat som spytter ut en risikoklasse som svar når de ser en rad med kurvedata.
De har hver sine gode egenskaper
• Finner flest fremtidige uhell
(22%, ved å peke ut kun 1.5% av kurver i
risikoklasser 4 og 5)
• Setter ca 80% av kurver i laveste klasse,
og disse har få uhell per kurve i fasit (0.19 i
snitt, i motsetning til 4.8 i øvre risikoklasser)
• Fokuserer mer på flere storbyer og store veier
med kjent ulykkeshistorikk blant høye
risikoklasser. Noe sneversynt i hva som
vektlegges som viktige drivere.
• Finner noe færre fremtidige uhell:
(15%, ved å peke ut kun 1% av kurver i
risikoklasse 4 og 5)
• Setter hele 90% av kurver i laveste risikoklasse,
og disse har enda færre uhell i snitt, kun 0.125
uhell per kurve i fasit mot 4.34 i høyeste
risikoklasser
• Fokuserer mer holistisk og aldri på historikk,
tydelig fokus på utfordrende veigeometri når den
setter risikoklasser
Eksempler på ulikt fokus
Vi vil produsere estimater til bruk arbeidet med Nasjonal
Transportplan, og har inngått dialog med fylkeskommuner om
hvordan de kan bruke egne estimater til sin prioritering
KurveID Geografi Veglenke-
sekvensID
Relativ
posisjon
Risikoklasse
123 LAT(…)LON(..) 656 0.3-0.55 1
234 LAT(…)LON(..) 745 0.7-0.87 5
Takk for meg!

More Related Content

More from TSF - Trafikksikkerhetsforeningen

Åpningen av Vegsikringskonferansen 2023 Anette Aanesland Adm.dir. Nye Veier AS
Åpningen av Vegsikringskonferansen 2023 Anette Aanesland Adm.dir. Nye Veier ASÅpningen av Vegsikringskonferansen 2023 Anette Aanesland Adm.dir. Nye Veier AS
Åpningen av Vegsikringskonferansen 2023 Anette Aanesland Adm.dir. Nye Veier ASTSF - Trafikksikkerhetsforeningen
 
Bærekraft og miljø Nye Veier AS Vegsikringskonferansen Nye Veier 23
Bærekraft og miljø Nye Veier AS Vegsikringskonferansen Nye Veier 23Bærekraft og miljø Nye Veier AS Vegsikringskonferansen Nye Veier 23
Bærekraft og miljø Nye Veier AS Vegsikringskonferansen Nye Veier 23TSF - Trafikksikkerhetsforeningen
 
Innfesting av rekkverk på løse vegskulder Vegsikringskonferansen
Innfesting av rekkverk på løse vegskulder VegsikringskonferansenInnfesting av rekkverk på løse vegskulder Vegsikringskonferansen
Innfesting av rekkverk på løse vegskulder VegsikringskonferansenTSF - Trafikksikkerhetsforeningen
 
Behovet for tariff arbeid på vegen Vegsikringskonferansen 23
Behovet for tariff arbeid på vegen Vegsikringskonferansen 23Behovet for tariff arbeid på vegen Vegsikringskonferansen 23
Behovet for tariff arbeid på vegen Vegsikringskonferansen 23TSF - Trafikksikkerhetsforeningen
 
Gjennomføringsplan for MC tiltak Vegsikringskonferansen 2023
 Gjennomføringsplan for MC tiltak  Vegsikringskonferansen 2023 Gjennomføringsplan for MC tiltak  Vegsikringskonferansen 2023
Gjennomføringsplan for MC tiltak Vegsikringskonferansen 2023TSF - Trafikksikkerhetsforeningen
 
Trafikksikkerhetsfordelene ved vegdesign Vegsikringskonferansen
Trafikksikkerhetsfordelene ved vegdesign VegsikringskonferansenTrafikksikkerhetsfordelene ved vegdesign Vegsikringskonferansen
Trafikksikkerhetsfordelene ved vegdesign VegsikringskonferansenTSF - Trafikksikkerhetsforeningen
 
Prosjektet METR – Elektroniske Trafikkreguleringer Vegsikringskonferansen 202...
Prosjektet METR – Elektroniske Trafikkreguleringer Vegsikringskonferansen 202...Prosjektet METR – Elektroniske Trafikkreguleringer Vegsikringskonferansen 202...
Prosjektet METR – Elektroniske Trafikkreguleringer Vegsikringskonferansen 202...TSF - Trafikksikkerhetsforeningen
 

More from TSF - Trafikksikkerhetsforeningen (20)

Ingrid Dahl Hovland Vegsikringskonferansen 23
Ingrid Dahl Hovland Vegsikringskonferansen 23Ingrid Dahl Hovland Vegsikringskonferansen 23
Ingrid Dahl Hovland Vegsikringskonferansen 23
 
Åpningen av Vegsikringskonferansen 2023 Anette Aanesland Adm.dir. Nye Veier AS
Åpningen av Vegsikringskonferansen 2023 Anette Aanesland Adm.dir. Nye Veier ASÅpningen av Vegsikringskonferansen 2023 Anette Aanesland Adm.dir. Nye Veier AS
Åpningen av Vegsikringskonferansen 2023 Anette Aanesland Adm.dir. Nye Veier AS
 
Drift og Vedlikehold Mesta Vegsikringskonferansen 23
Drift og Vedlikehold Mesta Vegsikringskonferansen 23Drift og Vedlikehold Mesta Vegsikringskonferansen 23
Drift og Vedlikehold Mesta Vegsikringskonferansen 23
 
Drift og Vedlikehold RIF Vegsikringskonferansen 23
Drift og Vedlikehold RIF Vegsikringskonferansen 23Drift og Vedlikehold RIF Vegsikringskonferansen 23
Drift og Vedlikehold RIF Vegsikringskonferansen 23
 
Trafikksikkerhet - nullvisjonen Vegsikringskonferansen 23
Trafikksikkerhet - nullvisjonen Vegsikringskonferansen 23Trafikksikkerhet - nullvisjonen Vegsikringskonferansen 23
Trafikksikkerhet - nullvisjonen Vegsikringskonferansen 23
 
TEM Guidelines on Workzone Safety Vegsikringskonferansen 23
TEM Guidelines on Workzone Safety Vegsikringskonferansen 23TEM Guidelines on Workzone Safety Vegsikringskonferansen 23
TEM Guidelines on Workzone Safety Vegsikringskonferansen 23
 
Bærekraft og miljø Nye Veier AS Vegsikringskonferansen Nye Veier 23
Bærekraft og miljø Nye Veier AS Vegsikringskonferansen Nye Veier 23Bærekraft og miljø Nye Veier AS Vegsikringskonferansen Nye Veier 23
Bærekraft og miljø Nye Veier AS Vegsikringskonferansen Nye Veier 23
 
Bærekraft og miljø Vegsikringskonferansen 23
Bærekraft og miljø Vegsikringskonferansen 23Bærekraft og miljø Vegsikringskonferansen 23
Bærekraft og miljø Vegsikringskonferansen 23
 
EPD-Norge Klimamål Vegsikringskonferansen
 EPD-Norge Klimamål Vegsikringskonferansen EPD-Norge Klimamål Vegsikringskonferansen
EPD-Norge Klimamål Vegsikringskonferansen
 
Kommunale veger og bruer Vegsikringskonferansen
Kommunale veger og bruer VegsikringskonferansenKommunale veger og bruer Vegsikringskonferansen
Kommunale veger og bruer Vegsikringskonferansen
 
Innfesting av rekkverk på løse vegskulder Vegsikringskonferansen
Innfesting av rekkverk på løse vegskulder VegsikringskonferansenInnfesting av rekkverk på løse vegskulder Vegsikringskonferansen
Innfesting av rekkverk på løse vegskulder Vegsikringskonferansen
 
Behovet for tariff arbeid på vegen Vegsikringskonferansen 23
Behovet for tariff arbeid på vegen Vegsikringskonferansen 23Behovet for tariff arbeid på vegen Vegsikringskonferansen 23
Behovet for tariff arbeid på vegen Vegsikringskonferansen 23
 
Workzone Safety Vegsikringskonferansen
Workzone Safety VegsikringskonferansenWorkzone Safety Vegsikringskonferansen
Workzone Safety Vegsikringskonferansen
 
MC Trafikkmiljø NMCU Veisikringskonferansen 2023.pptx
MC Trafikkmiljø NMCU Veisikringskonferansen 2023.pptxMC Trafikkmiljø NMCU Veisikringskonferansen 2023.pptx
MC Trafikkmiljø NMCU Veisikringskonferansen 2023.pptx
 
Gjennomføringsplan for MC tiltak Vegsikringskonferansen 2023
 Gjennomføringsplan for MC tiltak  Vegsikringskonferansen 2023 Gjennomføringsplan for MC tiltak  Vegsikringskonferansen 2023
Gjennomføringsplan for MC tiltak Vegsikringskonferansen 2023
 
MC-trafikkmiljø Svendsen Vegsikringskonferansen
MC-trafikkmiljø Svendsen VegsikringskonferansenMC-trafikkmiljø Svendsen Vegsikringskonferansen
MC-trafikkmiljø Svendsen Vegsikringskonferansen
 
Skjermbruk og Human factor Vegsikringskonferansen
Skjermbruk og Human factor VegsikringskonferansenSkjermbruk og Human factor Vegsikringskonferansen
Skjermbruk og Human factor Vegsikringskonferansen
 
Trafikksikkerhetsfordelene ved vegdesign Vegsikringskonferansen
Trafikksikkerhetsfordelene ved vegdesign VegsikringskonferansenTrafikksikkerhetsfordelene ved vegdesign Vegsikringskonferansen
Trafikksikkerhetsfordelene ved vegdesign Vegsikringskonferansen
 
Prosjektet METR – Elektroniske Trafikkreguleringer Vegsikringskonferansen 202...
Prosjektet METR – Elektroniske Trafikkreguleringer Vegsikringskonferansen 202...Prosjektet METR – Elektroniske Trafikkreguleringer Vegsikringskonferansen 202...
Prosjektet METR – Elektroniske Trafikkreguleringer Vegsikringskonferansen 202...
 
Gode lesbare trafikkmiljø Skilt Vegsikringskonferansen
 Gode lesbare trafikkmiljø Skilt Vegsikringskonferansen Gode lesbare trafikkmiljø Skilt Vegsikringskonferansen
Gode lesbare trafikkmiljø Skilt Vegsikringskonferansen
 

Christian Berthelsen Statens vegvesen Vegsikringskonferansen 2024

  • 1. Nasjonal risikoklassifisering av kurver på veinettet Kan praktisk KI hjelpe oss å prioritere? Christian Berthelsen, Senior Data Scientist Avdeling DIA, Statens vegvesen
  • 2. KI
  • 3. Litt mer nyansert oversikt over feltene innenfor KI
  • 4. Mange av feltene dreier seg om helt spesifikke typer problemer med spesifikke typer data
  • 5. Mens størsteparten av maskinlæring kan brukes på helt «klassiske data» (data i form av rader og kolonner) * Men helst fra databaser, for de som skal jobbe med dette sin skyld
  • 6. Hva slags data trenger du da?
  • 7. Person Timer studert Bestått fagprøve? 1 90 Ja 2 80 Ja 3 70 Ja 4 60 Ja 5 50 Nei 6 40 Ja 7 30 Nei 8 20 Nei 9 10 Nei 10 0 Nei Eksempel på et datasett
  • 8. 0 90 Timer studert Når er det sannsynligheten er høyest for å bestå?
  • 11. 0 90 Timer studert Ikke bestått Usikkert
  • 12. 0 90 Timer studert Ikke bestått Usikkert Bestått
  • 13. Dette eksemplet var for en forklaringsvariabel
  • 14. Men ideelt sett har man flere
  • 15. Dataene er som fotballaget som skal prøve å score mål
  • 16. Viktige ting du mangler (eller ikke har presise nok) data om Kompleksiteten i målet ditt Støy fra andre ting enn det du har data om, samt tilfeldig variasjon Det finnes også et heftig motstanderlag
  • 17. Vårt mål: Estimere risiko på kurver
  • 18. Evalueringsstrategi 2015 2016 2017 2018 2019 2020 2021 2022 2015 2016 2017 2018 2019 2020 2021 2022 2015 2016 2017 2018 2019 2020 2021 2022 Estimering Validering Estimering Validering Estimering Validering = 3 simuleringer av ekte ytelse, som informerer oss om hvor bra dette egentlig fungerer når en «fremtid» kommer som fasit etter estimatene er gjort
  • 19. Steg 1: Samle data Ulykkeshendelser + Veigeometri med kurvespesifikke beregninger ÅDT Andre metadata om kurve (kjørefelt, kollektivfelt etc) Tidligere historisk ulykkesgrad i samme område Enkle sideterreng-fakta
  • 20. Steg 2: Forstå dataene Viktig moment: Ulykker er en veldig sjelden hendelse
  • 21. Sjeldne hendelser kan som regel ikke forutsies med høy sikkerhet, det handler om å finne økt relativ sannsynlighet
  • 22. Dersom du var ute i tordenvær, hvilket av stedene ville du foretrukket å befinne deg? Sted A Sted B Hint: Ett av stedene har 10x lavere sannsynlighet for å bli truffet av lynet enn det andre
  • 24. 1 : 100 1 : 1000 Sted A Sted B
  • 25. Men til tross for økt sannsynlighet, kan vi si at det er veldig sannsynlig at lynet vil slå ned her? Sted A Sted B 1 : 100 1 : 1000
  • 26. Om ønsket output 10x 20x 3x 1x 0.1x 1% 20% 3% 10% 0.1% Relativ risiko Absolutt risiko Antall kurver Veldig mange Ganske mange Veldig få Ganske få Grei mengde
  • 27. Eksempler på sammenhengene algoritmene leter seg gjennom
  • 28. Eksempler på sammenhengene algoritmene leter seg gjennom
  • 29. Første modell finner maksimal ytelse fra bare fire variabler Ulykkeshistorikk Kurvelengde ÅDT Skarpeste kurveradius
  • 30.
  • 31. Alternativ modell som "tvinges" vekk fra ÅDT og historikk fokuserer mye jevnere på mange typer veigeometri og metadata Kurvelengde Skarpeste kurveradius Intensitet høydedifferanse Høydedifferanse mot nabostrekning ÅDT Lengde på lengste nabostrekning Høydedifferanse til sideterreng Intensitet på tverrfallsvariasjon Fartsgrense Hvorvidt kristisk tverrfall er I kurve Intensitet I retningsendringer Skog finnes langs kurve Vann finnes langs kurve
  • 32. Man kan illustrere ulikhetene i de to modellene slik "Regnskapsføreren" Bryr seg om å finne flest fremtidige ulykker, selv om det innebærer økt fokus på høytrafikkerte steder med mye tidligere ulykker. Fordi det er «der mest skjer». "Designeren" Vil ikke peke på ut steder der mye allerede er gjort, prøver å finne de mer «overraskende» kurvene som er farlige pga. sine geometriske egenskaper, snarere enn ÅDT eller historie NB! De er ikke «bots» eller noe slikt. Hensikten med å tilskrive de en personlighet er kun ment for å lettere gi intuisjon rundt forskjellene mellom hva de vektlegger i beregningene sine. De er bare «innpakkede matematikk- oppskrifter» i filformat som spytter ut en risikoklasse som svar når de ser en rad med kurvedata.
  • 33. De har hver sine gode egenskaper • Finner flest fremtidige uhell (22%, ved å peke ut kun 1.5% av kurver i risikoklasser 4 og 5) • Setter ca 80% av kurver i laveste klasse, og disse har få uhell per kurve i fasit (0.19 i snitt, i motsetning til 4.8 i øvre risikoklasser) • Fokuserer mer på flere storbyer og store veier med kjent ulykkeshistorikk blant høye risikoklasser. Noe sneversynt i hva som vektlegges som viktige drivere. • Finner noe færre fremtidige uhell: (15%, ved å peke ut kun 1% av kurver i risikoklasse 4 og 5) • Setter hele 90% av kurver i laveste risikoklasse, og disse har enda færre uhell i snitt, kun 0.125 uhell per kurve i fasit mot 4.34 i høyeste risikoklasser • Fokuserer mer holistisk og aldri på historikk, tydelig fokus på utfordrende veigeometri når den setter risikoklasser
  • 35. Vi vil produsere estimater til bruk arbeidet med Nasjonal Transportplan, og har inngått dialog med fylkeskommuner om hvordan de kan bruke egne estimater til sin prioritering KurveID Geografi Veglenke- sekvensID Relativ posisjon Risikoklasse 123 LAT(…)LON(..) 656 0.3-0.55 1 234 LAT(…)LON(..) 745 0.7-0.87 5