Maskinlæring for tryggere veger Vebjørn Axelsen, leder for avanserte analyser, BearingPoint Teknologidagene, 30. oktober 2018
1950 1952 1954 1956 1958 1960 1962 1964 1966 1968 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 2016 Antall dødsfall på norske veger har gått jevnt ned siden 70-tallet, til tross for stor økning i trafikk 600 500 400 300 200 100 Hvordan? 0
PROBLEMSTILLING Hvilke egenskaper ved vegen og vegens omgivelser kjennetegner ulykkesutsatte vegstrekninger?
Data
Vi benytter åpne data for å beskrive problemet, på tvers av vegutforming, demografi og klima NVDB SSB Meteorologisk institutt 55 000 km veg (ERF) 45 prioriterte forklaringsvariabler Data på geografiske rutenett 14 prioriterte forklaringsvariabler 504 værstasjoner 18 prioriterte forklaringvariabler Belysning, rekkverk, fartsgrense, fotobokser, broer, tunneler, kryss, kurvatur, vegklassifiseringer, Trafikkulykker Befolkning, bygningsmasse, landbruk Nedbør, temperatur, luftttrykk
Det kontinuerlige vegnettet kappes i risikohomogene vegsegmenter: hver vesentlige endring langs veien gir et kapp NVDB SSB Endret fartsgrense Rekkverk innføres Vegsegment 3 Fartsgrense 50 Rekkverk: Ja Vegsegment 2 Fartsgrense: 80 Rekkverk: Ja Met. institutt Vegsegment 1 Fartsgrense: 80 Rekkverk: Nei
Demografiske data legges på vegsegmentene fra SSBs rutenett i kart NVDB Befolkning: 504 Vegsegment 3 Fartsgrense 50 Rekkverk: Ja Befolkning: 504 SSB Met. institutt Befolkning: 318 Vegsegment 2 Fartsgrense: 80 Rekkverk: Ja Befolkning: 504 Vegsegment 1 Fartsgrense: 80 Rekkverk: Nei Befolkning: 318
Månedlige værdata aggregeres til 6-års klimavariabler, og legges på vegsegmentene basert på nærhet til værstasjoner NVDB SSB Met. institutt Befolkning: 504 Befolkning: 318 Vegsegment 3 Fartsgrense 50 Rekkverk: Ja Befolkning: 504 Nedbør: 18 Vegsegment 2 Fartsgrense: 80 Rekkverk: Ja Befolkning: 504 Nedbør: 18 Vegsegment 1 Fartsgrense: 80 Rekkverk: Nei Befolkning: 318 Nedbør: 18 Temperatur: 12
En risikokategori tilordnes hvert segment ved å beregne påløpt risiko per kjøretøykilometer Historiske ulykker kobles til vegsegmenter Risikoscore beregnes Høyrisikosegmenter identifiseres Alvorlighetsgrad ulykke: Drept: 10 Alvorlig skadd: 5 Lett skadd: 1 Uskadd: 0 Normalisering: Segmentlengde Årsdøgntrafikk (ÅDT) Høy Lav Topp 6 % Risikoscore = Vektet sum av ulykker Segmentlengde ÅDT
Med dette har vi det norske ERF-vegnettet beskrevet som et flatt datasett, der hver rad beskriver ett vegsegment i detalj Høy Lav Vegsegment 1 Vegsegment 2 Vegsegment 3 Vegegenskaper Demografi Klima Risikoklasse Vegsegment 115K Høyrisiko Lavrisiko
Analyse
Vi benytter algoritmer innen ledet maskinlæring (supervised learning) til å finne mønstre INPUTDATA Egenskaper ved vegen MASKINLÆRING Algoritmer finner mønstre MODELL Beskriver risiko OUTPUTDATA Historisk ulykkesrisiko
3000 5000 Vi betrakter vegsegmentene i et n-dimensjonalt rom, og søker etter lommer med vesentlig overrepresentasjon av høyrisiko Fartsgrense Datasett 80 50 High-risk Low-risk Rule ÅDT
Prosessen for å finne de mest verdifulle sammenhengene drar vesentlig nytte av domenekunnskap Uttømmende søk Prioritering og minimering Regelvalg ~2 millioner regler: Resultat fra uttømmende søk ~150 regler: Gjenstående etter krav til signal og fjerning av overlappende regler 9 regler: Regler prioritert av Trafikksikkerhetsseksjonen for utdypende beskrivelse i rapport
Reglene gir lettforståelige beskrivelser av egenskaper som i kombinasjon kjennetegner ulykkesutsatte strekninger EKSEMPEL: Svingete fylkesveier med høyere fartsgrense og en del trafikk 80+ Fylkesveg 3+ kurver (r < 300m) Fartsgrense 80-110 ÅDT 1380-3500 Disse vegene har 2,28x ulykkesrisiko sammenlignet med snittet, og omfatter 1,3 % av total trafikk
Supplerende analyser
Trafikkmengde er en dominerende faktor, og en supplerende analyse går derfor i dybden på ÅDT 1000-25000, tofelts veg Utvalg: ÅDT [1000, 25 000] < 4 kjørefelt Ikke rampe REGELGRUPPER Tettbebygd strøk Ubelyste veger Kryss Kurvatur (horisontal) Lav/middels vinterdrift Smalt dekke + høy trafikk
EKSEMPEL: Veg med krapp sving og relativt høy fartsgrense, på vinterdriftsklasse DkC, i befolket område DkC 70-80 Vinterdrift DkC 1+ kurver (r<200m) Fartsgrense 70-80 Befolket område Disse vegene har 1,41x ulykkesrisiko sammenlignet med snittet, og omfatter 3,7 % av total trafikk
OPPRINNELIG PROBLEMSTILLING Hvilke egenskaper ved vegen og vegens omgivelser kjennetegner ulykkesutsatte vegstrekninger? PROBLEMSTILLING #2 Hvilke egenskaper kjennetegner enkeltulykker med alvorlig utfall? Alvorlighetsgrad ulykke Drept (Meget) Alvorlig skadd Lett skadd Uskadd Vår definisjon Alvorlig utfall Ikke alvorlig utfall
EKSEMPEL: Mannlige førere på ubelyste veger med stiplet kantlinje Stiplet kantlinje Kun mannlige førere Mørkt uten vegbelysning Disse ulykkene har 1,75x så ofte alvorlig utfall som snittet, og dekker 1,9 % av analyserte ulykker
Relativ Lift risiko Gradvis avgrensning viser hvordan risikoen endrer seg innenfor utvalget 1,8 1,7 1,6 1,5 1,4 1,3 1,2 1,1 1 Broken Stiplet edge line No Kun female mannlige drivers Mørkt Dark without uten kantlinje førere vegbelysning street lights Dark Mørkt with med street vegbelysning lights Increase Økning Decrase Reduksjon
Vegsegmentanalyse: Hele vegnettet Vegsegmentanalyse: Tofelts med betydelig trafikk Enkeltulykkesanalyse