Sammenligning av metoder for beregning av årsdøgntrafikk
|
|
|
- Sigrid Holt
- 9 år siden
- Visninger:
Transkript
1 Sammenligning av metoder for beregning av årsdøgntrafikk Notatnr Forfattere Dato SAMBA/6/15 Ola Haug Magne Aldrin 3. juli 215
2 Norsk Regnesentral Norsk Regnesentral (NR) er en privat, uavhengig stiftelse som utfører oppdragsforskning for bedrifter og det offentlige i det norske og internasjonale markedet. NR ble etablert i 1952 og har kontorer i Kristen Nygaards hus ved Universitetet i Oslo. NR er et av Europas største miljøer innen anvendt statistisk-matematisk modellering og har et senter for forskningsdrevet innovasjon, Statistics for Innovation (sfi) 2, med finansiering fra Norges forskningsråd. Det jobbes med et bredt spekter av problemstillinger, for eksempel finansiell risiko, jordobservasjon, estimering av fiskebestander og beskrivelse av geologien i petroleumsreservoarer. NR er ledende i Norge innen utvalgte deler av informasjons- og kommunikasjonsteknologi. Innen IKT-området har NR innsatsområdene e-inkludering, informasjonssikkerhet og smarte informasjonssystemer. NRs visjon er forskningsresultater som brukes og synes.
3 Tittel Forfattere Sammenligning av metoder for beregning av årsdøgntrafikk Ola Haug Magne Aldrin Dato 3. juli 215 Publikasjonsnummer SAMBA/6/15 Sammendrag Faktormetoden og basiskurvemetoden er to ulike teknikker som begge beregner gjennomsnittlig døgntrafikk over året (ÅDT) basert på registrering av antall kjøretøy over en avgrenset tidsperiode. Vi har vurdert de to metodene opp mot faktisk ÅDT for ulike kategorier av simulerte korttidstellinger. Ut fra simuleringsdataene som danner grunnlag for analysen, viser det seg at faktormetoden er den universelt beste av de to idet den presterer best både for tellinger som begrenser seg til noen timer, og i situasjoner hvor telleperioden strekker seg over flere uker. Forsidebilde: istock. Emneord Målgruppe Tilgjengelighet Prosjekt Faktormetoden, basiskurvemetoden, relativ feil, absolutt feil SINTEF Teknologi og samfunn, Statens Vegvesen Vegdirektoratet Åpen Metodikk for ÅDT-estimering Prosjektnummer Satsningsområde Statistikk for teknologi, industri og forvaltning Antall sider 2 Copyright Norsk Regnesentral 3
4
5 Innhold 1 Innledning Simuleringseksperiment Analyse Resultater Diskusjon Konklusjon Referanser A Metodisk usikkerhet i faktormetoden - formelverk A.1 Bakgrunn A.2 Teori A.3 En anvendelse Sammenligning av metoder for beregning av årsdøgntrafikk 5
6
7 1 Innledning På oppdrag fra Statens Vegvesen Vegdirektoratet har Norsk Regnesentral (NR) i samarbeid med SINTEF Teknologi og samfunn sammenlignet to ulike metoder for beregning av årsdøgntrafikk (ÅDT) fra korttidstellinger av vegtrafikk. De to metodene, kalt faktormetoden og basiskurvemetoden, er begge per i dag oppført som alternativer for beregning av trafikkparametere i Veileder i trafikkdata, Håndbok V714 (Vegdirektoratet, 214). Vegdirektoratet ønsker en vurdering av om det finnes en universelt optimal metode blant de to, eller eventuelt om det for gitte tellesituasjoner er slik at den ene er å foretrekke framfor den andre. 2 Simuleringseksperiment Sammenligningsstudien er bygget opp som et simuleringseksperiment hvor det for tellepunktår med høy telledekning (>95%) genereres en rekke syntetiske korttidstellinger i henhold til totalt 15 ulike kategorier av forhåndsdefinerte telleoppsett (case). For hver simulering av korttidstellinger beregnes ÅDT med de to metodene. De 15 kategoriene av korttidstellinger varierer fra enkelttimer via døgn til registreringer over én til flere uker. Kategoriene er definert av SINTEF Teknologi og samfunn og Vegdirektoratet i fellesskap og beskrevet i tabell 1. Case Beskrivelse 1 1 uke 2 2 uker 3 3 uker uker (1 uke i hvert kvartal) (1) uker, ekstra uke ved høy SDT (1 uke i hvert kvartal + 1 uke i juli) 6 4 uker i starten av året timer (7 9 og 15 17) timer (7 9, og 15 17) 9 1 time (makstime) 1 6 timer (start kl 7 eller kl 15) 11 1 døgn 12 1 døgn i januar uker 14 1 måned (3 dager etter hverandre) 15 8 uker i starten av året Tabell 1. Kategorier av korttidstelleoppsett. Datasettet som produseres fra simuleringseksperimentet er videre å oppfatte som todelt med hensyn på valg av faktor- eller basiskurver gjennom den logiske variabelen Ran- Sammenligning av metoder for beregning av årsdøgntrafikk 7
8 dom : For Random=FALSE brukes kurveklasser som bestemt av Vegdirektoratet for hvert registreringspunkt ut fra dets trafikkprofil, mens for Random=TRUE er det trukket en tilfeldig kurveklasse som brukes gjennomgående over et helt case. For hver kombinasjon av case (1, 2,..., 15) og Random (FALSE/TRUE) genereres 13 1 korttidstellesituasjoner. Mellom ulike simuleringer varieres registreringspunktnummeret, og telleperioden trekkes i henhold til det aktuelle caset. For hver simulering estimeres ÅDT for faktor- og basiskurvemetoden, samt faktisk ÅDT (beregnet som telledøgntrafikk, TDT, dvs gjennomsnittlig døgntrafikk over alle talte døgn i hvert tellepunktår). Ved å la registreringspunktene inngå som en variabel i simuleringen, vil ulike registreringspunkter opptre med ulik frekvens i simuleringseksperimentet. Programvaren som brukes i simuleringseksperimentet er utviklet av Triona. Faktormetoden er en manuell metode bygget rundt et sett av standard variasjonskurver for ulike vegtyper. Basiskurvemetoden er implementert og i rutinemessig drift som en del av trafikkdatabanken NorTraf. I bunnen av denne metoden ligger funksjoner opprinnelig skrevet av NR i C#, men som i dette prosjektet er sydd sammen av Triona til et javabibliotek. 3 Analyse I analysen av resultatene fra simuleringseksperimentet har vi utelatt tellepunktår med kompletthetsverdi mindre enn 95%. Dette reduserer effekten av den skjevheten som introduseres ved at fasit ÅDT er beregnet som TDT, mens faktor- og basiskurvemetoden begge leverer estimater for gjennomsnittlig døgntrafikk over alle årets dager, ÅDT. I det opprinnelige simuleringsmaterialet fra Triona foreligger det enkelte ekstreme avvik mellom fasitverdi og estimatene for ÅDT. Vegdirektoratet har funnet at avvikene går igjen for bestemte registreringspunkter, og at de gjerne er koblet til en tidsforskyvning i grunnlagsdataene. Totalt dreier det seg om 57 punkter av i alt 39. Alle simuleringer for disse punktene er tatt ut av den videre analysen. De gjenværende 333 registreringspunktene opptrer i fra 6 til 1294 enkeltsimuleringer i sammenligningsstudien. I figur 1 er fordelingen av kompletthetsverdier i det endelige datamaterialet vist som et histogram (venstre panel). Høyre panel viser hvor mange simuleringer som inngår i hvert case i det endelige datamaterialet. I gjennomsnitt består et case av 6781 enkeltsimuleringer, varierende fra 6451 for case 4 og 5 til 6992 for case 11. Vi har vurdert de to metodene ut fra avviksmålene gjennomsnittlig relativ absoluttfeil (MRAE) og gjennomsnittlig relativ kvadratfeil (RMRSE), definert som MRAE = 1 N RMRSE = 1 N N i=1 y i y i,fasit y i,fasit (1) N ( ) yi y 2 i,fasit (2) i=1 y i,fasit 8 Sammenligning av metoder for beregning av årsdøgntrafikk
9 Antall 2 4 Antall Kompletthet [%] Case Figur 1. Telledekning (venstre panel) og antall simuleringer for hvert case (høyre panel) etter fjerning av tellepunkter med feilaktige data og tellepunktår med lav dekning. hvor N er antall simuleringer (enten for et case eller totalt), y i,fasit er fasit ÅDT for simulering i og y i representerer ÅDT-estimater enten fra faktormetoden eller basiskurvemetoden. Lavest verdi indikerer minst avvik fra fasit og er dermed best. I tillegg har vi brukt relativ feil ( i ) og absolutt feil (AE i ) for hver simulering i for å vurdere hvorvidt metodene over- eller underestimerer fasit ÅDT, i = y i y i,fasit y i,fasit (3) AE i = y i y i,fasit. (4) Det er gjort separate analyser for tilfellene Random=TRUE og Random=FALSE. 4 Resultater Verdier for avviksmålene MRAE og RMRSE er vist i tabellene 2 og 3 for tilfellene Random=FALSE og Random=TRUE. Om vi først betrakter tilfellet hvor valg av kurveklasser er gjort på bakgrunn av kunnskap om registreringspunktene (Random=FALSE), ser vi hvordan telleoppsettet påvirker estimatene. Ser vi spesifikt på M RAE for faktormetoden i tabell 2, ser vi hvordan avviket avtar fra case 1 (1 telleuke sammenhengende) til case 3 (3 telleuker sammenhengende), og videre til case 4 hvor nedgangen er betydelig når 4 telleuker spres over året. Dette er i tråd med hva vi ville forvente. Ved å legge til ytterligere en telleuke i juli (case 5) oppnås kun en marginal forbedring i forhold til case 4. Sammenhengende telling i 4 uker (case 6) eller 3 dager (case 14) gir langt dårligere Sammenligning av metoder for beregning av årsdøgntrafikk 9
10 resultater enn når tellingene spres (case 4), og det hjelper heller ikke å øke den sammenhengende telleperioden til 8 uker (case 15). I case 13 telles to uker første halvår og to uker andre halvår, og tallene viser igjen at det er bedre med spredte tellinger enn med en kontinuerlig telleperiode av tilsvarende lengde. Tendensen er tilsvarende for oppsettene med times- og døgntellinger (case 7-12), selv om avvikene som sådan naturlig nok er høyere her. Tellinger kun i makstimen (case 9) gir høyest avvik etterfulgt av 2 sammenhengende timer i morgen- og ettermiddagsrushet (case 7) som i sin tur er litt verre enn å telle 6 sammenhengende timer med start enten kl 7 eller kl 15 (case 1). Langt bedre er det å fordele de 6 timene på tre bolker utover dagen (7-9, og 15-17) (case 8), noe som gir et resultat på linje med å telle i 24 påfølgende timer (case 11). Case M RAE-faktor M RAE-basis RM RSE-faktor RM RSE-basis Totalt Tabell 2. Avviksmål MRAE og RMRSE for faktor- og basiskurvemetoden for ulike oppsett av korttidstellinger i tilfellet Random=FALSE. Ser vi så på avvikene mellom faktor- og basiskurvemetoden, finner vi at faktormetoden er best i 14 og 12 av de totalt 15 telleoppsettene målt etter henholdsvis MRAE og RMRSE. Faktormetoden kommer også best ut etter begge kriteriene når vi ser på avvik for alle simuleringene under ett ( Totalt i tabellen). Riktignok er ikke utslagene like store for alle telleoppsettene, men den gjennomgående tendensen er klar. For simulering med tilfeldig tilordning av kurveklasser (Random=TRUE) er bildet mer nyansert, se tabell 3. Nå er faktormetoden best etter henholdsvis MRAE og RMRSE i bare 7 og 6 av de totalt 15 telleoppsettene, men den har fortsatt lavest avvik for alle simuleringene sett under ett. I tråd med hva vi ville forvente, er avvikene generelt større enn når kurveklassene velges ut fra egenskapene til registreringspunktene. For å vurdere om de to metodene over- eller underestimerer årsdøgntrafikken, har vi be- 1 Sammenligning av metoder for beregning av årsdøgntrafikk
11 Case M RAE-faktor M RAE-basis RM RSE-faktor RM RSE-basis Totalt Tabell 3. Avviksmål MRAE og RMRSE for faktor- og basiskurvemetoden for ulike oppsett av korttidstellinger i tilfellet Random=TRUE. regnet relativt og absolutt avvik ( i og AE i ). Figurene 2 og 3 viser spredningsdiagram for AE i for tilfellene Random=FALSE og Random=TRUE. Det er for hvert panel snakk om veldig mange punkter som dels er plottet oppå hverandre, så figurene skal tolkes med forsiktighet. Det er heller ikke felles akseverdier mellom de ulike panelene. Vi ser likevel at det for begge metodene og alle casene er enkelte svært store avvik fra fasit ÅDT, både positive og negative. De røde linjene deler panelene i fire kvadranter. Punkter som faller innenfor de to kvadrantene langs positiv og negativ x-akse representerer enkeltsimuleringer hvor faktormetoden har lavest avvik, mens for punkter som faller i kvadrantene langs y-aksen er basiskurvemetoden best. Den relative feilen gir også innblikk i hvordan estimatene plasserer seg i forhold til fasit ÅDT. Figurene 4 og 5 viser fordelingen til i for henhvoldsvis faktor- og basiskurvemetoden i tilfellet Random=FALSE, mens figurene 6 og 7 gir tilsvarende oversikt for Random=TRUE. Her opereres det med samme utstrekning på x-aksen for sammenhørende kategorier av telleoppsett i de to metodene, og de vertikale stiplete linjene markerer yttergrensene i det aktuelle datasettet. Siden i angir det relative avviket, er histogrammene også sammenlignbare mellom de ulike kategoriene. Ut fra definisjonen av i vil 1 være en nedre grense for denne størrelsen. Om vi først betrakter telleoppsettene for tilfellet Random=FALSE, synes det som om histogrammene i form er relativt like for de to metodene. De vertikale stiplete linjene avslører imidlertid at basiskurvemetoden oftere enn faktormetoden er den som definerer utstrekningen av x-aksen ved å spenne ut hele denne, dvs at avvikene er større for denne metoden. Dette er i tråd med resultatene vist i MRAE- og RMRSE-kolonnene i tabell 2. Sammenligning av metoder for beregning av årsdøgntrafikk 11
12 Absolutt avvik (Random=FALSE) Case 7 Case Case 6 1 Case Case 9 Case 1 Case 11 Case Case 13 Case 14 Case 15 Totalt Case Case Case 2 1 Case Figur 2. Absolutt avvik for tilfellet Random=FALSE. Basiskurvemetoden langs x-aksen, faktormetoden langs y-aksen. For Random=TRUE er bildet et annet. Her avviker de to metodene med hensyn på formen til histogrammene, men også når det gjelder hvilket feildatasett som har størst utstrekning (de vertikale linjene). Denne prestasjonsutjevningen mellom metodene er i tråd med hva vi fant for M RAE og RM RSE gjengitt i tabell 3. 5 Diskusjon Gjennom simuleringseksperimentet er det avdekket ulike typer uregelmessigheter. Dette gjelder både resultater fra programvaren som Triona leverer og feil knyttet til telledataene som går inn i beregningene. Trionas beregning av telledekning (komplette dager) er inkonsistent for enkelte av tellepunktårene. For eksempel er det for et spesifikt tellepunkt (26) registrert en dekning på 2.73% i 28. Dette tilsvarer om lag 1 dager med tellinger, mens nærmere undersøkelser foretatt av Vegdirektoratet viser at tellinger foreligger for 6 dager i januar og februar 12 Sammenligning av metoder for beregning av årsdøgntrafikk
13 Absolutt avvik (Random=TRUE) Case 6 Case 7 Case Case Case 9 Case 1 Case 11 Case 12 1e e+5 1 e Case 13 Case 14 Case 15 Totalt e Case 4 2 Case Case 2 2 Case Figur 3. Absolutt avvik for tilfellet Random=TRUE. Basiskurvemetoden langs x-aksen, faktormetoden langs y-aksen. 28 svarende til en kompletthet på rundt 16%. Triona på sin side opererer med 62 telledager for dette tellepunktåret i sitt datamateriale, så her er det åpenbart noe som ikke henger helt sammen. Flere av telleoppsettene strekker seg utover 1 dager (case 2, 3, 4, 5, 6, 13, 14, 15), og noen av dem krever også en fordeling av tellingene over hele året (case 4, 5, 13). Selv med en telledekning på 16% vil disse siste casene umulig kunne genereres for et tellepunkt som kun har tellinger i årets to første måneder. Likevel produserer programvaren til Triona ÅDT-estimater for begge metodene i tillegg til faktisk ÅDT-verdi. Dette gjør oss i tvil om algoritmen Triona har implementert for å trekke ut simulerte korttidstellinger fra faktiske telledata virker slik den er tenkt. Spesielt ville det være interessant å få greie på hvilke telleverdier som faktisk blir brukt for tidspunkter hvor det ikke foreligger tellinger. Vegdirektoratet har sett nærmere på beregning av telledekningen med utgangspunkt i egne data. For de fleste tellepunkter og år later det til å være overensstemmelse mellom verdiene som produseres av programvaren til Triona og deres tall. For enkelte tellepunktår er det imidlertid til dels store avvik (opptil 2 prosentpoeng). Betydningen av avviken- Sammenligning av metoder for beregning av årsdøgntrafikk 13
14 Faktormetoden: Relativt avvik (Random=FALSE) Case 1 Case 2 Case 3 Case Case 5 Case 6 Case 7 Case Case 9 Case 1 Case 11 Case Case 13 Case 14 Case 15 Total Figur 4. Relativt avvik for ulike kategorier av telleoppsett samt Total ved bruk av faktormetoden for tilfellet Random=FALSE. de beregning av telledekning i Trionas programvare er trolig liten for tilnærmet komplette telleserier. Et lite forbehold må vi likevel ta all den tid vi ikke vet hvilke telleverdier programmet bruker for eventuelt manglende telletimer. For 1% komplette telleserier er problemstillingen ikke aktuell. En stikkprøveanalyse gjort av Vegdirektoratet for tellepunktår med kompletthetsverdi over 8% viser neglisjerbare avvik mellom Trionas verdi for telledekning og Vegdirektoratets tall. Når det gjelder telledataene i seg selv, har Vegdirektoratet tatt for seg enkeltsimuleringer hvor avvikene mellom estimert fasitverdi for ÅDT (TDT) og ÅDT-estimatene fra faktoreller basiskurvemetoden er betydelige. De mest ekstreme avvikene er gjerne knyttet til bestemte tellepunkter, og det viser seg at det ofte er en tidsforskyvning i grunnlagsdataene i disse tilfellene. Slike tidsforskyvninger oppstår gjerne i overgangen mellom sommer- og vintertid (og motsatt) og vedvarer inntil telleutstyret igjen blir synkronisert mot faktisk kalendertid. For et tellepunkt på Lysaker utenfor Oslo viser et plott av gjennomsnittlig årlig trafikkvolum for alle døgnets timer at rushet i 28 er anslagsvis 5 timer forsinket i forhold til årene 29 og 21, se figur 8. Slike feilregistreringer av telletimer er kritisk negative for beregningen av trafikkparametere. Store avvik i AE i eller i for både faktor- og basiskurvemetoden kan være en indikasjon på at noe er feil i telledataene (for eksempel er tidsforskyvning fortsatt mulig selv om telledekningen er høy). Det er imidlertid vanskelig å trekke noen slutning om hvor store avvik som må påregnes for en gitt simulering all den tid vi ikke har tilgjengelig tilhørende estimater for det teoretiske standardavviket. 14 Sammenligning av metoder for beregning av årsdøgntrafikk
15 Basiskurvemetoden: Relativt avvik (Random=FALSE) Case 1 Case 2 Case 3 Case Case 5 Case 6 Case 7 Case Case 9 Case 1 Case 11 Case Case 13 Case 14 Case 15 Total Figur 5. Relativt avvik for ulike kategorier av telleoppsett samt Total ved bruk av basiskurvemetoden for tilfellet Random=FALSE. 6 Konklusjon Resultatene i kapittel 4 viser at faktormetoden gjennomgående er bedre enn basiskurvemetoden til estimering av årsdøgntrafikk, ÅDT. I tilfellet hvor det velges kurveklasser ut fra kjennskap til trafikkprofilen til hvert enkelt tellepunkt (Random=FALSE), er faktormetoden bedre enn basiskurvemetoden for et klart flertall av de forhåndsdefinerte korttidstellekategoriene målt både etter MRAE og RMRSE. Og for de få tilfellene hvor basiskurvemetoden kommer best ut, er denne kun marginalt bedre enn faktormetoden. For simuleringer hvor kurveklassene velges tilfeldig (Random=TRUE) presterer de to metodene omtrent jevngodt, men dette tilfellet er ikke så interessant ettersom estimering av trafikkparametere typisk vil foregå med bruk av den kunnskap som er tilgjengelig om tellepunktene. Kategoriene av tellesituasjoner som er undersøkt i denne studien dekker både situasjoner med svært kort tellehistorikk (timer) og situasjoner hvor telledata er tilgjengelig over lengre perioder (uker). Det er derfor grunnlag for å si at faktormetoden utgjør en universelt beste metode for beregning av årsdøgntrafikk. Grunnen til at basiskurvemetoden kommer dårlig ut vurdert etter M RAE og RM RSE, er ikke fullt ut kartlagt. Grafiske framstillinger av absolutt og relativt avvik for enkeltsimuleringer antyder imidlertid at basiskurvemetoden produserer flere store avvik fra fasit ÅDT enn hva som er tilfellet for faktormetoden. Disse store enkeltavvikene for gitte korttidstellinger bidrar kritisk til å ødelegge for det samlede avviket (MRAE og RMRSE). For å finne årsaken til hvorfor basiskurvemetoden gir slike utslag, må man gå inn i de Sammenligning av metoder for beregning av årsdøgntrafikk 15
16 Faktormetoden: Relativt avvik (Random=TRUE) Case 1 Case 2 Case 3 Case Case 5 Case 6 Case 7 Case Case 9 Case 1 Case 11 Case Case 13 Case 14 Case 15 Total Figur 6. Relativt avvik for ulike kategorier av telleoppsett samt Total ved bruk av faktormetoden for tilfellet Random=TRUE. aktuelle tellesituasjonene og analysere nærmere hvordan basiskurvemetoden håndterer disse. Det kan for eksempel ligge uavdekkede metodiske svakheter bak, eller det kan være feil i telledataene som slår uheldig ut. Det bør også nevnes at den versjonen av basiskurvemetoden som er brukt i simuleringseksperimentet ble kodet på nytt i et annet programmeringsspråk av Triona i forbindelse med denne sammenligningsstudien. Referanser Vegdirektoratet (211). Veileder innsamling og beregning av trafikkdata til støykartlegging. Statens Vegvesen Vegdirektoratet. VD rapport nr 48. Vegdirektoratet (214). Veileder i trafikkdata, håndbok V714. Statens Vegvesen Vegdirektoratet. ISBN: Sammenligning av metoder for beregning av årsdøgntrafikk
17 Basiskurvemetoden: Relativt avvik (Random=TRUE) Case 1 Case 2 Case 3 Case Case 5 Case 6 Case 7 Case Case 9 Case 1 Case 11 Case Case 13 Case 14 Case 15 Total Figur 7. Relativt avvik for ulike kategorier av telleoppsett samt Total ved bruk av basiskurvemetoden for tilfellet Random=TRUE. Figur 8. Tidsforskyvning i telledata for registreringspunkt på Lysaker som beregnet av SINTEF. Kurvene viser gjennomsnittlig årlig trafikkvolum over døgnet for årene 28, 29 og 21. Sammenligning av metoder for beregning av årsdøgntrafikk 17
18 A Metodisk usikkerhet i faktormetoden - formelverk A.1 Bakgrunn Registrering og beregning av trafikkparametre (som ÅDT) er forbundet med ulike former for feil og usikkerhet. For det første er det begrensninger i nøyaktigheten ved registrering av kjøretøy. Måletekniske feil opptrer såvel for automatisk måleutstyr som ved manuelle tellinger. Dernest vil tidspunktet for trafikkregistreringen kunne medføre det vi kaller tilfeldige feil. Trafikkuhell, været og ulike arrangementer er alle eksempler på faktorer som kan påvirke det aktuelle trafikkbildet og dermed også tellingene. Til sist er det slik at selv om kjøretøyregistreringene var eksakte og uten feil, ville tallene for ÅDT likevel være forbundet med en metodisk usikkerhet. Størrelsen på denne usikkerheten er knyttet til den aktuelle beregningsmodellen (for eksempel faktor- eller basiskurvemetoden), men generelt er det slik at usikkerheten avtar desto større andel av trafikken som telles. I ekstremtilfellet at alle årets timer er talt, blir den metodiske usikkerheten for ÅDT lik null. De ulike feiltypene nevnt over er omtalt i kapittel i Veileder for innsamling og beregning av trafikkdata til støykartlegging (Vegdirektoratet, 211). Der uttrykkes den metodiske usikkerheten ved beregning av ÅDT fra faktormetoden som U i = (x i (n)) 2 + (y i (m)) 2 + (z i (k)) 2 (A.1) hvor i angir faktorkurvesettet og x i = usikkerheten ved beregning av døgntrafikk fra n timer y i = usikkerheten ved beregning av ukedøgntrafikk fra m dager (A.2) z i = usikkerheten ved beregning av ÅDT fra k uker. Tabeller over x i (n), y i (m) og z i (k) er gitt i vedlegg 3 i Vegdirektoratet (214). Ifølge tabellteksten angir verdiene utvalgsusikkerhet i prosent for beregning av 95% konfidensintervall. Det betyr at x i (n), y i (m) og z i (k) representerer relative usikkerheter. Utover dette er vi ikke kjent med hvordan tallene er framkommet og vil derfor måtte ta verdiene for gitt. Generelt er den metodiske usikkerheten i ÅDT-estimatene bestemt ut fra informasjonsinnholdet i telledataene. Dette er igjen påvirket både av tidspunktet for registreringen og lengden på registreringsperioden. Ved å telle flere timer (eller døgn eller uker), så vil usikkerheten gå ned. Men ikke alle timer bidrar med like mye informasjon. For eksempel vil registreringer i morgen- eller ettermiddagsrushet føre til en lavere usikkerhet enn registreringer tatt over en like lang periode på natta når trafikken typisk utgjør en mindre andel av det totale døgnvolumet. Tabellverdiene i Vegdirektoratet (214) er basert på at kjøretøyregistreringene er gjennomført i perioder med mest trafikk. Har vi registrering for kun én time skal det være den timen i døgnet med mest trafikk, har vi registrering i to timer skal det være de to timene i døgnet med mest trafikk, og så videre. 18 Sammenligning av metoder for beregning av årsdøgntrafikk
19 A.2 Teori Utgangspunktet for formelen (A.1) for usikkerhet er uttrykket for beregning av ÅDT fra korttidstellinger av trafikken. Siden kjøretøy typisk registreres over en begrenset tidsperiode, må det gjøres en skalering av tellingene for å få estimater som er representative for et gjennomsnittsdøgn slik ÅDT er ment å beskrive. Den samlede skaleringsfaktoren er uttrykt gjennom kurver for døgnvariasjon (timesoppløsning), ukevariasjon (ukedagsoppløsning) og årsvariasjon (ukenummeroppløsning). Ulike typer av trafikkvariasjonsmønstre lar seg representere gjennom i alt syv ulike sett av slike faktorkurver. Årsdøgntrafikken for et gitt sett av faktorkurver beregnes ut fra dette som ÅDT = V d u a (A.3) hvor V er registrert antall kjøretøy i telleperioden og hvor produktet d u a utgjør den samlede skaleringsfaktoren. Faktoren d angir telletimenes andel av døgnvolumet (ut fra normert trafikk), u representerer telledøgnets normerte trafikk relativt til gjennomsnittlig ukedøgntrafikk, og a angir telleukens normerte trafikk i forhold til gjennomsnittlig uketrafikk over året. Med normert trafikk forstås historisk trafikkvariasjonsmønster for veger som tilhører den aktuelle gruppen av faktorkurver. Når vi i det følgende utleder bakgrunnen for formelen (A.1), ser vi kun på den usikkerheten som ligger i at d, u og a har en usikkerhet knyttet til seg. Usikkerhet i registrert antall kjøretøy V, derimot, sorterer under det som innledningsvis og i tråd med Vegdirektoratet (211) er definert som tilfeldige feil og inngår ikke i beregningene. Det er likevel viktig å være oppmerksom på at bidraget fra denne komponenten kan være vel så stort som den metodiske usikkerheten, og dette må tas hensyn til når man vurderer den totale usikkerheten i ÅDT. Vi betrakter altså V som gitt (konstant) og representerer usikkerheten i faktorene d, u og a ved å betrakte disse størrelsene som stokastiske variabler med tilhørende forventningsverdier µ d, µ u og µ a og standardavvik σ d, σ u og σ a. Generelt gjelder for en funksjon av stokastiske variabler at uttrykk for forventningsverdi og varians kan tilnærmes via en Taylorutvikling rundt forventningsverdiene til enkeltvariablene. For variansen er det oftest tilstrekkelig å ta med første ordens ledd i Taylorrekka. For en funksjon f(x) bestående av p stokastiske variabler, X = (X 1, X 2,..., X p ), kan variansen dermed skrives p σf 2 = Var(f(X)) i=1 j=1 p ( ) ( ) f f x i x j σ i,j (A.4) hvor σ i,j betegner kovariansen mellom X i og X j og hvor tilfellet i = j representerer variansen. Av spesiell interesse for ÅDT gitt som i (A.3) er uttrykket for variansen til den inverse av en stokastisk variabel X 1 med standardavvik σ 1. Fra (A.4) følger at det relative standardavviket til f(x) = 1/X 1 er gitt som σ f f(x) ( ) 2 σ1. (A.5) X 1 Sammenligning av metoder for beregning av årsdøgntrafikk 19
20 Forutsetter vi at variablene d, u og a i (A.3) er ukorrelerte slik at σ i,j = for i j i (A.4), kan uttrykket i (A.5) utvides til σ ÅDT ÅDT = ( ) 2 σd + µ d ( σu µ u ) 2 + ( σa µ a ) 2. (A.6) Sammenholder vi (A.6) med den opprinnelige formelen for usikkerhet gitt i (A.1), gjenkjenner vi U i som den relative usikkerheten σ ÅDT. Videre tilsvarer x ÅDT i(n) den relative usikkerheten σ d µ d, mens y i (m) = σu µ u og z i (k) = σa µ a. Med en slik fortolkning betegner dermed usikkerhetene i (A.2) det man innenfor stastistikkfaget mer presist omtaler som variasjonskoeffisienter definert som forholdet mellom standardavvik og forventningsverdi. A.3 En anvendelse Årsdøgntrafikken gitt i (A.3) er uttrykk for den gjennomsnittlige døgntrafikken over året. I henhold til det såkalte sentralgrenseteoremet innenfor statistikken kan det derfor argumenteres for at ÅDT asymptotisk følger en normalfordeling. For en normalfordelt stokastisk variabel X med ukjent forventning µ og kjent standardavvik σ gjelder generelt at et konfidensintervall for µ på nivå α er gitt som ( µ u α 2 σ, µ + u α 2 σ ) (A.7) hvor µ er en punktestimator for µ og u α er α 2 2 -kvantilen i standard normalfordelingen. Et 95% konfidensintervall tilsvarer α = 5% med u.25 = Som en tilnærmelse angis ofte et 95% konfidensintervall som punktestimatet for parameteren ±2 standardavvik. På side 62 i avsnitt i Veileder i trafikkdata, Håndbok V714 (Vegdirektoratet, 214) er det i Eksempel 4 vist hvordan et 95% konfidensintervall for ÅDT-verdien kan bestemmes som ÅDT ± U i ÅDT. En sammenligning med uttrykket for et nivå-α konfidensintervall i (A.7) viser at faktoren tilsvarende u α -kvantilen ikke inngår eksplisitt i disse beregningene. Imidlertid kan det være at u α -kvantilen er bakt inn i verdiene for x i(n), y 2 2 i (m) og z i (k) i (A.1). Fortolkningen av disse størrelsene blir da en litt annen enn i avsnitt A.2 ved at u α 2 også kommer inn som en faktor (x i(n) = u α 2 σd µ d, etc). Ved å innlemme kvantilen i tabellverdiene mister man fleksibilitet i usikkerhetsberegningene ved at alle konfidensintervaller låses til et fast nivå (α = 5% gir kun mulighet for å beregne 95% intervaller). Som nevnt i avsnitt A.1, er vi ikke kjent med hvordan verdiene i tabellene for beregning av usikkerhet er framkommet. Vi kan dermed heller ikke si nøyaktig hva de representerer. Men dersom α 2 -kvantilen ikke er trukket inn i tabellverdiene og vi samtidig forutsetter at usikkerheten U i i (A.1) faktisk representerer en variasjonskoeffisient slik utledningen i avsnitt A.1 gir grunn til å tro, så innebærer det at konfidensintervallet i Eksempel 4 beregnes som ÅDT± σ ÅDT. Dette tilsvarer i så fall et 68% konfidensintervall (punktestimat pluss/minus ett standardavvik), og ikke 95%. 2 Sammenligning av metoder for beregning av årsdøgntrafikk
Falske positive i lusetellinger?
Falske positive i lusetellinger? 50 % grense = 0,2 grense = 0,5 Sannsynlighet for en falsk positiv 40 % 30 % 20 % 10 % 0 % 0,0 0,1 0,2 0,3 0,4 0,5 Faktisk lusetall Notatnr Forfatter SAMBA/17/16 Anders
Beregning av trafikkvolum ved hjelp av basiskurvemetoden - En innføring
Beregning av trafikkvolum ved hjelp av basiskurvemetoden - En innføring SAMBA/5/ Magne Aldrin Ola Haug Januar 2 NR Norsk Regnesentral ANVENDT DATAFORSKNING NR-notat/NR-Note Tittel/Title: Beregning av trafikkvolum
Følsomme lusetellinger ved forslag til ny forskrift. Anders Løland
Følsomme lusetellinger ved forslag til ny forskrift Notatnr Forfatter SAMBA/01/12 Anders Løland Dato 11. januar 2012 Norsk Regnesentral Norsk Regnesentral (NR) er en privat, uavhengig stiftelse som utfører
Rekrutteringsfunksjoner for sild, torsk og lodde
Rekrutteringsfunksjoner for sild, torsk og lodde Sild 0 50 100 150 200 250 300 Beverton-Holt Ricker linear regression paa log-skala 0 2 4 6 8 10 12 14 Gytebimoasse (millioner tonn) Torsk 0 5 10 15 20 25
Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår
Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x
ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper
ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker
Veileder i trafikkdata
Formålet med veilederen er: Dokumentasjon av vegtrafikkdatasystem Kunnskapsoverføring til nye medarbeidere Bedre kvaliteten på trafikkregistreringer og målestasjonene Bedre kvalitet på trafikkdata Bedre
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis
Faktorvariasjonskurver -faktorkurvemetoden
Kjell Johansen Utbyggingsavdelingen, Vegdirektoratet Registrering av trafikk har som det mest sentrale mål å si noe trafikkens nivå. Dette gjøres enkelt ved å bruke trafikkparameteren ÅDT. Ressursmangel
Et lite notat om og rundt normalfordelingen.
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte
TMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler
STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Boka (Ch 1.4) motiverer dette ved å gå fra histogrammer til tetthetskurver.
Et lite notat om og rundt normalfordelingen.
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte
TMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).
Econ 130 HG mars 017 Supplement til forelesningen 7. februar Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.0). Regel 5.19 sier at summer, Y X1 X X
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Fra første forelesning: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av
ECON2130 Kommentarer til oblig
ECON2130 Kommentarer til oblig Her har jeg skrevet ganske utfyllende kommentarer til en del oppgaver som mange slet med. Har noen steder gått en del utover det som det strengt tatt ble spurt om i oppgaven,
TMA4240 Statistikk Høst 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte
TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag
TMA4245 Statistikk Vår 2017 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3 Dette er den første av to innleveringer i blokk 2 Denne øvingen skal oppsummere pensum
Eksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Sara Martino a, Torstein Fjeldstad b Tlf: a 994 03 330, b 962 09 710 Eksamensdato: 28. november 2018 Eksamenstid
betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2
ECON30: EKSAMEN 06v SENSORVEILEDNING. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i
Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.
Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon
TMA4240 Statistikk Høst 2016
TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper
TMA4240 Statistikk Høst 2018
TMA4240 Statistikk Høst 2018 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 5 Dette er andre av tre innleveringer i blokk 2. Denne øvingen skal oppsummere pensum
i x i
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale
Statistikk 1. Nico Keilman. ECON 2130 Vår 2014
Statistikk 1 Nico Keilman ECON 2130 Vår 2014 Pensum Kap 1-7.3.6 fra Løvås «Statistikk for universiteter og høgskoler» 3. utgave 2013 (eventuelt 2. utgave) Se overspringelsesliste på emnesiden Supplerende
Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere
Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for
TMA4240 Statistikk 2014
TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
Løsningsforslag til obligatorisk oppgave i ECON 2130
Andreas Mhre April 15 Løsningsforslag til obligatorisk oppgave i ECON 13 Oppgave 1: E(XY) = E(X(Z X)) Setter inn Y = Z - X E(XY) = E(XZ X ) E(XY) = E(XZ) E(X ) E(XY) = - E(X ) X og Z er uavhengige, så
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Kapittel 7: Utvalgsfordeling Bo Lindqvist Institutt for matematiske fag 2 Fra kapittel 1: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg
Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere
2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon bruker kjikvadrat-fordelingen ( chi-square distribution ) (der kji er den
Fasit for tilleggsoppgaver
Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x
TMA4245 Statistikk Eksamen august 2014
TMA4245 Statistikk Eksamen august 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Oppgave 1 En bedrift produserer en type medisin i pulverform Medisinen selges på flasker
Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind
Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind [email protected] Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator
Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere
2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende
Vedlegg: Faktormetoden
Vedlegg: Faktormetoden Faktormetoden er en relativt enkel metode hvor en ved hjelp av relativt få variasjonskurver for døgn-, uke- og årsvariasjon kan beregne ÅDT. Ved beregning av ÅDT i et punkt må man
ØVINGER 2017 Løsninger til oppgaver. Øving 1
ØVINGER 017 Løsninger til oppgaver Øving 1.1. Frekvenstabell For å lage en frekvenstabell må vi telle antall observasjoner av hvert antall henvendelser. Siden antall henvendelser på en gitt dag alltid
STK Oppsummering
STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS
Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS Denne artikkelserien handler om statistisk behandling av kalibreringsresultatene. I de fleste tilfeller
Trafikkanalyse Midtun Leir 1 Innledning
Trafikkanalyse Midtun Leir 1 Innledning I forbindelse med utarbeiding av privat forslag til reguleringsplan for Midtun Leir er det utarbeidet en trafikkanalyse med henblikk på hvilke følger tiltak i henhold
Eksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
Kort overblikk over kurset sålangt
Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente
HØGSKOLEN I STAVANGER
EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN
Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere
2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger
TMA4240 Statistikk Høst 2009
TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave
TMA4240 Statistikk Høst 2015
TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Oppgave 1 X er kontinuerlig fordelt med sannsynlighetstetthet f(x) = 2xe
Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind
Forelesning 7: Store talls lov, sentralgrenseteoremet Jo Thori Lind [email protected] Oversikt 1. Estimering av variansen 2. Asymptotisk teori 3. Store talls lov 4. Sentralgrenseteoremet 1.Estimering
Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk
Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor
for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3, blokk II Dette er den første av to innleveringer i blokk 2. Denne øvingen skal oppsummere
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 22/3, 2006. Tid for eksamen: Kl. 09.00 11.00. Tillatte hjelpemidler:
ÅMA110 Sannsynlighetsregning med statistikk, våren
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 24. april Bjørn H. Auestad Oppsummering våren
år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9
TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører
UNIVERSITETET I OSLO
Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13. oktober 2010. Tid for eksamen: 15:00 17:00. Oppgavesettet
TMA4240 Statistikk H2017 [15]
TMA4240 Statistikk H207 [5] Del 2: Statistisk inferens Populasjon og utvalg [8.] Observatorer og utvalgsfordelinger [8.2-8.3] Fordeling til gjennomsnittet og sentralgrenseteoremet [8.4] Normalplott [8.8]
STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner
STK1100 våren 2017 Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner Svarer til avsnittene 4.1 og 4.2 i læreboka Ørnulf Borgan Matematisk institutt Universitetet i
Gammafordelingen og χ 2 -fordelingen
Gammafordelingen og χ 2 -fordelingen Gammafunksjonen Gammafunksjonen er en funksjon som brukes ofte i sannsynlighetsregning. I mange fordelinger dukker den opp i konstantleddet. Hvis man plotter n-fakultet
TMA4240 Statistikk 2014
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave Scriptet run confds.m simulerer n data x,..., x n fra en normalfordeling med
TMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 9.6: Prediksjonsintervall 9.8: To utvalg, differanse µ 1 µ 2 Mette Langaas Foreleses mandag 18.oktober, 2010 2 Prediksjonsintervall for fremtidig observasjon,
Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1
ECON 0 EKSAMEN 004 VÅR SENSORVEILEDNING Oppgaven består av 0 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom
Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg
ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.
ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 0, s. 1 (Det tas forbehold om feil i løsningsforslaget.) a) Gjennomsnitt: x = 1 Emp. standardavvik: Median: 1 (1.33 + 1.) = 1.35
Bootstrapping og simulering Tilleggslitteratur for STK1100
Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 (oppdatert April 2016) 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor
Eksamensoppgave i ST0103 Brukerkurs i statistikk
Institutt for matematiske fag Eksamensoppgave i ST0103 Brukerkurs i statistikk Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: August 2018 Eksamenstid (fra til): 09:00 13:00 Hjelpemiddelkode/Tillatte
UNIVERSITETET I OSLO Matematisk Institutt
UNIVERSITETET I OSLO Matematisk Institutt Midtveiseksamen i: STK 1000: Innføring i anvendt statistikk Tid for eksamen: Onsdag 9. oktober 2013, 11:00 13:00 Hjelpemidler: Lærebok, ordliste for STK1000, godkjent
Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE
Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE MET1002 Statistikk Grunnkurs 7,5 studiepoeng Torsdag 14. mai 2007 kl. 09.00-13.00 Faglærer: Sjur Westgaard (97122019) Kontaktperson
Medisinsk statistikk Del I høsten 2009:
Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X
(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1
ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2011, s. 1 (Det tas forbehold om feil i løsningsforslaget.) Oppgave 1 a) Data: x 1, x 2, x 3, x 4, x 5 Gjennomsnitt: x = 1 5 (x 1
STK1100 våren 2019 Mere om konfidensintevaller
STK1100 våren 2019 Mere om konfidensintevaller Svarer til avsnitt 8.2 i læreboka Ørnulf Borgan Matematisk institutt Universitetet i Oslo 1 Konfidensintervall for µ i store utvalg Anta at de stokastiske
Kap. 8: Utvalsfordelingar og databeskrivelse
Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling
Tabell 1: Beskrivende statistikker for dataene
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7, blokk II Løsningsskisse Oppgave 1 a) Utfør en beskrivende analyse av datasettet % Data for Trondheim: TRD_mean=mean(TRD);
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 101 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Mandag 30. november 1992. Tid for eksamen: 09.00 15.00.
ST0103 Brukerkurs i statistikk Høst 2014
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST0103 Brukerkurs i statistikk Høst 2014 Løsningsforslag Øving 1 2.1 Frekvenstabell For å lage en frekvenstabell må vi telle
EN LITEN INNFØRING I USIKKERHETSANALYSE
EN LITEN INNFØRING I USIKKERHETSANALYSE 1. Forskjellige typer feil: a) Definisjonsusikkerhet Eksempel: Tenk deg at du skal måle lengden av et noe ullent legeme, f.eks. en sau. Botemiddel: Legg vekt på
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST0 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Torsdag 9. mai 994. Tid for eksamen: 09.00 5.00. Oppgavesettet
TMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.
1 ECON213: EKSAMEN 217 VÅR - UTSATT PRØVE TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i
ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering
ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren
Løsning eksamen desember 2017
Løsning eksamen desember 017 Oppgave 1 Innfører hendelsene D: enheten er defekt K: enheten blir kassert a i Disse sannsynlighetene kan leses ut av oppgaveteksten: P D = 0, 10 P K D = 0, 07 P K D = 0, 95
Konvertering fra døgn- til timemiddelbaserte varslingsklasser for svevestøv i Bedre byluft Sam-Erik Walker
NILU: OR 60/2003 NILU: OR 60/2003 REFERANSE: O-2205 DATO: AUGUST 2003 ISBN: 82-425-1490-9 Konvertering fra døgn- til timemiddelbaserte varslingsklasser for svevestøv i Bedre byluft Sam-Erik Walker 1 Innhold
Seksjon 1.3 Tetthetskurver og normalfordelingen
Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data ved tall Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver
