Eksamensoppgave i ST0103 Brukerkurs i statistikk

Like dokumenter
Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2009

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i TMA4245 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4255 Anvendt statistikk

TMA4240 Statistikk 2014

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4255 Anvendt statistikk

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamensoppgave i MA1202/MA6202 Lineær algebra med anvendelser

Eksamensoppgave i SØK1004 Statistikk for økonomer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4295 Statistisk inferens

Eksamensoppgåve i TMA4245 Statistikk

TMA4240 Statistikk Høst 2018

ST0202 Statistikk for samfunnsvitere

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4250 Romlig Statistikk

Eksamensoppgave i TMA4275 Levetidsanalyse

Eksamensoppgave i TMA4267 Lineære statistiske modeller

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgave i TMA4275 Levetidsanalyse

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamensoppgave i TMA4275 Levetidsanalyse

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk Eksamen desember 2016

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Eksamensoppgave i SØK1004 Statistikk for økonomer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4240 Statistikk Høst 2009

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

EKSAMEN I FAG TMA4240 STATISTIKK

TMA4240 Statistikk Høst 2016

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

HØGSKOLEN I STAVANGER

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Faktor - en eksamensavis utgitt av ECONnect

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i SØK Statistikk for økonomer

UNIVERSITETET I OSLO

EKSAMEN I TMA4240 Statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

HØGSKOLEN I STAVANGER

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk Eksamen desember 2015

EKSAMENSOPPGAVE. Eksamen i: STA Brukerkurs i statistikk 1 Mandag 03. juni 2013 Kl 09:00 13:00 Åsgårdvegen 9

Eksamensoppgave i TMA4267 Lineære statistiske modeller

TMA4240 Statistikk Høst 2015

Eksamensoppgave i TMA4265 Stokastiske Prosesser

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

vekt. vol bruk

Eksamensoppgave i TMA4320 Introduksjon til vitenskapelige beregninger

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgave i TMA4115 Matematikk 3

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2016

UNIVERSITETET I OSLO

LØSNINGSFORSLAG ) = Dvs

TMA4265 Stokastiske prosesser

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

UNIVERSITETET I OSLO

TMA4265 Stokastiske prosesser

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Transkript:

Institutt for matematiske fag Eksamensoppgave i ST0103 Brukerkurs i statistikk Faglig kontakt under eksamen: Jarle Tufto Tlf: 99 70 55 19 Eksamensdato: 3. desember 2016 Eksamenstid (fra til): 09:00-13:00 Hjelpemiddelkode/Tillatte hjelpemidler: C: Bestemt enkel kalkulator. Tabeller og formler i statistikk (Tapir akademisk forlag). Ett gult A4-ark med egne håndskrevne notater. Annen informasjon: Noen formler for bruk i regresjonsanalyse er gitt i vedlegg. Alle svar skal begrunnes (f.eks. ved at mellomregning tas med eller ved henvisning til teori eller eksempler fra pensum). I vurderingen teller hvert av de ti bokstavpunktene likt. Målform/språk: bokmål Antall sider: 5 Antall sider vedlegg: 1 Informasjon om trykking av eksamensoppgave Originalen er: 1-sidig 2-sidig sort/hvit farger skal ha flervalgskjema Dato Kontrollert av: Sign Merk! Studenter finner sensur i Studentweb. Har du spørsmål om din sensur må du kontakte instituttet ditt. Eksamenskontoret vil ikke kunne svare på slike spørsmål.

ST0103 Brukerkurs i statistikk, 3. desember 2016 Side 1 av 5 Oppgave 1 Ved et botanisk institutt gjorde man en undersøkelse av forekomsten av en bestemt type sopp i myrjord. Dette ble gjort ved at man på et bestemt myrområde tok opp sylindre av jord med en jordskrue, vasket røttene, og deretter bestemte andelen av rotceller med sopp. Andelen ble oppgitt med enhet prosent. La X være resultatet av en slik prøve. Fra lang erfaring regnes som kjent at X er normalfordelt med forventning 42.0 og standardavvik 4.0. Resultater fra forskjellige prøver antas å være stokastisk uavhengige. a) Hva er sannsynligheten for at en måling av X er mindre enn 35? Finn sannsynligheten for at en måling er mellom 35 og 45. Tegn inn de to sannsynlighetene som arealer på en enkel skisse av sannsynlighetstettheten til X. b) Anta i dette punktet at det ble gjort fire prøver. Hva er sannsynligheten for at gjennomsnittet av de fire prøvene er under 35? Hva er sannsynligheten for at minst tre av de fire prøvene er mellom 35 og 45? Oppgave 2 La situasjonen være som i Oppgave 1. På en annen del av myrområdet består jordsmonnet hovedsakelig av bleket sand. Man ønsket å finne ut om andelen av sopp er en annen i denne jordtypen enn i myrjorda der prøvene beskrevet i Oppgave 1 ble tatt. Det ble tatt 20 prøver i det nye området på samme måte som beskrevet i begynnelsen av Oppgave 1. Dette ga målingene X 1, X 2,..., X 20 gitt nedenfor. Målingene antas å være realisasjoner av uavhengige og identisk normalfordelte variabler med ukjent forventning µ og samme standardavvik som for de første prøvene, σ = 4.0. (Analysene nedenfor skal altså gjøres med kjent σ.) Målinger: 37.99 46.49 36.92 48.10 42.70 49.91 39.10 46.43 39.52 40.40 47.11 41.32 42.61 47.99 44.19 47.40 49.42 45.52 44.84 41.45 Du kan bruke at 20 X i = 879.41.

Side 2 av 5 ST0103 Brukerkurs i statistikk, 3. desember 2016 a) Finn et punktestimat for µ basert på målingene, og beregn dets standardfeil, dvs. standardavviket for estimatoren. Finn også et 95% konfidensintervall for µ. b) Forklar kort hvorfor botanikernes problemstilling medfører testing av H 0 : µ = 42.0 mot H 1 : µ 42.0. Gjennomfør testingen med de gitte dataene og angi konklusjonen når signifikansnivået settes til 0.05. Beregn også den tilhørende p-verdi. Hvilken fortolkning har den? c) Hva menes med type I-feil og type II-feil i hypotesetesting? Hva er sannsynligheten for type I-feil i testen i forrige punkt? Hva er sannsynligheten for type II-feil ved denne testen dersom µ i virkeligheten er 45.0? Oppgave 3 Som en del av en større geologisk undersøkelse har man studert kjerneprøver av sand med formål å beskrive sammenhengen mellom effektiv diffusjon og graden av sementering. Den effektive diffusjon beskriver hvor lett gasser diffunderer gjennom sandkjernen og representeres ved en måling d. Graden av sementering for en sandkjerne er et tall mellom 0 og 1 og betegnes med c. Man ønsker å beskrive d som funksjon av c og forventer en sammenheng der θ og β er ukjente parametre. d = θ(1 c) β, (1) For å estimere θ og β gjøres et eksperiment der man starter med å måle den effektive diffusjon D for en sandkjerne med c = 0. Deretter økes sementeringen gradvis ved tilsetting av koppersulfat, og man måler de korresponderende verdier av c og D. Dette gir tilsammen 10 sammenhørende verdier av D og c, (D 1, c 1 ), (D 2, c 2 ),..., (D 10, c 10 ).

ST0103 Brukerkurs i statistikk, 3. desember 2016 Side 3 av 5 a) Vis, ved å ta den naturlige logaritmen på hver side av likheten i (1), at vi kan beskrive den forventede sammenhengen (1) ved y = α + βx der y = ln d, α = ln θ og x = ln(1 c). Basert på dette bestemmer man seg for å analysere dataene med en enkel lineære regresjonsmodell der Y i = ln D i og x i = ln(1 c i ). Y i = α + βx i + e i, i = 1, 2,..., 10 (2) Hvilke antagelser ligger generelt til grunn for bruk av modellen (2)? Diskuter kort i hvilken grad de kan antas oppfylt i den gitte situasjonen. Tabellen nedenfor gir verdiene av c i og de tilhørende responser D i = d i, samt de transformerte x i og y i som brukes i regresjonsanalysen. i c i d i x i = ln(1 c i ) y i = ln d i 1 0,000 234.102 0.000 5.456 2 0.080 165.961-0.083 5.112 3 0.160 90.990-0.174 4.511 4 0.250 82.496-0.288 4.413 5 0.307 43.413-0.367 3.771 6 0.380 28.156-0.478 3.338 7 0.460 11.903-0.616 2.477 8 0.520 8.747-0.734 2.169 9 0.590 4.589-0.892 1.524 10 0.672 1.165-1.115 0.153 Det oppgis at x i = 4.747, x 2 i = 3.440, y i = 32.924, y 2 i = 134.273, xi y i = 10.108. Du kan også bruke at SS E = 0.1898 og (x i x) 2 = 1.187. I regningen kan du bruke formler som er gitt i vedlegget og i tabellene. Et spredningsplott for de beregnede (x i, y i ) med inntegnet regresjonslinje er til orientering gitt på neste side.

Side 4 av 5 ST0103 Brukerkurs i statistikk, 3. desember 2016 b) Beregn punktestimatene ˆα og ˆβ for α og β basert på minste kvadraters metode ved å bruke de oppgitte resultatene. Finn også et punktestimat for parameteren θ fra ligning (1). Beregn punktestimatet S for σ og bruk dette til å finne standardfeilen for estimatet ˆβ. Finn også et 95% konfidensintervall for β. Hvor stor andel av variasjonen i responsene forklares av regresjonsmodellen? Gi en kommentar i lys av spredningsplottet.

ST0103 Brukerkurs i statistikk, 3. desember 2016 Side 5 av 5 Oppgave 4 En biolog er interessert i å undersøke forekomsten av en sjelden insektsart, i det følgende kalt art A, i et bestemt område. Det settes opp en såkalt malaisefelle (en stor, telt-lignende struktur) og det antas at insekter av art A fanges i fellen som en Poisson-prosess med intensitet (rate) λ pr. time. La X være antallet insekter av art A som fanges i løpet av en uke (= 168 timer). Biologen anslår før undersøkelsen at λ er 0.01. Denne verdi for λ skal brukes i punktene a) og b). a) Gjør rede for at X er Poisson-fordelt med forventning µ = 1.68. Hva er sannsynligheten for at biologen ikke vil finne noen insekter av art A i fellen etter en uke? Hva er sannsynligheten for at det er minst tre insekter av art A i fellen? Anta nå at fellen ble stående i to uker. Gitt at det ble fanget minst tre insekter av art A i løpet av de to ukene, hva er sannsynligheten for at ingen ble fanget den første uken? b) La T være tiden, målt i timer, til det første insektet av art A blir fanget i fellen. (Se i dette punktet bort fra at fellen er montert bare en begrenset tid.) Hvilken fordeling har T? Hva er sannsynligheten for at ingen insekter av art A fanges i løpet av de første 48 timene, dvs. T > 48? Gitt at ingen insekter av art A fanges i løpet av de første 48 timene, hva er sannsynligheten for at det heller ikke fanges noen i løpet av de neste 48 timene? Kommenter resultatet. Biologen er ikke lenger sikker på sitt tidligere anslag av λ og vil estimere λ. Han lar fellen stå i fem uker og finner Y insekter av art A. c) Hvilken sannsynlighetsfordeling har Y? Sett opp en forventningsrett estimator ˆλ for λ basert på Y. Hva blir estimatet hvis det observeres at Y = 15? Hva blir standardfeilen (dvs. estimert standardavvik) for dette estimatet?

ST0103 Brukerkurs i statistikk, 3. desember 2016 Side i av i Supplement til Noen resultater fra regresjonsanalysen i Tabeller og formler i statistikk, Tapir akademisk forlag. Formlene bygger på summene: x i, x 2 i, y i, yi 2, x i y i Minste kvadraters metode gir da: Fra læreboka: Her er: ˆβ = n( n x i y i ) ( n x i )( n y i ) n( n x 2 i ) ( n x i ) 2 ˆα = ( n y i ) ˆβ( n x i ) n (y i ȳ) 2 = (ˆα + ˆβx i ȳ) 2 + (y i ˆα ˆβx i ) 2 } {{ } } {{ } } {{ } SS T SS R SS E SS T = ( yi 2 ) 1 n n ( y i ) 2 SS E = ( yi 2 ) ˆα( y i ) ˆβ( x i y i ) Forventningsrett estimator for σ 2 : S 2 = SS E n 2 Statistiske egenskaper ved estimatorene: E(ˆα) = α, E( ˆβ) = β V ar(ˆα) = σ2 n x 2 i n n (x i x) 2, V ar( ˆβ) = σ 2 n (x i x) 2