UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Like dokumenter
UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

vekt. vol bruk

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMENSOPPGAVER STAT100 Vår 2011

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

UNIVERSITETET I OSLO

Tilleggsoppgaver for STK1110 Høst 2015

Løsningsforslag eksamen STAT100 Høst 2010

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

ECON240 VÅR / 2016 BOKMÅL

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

UNIVERSITETET I OSLO

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider.

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2016

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4240 Statistikk

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Eksamensoppgave i TMA4255 Anvendt statistikk

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

TMA4240 Statistikk Høst 2009

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Eksamensoppgave i TMA4245 Statistikk

HØGSKOLEN I STAVANGER

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

UNIVERSITETET I OSLO

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA-2004.

Løsningsforslag eksamen 25. november 2003

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

EKSAMENSOPPGAVE STA-1001.

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

TMA4240 Statistikk Høst 2009

STK juni 2016

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

Eksamensoppgave i ST0103 Brukerkurs i statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Skoleeksamen i SOS Kvantitativ metode

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

ST0202 Statistikk for samfunnsvitere

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Fasit for tilleggsoppgaver

TMA4240 Statistikk Høst 2007

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO

Oppgave N(0, 1) under H 0. S t n 3

TMA4240 Statistikk 2014

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO Matematisk Institutt

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Transkript:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte hjelpemidler: Oppgave 1. Tabeller for χ 2, t og F fordelingene. Godkjent kalkulator og formelsamling for STK1100/ STK1110 og for STK1120. Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. For å sammenlikne tre ulike typer investeringsfond (som vi her vil kalle A, B og C), ble 2000 kroner investert i 18 ulike fond, 6 av hver type, i en periode på 5 år. For hver investering ble gevinsten (i kroner) registrert og er gitt i tabellen nedenfor. Vi vil anta en modell A B C 13288 15738 14790 12782 14249 13827 12812 12369 13680 11713 12822 13150 11201 12117 12669 12233 12605 14267 Y ij = µ + α i + e ij, i = 1,..., I, j = 1,..., J (1) for disse data. De vanlige antagelser vil gjelde for e ij -ene. En Anova tabell for analyse av disse data er gitt nedenfor. (Fortsettes side 2.)

Eksamen i STK1120, Mandag 4. juni 2007. Side 2 Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) fund 2 6134625 3067312 2.9258 0.08455 Residuals 15 15725266 1048351 (a) Sett opp den hypotesen som testes. Forklar hvordan du kan bruke tallene i Anova tabellen for å teste hypotesen og formulér en konklusjon på testen når du bruker signifikansnivå 0.05. Vi vil nå diskutere mer generelt modellen (1). Anta vi ønsker å teste hypoteser på formen H 0 : I c i α i = 0 (2) i=1 der I i=1 c i = 0. C = I i=1 c iα i kalles gjerne en kontrast. (b) Definer Ĉ = I i=1 c iy i der Y i = 1 J J j=1 Y ij. Finn forventningen til Ĉ og vis at denne forventningen blir lik 0 under H 0. Vis også at E[Ĉ2 ] = C 2 + var[ĉ]. (c) Finn variansen til Ĉ og vis at den kan skrives som var[ĉ] = σ2 K C for en konstant K C. Definer SS C = b C 2 K C. Argumenter for at F C = SS C /1 SS W /(IJ J), der SS W = I i=1 J (Y ij Y i ) 2. er en fornuftig testobservator for å teste H 0. For hva slags verdier (store og/eller små) av F C bør H 0 forkastes? (d) Vis at SS C /σ 2 blir χ 2 -fordelt med 1 frihetsgrad og at SS C er uavhengig av SS W. Argumenter også for at F C er F -fordelt med 1 og IJ J frihetsgrader. (e) Returner nå til investeringsdataene. Anta vi ønsker å teste om den forventede verdien for den første typen investeringsfond er lik gjennomsnittet av de forventede verdier for de to andre typer investeringsfond. (Fortsettes side 3.) j=1

Eksamen i STK1120, Mandag 4. juni 2007. Side 3 Spesifisér dette som en test av en hypotese på formen (2). Den tilhørende F C verdi blir i dette tilfellet 5.362 (dette behøver du ikke å regne ut). Utfør testen og formulér en konklusjon når du igjen bruker signifikansnivå 0.05. Diskutér konklusjonen i forhold til den konklusjon du fikk i (a). Oppgave 2. Genetisk variabilitet er antatt å være en sentral faktor i overlevelse av arter. Idéen er at populasjoner med mange forskjellige individer vil ha bedre sjanser for å klare seg i nye omgivelser. Tabellen nedenfor viser resultatene av et studie designet for å teste hypotesen eksperimentelt (hentet fra Larsen og Marx: An Introduction to Mathematical Statistics and Its Applications). To populasjoner av bananfluer, en som var kryssavlet (populasjon A med stor genetisk variabilitet) og en som var innavlet (populasjon B med mindre genetisk variabilitet) ble puttet i forseglede beholdere der mat og rom ble holdt til et minimum. Hver hundrede dag ble antall levende fluer i hver populasjon registert. Merk at dette vil være antall fluer i de neste generasjoner da bananfluer har levealder godt under 100 dager. Dag nummer (x A = x B ) Populasjon A (y A ) Populasjon B (y B ) 0 100 100 100 250 203 200 304 214 300 403 295 400 446 330 500 482 324 I figuren nedenfor er dataene plottet sammen med regresjonslinjer for modellene yi A =β0 A + βa 1 xa i + e A i, i = 1,..., 6; yi B =β0 B + βb 1 xb i + e B i, i = 1,..., 6. (3) For begge populasjonene antas støyleddene å være uavhengige og normalfordelte med forventning 0 og felles varians σ 2. Det antas også uavhengighet mellom de to populasjonene. (Fortsettes side 4.)

Eksamen i STK1120, Mandag 4. juni 2007. Side 4 Populasjonsstørrelse 100 200 300 400 ya=145.3+0.742xa yb=131.3+0.452xb Populasjon A Populasjon B 0 100 200 300 400 500 Dag nummer β 1 -parametrene beskriver endringer i populasjonsstørrelser og kan brukes som indikatorer på overlevelsesmulighetene til populasjonene. Vi vil i denne oppgaven derfor se på hvordan vi kan teste H 0 : β A 1 = βb 1 mot H A : β A 1 > βb 1. (a) La ˆβ 1 A og ˆβ 1 B være minste kvadraters estimatene til henholdsvis β1 A og under de to lineære regresjonsmodellene. β B 1 Hva er forventningen til ˆβ A 1 ˆβ B 1 under modell (3)? Hva blir variansen til ˆβ 1 A ˆβ 1 B under den samme modellen? (Du kan her bruke at var[ ˆβ 1 A] = var[ ˆβ 1 B] = P σ 2 6 uten å utlede i=1 (x i x) 2 dette.) Argumenter for at T = ˆβ A 1 ˆβ B 1 s ˆβA 1 ˆβ B 1 (4) er en fornuftig test-observator å bruke for å teste H 0 mot H A under modell (3). (Her er s ˆβA 1 ˆβ standardfeilen til ˆβ A 1 B 1 ˆβ 1 B.) En kan vise at under modell (3) og H 0 så vil T følge en t-fordeling med 8 frihetsgrader (dette behøver du ikke å vise). (b) For de gitte data blir T = 2.49. Bruk dette til å utføre en test på H 0 og formuler en konklusjon. (c) Anta nå vi er noe usikre på antagelsene som ligger til grunn for modellene. Diskuter hvordan man kan bruke bootstrapping til å konstruere konfidensintervall for β A 1 βb 1. Testprosedyren ovenfor er basert på separate regresjonsmodeller for hver av de to populasjonene. Et alternativ vil være å bruke en felles modell { β 0 + β1 A x i + e i for i en observasjon fra populasjon A y i = β 0 + β1 Bx (5) i + e i for i en observasjon fra populasjon B der i nå er en indeks som løper over alle 12 observasjoner. (Fortsettes side 5.)

Eksamen i STK1120, Mandag 4. juni 2007. Side 5 (d) Skriv modellen (5) som en multippel lineær regresjonsmodell med passende valg av forklaringsvariable. Argumenter for hvorfor dette kan være en rimelig modell å bruke i den aktuelle situasjonen. Tabellen nedenfor viser utskrift fra en regresjonsanalyse for fellesmodellen (5). I tillegg får du oppgitt at den estimerte korrelasjonen mellom ˆβ 1 A og ˆβ 1 B er 0.52. Estimate Std. Error t value β 0 138.33333 16.76581 8.251 β1 A 0.76109 0.06358 11.971 β1 B 0.43291 0.06358 6.809 T -observatoren gitt i (4) kan brukes for å teste H 0 også i dette tilfellet, men nye verdier for estimatet av differansen og dets standardfeil må da brukes. En kan vise at T under modellen (5) og under H 0 blir t-fordelt med 9 frihetsgrader (dette behøver du ikke å vise). Den observerte verdien for T blir under den nye modellen lik 5.268. (e) Gi en verbal begrunnelse for hvorfor vi nå ender opp med 9 frihetsgrader i stedet for 8 som vi hadde da vi brukte separate regresjonsmodeller. Hva blir konklusjonen av å teste H 0 basert på modellen (5)? Hvorfor er det rimelig at vi får en mindre P-verdi i dette tilfellet? Oppgave 3. Tabellen nedenfor viser hvor mange som overlevde forliset av Titanic fordelt på om de var mannskap ombord eller 1., 2. eller 3. klasses passasjerer (tallene i parentes viser E ij -verdiene som brukes i en kji-kvadrattest på disse data). Du får også oppgitt at kji-kvadrat testobservatoren X 2 er 187.79. Mannskap 1. klasse 2. klasse 3. klasse Totalt Overlevd 212 202 118 178 710 (285.48) (104.84) (91.94) (227.74) Død 673 123 167 528 1491 (599.52) (220.16) (193.06) (478.26) Totalt 885 325 285 706 2201 Vi ønsker å undersøke om sjansen for å overleve er den samme uansett status på skipet. Formuler en passende null hypotese for teste dette. Utfør testen og formuler en konklusjon. Hva er de mest slående avvik fra null hypotesen? SLUTT