Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Type innføringsark (rute/linje): Antall sider inkl. forside: Kontaktperson under eksamen: Telefon/mobil: Rute. 6 Georg Elvebakk 77646532 Vil det bli gått oppklaringsrunde i eksamenslokalet? Svar: JA. Hvis JA: ca. kl. 10.30. Postboks 6050 Langnes, N-9037 Tromsø / 77 64 40 00 / postmottak@uit.no / uit.no
VIKTIG: Merk at i R-utskriftene kan noen av talla være erstatta av?. Om ikke anna er spesifisert skal signifikansnivået for tester være 5%. Deloppgavene vil telle likt ved vurderinga. Oppgave 1 Et mekanisk system består av tre komponenter: A, B og C. For at systemet skal virke må minst to av de tre komponentene virke. C B A Vi antar at hver av komponentene har en sannsynlighet på p = 0.80 for å virke og at de virker/virker ikke uavhengig av hverandre. a) Argumenter for hva slags type fordeling vi har for X, antallet komponenter som virker. Finn sannsynligheten for at systemet skal virke. b) Finn sannsynligheten for at systemet virker, gitt at du veit at komponent A virker. Finn sannsynligheten for at komponent A virker, gitt at systemet virker. 2
Oppgave 2 Vi skal i denne oppgava se på målinger av sotpartikler i lufta(partikkelnivå målt i mikrogram per kubikkmeter). Det er tatt n = 10 målinger fra et målested i by A på ulike dager. Vi antar at dette er et tilfeldig utvalg fra en normalfordelt populasjon med forventning µ og standardavvik σ, disse parametrene er her ukjente. > sota [1] 320 316 269 265 263 282 292 279 263 276 > mean(sota) [1] 282.5 > var(sota) [1] 435.8333 a) Utled et 95%-konfidensintervall for µ, og finn intervallestimatet fra observasjonene. Hva forteller dette intervallet deg om sotpartikkelnivået i lufta i byen? Sier det noe om generelt nivå? Sier det noe om daglig nivå? I nabobyen B er de også opptatt av mengden sot i lufta. De har derfor målt sotpartikkelnivået på samme dager som i by A. Resultater for by B, og daglige differanser mellom A og B: > sotb [1] 313 310 272 262 259 270 288 274 268 265 > mean(sotb) [1] 278.1 > var(sotb) [1] 372.3222 > sot_diff = sota - sotb > sot_diff [1] 7 6-3 3 4 12 4 5-5 11 > mean(sot_diff) [1] 4.4 > var(sot_diff) [1] 28.48889 b) Forklar forskjellen på to uavhengige utvalg og to parvise utvalg. Hvilken situasjon dreier dette seg om? Gjør nødvendige antakelser, og sett opp og utfør en test for om forventa sotpartikkelnivå i by A er høgere enn i by B. Oppgi både forkastingsområdet og p-verdien for testen. Vi ønsker å kunne si noe om styrken av denne testen som funksjon av forventa differanse, µ D. For å forenkle utrekningene antar vi nå at standardavviket for differanser er kjent, σ D = 5. c) Utled en styrkefunksjon (funksjon av µ D ) for testen. Finn styrken når µ D = 2 og µ D = 4. Hva forteller disse deg? Hvor mange observasjoner trengs for å få en styrke på 0.90 når µ D = 4? 3
Oppgave 3 I denne oppgava skal vi ta for oss to stokastiske variabler X og Y som har simultan sannsynlighetstetthetsfunksjon gitt ved: f(x,y) = der parameteren β > 0 er ukjent. { y 2β e xy β, 0 < x <, 1 < y < 4 0, ellers Foråkunneestimereβ erettilfeldigutvalgpån = 5observasjonspar(x i,y i ), i = 1,...,5 registrert: (2.0, 3.1),(4.2, 2.0),(6.3, 2.2),(5.3, 1.5),(7.3, 2.2) For å finne en estimator for β vil vi bruke sannsynlighetsmaksimering. a) Sett opp likelihoodfunksjonen(sannsynlighetsmaksimeringsfunksjonen) basert på det tilfeldige utvalget, og vis at estimatoren for β blir ˆβ = ni=1 X i Y i n b) Finn estimatet for β fra de oppgitte observasjonene. Forklar hva det betyr at en estimator er forventningsrett, og rekn ut forventninga til estimatoren ˆβ. Du kan ha nytte av delvis integrasjon: f(x)g(x)dx = F(x)G(x) F(x)g(x)dx 4
Oppgave 4 Kasperhar tenktåkjøpebruktbil. Han harbestemt seg for merke ogårsmodell, men rekner med at kilometerstanden (kjørelengda), x, vil ha mye å si for prisen, Y. Ut fra det han har funnet på internett antar han at prisen på biler av modellen han har valgt seg ut vil være uavhengige og normalfordelte med forventning E(Y) = 215 0.2 x og standardavvik SD(Y) = 20. Forventningsverdien for prisen endrer seg altså med kilometerstanden x, mens standardavviket er konstant. Pris er i 1000 kroner, kilometerstand i 1000 kilometer. a) Hva er sannsynligheten for at en bil med kilometerstand x = 100 koster over 200? Hva er sannsynligheten for at en bil med en kilometerstand som er 30 mindre enn en annen bil, likevel koster mindre? Kasper er ikke sikker på at forventning og varians er som påstått. Han samler derfor inn data for pris og kilometerstand fra n = 42 nylig solgte biler av den aktuelle modellen. Observasjonene er plotta nedenfor: Pris 100 150 200 250 0 50 100 150 200 Kilometerstand Han tilpasser en lineær regresjonmodell, det vil si: Y i = β 0 +β 1 x i +ǫ i, i = 1,...,42 der feilleda ǫ 1,...,ǫ 42 antas å være uavhengige og normalfordelte med forventning 0 og varians σ 2. Regresjonsanalysen er gjennomført i R: 5
> lm(y~x) Coefficients: (Intercept) x 208.2839-0.1937 > summary(lm(y~x)) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 208.28394 6.52547 31.919 <2e-16 *** x -0.19372 0.05976?? --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 17.91 on 40 degrees of freedom. Multiple R-squared: 0.2081. > mean(x) [1] 98.92857 > sum((x-mean(x))^2) [1] 89820.79 > res = residuals(lm(y~x)) > sum(res^2)/40 [1] 320.7196 b) Finn estimater for parametrene i denne modellen, og gi ei tolking av hva disse sier om sammenhengen mellom pris og kilometerstand. Hvilke hypoteser vil du teste for å undersøke om det er (signifikant) lineær sammenheng mellom pris og kilometerstand? Utfør testen og konkluder. Kasper har kommet over en bil av rett modell med kilometerstand 50, og han vil gjerne kunne si noe om hva prisen av denne kan bli. c) Finn et beste estimat for forventa pris av biler med kilometerstand 50. Hva er estimert standardavvik for dette estimatet? Finn et intervall som med 90% sannsynlighet vil inneholde prisen for akkurat denne bilen. 6