TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt, dvs. eit gjennomsnitt for alle bilane som køyrer på vegstrekningen i ein gitt periode. µ X X i, S 1 (X i n 1 X) 2 X X i 880 73.33, S 1 11 b) Type 1 feil er å forkaste H 0 når H 0 er rett. H 0 : µ 77 H 1 : µ < 77 (X i X) 2 34.7 11 9.7 α 0.05, forkast om: X 77 S n < t 0.05,11 1.8 73.33 77 9.7 1.31 > 1.8 dvs. ikkje grunnlag for å påstå at farten er blitt lågare på 5 % nivå. c) Type 2 feil er å ikkje forkaste når H 0 er gal. La β P (type 2 feil). Då er styrken 1 β. ( ) ( ) X 77 X 74 P < 1.645 µ 74 P < 1.645 + 3 µ 74 ( ) Φ 1.645 + 3 Φ( 0.61) 1 0.729 0.271 ovingb4-lsf-b 31. oktober 2007 Side 1

( ) X 77 P < 1.645 µ 74 0.9 n ( ) X 74 P < 1.645 + 3 µ 74 0.9 n n ( Φ 1.645 + 3 ) n 0.9 1.645 + 3 n 1.28 3 n 1.28 + 1.645 2.925 n (2.925)2 2 3 2 95.06 Dvs. vi må måle farten på 96 bilar eller fleir. Oppgave 2 Eksamen mai 2002, oppgave 3 av 3 a) La µ være fosforinnholdet. Hypotesene blir som følger: H 0 : µ 0.20, H 1 : µ > 0.20 Testobservator Z X 0.20 0.02/ er standard normalfordelt under H 0. Vi forkaster H 0 når Z er stor. Med signifikansnivå 0.05 forkaster vi H 0 for Z > 1.645. z x 0.20 0.02/ 1.51. Siden observert z < 1.645 beholder vi H 0. b) Hypotese H 0 forkastes kun hvis Z X 0.20 0.02/ > 1.645. Under alternativ hypotese at µ 0.21 vil størrelsen Y X 0.21 0.02/ være standard normalfordelt. P (Z > 1.645) P ( X 0.20 0.02/ X 0.21 > 1.645) P ( 0.02/ > 0.01 0.02/ + 1.645) P (Y > 0.0639) 8 Vi ønsker en n slik at sannsynligheten for å forkaste H 0 er større enn 0.9: P (Y > 0.01 0.02/ n + 1.645) > 0.9. Dette vil si at 0.01 0.02/ n + 1.645 < z 0.9, der z 0.9 er 0.9 percentilen i standard normalfordelingen. Siden z 0.9 1.28, finner vi at: n > ( 0.02(1.645+1.28) 0.01 ) 2 34. Dvs at n > 35 oppfyller kravet om 0.9 sannsynlighet for å gjenkjenne at µ 0.21. Oppgave 3 a) X absolutt styrke av vilkårlig valgt jordskjelv. Har at X N(x; 4.2, ). Har P (X > 5.4) P ( X 4.2 > 1 Φ(3) 1 0.9987 0.0013. 5.4 4.2 )

Kaller vår grenseverdi k. Da er P ( X 4.2 P (X > k) 0.05 > k 4.2 ) 0.05 k 4.2 1.645 k 4.2 + 1.645 4.858 4.9. b) Vi har følgende hypotese: H 0 : µ 4.2 H 1 : µ > 4.2. Under H 0 er X 4.2 s t-fordelt med 8 frihetsgrader. Forkast dersom X 4.2 s t 0.05,8 9 9 3.967 4.2 1.86. Setter vi inn får vi s 9 forkaster hypotesen. 1.07 < 1.86. Konklusjonen blir at man ikke Oppgave 4 Veiprosjektet a) Vi jobber med X som er normalfordelt med forventning µ 000 kr/meter og standardavvik σ kr/meter. P (X > 13000) 1 P (X 13000) 1 P ( X 13000 1 Φ(1.2) 1 0.8848 0.1152 13000 000 ) 1 P (Z 1.2) Finn et tall, k, slik at sannsynligheten er 0.05 for at konstnaden pr. meter for veien vil bli mindre enn k. P ( X 000 P (X < k) 0.05 < k 000 ) 0.05 k 000 1.645 k 1.645 + 000 5887.5

Gitt at vi vet at kostnaden pr. meter blir minst 000 kr/meter, hva er da sannsynligheten for at kostnaden pr. meter blir høyere enn 13000 kr/meter? P (X > 13000 X > 000) P (X > 13000 X > 000) P (X > 000) P (X > 13000) 2 0.1152 0.23 P (X > 000) b) Null- og alternativ hypotese: H 0 : µ 000 H 1 : µ > 000 De ukjente parameterene er µ og σ 2, og vi setter opp følgende estimatorer: ˆµ 1 n S 2 n X i X 1 n 1 n (X i X) 2 Vi vet at under H 0 så er T 0 (X 000) S 1 n t-fordelt med (n 1) frihetsgrader. Vi vil forkaste H 0 når T 0 k, der konstanten k finnes slik at Type-I feilen er kontrollert på nivå α. P (T 0 k H 0 sann) α k t α,(n 1) der t α,(n 1) er α-kvantilen i en t-fordeling med n 1 frihetsgrader. Forkastningsmråde: Forkast H 0 når T 0 t α,(n 1). Når α 0.01 og n 9 er t 0.01,8 2.896. Innsatt data fra tabell 1 i oppgaveteksten har vi: x 6480 11831.11 9 s 2 1 9 (x i x) 2 49295335 6161917 8 8 s 6161917 2482.3 t 0 11831.11 000 2482.3 2.21 9

Siden t 0 2.21 < t 0.01,8 2.896 så forkaster vi ikke H 0 på nivå α 0.01, og konkluderer med at vi har ikke tilstrekkelig bevis til å anta at kostnadene blir større enn 000 kr pr. meter. Når vi ikke forkastet H 0 på nivå 0.01 så betyr det at p-verdien må være større enn 0.01. P -verdien er gitt som P (T 0 > t 0 H 0 sann) P (T 0 > 2.21 µ 000) 1 P (T 0 2.21 µ 000) der T 0 under H 0 er t-fordelt med n 1 frihetsgrader. Fra tabell 2 i oppgaven så slår vi opp på P (T t) med t 2.2 og ν 8, og finner 0.971, som gir p-verdi 1 0.0710.029. P-verdien er det laveste signifikansnivået som ville frt til forkastning av nullhypotesen. c) La g(x) være sannsynlighetstettheten til X, og h(y) være sannsynlighetstettheten til Y. Siden X og Y er uavhengige, er simultan sannsynlighetstetthet f(x, y) g(x) h(y). Forventingen til W X Y : E(W ) E(X Y ) x g(x)dx x y g(x) h(y)dxdy y h(y)dy E(X) E(Y ) µ η Alternativt: Cov(X, Y ) E(X Y ) E(X) E(Y ) 0 når X og Y er uavhengige, slik at E(W ) E(X Y ) E(X) E(Y ) µ η. Før vi begynner på variansen, trenger vi følgende sammenhenger: E(W 2 ) E(X 2 Y 2 ) x 2 g(x)dx x 2 y 2 g(x) h(y)dxdy y 2 h(y)dy E(X 2 ) E(Y 2 ) Var(X) E[(X µ) 2 ] E(X 2 ) E(X) 2 E(X 2 ) µ 2 E(X 2 ) Var(X) + µ 2 σ 2 + µ 2 E(Y 2 ) Var(Y ) + η 2 τ 2 + η 2 Variansen til W X Y : Var(W ) E(W 2 ) [E(W )] 2 E(X 2 ) E(Y 2 ) [E(X) E(Y )] 2 (σ 2 + µ 2 ) (τ 2 + η 2 ) [µ η] 2 σ 2 τ 2 + σ 2 η 2 + τ 2 µ 2 + µ 2 η 2 µ 2 η 2 σ 2 τ 2 + σ 2 η 2 + τ 2 µ 2

Oppgave 5 Vi ønsker å finne et 95% konfidensintervall for σ 2 for så å bestemme om påstanden σ 2 1 er rimelig. Det er oppgitt at n 5, x 3 og ved regning får vi at s 2 0.815. Ved å anta at dataene kommer fra en normalfordeling vil Dermed finner vi X 2 (n 1)S2 σ 2 χ 2 n 1 1 α P (χ 2 1 α/2 < X2 < χ 2 α/2 ) P (χ 2 (n 1)S2 1 α/2 < σ 2 < χ 2 α/2 ) (n 1)S2 P ( χ 2 < σ 2 (n 1)S2 < α/2 χ 2 ) 1 α/2 P ( 4 0.815 11.143 < σ2 < 4 0.815 84 ) 1 0.05 P (0.293 < σ 2 < 6.736) 0.95 Dvs at et 95% konfidensintervall for σ 2 er [0.293, 6.736]. Siden σ 2 1 er med i dette intervallet virker påstanden rimelig. Oppgave 6 En sosiolog vurderer effektiviteten av et kurs for å få flere flere bilførere til å bruke bilbelte. Type I feil: Forkast H 0 når den er sann. Type II feil: Ikke forkast H 0 når den er feil. a) Hvis vi begår en type I-feil forkaster vi nullhypotesen når den er sann. Å påstå at kurset er ineffektivt er det samme som å forkaste påstanden om at kurset er effektivt, dermed må nullhypotesen som testes være: H 0 : Kurset er effektivt b) En type II-feil er å ikke forkaste nullhypotesen selv om denne er feil. Ved å feilaktig konkludere at kurset er effektivt forkaster hun ikke nullhypotesen om at kurset har effekt, altså blir nullhypotesen den samme som i a). Oppgave 7 Det blir påstått at en ny flekkfjerner fjerner mer enn 70% av flekkene. Vi vil forkaste nullhypotesen, H 0 : p 0.7 dersom færre enn 11 av tilfeldig valgte flekker fjernes. Ellers vil vi konkludere med at p > 0.7. Vi definerer X lik antall flekker som fjernes, og X vil da være binomisk fordelt med parametre n og p.

a) α P (type I-feil) P (forkaste H 0 når H 0 er sann) P (X 11 p 0.7) P (X 11 p 0.7) + P (X p 0.7) ( ) ( ) 0.7 11 0.3 1 + 0.7 0.3 0 0.085 11 b) β P (type II-feil) P (Ikke forkaste H 0 når H 0 er feil) ( ) P (X < 11 p 0.9) 0.9 x 0.1 x 0.341 x x0 Oppgave 8 Vi ønsker å teste nullhypotesen H 0 : µ 20000 km/år mot H 1 : µ > 20000 km/år. I oppgaven er det opplyst at n 0, x 23500 og s 3900. t x µ s/ 23500 20000 n 3900/ 8.97 P-verdien blir P P (T > 8.97) 0 og dermed forkaster vi H 0 og påstår at µ > 20000 km/år. Siden vi her har så mange som 0 observasjoner, kunne vi også ha brukt normalfordelingen, som ville gitt samme p-verdi.