Høst 205 Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Øvig ummer, blokk II Løsigsskisse Oppgave a) X bi(, p) fordi: Udersøker uavhegige delar av DNA-strukture. Fi for kvar del ut om dee dele av DNA-stukture er samafallade eller ikkje. Sasyet for samafallade er det same for alle delae (P (samafell) = p = 0.5). b) P (X = 2) = ( ) 5 0.5 2 ( 0.5) 5 2 = 0.38 2 P (X 2) = P (X < 2) = P (X ) = 0.835 = 0.65 P (X = 2 X 2) P (X = 2 X 2) = P (X 2) = 0.38 0.65 = 0.836 = P (X = 2) P (X 2) P (Type-I-feil) = P (forkaste H 0 H 0 ) = P (X = 5 p = 0.5) = 0.5 5 = 0.000076 P (Type-II-feil) = P (ikkje forkaste H 0 H ) = P (X < 5 p = ) = 0 Ser så på det geerelle uttrykket for sasyet for type-i-feil år vi har forsøk. Fi derfrå kor stor må vere for å oppå øska sasy for type-i-feil. P (Type-I-feil) = P (X = p = 0.5) = 0.5 < 0.00000 l(0.5) < l(0.00000) > l(0.00000) = 7.28 l(0.5) ov-lsf-b 25. oktober 205 Side
Høst 205 Mist 8 delar frå DNA-strukture må udersøkast dersom sasyet for type-i-feil skal vere midre e 0.00000. Oppgave 2 a) Merk fra Ve diagram at I ikke overlapper F eller R. P (R F ) = P (R F ) P (F ) = 0.3 0.5 = 0.6 P (R I ) = P (R I ) P (I ) b) Geerelle forutsetiger for biomisk fordelig i) Forsøksrekke består av ekeltforsøk. ii) Det registreres ku suksess eller ikke suksess. iii) Sasylighete for suksess er lik i alle forsøk. iv) Ekeltforsøkee er uavhegige. = P (R) P (I) = 0.4 0.05 = 0.42 For X har vi i) Det er valgt ut kamper. ii) Vi registrerer ku om de som får første målet vier(suksess) eller ikke. iii) Sasylighete for suksess er p og er atatt å være kostat. iv) Vi atar at kampee er uavhegige. Dette er rimelige atakelser. Setralgreseteoremet sier: Dersom Z, Z 2,..., Z er uavhegig idetisk fordelte fra sasylighetsfordelige f Z (z), hvor E(Z) = µ og V ar(z) = σ 2, så vil Z µ σ kovergere mot e ormalfordelig med forvetig 0 og varias. Der Z = i= Z i. For e biomisk forsøksrekke, defier Z i slik at: Z i = hvis suksess, og Z i = 0 ellers. Med adre ord: { p hvis z = P (Z i = z) = p hvis z = 0 Slik at E(Z i ) = p og V ar(z i ) = p( p). Side ekeltforsøkee er uavhegige så er Z i ee også uavhegige. Av setralgreseteoremet følger at ˆp p kovergerer mot e ormalfordelig med forvetig 0 og p( p) varias. Der ˆp = i= Z i. c) H 0 : p 0.8 mot H : p < 0.8 Evetuelt: H 0 : p = 0.8 mot H : p < 0.8 Vi øsker å forkaste dersom ˆp < k, hvor k bestemmes slik at P (ˆp < k) = α = 0.05 ov-lsf-b 25. oktober 205 Side 2
Vi beytter at Z = ˆp p 0 p0 ( p 0 ) uder H 0. Da har vi fra ligige over: P (Z < TMA4240 Statistikk Høst 205 er tilærmet ormalfordelt med forvetig 0 og varias (k p0 ) p0 ( p 0 ) ) = 0.05 Dette gir k = p 0 Z 0.05 (k p0 ) p0 ( p 0 ) = Z 0.05 p 0 ( p 0 ). Vi forkaster H 0 dersom: ˆp < p 0 Z 0.05 p0 ( p 0 ) = 0.8 0.658 For = 24 og X = i= Z i = 7 får vi ˆp = 0.7, k = 0.67. Vi forkaster ikke H 0. Vi ka ikke pastå at ekspertkommetatore tar feil på 5 proset ivå. d) Vi øsker at styrke på teste i alterativet p = 0.7 skal være mist 0.9. Dvs P (ˆp < 0.8 0.658 p = 0.7) = 0.9 Vi beytter at Z = ˆp 0.7 0.7 0.3 er tilærmet ormalfordelt med forvetig 0 og varias uder alterativet med p = 0.7. Isatt i kravet fra ligige over gir dette: P (Z < 0.8 0.7 0.658 ) = 0.9 0.7 0.3 0.7 0.3 0. percetile i ormalfordelige er lik Z 0. =.28. Kravet som må oppfylle blir dermed: 0. 0.658 =.28 0.7 0.3 0.7 0.3 Løsige blir = 55. kamper. Dvs at vi må se mist 56 kamper for å oppå de øskede styrke på teste. Oppgave 3 Eksame mai 2003, oppgave 2 av 3 a) Det er mest rimelig med e vestresidig hypotesetest: H 0 : µ = 6, H : µ < 6. Begruelse: forhadlere sier at bile ka forvetes å kjøre mist 6 km pr liter. Vi vil avsløre ev. feil i markedsførige. NB: Hypoteteseteste skal være uavhegig av måligee. E bør altså ikke velge alterativ hypotese på grulag av x. ov-lsf-b 25. oktober 205 Side 3
Høst 205 X er ormalfordelt med forvetig µ og varias σ 2 /. Variase er ukjet, derfor kreves T-fordelig med ν = = 9 frihetsgrader. Gjeomfører teste med α = 0.05. Testobservator: T obs = X µ S/. Observert verdi: t obs = x µ s/ 5.56 6 = 0.94/ 20 = 2.093. Fra tabell over kvatiler i T-fordelige; t 0.05,9 =.729. Altså: t < t 0.05,9, dermed skal H 0 forkastes. Hvis vi hadde valgt å bruke e ormalfordeligshypotese, ville kvatile z 0.05 =.645 gitt samme koklusjo. Imidlertid bør vi da argumetere for at avstade til dee kvatile er så stor at høyere varias i T-fordelige ikke ville påvirket resultatet. Å sammelike med dee kvatile ka ikke reges som fullgodt svar. b) P-verdie fies ved å lete opp verdie på testobservatore fra a) i tabell. For T-fordelig med ν = 9, fier vi t 0.025,9 = 2.093. Ettersom T-fordelige er symmetrisk, har vi at P(T > t α,ν ) = P(T < t α,ν ). Dermed; p = α = 0.025 = 2.5%. Testobservatore er ormalfordelt hvis σ = s. Dette bør være tilærmet oppfylt for å bruke ormalfordelig. Hvis e ikke har ekstra iformasjo om σ, er det ikke abefalt å tilærme studet-fordelige med e ormalfordelig år < 30, da s ikke er et godt ok estimat. Uder ormalfordelige får vi p-verdi P(Z 2.09) = Φ( 2.09) = 0.083. c) Atar H : µ = µ = 5.5 og σ = s. Teststyrke er sasylighete for å forkaste H 0 uder H, dvs ( ) X µ0 P σ/ <.645 µ = µ = 5.5. For å få e ormalfordelt variabel, flytter vi alt uteom X, som er stokastisk, over på høyre side. Deretter trekker vi fra sa forvetigsverdi µ og dividerer med stadardavviket på begge sider. P(X <.645 σ/ + µ 0 ) = P( X µ σ/.645 σ/ + µ0 µ < σ/ ) = P(Z < 0.7338) 0.767. Hvis vi ikke kue bruke ormalfordeligsatakelse, ville teststyrke blitt svakere. Her er det forutsatt at vi er gaske sikre på variase, f.eks. på grulag av data fra produset. Geerelt må atall observasjoer økes for å oppå økt teststyrke. (Dette er fullgodt svar.) Mulig tillegg: Hvis e har mulighet til å gjeomføre forsøket på e måte slik at variase blir midre, f.eks. kjøre bilee uder mer kotrollerte former i et laboratorium, ville også teststyrke økes. Evetuelt ka e øke sigifikasivået α f.eks. til 0., og dermed øke teststyrke, me dette er sjelde aktuelt i praksis. ov-lsf-b 25. oktober 205 Side 4
Oppgave 4 Brosebolter Eksame desember 2004, oppgave av 3 TMA4240 Statistikk Høst 205 a) Vi jobber med X som er ormalfordelt med forvetig µ x = 85 gram og varias σ 2 = gram 2. Hva er sasylighete for at kobberiholdet i e tilfeldig valgt brosebolt er midre e 84 gram? P (X < 84) = P (X 84) = P ( X 85 = Φ( ) = 0.587 84 85 ) = P (Z ) Fi et tall, k, slik at sasylighete er 0.0 for at kobberiholdet i e tilfeldig valgt brosebolt er større e k. P ( X 85 P (X > k) = 0.0 > k 85 ) = 0.0 k 85 = z 0.0 = 2.326 k = 2.326 + 85 = 87.326 Vi ser på kobberiholdet i to tilfeldig valgte og uavhegige brosebolter, som vi kaller X og X 2, og skal se på differase X X 2. Side X og X 2 begge er ormalfordelte og uavhegige så er også X X 2 ormalfordelt, med forvetigsverdi og varias som følger: E(X X 2 ) = E(X ) E(X 2 ) = µ x µ x = 0 Var(X X 2 ) = Var[X + ( ) X 2 ] = Var(X ) + ( ) 2 Var(X 2 ) = σ 2 + σ 2 = 2σ 2 = 2 da σ 2 =. Hva er sasylighete for at kobberiholdet i de to broseboltee avviker med mer e.5 gram? P ( X X 2 >.5) = P (X X 2 <.5) + P (X X 2 >.5) = 2 P (X X 2 <.5) = 2 P ( X X 2 0 <.5 0 ) 2 2 = 2 Φ(.5 2 ) = 2 Φ(.06) = 2 0.446 = 0.2892 b) E god estimator ˆθ er e estimator som er forvetigsrett, dvs. E(ˆθ) = θ, og har lite varias, dvs. Var(ˆθ) er lite. Vi liker veldig godt hvis variase miker år atall observasjoer som estimatore er basert på øker, og at variase går mot 0 år atallet observasjoer går mot uedelig (kosistes). ov-lsf-b 25. oktober 205 Side 5
Høst 205 To aktuelle estimatorer for σ 2 er σ 2 og S 2. Begge estimatoree er fuksjoer av i= (X i X) 2 og for å berege forveigsverdi og varias til estimatoree så bruker vi at i= V = (X i X) 2 σ 2 er kji-kvadratfordelt med ( ) frihetsgrader (se formelsamlige side 27). Vi vet videre at E(V ) = ( ) og Var(V ) = 2 ( ). Vi ka å uttrykke S 2 og ˆσ 2 som fuksjoer av V ; σ 2 = S 2 = (X i X) 2 = V σ2 i= i= Dermed forvetig til de to estimatoree: og videre variase: (X i X) 2 = V σ2 E( σ 2 ) = E( V σ2 ) = σ2 E(V ) = E(S 2 ) = E( V σ2 ) = σ2 σ2 E(V ) = σ2 = σ 2 Var( σ 2 ) = Var( V σ2 ) = σ4 2 ( ) Var(V ) = 2 2 σ 4 Var(S 2 ) = Var( V σ2 ) = σ 4 2 ( ) Var(V ) = ( ) 2 ( ) 2 σ4 = 2 σ4 ( ) Vi ser at S 2 er forvetigsrett, mes σ 2 er skjev. Side < vil σ2 i det lage løp uderestimere σ 2. Variase til begge estimatoree avtar år atall observasjoer øker. Estimatore σ 2 har midre varias e S 2 for alle verdier av. Begge estimatoree er kosistete. Hvis vi legger mest vekt på at vi øsker e estimator som er forvetigsrett så ville vi velge S 2, mes er det viktigst med mist mulig varias så ville vi velge σ 2. c) Vi jobber med to uavhegige ormalfordelte utvalg med samme varias. Vi har Brosespesialiste: X, X 2,..., X u.i.f. ormal med E(X i ) = µ x og Var(X i ) = σ 2, og Metalleksperte: Y, Y 2,..., Y m u.i.f. ormal med E(Y j ) = µ y og Var(Y j ) = σ 2. Vi øsker å udersøke om forvetigsverdie til kobberiholdet i brosebolter fra Metalleksperte er lavere e kobberiholdet i brosebolter fra Broseeksperte. Null- og alterativ hypotese: H 0 : µ x = µ y H : µ x > µ y H 0 : µ x µ y = 0 H : µ x µ y > 0 ov-lsf-b 25. oktober 205 Side 6
Høst 205 Det er også mulig å sette µ x µ y som H 0, me alle beregigee blir uforadret. De ukjete parameteree er µ x, µ y og σ 2, og vi setter opp følgede estimatorer: ˆµ x = ˆµ y = m S 2 p = X i = X i= Y j = Y j= + m 2 [ (X i X) 2 + i= m (Y j Y ) 2 ] j= Vi vet at uder H 0 så er T 0 = (X Y ) 0 S p + m t-fordelt med ( + m 2) frihetsgrader. Vi vil forkaste H 0 år T 0 k, der kostate k fies slik at Type-I feile er kotrollert på ivå α. P (T 0 k H 0 sa) α k t α,(+m 2) der t α,(+m 2) er α-kvatile i e t-fordelig med + m 2 frihetsgrader. Forkastigsmråde: Forkast H 0 år T 0 t α,(+m 2). Når α = 0.05 og = 0, m = 0, er t 0.05,8 =.734. Isatt data fra tabell i oppgavetekste har vi: x = 850.75 = 85.075 0 y = 842.0 = 84.2 0 s 2 p = 0 8 [ (x i x) 2 + t 0 = i= x y 0 s p 0 + 0 0 j= (y j y) 2 ] = (8.9 + 9.70) = 0.994 8 85.075 84.2 0 = =.94 0.994 0 + 0 Side t 0 =.94 > t 0.05,8 =.734 så forkaster vi H 0 på ivå α = 0.05, og kokluderer med at kobberiholdet i broseboltee fra Metalleksperte er lavere e kobberiholdet i broseboltee fra Brosespesialiste. Når vi forkastet H 0 på ivå 0.05 så betyr det at p-verdie må være midre e 0.05. P -verdie er gitt som P (T 0 > t 0 H 0 sa) = P (T 0 >.94 µ x µ y = 0) = P (T 0.94 µ x µ y = 0) Fra tabell 2 i oppgave så slår vi opp på P (T t) med t =.94 og ν = 8, og fier 0.966, som gir p-verdi 0.966=0.034. ov-lsf-b 25. oktober 205 Side 7
Høst 205 d) Et 95 % prediksjoitervall er et itervall som med 95 % sasylighet ieholder e y observasjo. E y observasjo fra Brosespesialiste, kalt X 0, er ormalfordelt med forvetig µ x og varias σ 2. Vi beytter ˆµ x = X som estimator for µ x og S 2 p som estimator for σ 2. For å utlede prediksjositervallet starter vi med X X 0, som er ormalfordelt med E(X X 0 ) = E(X) E(X 0 ) = 0 Var(X X 0 ) = Var(X) + Var(X 0 ) = σ2 + σ2 = ( + )σ2 Hvis σ 2 var kjet ville dermed X X 0 0 + σ vært stadard ormalfordelt. Nå er σ 2 ukjet, og vi beytter estimatore S 2 p. Vi ser da på X X 0 0 + S p som er t-fordelt med + m 2 frihetsgrader. Et ( α)00% predisjositervall for X 0 blir da: P (X t α 2,(+m 2) der P (T > t α 2,(+m 2) ) = α 2 P ( t α 2,(+m 2) < X X 0 0 + S p + S p < X 0 < X + t α 2,(+m 2) < t α 2,(+m 2) ) = α + S p) = α i t-fordelige med + m 2 frihetsgrader. NB: vi hadde fått det samme itervallet hvis vi hadde startet med X 0 X på gru av symmetri. Med + m 2 = 8 og α = 0.05 blir t α 2,(+m 2) = 2.0 og umeriske verdier for itervallet blir [82.88, 87.27], da x t α 2,(+m 2) x + t α 2,(+m 2) + s p = 85.075 2.0 + 0.997 = 82.88 0 + s p = 85.075 + 2.0 Det tilsvarede itervallet for Metalleksperte blir [82.0, 86.4] y t α 2,(+m 2) y + t α 2,(+m 2) + 0.997 = 87.27 0 + m s p = 84.2 2.0 + 0.997 = 82.0 0 + m s p = 84.2 + 2.0 + 0.997 = 86.4 0 ov-lsf-b 25. oktober 205 Side 8
Høst 205 Brosebolte som ble brukt til å kuse viduet hos Metalleksperte ble målt til å ha et kobberihold på 86.30 gram. Ka du ut fra itervallee du har laget over si oe om hvilke produset som ka ha laget brosebolte? 95% prediksjositervallet for e y observasjo fra Metalleksperte og 95% prediksjositervallet for e y observasjo fra Brosespesialiste ieholder begge verdie 86.30. Det er dermed mulig at brosebolte ka komme fra begge produsetee. Det vil ikke bli trukket i poeg hvis itervallet for Brosespesialiste er laget med Sx 2 = i= (X i X) 2 som estimator for σ 2 og for Metalleksperte med Sy 2 = m m j= (Y j Ȳ )2 som estimator for σ 2. Me da vil ma jobbe med e t-fordelig med hhv. og m frihetsgrader, og itervallee ville blitt litt bredere. ov-lsf-b 25. oktober 205 Side 9