TMA4240 Statistikk Eksamen desember 2015

Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag TMA20 Statistikk Eksame desember 205 Løsigsskisse Oppgave a) De kumulative fordeligsfuksjoe til X, F (x) P (X x): F (x) P (X x) x f(u)du x [ u θ] x x θ ( ) x θ for x >, ellers er F (x) 0. Setter θ.6, og reger ut P (X 2) F (2) 0.55 2.6 P (X > ) F () 0.20.6 P (X > X > 2) P (X > X > 2) P (X > 2) 0.20 0.55 0. θu (θ+) du P (X > ) P (X > 2) b) Sasylighetsmaksimerigsestimatore for θ. Vi starter med rimelighetsfuksjoe L, og tar logaritme til L for å lette regige. L(θ, x, x 2,..., x ) f(x i, θ) i i θx (θ+) i θ i x (θ+) i l(θ, x, x 2,..., x ) l L(θ, x, x 2,..., x ) l θ (θ + ) l x i Vi vil fie maksimum av l som fuksjo av θ og deriverer l med hesy på θ, og deretter setter lik 0 og løser ut. Vi sjekker at vi fier maksimum og ikke miimum ved i eksdes5-lsf-b 0. august 206 Side

å udersøke om de adrederiverte er egativ. dl dθ m θ l x i og dl dθ 0 i θ l x i 0 i θ l x i i θ i l x i Sjekk av maksimum: d2 l dθ 2 < 0 alltid egativ, dvs. maksimumspukt θ2 Dermed har vi maksimert rimelighetsfuksjoe med hesy på θ og fuet følgede sasylighetsmaksimerigsestimator: ˆθ i l X i Oppgave 2 a) Oppgitt at: X: ormalfordelt med E(X) og Var(X). Y : ormalfordelt med E(Y ) 2 og Var(Y ). X og Y er uavhegige. Dermed: P (X 0) P ( X 0 ) Φ( 0.5) 0.3085 Videre: X + Y er ormalfordelt (side e sum av to uavhegige ormalfordelte variabler er ormalfordelt) med E(X + Y ) E(X) + E(Y ) + 2 3 og Var(X + Y ) Var(X) + Var(Y ) + 5. ( X + Y 3 P (X + Y > ) P (X + Y ) P 3 ) 5 5 Φ(0.5) 0.6736 0.326 Til slutt, X Y er også ormalfordelt, og E(X Y ) E(X) E(Y ) 2 og Var(X Y ) Var(X) + Var(Y ) + 5. ( X Y + P (X Y 2) P 2 + ) 5 5 Φ( 0.5) 0.326 eksdes5-lsf-b 0. august 206 Side 2

b) Skriver estimatoree som fuksjoer av V X ( )S2 X og V Y (m )S2 Y : S 2 pooled ( )S2 X + (m )S2 Y S 2 mea 2 S2 X + 2 S2 Y σ2 V X + V Y σ2 V X 2( ) + σ2 V Y 2(m ) Vi bruker at år V X er kjikvadratfordelt med parameter ( ) så er E(V X ) ( ) og Var(V X ) 2( ), og tilsvarede at år V Y er kjikvadratfordelt med parameter (m ) så er E(V Y ) (m ) og Var(V Y ) 2(m ) (dette står blat aet i Tabeller og formeler i statistikk uder Kjikvadratfordelige). E(Spooled 2 ) E( V X + V Y ) E( V X + V Y ) [E( V X ) + E(V Y )] [( ) + (m )] σ2 σ2 Dermed er S 2 pooled e forvetigsrett estimator for σ2. E(Smea) 2 E ( V X 2( ) + σ2 V Y ) 2(m ) 2( ) E(V X) + 2(m ) E(V Y ) 2( ) ( ) + 2(m ) (m ) 2 σ2 + 2 σ2 Dermed er også S 2 mea e forvetigsrett estimator for. Variase fies tilsvarede, me husk at Var(V X ) 2( ) og Var(V Y ) 2(m ), og kostater kvadreres: Var(aV X ) a 2 Var(V X ). Var(S 2 pooled ) Var( V X + V Y ) () 2 Var( V X + V Y ) () 2 [Var( V X ) + Var(V Y )] () 2 [2()] 2 [2( ) + 2(m )] () 2 Var(Smea) 2 Var ( V X 2( ) + σ2 V Y ) 2(m ) ( ) 2 Var(V X) + (m ) 2 Var(V Y ) ( ) 2 2( ) + σ ( 2(m ) (m ) 2 2 + ) m Vi skal bare sammelige variasee for S 2 pooled og S2 mea år 0 og m 20. Var(Spooled 2 ) 2 0 + 20 2 2 0 + 20 2 2σ 28 0.07σ Var(S 2 mea) σ 2 ( 0 + 20 ) 2 ( 9 + ) 0.08σ 9 eksdes5-lsf-b 0. august 206 Side 3

Dermed er Var(S 2 pooled ) < Var(S2 mea) for disse verdiee av og m, og vi vil geerelt foretrekke så lite som mulig varias for e estimator. Dermed vil vi foretrekke S 2 pooled. Ikke spurt om: me, det vil være slik at variase til Spooled 2 alltid er midre eller lik variase til Smea. 2 Dette ka ma se eklest ved å se at Var(Spooled 2 ) Var(S2 mea) ( + ) m ( )(m ) (( ) + (m ))() ( )(m ) () 2 2 m + m 2 0 ( m) 2 0 Likhet får vi år m. Heller ikke spurt om: Videre så har Spooled 2 e fordel til over S2 mea fordi (+m 2)S2 pooled er e sum av to uavhegige kjikvadratfordelte størrelser og er dermed kjikvadratfordelt med parameter og ka lett brukes til å lage e t-fordelt observator (som gjort i este oppgave), mes dette ikke er tilfellet for Smea. 2 c) Vi øsker å udersøke om det er gru til å tro at µ X er større e µ Y, og dermed setter vi opp: H 0 : µ X µ Y mot H : µ X > µ Y som er det samme som å teste Testobservator er H 0 : µ X µ Y 0 mot H : µ X µ Y > 0 T 0 X Ȳ S pooled + m som er t-fordelt med frihetsgrader år ullhypotese er sa. Vi forkaster H 0 år T 0 er stor (fordi år H 0 er falsk er µ X µ Y > 0 og da vil vi forvete at X Ȳ er stor, og dermed også T 0 stor), og fier forkastigsgrese ved å løse P (forkaste H 0 år H 0 er sa) 0.05 P (T 0 > k) 0.05 dermed må k t 0.05,+m 2, fordi det er det tallet i t-fordelige som det er sasylighet 0.05 for å være større e. Forkastigsregele blir: Forkast H 0 år T 0 > t 0.05,+m 2. eksdes5-lsf-b 0. august 206 Side

Isatt verdier: 29, x 75.2, s 2 X 7.6, m, ȳ 6.0 og s2 Y 292.. t 0.05,29+ 2 t 0.05,268.65 ( )s 2 X s pooled + (m )s2 Y 28 7.6 + 0 292. 29 + 2 6322.8 236.0 5. 268 x ȳ 75.2 6.0 t 0.2 s pooled + m 5. 29 +.87 7.6 Dermed har vi at t 0 7.6 er mye større e forkastigsgrese.65 og vi forkaster klart H 0. P -verdie (ikke spurt om) for teste blir P (T 0 > 7.6) 2.5 0 3 (det ka ma ikke fie i tabell, me med software). Oversatt til spørreudersøkelses-situasjoe: det er gru til å tro at de som har svart «Eig» eller «Svært eig» på påstade «Akkurat å syes jeg at Statistikk er et artig kurs» har e høyere opplevd proset av forelesige de i gjeomsitt meer de forstår e de som svarte «Nøytral», «Ueig» eller «Svært ueig» på «artig»-spørsmålet. Oppgave 3 a) P (X 0) P (X ) 0.2 0.8 og P (Y X 0) P (Y 0 X 0) 0.. P (Y ) P (X 0 Y )) + P (X Y ) P (X Y ) P (X 0)P (Y X 0) + P (X )P (Y X ) 0.8 0. + 0.2 0.9 0.26 P (X Y ) P (Y ) P (X )P (Y X ) P (Y ) 0.2 0.9 0.26 0.69 b) Vi har e biomisk fordelig fordi vi ser på dette som ) 5 delforsøk, 2) i hvert delforsøk sjekker vi om sigalet har kommet frem korrekt (suksess) eller ikke, 3) suksessasylighete er 0.9, og ) de 5 delforsøkee er uavhegig av hveradre. Da er V atall suksesser biomisk fordelt med parametere 5 og 0.9. Biomisk fordelig gir P (V ) P (V ) + P (V 5) 5 0.9 0. + 0.9 5 0.33 + 0.59 0.92 Eller fra tabell: P (V ) P (X 3) 0.08 0.92. La X være kortotasjo for (X, X 2, X 3, X, X 5 ) og tilsvarede for Y. Bayes regel: P (X (0, 0, 0, 0, 0) Y (0, 0, 0, 0, 0)) P (X (0, 0, 0, 0, 0) Y (0, 0, 0, 0, 0)) P (Y (0, 0, 0, 0, 0)) P (X (0, 0, 0, 0, 0))P (Y (0, 0, 0, 0, 0) X (0, 0, 0, 0, 0)) P (X x)p (Y (0, 0, 0, 0, 0) X x) x eksdes5-lsf-b 0. august 206 Side 5

I evere må ma summere over alle de 32 mulige sedte sigaler. Fra biomisk fordelig ka mottatt sigal Y (0, 0, 0, 0, 0) skje ved at ulike atall posisjoer edres: ige elemeter edres (som i teller), ett elemet edres (i e av de 5 posisjoee), to elemeter edres (det er i alt 0 par av to blat de 5 posisjoee), etc. helt til alle posisjoer edres; X (,,,, ). Ved direkte bruk av biomisk fordelig og sasyligheter for X har vi: P (Y (0, 0, 0, 0, 0) X (0, 0, 0, 0, 0))P (X (0, 0, 0, 0, 0)) 0.9 5 0.35 0.207 P (Y (0, 0, 0, 0, 0) X (,,,, ))P (X (,,,, )) 0. 5 0.35 0.0000035 For de adre 30 adre utfallee samlet får vi følgede i ever: (5 0.9 0. + 0 0.9 3 0. 2 + 0 0.9 2 0. 3 + 5 0.9 0. ) 0.0 0.00 Da blir P (X (0, 0, 0, 0, 0) Y (0, 0, 0, 0, 0)) 0.207/(0.207 + 0.00 + 0.00000035) 0.98 Oppgave a) Fra tabell for Poisso fordelige med λ 8: P (Y 8) 0.56 P (0 < Y 8) P (Y 8) P (Y 0) P (Y > 0 Y 8) P (Y 8) 0.56 0.5622 0.030 0.96 0.5622 Ikke spurt om - me for å motivere at Poisso ka tilærmes med ormal. For ormalfordelige: P (Y 8) P (Z 8 8 8 ) P (Z 0) 0.5 P (Y > 0 Y 8) P (Z 0) P (Z < 8/ 8) P (Z 0) 0.5 0.0297 0.5 0.9 b) Det ser ut til å være e positiv tred med høyere salg for høyere føreforholdideks. Og økige ser ut til å være omtret kostat mellom føreforholdideksee (,2,3,). Me variabilitete øker tydelig med føreforholdsidekse. De er mye større for x e for x. Atakelse om kostat varias for støyleddee er dermed eppe gyldig. La e y observasjo (for «fatastiske forhold») være Y 0. Prediksjoe er Ŷ0 og føreforholdsidekse er x 0. Et 90 proset prediksjositervall starter med Ŷ0 Y 0, E(Ŷ0 Y 0 ) 0, og s 2 0 V ar(ŷ0 Y 0 ) ( + ( x)2 + ). 20 i (x i x) 2 ˆβ 237.5/2.95 9.5 ˆβ 0 25.65 9.5 2.5 2. Prediksjoe er Ŷ0 ˆβ 0 + ˆβ 2. + 9.5 0.. eksdes5-lsf-b 0. august 206 Side 6

Estimatet av variase er oppgitt til s 2 5.65 2, og vi får e t-fordelig: Da har vi P (t 8,0.05 < Ŷ0 Y 0 s 0 < t 8,0.95 ) 0.9, t 8,0.05.73 s 2 0 s2 ( + (x 0 x) 2 20 i (x i x) 2 + ) 5.652 (/20 + ( 2.5) 2 /2.95 + ) 6.05 2. P (Ŷ0 + s 0 t 8,0.05 < Y 0 < Ŷ0 + s 0 t 8,0.95 ) 0.9 Prediksjositervallet blir: (29.9, 50.9). c) E(mi{Y, 25}) Som gir E(mi{Y, 25}) 9.58 Fuksjoe som må optimeres er yf(y)dy + f(y)dy µφ(( µ)/σ) σφ(( µ)/σ) + ( Φ(( µ)/σ)) f() 20 E(mi{Y, }) 5 20( ( µ) Φ(( µ)/σ) σφ(( µ)/σ)) 5 Prøvig og feilig gir f(20) 260., f(25) 266.7, f(22) 266.9, f(2) 267.9, f(23) 268.. Dermed blir optimalt atall kopper forberedt 23. eksdes5-lsf-b 0. august 206 Side 7