TMA4240 Statistikk 2014

Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave Scriptet run confds.m simulerer n data x,..., x n fra en normalfordeling med forventningsverdi µ og varians σ ved å trekke n ganger fra en standard normalfordeling y i N(0, ) og utføre lineærtransformasjonen x i µ + σ y i, i,..., n Fra uttrykket kan vi greit regne på at da vil x i N(µ, σ ). (I Matlab trekker man fra en standard normalfordeling med funksjonen randn ). Kjører vi scriptet får vi et histogram av n 0000 simulerte data x,..., x n, som f.eks. kan se slik ut Figur : Histogram av n 0000 simulerte data fra N(, ) Histogrammet til høyre er standardisert, altså transformert slik at areal under histogramsøylene blir. I plottet er det i grønt også tegnet inn kurven for normalfordelingen med forventning og standardavvik. Vi ser at de simulerte dataene overlapper normalfordelingen de kommer fra veldig bra. Dette siden vi simulerer såpass mange datapunkter. Det resulterende gjennomsnittet ˆµ n n i x i.0047 er veldig nærme den sanne forventningsverdien som også ligger innenfor det estimerte konfidensintervalet [0.969.0434]. ov9-lsf-b 6. oktober Side

Trekker vi stedet n 00000 data (setter altså parameteren n i scriptet til 00000) kan histogrammet f.eks. se ut som i Fig. med estimert forventningsverdi ˆµ 0.9983 og estimert 9% konfidensinterval [0.989,.007]. Igjen er estimatet tilnærmet likt sann forventnigsverdi, som ligger innenfor konfidensintervalet, og overlappen mellom dataene og normalkurven er enda bedre. Figur : Histogram av n 00000 simulerte data fra N(, ) Trekker vi n 000 data (setter altså parameteren n i scriptet til 000) kan histogrammet f.eks. se ut som i Fig.3. med estimert forventningsverdi ˆµ 0.994 og estimert 9% konfidensinterval [0.8374.08]. Estimatet er fortsatt bra, men ikke like nærme som i tilfellene med høyere n. Vi ser også at estimert konfidensinterval er litt bredere, og at overlappen mellom dataene og normalkurven er dårligere (dette er også fordi vi har så liten oppløsning på histogrammet). Figur 3: Histogram av n 000 simulerte data fra N(, ) Det estimerte konfidensintervalet er beregnet som [ ˆµ.96 ˆσ n, ˆµ +.96 ] ˆσ n ov9-lsf-b 6. oktober Side

Når datamengden vokser og estimatet på standardaviket ikke varierer mye ser vi at faktoren ˆσ n går mot 0, altså blir konfidensintervalet smalere jo større datamengden er. Vi merker oss også at vi her har brukt kvantilen z 0.0.96 fra en normalfordeling selv om vi her bruker estimert varians. Med ukjent varians burde vi egentlig brukt kvantiler fra t-fordeling, men siden datamangden er så stor (n 000) vil t-fordeling med n frihetsgrader være tilnærmet lik standard normalfordeling. Oppgave a) P (X < 6.74) P ( X 6.8 6.74 6.8 < ) 0.06 0.06 Φ( ) Φ() 0.84 0.9 P (6.74 < X < 6.86) P (X < 6.86) P (X < 6.74) P ( X 6.8 6.86 6.8 < ) 0.9 0.06 0.06 Φ() 0.9 0.84 0.9 0.68 Eventuelt P ( X µ ) > 0.06) P (X µ < 0.06) + P (X µ > 0.06) P ( X µ µ < ) + P (X 0.06 0.06 > ) Φ( ) + Φ() ( Φ()) 0.38 P ( X µ ) > 0.06) P (6.74 < X < 6.86) 0.68 0.38 b) Y N(µ, σ ) P ( Y µ ) > 0.06) P (Y µ > 0.06) ( P ( Y µ 0.06 ())) 0.06 Y i X i er lineærkombinasjon av uavhengige normalfordelte variable. Dermed er Y normalfordelt med E(Y ) µ og V ar(y ) σ Y µ σ N(0, ) ov9-lsf-b 6. oktober Side 3

P ( Z 0.0 < y µ σ < Z 0.0 ) 0.9 P (Y Z 0.0 σ < µ < Y + Z 0.0 σ ) 0.9 D.v.s 9% konf. int. blir: [Y Z 0.0. σ, Y + Z 0.0 σ ] Innsatt tall: y x 6.76, σ 0.06, z 0.0.96 [6.76 (.96) 0.06, 6.76 + (.96) 0.06 ] [6.707, 6.83] Oppgave 3 a) La V være målt vekt, slik at V N(µ, σ ) N(0, 0. ). Vi får ( ) V µ 0. 0 P (V > 0.) P > P (Z > ) σ 0. P (Z ) 0.843 0.87 P ( V µ > 0.) P (V µ > 0.) + P (V µ < 0.) ( V µ P > 0. ) ( V µ + P < 0. ) σ 0. σ 0. P (Z > ) + P (Z ) P (Z ) + P (Z ) P (Z ) 0.87 0.374 La V n n i V i, slik at V N(µ, σ /n). Vi får P ( V µ > 0.) P ( V µ > 0.) + P ( V µ < 0.) ( V µ P σ/ n > 0. ) ( V µ 0./ + P σ/ n < 0. ) 0./ P (Z > ) + P (Z ) P (Z ) + P (Z ) P (Z.4) 0.0793 0.86 b) Vi har X N(µ A, σ ) og X N(µ B, σ ) som er uavhengig av hverandre. Vi får ved fremgangsmåte : E[ˆµ A ] E[X ] µ A Var[ˆµ A ] Var[X ] σ E[ˆµ B ] E[X ] µ B Var[ˆµ B ] Var[X ] σ ov9-lsf-b 6. oktober Side 4

Vi har Y N(µ A + µ B, σ ) og Y N(µ A µ B, σ ) som er uavhengig av hverandre. Vi får ved fremgangsmåte : E[ µ A ] E[(Y + Y )/] (E[Y ] + E[Y ]) (µ A + µ B + µ A µ B ) µ A Var[ µ A ] Var[(Y + Y )/] 4 (Var[Y ] + Var[Y ]) 4 (σ + σ ) σ / E[ µ B ] E[(Y Y )/] (E[Y ] E[Y ]) (µ A + µ B µ A + µ B ) µ B Var[ µ B ] Var[(Y Y )/] 4 (Var[Y ] + Var[Y ]) 4 (σ + σ ) σ / Begge fremgangsmåtene gir forventningsrette estimatorer, så vi velger den med minst varians, dvs. fremgangsmåte : µ A og µ B. c) Vi har µ A u (Y, Y ) (Y + Y )/ og µ B u (Y, Y ) (Y Y )/, som gir oss at Y w ( µ A, µ B ) µ A + µ B og Y w ( µ A, µ B ) µ A µ B. Fra transformasjonsformelen for to variabler har vi da at g µa, µ B ( µ A, µ B ) f Y,Y (w ( µ A, µ B ), w ( µ A, µ B )) J hvor J δw /δ µ A δw /δ µ A δw /δ µ B δw /δ µ B. ov9-lsf-b 6. oktober Side

Siden Y og Y er uavhengige, har vi f Y,Y (y, y ) f Y (y )f Y (y ) og vi får følgende: g µa, µ B ( µ A, µ B ) f Y,Y (w ( µ A, µ B ), w ( µ A, µ B )) J f Y (w ( µ A, µ B ))f Y (w ( µ A, µ B )) σ exp ( σ exp σ σ ( µ A + µ B (µ A + µ B )) σ ( µ A µ B (µ A µ B )) ) exp [ ( µa σ + µ B ) (( µ A + µ B ) (µ A + µ B ) + (µ A + µ B ) + ( µ A µ B ) ( µ A µ B ) (µ A µ B ) + (µ A µ B ) ] ( ) exp [ µ σ σ A + µ A µ B + µ B µ A µ A µ A µ B µ B µ B + µ A + µ A µ B + µ B + µ A µ A µ B + µ B µ A µ A + µ A µ B + µ B µ A µ B µ B + µ A µ A µ B + µ ] B ( ) exp [ µ σ σ A + µ B 4 µ A µ A 4 µ B µ B ] + µ A + µ B ( σ σ exp σ exp ) exp g µa ( µ A )g µb ( µ B ) [ ( µa σ µ A ) + ( µ B µ B ) ] σ ( µ A µ A ) σ ( µ B µ B ) og dermed er µ A og µ B uavhengige ( µ A N(µ A, σ /) og µ B N(µ B, σ /)). Oppgave 4 a) La Z λt u(t ), som er en strengt monoton og deriverbar funksjon for alle T. Vi har T Z/(λ) w(z) og w (Z) /(λ). Dette gir g Z (z) f(w(z)) w (z) λe λ(z/(λ)) (/(λ)) e z/, z > 0 0, ellers b) Vi har λt χ. Dersom levetiden til kompononentene T i er uavhengig, kan vi bruke ov9-lsf-b 6. oktober Side 6

følgende resultat n n λt i χ n i λ T i χ n i Vi finner et α konfidensintervall fra ( ) n P χ α/,n < λ t i < χ α/,n α i i ( ) χ α/,n P n i t < λ < χ α/,n i n i t α i ( ) χ 0.9/,0 P 6430. < λ < χ 0.0,0 0.90 430. ( 0.8 P 860.4 < λ < 3.40 ) 0.90 860.4 P ( 8.438 0 4 < λ < 4.44 0 4) 0.90 Så et 90% konfidensintervall for λ er (8.438 0 4, 4.44 0 4 ). ov9-lsf-b 6. oktober Side 7