Eco 130 Forelesig uke 11 (HG) Mer om ormalfordelige og setralgreseteoremet Uke 1 1
Fra forrige gag ~ betyr er fordelt som. ~ N( µσ, ) E( ) = µ, og var( ) = σ Normalfordelige er symmetrisk om μ og kotiuerlig P ( = x) = 0 µ ~ N( µσ, ) Z = ~ N(0,1). Z er stadard ormalfordelt. σ Gz ( ) = PZ ( z) tabulert i tabell E3 (D3) x µ x µ ~ N( µσ, ) P ( x) = P Z = G σ σ ~ N( µσ, ) Y = a + b ~ N( E( Y ), SD( Y )) = N( a + bµ, b σ) ~ N( µσ, ) et 1 αspredigsitervall for er gitt ved P( µ z σ µ + z σ) = 1 α, der z er α kvatile i N(0,1) α α α dvs. PZ ( > z ) = α. α Uke 1
Statistiske egeskaper for gjeomsitt La = atall øye ved et kast med e rettferdig terig 1 P ( = x) = for x= 1,,,6 6 sjekk selv E = = = = = ( ) 3.5 ( µ ), var( ).9 ( σ ), og σ 1.7088 (*) Vi har 5 uavhegige observasjoer av,, 4, 5, 5, 1. Disse tallee beteges med, x, x, x, x, x Gjeomsitt, 1 3 4 5 1 17 x = xi = = 3.4 5 i 5 Hva er de statistiske egeskapee til observasjoe x = 3.4? Uke 1 3
De statistiske egeskapee til e observasjo, y, av e stokastisk variabel, Y, ligger ikke i tallet y selv, me i de bakeforliggede mekaisme som ha produsert y - represetert ved sasylighetsfordelige for Y. For å bestemme de statistiske egeskapee til observasjoe (tallet) treger vi e stokastisk variabel som har produsert 3.4. Merk at utsaget uavhegige observasjoer av er upresist. x = 3.4, Modell for eksperimetet uavhegige observasjoer av, ( x1, x,, x ): Itroduser stokastiske variable, 1,,,., e for hver observasjo, (dvs. 1 x1, x,, x) og der vi atar 1,,, er uavhegige og idetisk fordelte (uid) med samme fordelig som. Da ka vi defiere de stokastiske variabele, og tallet x = 3.4 tolkes som e observasjo av. = + + + 1 De statistiske egeskapee til x = 3.4 er rett og slett gitt ved sasylighetsfordelige til og des egeskaper. Uke 1 4
Vi gjetar eksperimetet ( 5 kast med terige ) flere gager. Ata resultatet ble Eksp. r. Sum 1 4 5 5 1 17 3.4 6 1 3 3 15 3.0 3 1 3 4 3 13.6 4 6 6 4 5 19 3.8 x1 x 3 x x x 4 5 x Tallee for x, 3.4, 3.0,.6, 3.8,.., er observasjoer av de stokastiske variabele + + = 1 5 5 De statistiske egeskapee til hver ekelt observasjo ligger i sasylighetsfordelige til, f.eks. forvetig, varias, forme på fordelige, prosetiler, osv. osv. Uke 1 5
Side i har samme fordelig som, E( ) = E( ) = 3. 5, var( ) = var( ) =.9, og P ( 3) = 0. 5 for i = 1,, 6 i Noe egeskaper for : i regel 4.1 1 1 1 ( 1 5) ( 1 5 ) E( ) = E + + + = E( ) + E( ) + + E( ) = 5 (3.5) = 3.5 5 5 5 regel 4.17 1 1 1 5 1 5 v ar ( ) = var ( + + + ) = ( var( ) + var( ) + + var( )) = 5 5 1.9 = 5 (.9) = = 0.584 5 5 i vist seere P ( 3) = 0.305 Merk at for observasjoe selv gjelder Ex ( ) = E(3.4) = 3.4, var(3.4) = 0, og P(3.4 3) = 0 Svaret på spørsmålet: De statistiske egeskapee til observasjoe x = 3.4 er gitt ved egeskapee til sasylighetsfordelige for de stokastiske variabele som har produsert 3.4. Uke 1 6
Geerelt. La være e vilkårlig stokastisk variabel med E( ) = µ og var( ) = σ Modell for uavhegige observasjoer av, ( uid modelle ): La,,, være uavhegige og idetisk fordelte ( uid), med samme 1 E = µ = σ i= fordelig som ( ( i), var( i) for 1,,, ) 1 La S = 1+ + + og = = Da gjelder følgede regler (setiger): S + + + ( R1) ( i) E( S) = µ, var( S) = σ (Uasett fordelig for ) σ ( ii) E( ) = µ, var( ) = ( i) : Regel 4.1 E + + + = µ + + µ = µ Bevis. ( ) 1 Regel 4.17 var( + + + ) = σ + + σ = σ 1 ( ) ( ) σ σ ( ii) Regel 4.7 E( ) = E S = E( S ) = ( µ ) = µ Regel 4.9 var S = var( S ) = ( ) = Bevis slutt. Uke 1 7
Viktige egeskaper år ekeltobservasjoee kommer fra e ormalfordelig (R) Hvis ~ N( µσ, ) (som at ~ N( µ, σ ) for alle i), gjelder eksakt for alle σ ( i) S ~ N ( µ, σ ) og ( ii) ~ N µ, i Merk at regel 5.17 i boka er litt mer geerell. De sier at selv om har forskjellige ormalfordeliger, vil, uder uavhegighet, e vilkårlig lieærkombiasjo, Y= a 1 1+ + a, være eksakt ormalfordelt, Y ~ N E( Y ), SD( Y ). ( ) ~ N ( µ, σ ) i i i For eksempel. Hvis, er uavhegige og ~ N(,1), ~ N(3, ), 1 vil, ifølge regel 5.17, Y = ~ N( EY ( ), SD( Y)). 1 1 1 Vi fier E( Y) = E( ) E( ) = 3 = 4 og var( Y ) = 4 + = 4 + 1 = 17 var( ) ( 1) var( 1) 4 Dermed, Y ~ N(4, 17) Uke 1 8
Egeskaper til år ekeltobservasjoee kommer fra e vilkårlig fordelig Vi atar som side 7: La 1,,, være uavhegige og idetisk fordelte ( uid), der de felles fordel ige for, Fx ( ), er helt vilkårlig, med E( i) = µ, var( i) = σ for i= 1,,, La S 1+ + + S = + + + = = i 1 og Det berømte setralgreseteoremet er som følger (jfr regel 5.18-19 i boka) (R3) Hvis ikke er for lite (tommelfigerregel: 0 ), gjelder ( i) S = + + er tilærmet ormalfordelt, dvs.: 1 tilærmet x µ S ~ N( E( S), SD( S)) = N ( µσ, ), slik at PS ( x) G σ ( ii) = S er tilærmet ormalfordelt, dvs.: tilærmet σ x µ ~ N( E( ), SD( )) = N( µ, ), slik at P ( x) G σ (der Gz ( ) = PZ ( z) er de kum. ford.-fuksjoe i N(0,1) ) Uke 1 9
Bruk av setralgreseteoremet i praksis Eksempel. kast med rettferdig terig. = atall øye ved et kast, der P ( = x) = 1 6 for x= 1,,,6 µ = E( ) = 3.5, σ = SD( ) =.9 (sjekk selv!) Tilfellet = : Her er klart for lite til at vi ka vete oe god tilærmelse ved ormalfordelige, me la oss prøve allikevel! Modell for kast: 1, er uid med samme fordelig som. La Y = sum øye = +, og la oss berege P( Y 4) som regeeksempel. 1 Uke 1 10
Eksakt beregig av PY ( 4) Det er 6 = 36 mulige kombiasjoer av observasjoer av 1,, som alle er like sasylige, 1 36. Tabell over sum øye (Y) 1 1 3 4 5 6 1 3 4 5 6 7 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 1 Eksakt fordelig for Y: PY ( 4) = (1 + + 3) 36 = 1 6 = 0.1667 y 3 4 5 6 7 PY ( = y) 1/36 /36 3/36 4/36 5/36 6/36 y 8 9 10 11 1 PY ( = y) 5/36 4/36 3/36 /36 1/36 Uke 1 11
Tilærmet beregig av PY ( 4) ved ormalfordelig Prisipp. Når ma bruker ormalfordelige som tilærmelse til fordelige for e stokastisk variabel Y - som har forvetig μ og varias σ - er det valig å bruke N ( µσ, ). Det gir som oftest de beste tilærmelse. For = får vi av regel 4.1 og 4.17: EY ( ) = E( ) = (3.5) = 7, Var( Y) = Var( ) = (.9) = (.415) 1 1 Så vi bruker N(7,.415) som tilærmelse. La Z ~ N(0, 1) Y 7 4 7 4 7 PY ( 4) = P P Z = G( 1.4) = 0.1075.415.415.415 Eksakt verdi: PY ( 4) = 0.1667 Feil: 0.06 Relativ stor feil skyldes lite Ka forbedres litt med heltallskorreksjo Uke 1 1
Eksakt fordelig for Y = sum øye ved kast med terig og tilærmet ormalfordelig N(EY, SD(Y))=N(7,.415) Desity 0.05.1.15. 4 6 8 10 1 y (Stata grafikk) Heltallskorreksjo. Tilærmelse til PY ( 4) er itegralet opp til 4 av ormaltetthete. Vi ser at vi mister halvparte av siste søyle. E bedre tilærmelse ville vært å ta itegralet opp til 4.5 i stedet. Merk at, side Y bare ka ta hele verdier, må PY ( 4) = PY ( 4.5) og vi får 4.5 7 PY ( 4) = PY ( 4.5) P Z = G( 1.04) = 0.149 (feil 0.016).415 Uke 1 13
Heltallskorreksjo geerelt. La Y være e vilkårlig stokastisk heltallsvariabel (e variabel som bare tar hele tall) med EY ( ) = µ og var( Y) = σ. Hvis vi tilærmer fordelige til Y med e ormalfordelig, ka vi ofte forbedre tilærmelse ved å bruke PY ( y) = PY ( y+ 0.5). De siste variate gir valigvis e bedre tilærmelse. Merk at begivehetee ( Y y) og ( Y y+ 0.5) alltid itreffer samtidig, og er derfor like sasylige. Tilærmelse ute heltallskorreksjo: Y µ y µ y µ y µ PY ( y) = P P Z = G σ σ σ σ Tilærmelse med heltallskorreksjo: Y µ y+ 0.5 µ y+ 0.5 µ y+ 0.5 µ PY ( y) = PY ( y+ 0.5) = P P Z = G σ σ σ σ Korreksjoe er mest relevat for små utvalgsstørrelser. For stor er de overflødig i praksis. Uke 1 14
Tilfellet = 5 kast. 1,, 5 er uid og fordelt som. Y = + + + Oppgave: Bereg PY ( 15) 1 5. EY ( ) = 5( E( )) = 5(3.5) = 17.5, var( Y) = 5(var( )) = 5(.9) = (3.8188) 1 1 5 Eksakt beregig. Det er 6 = 7776 mulige kombiasjoer av utfall for 1,, 5, som alle er like sasylige. Jeg laget et lite program (i GAUSS) som bereget Y for alle 7776 muligheter (atydet i tabelle). Tabelle gir eksakt 373 PY ( 15) = = 0.30517... 7776 y 5 6 7 14 15 16 9 30 Atall komb. Y = y 1 5 15 540 651 735 5 1 Atall komb. Y y 1 6 1 17 373 3108 7775 7776 Uke 1 15
Tilærmet beregig av PY ( 15) år = 5 ( ) Vi treger N E( Y ), SD( Y ) = N(17.5, 3.8188) for tilærmig av fordelige til Y. Eksakt. Eksakt fordelig for Y = sum øye for 5 kast med terig og tilærmet ormalfordelig N(EY, SD(Y))=N(17.5, 3.8188) PY ( 15) = 0.305 Ute heltallskorreksjo 15 17.5 PY ( 15) G = 3.8188 = G( 0.65) = 0.578 (Feil 0.047) Desity 0.0.04.06.08.1 5 10 15 0 5 30 y Med heltallskorreksjo 15.5 17.5 PY ( 15) G = 3.8188 = G( 0.5) = 0.3015 (Feil: 0.004) Uke 1 16
Tilfellet = 10 kast. 1,, 10 er uid og fordelt som. Y = + + + Oppgave: Bereg PY ( 30) 1 10. EY ( ) = 10( E( )) = 10(3.5) = 35, var( Y) = 10(var( )) = 10(.9) = (5.4007) 1 1 10 Eksakt beregig. Det er 6 = 60 466176 mulige kombiasjoer av utfall for 10 som alle er like sasylige ( 16 1,, 10 ). Mitt GAUSS-program brukte ca. 30 sek. for å gå igjeom all disse 60 mill. tilfellee, og således var i stad til å berege de eksakte fordelige for Y. Programmet fat bl.a. at 1 393 176 kombiasjoer av utfall for gir Y 30.,, 1 10 Dermed blir de eksakte sasylighete 1 393176 PY ( 30) = = 0. 0497.... 10 6 Uke 1 17
Tilærmet beregig av PY ( 30) år = 10 ( ) Vi treger N E( Y ), SD( Y ) = N(35, 5.4007) for tilærmig av fordelige til Y. Eksakt. PY ( 30) = 0.050 Ute heltallskorreksjo 30 35 PY ( 30) G 5.4007 = G( 0.93) = 0.176 (Feil 0.08) Desity 0.0.04.06.08 Eksakt fordelig for Y = sum øye for 10 kast med terig og tilærmet ormalfordelig N(EY, SD(Y)) = N(35, 5.4007) 10 0 30 40 50 60 y Med heltallskorreksjo 30.5 35 PY ( 30) G 5.4007 = G( 0. 8) 3 = 0.033 (Feil: 0.00) Vi ser at heltallskorreksjo fortsatt løer seg, me midre og midre ettersom øker. Uke 1 18
Tilfellet = 0 kast. 1,, 0 er uid og fordelt som. Y = + + + Oppgave: Bereg PY ( 60) 1 0. EY ( ) = 0( E( )) = 0(3.5) = 70, var( Y) = 0(var( )) = 0(.9) = (7.6376) 1 1 Eksakt beregig er ekstremt upraktisk i dette tilfellet. Side det er 6 0 = ( 6 10 ) (60 mill.) kombiasjoer å rege igjeom å for å bestemme de eksakte fordelige, betyr det at mi laptop som bruker ca ½ miutt på 60 mill. kombiasjoer, ville trege ca. 60 mill. halv-miutter 58 år (!) På de ae side, eksakt beregig er komplett overflødig her side ormal-tilærmelse blir bedre og bedre år øker og de var bra for =10. 60.5 70 PY ( 60) G = G( 1.4) = 0. 1075 7.6376 (med e feil betydelig midre e 0.00 vi hadde for = 10). Uke 1 19
Merkader I dette eksemplet viste ormaltilærmelse seg å gi akseptable resultater selv for så lite som 5. Dette skyldes først og fremst symmetrie og forme på utgagsfordelige for. For adre fordeliger, for eksempel skjeve og flertoppete fordeliger, vil måtte være større før ormaltilærmelse skal være tilfredsstillede. For de aller fleste fordeliger (for ) gir tommelfigerregele 0 tilfredsstillede tilærmelse. Normaltilærmelse ka brukes for mage kompliserte fordeliger f.eks. for biomiske, hypergeometriske og poisso fordeliger. Se regel 5.0 som er e viktig regel i dette kurset. Les regel 5.0 på ege håd og sørg for at de beherskes via oppgaver. (Se f.eks. oppg. 5, 6, 11, 1, 13 i kap. 5 (utg. 3), eller 5, 6, 9, 10, 11 i kap. 5 (utg.). Heltallskorreksjo er først og fremst aktuell år er moderat og i greseområdet mellom akseptabel og ikke-akseptabel ormal-tilærmelse. Uke 1 0