ÅMA Sasylighetsregig med statistikk, våre Kp. 4 Kotiuerlige tilfeldige variable; Normalfordelig Kotiuerlige tilfeldige variable, itro. (eller: Kotiuerlige sasylighetsfordeliger) Vi har til å sett på diskrete fordeliger - mulige verdier er atskilte pukter på tallije, feks f.eks.,,, 3,... Kotiuerlige tilfeldige variable, itro. (eller: Kotiuerlige sasylighetsfordeliger) Vi har til å sett på diskrete fordeliger - mulige verdier er atskilte pukter på tallije, feks f.eks.,,, 3,... I mage situasjoer er det aturlig at alle verdier på tallije (muliges e del av de) er mulige utfall. 3
7) 5) 3) ) 9) 7) 5) 3) ) 9) 7) 5) 3) ) 9) 7) 5) Kotiuerlige tilfeldige variable, itro. Eks.: X=høyde til tilfeldig valgt kvielig UiSstudet.,,,8 I prisippet er ehver verdi i f.eks. itervallet [.5m,.m], et mulig utfall.,6, [53, 5 [55, 5 [57, 5 [59, 6 [6, 6 [63, 6 [65, 6 [67, 6 [69, 7 [7, 7 [73, 7 [75, 7 [77, 7 [79, 8 [8, 8 [83, 8 [85, 8.5m.m Vi ka ikke liste opp alle mulige utfall i e slik situasjo og kytte sasylighet til hvert av dem! 4 Kotiuerlige tilfeldige variable, itro. Vi sier at X er e kotiuerlig tilfeldig variabel, eller at X har kotiuerlig sasylighetsfordelig., For å beskrive fordelig av sasylighet på de forskjellige utfallee, f(x),,8,6, brukes e kurve, f(x): 85 8 75 7 65 6 55 x 5 Kotiuerlige tilfeldige variable, itro. Kurve beskriver fordelige av sasylighet på de forskjellige utfallee, ved at: sasylighete er stor for verdier x der f(x) er stor. Vi ka ikke betrakte ekeltverdier, me et itervall, [a, b], av verdier.,,,8 f(x),6, 85 8 75 7 65 6 55 x 6
Kotiuerlige tilfeldige variable, itro. Kurve beskriver fordelige av sasylighet på de forskjellige utfallee, ved at: sasylighete er stor for verdier x der f(x) er stor. Vi ka ikke betrakte ekeltverdier, me et itervall, [a, b], av verdier., P(X [a,b]) = P(a X b) f(x),,8,6 b = f(x)dx a, 55 6 65 a b 7 x 75 8 85 7 Kotiuerlige tilfeldige variable, itro. Def.: Kurve f(x) kalles sasylighetstetthetsfuksjoe til X. For tetthetsfuksjoe f(x) må vi ha at : ) f(x) ) for to tall a og b der a < b, P(a X b) = f(x) dx 3) f(x) dx = - b a er 8 Kotiuerlige tilfeldige variable, itro. Def.: For e tilfeldig variabel Y sier vi at fuksjoe F defiert ved F(y) = P(Y y), er fordeligsfuksjoe til Y. Dersom Y er kotiuerlig fordelt, så F(y) = P(Y y) = f(x) dx y - 9 3
Kotiuerlige tilfeldige variable, itro. Forvetig og varias for kotiuerlige variable: Def.: Dersom X er e kotiuerlig tilfeldig variabel med tetthet f(x), så E(X) = xf(x)dx = μ - Var(X) = (x - μ) f(x)dx - ( = E{ ( X μ) }) Kotiuerlige tilfeldige variable, itro. Forvetig og varias for kotiuerlige variable: Obs.: har samme fortolkig som for diskrete variable - setrum, beliggehet - spredig Def.: Dersom X er tetthet f(x), så E(X) Var(X) = xf(x)dx = - = - e kotiuerlig tilfeldig variabel med μ (x - μ) f(x)dx ( = E{ ( X μ) }) Kotiuerlige tilfeldige variable Viktige klasser av kotiuerlige fordeliger som vi skal se på: Ekspoesialfordelige (kp. 4.) Normalfordelige (kp. 4.3) Seiere: Studet s t-fordelig (kp. 6.6) 4
Kotiuerlige tilfeldige variable Viktige klasser av kotiuerlige fordeliger som vi skal se på: Ekspoesialfordelige (kp. 4.) Normalfordelige (kp. 4.3) Seiere: Studet s t-fordelig (kp. 6.6) 3 Ekspoesialfordelige (kp. 4.) Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x λ Skrivemåte: X~eksp.( ) 4 Ekspoesialfordelige (kp. 4.) Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x, λ = : x e, f(x) =, for x > for x f(x),5, - 3 4 5 6 7 x 5 5
f(x) f(x) f(x),,5, - 3 4 5 6 7 x,,5, - 3 4 5 6 7 x,,5, - 3 4 5 6 7 x Ekspoesialfordelige E viktig type (kotiuerlig) fordelig. Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x Obs.: ) kotiuerlig vetetidsfordelig; jf. geometrisk fordelig; ) svært mye brukt til modellerig og aalyse av pålitelighet til systemer 6 Ekspoesialfordelige E viktig type (kotiuerlig) fordelig. Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x Eksempel: Modell for edbørsmegde et døg. ( Vetetid til reget er slutt.) Histogram over døgedbør i februarmåeder åree 997-6. (Døg med <.7mm er utelatt.) Rød kurve er tilpasset ekspoesialtetthet. Gjeomsitt:.87mm 7 Ekspoesialfordelige Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x Setig : Dersom X er ekspoesialfordelt med parameter λ, så E(X) = og Var(X) = λ λ 8 6
f(x),,5-3 4 5 6 7 x Ekspoesialfordelige Setig : Dersom parameter λ, så E(X) = λ og X er ekspoesialfordelt med Var(X) = λ For edbørsdataee: E(X) estimeres med gj.s. Dvs.: /λ estimeres til.87, og dermed: λ estimeres til /.87 =.777 9 Ekspoesialfordelige Eksp.-tettheter med ulike parametere: Forv. = Parameter λ = ; E(X) = = x e, f(x) =, for x > for x,,5, - 3 8 3 Forv. =.x.e, for x > Parameter λ =.; f(x) =, for x E(X) = =.,,5, - 3 8 3 Ekspoesialfordelige Setig : Dersom X er ekspoesialfordelt med Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : parameter λ, så λx λe, for x >, E(X) = og Var(X) = f(x) = λ λ, for x Obs.: - λx E(X) = xf(x)dx = xλe dx = L = - λ Forvetige (og varias) fies vha. itegrasjo. (Det er ikke pesum i dette kurset.) 7
Ekspoesialfordelige Eks.: Vi atar at levetide til e tilfeldig valgt lyspære er eksposialfordelt med forvetig 5 timer. Hva er sasylighete for at de svikter før timer? Hva er sasylighete for at de virker mist 3 timer? Ekspoesialfordelige Eks.: Vi atar at levetide til e tilfeldig valgt lyspære er eksposialfordelt med forvetig 5 timer. La T = levetide til lyspære. Vi har : T er ekspoesialfordelt med parameter λ = ; 5 tetthet : f(t) = 5 e 5, x, for t > for t 3 Ekspoesialfordelige Geerelt : t λt -λt P(T t) = λe dt = e 4 8
Ekspoesialfordelige Geerelt : t λt -λt P(T t) = λe dt = e - 5 - P(T < ) = e = e 5 =.33. 5 Ekspoesialfordelige Geerelt : t λt -λt P(T t) = λe dt = e - 5 - P(T < ) = e = e 5 =.33. P(T 3 ) = P(T < 3 ) - = e 5 3 =.3 6 Kotiuerlige tilfeldige variable, geerelt Obs.: Dersom X er kotiuerlig fordelt, så a P(X = a) = f(x)dx = a Derfor : P(X a) = P(X < a) 7 9
5 5 5 5 Kotiuerlige tilfeldige variable Obs.: Dersom X er kotiuerlig fordelt, så,, P(a X b) : f(x),8,6, 55 6 a 65 b 7 x 75 8 85,,,8 P(X = a) = P(a X a) = f(x),6, 55 6 65 a 7 x 75 8 85 8 Kotiuerlige tilfeldige variable Viktige klasser av kotiuerlige fordeliger som vi skal se på: Ekspoesialfordelige (kp. 4.) Normalfordelige (kp. 4.3) Seiere: Studet s t-fordelig (kp. 6.6) 9 Normalfordelige (kp. 4.3) Dette er de viktigste fordelige i de forstad at ige adre fordeliger er mer brukt i statistiske aalyser e ormalfordelige! 3
Normalfordelige Defiisjo: Dersom X er e tilfeldig variabel med tetthet : f ( x ) = e πσ ( x μ) σ, < x <, sier vi at X er ormalfordelt med forvetig μ og varias σ. Skriver : X ~ N( μ, σ ) 3 Normalfordelige N(,),5,4,3, N(,),, -4, -,,, 4, 6, 8,, 3 Normalfordelige,5,4,3, N(,) N(5,),, -4, -,,, 4, 6, 8,, 33
Normalfordelige,5,4,3, N(,) N(5,) N(,,5),, -5,, 5,, 34 Normalfordelige Normalfordelige er spesielt viktig fordi mage datasett ser ut til å være ormalfordelte mage aalysemetoder bygger på ormalfordelige 35 Normalfordelige, Stadardormal Defiisjo: Normalfordelig med forvetig og varias kalles stadardormalfordelige. Tabeller over sasyligheter i N(,)-fordelige: 36
Normalfordelige, sasyligheter La Z~N(, ).,5 P(Z ) = f(x)dx = -,4,3,,, -4, -,,, 4, -,... tabell 37 Normalfordelige, sasyligheter La Z~N(, ).,5 P(Z ) = f(x)dx = -,4,3,,, -4, -,,, 4, -, =.843 38 Normalfordelige, sasyligheter,5 P( Z>.5 ) =,4,3, = -P( Z<.5 ),, -4, -,,, 4, -, =... -.695 =.385 Vi har tabell ku for N(,)-fordelige. 39 3
Normalfordelige Eks.: La de tilfeldige variabele X være megde melk i e tilfeldig valgt -literskartog. Vi atar at X~N(,. ) (X er ormalfordelt med forvetig og varias.. Hva er sasylighete for at det er midre e.95 liter i e tilfeldig valgt kartog? 4 Normalfordelige Eks.: La de tilfeldige variabele X være megde melk i e tilfeldig valgt -literskartog. Vi atar at X~N(,. ) (X er ormalfordelt med forvetig og varias.. Hva er sasylighete for at det er midre e.95 liter i e tilfeldig valgt kartog? Dvs.: vi vil fie P( X<.95 ).... tabeller...? 4 Normalfordelige Obs. : Y = a + bx er også ormalfordelt Obs. : X μ μ X Z = = + X = a σ X σ X σ 3 { X X + a b bx..., og derfor er Z defiert som over, også ormalfordelt 4 4
Normalfordelige Obs. : Y = a + bx er også ormalfordelt Obs. : X μ μ X Z = = + X = a σ X σ X σ 3 { X X + a b bx..., og derfor er Z defiert som over, også ormalfordelt, og... Z har forvetig og varias (SJEKK DETTE!). Dvs.: Z~N(, ). 43 Normalfordelige Eks.: X~N(,. ). Vi vil fie P( X<.95 ). X <.95 Derfor : X.95 Z = <.. X μ X Z = σ X.95 }..95 P( X <.95) = P Z < = P( Z <.5) =.6. 44 Normalfordelige, resultater Setig: Dersom X,..., X er uavhegige, ormalfordelte tilfeldige variable (og a, a,..., a er kostater), så er Y = a + a X +...+ a X e ormalfordelt tilfeldig variabel. 45 5
Normalfordelige Obs.: Resultatet i setige gjelder ikke geerelt (for adre typer fordeliger) Dersom X ~ekspo.() og X ~ekspo.(), så har vi ikke at X +X ~ekspo.() Dersom X ~B(,.5) og X ~B(,.), så har vi ikke at X +X ~B(); Heller ikke er f.eks. X biomisk fordelt! 46 Normalfordelige Setig: Dersom X,..., X er uavhegige, ormalfordelte tilfeldige variable (og a, a,..., a er kostater), så er Y = a + a X +...+ a X e ormalfordelt tilfeldig variabel. Forvetig: E(Y) = E(a +a X +...+ a X ) = a + a E(X )+...+ a E( X ) Varias: Var(Y) = Var(a +a X +...+ a X ) =a Var(X )+...+ a Var( X ) 47 Statistiske egeskaper til gjeomsittet Statistiske egeskaper til gjeomsittet Hvorfor?? Eks.: Data: 48 4.8 3.8 384.4 445. 53.6 365. 54.5 453.7 374. 44.3 43 ( måliger av e persos blodsukkerivå; tatt på samme tidspukt.) Vi vil typisk bruke gjeomsitt, som her er 4.35, i diverse videre aalyser. 48 6
,8,8 Statistiske egeskaper til gjeomsittet Eks.: Data: 4.8 3.8 4.4 5. 3.6 5. 4.5 3.7 4. 4.3 Gjeomsitt er 4.35; Prikkdiagram: 3 3, 35 3,5 4 4, 45 4,5 5 5, 55 5,5 Hva er virkelig ivå? (4.35 eller 3.6 eller 5....) Vi treger å vite oe om de statistiske usikkerhete i aslaget 4.35!! 49 Statistiske egeskaper til gjeomsittet Eks.: Data: 4.8 3.8 4.4 5. 3.6 5. 4.5 3.7 4. 4.3 Gjeomsitt er 4.35; Statistisk takegag: Vi oppfatter de måligee som utfall av e (kotiuerlig) fordelig: 3, 3,5 4, 4,5 5, 5,5 3, 3,5 4, 4,5 5, 5,5 5 Statistiske egeskaper til gjeomsittet Eks.: Data: 4.8 3.8 4.4 5. 3.6 5. 4.5 3.7 4. 4.3 Gjeomsitt er 4.35; Statistisk takegag: Vi oppfatter de måligee som utfall av e (kotiuerlig) fordelig: 3, 3,5 4, 4,5 5, 5,5 3, 3,5 4, 4,5 5, 5,5 Jf. også: resultat av terigkast, 3, 6,,...: utfall av fordelige y 3 4 5 6 P(Y=y) /6 /6 /6 /6 /6 /6 5 7
Statistiske egeskaper til gjeomsittet Dvs.: vi oppfatter måligee x, x, K, x tilfeldige variable X, X, K, X aktuelle fordelige. som utfall av som alle har de Gjeomsittet av måligee, x = ( x + x + L+ x ) oppfattes som utfall av gjemosittet X = ( X + X + L+ X ) av de tilfeldige variable: 5 Statistiske egeskaper til gjeomsittet Eks.: Data: 4.8 3.8 4.4 5. 3.6 5. 4.5 3.7 4. 4.3 Gjeomsitt er 4.35; Prikkdiagram: 3, 3,5 4, 4,5 5, 5,5 Hva er virkelig ivå? (4.35 eller 3.6 eller 5....) Vi treger å vite oe om de statistiske usikkerhete i aslaget 4.35!! De statistiske egeskapee til X = L+ vil kue fortelle oss mye om de statistiske ( X + X + X ), usikkerhete!! Dette er e typisk situasjo! 53 Statistiske egeskaper til gjeomsittet Geerelt : måliger x, x, K, x ; oppfattes som utfall av tilfeldige variable X, X, K, X. Mage gager er det rimelig å ata at X, X, K, X ) uavhegige og idetisk fordelte tilfeldige variable, og ) ormalfordelte. er Hva er da egeskapee til X = L ( X + X + + X )? 54 8
Statistiske egeskaper til gjeomsittet Setig : Dersom X,X, K,X er uavhegige tilfeldige variable som alle er ormalfordelte med forvetig μ og varias σ, så er X = L ( X + X + + X ) + ormalfordelt med forvetig μ og varias σ. 55 Statistiske egeskaper til gjeomsittet Setig : Dersom X,X, K,X tilfeldige variable som alle er ormalfordelte med forvetig μ og varias σ, er uavhegige så er X = ( X + X + L+ X ) ormalfordelt med forvetig μ og varias Bevis :... vha.: σ.. Setig: Dersom X,..., X er uavhegige, ormalfordelte tilfeldige variable (og a,..., a er kostater), så er Y = a X +...+ a X e ormalfordelt tilfeldig variabel.. Regeregler for forvetig og varias. 56 Statistiske egeskaper til gjeomsittet X = X + X + L+ X = li.komb. av uavh. orm.ford. tilf. var. E( X ) = E ( X + L+ X ) = E( X + L+ X ) = { E( X) + L + E( X )} = ( μ + + μ) = μ 4 L 43 μ Setig : Dersom tilfeldige variable X,X som forvetig μ og varias, K,X alle X = ( X + X + L+ X ) ormalfordelt med forvetig μ og varias σ er, er uavhegige ormalfordelte med så er σ. 57 9
Statistiske egeskaper til gjeomsittet X = X + X + L+ X = li.komb. av uavh. orm.ford. tilf. var. E( X ) = E ( X + L+ X ) = E( X + L+ X ) = { E( X) + L + E( X )} = ( μ + + μ) = μ 4 L 43 μ Setig : Dersom tilfeldige variable X,X som forvetig μ og varias, K,X alle X = ( X + X + L+ X ) ormalfordelt med forvetig μ og varias σ er, er uavhegige ormalfordelte med så er σ. Var(X ) = Var ( X + L+ X ) = Var( X + L+ X ) = { Var( X ) + L+ Var( X )} 64748 σ 4 σ = ( σ + L+ σ ) = 58 Statistiske egeskaper til gjeomsittet E del gager er det ikke rimelig å bruke ormalatakelse (ata at måligee er utfall fra e ormalfordelig). (F.eks. dersom dataee har e tydelig flertoppet eller usymmetrisk fordelig.) Hva ka vi da si om: Statistiske egeskaper til gjeomsittet? 59 Setralgresesetige Setralgresesetige : Dersom X,X, uavhegige og idetisk fordelte tilfeldige variable med forvetig μ og varias σ, så er X = L K ( X + X + X ) +,X er tilærmet ormalfordelt med σ forvetig μ og varias, år er stor. Bevis:...... 6
Setralgresesetige Obs : Setralgresesetige : Dersom X, X, K,X er uavhegige og idetisk fordelte tilfeldige variable med forvetig μ og varias σ, så er ( X + X + + X ) Y = L tilærmet ormalfordelt med forvetig μ og varias σ, år er stor. Videre : Y - E(Y) SD(Y) er tilærmet ormalfordelt med forvetig og varias. 6 Setralgresesetige... år er stor...?? Tommelfigerregel: mist 3 for god tilærmig. Eks.: Y = sum av 3 kast med e terig. Fordelig til Y? P(Y<) =? 6 Setralgresesetige Eks.: Y = sum av 3 kast med e terig. La X i = resultat i kast r i, i=,,..., 3. Vi ka fie at E(X i )=3.5 og Var(X i )=.9, og vi har her at Y = X +... + X 3 (Alle X i ee er uavhegige og idetisk fordelte!) Y si fordelig er tilærmet ormal med forvetig 3 3.5 = 5 og varias 3.9 = 87.6 63
Setralgresesetige Y si fordelig er tilærmet ormal med forvetig 3 3.5 = 5 og varias 3.9 = 87.6,5,3,, 75 85 95 5 5 5 35 64 Setralgresesetige Y si fordelig er tilærmet ormal med forvetig 3 3.5 = 5 og varias 3.9 = 87.6,5 Y 5 5 P(Y < ) = P < 87.6 443 87.6.53,3,, 75 85 95 5 5 5 35 P(Z < -.53) =.98, ( her er Z ~ N(,) ) fra tabell.,5,3,, 75 85 95 5 5 5 35 65 Normaltilærmig, biomisk De biomiske fordelige ka tilærmes med ormalfordelig i e del tilfeller: Dersom Y~B(, p) og p(-p) p) mist, så ka fordelige til Y tilærmes med fordelige til X, der X er ormalfordelt med forvetig p og varias p(-p); X~N( p, p(-p) ) Gir betydelig foreklig ved utregig av sasyligheter. 66
Normaltilærmig, biomisk Altså: Y ~ B(, p ). p( p), så har vi med god tilærmig : P(Y y) P(X y), der X ~ N( p, p(- p) ) 67 Normaltilærmig, biomisk Eks.: Y=at. kro i kast med et pegestykke ~ B(,.5 ) P(Y 4) P(X 4), der X ~ N( 5, 5 ) ( E(Y) = 5 og Var(Y) =.5 (-.5) = 5) P X -5 5 4-5 5 ( X 4) = P = P( Z -) =.8 68 Normaltilærmig, biomisk P(Y 4) P = P ( X 4) X -5 4-5 = P 5 5 ( Z -) =.8,,6,8,6 B(,.5) B(,.5) P(Y<= 4) N(5, 5), P(Y<= 4) N(5, 5),, 35 38 4 44 47 5 53 56 59 6 65, 35 36 37 38 39 4 4 4 43 44 45 69 3
Normaltilærmig, biomisk Det må åpebart være bedre med: ( X 4.5) P(Y 4) P +,,6,8,6 B(,.5) B(,.5) P(Y<= 4) N(5, 5), P(Y<= 4) N(5, 5),, 35 38 4 44 47 5 53 56 59 6 65, 45 44 43 4 4 4 39 38 37 36 35 7 Normaltilærmig, biomisk Da får vi: P(Y 4) X -5 4 + 5.5-5 P( X 4 +.5) = P 5 5 = P Z -.9 =.87 (eksakt : ( ).84),6,6 B(,.5) B(,.5) P(Y<= 4) P(Y<= 4), N(5, 5), N(5, 5),, 7 45 44 43 4 4 4 39 38 37 36 35 45 44 43 4 4 4 39 38 37 36 35 Normaltilærmig, heltallskorreksjo Heltallskorreksjo ved ormaltilærmig av fordeliger som tar verdier på heltallee: X: tilfeldig variabel med fordelig som ka tilærmes med ormalfordelige; Y: Normalfordelt tilf.var. med forv. E(X) og varias Var(X). Da: ( X x) P( Y x.5) P + 7 4
Normaltilærmig, heltallskorreksjo ( X x) P( Y x.5) P + Gjelder altså bl.a. ved ormaltilærmig av biomisk fordelig Hypergeometrisk fordelig Poissofordelig 73 Normaltilærmig Hypergeometrisk modell dersom <. N, så tilærmig til biomisk modell, og dersom biomisk modell ka tilærmes med ormalfordelig,... Poissomodell Dersom Y ~ Poisso ( λt) og λt, så P(Y y) P(X y), der X ~ N( { λt, { λt ) E(Y) Var(Y) 74 5