....3.4.5..5..5..5...4.6.8....4.6.8....3.4..5..5 Kaittel 6: Kontinuerlige sannsynsfordelingar TMA445 Statistikk Ka 6.5-6.8. 6.5: Normal aroksimasjon til binomisk fordeling, 6.6-6.8: Eksonensialfordeling, gammafordeling og kji-kvadrat-fordeling Turid.Follestad@math.ntnu.no./8 6.5 Normalaroksimasjon til binomisk fordeling TEO 6. Dersom X er ein binomisk stokastisk variabel med forventning µ = n og varians σ = n( ), så vil fordelinga til den stokastiske variablen Z = X µ = X n σ n( ) konvergere til standardnormalfordelinga, n(z;,), når n. n=, =. n=, =. n= 5, =..5..5..5..5 3 4 4 6 8 4 n=, =.5 3 4 n=, =.5 4 6 8 n= 5, =.5 3 4 TMA445 Statistikk: Kaittel 6.5-6.8./8 TMA445 Statistikk: Kaittel 6.5-6.8.4/8 Betinga fordelingar: f( ) og f( ) er også normalfordelingar. fx ( ) = e πσ ( µ) «σ, X N(µ, σ ) fx ( ) = e πσ ( µ) σ «, X N(µ, σ ) Marginalfordelingar: µ = E(X), σ = Var(X ), µ = E(X), σ = Var(X ) og ρ = ρ(x, X) er korrelasjonen mellom X og X. e ( µ) ( ρ ) σ + ρ( µ)( µ) + ( µ) ««σσ σ f(, ) = πσσ ρ To kontinuerlige stokastiske variablar X og X har bivariat normalfordeling dersom Bivariat normalfordeling (eksemel å simultanfordeling) TMA445 Statistikk: Kaittel 6.5-6.8.3/8 P( X ) P(.5 n n( ) Z +.5 n n( ) ) Generelt: 5 5 f()..5..5.5 n P(X ) P(Z ) n( ) Ein "kontinuitetskorreksjon" (erstattar med.5) kan gjere aroksimasjonen betre: La X b(;,.4). Kva er P(X )? Eksemel: Normalaroksimasjon til binomisk
f(,) TMA445 Statistikk: Kaittel 6.5-6.8.6/8 Eksonensialfordelinga har ikkje hukommelse, dvs. er "gløymsk": P(X > s + t X > s) = P(X > t). La X = tid til første hending. X er då eksonensialfordelt med forventning E(X) = λ. der λ er gjennomsnittlig antal hendingar er tidseining. y! y =,,,... (y; λt) = e λt (λt) y La Y = antal hendingar i intervallet [, t]. Y er då Poisson-fordelt, med sannsynsfordeling 3. Sannsynet for at meir enn ei hending skal inntreffe innanfor eit kort tidsintervall av lengde t er neglisjerbar.. Sannsynet for at ei enkelt hending inntreffer innanfor et kort tidsintervall av lengde t er tilnærma λ t.. Antal hendingar i disjunkte tidsintervall er uavhengige. Vi ser å hendingar å ein tidsakse, f.eks. SMS til basestasjon eller bøteleggingar i ein trafikk-kontroll. Ein Poisson rosess ofyller: Ventetida i ein Poisson-rosess 4 4 TMA445 Statistikk: Kaittel 6.5-6.8.5/8 f( )....3.4 f( ) for =,, 4 4 4 4 Bivariat normalfordeling (forts) TMA445 Statistikk: Kaittel 6.5-6.8.8/8 4 6 8...4.6.8. beta=4 beta=5 beta=3 f() beta= beta= f(; β) for β =,, 3, 4, 5 (eller λ =,, 3, 4, 5 ) Eksonensialfordelinga, f(; β) TMA445 Statistikk: Kaittel 6.5-6.8.7/8 µ = E(X) = β = λ σ = Var(X) = β = λ Forventning og varians: (TEO 6.3, COR ) Kumulativ fordelingsfunksjon:, F() = e /β, > Alt. arametrisering: λ = /β, der λ er intensiteten i ein Poisson rosess. f(; β) = β e /β, >, elles DEF: Ein kontinuerlig stokastisk variabel X har ei eksonensialfordeling med arameter β (β > ), dersom sannsynstettleiken er Eksonensialfordelinga
Eksemel: Trafikk-kontroll, mobilbruk Politiet vil aksjonere mot ulovlig mobilbruk i bil, og gjennomfører ein kontroll ved Lerkendal-rundkøyringa. Antar at antal sjåførar som blir bøtelagt i løet av t timar er Poisson-fordelt med intensitet λ = 5, dvs. med forventning λt = 5t. La X vere tid frå kontrollen startar til første bilførar blir bøtelagt. Ogåver:. Kva er forventa tid til. bøtelegging?. Kva er sannsynet for at første bot er skriven ut før det er gått min? 3. Kva er sannsynet for at det tar meir enn 3 timar til første bøtelegging? 4. Dersom ingen er bøtelagt etter min, kva er sannsynet for at første bot er skriven ut etter nye min.? 5. Kva er sannsynet for at det tar meir enn ein time før det er skrive ut bøter? TMA445 Statistikk: Kaittel 6.5-6.8.9/8 Eksemel: Trafikk-kontroll, mobilbruk (forts.) Løysing: X er eksonensialfordelt med arameter β = /λ = 5.. Forventa tid til. bøtelegging: E(X) = β = /λ = /5 t = min.. Sannsynet for at første bot er skriven ut før det er gått min? P(X 3 ) = F( 3 ) = e β 3 = e 5/3 =.9 =.8 3. Sannsynet for at det tar meir enn 3 timar til første bøtelegging: P(X > 3) = P(X 3) = ( e 3/β ) = e 3 5 =.3 4. Sannsynet for at første bot er skriven ut etter 4 ( + ) min., gitt at ingen er bøtelagt etter min: P(X > 3 X > 3 ) = P(X > 3 3 ) = P(X > 3 ) = P(X 3 ) =.8 =.9 TMA445 Statistikk: Kaittel 6.5-6.8./8 Eksemel: Illustrasjon av mangel å hukommelse Ei lysære har levetid X, som er eksonensialfordelt med arameter β. { f(; β) = β e /β, > elles. Vi veit at lysæra har virka i s timar, kva er då sannsynet for at ho virkar t timar til? Har at P(X > s+t X > s) = P(X > s+t s) = F(t), der F(t) = P(X t) er kumulativ fordeling for X, innsett t. TMA445 Statistikk: Kaittel 6.5-6.8./8 Tid til nte hending Trafikk-kontroll: Kor lenge må olitiet stå å ost før dei har skrive ut bøter? Lysærer: Kjøer ein akke med lysærer til ein lame. Kor lenge held dei? SMS til basestasjon: Kor lang tid går det før basestasjonen har mottatt SMS? Ei maskin må byttast ut når ho har feila og blitt rearert 5 gongar. Kor lang tid tar det før ho må byttast ut? TMA445 Statistikk: Kaittel 6.5-6.8./8
Gammafordelinga DEF: Ein kontinuerlig stokastisk variabel X følgjer ei gammafordeling med arametrar α og β dersom sannsynstettleiken er gitt ved f(; α, β) = { β α Γ(α) α e /β, > elles, der α > og β >. Eksonensialfordeling: gammafordeling med α =. TEO 6.3: Forventing og varians i gammafordelinga: µ = E(X) = αβ σ = Var(X) = αβ TMA445 Statistikk: Kaittel 6.5-6.8.3/8 Gammafunksjonen DEF 6.: Gammafunksjonen er definert som Γ(α) = α e d for α >. For α > : Γ(α) = (α )Γ(α ). For α ositivt heiltal: Γ(α) = (α )! Γ() =. Γ( ) = π. TMA445 Statistikk: Kaittel 6.5-6.8.4/8 Gammafordelinga, f(; α, β) α = α = 3 β = β = TMA445 Statistikk: Kaittel 6.5-6.8.5/8 5 5 5 5 5 5 5 5 f() f()...4.6.8....4.6.8. f() f()...4.6.8....4.6.8. Eksemel: Trafikk-kontroll, mobilbruk (forts.) Løysing, og. 5: 5. Sannsynet for at det tar meir enn ein time før det er skrive ut bøter: La no X vere antal timar til.bøtelegging. X er Gammafordelt med α =, β = λ = 5. P(X > ) = P(X ) P(X ) = ( 5 ) Γ() e 5 d = 5 e 5 delvis integrasjon d =... =.96 P(X > ) = P(X ) =.96 =.4 TMA445 Statistikk: Kaittel 6.5-6.8.6/8
TMA445 Statistikk: Kaittel 6.5-6.8.8/8 5 5..5..5..5.3 Kjikvadrat,5,, µ = E(X) = ν σ = Var(X) = ν Forventning og varians: Kjikvadratfordelinga (forts.) TMA445 Statistikk: Kaittel 6.5-6.8.7/8 Kji-kvadrat vs. gamma: Kji-kvadratfordelinga er gammafordelinga med α = ν/ og β =. der ν er eit ositivt heiltal. DEF Ein kontinuerlig stokastisk variabel X er kji-kvadratfordelt med arameter ν (kalla fridomsgrader) dersom sannsynstettleiken er gitt ved f(; ν) = ν/ Γ(ν/) ν/ e /, >, elles, (meir fullstendig saman med statistisk inferens) 6.8 Kjikvadratfordelinga