ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. Diskrete tilfeldige variable Kp. Diskrete tilfeldige variable Har sett på (tidligere: begrep/definisjoner; tilfeldig (stokastisk variabel sannsynlighetsfordeling forventning Diskrete tilfeldige variable, varians (kp..4 Varians måler spredning i sannsynlighetsfordelingen.
Diskrete tilfeldige variable, varians (kp..4 Varians måler spredning i sannsynlighetsfordelingen. (Empirisk varians måler spredning i data. Def.: Variansen til en tilfeldig variabel X defineres ved : Var(X E{(X -μ }, der μ E(X. Obs.: Dersom X er en diskret tilf. var. som kan anta verdiene,,, K, så har vi : Var(X ( - μ P(X + ( - μ P(X + ( -μ P(X + L. 4 Diskrete tilfeldige variable, varians (kp..4 Varians måler spredning i sannsynlighetsfordelingen. Var(X ( - μ P(X + ( - μ P(X + ( -μ P(X + L avvik mellom verdi,, og sentrum, i μ kvadrerte avvik summert, vektet med sannsynlighet for verdi, P(X i. 5 Diskrete tilfeldige variable, varians (kp..4 Varians måler spredning i sannsynlighetsfordelingen. Var(X ( - μ P(X + ( - μ P(X + ( -μ P(X + Eks.: L. U V P(Uu..4. P(Vv..8. 6
Diskrete tilfeldige variable, varians (kp..4 Eks.: Hvilken fordeling har størst varians? U V 4 P(Uu..4. P(Vv...4.. 7 Diskrete tilfeldige variable, varians (kp..4 Eks.: Hvilken fordeling har størst varians? U V 4 P(Uu..4. P(Vv...4..,5,5,4,4,,,,,, 4 8 Diskrete tilfeldige variable, standardavvik Def.: Standardavviket til X defineres ved : SD(X VAR(X Obs.: Standardavviket måler spredning i fordelingen (som varians. 9
Regneregler for varians Var(X, X : tilfeldig variabel Var(k, k : konstant V: Var(X E(X { E(X } V: Var(aX + b a Var(X, a,b : konstanter Eks.: Innkjøp av el.artikler; varians til kostnad. Regneregler for varians Bevis for V: V: Var(X E(X μ, μ E(X Var(X E { (X μ } E { X μx + μ } E(X μe(x { + μ E(X μ μ Regneregler for varians Bevis for V: V: Var(aX + b a Var(X, Husk definisjon : Var(X E E ( ax + b Var aμ + b; Derfor : { (X μ } [ ] E [{ a( X μ } ] ( ax + b E { ax + b (aμ + b } a E [{ X μ } ] a Var(X 4
Diskrete tilfeldige variable, varians Eks.: X er tilfeldig variabel med en bestemt fordeling og varians, Var(X. La Y X og Y.5 X. Etter regneregel V er variansen til Y større enn variansen til Y (6 ganger større. Var(Y Var(Y 4Var(X.5Var(X Var(X Var(.5X 4 6.5 Intuitiv forklaring?? Diskrete tilfeldige variable, varians Eks.: Y X og Y.5 X. 4 8 6.5X X 4 4 6 X 4 Varians til sum; kovarians (Sidene 6 4 i boken: vi gjør dette litt annerledes og litt forenklet. Dersom vi skal regne ut Var(X+Y, kommer det inn et ledd i uttrykket som ser slik ut: E[(X μ (Y μ ], ( der μ E[X], og μ E[Y]. X Y X Y Var(X + Y Var(X + Var(Y + E[(X μ (Y μ ] X Y 5 5
Varians til sum; kovarians Def.: Kovariansen mellom to tilfeldige variable defineres ved: Cov( X, Y E[(X μ (Y μ ], X Y der μ E[X], og μ E[Y]. X Y Kovarians er et viktig mål på statistisk samvariasjon 6 Varians til sum; kovarians Statistisk samvariasjon Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. Xtemp. en tilfeldig sommerdag Yant. solgte is den dagen Utfall (,y av (X,Y: 7 Varians til sum; kovarians Statistisk samvariasjon Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. Xtemp. en tilfeldig sommerdag Yant. solgte is den dagen Utfall (,y av (X,Y: 4 8 positiv samvariasjon Cov(X,Y> antall is 8 8 8 8,, 8,, temperatur 8 6
Varians til sum; kovarians Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. Xtemp. en tilfeldig vinterdag Yant. solgte sekker ved den dagen Utfall (,y av (X,Y: 9 Varians til sum; kovarians Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. Xtemp. en tilfeldig vinterdag Yant. solgte sekker ved den dagen Utfall (,y av (X,Y: negativ samvariasjon Cov(X,Y< antall vedsekker 8 6 4 8 6 4 -, -5,, 5,, temperatur Varians til sum; kovarians Kovarians, fortolkning av definisjonen Cov( X,Y E[(X μ (Y μ ], X Y der μ X E[X], og μ Y E[Y]. Cov(X,Y er forventning til produktet mellom (X μ X og (Y μ Y 7
Kovarians Ingen (lineær statistisk sammenheng: Cov( X, Y Varians til sum; kovarians Regneregler: V4+: Dersom Cov(X,Y, så Var(X+Y Var(X + Var(Y V5+: Dersom alle X, X,..., X n har parvis kovarians null, så Var(X +X +...+X n Var(X +...+Var(X n Varians til sum; kovarians Hva med Var( X-Y?? (med og uten kovarians 4 8
Uavhengige tilfeldige variable Kovarians måler en form for (lineær avhengighet mellom tilfeldige variable. I svært mange situasjoner vil kovarians være tilstrekkelig for å fange opp interessant statistisk samvariasjon. Den generelle definisjonen for sammenheng mellom tilfeldige variable er inneholdt i definisjonen av uavhengige/avhengige tilfeldige variable. 5 Uavhengige tilfeldige variable Husk: Begivenhetene A og B uavhengige dersom P(ABP(AP(B Def.: To tilfeldige variable X og Y sies å være statistisk uavhengige dersom ({ X } { Y y} P(X P(Y y, P for alle verdier (,y (som X og Y kan anta. 6 Uavhengige tilfeldige variable At X og Y er statistisk uavhengige tilfeldige variable betyr at de har ingen sammenheng. Obs. : Statistisk uavhengighet er ikke det samme som kovarians lik null! Obs. : Følgende gjelder: Dersom X og Y er uavhengige, så: Cov(X,Y. (Det omvendte er gjelder ikke! 7 9
Korrelasjon Def.: Korrelasjonen mellom to tilfeldige variable X og Y er definert ved: ( X,Y Cov ρ ( X, Y Corr SD(XSD(Y ( X, Y 8 Korrelasjon Obs.: Korrelasjonen - er alltid mellom og, - har samme fortegn som kovariansen, og - er også et mål på styrken av samvariasjonen Corr(X,Y (eller : komplett (lineær sammenheng Corr(X,Y : ingen (lineær sammenheng 9 Korrelasjon Eks.: Vi vil studere variasjonen i gjennomsnittlig oljepris over en periode. Betrakter to-dagers gjennomsnitt. X oljepris (pr. fat dag X oljepris (pr. fat dag Antar: E(X E(X $, og Var(X Var(X 4($
ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. Diskrete tilfeldige variable Noen viktige sannsynlighetsmodeller Noen viktige sannsynlighetsmodeller ( Sanns.modell : nå betyr det klasse/type sanns.fordeling. Binomisk modell (kp..6 Hypergeometrisk modell (kp..7 Geometrisk modell (notater Poisson-modell (kp..8 (Seinere skal vi se på viktige kontinuerlige sannsynlighetsmodeller. Binomisk modell Situasjon der binomisk modell vil kunne passe: X antall ganger en bestemt begivenhet inntreffer i løpet av et fastlagt antall forsøk. (Dette skal presiseres seinere...
Binomisk modell Situasjon der binomisk modell vil kunne passe: X antall ganger en bestemt begivenhet inntreffer i løpet av et fastlagt antall forsøk. Eks.: antall kron i kast med et pengestykke antall seksere i 5 kast med en terning antall toppgevinster med en rekke i LOTTO hver uke i ett år 4 Binomisk modell X antall ganger en bestemt begivenhet inntreffer i løpet av et fastlagt antall forsøk. antall suksesser i n delforsøk Delforsøkene må tilfredstille:. uavhengige resultat i ulike delforsøk. resultatet er enten suksess eller fiasko. P( suksess er konstant i alle delforsøkene Def.: Når disse kravene er tilfredsstilt kaller vi de n delforsøkene for en binomisk forsøksrekke. 5 Binomisk modell Definisjon: Når X antall suksesser i en binomisk forsøksrekke, sier vi at X er binomisk fordelt (n, p der p P( suksess (kalles suksessannsynligheten. Skrivemåte: X ~ B(n, p 6
Binomisk modell Dersom: X ~ B(n, p X kan anta verdiene,,,..., n sannsynligheter og forventning og varians gitt ved formel: P ( X n p ( p n, for,,, K,n E ( X np ( X np( p Var (obs: forutsetningene om binomisk forsøksrekke medfører resultatene over. 7 Binomisk modell Eks.: X antall seksere i fem terningkast ~ B( 5, /6 E( X np Var( X np( p 5 Forventet : E( X np 5 6 6 Var ( X np( p 5.694 6 6 (.694.8 SD X 8 Binomisk modell Eks.: X antall seksere i fem terningkast ~ B( 5, /6 Beregne sannsynligheter: n n P( X p ( p P( fem seksere P P( minst en sekser ( X 5 P 5 5 5 5. 5 6 6 ( X P( X 5 5.49.598 6 6 9
Binomisk modell Eks.: X antall seksere i fem terningkast ~ B( 5, /6 4 Binomisk modell Eks.: LOTTO. Y ~ B( 5, p ; p/57966 P 5 y y 5 y ( Y y p ( p, y,,, K, 5,,8,6,4,, 6 9 584769445485 4 Binomisk modell Binomisk modell er svært mye brukt. Typisk problemstilling kan være fra medisinsk FoU. Eks.: En behandlingsmetode/medisin testes på n pasienter (som alle har en bestemt lidelse. Dersom vi vet at (f.eks. av erfaring 7% blir helbredet med slik behandling, hva er fordelingen til antall helbredede blant de testindividene? (Tenk ev. ny vs. gammel metode. 4 4
Binomisk modell Eks.: n pasienter; 7% blir helbredet med slik behandling; fordelingen til antall helbredede blant de testindividene? La Yant. helbredede blant de. Resultatene for de n pasientene utgjør (ev. tilnærmelsesvis en binomisk forsøksrekke.. Ulike pasienter blir helbredet uavhengig av hverandre (rimelig antakelse. Helbredet (suksess eller ikke (fiasko i alle delforsøk. P(helbredet.7 for en tilfeldig pasient 4 Binomisk modell Eks.: n pasienter; 7% blir helbredet med slik behandling; fordelingen til antall helbredede blant de testindividene? La Yant. helbredede blant de. Vi har da at Y ~ B(,.7 (binomisk fordelt med n og p.7.,,5,,5,,5, 4 6 8 4 6 8 y antall helbredede 44 Binomisk modell Eks.: n pasienter; 7% blir helbredet med slik behandling; fordelingen til antall helbredede blant de testindividene? La Yant. helbredede blant de. Vi har da at Y ~ B(,.7 (binomisk fordelt med n og p.7.,,5 (Obs: Når behandlingen er, gjennomført, får vi en,5 observasjon av Y et av tallene fra, til. Seinere i kurset vil det være en,5 viktig tenkemåte å tenke på et, slikt data som et utfall av Y. 4 6 8 4 6 8 y antall helbredede 45 5
Binomisk modell Eks.: Yatzy hva er sannsynligheten for å få to treere i et kast med fem terninger? - minst to treere? - fem treere? 46 Binomisk modell Begrunnelse (bevis for formelen for sannsynlighetene. 47 Binomisk modell, fordeling Betrakter et eksempel: Xant. mynt i kast med pengestykke. P(X P(K K L K Formel : P(X p ( p (- p (- p P(K P(K LP(K, fordi K 'ene er uavhengige i n n P( X p ( p 48 6
7 49 Binomisk modell, fordeling 9-9 9 p(- p p ( p P(X Formel : p(- p (- p p P(M P(K P(K P(K P(M P(K M K P(K K M P(K K K P(M P(X + + + + L L L L M L L ( n p ( p n X P 5 Binomisk modell, fordeling som formelsier., (- p p P(X derfor sekvenser; mulige finnes Det (- p p K K M P(M sekvens : mulig en for Sanns. : P(X 8 8 L ( n p ( p n X P 5 Binomisk modell, fordeling n,,...,, (- p p n P(X : at innser vi og delforsøk, n til kan enkelt generaliseres Dette n-
Binomisk modell Sannsynligheter kan beregnes. vha. formel, eller. vha. tabeller over binomiske sannsynligheter (som er lagt ut på nettstedet. Obs.: Gjør dere kjent med tabeller til fordelingene som blir gjennomgått! 5 Binomisk modell, tabeller 5 Binomisk modell, tabeller 54 8
Binomisk modell, tabeller 55 Binomisk modell, tabeller 56 Binomisk modell, forventning og varians; utledninger Vi har slått fast at dersom X ~ B( n, p, så: E ( X np ( X np( p Var Dette skal vi begrunne (bevise! 57 9
Binomisk modell, forventning og varians; utledninger Vi kan skrive : X I + I + L+ In, der, I j, dersomfiasko i delforsøk nr. dersom suksess i delforsøk nr. j j, j,,...,n Hver I j har fordelingen : i P(I j i -p p Og alle I j 'ene er uavhengige. Beggedeler følger av forutsetningene om binomisk forsøksrekke. 58 Binomisk modell, forventning og varians; utledninger Da får vi: E(I j ( p + p p, i P(I j i -p p og siden : X I + I + L+ In, får vi : E( X E( I + I + L+ In E( I + E( I + L+ E( In p + p + L+ p np 59 Binomisk modell, forventning og varians; utledninger Videre, får vi: E(I j ( p + p p, i P(I j i -p p som gir : Var(I E(I j j { E(I j } p p p( p, 6
Binomisk modell, forventning og varians; utledninger Og da: siden : X I + I + L+ I n, og I j ' ene er uavhengige får vi : Var( X Var( I + I + L+ I n Var( I + Var( I + L+ Var( I n p( p + p( p + L+ p( p np( p Var(I j p( p 6