ÅMA Sannsynlighetsregning med statistikk, våren Kp. Diskrete tilfeldige variable ÅMA Sannsynlighetsregning med statistikk, våren Kp. Diskrete tilfeldige variable Diskrete tilfeldige variable, innledning Hva er en tilfeldig variabel (stokastisk variabel)? Diskret tilfeldig variabel... Kontinuerlig tilfeldig variabel... Først: enkle diskrete tilfeldige variable
Diskrete tilfeldige variable, innledning Eks.: Tre kast med pengestykke; vi betrakter rekkefølge av kron (K) og mynt (M). {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } 4 Diskrete tilfeldige variable, innledning Eks.: Tre kast med pengestykke; vi betrakter rekkefølge av kron (K) og mynt (M). {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } Vi vil kvantifisere bestemte egenskaper ved utfallene. (numeriske beskrivelser og behandling av resultatene) 5 Diskrete tilfeldige variable, innledning Eks.: Tre kast med pengestykke; vi betrakter rekkefølge av kron (K) og mynt (M). {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } Vi vil kvantifisere bestemte egenskaper ved utfallene. (numeriske beskrivelser og behandling av resultatene) F.eks.: vi ser på antall mynt (i tre kast) Definer: X = antall mynt i tre kast med pengestykke 6
Diskrete tilfeldige variable, innledning Eks.: Tre kast med pengestykke; vi betrakter rekkefølge av kron (K) og mynt (M). {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } X = antall mynt i tre kast med pengestykke Mulige verdier for X:,, eller Vi sier at X er en tilfeldig variabel 7 Diskrete tilfeldige variable, innledning {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } X = antall mynt i tre kast med pengestykke Mulige verdier for X:,, eller Matematisk: En tilfeldig variabel er en reell funksjon på utfallsrommet : X(u) tallinjen 8 Diskrete tilfeldige variable, innledning {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } X = antall mynt i tre kast med pengestykke Mulige verdier for X:,, eller Sannsynlighetene knyttet til utfallene gir bestemte sannsynligheter for de ulike verdiene X kan anta. Dette er sannsynlighetsfordelingen til X F.eks.: P(X=) = P({KMM, MKM, MMK}) = /8 9
Diskrete tilfeldige variable, innledning {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } X = antall mynt i tre kast med pengestykke Mulige verdier for X:,, eller En diskret sannsynlighetsfordeling gis ofte i tabell. Fordeling til X: x P(X=x) /8 /8 /8 /8 (Obs: sannsynlighetene i en fordeling må summere seg til!) Diskrete tilfeldige variable, innledning Eks.: Y = resultatet i et terningkast y 4 P(Y=y) /6 /6 /6 /6 5 /6 6 /6 En tilfeldig variabel er en abstrakt størrelse som kan bli ulike verdier. Resultat/data kan vi oppfatte som utfall av tilfeldige variable. (Mer om dette seinere i kurset.) Diskrete tilfeldige variable, innledning x P(X=x) /8 /8 /8 /8 P( minst to mynt) = P( X ) = P( X = ) + P( X = ) = + = 8 8 y 4 5 6 P(Y=y) /6 /6 /6 /6 /6 /6 P( høyest 4) = P( Y 4) 4 = P( Y = ) + P( Y = ) + P( Y = ) + P( Y = 4) = L = = 6 4
Diskrete tilfeldige variable, innledning To viktige størrelser i forbindelse med tilfeldige variable / sannsynlighetsfordelinger: Forventning Varians Diskrete tilfeldige variable, forventning Def.: For en diskret tilfeldig variabel Y som kan anta verdiene y, y, y,..., defineres forventingen til Y ved: E(Y) = y P(Y= y ) + y P(Y= y ) + y P(Y= y ) +... ( sum av ledd på formen: verdi*sannsynlighet ) Eks.: E(X) = (/8)+(/8)+(/8)+(/8) =.5 4 Diskrete tilfeldige variable, forventning Eks.: E(X) = (/8)+(/8)+(/8)+(/8) =.5 Obs. : forventningsverdien er gjennomsnittsverdien i det lange løp Obs. : forventningsverdien viser sentrum i sannsynlighetsfordelingen.,4,,, 5 5
Diskrete tilfeldige variable, forventning Eks.: E(X) = (/8)+(/8)+(/8)+(/8) =.5 Obs. : forventingsverdien behøver ikke være et av utfallene til den tilfeldige variable! Obs. 4: forventingsverdien er ikke det samme som modalverdien (mest sannsynlig verdi) eller medianen (median i sannsynlighetsfordelingen). 6 Diskrete tilfeldige variable, forventning Eks.: Spill; vinner mill. med sanns. /5 ; ellers vinnes ingenting. Forventet gevinst? 7 Diskrete tilfeldige variable, forventning Eks.: Spill; vinner mill. med sanns. /5 ; ellers vinnes ingenting. Forventet gevinst? X = gevinst ( eller mill.) Fordeling til X: x P(X=x) -/5 /5 E(X) = (/5) =.4 Dvs.: ved (mange) gjentatte slike spill, vil gjennomsnittsgevinsten være.4. 8 6
Diskrete tilfeldige variable, regneregler for forventning Vi får ofte behov for å finne forventning til uttrykk der tilfeldige variable inngår. Det er derfor viktig å vite hvordan vi skal håndtere dette. 9 Diskrete tilfeldige variable, regneregler for forventning E: E(aX+b) = ae(x) + b, (X: tilf.var., a,b:konstanter) E: E(X +X ) = E(X ) + E(X ), (X og X :tilf.var.) Diskrete tilfeldige variable, regneregler for forventning E: E(aX+b) = ae(x) + b, (X: tilf.var., a,b:konstanter) E: E(X +X ) = E(X ) + E(X ), (X og X :tilf.var.) E5 (generelt): E(a X +...+ a n X n ) = a E(X ) +...+ a n E(X n ), (X,..., X n :tilf.var., og a,..., a n : konstanter) 7
Diskrete tilfeldige variable, regneregler for forventning Def.: Dersom X en diskret tilfeldig variabel som kan anta verdiene x, x, x,..., og g er en funksjon, defineres forventingen til g(x) ved: E[g(X)] = g(x ) P(X=x ) + g(x ) P(X=x ) +... Eks.: Forventingen til X : g(x) = X ; E[X ] = x P(X=x ) + x P(X=x ) +... Diskrete tilfeldige variable, regneregler for forventning Eks.: Fordeling til X: x P(X=x) /8 /8 /8 /8 E[X ] = x P(X=x ) + x P(X=x ) +... E(X ) = (/8)+ (/8)+ (/8)+ (/8) = (/8)+4(/8)+9(/8) = 4/8 = Diskrete tilfeldige variable, forventning Eks.: Firma selger el.artikler; innkjøp fra grossist i parti på 5 stk. To tilbud. Grossist A: 5,- grossist B: 57,-. Noen defekte; omkostninger: 5,- pr defekt enhet. X=antall defekte fra A, Y=antall defekte fra B; Har at: x 4 Y P(X=x)..... P(Y=y).4.4. Hvilken grossist bør velges? 4 8
Kp. Diskrete tilfeldige variable Har sett på (tidligere): begrep/definisjoner; tilfeldig (stokastisk) variabel sannsynlighetsfordeling forventning 5 Diskrete tilfeldige variable, varians (kp..4) Varians måler spredning i sannsynlighetsfordelingen. 6 Diskrete tilfeldige variable, varians (kp..4) Varians måler spredning i sannsynlighetsfordelingen. (Empirisk varians måler spredning i data.) Def.: Variansen til en tilfeldig variabel X defineres ved : Var(X) = E{(X - μ) }, der μ = E(X). Obs.: Dersom X er en diskret tilf. var. som kan anta verdiene x, x, x, K, så har vi : Var(X) = (x - μ) P(X = x ) + (x - μ) P(X = x ) + (x - μ) P(X = x ) + L. 7 9
Diskrete tilfeldige variable, varians (kp..4) Varians måler spredning i sannsynlighetsfordelingen. Var(X) = (x - μ) P(X = x ) + (x - μ) P(X = x ) + (x - μ) P(X = x ) + L. avvik mellom verdi, x, og sentrum, i μ kvadrerte avvik summert, vektet med sannsynlighet for verdi, P(X=x i ) 8 Diskrete tilfeldige variable, varians (kp..4) Varians måler spredning i sannsynlighetsfordelingen. Var(X) = (x - μ) P(X = x ) + (x - μ) P(X = x ) + (x - μ) P(X = x ) + Eks.: L. U V P(U=u)..4. P(V=v)..8. 9 Diskrete tilfeldige variable, varians (kp..4) Eks.: Hvilken fordeling har størst varians? U V 4 P(U=u)..4. P(V=v)...4..
Diskrete tilfeldige variable, varians (kp..4) Eks.: Hvilken fordeling har størst varians? U V 4 P(U=u)..4. P(V=v)...4..,5,5,4,4,,,,,, 4 Diskrete tilfeldige variable, standardavvik Def.: Standardavviket til X defineres ved : SD(X) = VAR(X) Obs.: Standardavviket måler spredning i fordelingen (som varians). Regneregler for varians Var(X), X : tilfeldig variabel Var(k) =, k : konstant V: Var(X) = E(X ) { E(X)} V: Var(aX + b) = a Var(X), a,b : konstanter Eks.: Innkjøp av el.artikler; varians til kostnad.
Regneregler for varians Bevis for V: V: Var(X) = E(X ) μ, μ = E(X) Var(X) = E { (X μ) } = E { X μx + μ } = E(X ) μe(x) { + μ μ = E(X ) μ 4 Regneregler for varians Bevis for V: V: Var(aX + b) = a Var(X), Husk definisjon : Var(X) = E E ( ax + b) Var = aμ + b; Derfor : { (X μ) } [ ] = E [{ a( X μ) } ] ( ax + b) = E { ax + b (aμ + b) } = a E [{ X μ } ] = a Var(X) 5 Diskrete tilfeldige variable, varians Eks.: X er tilfeldig variabel med en bestemt fordeling og varians, Var(X). La Y = X og Y =.5 X. Etter regneregel V er variansen til Y større enn variansen til Y (6 ganger større). Var(Y ) Var(X) = = Var(Y ) Var(.5X) = 4Var(X).5Var(X) = 4 = 6.5 Intuitiv forklaring?? 6
Diskrete tilfeldige variable, varians Eks.: Y = X og Y =.5 X. 4 8 6.5X X 4 4 6 X 7 Varians til sum; kovarians (Sidene 6 4 i boken: vi gjør dette litt annerledes og litt forenklet.) Dersom vi skal regne ut Var(X+Y), kommer det inn et ledd i uttrykket som ser slik ut: E[(X μ )(Y μ )], ( der μ = E[X], og μ E[Y] ). = X Y X Y Var(X + Y) = Var(X) + Var(Y) + E[(X μ )(Y μ )] X Y 8 Varians til sum; kovarians Def.: Kovariansen mellom to tilfeldige variable defineres ved: Cov( X, Y ) = E[(X μ )(Y μ )], X Y der μ = E[X], og μ = E[Y]. X Y Kovarians er et viktig mål på statistisk samvariasjon 9
Varians til sum; kovarians Statistisk samvariasjon Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. X=temp. en tilfeldig sommerdag Y=ant. solgte is den dagen Utfall (x,y) av (X,Y): 4 Varians til sum; kovarians Statistisk samvariasjon Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. X=temp. en tilfeldig sommerdag Y=ant. solgte is den dagen Utfall (x,y) av (X,Y): 4 8 positiv samvariasjon Cov(X,Y)> antall is 8 8 8 8,, 8,, temperatur 4 Varians til sum; kovarians Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. X=temp. en tilfeldig vinterdag Y=ant. solgte sekker ved den dagen Utfall (x,y) av (X,Y): 4 4
Varians til sum; kovarians Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. X=temp. en tilfeldig vinterdag Y=ant. solgte sekker ved den dagen Utfall (x,y) av (X,Y): negativ samvariasjon Cov(X,Y)< antall vedsekker 8 6 4 8 6 4 -, -5,, 5,, temperatur 4 Varians til sum; kovarians Kovarians, fortolkning av definisjonen Cov( X, Y ) = E[(X μ )(Y μ )], X Y der μ X = E[X], og μ Y = E[Y]. Cov(X,Y) er forventning til produktet mellom (X μ X ) og (Y μ Y ) 44 Kovarians Ingen (lineær) statistisk sammenheng: Cov( X, Y ) = 45 5
Varians til sum; kovarians Regneregler: V4+: Dersom Cov(X,Y) =, så Var(X+Y) = Var(X) + Var(Y) V5+: Dersom alle X, X,..., X n har parvis kovarians null, så Var(X +X +...+X n ) = Var(X )+...+Var(X n ) 46 Varians til sum; kovarians Hva med Var( X-Y )?? (med og uten kovarians) 47 Uavhengige tilfeldige variable Kovarians måler en form for (lineær) avhengighet mellom tilfeldige variable. I svært mange situasjoner vil kovarians være tilstrekkelig for å fange opp interessant statistisk samvariasjon. Den generelle definisjonen for sammenheng mellom tilfeldige variable er inneholdt i definisjonen av uavhengige/avhengige tilfeldige variable. 48 6
Uavhengige tilfeldige variable Husk: Begivenhetene A og B uavhengige dersom P(AB)=P(A)P(B) Def.: To tilfeldige variable X og Y sies å være statistisk uavhengige dersom ({ X = x} { Y = y} ) = P(X = x)p(y y), P = for alle verdier (x,y) (som X og Y kan anta). 49 Uavhengige tilfeldige variable At X og Y er statistisk uavhengige tilfeldige variable betyr at de har ingen sammenheng. Obs. : Statistisk uavhengighet er ikke det samme som kovarians lik null! Obs. : Følgende gjelder: Dersom X og Y er uavhengige, så: Cov(X,Y)=. (Det omvendte er gjelder ikke!) 5 Korrelasjon Def.: Korrelasjonen mellom to tilfeldige variable X og Y er definert ved: ( X,Y) Cov ρ ( X,Y) = = Corr SD(X)SD(Y) ( X,Y) 5 7
Korrelasjon Obs.: Korrelasjonen - er alltid mellom og, - har samme fortegn som kovariansen, og - er også et mål på styrken av samvariasjonen Corr(X,Y) = (eller ): komplett (lineær) sammenheng Corr(X,Y) = : ingen (lineær) sammenheng 5 Korrelasjon Eks.: Vi vil studere variasjonen i gjennomsnittlig oljepris over en periode. Betrakter to-dagers gjennomsnitt. X =oljepris (pr. fat) dag X =oljepris (pr. fat) dag Antar: E(X ) = E(X ) = $, og Var(X ) = Var(X ) = 4($ ) 5 8