Kapittel 5: Tilfeldige variable, forventning og varians. Tilfeldige variable Tilfeldige variable kalles også stokastiske variable. En tilfeldig variabel er en variabel som får sin numeriske verdi bestemt av utfallet av et stokastisk forsøk. Eksempler: Aksjekurs om en uke, temperaturen i morgen, levetid for lyspære, antall medaljer Norge tar i OL, antall ulykker på en veistrekning, omsetning i en bedrift neste år, antall studenter som får A på eksamen i BØK145, antall bilag med feil ved en revisjon, lånerenten om ett år, antall mål i en fotballkamp, antall som svarer ja i en undersøkelse, osv. Eksempel: La X=antall kron i tre myntkast. X er da en tilfeldig variabel. Utfallsrom KKK 3 KKM KMK MKK KMM 1 MKM 1 MMK 1 MMM 0 Vi ser at mulige verdier for X i dette eksemplet er 0, 1, og 3.
Tilfeldige variable er enten diskrete eller kontinuerlige. En variabel er diskret dersom den kun kan anta et tellbart antall verdier. Eksempler: X=antall kron i m myntkast, Y=antall trykkfeil i ei bok, Z=antall bilag med feil i et regnskap, osv En variabel er kontinuerlig dersom den kan anta en hvilken som helst verdi i et intervall. Eksempler: X=temperatur, Y=børsindeks, T=levetid for lyspære, osv I noen situasjoner kan det være en definisjonssak om man velger å se på en variabel som diskret eller kontinuerlig. I resten av kapittel 5 skal vi se på diskrete variable. Eksempel: Sannsynlighetsfordelinger I myntkasteksemplet såg vi at 3 av de 8 like sannsynlige utfallene gav verdien X=. Dette kan vi uttrykke: P(X=)=3/8=0.375. Tilsvarende kan vi regne ut sannsynligheten for de andre mulige verdiene til X. Vi får da det som kalles sannsynlighetsfordelingen til X. P()=P(X=) er sannsynlighetsfordelingen til den diskrete tilfeldige variabelen X dersom: 1. P( ) 0. P( ) 1 Notasjon: Stor bokstav = tilfeldig variabel (før forsøket er utført) Liten bokstav = numerisk verdi til variabelen (etter forsøket er utført)
Eksempel: Myntkasteksemplet X=antall kron i tre myntkast. P(0)=1/8, P(1)=3/8, P()=3/8, P(3)=1/8 og P()=0 for alle andre. Sjekk: P( ) 1 Vi kan sette sannsynlighetsfordelingen opp i en tabell: 0 1 3 P() 1/8 3/8 3/8 1/8 Vi kan også tegne sannsynlighetsfordelingen: Forventningsverdi Forventningsverdi = gjennomsnitt i det lange løp Forventningsverdien angir sentrum i sannsynlighetsfordelingen. Forventningsverdien til den diskrete tilfeldige variabelen X er: E( X ) P( ) Eksempel: X=antall kron i tre myntkast. E( X ) 0 1 3 P() 1/8 3/8 3/8 1/8 P( ) 01/ 8 13/ 8 3/ 8 31/ 8 1.5
Merk at E(X) ikke trenger være blant de mulige verdiene for X. Eksempel: Terningkast X=resultat av terningkast 1 3 4 5 P() 1/ 1/ 1/ 1/ 1/ 1/ E( X ) 11/ 1/ 31/ 41/ 51/ 1/ 3.5 Eksempel: Bilutleigefirma med 3 biler. X=antall biler utleid en tilfeldig dag. Av erfaring vet man at: Eksempel: Bilutleige fortsettelse Anta at fortjenesten, g(), ved biler utleid er: 0 1 3 g() -700 100 900 1700 Hva er firmaets forventa fortjeneste per dag? Dvs, hva er E[g(X)]? E[ g ( X )] g( ) P( ) Eksemplet: 0 1 3 P() 0.15 0.30 0.35 0.0 0 1 3 P() 0.15 0.30 0.35 0.0 Forventa fortjeneste = gj.sn. fortjeneste per dag i det lange løp
Varians Varians er et nyttig mål som sier noe om hvor mye verdien til en tilfeldig variabel vil variere fra forsøk til forsøk. Varians= mål på spredning omkring forventningsverdien Definisjoner: Variansen til den diskrete tilfeldige variabelen X er: Alternativ formel som gir enklere regning (se forklaring i boka): Standardavviket til den diskrete tilfeldige variabelen X er: Var( X ) E[( X E( X )) ] ( E( X )) P( ) Var( X ) E( X ) SD( X ) Var( X ) E( X ) P( ) E( X ) Merk: Var(X)0 og SD(X)0 alltid! Varians/standardavvik er mål på spredning i en sannsynlighetsfordeling. Utvalgsvarians/utvalgsstandardavvik (kap. 1) er mål på spredning i et datasett. I økonomi vil varians være et mål på risiko (mer om dette senere) Dersom vi registrerer mange X-verdier fra en symmetrisk sannsynlighetsfordeling sier en grov tommelfingerregel at: Ca 8% av verdiene vil ligge i Ca 95% av verdiene vil ligge i Nesten alle verdiene vil ligge i E( X ) SD( X ), E( X ) SD( X ) E( X ) SD( X ), E( X ) SD( X ) E( X ) 3SD( X ), E( X ) 3SD( X )
Eksempel: Terningkast X=resultat av terningkast Var( X ) 1 3 4 5 P() 1/ 1/ 1/ 1/ 1/ 1/ 1 P( ) E( X ) 1 1 3 1 4 1 5 1 1 3.5.9 Eksempel: To investeringsprosjekter vurderes. La X=avkastning ved prosjekt 1 og Y=avkastning ved prosjekt. Følgende overslag er gjort: Prosjekt 1: Gir: E(X)=30 og Var(X)=1100 Prosjekt : Gir: E(Y)=30 og Var(Y)=19100-00 -100 0 100 00 P() 0.1 0. 0. 0.3 0. y -00-100 0 100 00 P(y) 0.15 0.15 0. 0.5 0.5 Dvs: - Lik forventa avkastning, E(X)=E(Y). - Prosjekt har høyest risiko, Var(Y)>Var(X), dvs større sannsynlighet for stort tap/stor gevinst ved prosjekt.
Regneregler for forventning og varians La a og b være konstanter (faste tall) og X en tilfeldig variabel. Da gjelder: E(a+ bx) = a+ be(x) Var(a+ bx) = b Var(X) Spesialtilfeller: b=0 gir: E(a)=a og Var(a)=0 a=0 gir: E(bX) = be(x) og Var(bX) =b Var(X) a=0 og b=-1 gir: Var(-X) = (-1) Var(X) = Var(X) (NB!!) Eksempel: Byggeprosjekt Materialkostnadene er a=1400 og lønnsutgiftene per mnd er b=80. X=byggetid (mnd) 4 5 7 8 P() 0.01 0.0 0.0 0.15 0.04 Dette gir at E(X)=.01 og Var(X)=0.5499 Totalkostnaden blir: K = a+bx = 1400+80X Får da: E(K) = E(1400+80X) = 1400+80E(X) = 1400+80.01 = 1880.8 Var(K) = Var(1400+80X) = 80 Var(X) = 80 0.5499 = 3519.4
Eksempel: Et firma selger el.artikler. Kjøpes inn fra grossist i parti på 50 stk. To tilbud. Grossist A: 3500,- og grossist B: 3570,-. Noen defekte; omkostninger: 35,- pr defekt enhet. X = antall defekte fra A, Y = antall defekte fra B; Har at: 0 1 3 4 P() 0.1 0. 0.3 0.3 0.1 Hvor lønner det seg for firmaet å kjøpe artiklene? y 0 1 P(y) 0.4 0.4 0. Notasjon: Til slutt Ofte bruker man symbolet for E(X) og symbolet for Var(X), dvs bruker = E(X), = Var(X) og = SD(X) Lineærkombinasjoner av flere variable Regnereglene for forventning og varians kan generaliseres til flere variable. For eksempel, dersom a, b og c er konstanter og X og Y er to tilfeldige variable har vi at: E(a+ bx + cy) = a+ be(x) + ce(y) Var(a+ bx + cy) = b Var(X) + c Var(Y) (ved uavhengighet) Regelen for forventningsverdi gjelder alltid, regelen for varians kun dersom X og Y er uavhengige (dvs informasjon om verdien til den ene påvirker ikke sannsynlighetsfordelingen til den andre). Ved avhengighet kommer et kovariansledd i tillegg (kap., ikke pensum).
Oppsummering Tilfeldige variable, diskrete og kontinuerlige. Sett på diskrete her. Sannsynlighetsfordeling: 1.. P( ) 0 P( ) 1 Forventningsverdi: E( X ) P( ) Varians: E[ g ( X )] g( ) P( ) Var( X ) E[( X E( X )) Standardavvik: SD( X ) Var( X ) E(a+ bx) = a+ be(x) Var(a+ bx) = b Var(X) ] P( ) E( X )