ÅMA110 Sannsynlighetsregning med statistikk, våren 2010. ÅMA110 Sannsynlighetsregning med statistikk, våren 2010



Like dokumenter
statistikk, våren 2011

Betinget sannsynlighet

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Kapittel 5: Tilfeldige variable, forventning og varians.

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Statistikk 1 kapittel 4

Motivasjon for kurset. ÅMA110 Sannsynlighetsregning med statistikk, våren Oppsummering. ÅMA110 Sannsynlighetsregning med statistikk våren 2008

Regneregler for forventning og varians

Statistikk 1 kapittel 4

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Kapittel 4: Matematisk forventning

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Forventning og varians.

Forventning og varians.

ÅMA110 Sannsynlighetsregning med statistikk, våren Grunnbegrep. Grunnbegrep, sannsynligheten for et utfall

Foreleses onsdag 8. september 2010

TMA4240 Statistikk H2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TMA4240 Statistikk Høst 2008

ST0202 Statistikk for samfunnsvitere

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

FASIT TIL NOEN OPPGAVER I SANNSYNLIGHET OG KOMBINATORIKK. Oppgave 9 a) 8 utfall: MMM, MMK, MKM, MKK, KMM, KMK, KKM, KKK b)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren

Kapittel 4.4: Forventning og varians til stokastiske variable

Kapittel 4: Sannsynlighet - Studiet av tilfeldighet

Kapittel 2: Hendelser

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Hypergeometrisk modell

µ = E(X) = Ʃ P(X = x) x

Stokastisk variabel. Eksempel augefarge

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

Forelening 1, kapittel 4 Stokastiske variable

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Oppgavesett nr. 5. MAT110 Statistikk 1, Et transportfirma har et varemottak for lastebiler med spesialgods, se figur 1.

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

ÅMA110 Sannsynlighetsregning med statistikk (5sp), våren 2012 BMF100 Sannsynlighetsregning og statistikk 1 (10sp), våren 2012

Forelesning 13. mars, 2017

FORMELSAMLING TIL STK1100 OG STK1110

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Oppfriskning av blokk 1 i TMA4240

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Kapittel 5: Tilfeldige variable, forventning og varians.

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Hypergeometrisk modell

To-dimensjonale kontinuerlige fordelinger

Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians.

Høgskoleni østfold EKSAMEN

ST0202 Statistikk for samfunnsvitere

Tilfeldige variable (5.2)

Statistikk 1 kapittel 5

Fasit for tilleggsoppgaver

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

HØGSKOLEN I STAVANGER

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Eksamen i. MAT110 Statistikk 1

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Prøvemidtveiseksamen TMA4240 Statistikk H2004

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Bernoulli forsøksrekke og binomisk fordeling

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Høgskoleni Øs fold EKSAMEN. Om noe er uklart eller mangelfullt i oppgaven inngår det som en del av oppgaven å ta de nødvendige forutsetninger.

HØGSKOLEN I STAVANGER

Eksempel: kast med to terninger

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Kap. 5.2: Utvalgsfordelinger for antall og andeler

LØSNING: Oppgavesett nr. 1

Løsningskisse seminaroppgaver uke 11 ( mars)

Formelsamling i medisinsk statistikk

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Sannsynlighetsregning og Statistikk.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

TMA4245 Statistikk Eksamen desember 2016

Kap. 7 - Sannsynlighetsfordelinger

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

MAT110. Statistikk 1. Kompendium 2018, del 2. Per Kristian Rekdal

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

En kort innføring i sannsynlighetsregning

Transkript:

ÅMA Sannsynlighetsregning med statistikk, våren Kp. Diskrete tilfeldige variable ÅMA Sannsynlighetsregning med statistikk, våren Kp. Diskrete tilfeldige variable Diskrete tilfeldige variable, innledning Hva er en tilfeldig variabel (stokastisk variabel)? Diskret tilfeldig variabel... Kontinuerlig tilfeldig variabel... Først: enkle diskrete tilfeldige variable

Diskrete tilfeldige variable, innledning Eks.: Tre kast med pengestykke; vi betrakter rekkefølge av kron (K) og mynt (M). {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } 4 Diskrete tilfeldige variable, innledning Eks.: Tre kast med pengestykke; vi betrakter rekkefølge av kron (K) og mynt (M). {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } Vi vil kvantifisere bestemte egenskaper ved utfallene. (numeriske beskrivelser og behandling av resultatene) 5 Diskrete tilfeldige variable, innledning Eks.: Tre kast med pengestykke; vi betrakter rekkefølge av kron (K) og mynt (M). {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } Vi vil kvantifisere bestemte egenskaper ved utfallene. (numeriske beskrivelser og behandling av resultatene) F.eks.: vi ser på antall mynt (i tre kast) Definer: X = antall mynt i tre kast med pengestykke 6

Diskrete tilfeldige variable, innledning Eks.: Tre kast med pengestykke; vi betrakter rekkefølge av kron (K) og mynt (M). {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } X = antall mynt i tre kast med pengestykke Mulige verdier for X:,, eller Vi sier at X er en tilfeldig variabel 7 Diskrete tilfeldige variable, innledning {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } X = antall mynt i tre kast med pengestykke Mulige verdier for X:,, eller Matematisk: En tilfeldig variabel er en reell funksjon på utfallsrommet : X(u) tallinjen 8 Diskrete tilfeldige variable, innledning {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } X = antall mynt i tre kast med pengestykke Mulige verdier for X:,, eller Sannsynlighetene knyttet til utfallene gir bestemte sannsynligheter for de ulike verdiene X kan anta. Dette er sannsynlighetsfordelingen til X F.eks.: P(X=) = P({KMM, MKM, MMK}) = /8 9

Diskrete tilfeldige variable, innledning {KKK, KKM, KMK, MKK, KMM, MKM, MMK, MMM} = { u, u, u, u 4, u 5, u 6, u 7, u 8 } X = antall mynt i tre kast med pengestykke Mulige verdier for X:,, eller En diskret sannsynlighetsfordeling gis ofte i tabell. Fordeling til X: x P(X=x) /8 /8 /8 /8 (Obs: sannsynlighetene i en fordeling må summere seg til!) Diskrete tilfeldige variable, innledning Eks.: Y = resultatet i et terningkast y 4 P(Y=y) /6 /6 /6 /6 5 /6 6 /6 En tilfeldig variabel er en abstrakt størrelse som kan bli ulike verdier. Resultat/data kan vi oppfatte som utfall av tilfeldige variable. (Mer om dette seinere i kurset.) Diskrete tilfeldige variable, innledning x P(X=x) /8 /8 /8 /8 P( minst to mynt) = P( X ) = P( X = ) + P( X = ) = + = 8 8 y 4 5 6 P(Y=y) /6 /6 /6 /6 /6 /6 P( høyest 4) = P( Y 4) 4 = P( Y = ) + P( Y = ) + P( Y = ) + P( Y = 4) = L = = 6 4

Diskrete tilfeldige variable, innledning To viktige størrelser i forbindelse med tilfeldige variable / sannsynlighetsfordelinger: Forventning Varians Diskrete tilfeldige variable, forventning Def.: For en diskret tilfeldig variabel Y som kan anta verdiene y, y, y,..., defineres forventingen til Y ved: E(Y) = y P(Y= y ) + y P(Y= y ) + y P(Y= y ) +... ( sum av ledd på formen: verdi*sannsynlighet ) Eks.: E(X) = (/8)+(/8)+(/8)+(/8) =.5 4 Diskrete tilfeldige variable, forventning Eks.: E(X) = (/8)+(/8)+(/8)+(/8) =.5 Obs. : forventningsverdien er gjennomsnittsverdien i det lange løp Obs. : forventningsverdien viser sentrum i sannsynlighetsfordelingen.,4,,, 5 5

Diskrete tilfeldige variable, forventning Eks.: E(X) = (/8)+(/8)+(/8)+(/8) =.5 Obs. : forventingsverdien behøver ikke være et av utfallene til den tilfeldige variable! Obs. 4: forventingsverdien er ikke det samme som modalverdien (mest sannsynlig verdi) eller medianen (median i sannsynlighetsfordelingen). 6 Diskrete tilfeldige variable, forventning Eks.: Spill; vinner mill. med sanns. /5 ; ellers vinnes ingenting. Forventet gevinst? 7 Diskrete tilfeldige variable, forventning Eks.: Spill; vinner mill. med sanns. /5 ; ellers vinnes ingenting. Forventet gevinst? X = gevinst ( eller mill.) Fordeling til X: x P(X=x) -/5 /5 E(X) = (/5) =.4 Dvs.: ved (mange) gjentatte slike spill, vil gjennomsnittsgevinsten være.4. 8 6

Diskrete tilfeldige variable, regneregler for forventning Vi får ofte behov for å finne forventning til uttrykk der tilfeldige variable inngår. Det er derfor viktig å vite hvordan vi skal håndtere dette. 9 Diskrete tilfeldige variable, regneregler for forventning E: E(aX+b) = ae(x) + b, (X: tilf.var., a,b:konstanter) E: E(X +X ) = E(X ) + E(X ), (X og X :tilf.var.) Diskrete tilfeldige variable, regneregler for forventning E: E(aX+b) = ae(x) + b, (X: tilf.var., a,b:konstanter) E: E(X +X ) = E(X ) + E(X ), (X og X :tilf.var.) E5 (generelt): E(a X +...+ a n X n ) = a E(X ) +...+ a n E(X n ), (X,..., X n :tilf.var., og a,..., a n : konstanter) 7

Diskrete tilfeldige variable, regneregler for forventning Def.: Dersom X en diskret tilfeldig variabel som kan anta verdiene x, x, x,..., og g er en funksjon, defineres forventingen til g(x) ved: E[g(X)] = g(x ) P(X=x ) + g(x ) P(X=x ) +... Eks.: Forventingen til X : g(x) = X ; E[X ] = x P(X=x ) + x P(X=x ) +... Diskrete tilfeldige variable, regneregler for forventning Eks.: Fordeling til X: x P(X=x) /8 /8 /8 /8 E[X ] = x P(X=x ) + x P(X=x ) +... E(X ) = (/8)+ (/8)+ (/8)+ (/8) = (/8)+4(/8)+9(/8) = 4/8 = Diskrete tilfeldige variable, forventning Eks.: Firma selger el.artikler; innkjøp fra grossist i parti på 5 stk. To tilbud. Grossist A: 5,- grossist B: 57,-. Noen defekte; omkostninger: 5,- pr defekt enhet. X=antall defekte fra A, Y=antall defekte fra B; Har at: x 4 Y P(X=x)..... P(Y=y).4.4. Hvilken grossist bør velges? 4 8

Kp. Diskrete tilfeldige variable Har sett på (tidligere): begrep/definisjoner; tilfeldig (stokastisk) variabel sannsynlighetsfordeling forventning 5 Diskrete tilfeldige variable, varians (kp..4) Varians måler spredning i sannsynlighetsfordelingen. 6 Diskrete tilfeldige variable, varians (kp..4) Varians måler spredning i sannsynlighetsfordelingen. (Empirisk varians måler spredning i data.) Def.: Variansen til en tilfeldig variabel X defineres ved : Var(X) = E{(X - μ) }, der μ = E(X). Obs.: Dersom X er en diskret tilf. var. som kan anta verdiene x, x, x, K, så har vi : Var(X) = (x - μ) P(X = x ) + (x - μ) P(X = x ) + (x - μ) P(X = x ) + L. 7 9

Diskrete tilfeldige variable, varians (kp..4) Varians måler spredning i sannsynlighetsfordelingen. Var(X) = (x - μ) P(X = x ) + (x - μ) P(X = x ) + (x - μ) P(X = x ) + L. avvik mellom verdi, x, og sentrum, i μ kvadrerte avvik summert, vektet med sannsynlighet for verdi, P(X=x i ) 8 Diskrete tilfeldige variable, varians (kp..4) Varians måler spredning i sannsynlighetsfordelingen. Var(X) = (x - μ) P(X = x ) + (x - μ) P(X = x ) + (x - μ) P(X = x ) + Eks.: L. U V P(U=u)..4. P(V=v)..8. 9 Diskrete tilfeldige variable, varians (kp..4) Eks.: Hvilken fordeling har størst varians? U V 4 P(U=u)..4. P(V=v)...4..

Diskrete tilfeldige variable, varians (kp..4) Eks.: Hvilken fordeling har størst varians? U V 4 P(U=u)..4. P(V=v)...4..,5,5,4,4,,,,,, 4 Diskrete tilfeldige variable, standardavvik Def.: Standardavviket til X defineres ved : SD(X) = VAR(X) Obs.: Standardavviket måler spredning i fordelingen (som varians). Regneregler for varians Var(X), X : tilfeldig variabel Var(k) =, k : konstant V: Var(X) = E(X ) { E(X)} V: Var(aX + b) = a Var(X), a,b : konstanter Eks.: Innkjøp av el.artikler; varians til kostnad.

Regneregler for varians Bevis for V: V: Var(X) = E(X ) μ, μ = E(X) Var(X) = E { (X μ) } = E { X μx + μ } = E(X ) μe(x) { + μ μ = E(X ) μ 4 Regneregler for varians Bevis for V: V: Var(aX + b) = a Var(X), Husk definisjon : Var(X) = E E ( ax + b) Var = aμ + b; Derfor : { (X μ) } [ ] = E [{ a( X μ) } ] ( ax + b) = E { ax + b (aμ + b) } = a E [{ X μ } ] = a Var(X) 5 Diskrete tilfeldige variable, varians Eks.: X er tilfeldig variabel med en bestemt fordeling og varians, Var(X). La Y = X og Y =.5 X. Etter regneregel V er variansen til Y større enn variansen til Y (6 ganger større). Var(Y ) Var(X) = = Var(Y ) Var(.5X) = 4Var(X).5Var(X) = 4 = 6.5 Intuitiv forklaring?? 6

Diskrete tilfeldige variable, varians Eks.: Y = X og Y =.5 X. 4 8 6.5X X 4 4 6 X 7 Varians til sum; kovarians (Sidene 6 4 i boken: vi gjør dette litt annerledes og litt forenklet.) Dersom vi skal regne ut Var(X+Y), kommer det inn et ledd i uttrykket som ser slik ut: E[(X μ )(Y μ )], ( der μ = E[X], og μ E[Y] ). = X Y X Y Var(X + Y) = Var(X) + Var(Y) + E[(X μ )(Y μ )] X Y 8 Varians til sum; kovarians Def.: Kovariansen mellom to tilfeldige variable defineres ved: Cov( X, Y ) = E[(X μ )(Y μ )], X Y der μ = E[X], og μ = E[Y]. X Y Kovarians er et viktig mål på statistisk samvariasjon 9

Varians til sum; kovarians Statistisk samvariasjon Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. X=temp. en tilfeldig sommerdag Y=ant. solgte is den dagen Utfall (x,y) av (X,Y): 4 Varians til sum; kovarians Statistisk samvariasjon Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. X=temp. en tilfeldig sommerdag Y=ant. solgte is den dagen Utfall (x,y) av (X,Y): 4 8 positiv samvariasjon Cov(X,Y)> antall is 8 8 8 8,, 8,, temperatur 4 Varians til sum; kovarians Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. X=temp. en tilfeldig vinterdag Y=ant. solgte sekker ved den dagen Utfall (x,y) av (X,Y): 4 4

Varians til sum; kovarians Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. X=temp. en tilfeldig vinterdag Y=ant. solgte sekker ved den dagen Utfall (x,y) av (X,Y): negativ samvariasjon Cov(X,Y)< antall vedsekker 8 6 4 8 6 4 -, -5,, 5,, temperatur 4 Varians til sum; kovarians Kovarians, fortolkning av definisjonen Cov( X, Y ) = E[(X μ )(Y μ )], X Y der μ X = E[X], og μ Y = E[Y]. Cov(X,Y) er forventning til produktet mellom (X μ X ) og (Y μ Y ) 44 Kovarians Ingen (lineær) statistisk sammenheng: Cov( X, Y ) = 45 5

Varians til sum; kovarians Regneregler: V4+: Dersom Cov(X,Y) =, så Var(X+Y) = Var(X) + Var(Y) V5+: Dersom alle X, X,..., X n har parvis kovarians null, så Var(X +X +...+X n ) = Var(X )+...+Var(X n ) 46 Varians til sum; kovarians Hva med Var( X-Y )?? (med og uten kovarians) 47 Uavhengige tilfeldige variable Kovarians måler en form for (lineær) avhengighet mellom tilfeldige variable. I svært mange situasjoner vil kovarians være tilstrekkelig for å fange opp interessant statistisk samvariasjon. Den generelle definisjonen for sammenheng mellom tilfeldige variable er inneholdt i definisjonen av uavhengige/avhengige tilfeldige variable. 48 6

Uavhengige tilfeldige variable Husk: Begivenhetene A og B uavhengige dersom P(AB)=P(A)P(B) Def.: To tilfeldige variable X og Y sies å være statistisk uavhengige dersom ({ X = x} { Y = y} ) = P(X = x)p(y y), P = for alle verdier (x,y) (som X og Y kan anta). 49 Uavhengige tilfeldige variable At X og Y er statistisk uavhengige tilfeldige variable betyr at de har ingen sammenheng. Obs. : Statistisk uavhengighet er ikke det samme som kovarians lik null! Obs. : Følgende gjelder: Dersom X og Y er uavhengige, så: Cov(X,Y)=. (Det omvendte er gjelder ikke!) 5 Korrelasjon Def.: Korrelasjonen mellom to tilfeldige variable X og Y er definert ved: ( X,Y) Cov ρ ( X,Y) = = Corr SD(X)SD(Y) ( X,Y) 5 7

Korrelasjon Obs.: Korrelasjonen - er alltid mellom og, - har samme fortegn som kovariansen, og - er også et mål på styrken av samvariasjonen Corr(X,Y) = (eller ): komplett (lineær) sammenheng Corr(X,Y) = : ingen (lineær) sammenheng 5 Korrelasjon Eks.: Vi vil studere variasjonen i gjennomsnittlig oljepris over en periode. Betrakter to-dagers gjennomsnitt. X =oljepris (pr. fat) dag X =oljepris (pr. fat) dag Antar: E(X ) = E(X ) = $, og Var(X ) = Var(X ) = 4($ ) 5 8