ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Like dokumenter
statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Noen viktige sannsynlighetsmodeller

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Betinget sannsynlighet

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Hypergeometrisk modell

Hypergeometrisk modell

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Regneregler for forventning og varians

Statistikk 1 kapittel 5

Statistikk 1 kapittel 4

Statistikk 1 kapittel 5

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Bernoulli forsøksrekke og binomisk fordeling

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Motivasjon for kurset. ÅMA110 Sannsynlighetsregning med statistikk, våren Oppsummering. ÅMA110 Sannsynlighetsregning med statistikk våren 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Kapittel 5: Tilfeldige variable, forventning og varians.

Forventning og varians.

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Forelening 1, kapittel 4 Stokastiske variable

Kapittel 2: Hendelser

Foreleses onsdag 8. september 2010

Forventning og varians.

ÅMA110 Sannsynlighetsregning med statistikk, våren

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Diskrete sannsynlighetsfordelinger.

TMA4240 Statistikk Høst 2008

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Kapittel 4: Matematisk forventning

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

Diskrete sannsynlighetsfordelinger.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Fasit for tilleggsoppgaver

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

HØGSKOLEN I STAVANGER

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

HØGSKOLEN I STAVANGER

Kapittel 4.4: Forventning og varians til stokastiske variable

ST0202 Statistikk for samfunnsvitere

Tilfeldige variable (5.2)

FORMELSAMLING TIL STK1100 OG STK1110

Formelsamling i medisinsk statistikk

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsynlighetsregning med statistikk, våren Grunnbegrep. Grunnbegrep, sannsynligheten for et utfall

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Kap. 7 - Sannsynlighetsfordelinger

Forelesning 13. mars, 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Sannsynlighet og statistikk

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

TMA4240 Statistikk H2015

Oppfriskning av blokk 1 i TMA4240

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

Høgskoleni østfold EKSAMEN

Statistikk 1 kapittel 4

Løsningskisse seminaroppgaver uke 11 ( mars)

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk H2010

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Oppgavesett nr. 5. MAT110 Statistikk 1, Et transportfirma har et varemottak for lastebiler med spesialgods, se figur 1.

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

MAT110. Statistikk 1. Kompendium 2018, del 2. Per Kristian Rekdal

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

DEL 1 GRUNNLEGGENDE STATISTIKK

Kp. 9.8 Forskjell mellom to forventninger

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

TMA4245 Statistikk Eksamen desember 2016

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Sannsynlighet og statistikk S2 Løsninger

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

Transkript:

ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. Diskrete tilfeldige variable Kp. Diskrete tilfeldige variable Har sett på (tidligere: begrep/definisjoner; tilfeldig (stokastisk variabel sannsynlighetsfordeling forventning Diskrete tilfeldige variable, varians (kp..4 Varians måler spredning i sannsynlighetsfordelingen.

Diskrete tilfeldige variable, varians (kp..4 Varians måler spredning i sannsynlighetsfordelingen. (Empirisk varians måler spredning i data. Def.: Variansen til en tilfeldig variabel X defineres ved : Var(X E{(X -μ }, der μ E(X. Obs.: Dersom X er en diskret tilf. var. som kan anta verdiene,,, K, så har vi : Var(X ( - μ P(X + ( - μ P(X + ( -μ P(X + L. 4 Diskrete tilfeldige variable, varians (kp..4 Varians måler spredning i sannsynlighetsfordelingen. Var(X ( - μ P(X + ( - μ P(X + ( -μ P(X + L avvik mellom verdi,, og sentrum, i μ kvadrerte avvik summert, vektet med sannsynlighet for verdi, P(X i. 5 Diskrete tilfeldige variable, varians (kp..4 Varians måler spredning i sannsynlighetsfordelingen. Var(X ( - μ P(X + ( - μ P(X + ( -μ P(X + Eks.: L. U V P(Uu..4. P(Vv..8. 6

Diskrete tilfeldige variable, varians (kp..4 Eks.: Hvilken fordeling har størst varians? U V 4 P(Uu..4. P(Vv...4.. 7 Diskrete tilfeldige variable, varians (kp..4 Eks.: Hvilken fordeling har størst varians? U V 4 P(Uu..4. P(Vv...4..,5,5,4,4,,,,,, 4 8 Diskrete tilfeldige variable, standardavvik Def.: Standardavviket til X defineres ved : SD(X VAR(X Obs.: Standardavviket måler spredning i fordelingen (som varians. 9

Regneregler for varians Var(X, X : tilfeldig variabel Var(k, k : konstant V: Var(X E(X { E(X } V: Var(aX + b a Var(X, a,b : konstanter Eks.: Innkjøp av el.artikler; varians til kostnad. Regneregler for varians Bevis for V: V: Var(X E(X μ, μ E(X Var(X E { (X μ } E { X μx + μ } E(X μe(x { + μ E(X μ μ Regneregler for varians Bevis for V: V: Var(aX + b a Var(X, Husk definisjon : Var(X E E ( ax + b Var aμ + b; Derfor : { (X μ } [ ] E [{ a( X μ } ] ( ax + b E { ax + b (aμ + b } a E [{ X μ } ] a Var(X 4

Diskrete tilfeldige variable, varians Eks.: X er tilfeldig variabel med en bestemt fordeling og varians, Var(X. La Y X og Y.5 X. Etter regneregel V er variansen til Y større enn variansen til Y (6 ganger større. Var(Y Var(Y 4Var(X.5Var(X Var(X Var(.5X 4 6.5 Intuitiv forklaring?? Diskrete tilfeldige variable, varians Eks.: Y X og Y.5 X. 4 8 6.5X X 4 4 6 X 4 Varians til sum; kovarians (Sidene 6 4 i boken: vi gjør dette litt annerledes og litt forenklet. Dersom vi skal regne ut Var(X+Y, kommer det inn et ledd i uttrykket som ser slik ut: E[(X μ (Y μ ], ( der μ E[X], og μ E[Y]. X Y X Y Var(X + Y Var(X + Var(Y + E[(X μ (Y μ ] X Y 5 5

Varians til sum; kovarians Def.: Kovariansen mellom to tilfeldige variable defineres ved: Cov( X, Y E[(X μ (Y μ ], X Y der μ E[X], og μ E[Y]. X Y Kovarians er et viktig mål på statistisk samvariasjon 6 Varians til sum; kovarians Statistisk samvariasjon Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. Xtemp. en tilfeldig sommerdag Yant. solgte is den dagen Utfall (,y av (X,Y: 7 Varians til sum; kovarians Statistisk samvariasjon Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. Xtemp. en tilfeldig sommerdag Yant. solgte is den dagen Utfall (,y av (X,Y: 4 8 positiv samvariasjon Cov(X,Y> antall is 8 8 8 8,, 8,, temperatur 8 6

Varians til sum; kovarians Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. Xtemp. en tilfeldig vinterdag Yant. solgte sekker ved den dagen Utfall (,y av (X,Y: 9 Varians til sum; kovarians Eks. : Betrakt f.eks. bensinstasj. i madlakrossen. Xtemp. en tilfeldig vinterdag Yant. solgte sekker ved den dagen Utfall (,y av (X,Y: negativ samvariasjon Cov(X,Y< antall vedsekker 8 6 4 8 6 4 -, -5,, 5,, temperatur Varians til sum; kovarians Kovarians, fortolkning av definisjonen Cov( X,Y E[(X μ (Y μ ], X Y der μ X E[X], og μ Y E[Y]. Cov(X,Y er forventning til produktet mellom (X μ X og (Y μ Y 7

Kovarians Ingen (lineær statistisk sammenheng: Cov( X, Y Varians til sum; kovarians Regneregler: V4+: Dersom Cov(X,Y, så Var(X+Y Var(X + Var(Y V5+: Dersom alle X, X,..., X n har parvis kovarians null, så Var(X +X +...+X n Var(X +...+Var(X n Varians til sum; kovarians Hva med Var( X-Y?? (med og uten kovarians 4 8

Uavhengige tilfeldige variable Kovarians måler en form for (lineær avhengighet mellom tilfeldige variable. I svært mange situasjoner vil kovarians være tilstrekkelig for å fange opp interessant statistisk samvariasjon. Den generelle definisjonen for sammenheng mellom tilfeldige variable er inneholdt i definisjonen av uavhengige/avhengige tilfeldige variable. 5 Uavhengige tilfeldige variable Husk: Begivenhetene A og B uavhengige dersom P(ABP(AP(B Def.: To tilfeldige variable X og Y sies å være statistisk uavhengige dersom ({ X } { Y y} P(X P(Y y, P for alle verdier (,y (som X og Y kan anta. 6 Uavhengige tilfeldige variable At X og Y er statistisk uavhengige tilfeldige variable betyr at de har ingen sammenheng. Obs. : Statistisk uavhengighet er ikke det samme som kovarians lik null! Obs. : Følgende gjelder: Dersom X og Y er uavhengige, så: Cov(X,Y. (Det omvendte er gjelder ikke! 7 9

Korrelasjon Def.: Korrelasjonen mellom to tilfeldige variable X og Y er definert ved: ( X,Y Cov ρ ( X, Y Corr SD(XSD(Y ( X, Y 8 Korrelasjon Obs.: Korrelasjonen - er alltid mellom og, - har samme fortegn som kovariansen, og - er også et mål på styrken av samvariasjonen Corr(X,Y (eller : komplett (lineær sammenheng Corr(X,Y : ingen (lineær sammenheng 9 Korrelasjon Eks.: Vi vil studere variasjonen i gjennomsnittlig oljepris over en periode. Betrakter to-dagers gjennomsnitt. X oljepris (pr. fat dag X oljepris (pr. fat dag Antar: E(X E(X $, og Var(X Var(X 4($

ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. Diskrete tilfeldige variable Noen viktige sannsynlighetsmodeller Noen viktige sannsynlighetsmodeller ( Sanns.modell : nå betyr det klasse/type sanns.fordeling. Binomisk modell (kp..6 Hypergeometrisk modell (kp..7 Geometrisk modell (notater Poisson-modell (kp..8 (Seinere skal vi se på viktige kontinuerlige sannsynlighetsmodeller. Binomisk modell Situasjon der binomisk modell vil kunne passe: X antall ganger en bestemt begivenhet inntreffer i løpet av et fastlagt antall forsøk. (Dette skal presiseres seinere...

Binomisk modell Situasjon der binomisk modell vil kunne passe: X antall ganger en bestemt begivenhet inntreffer i løpet av et fastlagt antall forsøk. Eks.: antall kron i kast med et pengestykke antall seksere i 5 kast med en terning antall toppgevinster med en rekke i LOTTO hver uke i ett år 4 Binomisk modell X antall ganger en bestemt begivenhet inntreffer i løpet av et fastlagt antall forsøk. antall suksesser i n delforsøk Delforsøkene må tilfredstille:. uavhengige resultat i ulike delforsøk. resultatet er enten suksess eller fiasko. P( suksess er konstant i alle delforsøkene Def.: Når disse kravene er tilfredsstilt kaller vi de n delforsøkene for en binomisk forsøksrekke. 5 Binomisk modell Definisjon: Når X antall suksesser i en binomisk forsøksrekke, sier vi at X er binomisk fordelt (n, p der p P( suksess (kalles suksessannsynligheten. Skrivemåte: X ~ B(n, p 6

Binomisk modell Dersom: X ~ B(n, p X kan anta verdiene,,,..., n sannsynligheter og forventning og varians gitt ved formel: P ( X n p ( p n, for,,, K,n E ( X np ( X np( p Var (obs: forutsetningene om binomisk forsøksrekke medfører resultatene over. 7 Binomisk modell Eks.: X antall seksere i fem terningkast ~ B( 5, /6 E( X np Var( X np( p 5 Forventet : E( X np 5 6 6 Var ( X np( p 5.694 6 6 (.694.8 SD X 8 Binomisk modell Eks.: X antall seksere i fem terningkast ~ B( 5, /6 Beregne sannsynligheter: n n P( X p ( p P( fem seksere P P( minst en sekser ( X 5 P 5 5 5 5. 5 6 6 ( X P( X 5 5.49.598 6 6 9

Binomisk modell Eks.: X antall seksere i fem terningkast ~ B( 5, /6 4 Binomisk modell Eks.: LOTTO. Y ~ B( 5, p ; p/57966 P 5 y y 5 y ( Y y p ( p, y,,, K, 5,,8,6,4,, 6 9 584769445485 4 Binomisk modell Binomisk modell er svært mye brukt. Typisk problemstilling kan være fra medisinsk FoU. Eks.: En behandlingsmetode/medisin testes på n pasienter (som alle har en bestemt lidelse. Dersom vi vet at (f.eks. av erfaring 7% blir helbredet med slik behandling, hva er fordelingen til antall helbredede blant de testindividene? (Tenk ev. ny vs. gammel metode. 4 4

Binomisk modell Eks.: n pasienter; 7% blir helbredet med slik behandling; fordelingen til antall helbredede blant de testindividene? La Yant. helbredede blant de. Resultatene for de n pasientene utgjør (ev. tilnærmelsesvis en binomisk forsøksrekke.. Ulike pasienter blir helbredet uavhengig av hverandre (rimelig antakelse. Helbredet (suksess eller ikke (fiasko i alle delforsøk. P(helbredet.7 for en tilfeldig pasient 4 Binomisk modell Eks.: n pasienter; 7% blir helbredet med slik behandling; fordelingen til antall helbredede blant de testindividene? La Yant. helbredede blant de. Vi har da at Y ~ B(,.7 (binomisk fordelt med n og p.7.,,5,,5,,5, 4 6 8 4 6 8 y antall helbredede 44 Binomisk modell Eks.: n pasienter; 7% blir helbredet med slik behandling; fordelingen til antall helbredede blant de testindividene? La Yant. helbredede blant de. Vi har da at Y ~ B(,.7 (binomisk fordelt med n og p.7.,,5 (Obs: Når behandlingen er, gjennomført, får vi en,5 observasjon av Y et av tallene fra, til. Seinere i kurset vil det være en,5 viktig tenkemåte å tenke på et, slikt data som et utfall av Y. 4 6 8 4 6 8 y antall helbredede 45 5

Binomisk modell Eks.: Yatzy hva er sannsynligheten for å få to treere i et kast med fem terninger? - minst to treere? - fem treere? 46 Binomisk modell Begrunnelse (bevis for formelen for sannsynlighetene. 47 Binomisk modell, fordeling Betrakter et eksempel: Xant. mynt i kast med pengestykke. P(X P(K K L K Formel : P(X p ( p (- p (- p P(K P(K LP(K, fordi K 'ene er uavhengige i n n P( X p ( p 48 6

7 49 Binomisk modell, fordeling 9-9 9 p(- p p ( p P(X Formel : p(- p (- p p P(M P(K P(K P(K P(M P(K M K P(K K M P(K K K P(M P(X + + + + L L L L M L L ( n p ( p n X P 5 Binomisk modell, fordeling som formelsier., (- p p P(X derfor sekvenser; mulige finnes Det (- p p K K M P(M sekvens : mulig en for Sanns. : P(X 8 8 L ( n p ( p n X P 5 Binomisk modell, fordeling n,,...,, (- p p n P(X : at innser vi og delforsøk, n til kan enkelt generaliseres Dette n-

Binomisk modell Sannsynligheter kan beregnes. vha. formel, eller. vha. tabeller over binomiske sannsynligheter (som er lagt ut på nettstedet. Obs.: Gjør dere kjent med tabeller til fordelingene som blir gjennomgått! 5 Binomisk modell, tabeller 5 Binomisk modell, tabeller 54 8

Binomisk modell, tabeller 55 Binomisk modell, tabeller 56 Binomisk modell, forventning og varians; utledninger Vi har slått fast at dersom X ~ B( n, p, så: E ( X np ( X np( p Var Dette skal vi begrunne (bevise! 57 9

Binomisk modell, forventning og varians; utledninger Vi kan skrive : X I + I + L+ In, der, I j, dersomfiasko i delforsøk nr. dersom suksess i delforsøk nr. j j, j,,...,n Hver I j har fordelingen : i P(I j i -p p Og alle I j 'ene er uavhengige. Beggedeler følger av forutsetningene om binomisk forsøksrekke. 58 Binomisk modell, forventning og varians; utledninger Da får vi: E(I j ( p + p p, i P(I j i -p p og siden : X I + I + L+ In, får vi : E( X E( I + I + L+ In E( I + E( I + L+ E( In p + p + L+ p np 59 Binomisk modell, forventning og varians; utledninger Videre, får vi: E(I j ( p + p p, i P(I j i -p p som gir : Var(I E(I j j { E(I j } p p p( p, 6

Binomisk modell, forventning og varians; utledninger Og da: siden : X I + I + L+ I n, og I j ' ene er uavhengige får vi : Var( X Var( I + I + L+ I n Var( I + Var( I + L+ Var( I n p( p + p( p + L+ p( p np( p Var(I j p( p 6