Forventning og varians.

Like dokumenter
Forventning og varians.

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Kapittel 4: Matematisk forventning

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Foreleses onsdag 8. september 2010

statistikk, våren 2011

Forelesning 13. mars, 2017

HØGSKOLEN I STAVANGER

FORMELSAMLING TIL STK1100 OG STK1110

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Kapittel 2: Hendelser

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

ØVINGER 2017 Løsninger til oppgaver. Lineærkombinasjonen Z = 5X + 8Y har forventningsverdi

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

To-dimensjonale kontinuerlige fordelinger

Statistikk 1 kapittel 4

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Forelesning 7. mars, 2017

La U og V være uavhengige standard normalfordelte variable og definer

Kapittel 5: Tilfeldige variable, forventning og varians.

FORMELSAMLING TIL STK1100 OG STK1110

Oppgavesett nr. 5. MAT110 Statistikk 1, Et transportfirma har et varemottak for lastebiler med spesialgods, se figur 1.

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Oppfriskning av blokk 1 i TMA4240

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Kapittel 4.4: Forventning og varians til stokastiske variable

TMA4240 Statistikk Høst 2008

HØGSKOLEN I STAVANGER

Institutt for Samfunnsøkonomi

TMA4240 Statistikk Høst 2009

Formelsamling i medisinsk statistikk

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

FORMELSAMLING STATISTIKK, HiG

Løsningsforslag, eksamen statistikk, juni 2015

Funksjoner av stokastiske variable.

Løsningsforslag til obligatorisk oppgave i ECON 2130

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Stokastisk variabel. Eksempel augefarge

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

Funksjoner av stokastiske variable.

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Statistikk 1 kapittel 4

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Eksamen desember 2015

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Om eksamen. Never, never, never give up!

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk H2015

Om eksamen. Never, never, never give up!

Forelening 1, kapittel 4 Stokastiske variable

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Formelsamling V MAT110 Statistikk 1. Per Kristian Rekdal

Regneregler for forventning og varians

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2015

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2016

Fasit for tilleggsoppgaver

TMA4240 Statistikk Eksamen desember 2015

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

FORMELSAMLING STATISTIKK, HiG

µ = E(X) = Ʃ P(X = x) x

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

FORMELSAMLING STATISTIKK, HiG Versjon per 10. januar 2002, ved Hornæs

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Prøvemidtveiseksamen TMA4240 Statistikk H2004

Kp. 9.8 Forskjell mellom to forventninger

Tema 2: Stokastiske variabler og sannsynlighetsfordelinger Kapittel 3 ST :44 (Gunnar Taraldsen)

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Bernoulli forsøksrekke og binomisk fordeling

Diskrete sannsynlighetsfordelinger.

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

TMA4245 Statistikk Eksamen desember 2016

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

TMA4240 Statistikk 2014

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Løsningsforslag Eksamen S2, høsten 2016 Laget av Tommy Odland Dato: 27. januar 2017

Transkript:

Forventning og varians. Dekkes av kapittel 4 i læreboka. Forventning (4.1) Forventningsverdi = gjennomsnitt i det lange løp. Defininsjon: Forventningsverdien til en stokastisk variabel X er: x xf(x),x diskret E(X) = xf(x)dx,x kontinuerlig Bruker ofte μ eller μ X som symbol for E(X). Eksempel: Myntkast, kaster en mynt 3 ganger. X= antall kron. Vist tidliger at: x 1 2 3 f(x) 1/8 3/8 3/8 1/8 Gir at E(X) = x xf(x) = 1 8 +1 3 8 +2 3 8 +3 1 8 = 3 2 1

Eksempel: Y = funksjonstid til elektronisk komponent. Y har sannsynlighetstetthet 1 5 f(y) = e y/5,y,ellers som gir at E(Y ) = yf(y)dy = = [ ye y/5 ] = [5e y/5 ] =5 y 1 5 e y/5 dy e y/5 dy Dvs tester vi mange komponenter av denne typen vil vi se at de i gjennomsnitt har en funksjonstid på rundt 5. Forventningsverdi til funksjoner av stokastiske variable finnes på tilsvarende måte: Definisjon: E(g(X)) = x g(x)f(x) g(x)f(x)dx,x diskret,x kontinuerlig 2

Eksempel: Se boka/øving. Definisjon: Dersom X og Y er to stok. var. med simultanfordeling f(x, y) er x y g(x, y)f(x, y) E(g(X, Y )) =, g(x, y)f(x, y)dxdy,kont. disk. Eksempel: To kontinuerlige stok. var. har simultanfordeling x(1+3y 2 ) 4, <x<2, <y<1 f(x, y) =,ellers Finn E(Y/X): E( Y X )= 1 2 y x x(1 + 3y 2 ) dxdy = 5 4 8 Merk (viktig!): E( Y X ) E(Y ) E(X) 3

Varians og kovarians (4.2) Varians = mål på spredning omkring forventningsverdien. Defininsjon: Variansen til stok. var. X er: σ 2 = σx 2 =Var(X) =E[(X μ) 2 ] x = (x μ)2 f(x),x diskret (x μ)2 f(x)dx,x kontinuerlig σ =SD(X) = Var(X) kalles standardavviket til X. Teorem: Var(X) =E(X 2 ) μ 2 =E(X 2 ) E(X) 2 Bevis: Se boka. Eksempel: Y = funksjonstid til elektronisk komponent. E(Y 2 ) = = =5 y 2 1 5 e y/5 dy Var(Y ) = E(Y 2 ) E(Y ) 2 =5 5 2 =25 4

Tommelfingerregel: Ofte (men ikke alltid...) vil ca 95% av observasjonene ligge i intervallet [μ 2σ, μ +2σ]. Definisjon: Var(g(X)) = E[(g(X) μ g(x) ) 2 ]=E[g(X) 2 ] μ 2 g(x) (Se eksempler i boka). Definisjon: Kovariansen til X og Y er gitt ved: σ XY =Cov(X) =E[(X μ X )(Y μ Y )] x y = (x μ X)(y μ Y )f(x, y) (x μ X)(y μ Y )f(x, y)dxdy,disk.,kont. Kovarians = mål på samvariasjon. Cov(X, Y ) >, positiv sammenheng mellom X og Y (f.eks. høyde/skonummer), Cov(X, Y ) <, negativ sammenheng mellom X og Y (f.eks. alder bil/pris bil), 5

Merk: X og Y uavh. Cov(X, Y )=. NB! Motsatt gjelder ikke. To variable kan ha Cov(X, Y ) = og likevel være avhengige! Teorem: Cov(X, Y )=E(XY ) E(X)E(Y ) Bevis: Se boka. Problem: Kovariansen ofte vanskelig åtolke, avhenger av skala. Bruker derfor ofte korrelasjon som er en normalisering av kovariansen. Definisjon: Korrelasjon ρ(x, Y )=Corr(X, Y )= Cov(X, Y ) Var(X)Var(Y ) 1 ρ(x, Y ) 1 Korrelasjon = grad av lineær sammenheng mellom X og Y : 6

rho=-.8 rho=-.4 rho= rho=.4 rho=.8 rho=1 Eksempel: Vann, X = relativt vannforbruk, Y = relativt humusinnhold. f(x, y) = { x 1 2 y + 3 4, x 1, y 1,ellers Finn Corr(X, Y ): 7

E(X) = = E(Y ) = E(XY ) = 1 1 1 1 1 1 Cov(X, Y ) = 13 48 7 12 xf(x, y)dydx x(x 1 2 y + 3 4 )dydx = 7 12 y(x 1 2 y + 3 11 )dydx = 4 24 xy(x 1 2 y + 3 4 11 24 = 1 288 )dydx = 13 48 Tilsvarende utregninger gir at E(X 2 )= 5 og 12 E(Y 2 )= 7, som videre gir at Var(X) = 5 24 12 ( 7 12 )2 = 11 og Var(Y )= 7 ( 11 144 24 24 )2 = 47 og 576 dermed blir ρ(x, Y )= 1/288 (11/144) (47/576) =.4 dvs praktisk talt ingen korrelasjon mellom vannforbruk (X) og humusinnhold (Y ). 8

Det foregående eksemplet viser at dersom man kjenner simultanfordeligen til to variable så kan man regne ut korrelasjonen mellom variablene. I praksis er situasjonen ofte at man ikke kjenner simultanfordelingen, men man har noen data (målinger) over sammenhørende verdier. Da kan man fra dataene regne ut estimert, eller empirisk korrelasjon. Definisjon: Empirisk korrelasjon (ofte bare kalt korrelasjon) for n målinger (x 1,y 1 ),...,(x n,y n ): r = s XY s 2 X s 2 Y = 1 n (x n 1 i=1 i x)(y i ȳ) n (y i=1 i ȳ) 2 1 n 1 n i=1 (x i x) 2 1 n 1 1 r 1 Her er x og ȳ gjennomsnittene av x- ogymålingene, s XY empirisk kovarians og s 2 X og s2 Y empiriske varianser. 9

Eksempel: Resultat på midtsemester og slutteksamen. I del 2 av MOT11 kommer dere til ålære om autokovarians og autokorrelasjon, som er kovarians/korrelasjon mellom etterfølgende målinger i en tidsrekke. 1

Forventning og varians til lineærkombinasjoner (4.3) Ved å bruke definisjonene av forventning og varians på lineærkombinasjoner av stokastiske variable får vi en rekke regneregler for lineærkombinasjoner (se boka for alle detaljer). Flesteparten av disse kan oppsummeres i følgende generelle regel (som står i formelsamlingen): Teorem: La Y = n i=1 a ix i + b. Daer E(Y )= Var(Y )= n a i E(X i )+b, i=1 n a 2 i Var(X i )+2 i=1 n i=1 i 1 j=1 a i a j Cov(X i,x j ). Se bevis for en del av spesialtilfellene i boka. Merk spesielt at regelen gir at E(aX + b) = ae(x)+b og at Var(aX + b) =a 2 Var(X) (f.eks. blir Var( X) =Var(X)...). Husk også atved uavhengighet mellom variable blir Cov =. 11

Eksempel: Vi skal bruke et måleinstrument til åmåle ph-verdien til en løsning. Vi vet at målinger med dette instrumentet gir resultater som har en fordeling med forventningsverdi μ (sann ph-verdi) og varians σ 2 =.1. I stedet for åbaregjøreenmåling bestemmer vi oss for ågjøre1målinger og bruke gjennomsnittet av disse 1 målingene som vårt resultat. Hva blir forventningsverdi og varians til dette gjennomsnittet? La X = 1 1 (X 1 + X 2 + + X 1 )= 1 1 X 1 + + 1 1 X 1 være gjennomsnittet av de 1 målingene. Vi antar at de 1 målingene er uavhengige. E( X)= 1 1 E(X 1)+ + 1 1 E(X 1) = 1 1 μ + + 1 1 μ = μ Var( X)=( 1 1 )2 Var(X 1 )+ +( 1 1 )2 Var(X 1 ) =( 1 1 )2 σ 2 + +( 1 1 )2 σ 2 = σ2 1 =.1 1 =.1 12

Dvs, gjennomsnittet har samme forventningsverdi som enkeltmålingene men lavere varians. Bruker vi tommelfingerregelen om at omtrent 95% av resultatene vil havne i intervallet μ ± 2σ får vi at en enkeltmåling har ca 95% sannsynlighet for å havne innenfor [μ 2.1,μ+2.1] = [μ.2,μ+.2], mens gjennomsnittet av 1 målinger har ca 95% sannsynlighet for å havne innenfor [μ 2.1,μ+2.1] = [μ.6,μ+.6]. 13