Forventning og varians.

Like dokumenter
Forventning og varians.

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Kapittel 4: Matematisk forventning

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

statistikk, våren 2011

HØGSKOLEN I STAVANGER

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

FORMELSAMLING TIL STK1100 OG STK1110

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

ØVINGER 2017 Løsninger til oppgaver. Lineærkombinasjonen Z = 5X + 8Y har forventningsverdi

Kapittel 2: Hendelser

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Statistikk 1 kapittel 4

Kapittel 5: Tilfeldige variable, forventning og varians.

La U og V være uavhengige standard normalfordelte variable og definer

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Oppgavesett nr. 5. MAT110 Statistikk 1, Et transportfirma har et varemottak for lastebiler med spesialgods, se figur 1.

Oppfriskning av blokk 1 i TMA4240

FORMELSAMLING TIL STK1100 OG STK1110

TMA4240 Statistikk Høst 2008

HØGSKOLEN I STAVANGER

To-dimensjonale kontinuerlige fordelinger

Kapittel 4.4: Forventning og varians til stokastiske variable

Formelsamling i medisinsk statistikk

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Løsningsforslag, eksamen statistikk, juni 2015

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

Stokastisk variabel. Eksempel augefarge

TMA4240 Statistikk H2015

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

TMA4240 Statistikk Høst 2009

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Løsningsforslag til obligatorisk oppgave i ECON 2130

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Funksjoner av stokastiske variable.

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4240 Statistikk Eksamen desember 2015

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Funksjoner av stokastiske variable.

FORMELSAMLING STATISTIKK, HiG

Statistikk 1 kapittel 4

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Forelening 1, kapittel 4 Stokastiske variable

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Om eksamen. Never, never, never give up!

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Formelsamling V MAT110 Statistikk 1. Per Kristian Rekdal

Om eksamen. Never, never, never give up!

Regneregler for forventning og varians

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk H2015

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

TMA4240 Statistikk Høst 2016

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2007

Fasit for tilleggsoppgaver

TMA4240 Statistikk Eksamen desember 2015

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

µ = E(X) = Ʃ P(X = x) x

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgåve i TMA4240 Statistikk

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

TMA4240 Statistikk H2010

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Bernoulli forsøksrekke og binomisk fordeling

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk 2014

Institutt for Samfunnsøkonomi

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Kp. 9.8 Forskjell mellom to forventninger

Oppgave N(0, 1) under H 0. S t n 3

TMA4240 Statistikk Høst 2015

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Tema 2: Stokastiske variabler og sannsynlighetsfordelinger Kapittel 3 ST :44 (Gunnar Taraldsen)

FORMELSAMLING STATISTIKK, HiG

TMA4245 Statistikk Vår 2007

Betinget sannsynlighet

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Transkript:

Forventning og varians. Dekkes av kapittel 4 i læreboka. Forventning (4.) Forventningsverdi gjennomsnitt i det lange løp. Defininsjon: Forventningsverdien til en stokastisk variabel X er: E(X) f(),x diskret f()d,x kontinuerlig Bruker ofte μ eller μ X som symbol for E(X). Eksempel: Myntkast, kaster en mynt 3 ganger. X antall kron. Vist tidliger at: Gir at E(X) 2 3 f() /8 3/8 3/8 /8 f() 8 + 3 8 +2 3 8 +3 8 3 2 Eksempel: Y funksjonstid til elektronisk komponent. Y har sannsynlighetstetthet 5 f(y) e y/5,y,ellers som gir at E(Y ) yf(y)dy [ ye y/5 ] [5e y/5 ] 5 y 5 e y/5 dy e y/5 dy Dvs tester vi mange komponenter av denne typen vil vi se at de i gjennomsnitt har en funksjonstid på rundt 5. Forventningsverdi til funksjoner av stokastiske variable finnes på tilsvarende måte: Definisjon: E(g(X)) g()f() g()f()d,x diskret,x kontinuerlig 2

Eksempel: Se boka/øving. Definisjon: Dersom X og Y er to stok. var. med simultanfordeling f(, y) er y g(, y)f(, y) E(g(X, Y )), g(, y)f(, y)ddy,kont. Eksempel: To kontinuerlige stok. var. har simultanfordeling (+3y 2 ) 4, <<2, <y< f(, y),ellers disk. Varians og kovarians (4.2) Varians mål på spredning omkring forventningsverdien. Defininsjon: Variansen til stok. var. X er: σ 2 σx 2 Var(X) E[(X μ) 2 ] ( μ)2 f(),x diskret ( μ)2 f()d,x kontinuerlig σ SD(X) Var(X) kalles standardavviket til X. Teorem: Var(X) E(X 2 ) μ 2 E(X 2 ) E(X) 2 Finn E(Y/X): E( Y X ) 2 y Merk (viktig!): E( Y X ) E(Y ) E(X) ( + 3y 2 ) ddy 5 4 8 Bevis: Se boka. Eksempel: Y funksjonstid til elektronisk komponent. E(Y 2 ) 5 y 2 5 e y/5 dy Var(Y ) E(Y 2 ) E(Y ) 2 5 5 2 25 3 4

Tommelfingerregel: Ofte (men ikke alltid...) vil ca 95% av observasjonene ligge i intervallet [μ 2σ, μ +2σ]. Definisjon: Var(g(X)) E[(g(X) μ g(x) ) 2 ]E[g(X) 2 ] μ 2 g(x) (Se eksempler i boka). Definisjon: Kovariansen til X og Y er gitt ved: σ XY Cov(X) E[(X μ X )(Y μ Y )] y ( μ X)(y μ Y )f(, y) ( μ X)(y μ Y )f(, y)ddy Kovarians mål på samvariasjon. Cov(X, Y ) >, positiv sammenheng mellom X og Y (f.eks. høyde/skonummer), Cov(X, Y ) <, negativ sammenheng mellom X og Y (f.eks. alder bil/pris bil),,disk.,kont. Merk: X og Y uavh. Cov(X, Y ). NB! Motsatt gjelder ikke. To variable kan ha Cov(X, Y ) og likevel være avhengige! Teorem: Cov(X, Y )E(XY ) E(X)E(Y ) Bevis: Se boka. Problem: Kovariansen ofte vanskelig åtolke, avhenger av skala. Bruker derfor ofte korrelasjon som er en normalisering av kovariansen. Definisjon: Korrelasjon ρ(x, Y )Corr(X, Y ) ρ(x, Y ) Cov(X, Y ) Var(X)Var(Y ) Korrelasjon grad av lineær sammenheng mellom X og Y : 5 6

rho-.8 rho.4 rho-.4 rho.8 rho rho Eksempel: Vann, X relativt vannforbruk, Y relativt humusinnhold. { 2 f(, y) y + 3,, y 4,ellers Finn Corr(X, Y ): E(X) E(Y ) E(XY ) f(, y)dyd Cov(X, Y ) 3 48 7 2 24 288 ( 2 y + 3 4 )dyd 7 2 y( 2 y + 3 )dyd 4 24 y( 2 y + 3 3 )dyd 4 48 Tilsvarende utregninger gir at E(X 2 ) 5 og 2 E(Y 2 ) 7, som videre gir at Var(X) 5 24 2 ( 7 2 )2 og Var(Y ) 7 ( 44 24 24 )2 47 og 576 dermed blir ρ(x, Y ) /288 (/44) (47/576).4 dvs praktisk talt ingen korrelasjon mellom vannforbruk (X) og humusinnhold (Y ). 7 8

Det foregående eksemplet viser at dersom man kjenner simultanfordeligen til to variable så kan man regne ut korrelasjonen mellom variablene. Eksempel: Resultat på midtsemester og slutteksamen. I praksis er situasjonen ofte at man ikke kjenner simultanfordelingen, men man har noen data (målinger) over sammenhørende verdier. Da kan man fra dataene regne ut estimert, eller empirisk korrelasjon. Definisjon: Empirisk korrelasjon (ofte bare kalt korrelasjon) for n målinger (,y ),...,( n,y n ): r s XY s 2 X s 2 Y r n ( n i i )(y i ȳ) n (y i i ȳ) 2 n n i ( i ) 2 n Her er og ȳ gjennomsnittene av - ogymålingene, s XY empirisk kovarians og s 2 X og s2 Y empiriske varianser. I del 2 av MOT kommer dere til ålære om autokovarians og autokorrelasjon, som er kovarians/korrelasjon mellom etterfølgende målinger i en tidsrekke. 9

Forventning og varians til lineærkombinasjoner (4.3) Ved å bruke definisjonene av forventning og varians på lineærkombinasjoner av stokastiske variable får vi en rekke regneregler for lineærkombinasjoner (se boka for alle detaljer). Flesteparten av disse kan oppsummeres i følgende generelle regel (som står i formelsamlingen): Teorem: La Y n i a ix i + b. Daer E(Y ) Var(Y ) n a i E(X i )+b, i n a 2 i Var(X i )+2 i n i a i a j Cov(X i,x j ). i j Se bevis for en del av spesialtilfellene i boka. Merk spesielt at regelen gir at E(aX + b) ae(x)+b og at Var(aX + b) a 2 Var(X) (f.eks. blir Var( X) Var(X)...). Husk også atved uavhengighet mellom variable blir Cov. Eksempel: Vi skal bruke et måleinstrument til åmåle ph-verdien til en løsning. Vi vet at målinger med dette instrumentet gir resultater som har en fordeling med forventningsverdi μ (sann ph-verdi) og varians σ 2.. I stedet for åbaregjøreenmåling bestemmer vi oss for ågjøremålinger og bruke gjennomsnittet av disse målingene som vårt resultat. Hva blir forventningsverdi og varians til dette gjennomsnittet? La X (X + X 2 + + X ) X + + X være gjennomsnittet av de målingene. Vi antar at de målingene er uavhengige. E( X) E(X )+ + E(X ) μ + + μ μ Var( X)( )2 Var(X )+ +( )2 Var(X ) ( )2 σ 2 + +( )2 σ 2 σ2.. 2

Dvs, gjennomsnittet har samme forventningsverdi som enkeltmålingene men lavere varians. Bruker vi tommelfingerregelen om at omtrent 95% av resultatene vil havne i intervallet μ ± 2σ får vi at en enkeltmåling har ca 95% sannsynlighet for å havne innenfor [μ 2.,μ+2.] [μ.2,μ+.2], mens gjennomsnittet av målinger har ca 95% sannsynlighet for å havne innenfor [μ 2.,μ+2.] [μ.6,μ+.6]. 3