Kapittel 4.4: Forventning og varians til stokastiske variable

Like dokumenter
Denne uken: Kapittel 4.3 og 4.4

Kapittel 4.3: Tilfeldige/stokastiske variable

Utvalgsfordelinger (Kapittel 5)

TMA4240 Statistikk H2010

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Tilfeldige variable (5.2)

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Kapittel 2: Hendelser

ST0202 Statistikk for samfunnsvitere

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

ÅMA110 Sannsynlighetsregning med statistikk, våren

UNIVERSITETET I OSLO

Utvalgsfordelinger (Kapittel 5)

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

TMA4240 Statistikk H2010

Seksjon 1.3 Tetthetskurver og normalfordelingen

statistikk, våren 2011

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

TMA4240 Statistikk Høst 2016

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

TMA4240 Statistikk H2015

ST0202 Statistikk for samfunnsvitere

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Sannsynlighet: Studiet av tilfeldighet

UNIVERSITETET I OSLO Matematisk Institutt

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Statistikk 1 kapittel 4

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

TMA4240 Statistikk Eksamen desember 2015

Seksjon 1.3 Tetthetskurver og normalfordelingen

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Forelening 1, kapittel 4 Stokastiske variable

Fasit for tilleggsoppgaver

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

Et lite notat om og rundt normalfordelingen.

TMA4240 Statistikk Høst 2018

ST0202 Statistikk for samfunnsvitere

Binomisk sannsynlighetsfunksjon

TMA4245 Statistikk Eksamen desember 2016

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

UNIVERSITETET I OSLO

To-dimensjonale kontinuerlige fordelinger

Kapittel 5: Tilfeldige variable, forventning og varians.

UNIVERSITETET I OSLO

Forventning og varians.

DEL 1 GRUNNLEGGENDE STATISTIKK

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Et lite notat om og rundt normalfordelingen.

Kap. 8: Utvalsfordelingar og databeskrivelse

TMA4245 Statistikk Eksamen august 2014

UNIVERSITETET I OSLO

Forventning og varians.

ST0202 Statistikk for samfunnsvitere

3.1 Stokastisk variabel (repetisjon)

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

STK Oppsummering

Statistikk og dataanalyse

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Inferens i fordelinger

ECON2130 Kommentarer til oblig

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk H2017 [15]

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Eksamensoppgave i TMA4240 Statistikk

UNIVERSITETET I OSLO

Kapittel 4: Matematisk forventning

STK1100 våren Generell introduksjon. Omhandler delvis stoffet i avsnitt 1.1 i læreboka (resten av kapittel 1 blir gjennomgått ved behov)

FORMELSAMLING TIL STK1100 OG STK1110

Kapittel 3: Studieopplegg

Løsningsforslag til obligatorisk oppgave i ECON 2130

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Kapittel 4: Sannsynlighet - Studiet av tilfeldighet

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Regneregler for forventning og varians

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Inferens i regresjon

Transkript:

Kapittel 4.4: Forventning og varians til stokastiske variable

Forventning og varians til stokastiske variable Histogrammer for observerte data: Sannsynlighets-histogrammer og tetthetskurver for stokastiske variable:

Tidligere har vi sett på gjennomsnitt og empirisk varians til observerte data Numeriske beskrivelser av observerte data Nå skal vi se på forventning og (teoretisk) varians til stokastiske variable Numeriske beskrivelser av teoretisk oppførsel

Velger tall mellom 000 og 999 Spill-eksempel Et tall trekkes tilfeldig ut og en vinner $500 hvis en har valgt riktig tall. 1000 slike tresifrede tall, sannsynlighetene for å tape/vinne er derfor Eksempel tre spill: En spiller vant ingen av gangene. Observert gevinst er x 1 =$0, x 2 =$0 og x 3 =$0. Gjennomsittlig observert gevinst: x =(x 1 +x 2 +x 3 )/3=$0 En lang rekke av spill: 0.1% av gangene blir det gevinst, 99.9% av gangene blir det ikke det. Gjennomsnittlig utbetaling blir da $500*0.001 + $0*0.999=$0.50 En lang rekke av spill gjenspeiler teoretisk forventet gjennomsnittlig utbetaling pr spill: $0.50

Idealisering Sannsynlighetsfordeling: Idealisert beskrivelse av andeler i det lange løp Forventning: Beskriver forventet verdi av gjennomsnittet i det lange løp Forventning=μ (eller μ X, for å huske at det er forventningen til X)

Forventning til en diskret stokastisk variabel

Eksempel S={1,2,3,4,5,6,7,8,9} Kast med en 9-sidet terning: P(X=i)=1/9=0.111 for alle i=1,2,3,...,9 μ X =1*0.111 + 2*0.111 +...+ 9*0.111=5 Sannsynligheter etter Benford's lov μ X =

Forventning for kontinuerlige variable Kap 1: Balansepunkt i fordeling Symmetriske fordelinger Lik senter Generelt: Regnes ut som et integral (der f(x) er sannsynlighetstettheten til x)

= I figuren: k=df=4

Statistisk estimering μ=forventet høyde i populasjon av kvinner μ: ukjent parameter Enkelt randomisert utvalg: x 1,...,x n Estimat for μ: x x observator, stokastisk variabel, brukes til å anslå/estimere μ x forventningsrett estimator for μ Hvis vi fortsetter å legge til nye observasjoner til vårt tilfeldige utvalg, vil x garantert komme så nær vi ønsker den sanne forventningen μ (store talls lov)

Store talls lov x =(x 1 +x 2 +...+x n )/n x 1, x 2,...,x n uavhengige observasjoner fra samme populasjon med forventning μ Når antall observasjoner (n) øker, vil x nærme seg μ Jacob Bernoulli i 1713

Høyde kvinner

Store talls lov Sier oss at gjennomsnitt er stabile og oppfører seg på en spesiell måte Et spillekasino kan tape på enkeltspillere, men vil gjennomsnittelig vinne fordi store talls lov sier dem hva gjennomsnittlig inntekt vil være over lang tid Et forsikringsselskap kan tape på enkeltkunder, men vil gjennomsnittelig tjene, fordi store talls lov sier dem hva gjennomsnittlig inntekt/utbetaling vil være for mange kunder Kan vises matematisk Hvor stort er stort? Avhenger av variabilitet på hver enkelt x i (jo større variabilitet, jo flere observasjoner trengs)

Regler for forventning For konstanter a og b, slik at a+bx er en lineærtransformasjon av X: For to stokastiske variable X og Y:

Regler for forventning: Eksempler Den stokastiske variabelen X har forventning 2 Forventningen til den stokastiske variabelen Y=3+5*X er da: Forventningen til den stokastiske variabelen Z=X+Y er da:

Variansen til en stokastisk variabel Varians og standardavvik er teoretiske mål på spredningen (variabiliteten) i sannsynlighetsfordelingen Observert varians for et datasett betegner vi s 2 Observert standardavvik for et datasett betegner vi s Teoretisk varians for den stokastiske variabelen X betegner vi σ 2 eller σ X 2 Teoretisk standardavvik for den stokastiske variabelen X betegner vi σ eller σ X Som for s 2 er den teoretisk variansen et slags gjennomsnitt (vektet av sannsynligheter som for forventningen) av kvadratet av avvikene (X-μ X ) 2

Regler for varianser Regel 1: Regel 2: Regel 3:

Standardavvik NB!!! Regel 2 for varianser betyr at standardavviket til summen av to uavhengige stokastiske variable ikke er lik summen av standardavvikene! Fremgangsmåte for å kombinere standardavvik: Bruk reglene for varianser, og ta deretter kvadratroten for å finne standardavviket

Det viktige tilfellet X-Y (der X og Y er uavhengige): Hva når X og Y ikke er uavhengige?

Teoretisk korrelasjon Empirisk korrelasjon r mellom to observerte variable: Gjennomsnittet av produktet av de standardiserte observasjonene for hvert individ Teoretisk korrelasjon ρ mellom de stokastiske variablene X og Y: En type vektet gjennomsnitt av produktet av de standardiserte stokastiske variablene ρ er et tall mellom -1 og 1

Regneregler for forventning og varians: Eksempel

Oppsummering: Forventning til stokastiske variable Forventning: Idealisert beskrivelse av langtids utfall av gjennomsnitt For diskrete stokastisk variable: Vektet gjennomsnitt av x i -ene med sannsynlighetene som vekter For kontinuerlige stokastisk variable må vi integrere produktet av x og sannsynlighetstettheten til x

Oppsummering: Varians til stokastiske variable Teoretisk varians: Idealisert beskrivelse av langtids utfall av spredningen/variabiliteten For diskrete stokastisk variable: Vektet gjennomsnitt av (x i -μ X ) 2 -ene med sannsynlighetene som vekter For kontinuerlige stokastisk variable må vi integrere produktet av (x-μ X ) 2 og sannsynlighetstettheten til x

Oppsummering: Regneregler for forventning og varians