Transformasjoner av stokastiske variabler

Like dokumenter
Gammafordelingen og χ 2 -fordelingen

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

La U og V være uavhengige standard normalfordelte variable og definer

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2008

Eksamensoppgave i TMA4240 Statistikk

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

To-dimensjonale kontinuerlige fordelinger

TMA4240 Statistikk H2015

TMA4100 Matematikk 1, høst 2013

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk H2010

Notasjon. Løsninger. Problem. Kapittel 7

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

TMA4240 Statistikk Høst 2009

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

TMA4100 Matematikk 1 Høst 2014

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2016

Derivasjon Forelesning i Matematikk 1 TMA4100. Hans Jakob Rivertz Institutt for matematiske fag 2. september 2011

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Eksamen desember 2015

FORMELSAMLING TIL STK1100 OG STK1110

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Binomisk sannsynlighetsfunksjon

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

UNIVERSITETET I OSLO

Regneøvelse 22/5, 2017

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

UNIVERSITETET I OSLO

Poissonprosesser og levetidsfordelinger

Normal- og eksponentialfordeling.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Kapittel 2: Hendelser

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Løsningsforslag, eksamen MA1101/MA6101 Grunnkurs i analyse I, vår 2009

Oppfriskning av blokk 1 i TMA4240

UNIVERSITETET I OSLO

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgåve i TMA4240 Statistikk

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Prøvemidtveiseksamen TMA4240 Statistikk H2004

TMA4100 Matematikk 1, høst 2013

DEL 1 GRUNNLEGGENDE STATISTIKK

UNIVERSITETET I OSLO

STK juni 2018

Løsningsforslag for MAT-0001, desember 2009, UiT

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Eksempel: kast med to terninger

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

Formelsamling i medisinsk statistikk

UNIVERSITETET I OSLO Matematisk Institutt

Anbefalte oppgaver - Løsningsforslag

Funksjoner av stokastiske variable.

FORMELSAMLING TIL STK1100 OG STK1110

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Eksamensoppgave i TMA4245 Statistikk

Kontinuerlige sannsynlighetsfordelinger.

Funksjoner av stokastiske variable.

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2007

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

STK Oppsummering

dg = ( g P0 u)ds = ( ) = 0

ST0202 Statistikk for samfunnsvitere

MAT1030 Forelesning 14

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

LØSNINGSFORSLAG EKSAMEN I GRUNNKURS I ANALYSE I (MA1101/MA6101)

TMA4240 Statistikk 2014

Medisinsk statistikk Del I høsten 2009:

Fra første forelesning:

Seksjon 1.3 Tetthetskurver og normalfordelingen

Seksjon 1.3 Tetthetskurver og normalfordelingen

HØGSKOLEN I STAVANGER

Kapittel 6: Funksjoner

MA0002 Brukerkurs i matematikk B Vår 2016

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

TMA4240 Statistikk Høst 2015

Prøveeksamen i MAT 1100, H-03 Løsningsforslag

Funksjoner Forelesning i Matematikk 1 TMA4100. Hans Jakob Rivertz Institutt for matematiske fag 19. august 2010

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Kapittel 4: Matematisk forventning

Areal mellom kurver Volum Forelesning i Matematikk 1 TMA4100

MAT1030 Forelesning 14

Løsningsforslag for eksamen i brukerkurs i matematikk A (MA0001)

Foreleses onsdag 8. september 2010

Transkript:

Transformasjoner av stokastiske variabler Notasjon merkelapper på fordelingene Sannsynlighetstettheten og den kumulative fordelingen til en stokastisk variabel X betegnes hhv. f X og F X. Indeksen er altså en merkelapp som forteller hvilken stokastisk variabel som har den aktuelle fordelingen. Funksjoner av stokastiske variabler Hvis X er høyden til en vilkårlig valgt norsk mann målt i centimeter vil fordelingen til X være sentrert rundt verdien 180 (cm). Hvis vi innfører Y som høyden målt i meter vil verdiene gruppere seg rundt 1.80 (meter). Den matematiske sammenhengen melom X og Y er da Y = X/100. (1) Den variable Y er en funksjon av X, og den er da også en stokastisk variabel, men den vil nødvendigvis ha en helt annen fordeling enn X. Til ethvert enkeltutfall av eksperimentet (en mann trukket fra populasjonen) svarer det en verdi for X, men samtidig også en verdi for Y. Et annet eksempel er å la X betegne oppnådd konsentrasjon av H + -ioner etter et gjennomført kjemisk eksperiment. Hvis Y er PH-verdien gjelder da sammenhengen Y = log X. (2) De variable X og Y vil ha helt forskjellige verdier, og de vil også ha helt forskjellige fordelinger. De samme betrakningene vil også være gyldige for en vilkårlig funksjonssammenheng mellom X og Y 1

X = g(y ). (3) Vi sier da at Y er en transformasjon av X definert ved funksjonen g( ). I sannsynlighetsregning og statistikk vil det ofte være nødvendig å studere slike transformasjoner av stokastiske variabler. Vi skal i det følgende se på hvordan vi kan finne fordelingen til Y = g(x) når vi kjenner fordelingen til X. Generell behandling av transformasjoner Å finne fordelingen til Y når fordelingen til X er kjent gjøres enklest ved først å finne den kumulative fordelingen til Y som er F Y (y) = P (Y y) = P (g(x) y). (4) Videre kan ulikheten g(x) y alltid løses m.h.p. X. I eksemplet med høydene målt i centimeter og meter (likning 1) finner vi {g(x) y} = {X/100 y} = {X 100y} (5) slik at den kumulative fordelingen til Y da blir F Y (y) = P (X 100y) = F X (100y). Den kumulative fordelingen til Y er her uttrykt ved den (kjente) kumulative fordelingen til X. Vi kan nå finne sannsynlighetstettheten til Y ved å derivere m.h.p. y på begge sider. Vi må da bruke kjerneregelen som gir f Y (y) = F Y (y) = d dy F X(100y) = f X (100y) d dy (100y) = 100f X(100y). (6) Uttrykket f X (100y) betyr her at vi skal erstatte den variable x i formelen f X (x) med 100y. I eksemplet med det kjemiske eksperimentet (likning 2) finner vi tilsvarende 2

{g(x) y} = { log X y} = {X 10 y } (7) slik at F Y (y) = P (X 10 y ) = 1 P (X < 10 y ) = 1 F X (10 y ). Sannsynlighetstettheten til Y blir da f Y (y) = F Y (y) = d dy [1 F X(10 y )] = f X (10 y )10 y ln(10). (8) Vi har her brukt at den deriverte av funksjonen 10 y er 10 y ln(10). De to transformasjonene ovenfor (likning 1 og 2) er definert ved strengt monotone funksjoner g( ). Løsningen på ulikheten g(x) y blir da et intervall på X-aksen. Generelt kan løsningen bli et sammensatt område på tall-linjen. For transformasjonen Y = g(x) = X 2 finner vi f. eks. {g(x) y} = {X 2 y} = { y X y}. (9) Den kumulative fordelingen til Y blir da F Y (y) = P (g(x) y) = F X ( y) F X ( y) (10) som gir sannsynlighetstettheten f Y (y) = 1 2 y [f X( y) + f X ( y)]. (11) Strengt monotone transfomasjoner Fordelingen til Y kan uttrykkes ved en enkel generell formel for alle strengt monotone transformasjoner. Anta først at g(x) er en strengt voksende funksjon. Løsningen på likningen g(x) = y m.h.p. X blir da en funksjon av y (den inverse funksjonen av g( ) ) som vi skriver X = h(y). (12) 3

I eksempelet med høyder målt i centimeter og meter (likning 1) blir da h(y) = 100y, mens kjemi-eksempelet (likning 2) gir h(y) = 10 y. Siden funksjonen er strengt voksende finner vi da {g(x) y} = {X h(y)} (13) slik at kumulativ fordeling til Y blir F Y (y) = P (g(x) y) = P (X h(y)) = F X (h(y)). (14) Sannsynlighetstettheten blir da f Y (y) = F Y (y) = d dy F X(h(y)) = f X (h(y))h (y). (15) Tilsvarende regning for en strengt avtagende funksjon g( ) gir {g(x) < y} = {X > h(y)} (16) og kumulativ fordeling F Y (y) = P (g(x) y) = P (X h(y)) = 1 P (X < h(y)) = 1 F X (h(y)). (17) Ved å derivere begge sider av likning 17 m.h.p. y finner vi nå sannsynlighetstettheten f Y (y) = d dy [1 F X(h(y)] = f X (h(y))h (y). (18) For en strengt avtagende funksjon g( ) er også den inverse funksjonen h(y) strengt avtagende slik at den deriverte h (y) er negativ. Vi kan da skrive h (y) som h (y). For voksende h(y) kan vi tilsvarende skrive h (y) som 4

h (y). Ved å velge å uttrykke resultatene ved h (y) ser vi da at formelene for F Y (y) blir like for strengt voksende og strengt avtagende transformasjoner. For strengt monotone (voksende eller avtagende) transformasjonber gjelder da altså f Y (y) = f X (h(y)) h (y). (19) Noen eksempler på transformasjoner (a) Normalfordeling. La nå X være standard normalfordelt, dvs. f X (x) = 1 2π e x2 /2. (20) Vi vil finne fordelingen til den variable Y = X 2. Den variable X kan ta verdier på hele tall-linjen, mens Y åpenbart ikke kan ta negative verdier. Ved å sette inn i den generelle formelen vi fant for denne transformasjonen (likning (11)) finner vi for y 0 f Y (y) = 1 2 y) 2πy [e ( 2 /2 + e ( y) 2 /2 ] = 1 e y/2 (21) 2πy mens sannsynligheten er null for negative y (fordi Y ikke kan ta negative verdier). (b) Lineære transfomasjoner. Spesielt når vi analyserer normalfordelte variable blir det ofte nødvendig å se på lineære transformasjoner g(x) = ax + b. Hvis a ikke er lik null er dette en strengt monoton transfomasjon med invers funksjon h(y) = (y b)/a. Fordelingen til Y finnes da ved å sette inn i likning 19 f Y (y) = f X ((y b)/a) 1/a. (22) 5

Spesielt får vi f.eks. at hvis X er standard normalfordelt, dvs. f X (x) = (2π) 1/2 e x2 /2, blir (for a > 0) f Y (y) = (2π) 1/2 a 1 e (y b)2 /(2a 2). (c) Generering av eksponensielt fordelte variabler med datamaskin. De fleste datamaskiner har innebygde rutiner ( pseudo random number generators ) som gir en variabel en tilfeldig verdi mellom 0 og 1, eller mer presist, den variable X blir tilordnet en verdi som er rektangulært fordelt på intervallet [0,1].: og lik null når x ikke ligger i intervallet [0,1]. f X (x) = 1 for 0 x 1, (23) Vi lar så maskinen beregne Y = 1 ln X, der λ er et gitt positivt tall. λ Hvilken fordeling får da den variable Y? Dette er en monoton transformasjon og den inverse funksjonen er h(y) = e λy. Vi finner igjen fordelingen til Y ved å sette inn i likning (19), og finner f Y (y) = f X (e λy ) λe λy = λe λy. (c) Lognormalfordelingen. La X være N(µ, σ 2 ) og definer Y = e X. Vi ser at Y bare tar positive verdier. Siden dette er en monoton transformasjon kan vi bruke formelen (19) med h(y) = ln(y) som gir f Y (y) = 1 (ln(y) µ)2 e 2σ 2. (24) 2πσ2 y Dette kalles lognormalfordelingen med parametre µ og σ 2. Tolkningen av parametrene er da at E(ln Y ) = µ og var(ln Y ) = σ 2. Det kan vises at EY = e µ+σ2 /2 (25) 6

og at var(y ) = e 2µ+σ2 (e σ2 1). (26) 7