Gammafordelingen og χ 2 -fordelingen

Like dokumenter
Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Kontinuerlige sannsynlighetsfordelinger.

Transformasjoner av stokastiske variabler

To-dimensjonale kontinuerlige fordelinger

FORMELSAMLING TIL STK1100 OG STK1110

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger : Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2016

Poissonprosesser og levetidsfordelinger

STK juni 2018

TMA4240 Statistikk 2014

Løsning eksamen desember 2017

TMA4245 Statistikk Eksamen desember 2016

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Oppfriskning av blokk 1 i TMA4240

FORMELSAMLING TIL STK1100 OG STK1110

TMA4240 Statistikk Høst 2015

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Funksjoner av stokastiske variable.

Løsningsforslag, eksamen statistikk, juni 2015

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

6.1 Kontinuerlig uniform fordeling

6.5 Normalapproksimasjon til. binomisk fordeling

TMA4240 Statistikk Høst 2015

La U og V være uavhengige standard normalfordelte variable og definer

Funksjoner av stokastiske variable.

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Medisinsk statistikk Del I høsten 2009:

TMA4240 Statistikk Høst 2015

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk Høst 2007

Kontinuerlige sannsynlighetsfordelinger.

Eksamensoppgave i TMA4240 Statistikk

Kap. 6, Kontinuerlege Sannsynsfordelingar

Fasit for tilleggsoppgaver

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

Bootstrapping og simulering Tilleggslitteratur for STK1100

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

EKSAMEN I SIF4018 MATEMATISK FYSIKK mandag 28. mai 2001 kl

TMA4240 Statistikk H2015

UNIVERSITETET I OSLO

TMA4240 Statistikk H2017 [15]

Kap. 6, Kontinuerlege Sannsynsfordelingar

Formelsamling i medisinsk statistikk

Kapittel 2: Hendelser

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

TMA4240 Statistikk Eksamen desember 2015

LØSNINGSFORSLAG EKSAMEN, MAT 1001, HØSTEN (x + 1) 2 dx = u 2 du = u 1 = (x + 1) 1 = 1 x + 1. ln x

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk Høst 2008

FORMELSAMLING STATISTIKK, HiG Versjon per 10. januar 2002, ved Hornæs

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

DEL 1 GRUNNLEGGENDE STATISTIKK

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Kap. 8: Utvalsfordelingar og databeskrivelse

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

ST0202 Statistikk for samfunnsvitere

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2009

Et lite notat om og rundt normalfordelingen.

Regneøvelse 22/5, 2017

Kap. 6, Kontinuerlege Sannsynsfordelingar

Forslag til endringar

Kapittel 4.4: Forventning og varians til stokastiske variable

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

Pilkast og kjikvadrat fordelingen

Utvalgsfordelinger (Kapittel 5)

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Løsningsforslag statistikkeksamen desember 2014

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

TMA4240 Statistikk H2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Weibullfordelingen. Kjetil L. Nielsen. Innhold. 1 Teori. 1.1 Tetthetsfunksjon og fordelingsfunksjon

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

STK Oppsummering

UNIVERSITETET I OSLO

Løsningsforslag Eksamen S2, høsten 2017 Laget av Tommy O. Sist oppdatert: 26. november 2017

Et lite notat om og rundt normalfordelingen.

Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100

Transkript:

Gammafordelingen og χ 2 -fordelingen Gammafunksjonen Gammafunksjonen er en funksjon som brukes ofte i sannsynlighetsregning. I mange fordelinger dukker den opp i konstantleddet. Hvis man plotter n-fakultet (n!) mot n for n =, 1,... er det naturlig å spørre seg om det ikke finnes en kontinuerlig funksjon som går gjennom alle punktene. Svaret på dette spørsmålet er nettopp gammafunksjonen, eller rettere sagt, en translasjon av gammafunksjonen. Mer presist, den funksjonen vi skal definere og skrive som Γ(n) vil for heltallige n være lik (n 1)!. Altså er Γ(1) =! = 1, Γ(2) = 1! = 1, Γ(3) = 2! = 2, osv. Vi definerer gammafunksjonen for alle positive x ved integralet Vi ser da at Γ(1) = Γ(x) = Ved delvis integrasjon finner vi videre at xγ(x) = xt x 1 e t dt = = + t x 1 e t dt. (1) e t dt = [ e t ] = ( 1) = 1. Dermed gjelder rekursjonsformelen u (t)v(t)dt = [t x e t ] t (x+1) 1 e t dt = Γ(x + 1). t x ( e t )dt Γ(x + 1) = xγ(x) (2) generelt. Siden Γ(1) = 1 finner vi da rekursivt Γ(2) = 1 Γ(1) = 1, Γ(3) = 2Γ(2) = 2!, Γ(4) = 3Γ(3) = 3!,... osv, slik at Γ(n) = (n 1)!. Det kan vises at Γ( 1 2 ) = π. Ved å bruke likning (2) kan man da beregne funksjonen for alle halvtallige verdier. 1

For andre verdier må funksjonsverdien beregnes numerisk, enten ved å benytte en rekkeutvikling for den eller ved numerisk integrasjon. Oppgave 1 Hvordan oppfører Γ(x) seg når x nærmer seg null (ovenfra)? Bruk rekursjonsformelen for gammafunksjonen til å beregne Γ(.5), Γ(1.), Γ(1.5),... Γ(4). Bruk disse verdiene til å skissere gammafunsjonen på området [, 4]. Gammafordelingen Vi kan nå finne konstanten c i fordelingen på formen f(x) = cx k 1 e αx definert for positive x. Ved å innføre ny integrasjonsvariabel u = αx finner vi f(x)dx = c ( u α )k 1 e u 1 α du = c u k 1 e u du = cγ(k). α k α k Siden dette integralet må være lik 1 for at f(x) skal være en sannsynlighetstetthet ser vi at konstanten c må være lik α k /Γ(k). Den fordelingen vi nå har funnet kalles gammafordelingen. Vi sier at X er gammafordelt med formparameter k og skalaparameter α hvis X har sannsynlighetstettheten for x. f(x) = αk Γ(k) xk 1 e αx (3) Legg merke til at eksponensialfordelingen er en gammafordeling med formparameter lik 1. Vi kan nå også finne forventningen og variansen til X ved å beregne EX r = x r f(x)dx = αk x (k+r) 1 e αx dx. Γ(k) 2

Ved å erstatte k med (k+r) i resultatet funnet ovenfor, som sier at x k 1 e αx dx = Γ(k)/α k, finner vi EX r = αk Γ(k + r) = Γ(k) α k+r Γ(k + r) α r Γ(k). Ved å sette inn r = 1 og bruke at kγ(k) = Γ(k + 1) gir dette EX = k α og tilsvarende, ved å sette r = 2 får vi at EX 2 = k(k + 1)/α 2 som gir var(x) = EX 2 (EX) 2 = k α 2. Oppgave 2 Skjevheten til en fordeling med forventning µ og varians σ 2 er definert som E(X µ) 3 /σ 3. Symmetriske fordelinger (f. eks. normalfordelingen) vil da ha skjevhet lik null. Finn skjevheten til gammafordelingen og studer hvordan den forandrer seg når formparameteren forandrer seg. Hint: multipliser ut (X µ) 3 og finn alle ledd ved å sette inn i den generelle formelen for momentene til gammafordelingen. Bruk rekursjonsformelen til å bli kvitt gammafunksjonen. Skalatransformasjoner og summer La nå X være gammafordelt med parametre (k, α) og definer Y = βx, for β >. Ved å benytte formelen for monotone transformasjoner finner vi da at Y også er gammafordelt. Formparameteren blir den samme som for X, dvs. lik k, mens skalaparameteren blir α/β. En annen nyttig egenskap ved gammafordelingen er følgende: Dersom X 1, X 2,..., X n er uavhengige variable, X i gammafordelt med formparameter k i og skalaparameter α, så er summen Z = n i=1 X i også gammafordelt. Formparameteren i fordelingen til Z er n i=1 k i og skalaparameteren er α. Av resultatet 3

om endring av skala gitt ovenfor følger det da at middelverdien Z/n også blir gammafordelt. Formparameteren blir k i og skalaparameteren αn. Hvis vi adderer mange variable med samme gammafordeling vil summen være gammafordelt med stor formparameter. Ifølge sentralgrenseteoremet kan derfor gammafordelingen tilnærmes med en normalfordeling når formparameteren er stor. I praksis fungerer dette godt når k > 1. Oppgave 3 La X være gammafordelt med parametre (k, α). Bruk transformasjonsformelen for monotone transformasjoner til å vise at Y = βx da er gammafordelt med parametre (k, α/β). χ 2 -fordelingen I statistisk analyse av normalfordelte variable anvendes en fordeling som er et spesialtilfelle av gammafordelingen og som kalles χ 2 -fordelingen. La X være en standard normalfordelt variabel og sett Y = X 2. Vi kan da finne den kumulative fordelingen til Y, F Y (y) = P (Y y) = P (X 2 y) = P ( y X y) = F X ( y) F X ( y). Vi deriverer på begge sider m.h.p. y og finner sannsynlighetstettheten f Y (y) = 1 2 y [f X( y) + f X ( y)]. Ved å sette inn i standard normalfordelingen og bruke at π = Γ( 1 2 ) følger det at at f Y (y) = (1/2)1/2 Γ(1/2) y1/2 1 e y/2 for y >. Vi ser at Y = X 2 er gammafordelt med formparameter og skalaparameter lik 1/2. La nå X 1, X 2,..., X n være uavhengige standard normalfordelte variabler og sett Y = X 2 1 +X 2 2 +...+X 2 n. Da er Y en sum av n gammafordelte variable med 4

parametre (1/2, 1/2) og er derfor gammafordelt med parametre (n/2, 1/2), dvs. 1 f Y (y) = 2 n/2 Γ(n/2) yn/2 1 e n/2. (4) Denne fordelingen kalles χ 2 -fordelingen med n frihetsgrader. Begrepet frihetsgrader brukes her som en betegnelse på en heltallig parameter. Ved å sette inn i uttrykkene for forventning og varians til gammafordelingen finner vi at forventningsverdien blir n og variansen 2n. Kvantiler i denne fordelingen for gitte verdier av n finner man i statistiske tabeller. Vi ser at hvis n er stor, så er Y en sum av et stort antall variable (X 2 i ) og er dermed tilnærmet normalfordelt ifølge sentralgrenseteoremet. Tilnærmelsen vil være ganske nøyaktig for n > 2. Oppgave 4 Finn 5%- og 95%-kvantilene i χ 2 -kvadratfordelingen med hhv. 1, 2 og 5 frihetsgrader i en statistisk tabell. Beregn også disse kvantilene ved å tilnærme fordelingene med normalfordelinger og sammenlikn med de eksakte tallene. Oppgave 5 La X være gammafordelt med parametre (k, α). Vis at fordelingen til Y = 2αX er χ 2 -fordelt, men at antall frihetsgrader ikke nødevendigvis er et helt tall. Bruk dette til å finne tilnærmet 5%-kvantilen i gammafordelingen med parametre (7.3, 3.4). Hint: Interpoler i χ 2 -tabellen. Bruk av χ 2 -fordelingen i statistisk analyse La nå X 1, X 2,..., X n være uavhengige N(µ, σ 2 ). Da er (X i µ)/σ standard normalfordelte og det følger av resultatene ovenfor at kvadratsummen Z = 1 σ 2 n i=1 (X i µ) 2 5

er χ 2 -fordelt med n frihetsgrader. Et resultat som viser å være mer anvendbart er at vi fremdeles får en χ 2 - fordelt variabel dersom forventningen µ erstattes med middelverdien X, men at antall frihetsgrader da er n 1. Dette resultatet vil blant annet bli brukt til å trekke slutninger om en ukjent varians σ 2 på grunnlag av uavhengige normalfordelte observasjoner. Et annet nyttig resultat er at summer (og middelverdier) av eksponensielt fordelte variable også kan analyseres ved hjelp av χ 2 -fordelingen. Hvis X i, i = 1, 2..., n, er uavhengige eksponensielt fordelte variable med sannsynlighetstetthet f(x) = λe λx så følger det av resultatene ovenfor at n i=1 X i er gammafordelt med formparameter n og skalaparameter λ. Videre følger det av resultatet for skalaendringer at 2λ X i da er gammafordelt med formparameter n og skalaparameter lik λ/(2λ) = 1/2, dvs. denne variable er χ 2 -fordelt med 2n frihetsgrader. Oppgave 6 La T 1, T 2..., T 1 være 1 uavhengige eksponensielt fordelte variable med parameter λ = 2.5. Finn 5%- og 95%-kvantilen i fordelingen til middelverdien T. Hint: Uttrykk T på formen az, der a er en kjent konstant og Z er χ 2 -fordelt. Sett så opp ulikheten P (Z < z α ) =.5 (hvor z α kan finnes i tabellene) og sett inn Z uttrykt ved T. 6