Eksponensielle klasser og GLM

Like dokumenter
Eksponensielle klasser

Forelesning 4 STK3100

Introduksjon til Generaliserte Lineære Modeller (GLM)

Forelesning 6 STK3100

Forelesning 7 STK3100

Forelesning 8 STK3100

Prøveeksamen i STK3100/4100 høsten 2011.

Kap. 6, Kontinuerlege Sannsynsfordelingar

Kap. 6, Kontinuerlege Sannsynsfordelingar

Introduksjon til Generaliserte Lineære Modeller (GLM)

Generaliserte Lineære Modeller

Generaliserte Lineære Modeller

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller

Forelesning 6 STK3100

Forelesning 9 STK3100

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Kap. 6, Kontinuerlege Sannsynsfordelingar

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

STK Oppsummering

Kontinuerlige sannsynlighetsfordelinger.

STK1100 våren 2019 Mere om konfidensintevaller

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

STK Oppsummering

DEL 1 GRUNNLEGGENDE STATISTIKK

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Forelesning 5 STK3100/4100

Oppgave 1: Terningsutfall På en kubisk terning er det 1/6 sannsynlighet for hver type utfall fra 1 til 6. Ved to terninger, er utfallene antatt

Poissonprosesser og levetidsfordelinger

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Eksamensoppgave i TMA4240 Statistikk

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Formelsamling i medisinsk statistikk

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2015

Eksamensoppgave i TMA4295 Statistisk inferens

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

UNIVERSITETET I OSLO

Kontinuerlige sannsynlighetsfordelinger.

Kort overblikk over kurset sålangt

Introduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R

TMA4240 Statistikk Høst 2015

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

UNIVERSITETET I OSLO

STK-MAT Arne Bang Huseby

TMA4240 Statistikk H2010

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

UNIVERSITETET I OSLO

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

2 Om å lære matematikk og litt om vurdering av måloppnåelse/kompetanse

Om eksamen. Never, never, never give up!

TMA4240 Statistikk H2015

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

Utvalgsfordelinger (Kapittel 5)

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

Oppfriskning av blokk 1 i TMA4240

TMA4240 Statistikk H2010

Om eksamen. Never, never, never give up!

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

UNIVERSITETET I OSLO

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

Modellrisiko i porteføljeforvaltning

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

ST0202 Statistikk for samfunnsvitere

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Kapittel 2: Hendelser

Forelesning 13. STK november Med glattingsteknikker. leter vi ikke etter en parametrisk for for E

Statistikk og dataanalyse

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

ST0202 Statistikk for samfunnsvitere

Bernoulli forsøksrekke og binomisk fordeling

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Et lite notat om og rundt normalfordelingen.

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

Binomisk sannsynlighetsfunksjon

Tilleggsoppgaver for STK1110 Høst 2015

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Funksjoner av stokastiske variable.

TMA4240 Statistikk H2010 (22)

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Løsning eksamen desember 2016

10.1 Enkel lineær regresjon Multippel regresjon

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

FORMELSAMLING TIL STK1100 OG STK1110

Funksjoner av stokastiske variable.

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Fagdag 5-3MX. Kommentarer

Transkript:

!! 3 ksponensielle klasser, Dobson, Kap 3 ksponensielle klasser GLM n stokastisk variabel sies å ha fordeling i den eksponensielle fordelingsklasse som tettheten pktsannsh til kan skrives på formen STK3-3 september 7 $ Sven Ove Samuelsen eller ekvivalent som Plan for 3 forelesning: Definisjoner av eksponensielle klasser ksempler 3 Forventningsstruktur eksponensielle klasser Likelihood GLM altså Merk symmetrien mellom ksponensielle klasser GLM p3 ksponensielle klasser GLM p33 Definisjon av GLM ks Poissonfordeling, -!!,- Uavhengige responser: Pktsannsynlighetene til er da Vektorer av forklaringsvariable er -dimensjonale 5 3 n GLM = Generalisert Lineær Modell er definert ved altså som tetthet i den eksponensielle fordelingsklasse kommer fra samme eksponensiell klasse ksponensielle klasser defineres neste slide, men normalfordelinger, binomiske, Poisson-fordelinger er i eksp klasser Lineære komponenter prediktorer 3 Linkfunksjon : Med lineær komponent ved at kobles forventningen til ksponensielle klasser GLM p3 ksponensielle klasser GLM p3

ksempel: Binær respons sannsynlighet sannsynlighet Dvs har tetthet som kan omformes til som gir som le til dessuten blir ksponensielle klasser GLM p73 - ksempel: Da har har tetthet som kan omformes til Legg spesielt merke til Vi skal se at dette er generelle regler for eksponensielle klasser ksponensielle klasser GLM p3 ks Poissonfordeling, forts Det er imidlertid flere måter å spesifisere denne eksponensielle klassen Alternativt kan vi ha som før 3 er klassen på kanonisk form Når er den naturlige eller kanoniske parameteren Med ksponensielle klasser GLM p53 Redefinisjon av eksponensiell klasse De eksponensielle klassene vi skal arbeide er kanoniske naturlig parameter Derfor skal vi heller benytte følgende definisjon: har fordeling i den eksponensielle klasse som tettheten kan skrives i forhold til Dobson Merk at vi har byttet ksponensielle klasser GLM p63

N ksempel: Da blir tettheten altså normalfordelt generell varians 5 som kan omformes til spredningsledd Dessuten blir Kan legge merke til at ksponensielle klasser GLM p3 Binomisk fordeling kjent spredningsledd feks i - Med inngår antall forsøk Da Vi kan omforme dette ved å se på andel suksesser har tetthet som kan skrives som, kjent, vanligvis er det en parameter som I dette tilfellet er må estimeres ksponensielle klasser GLM p3 N ksempel: Da blir tettheten altså normalfordelt varians 5 som kan omformes til : Igjen genereres forventning varians fra ksponensielle klasser GLM p93 ksponensiell klasse spredningsparameter Normalfordelinger varians kan så settes opp som en eksponensiell klasse, men den naturlige parameteren vil avhenge av både for detaljer se Dobson, Kap 3 Vi skal istedet se på slike fordelinger som en eksponensiell klasse spredningsparameter: parameteren kalles spredningsleddet eller spredningsparameteren ksponensielle klasser GLM p3

Foventning varians i eksponensiell klass har iverte Vi finner at mhp som gir Dette var nettopp hva vi observerte for binomisk fordeling normalfordeling ksponensielle klasser GLM p53 ksempel Poissonfordeling var kanonisk parameter -!!, - Med Vi får altså var som sikkert er velkjent ksponensielle klasser GLM p63 Momentgenerende funksjon defineres momentgenerende funksjon Hvis har tetthet ved i en omegn om såsant dette integralet eksisterer for alle Vi har da at STK samt at ksponensielle klasser GLM p33 Momentgenerende funksjon for eksponensiell klasse Med tetthet dvs eksp klasse uten spredningsledd blir momentgenerende funksjon fra altså integral mhp en tetthet, i en for siden det kan vises at omegn om ksponensielle klasser GLM p3

ks: Normalfordeling N Vi fant da at som gir kjente formler ksponensielle klasser GLM p93 - ks Binomisk fordeling spesifiserte vi For som gir ksponensielle klasser GLM p3 Likelihood-egenskaper Anta at vi observerer en fra Da fås L-likelihood-bidrag Score-bidrag Bidrag til informasjon: Der blir så, ved forventnings variansreglene for ekspklasser, Dette er generelle likelihood egenskaper, som vi nå har vist for ksponensielle klasser GLM p73 ekspklasser for eksp klasse MD spredningsparameter Tetthet: Da blir momentgenerende funksjon Der fås som le til ksponensielle klasser GLM p3

iansfunksjon For eksponensielle klasser spredningsparameter har vi vist Det er en - sammenheng mellom som en funksjon av Derfor kan vi uttrykke Der kan vi definere variansfunksjonen slik at direkte For de vanligste fordelingene gis uttrykket for ksponensielle klasser GLM p33 iansfunksjon for noen fordelinger Der blir For normalfordelingen er variansfunksjonen konstantfunksjonen, dvs For Poissonfordelingen er identitetsfunksjonen For binomisk fordeling,, er, blir variansfunksjonen ksponensielle klasser GLM p3 Likelihood-egenskaper fås Med fra som le til de generelle likelihood-egenskapene Vi skal neste gang se utledning av disse formlene for generelle regulære likelihoo ksponensielle klasser GLM p3 ksp klasse Dobson s parametrisering gir fås da Fra etter litt regning Vie gir ksponensielle klasser GLM p3

Andre lemmer i den eksponensielle fordelingsklasse I tillegg til normalfordelinger, binomisk fordelinger Poisson-fordelinger innehol den eksponensiell fordelingsklasse bla Gamma-fordelinger spesielt eksponensialfordelinger Negativt binomisk fordeling spesielt geometrisk fordeling Invers gaussisk fordeling Trunkerte fordelinger fra andre fordelinger i eksponensiell klasse Weibullfordelinger ikke-kanonisk fordeling! Paretofordeling ikke-kanonisk! Likelihood for GLM Siden -ene er uavhengige tetthet Merk at dette er en funksjon av regresjonskoeffisientene er en funksjon av som igjen er en funksjon av Med l-likelihood-bidrag l-likelihood blir likelihooden blir siden ksponensielle klasser GLM p53 ksponensielle klasser GLM p73 Spesifikk definisjon av GLM n GLM = Generalisert Lineær Modell kan defineres ved Uavhengige tetthet forventninger Lineære komponenter prediktorer fra samme eksponensiell klasse Scorebidrag for GLM Score-bidrag utledes ved utstrakt bruk av kjerneregelen regelen om ivert av invers funksjon Linkfunksjon : Med lineær komponent ved at kobles forventningen til Merk at avhenger av gjennom Der avhenger så av via sammenhengen Altså blir ksponensielle klasser GLM p63 ksponensielle klasser GLM p3

Kanonisk link Matematisk sett forenkles en GLM ved å anta dvs kanonisk naturlig parameter = lineær prediktor Isåfall kalles linkfunksjonen for kanonisk Vi får da at score-funksjonen gis ved siden ksponensielle klasser GLM p33 ksempler på kanonisk link Siden vi generelt så har finner vi den kanoniske linken fra Da blir Normalfordeling: Vanlig lineær-normal modell som fører Poissonfordeling: L-lineær modell som fører Binomisk fordeling: Listisk regresjon som gir lit ksponensielle klasser GLM p33 Scorefunksjon estimeringsligninger for GLM Komponent i scorefunksjonen uttrykkes siden Merk at, ved å løse ligningene, Vi finner altså ML er estimert forventning ksponensielle klasser GLM p93 stimeringsligninger GLM spredningsledd Sålangt har vi antatt observasjoner fra eksponensiell klasse uten spredningsledd Utledningen modifiseres lett til fordelinger tetthet siden Altså blir komponent i score-funksjonen inngår proporsjonalt ikke betyr noe for estimeringen ksponensielle klasser GLM p33