Forelesning 4 STK3100

Like dokumenter
Eksponensielle klasser og GLM

Generaliserte Lineære Modeller

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Forelesning 7 STK3100

Generaliserte Lineære Modeller

Eksponensielle klasser

UNIVERSITETET I OSLO

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Tilleggsoppgaver for STK1110 Høst 2015

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

STK juni 2016

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere

Løsningsforslag: STK2120-v15.

Dagens tekst. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

UNIVERSITETET I OSLO

TMA4240 Statistikk H2015

Seminaroppgave 10. (a) Definisjon: En estimator θ. = θ, der n er et endelig antall. observasjoner. Forventningsretthet for β: Xi X ) Z i.

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kap. 8: Utvalsfordelingar og databeskrivelse

NORMALFORDELINGER, KOVARIANSMATRISER OG ELLIPSOIDER

Utvalgsfordelinger (Kapittel 5)

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ST0202 Statistikk for samfunnsvitere

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag øving 8, ST1301

Ekstraoppgaver for STK2120

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Gammafordelingen og χ 2 -fordelingen

UNIVERSITETET I OSLO

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

FORMELSAMLING TIL STK1100 OG STK1110

TMA4245 Statistikk Eksamen desember 2016

Forslag til endringar

TMA4240 Statistikk Eksamen desember 2015

7.2 Sammenligning av to forventinger

Oppgave 1: Feil på mobiltelefoner

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk H2017 [15]

STK Oppsummering

ST0202 Statistikk for samfunnsvitere

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

EKSTRAOPPGAVER I STK1110 H2017

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Eksamensoppgave i TMA4295 Statistisk inferens

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk H2010

Introduksjon til Generaliserte Lineære Modeller (GLM)

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

TMA4240 Statistikk Høst 2015

Foreleses onsdag 13.oktober, 2010

Hypotesetest: generell fremgangsmåte

Øving 12, ST1301 A: B:

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Forelesning 6 STK3100

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4240 Statistikk Høst 2007

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Notat 3 - ST februar 2005

Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1

UNIVERSITETET I OSLO

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Oppsummering av STK2120. Geir Storvik

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Notasjon. Løsninger. Problem. Kapittel 7

UNIVERSITETET I OSLO

TMA4240 Statistikk H2015

Kapittel 3: Studieopplegg

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2015

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Par-copula konstruksjoner: Et fleksibelt verktøy for å modellere multivariat avhengighet

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i TMA4240 Statistikk

Fasit for tilleggsoppgaver

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Gauss-Jordan eliminasjon; redusert echelonform. Forelesning, TMA4110 Fredag 18/9. Reduserte echelonmatriser. Reduserte echelonmatriser (forts.

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk H2010

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Kontinuerlige sannsynlighetsfordelinger.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Kort overblikk over kurset sålangt

Transkript:

! * 2 2 2 Bevis : Anta Forelesning 4 STK3 september 27 S O Samuelsen Plan for annen forelesning: Likelihood-egenskaper 2 Konsistens for ML 3 Tilnærmet fordeling for ML 4 Likelihoodbaserte tester 5 Multivariat normalfordeling Da er selvfølgelig mhp integrasjon mhp dvs! Så når ombytte av derivasjon er lovlig fås!! Men scorefunksjonen basert på er nettopp! &! & vi har altså vist resultatet for skalar Forelesning 4 STK3 p/29 Forelesning 4 STK3 p3/2 Likelihoodegenskaper Anta at Da gjelder l-likelihood Score-funksjon er en regulær likelihood La videre Observert informasjon Forventet Fisher) informasjon Reglene gjelder så for vektorer for skalare, men vi skal bare vise dem Forelesning 4 STK3 p2/29 At forventning for score er lik holder mer generelt: Anta at ),- ller vi kan anta at altså er uavhengige, / Dermed har vi like fullt,! 3 43 43 2 Da er fortsatt! har simultantetthet! 3 43 så for ikke-identiske tilmed avhengige variable - såsant ombytte derivasjon integrasjon er lov 43 Forelesning 4 STK3 p4/2

ksponensiell klasse med spredningsparameter) Da er &! & Anta fås Og siden hvilket ble bevist ved momentgenerende funksjoner sist Det samme ble som så følger av Forelesning 4 STK3 p7/2 Merk: er en funksjon av den ukjente parameteren n likelihood : Våre data er generert av en spesiell parameterverdi Likelihood-egenskapene vi har utledet gjelder bare for denne sanne verdien vi har mer presist at vil, feks, typisk For andre verdier av! Forelesning 4 STK3 p8/2 iansen til scoren er lik forventet informasjon: følger av!! & samt eller ekv Dette gir! Forelesning 4 STK3 p5/29 iansen til scoren = forventet informasjon, forts: altså får vi Men siden av potensielt ikke-identiske Her utvides resultatet til vektorer 43 2 på med avhengige komponenter ved å bytte ut samme måte som for Forelesning 4 STK3 p6/29

Regulære ML er konsistente Anta at er identiske uavhengig fordelte uif) Vi har da at score-funksjonen, uttrykt gjennom score-bidragene, ) *,- Ved store talls lov vil da punktvis) / ksempel: ksponensialfordeling Gjsn L-lik, n= l -2-5 - -5 u -5 5 5 5 2 theta Gjsn L-lik, n= Gjsn Score, n= 5 5 2 theta Gjsn Score, n= for en funksjon Tilsvarende vil Spesielt har vi at, - l -2-5 - -5 u -5 5 Forventet Simulert / 5 5 2 5 5 2 der funksjonen generelt vil ha maksimum i Forelesning 4 STK3 p9/29 theta theta Forelesning 4 STK3 p/2 Heuristisk argument for at ML er konsistent Siden for stor:,, med maksimum i vil så når, dvs vi har rimeligvis) at ML ksempel: Uavhengige eksponensialfordelte Da blir som har nullpunkt for er konsistent, dvs ) med forventning, med forventning, Forelesning 4 STK3 p/29 Regulære ML er tilnærmet normalfordelt Anta er uif med tetthet La forventet informasjon fra en forventet informasjon fra Vi skal vise heuristisk) at når er stor has Merk: ), ML dermed eller Her er sann parameterverdi I disse resultatene kan vi bytte ut informasjon ), med observert Forelesning 4 STK3 p2/2

Large sample fordeling ML så vi får Men dvs er tilnærmet lik en lineærtransformasjon av som er tilnærmet normalfordelt Derfor blir selv tilnærmet normal med varians lest som tilnærmet fordelt) Altså med Alternativt uttrykkes dette Forelesning 4 STK3 p5/2 ksempel: ksponensialfordeling Fra tidligere slide har vi score dermed ML Dessuten blir informasjon altså tilnærmet samt Forelesning 4 STK3 p6/2 ormaltilnærming for score, Vi har for scorebidrag, - / varians er uif med forventing Men Dermed gir sentralgrenseteormet -ene gjennomsnittet av der Forelesning 4 STK3 p3/29 ordens Taylorutvikling av gir omkring verdi glatt funksjon Restledd Dermed har vi så for passende der Restledd Restledd for passende der Restledd Vi skal bruke dette resultatet for scorefunksjonen rekkeutviklet i denne sanne parameterverdien : Restledd raskere enn for Restledd Forelesning 4 STK3 p4/29

Simulering av eksponensialfordeling Histram Score, n= 5 5 2 25 5 5 2 - -5 5 u Histram Score, n= 5 5 2 5 5 Histram ML, n= 5 5 2 25 3 ML Histram ML, n= Kommentarer Wald- Scoretest For begge testene kan vi erstatte forventet informasjon med observert informasjon 2 Merk at både under nullhypotesen får en tilnærmet fordeling 3 Testene er asymptotisk ekvivalente, dvs de vil gi samme resultat ettersom datamengden øker, men i praksis vil gjerne Score-tester fungere noe bedre enn Wald-tester 4 Wald-tester kan avhenge av parametrisering, feks om vi ser på eller Score-testene blir de samme uavhengig av parametrisering -3-2 - 2 3 u 8 2 4 ML Forelesning 4 STK3 p7/29 Forelesning 4 STK3 p9/2 To likelihood-baserte tester Vi kan nå teste en nullhypotese H, både basert på Likelihood-ratio test LRT) Som et tredje alternativ kan vi teste under H ved likelihood-ratio test ved å se på forholdet mellom likelihood apriori under hypotesen eller ekvivalent Wald-testen benytter test-størrelse, der standardfeil for, under H Vi kan imidlertid så bruke Score-testen basert på er der has tilnærmet ), / Under under H dvs kjikvadratfordelt med en frihetsgrad, tilsvarende Wald- Score-testene Vi skal vise dette under H Forelesning 4 STK3 p8/29 Faktisk er så LR-testen asymptotisk ekvivalent med Wald- Scoretest Forelesning 4 STK3 p2/2

Momenter i multivariat normalfordeling - Spesielt blir / som har Dermed blir forventningen i den -dimensjonal normalfordelingen Dessuten blir variansen til - / kovariansen mellom - Cov / Forelesning 4 STK3 p23/2 Kovariansmatrise til stokastisk vektor defineres ved Cov med / Cov skriver vi Spesielt for multivariat normalfordelt ved fra Vi kan dessuten uttrykke verifiser!) Forelesning 4 STK3 p24/2 Taylor-utvikling av LRT-observator til: Vi 2ordens Taylor-utvikler her om Restledd Restledd Men tilnærmet er siden Dermed siden vi har tilnærmet Forelesning 4 STK3 p2/29 Multivariat normalfordeling Vi definerer at en -dimensjonal vektor er multivariat normalfordelt dersom vi kan skrive er en vektor av uavhengige,) en vilkårlig -dimensjonal vektor, der variable av tall / Forelesning 4 STK3 p22/29 er en ikke-singulær matrise

! Tetthet for multivariat normalfordeling, forts har gitt ved Videre er kovariansmatrisen til determinant samt invers brukt ved at identitetsmatrisen / Siste likhet følger av generelle matriseregel ) / / gir dette 43 Jac 43 Innsatt i 43 43 43 43 43 siden Forelesning 4 STK3 p27/2 Spesialtilfeller er på denne Univariat normaltetthet formen med 2 Bivariat normaltetthet! & & & & ) 43 43 med Forelesning 4 STK3 p28/2 Multivariat transformasjonssetning Fra Rice STK, s 2-3) has at hvis har multivariat tetthet invers funksjon) / med Jacobi-matrise Jac tetthet så har 43 Jac 43 43 43 er determinanten til Jac 43 Jac der Forelesning 4 STK3 p25/29 Tetthet for multivariat normalfordeling gis da ved 43 3 43 blir gitt fra Bevis: Den inverse transformasjonen har Jacobi-matrise har uavhengige tetthet Her vet vi dessuten at,) fordelte komponenter, altså har / Forelesning 4 STK3 p26/29

3 ksponentens fordeling For multivariate normalfordelinger er eksponenten et 2 gradspolynom i på ellipsoider i det -dimensjonale rom 43 43 43 konstant Dessuten får vi at eksponenten innsatt stokastisk blir - / altså kjikvadratfordelt med uavhengige frihetsgrader siden,) Forelesning 4 STK3 p29/29