Forelesning 25 og 26 Introduksjon til Bayesiansk statistikk

Like dokumenter
Forelesning 19 og 20 Regresjon og korrelasjons (II)

1. Konfidens intervall for

STK1100 våren Konfidensintevaller

Forelesning 21 og 22 Goodness of fit test and contingency table ( 2 test og krysstabell)

Forelesning Ordnings observatorer

Forelesning Enveis ANOVA

STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon

Forelesning Punktestimering

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

Econ 2130 uke 15 (HG)

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk

Oversikt over tester i Econ 2130

TMA4245 Statistikk Eksamen august 2014

Løsningsforslag Eksamen i Statistikk Nov 2001 Oppgave 1 a) Det fins 8 mulige kombinasjoner. Disse finnes ved å utelate ett og ett tall.

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Estimering. Målemodellen. Kp. 5 Estimering. Målemodellen.

Formler og regler i statistikk ifølge lærebok Gunnar Løvås: Statistikk for universiteter og høgskoler

TMA4245 Statistikk Eksamen mai 2016

Seminaroppgaver for uke 13

Oppgave 1 Det er oppgitt i oppgaveteksten at estimatoren er forventningsrett, så vi vet allerede at E(ˆµ) = µ. Variansen til ˆµ er 2 2 ( )

Seminaroppgaver for uke 13 (Oppgave (1), (2), og (3))

Det ble orientert i plenum under eksamensdagen om følgende endringer i forhold til oppgaven:

Om enkel lineær regresjon II

Regler om normalfordelingen

Om enkel lineær regresjon II

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

Oversikt over tester i Econ 2130

Om enkel lineær regresjon II

TMA4245 Statistikk Eksamen 21. mai 2013

Løsningskisse seminaroppgaver uke 17 ( april)

Notat 1: Grunnleggende statistikk og introduksjon til økonometri

Analyse av sammenhenger

Regler om normalfordelingen

Regler om normalfordelingen

Oversikt over konfidensintervall i Econ 2130

Statistikk med anvendelse i økonomi

Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oversikt over tester i Econ 2130

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

(ii) Anta vi vet om en observasjon av X at den ikke er større enn 5. Hva er da sannsynligheten for at den er lik 5? (Hint: Finn PX ( = 5 X 5) ).

Mer om Hypotesetesting (kap 5) Student t-fordelingen. Eksamen. Fordelingene blir like ved stor n:

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT. Innleveringssted: Ekspedisjonen i 12. etasje (mellom ) OG Fronter (innen klokken 15).

Eksempel 1 - Er gjennomsnittshøyden for kvinner i Norge økende?

EKSAMEN løsningsforslag

TMA4240/4245 Statistikk Eksamen august 2016

Introduksjon til økonometri, kap 8, 9.1 og 9.2. Hva er formålet med økonometri? Utvalgskorrelasjoner To-variabel regresjoner

Oversikt 1. forelesning. ECON240 Statistikk og økonometri. Visuell/grafisk presentasjon av data. Datainnsamling; utdanning og inntekt

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Makroøkonomi - B1. Innledning. Begrep. B. Makroøkonomi. Mundells trilemma går ut på følgende:

Enveis variansanalyse (One-way ANOVA, fixed effects model) (Notat til Kap. 12 i Rosner)

Forelesning 3 mandag den 25. august

Gråtonehistogrammer. Histogrammer. Hvordan endre kontrasten i et bilde?

Econ 2130 uke 13 (HG)

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

Medisinsk statistikk, del II, vår 2008 KLMED Lineær regresjon, Rosner Regresjon?

Medisinsk statistikk, del II, vår 2009 KLMED 8005

Kapittel 1: Beskrivende statistikk

X ijk = µ+α i +β j +γ ij +ǫ ijk ; k = 1,2; j = 1,2,3; i = 1,2,3; i=1 γ ij = 3. i=1 α i = 3. j=1 β j = 3. j=1 γ ij = 0.

Appendiks 1: Organisering av Riksdagsdata i SPSS. Sannerstedt- og Sjölins data er klargjort for logitanalyse i SPSS filen på følgende måte:

TMA4265 Stokastiske prosesser

Oppgaver. Multiple regresjon. Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

FORELESNINGSNOTATER I SPILLTEORI Geir B. Asheim, våren 2001 (oppdatert ).

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Seleksjon og uttak av alderspensjon fra Folketrygden

Forelesning Z-, t-test, test for forventningsdifferanser

Oppgave 1 ECON 2130 EKSAMEN 2011 VÅR

Om enkel lineær regresjon I

Kapittel 1: Beskrivende statistikk

Anvendelser. Kapittel 12. Minste kvadraters metode

Hvordan får man data og modell til å passe sammen?

Statistikk og økonomi, våren 2017

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

TMA4265 Stokastiske prosesser

Om enkel lineær regresjon I

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Chapter 2 - Discrete Mathematics and Its Applications. Løsningsforslag på utvalgte oppgaver

Estimering 1 -Punktestimering

ECON240 Statistikk og økonometri

ØVINGER 2017 Løsninger til oppgaver

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

TMA4300 Mod. stat. metoder

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Estimering 1 -Punktestimering

Kapittel 8: Estimering

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

STK1100 våren 2017 Estimering

Forelesning 2 MET3592 Økonometri ved David Kreiberg Vår 2011

Transkript:

Yushu.@hh.o Forelesg 5 og 6 Itroduksjo tl Bayesask statstkk 1. Itroduksjo Fortsatt atar v har stokastsk varabel X (X ka være stokastsk varabel vektor) kommer fra e fordelg med parametere ( ka være parameter vektor). I klasssk frekves statstkk, v atar alltd at parametere er determstske kostat. For eksempel, klasssk statstkk feres, parametere er ukjete kostat og v utvkler vdere feres for de ukjete determstske parametere etter v har fått observasjoee ( x1, x,..., x ) fra X: estmerg, CI, hypotese testg. I Bayesask statstkk, atar v at parametere er også stokastske varabler og agr fordelg tl parametere først, basert på førkuskap om parametere. V samler observasjoee ( x1, x,..., x ) etterpå og oppdaterer parameters fordelgee etter v har samlet data. et fes tre hoved tr år v gjeomføre Bayesask statstkk: (1) Pror fordelg for : først agr ma e pror-fordelg «pror dstrbuto» g( ) for parametere før data er samlet. g( ) skal beskrve og oppsummere førkuskap om parameterverdee : v velger g( ) utfra egeskapee tl parametere, basert på formasjo v har allerede hatt. f.eks. Hvs er dskrete, ka v bruker e dskrete fordelg g( ); hvs ka ta verder over hele tallje, ka v bruker e kotuelg fordelg g( ); hvs lgger tervallet 0-1, ka v sette g( ) U(0,1). () Fordelg for X: v samler data ( x1, x,..., x ) med fordelg fuksjo f( x ). Etter v har fått, ka v skrve ed lkelhood fuksjo f f x1 x x ( ) (,,..., ) (3) Posteror fordelg for : fra pror-fordelg g( ) og lkelhood fuksjo f( ), ka ma oppdatere fordelg tl og få posteror-fordelg «posteror dstrbuto» om : f ( ) g( ) h( ), med margalfordelge: f ( ) f ( ) g( ) d, ( x1, x,..., x ). a ka h( ) oppsummere all formasjo om parametere: formasjo fra førkuskap av (pror fordelg) + formasjo lgger observasjo (lkelhood fuksjo)

Yushu.@hh.o *a. Bayesask statstkk brukes ofte år pror formasjo for parameter er tlgjegelg, og formasjoe ka oppdateres etter ye observasjoer eller ekspermeter: har v hådtert ett datasett, bruker v det som førkuskap og v ka hådtere est y dataset for å oppdatere fordelge tl parametere. et betyr at posteror fordelg h( ) ka bl pror fordelg g( ) for este ekspermet: I dags posteror er morges pror. f ( ) g( ) b. et ka være vaskelg å fe e aalytsk form for h( ), me umersk metoder eller smulerg metoder slk som MCMC (Markov cha Mote Carlo) ka avedes.. Bayesask statstkk eksempler.1) skrete fordelg Eks 1. u har 4 vsuelt detske myter lomme - 3 er jeve med 50% sjase å få kroe kast, og 1 er speselle myt som kke er jeve med 70% sjase å få kroe kast. a. u kommer lomme og tlfeldg velge e myt og kaste de. Ata at du få kroe. Hva er sasylghete for at myte er de speselle myte? b. Etter ekspermet a. gjør v et ytt ekspermet: v tar de samme myte fra a. og kaste de 3 gager, og hver kaste resultert kroe. Nå hva er sasylghete for at myte er de speselle kvartal?.) Kotuerlg fordelg Eks. ( x1, x,..., x ) er observasjoer som tlsvarer uavhegge S.V ( 1,... ) (, ) X X N. Basert på tdlgere formasjo, er pror-fordelg for forvetg gtt som N(, ). F posteror-fordelg h( ) etter v har fått observasjoee. øsg: (1) Pror fordelg: 1 ( ) N(, ) g( ) exp

Yushu.@hh.o () kelhood fuksjo år v har fått observasjo ( x1, x,..., x ) fra uavhegge S.V ( X 1,... X ) N(, ) : f ( ) f ( x, x,..., x ) f ( x ) 1 1 1 1 / / 1 = exp ( ) ( ) ( ) exp ( ) x x 1 1 (3) Posteror-fordelg: f ( ) g( ) h( ), ( x1, x,..., x ), I dette tlfelle er margalfordelg f( ) rrelevat med, ford f( ) er bare e ormalsergskostat og ka goreres. V bruker symbelet slk at høyre sde av er ormalserg fra vestre sde av, f.esk., A B betyr at A costat* B. a: f ( ) g( ) h( ) f ( ) g( ) / / 1 1 ( ) ( ) ( ) exp ( x ) * exp 1 x 1 exp{ ( ) ( )} x / 1 N( x1... x, ); x 1 1 1 1 / / a x / 1 1 /, 1 1 1 / ormal fordelg også: N(, ), får v at poteror fordelg er faktsk Eks 3. V atar at forvetg tl høyder av jeter aldere 18 er ormal fordelt som g ( ) ~ N(165, ). 10 jeter aldere 18 hadde høyder blr målt som ( cm): 169.6,166.8,157.1,181.1,158.4,165.6,166.7,156.5,168.1,165.3 V atar at varas tl høyder er 50 cm og fe de oppdaterte fordelge tl forvetg for høyder av jeter aldere 18.

Yushu.@hh.o Fgure 1: Fordelger tl pror, lkelhood og posteror 3. Statstsk feres for Bayesask statstkk Alle statstsk fereser for ka bl gjeomført basert på posteror-fordelg h( ) 3.1.Pukt estmerg I klasssk frekves statstkk, de ukjete parametere er fast kostat, og ka estmeres ved bruk av estmator (f.eks. Momet estmator, ME). I Bayesask statstkk, Pukt estmator for ka bygges på posteror-fordelg h( ), eks, pukt estmator for ka være forvetg av posteror-fordelg ˆ E( ) h( ) d *meda eller mode av posteror-fordelg ka bl alteratve estmator. 3. 100(1 ) % troverdghetstervall (credblty terval) for V deferer tervallet [, ] er 100(1 ) % troverdghetstervall (credblty terval) U for slk som P ( ) U U h( ) d 1. Et 100(1 ) % troverdghetstervall for er et tervall der v med sasylghet 1 tror at θ befer seg etter at dataee er samlet. 100(1 ) % troverdghetstervall tlsvare tl 100(1 ) % kofdestervall frekvetsk statstkk. Me v tolker 100(1 ) % kofdestervall frekvetsk statstkk som: hvs v utgjører ekspermet 100 gager, (1 ) gager vl tervallet dekke de ukjete determstsk.

Yushu.@hh.o 3.3. Statstsk hypotesetestg V ka utføre statstsk hypotesetestg ved bruk av troverdghetstervall f.esk., H0: 0 mot 0 og [, U] er et 1 troverdghetstervall for. forkast H 0 dersom 0 [, U] Eks 4. Studet Ole fra skole W bygger e statstsk modell for has score på stadard IQ-tester. Ha meer at, geerelt, er has score ormalfordelt med ukjet forvetg og varase 80. Pror formasjo (fesk. Kuskap fra ekspert) meer at IQ av studeter skole W, er ormal fordelt med forvetg 110 og varas 10. Ole tok to IQ-tester og scoret 98 de første og 104 de adre. a. Hva er de bayesaske estmat av Oles IQ frekvetsk statstkk b. Hva er de bayesaske estmat av Oles IQ? c. Fe 95% kofdestervall for Oles IQ d. Fe 95% troverdghetstervall for Oles IQ. 4. Numersk metode Bayesask statstkk I mage tlfeller er margalfordelg f( ) kke ormalsergskostat og det fes kke e aalytsk form for f ( ) g( ) h( ) : det ka bl vaskelg for å få tegrasjo f ( ) f ( ) g( ) d. V ka derfor bruke umersk eller smulerg metoder for å få fordelg h( ), f.eks, Markov Cha Mote Carlo (MCMC) a. E Markov-kjede er e tdssere der verde å ku avhege av forrge verd. Ekelte tdsserer stablserer seg slk at de har e fordelg som kke foradrer seg over td, de såkalte stasjoærfordelge (Etter de blå lje Fgure ). b. et er mulg å lage e tdssere som er slk at de stasjoære fordelge er lk de fordelge du er ute etter selv, f.eks, h( ). ette kalles MCMC Fgure : MCMC smulerg ka føre tl e stasjoær fordelg (etter blår lje)