Econ 2130 uke 15 (HG)

Like dokumenter
Oversikt over tester i Econ 2130

Oversikt over konfidensintervall i Econ 2130

Regler om normalfordelingen

Oversikt over tester i Econ 2130

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

Regler om normalfordelingen

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

Regler om normalfordelingen

Om enkel lineær regresjon II

Løsningsforslag Eksamen i Statistikk Nov 2001 Oppgave 1 a) Det fins 8 mulige kombinasjoner. Disse finnes ved å utelate ett og ett tall.

Oversikt over tester i Econ 2130

Løsningskisse seminaroppgaver uke 17 ( april)

Om enkel lineær regresjon II

STK1100 våren Konfidensintevaller

Om enkel lineær regresjon II

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

1. Konfidens intervall for

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen mai 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk

STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon

Eksempel 1 - Er gjennomsnittshøyden for kvinner i Norge økende?

Seminaroppgaver for uke 13

Seminaroppgaver for uke 13 (Oppgave (1), (2), og (3))

Forelesning 25 og 26 Introduksjon til Bayesiansk statistikk

TMA4240 Statistikk Høst 2016

Oppgave 1 Det er oppgitt i oppgaveteksten at estimatoren er forventningsrett, så vi vet allerede at E(ˆµ) = µ. Variansen til ˆµ er 2 2 ( )

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Estimering. Målemodellen. Kp. 5 Estimering. Målemodellen.

Forelesning 19 og 20 Regresjon og korrelasjons (II)

Det ble orientert i plenum under eksamensdagen om følgende endringer i forhold til oppgaven:

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

Notat 1: Grunnleggende statistikk og introduksjon til økonometri

Analyse av sammenhenger

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Statistikk med anvendelse i økonomi

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

Formler og regler i statistikk ifølge lærebok Gunnar Løvås: Statistikk for universiteter og høgskoler

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

Forelesning Punktestimering

TMA4245 Statistikk Eksamen 21. mai 2013

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL

Forelesning Ordnings observatorer

EKSAMEN løsningsforslag

Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

Forelesning Enveis ANOVA

Forelesning 21 og 22 Goodness of fit test and contingency table ( 2 test og krysstabell)

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

Econ 2130 uke 13 (HG)

Forelesning 3 mandag den 25. august

Mer om Hypotesetesting (kap 5) Student t-fordelingen. Eksamen. Fordelingene blir like ved stor n:

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Oversikt over konfidensintervall i Econ 2130

(ii) Anta vi vet om en observasjon av X at den ikke er større enn 5. Hva er da sannsynligheten for at den er lik 5? (Hint: Finn PX ( = 5 X 5) ).

Oversikt over konfidensintervall i Econ 2130

Econ 2130 Forelesning uke 11 (HG)

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Oppgave 1 ECON 2130 EKSAMEN 2011 VÅR

Estimering 2. -Konfidensintervall

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT. Innleveringssted: Ekspedisjonen i 12. etasje (mellom ) OG Fronter (innen klokken 15).

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oversikt over konfidensintervall i Econ 2130

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Kapittel 8: Estimering

Om enkel lineær regresjon I

Om enkel lineær regresjon I

Kap. 9: Inferens om én populasjon

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

X ijk = µ+α i +β j +γ ij +ǫ ijk ; k = 1,2; j = 1,2,3; i = 1,2,3; i=1 γ ij = 3. i=1 α i = 3. j=1 β j = 3. j=1 γ ij = 0.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Makroøkonomi - B1. Innledning. Begrep. B. Makroøkonomi. Mundells trilemma går ut på følgende:

Oversikt 1. forelesning. ECON240 Statistikk og økonometri. Visuell/grafisk presentasjon av data. Datainnsamling; utdanning og inntekt

Forelesning Z-, t-test, test for forventningsdifferanser

TMA4245 Statistikk Eksamen mai 2017

Positive rekker. Forelest: 3. Sept, 2004

Mer om utvalgsundersøkelser

MOT310 Statistiske metoder 1, høsten 2011

Statistikk og økonomi, våren 2017

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oppgaver fra boka: X 2 X n 1

Randi Johannessen. Mikroindeksformel i konsumprisindeksen. 2001/64 Notater 2001

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Løsningskisse for oppgaver til uke 15 ( april)

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

TMA4300 Mod. stat. metoder

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Estimering 1 -Punktestimering

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Estimering 1 -Punktestimering

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

FORELESNINGSNOTATER I SPILLTEORI Geir B. Asheim, våren 2001 (oppdatert ).

Kapittel 1: Beskrivende statistikk

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

ECON240 Statistikk og økonometri

TMA4240 Statistikk Høst 2016

Transkript:

Eco 130 uke 15 (HG) Kofdestervall Løvås: 6.1., 6.3.1 3. (Avstt 6.3.4 6 leses på ege håd. Se også overskt over kofdestercvall ekstra otat på ettet.) 1

Defsjo av kofdestervall La θ være e ukjet parameter e statstsk modell med stokastske varable X1, X, (som geererer data x1, x, ) Et kofdestervall for θ, [ AB, ], med kofdesgrad 1, er et tervall der gresee A og B er erverbare stokastske varable som oppfyller PA ( θ B) = 1 (oe gager 1 ) (uasett hvlke verd de ukjete θ har), og der kofdesgrade, 1, er et tall subjektvt valgt av forskere F.eks. et 95% kofdestervall for θ betyr at kofdesgrade er 1 = 0.95 og = 0.05 Valge valg av kofdesgrad: (100% kofdes leder tl ubrukelge store tervall!) Kofdesgrad 1 0.90 (90%) 0.95 (95%) 0.99 (99%) 0.10 0.05 0.01

Kofdestervall (KI) for ud-modelle (stuasjo I) µ Stuasjo I: X, X,, X uavhegge og detsk ormalfordelte, X ~ N( µ, ), 1 der µ er ukjet og er kjet. Atall ervasjoer,, er vlkårlg. Eksempel 6.9 Løvås: E lettvt me uøyaktg metode å måle kroppstemperatur på, er å måle øret. La X represetere resultatet av e slk målg på e gtt paset. V atar X ~ N( µ, ), der = 0.5 C ases som kjet fra tdlgere udersøkelser. DATA: V har = 8 gjetatte og uavhegge målger på samme paset: 39.1, 38.8, 39.9, 38.9, 38.8, 38.7, 39.0, 38.5 MODELL (for data): X1, X,, X ud og ormalfordelte, X ~ N ( µ, ), med = 8 og = 0.5 kjet. OPPGAVE: Kostruer og bereg et 95% KI for µ (de sae kroppstemperature). Hva er uskkerhete ved estmerg av µ? 3

Kostruksjo av Z-tervall (stuasjo I): FL uke 1 s. 8 X ˆ 1, X,, X ud og ormalfordelte, X ~ N( µ, ) µ = X ~ N( E( X ), SD( X )) = N µ, X E( X) ˆ µ µ ˆ µ µ Z = = = ~ N(0, 1) SD( X ) Valgt kofdesgrad: 1 z = -kvatle N(0,1). Dvs. PZ ( > z ) = Utledg: ˆ µ µ 1 = P( z Z z ) = P z z = P z ˆ µ µ z = = P ˆ µ z µ ˆ µ + z P ˆ z ˆ z = µ + µ µ = = P ˆ µ z µ ˆ µ + z = P ( A µ B) = 1 Et 1 KI for µ stuasjo I er ˆ µ ± z (kalt " Z-tervall") der z er et uttrykk for uskkerhete tl ˆ µ. Uskkerhete avtar hvs atall ervasjoer,, øker, me øker hvs øke r. 4

Sde SE( ˆ µ ) = SD( ˆ µ ) =, ka v skrve formele for kofdestervallet for µ : 1 KI for µ : ˆ µ ± z ˆ ˆ = µ ± z SE( µ ) I eksemplet, = 8, = 0.5 SE( ˆ µ ) = 0.5 8 = 0.1768 og estmatet: ˆ µ = X = 38.96 95% kofdesgrad = 0.05 og z = z = 1.960 (tabell E.4 (D.4)) 0.05 [ ] Observert KI: ˆ µ ± z ˆ ˆ ˆ SE( µ ) = µ ± z SE( µ ) = 38.96 ± (1.96)(0.1768) = 38.61, 39.31 Estmergsuskkerhete varerer med de subjektvt valgte kofdesgrade. Kofdesgrad 1 z SE ( ˆ µ ) Uskkerhet SE( ˆ ) ˆ ± z µ 1 KI µ z SE( ˆ µ ) Legde Valgt 0.90 0.10 0.05 1.645 0.1768 0.9 [38.67, 39.5] 0.58 0.95 0.05 0.05 1.960 0.1768 0.35 [38.61, 39.31] 0.70 0.99 0.01 0.005.576 0.1768 0.46 [38.50, 39.4] 0.9 5

Ae problemstllg: Kofdestervall brukes av og tl som hjelp tl plaleggg av e udersøkelse - dvs. ved valg av utvalgsstørrelse (). I eksemplet: Hvor mage ervasjoer tregs for at uskkerhete tl skal bl ca. ± 0.1 C (dvs. der tervallets legde = 0.)? ˆµ Dvs. bestem slk at z0.05 0.5 = (1.96) = 0.1 (0.5) = (1.96) = [ 5 (1.96)] = 96.04 dvs = 96 0. 1 V fat: = 8 gr e uskkerhet (kofdesgrad 95%) på ± z ˆ 0.05 SE( µ ) =± 0.35 C Merk at v fat e eksakt løsg her sde var kjet lk 0.5. Hvs er ukjet, vl løsge avhege av e mer eller mdre foruftg gjetg på. 6

(Frekvetstsk) tolkg av kofdesgrade - f.eks. 95% Merk at det er OK å s (A) P ˆ µ z µ ˆ µ + z P 0.05 0.05 = ( A µ B) = 0.95 me det er forbudt (selvmotsgede) å s (Tllatt) (B) P (38.61 µ 39.31) = 0.95 (Forbudt) Dette skyldes at tervallet (A) er et stokastsk tervall (som represeterer de statstske metode brukt) og sasylghete (0.95) for at tervallet skal dekke de ukjete µ er bestemt på forhåd før data er kjet. Itervallet (B) er et kokret ekelt ervert tervall som resulterte tre gtte tall, 38.6, µ og 39.31, og utsaget 38.61 µ 39.31 ka kke ha oe ae sasylghet e 0 eller 1. Sasylghete er 0 hvs utsaget er galt og lk 1 hvs utsaget er sat. Adre mulgheter fs kke (dvs. frekvetstsk sasylghetsteor som represeterer skole brukt dette kurset). 7

I de frekvetstske tradsjoe bruker ma å erstatte sasylghetsutsaget (B), med adre formulerger som f.eks. V har e kofdes på 95% for at 38.61 µ 39.31 eller V er 95% skre på at 38.61 µ 39.31. eller - rett og slett - vse tl at tervallet har kofdesgrad 95%. er sat. Kofdese kommer fra at v teker oss det erverte tervallet, [38.61, 39.31], som ett av e sere tervaller oppådd ved å gjeta ekspermetet mage gager (hver gag med 8 ye ervasjoer) uder samme betgelser. Om dee (tekte) sere av tervaller vet v at ca. 95% av dem dekker de ukjete µ. 8

Kofdestervall (KI) for µ ud-modelle (stuasjo II) Stuasjo I er sjelde sde valgvs er ukjet. V ka lkevel beytte Z-tervallet for stuasjo I som KI for µ (selv om er ukjet) der erstattes med estmatore ˆ = S x, hvs er stor (tommelfgerregel 30 ) (følger av vderegåede sasylghetsteor) Stuasjo II X, X,, X ud der X har e vlkårlg (ukjet) fordelg f( x), 1 der både µ og er ukjete. Atall ervasjoer,, er st o r ( 30). Eksempel. Megde av Col-bakterer va er av og tl brukt som e dkator på foruresg. Atall col-bakterer er regstrert = 30 vaprøver tlfeldg trukket fra e elv DATA: x1, x,, x30 9 13 9 8 7 11 9 13 8 9 7 8 5 9 8 5 8 8 8 7 8 9 5 6 5 7 7 7 13 8 x = 8.13 ( = ˆ µ ) s = Σ( x x) x 1 1 =.1613 ( = ˆ ) Desty 0.1..3 Hstogram for atall colbakterer pr. vaprøve (med best tlpasset ormalfordelgstetthet, N(gj.stt(x), sd(x)) ) 4 6 8 10 1 14 x 9

Kostruksjo av Z-tervall for µ (stuasjo II): X, X,, X ud og vlkårlg med E( X ), var( X ) 1 FL uke 1 s. 9 setralgreseteoremet fordelte = µ = tlærmet ˆ µ = X ~ N( E( X ), SD( X )) = N µ, X E( X) ˆ µ µ = = SD( X ) ˆ µ µ tlærmet samme fordelg som ~ Z ~ N( 0, 1) ( 0) Vderegåede teor vser at sste utsag kke edres vesetlg om de ukjete 1 byttes ut med estmatore ˆ = S = Σ( X X) for stor ( 30 ca.) (ka vses) Dermed: x 1 ˆ µ µ har tlærmet samme fordelg s om Z ~ N(0, 1) ( 30) ˆ ˆ µ µ 1 = P( z Z z ) P z z ˆ ˆ som sde 4 = P ˆ µ z µ ˆ µ + z = ˆ Et KI med kofdesgrad tlærmet for µ er ˆ ˆ µ ± z ˆ ˆ = µ ± z SE( µ ) (Der SE å betyr estmert stadardfel). 1 10

ˆ Tlærmet 100(1 )% kof. tervall for µ stuasjo II - formel: ˆ µ ± z ˆ ˆ = µ ± z SE( µ ) ˆ ˆ P ˆ µ z ˆ µ µ + z 1 I colbaktere-eksemplet: = 30, ˆ µ = x = 8.13, ˆ = s =.1613 x Kofdesgrad 95% 1 = 0.95 / = 0.05 z = z = 1.96 ˆ.1613 Stadardfel: SE( ˆ µ ) = = = 0.3946... 30 0.05 0.05 Uskkerhet (95% kofdes): z SE ( ˆ µ ) = (1.96)(0.3946..) = 0.7734.. Tlærmet 95% kofdestervall for µ ˆ µ ± z ˆ SE( µ ) = 8.13 ± 0.77 = [7.36, 8.91] 11

Bestemmelse av utvalgsstørrelse () stuasjo II (ukjet ). 1 KI for µ (tlærmet): ˆ µ ± z Uskkerhet ( ): z ± Øsket uskkerhet (c): ˆ = ˆ estmerer z Bestem slk at ( z ) c Treger e (a pror) gjetg på Ofte brukt fremgagsmåte: Estmer z = c = z for å bestemme (omtretlg). fra e lte forudersøkelse (plotudersøkelse) c I Col-eksemplet: Ata utvalget på 30 vaprøver var e plotudersøkelse. V øsker å estmere med uskkerhet c = 0.. µ Kofdesgrad 95% z = 1.96 Aslag på fra plotudersøkelse: ˆ = (.16...) Dermed aslag på : = ( ) 1.96 (.16..) = 448.6... 4 49 0. 1

Kofdestervall (KI) for µ ud-modelle (stuasjo III) Stuasjo III: X, X,, X uavhegge og detsk ormalfordelte, X ~ N( µ, ), 1 der både µ og er ukjete. Atall ervasjoer,, er vlkårlg. Dee stuasjoe leder tl et såkalt T-tervall som er et raffemet av Z-tervallet med eksakt kofdesgrad selv for små hvs v ka ata at ervasjoee kommer fra e ormalfordelg. T-tervallet bygger på et klasssk teorem (utvklet av W.S. Gosset begyelse på 1900-tallet og publsert uder psevdoymet Studet ): Teorem. Jfr. Løvås avstt 6.3.3. Uder forutsetgee stuasjo III (med ormalfordelte ervasjoer), har X µ ˆ µ µ T = = eksakt e fordelg som heter t-fordelg (eller studet S S fordelg ) med 1 frhetsgrader, (skrevet kort: T~ t ( 1) (Om t-fordelge se este sde) 1 S = ˆ = ( X X) 1 = 1 13

Ltt om(studet) t-fordelge T-fordelge med r frhetsgrader ( tr ( )) lger på N(0,1)-fordelge. De er klokkeformet og symmetrsk om y-akse. Dessute ærmer de seg N(0,1) år r øker. For r 9 (ca.) er forskjelle eglsjerbar. (Matematsk formel avstt 5.9. kke pesum.) Z = X µ ~ N(0,1) T X µ = ~ t ( 1) S kvatle, t tr ( ), defert ved PT ( > t ) = (tabell E.5 (D.5)) Noe 0.05-kvatler r t-kvatl N(0,1) 3 3.18 1.96 7.365 1.96 9.045 1.96 14

Kostruksjo av T-tervall for µ (stuasjo III) X1, X,, X uavhegge og detsk ormalfordelte, X ~ N( µ, ), der både µ og er ukjete. Vlkårl g. X µ ˆ µ µ T= = ~ t ( 1) S ˆ Kofdesgrad 1, og PT ( > t ) = PT ( < t ) = S = ˆ ˆ µ µ ˆ ˆ 1 = P( t T t ) = P t t som sde 4 P ˆ µ t µ ˆ µ t = = + ˆ ( ˆ µ ( ˆ µ ) µ ˆ µ + t SE( ˆ µ ) ) = P t SE 1 kofdestevall for µ stuasjo III ( T-tervall med 1 frhetsgrader) ˆ ˆ µ ± t som gjelder for alle (kke defert for = 1). ˆ ˆ (Merk at ˆ µ ± t ˆ µ ± z ( Z-tervall) for 30.) 15

Kroppstemperatur-eksemplet. DATA: V har = 8 gjetatte og uavhegge målger på samme paset: 1 39.1, 38.8, 39.9, 38.9, 38.8, 38.7, 39.0, 38.5 x = 38.96 og s= Σ( x x) = 0.407 7 MODELL: X1, X,, X ud og ormalfordelte, X ~ N( µ, ), med = 8, µ og ukjete. [ ] Atakelse kjet lk 0.5 ga et 95% KI: 38.61, 39.31 95% KI å: Forutsetgee for T-tervall er oppfylt. tabell E.5(D.5) X µ T ~ t ( 1) t(7) t t0.05.365 S = = = = S 95% KI: ˆ 38. 96 (.365) 0.407 µ ± t = ± = 38.96 ± 0.35 = 38.61, 39.31 8 ( ) [ ] At dette tervallet ga samme verd som Z-tervallet, 38.96 (1.96) 0.5 ±, 8 skyldes e re tlfeldghet. Det kue lke gjere bltt større eller mdre avhegg av estmatet ˆ. 16

Merkader. Overskt over kofdestervall for adre parametre pesum er beskrevet et supplerede otat på ettet (se speselt regeeksempel 1 og avstt 3). Det gjelder p bomsk-, λ posso-, og M hypergeometrsk fordelg (Z-tervall basert på regel 5.0). Jeg rekker kke å ta dette på forelesgee, så det må leses på ege håd. Dsse tlfellee ka dukke opp oppgaver og tl eksame. Det samme gjelder også kj-kvadrat-tervall for og T-tervall for β, og µ ( x) = + βx regresjosmodelle. Behadlge av stuasjo II er særdeles ty Løvås. V går ltt mer detaljert fram her sde stuasjo II er mye brukt økoometr mer komplekse sammeheger, og økoomstudeter bør kjee ltt tl ratoale bak slk metodkk. (Mer Stat.) De fleste statstkk-pakker reger rutemessg ut T-tervaller for populasjosgjeomstt µ stedefor Z-tervall - uasett. Dette gjøres uasett om forutsetge om ormalfordelte ervasjoer er realstsk eller kke. Årsake er selvsagt at T-tervallet alltd er ltt større e det tlsvarede Z-tervallet slk at fele ma gjør om ormaltetsforutsetge er urealstsk ku fører tl at kofdesgrade øker ltt forhold tl de omelle ( 1 ) oe som kke er substaselt fel. V ser at T-tervallet er ltt mer koservatvt e det tlsvarede Z-tervallet. 17