Oversikt over konfidensintervall i Econ 2130

Like dokumenter
Econ 2130 uke 15 (HG)

Oversikt over tester i Econ 2130

Regler om normalfordelingen

Oversikt over tester i Econ 2130

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

Regler om normalfordelingen

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

Regler om normalfordelingen

Om enkel lineær regresjon II

Om enkel lineær regresjon II

Løsningskisse seminaroppgaver uke 17 ( april)

Om enkel lineær regresjon II

Oversikt over konfidensintervall i Econ 2130

Eksempel 1 - Er gjennomsnittshøyden for kvinner i Norge økende?

Oversikt over konfidensintervall i Econ 2130

Oversikt over tester i Econ 2130

1. Konfidens intervall for

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oversikt over konfidensintervall i Econ 2130

STK1100 våren Konfidensintevaller

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk

Seminaroppgaver for uke 13

Forelesning 19 og 20 Regresjon og korrelasjons (II)

TMA4245 Statistikk Eksamen mai 2016

Løsningsforslag Eksamen i Statistikk Nov 2001 Oppgave 1 a) Det fins 8 mulige kombinasjoner. Disse finnes ved å utelate ett og ett tall.

Seminaroppgaver for uke 13 (Oppgave (1), (2), og (3))

Det ble orientert i plenum under eksamensdagen om følgende endringer i forhold til oppgaven:

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Estimering. Målemodellen. Kp. 5 Estimering. Målemodellen.

TMA4245 Statistikk Eksamen august 2014

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Forelesning 25 og 26 Introduksjon til Bayesiansk statistikk

Analyse av sammenhenger

STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon

Notat 1: Grunnleggende statistikk og introduksjon til økonometri

TMA4245 Statistikk Eksamen 21. mai 2013

Statistikk med anvendelse i økonomi

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

Forelesning Punktestimering

Forelesning Ordnings observatorer

TMA4240 Statistikk Høst 2016

Forelesning 21 og 22 Goodness of fit test and contingency table ( 2 test og krysstabell)

Oppgave 1 Det er oppgitt i oppgaveteksten at estimatoren er forventningsrett, så vi vet allerede at E(ˆµ) = µ. Variansen til ˆµ er 2 2 ( )

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

Formler og regler i statistikk ifølge lærebok Gunnar Løvås: Statistikk for universiteter og høgskoler

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT. Innleveringssted: Ekspedisjonen i 12. etasje (mellom ) OG Fronter (innen klokken 15).

Mer om Hypotesetesting (kap 5) Student t-fordelingen. Eksamen. Fordelingene blir like ved stor n:

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

Forelesning Enveis ANOVA

EKSAMEN løsningsforslag

Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

Oversikt over konfidensintervall i Econ 2130

Forelesning 3 mandag den 25. august

Econ 2130 uke 13 (HG)

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

Econ 2130 Forelesning uke 11 (HG)

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

(ii) Anta vi vet om en observasjon av X at den ikke er større enn 5. Hva er da sannsynligheten for at den er lik 5? (Hint: Finn PX ( = 5 X 5) ).

Om enkel lineær regresjon I

Mer om utvalgsundersøkelser

Om enkel lineær regresjon I

Positive rekker. Forelest: 3. Sept, 2004

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Oppgave 1 ECON 2130 EKSAMEN 2011 VÅR

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

Oversikt 1. forelesning. ECON240 Statistikk og økonometri. Visuell/grafisk presentasjon av data. Datainnsamling; utdanning og inntekt

Løsningskisse for oppgaver til uke 15 ( april)

Statistikk og økonomi, våren 2017

Kap. 9: Inferens om én populasjon

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Introduksjon til økonometri, kap 8, 9.1 og 9.2. Hva er formålet med økonometri? Utvalgskorrelasjoner To-variabel regresjoner

Makroøkonomi - B1. Innledning. Begrep. B. Makroøkonomi. Mundells trilemma går ut på følgende:

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

STK1100 våren 2017 Estimering

ECON240 Statistikk og økonometri

Gråtonehistogrammer. Histogrammer. Hvordan endre kontrasten i et bilde?

Kap. 9: Inferens om én populasjon

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Kapittel 1: Beskrivende statistikk

Estimering 1 -Punktestimering

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

EKSAMEN Løsningsforslag

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

Estimering 1 -Punktestimering

Enveis variansanalyse (One-way ANOVA, fixed effects model) (Notat til Kap. 12 i Rosner)

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Forkunnskaper i matematikk for fysikkstudenter. Derivasjon.

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Påliteligheten til en stikkprøve

TMA4240 Statistikk Høst 2015

MOT310 Statistiske metoder 1, høsten 2011

Transkript:

1 HG Mars 017 Overskt over kofdestervall Eco 130 Merk at dee overskte kke er met å leses stedefor framstllge Løvås, me som et supplemet. De eholder tabeller med formler for kofdestervaller for stuasjoer som er aktuelt å kjee tl dette kurset. De eholder også oe eksempler på bruk av formlee. Utfordrge for studetee oppgaver blr således derfor først og fremst å kue gjekjee stuasjoe oppgave og derfor plukke ut korrekt formel for kofdestervallet. Overskte eholder også oe detaljer som jeg kke rekker å sakke om på de få forelesgee som gjestår. 1 Geerell ledg med oe presserger og et regeeksempel på et bomsk kofdestervall La være e ukjet parameter (populasjos-parameter) e statstsk modell. Uttrykket ukjet parameter betyr at de sae verde av populasjoe er ukjet. Når v setter opp e statstsk modell (som represeterer populasjoe v trekker data fra og trekgsprosedyre), atar v utgagspuktet at modelle er sa for e vss (ukjet) verd av parametere og usa for alle adre verder. Aførselstegee rudt sa ovefor skyldes at begrepet sa parameterverd ku gr god meg relasjo tl populasjoe dersom forutsetgee som er foretatt modelle er realstske forutsetger om populasjoe og måte data er trukket på. La ˆ være e aktuell estmator for, og SE SE( ˆ ) står for e eller ae (som oftest) estmert versjo av stadardfele tl hvs ˆ er forvetgsrett, er stadardfele tl ˆ kke oe aet e stadardavvket tl ˆ, emlg forelesg uke 10). ˆ. (Husk (NB!) at var( ˆ ). Jfr. også supplemetet tl [F.eks. ud-modelle med ˆ E( X ), 1,,,, var( ) og ˆ X X, blr stadardfele, SE( ˆ ) var( ˆ ) ]

Det vser seg at alle kofdestervall (KI) pesum (klusvt regresjosaalyse) - med et utak tabell koker ed tl samme form: ˆ c SE( ˆ ) der c er e kvatl bestemt av de valgte kofdesgrade. Dee kvatle er som oftest fra N(0,1) -fordelge og oe gager fra t- fordelge (se stuasjo tabell 1 (. Med kofdesgrade 1, er for eksempel c z (dvs -kvatle N (0,1) ) stuasjo 1 og 3 tabell 1 og alle stuasjoer tabell 3. Årsake tl at dee type av KI er så valg er at det ofte fes teoremer (som for eksempel setralgreseteoremet og regel 5.0 og adre lgede) som vser at estmatore er tlærmet ( oe få tlfeller eksakt) ormalfordelt, ˆ ~ N(, var( ˆ )) N(, SE( ˆ )). Dette ebærer (jfr. regele gtt def 5.13 sde 191 (178) om ormalfordelge) at ˆ tlærmet (*) ˆ SE( ˆ ) tlærmet ~ N(0, 1) (*) gjelder bare hvs utvalgsstørrelse (atall observasjoer) kke er for lte (se eksempel 1 uder). Løvås vser sde 1 40 (6) hvorda utsaget (*) leder tl kofdestervallet formulert regel 6.8 (6.7). Dessverre er regel 6.8 (6.7) uødvedg severt formulert hos Løvås med få avedelser (det er få stuasjoer der er eksakt ormalfordelt, me mage stuasjoer der er tlærmet ormalfordelt ). V blr derfor ødt tl å g e modfsert reformulerg av regel 6.8 (6.7) for å gjøre de mer avedelg: ˆ ˆ 1 Referaser paretes vser tl utg. av Løvås. Hvs det kke er oe paretes, er referase lk utg. og 3.

3 Regel 6.8 (6.7) (Løvås sde 40 (5)) modfsert. (Kofdestervall basert på ormalfordelge). ˆ (a) Hvs estmatore er forvetgsrett og tlærmet ormalfordelt med stadardfel 100(1 )% kofdestervall for SE( ˆ ), vl følgede tervall være et tlærmet (**) [ ˆ z ˆ ˆ ˆ SE( ), z SE( )], der z er kvatle N(0, 1) (dvs slk at P( Z z ) P( Z z ), der Z ~ N(0,1) ) Hvs ˆ SE( ˆ ) (*) er eksakt ormalfordelt, N (0,1), vl tervallet ha eksakt kofdesgrad 1 (eller 100(1 )% ). (b) Vderegåede teoremer sasylghetsteor (som v kke skal gå på her) vser at stuasjoer der stadardfele, SE( ˆ ) var( ˆ ) er ukjet (dvs avheger av ukjete parametre modelle), så vl uder geerelle betgelser (som at kke er for lte) kofdestervallet fortsatt ha kofdesgrad tlærmet 100(1 )% om stadardfele byttes ut med e estmert versjo. Med adre ord, utsaget (*) - og dermed (**) - gjelder fortsatt om SE( ˆ ) å står for estmert stadardfel (som du ka ta som et faktum dette kurset). Dette er brukt tabell 1 (stuasjo 3) og tabell 3 uder jfr. også regeeksempel 1 og. (a) begrues som Løvås sde 40 (6) der de eeste forskjelle er at det første lkhetsteget byttes ut med : ˆ 1 Pz z som Løvås sde 40 (6) (gjør det selv!) P ˆ z ˆ ˆ ˆ SE( ) z SE( ) SE( ˆ ) (b) bygger på vderegåede sasylghetsteor (delvs tatt opp Stat-kurset og mye brukt økoometrsk teor) og som kke behadles her Stat1. Dette er e vktg mapulasjo som v krever at studetee behersker og forstår.

4 For øvrg: Når det gjelder tolkge av begrepet kofdesgrad, les dskusjoe tl fgur 6.3 Løvås sde 5( 11). Regeeksempel 1 (Kostruksjo av kofdestervall e bomsk modell. Basert på oppgave 5.6 Løvås med y problemstllg). E spesalpedagog skal udersøke læreeve tl 900 tlfeldg utvalgte elever. I oppgave 5.6 atas at adele av alle skolebar (populasjoe) som har lærevasker, er p 0,15, altså kjet. V skal å stedet ata at p er ukjet og at 0.15 er et estmat for p basert på utvalget av 900 elever. V er teressert å berege uskkerhete ved dette aslaget uttrykt ved et 95% kofdestervall for p. For å komme oe ve, treger v e statstsk modell for populasjoe og utvalgsmetode. Modell. La X være atall bar med lærevasker et ret tlfeldg utvalg på 900 elever trukket fra populasjoe av alle skolebar. Ata X ~ b(, p ) der p er adele av skolebar populasjoe med lærevasker og atas ukjet. Merkad tl modelle. Merk at utvalget er forutsatt represetatvt. Dette lgger forutsetge om at utvalget er ret tlfeldg som deelt sett (sjelde eksakt oppfylt prakss, me ofte akseptabelt bra oppfylt) betyr at alle mulge utvalg på 900 fra populasjoe har samme sasylghet for å bl trukket ut. X er, uder dee forutsetge, stregt tatt hypergeometrsk fordelt, me, sde populasjoe er stor, ka v ute vesetlg tap av realsme ata at X er bomsk fordelt - som gr e eklere modell. Ata at pedagoge fat 135 bar med lærevasker utvalget. Tallet 135 er å å oppfatte som e observasjo av de stokastske X varabele, X. De valge estmatore dee modelle er pˆ. Estmatet (dvs de observerte verde p ˆobs basert på data) får v 135 ved å sette data estmatore, pˆ obs 0.15. Oppgave er altså å berege et kofdestervall for de ukjete p med 900 kofdesgrad (tlærmet) 95%: Om estmatore ˆp vet v følgede ut fra teore som er etablert kurset tl å:

5 (a) ˆp er forvetgsrett. [Begruelse: X 1 1 E( pˆ ) E E( X ) p p (jfr. regel 5.3)] (b) Stadardfele for ˆp er SE( pˆ ) p(1 p) X [Begruelse: 1 1 p var( ˆ) var var( ) (1 ) (1 p p X p p ). Dermed p(1 p) SE( pˆ) var( pˆ) ] (c) ˆp er tlærmet ormalfordelt, tlærmet pˆ ~ N( E( pˆ ), var( pˆ )) N( p, SE( pˆ )). [Begruelse. Dette følger av regel 5.0 som ser at hvs var( X ) p(1 p) 5 og p kke er veldg ær 0 tlærmet eller 1, så er X tlærmet ormalfordelt, X ~ N( E( X ), var( X )) N( p, p(1 p)). Sde 900, syes betgelse klart å være oppfylt. Dermed ka v bruke regele som ser at hvs X er ormalfordelt og Y =a + bx er e leær trasformasjo, så er også Y ormalfordelt, Y ~ N E( Y ), var(y) (evt forelesge uke 8 om ormalfordelge). Dette vser at 1 tlærmet 1 1 p(1 p) pˆ X ~ N E( X ), SD( X ) N p, N p, SE( pˆ) (Merk at 1 ) ] pˆ p Av dette følger at de stadardserte,, er tlærmet N(0,1) -fordelt (jfr Def 5.13 sde 191 (178) Løvås). Nå er SE( pˆ ) stadardfele, SE( p ˆ ) ukjet sde p er ukjet. Dermed, år er stor ok (slk at var( X ) p(1 p) 5), vl følge modfsert regel 6.8 (6.7) (b) dee tlærmelse fortsatt være akseptabel om v erstatter de ukjete stadardfele med estmert stadard fel ˆp

6 pˆ(1 pˆ). I tråd med otasjoe slk Løvås (og Excel og STATA og adre pakker) bruker de, lar v å estmerte versjoe. Utsaget (*) blr dee stuasjoe dermed seede ut som SE( pˆ ) stå for de ˆ pˆ p SE( ˆ ) pˆ(1 pˆ) tlærmet ~ N(0, 1) pˆ(1 pˆ) som gr et tlærmet (1 )100% KI for p: pˆ z ˆ ˆ SE( p) p z Med øsket kofdesgrad 95% treger v kvatle z0.05 1.96 (se tabell E4 (D4) bak Løvås), og kofdestervallet blr utreget som pˆ (1 ˆ obs pobs ) (0.15)(0.85) pˆ obs 1.96 0.15 (1.96) 0.15 0.0 [0.13, 0.17] 900 Merkad 1. Uskkerhete ved aslaget pˆ obs 0.15 er således dette eksemplet bereget tl 0.0 (geerelt z ˆ SE( ) ). V ser dermed at begrepet uskkerhet ved e estmerg kke er oe absolutt størrelse. De avheger kke bare av utvalgsstørrelse () og populasjosvarase tl X (her p(1 p) som er varase for atall suksesser et ekelt bomsk forsøk), me også av de subjektvt valgte kofdesgrade! Merkad. (For å berolge lesere). Om du tl eksame blr bedt om å berege et kofdestervall som eksemplet, treger du aturlgvs kke, om du kke eksplstt blr spurt om det, å komme opp med hele begruelse ovefor. Det vl valgvs være tlstrekkelg smpelthe å velge rktg formel forhold tl de aktuelle modelle og å kue sette tallee korrekt. Du ka aturlgvs ved tlleggsspørsmål rskere å bl bedt om å gjeomføre deler av argumetasjoe ovefor for aktuelle modell-typer som omfattes av pesum.

7 Aktuelle modelltyper 1 E valg modelltype er ud-modelle (1) (egelsk d) (1) La X1, X,, X være uavhegge og detsk fordelte stokastske (ud) varable med E( X) og var( X), der tolkes som størrelser (som oftest ukjete) e eller ae populasjo som data, x1, x,, x trekkes fra. 1 Aktuelle estmatorer: ˆ X og ˆ S ( X X ) som begge er forvetgsrette (jfr avsttet uder regel 6. og regel 6.3). 1 1 La -kvatle N(0,1) - fordelge beteges med (slk at P( z Z z ) 1, der Z ~ N (0,1) ) La -kvatle t ( 1) - fordelge beteges med t 1, (slk at P( t 1, T t 1, ) 1, der T ~ t( 1) ). Merk at fordelgee t( 1) og N(0,1) lger på hveradre: De er begge etoppet (klokkeformet) og symmetrsk rudt 0. Når er stor (dvs. omtret), er forskjelle eglsjerbar. For små er t ( 1) karaktersert ved ltt tygre haler e N (0,1) og ltt flatere kurve rudt 0 (jfr. fgur 5.6 sde 05 (19) Løvås). 30 z og Tabell 1 Kofdestervall for Stuasjo Forutsetger (modell) 1 3 (1) pluss forutsetge X ~ N(, ), 1,,, Vlkårlg Kjet (1) pluss forutsetge X ~ N(, ), 1,,, Bare (1) der X er vlkårlg fordelt Vlkårlg Ukjet stor, 30 (tl ød 0) Ukjet Stadardfel var( ˆ ) Estmert stadardfel S S Grulag for KI-et ˆ SE( ˆ ) X ~ N(0, 1) X ~ t ( 1) S X S tlærmet 1 KI for X z X t 1, ~ N(0, 1) X z S S Kofdesgrad Eksakt 1 Eksakt 1 Tlærmet 1

8 4 Bare (1) der X er vlkårlg fordelt lte Ukjet Ikke pesum Merkad 3. I stuasjo 3 vl de fleste computer-pakker (f.eks. Excel, Stata osv) rutemessg bruke t-kvatle ( t 1, ) stedet for N(0, 1) kvatle ( ). Sde alltd t 1, z, gjør kke dette oe skade selv om X -ee kke er ormalfordelte det bare øker KI-et ltt (gjør KI-et ltt mer «koservatvt»). På de ae sde, for 30 er t 1, z, så om ma bruker de ee eller de adre kvatle, er e smaksak forskjelle er eglsjerbar. z Merkad 4. Sde t( 1)-fordelge er tlærmet lk N(0, 1) for 30, vl forskjelle mellom KI-ee stuasjo og 3 være eglsjerbar år 30. Regeeksempel (Stuasjo 3 tabell 1: Tlærmet 95% KI for ud-modelle med ukjet, «stor» og vlkårlg fordelg for. ) X (Dette eksemplet skulle vært tatt forelesge uke 1, som det kke ble td tl, og er derfor lagt tl her.) Megde av Col-bakterer va er av og tl brukt som e dkator på foruresg. Atall col-bakterer er regstrert = 30 vaprøver tlfeldg trukket fra e elv.

9 DATA: x1, x,, x 30 9 13 9 8 7 11 9 13 8 9 7 8 5 9 8 5 8 8 8 7 8 9 5 6 5 7 7 7 13 8 Desty.1..3 Hstogram for atall colbakterer pr. vaprøve (med best tlpasset ormalfordelgstetthet, N(gj.stt(x), sd(x)) ) x 8.13 ( ˆ ) obs 0 4 6 8 10 1 14 x s ( x x) x 1 1.1613 ( ˆ ) obs Hstogrammet vser at det vlle vært tvlsomt å ata at ekeltobservasjoee er trukket fra e ormalfordelg (symmetre vrker ok, me det syes å være for mage observasjoer ute halee på fordelge. Modell: X, X,, X ud og vlkårlg fordelte med E( X ), var( X ) Regel 5.18 setralgreseteoremet 1 tlærmet ˆ X ~ N( E( X ), SD( X )) N, tlærmet samme fordelg som X E( X ) ˆ ˆ ~ Z ~ N(0,1) ( 0) SD( X )

10 Som (b) modfsert regel 6.8 (sde 3) følger av vderegåede teor (kke behadlet dette pesum) at sste utsag kke edres vesetlg om de 1 ukjete byttes ut med estmatore, ˆ S ( X X ), for stor, ( x 1 tlærmet samme fordelg som ˆ Dermed ka v kokludere at ~ Z ~ N(0, 1) ( 30) ˆ ˆ [Utdypg. Dette betyr at e sasylghet P( a b), som er lk flateholdet uder sasylghetstetthete for ˆ ˆ over tervallet ( ab, ), ka tlærmes på følgede måte. Dette flateholdet er emlg tlærmet lk tlsvarede ˆ flatehold N(0, 1)-tetthete - som er P( a Z b) - sde de to sasylghetstetthetee er tlærmet lke (følge teore ˆ som du kke treger å kjee tl her). Derfor blr P( a b) P( a Z b). ] ˆ 30 Som før (på forelesge uke 1 eller Løvås sde 40 (6)) utleder v vårt kofdestervall: ca.). ˆ 1 P( z Z z ) P z z ˆ som før ˆ P ˆ z ˆ z ˆ ˆ Et kofdestervall for med tlærmet kofdesgrad, 1 blr dermed ˆ z ˆ ˆ z SE( )

11 (der SE betyr estmert stadardfel. Jfr. også merkad 3 og 4 ovefor). I colbaktere-eksemplet: 30, ˆ x 8.13, ˆ s.1613 obs obs x Kofdesgrad 95% 1 0.95 / 0.05 z z 1.96 0.05 ˆ obs.1613 Stadardfel: SE( ˆ ) 0.3946... 30 Uskkerhet (95% kofdes): z SE( ) (1.96)(0.3946..) 0.7734.. 0.05 ˆ Tlærmet 95% kofdestervall for ˆ ˆ z ˆ 0.05SE( ) ˆ z 0.05 8.13 0.77 [7.36, 8.91] obs obs Bestemmelse av utvalgsstørrelse () stuasjo 3, tabell 1 (ukjet ): 1 KI for (tlærmet): ˆ z ˆ Uskkerhet ( ): z Øsket uskkerhet (c): Sde ˆ (som estmerer z ) Bestem slk at uskkerhete blr c, dvs. valgvs er ukjet, treger v derfor e (såkalt «a pror») gjetg på Ofte brukt fremgagsmåte: Estmer fra e lte forudersøkelse (plotudersøkelse). z z c c z for å bestemme (omtretlg). c

1 I col-eksemplet: : Ata utvalget på 30 vaprøver var e plotudersøkelse. V øsker å estmere med uskkerhet c = 0.. Kofdesgrad 95%. z 1.96. Aslag på fra plotudersøkelse: ˆ (.16...). obs 1.96 Dermed får v vårt aslag på : (.16..) 448.6... 449. 0. Dee utvalgsstørrelse burde g e uskkerhet ær 0.. Tabell. Kofdestervall for år X1, X,, X er uavhegge og ormalfordelte med X ~ N(, ). (Jeg vl atakelg kke rekke å sakke om dette på forelesgee, så dette må leses på egehåd 3.) Hvs e stokastsk varabel, V, er kj-kvadratfordelt (avstt 5.9.1) med k frhetsgrader, skrver v kort: V ~ k -fordelt ( er de greske bokstave kj ). p-kvatle dee fordelge kaller Løvås,, som er det tallet som oppfyller P( V ) p. Noe kvatler fes tabell E6 (D6). Merk at kj-kvadrat fordelge kke er symmetrsk (jfr. fgur 5.5 sde 03 (190) Løvås) slk at v treger kvatler begge eder av fordelge for å utlede kofdestervallet. Se merkad 6 for utledg og eksempel.) p p Modell Estmator Grulag for KI-et X1, X,, X er uavhegge og ( 1) S ~ detsk fordelte (ud) Vlkårlg ˆ 1 S med X ~ N(, ), 1,,, (Regel 5.) Nedre kofdesgrese ( 1) S Øvre kofdesgrese Kofdesgrad ( 1) S 1 Eksakt 1 3 Les avstt 5.9.1 (sde 04 (190)) om kj-kvadratfordelge, med spesell vekt på regel 5., og avstt 6.3.4 (sde 45 (30)) for relevat avedelse.

13 Merkad 5. Har v fuet et KI for populasjosvarase, 1 KI for være gtt ved [ A, B ]. Dette skyldes at begvehetee fuksjoe y (der A og B er postve stokastske varable) slk at ( A B), ka v lett fe et for stadardavvket,, også. Hvs [, ] AB er et P( A B) 1, så vl et 1 KI for rett og slett og ( A B) er logsk ekvvalete og derfor lke sasylge (sde x er e voksede fuksjo av x). [Illustrer selv de sste setge med et dagram over fuksjoe y x!]. Merkad 6. Utledg av kofdestervallet for. (Jfr. avstt 6.3.4 Løvås.) Sett V ( 1) S. I følge regel 5. er V - ~ 1 fordelt. For kvatlee 4 1 og har v følge defsjoe av kvatler og det at kj-kvadratfordelge er kotuerlg, P( V 1 ) 1 P( V 1 ) 1 P( V 1 ) 1 (1 ) og PV ( /). Dermed blr (se fgur 1): P( V ) 1. Ved settg for V får v dermed 1 ( 1) S 1 1 1 P1 P 1 ( 1) S ( 1) S ( 1) S ( 1) S ( 1) S P P 1 1 I de sste lkhete har v bare ordet om på ulkhete slk at de mste verde kommer tl vestre. Merk også at de adre lkhete skyldes at år ma tar de verse av begge sder av e ulkhet mellom postve tall, sur ulkhete rudt (for eksempel 4 1 4 1 ). 4 Hvs geerelt V er k -fordelt (med k frhetsgrader), er p-kvatle Løvås defert som et tall, skrevet, som oppfyller P( V ) p. p p

14 Regeeksempel 3 (Kostruksjo av et kj-kvadrat kofdestervall for ). For de y, y,, 37 kvehøydee (døtree), 1 y 37, som ble samlet på forelesge 5. mars 01 5, ble estmatet for populasjos-stadardavvket,, lk 1 ˆ obs Sobs ( y y) 5.9457 1 1. V øsker et 95% KI for. Som modell bruker v (1) for de bakeforlggede stokastske varablee, Y1, Y,, Y 37, som altså atas ud og som tllegg atas at er ormalfordelte, Y ~ N(, ) for 1,,,. (Normalfordelgsatakelse ases valgvs for realstsk for høydemålger homogee grupper.) Kofdesgrad 0.95, gr 0.05 og 0.05. V treger altså kvatlee 0.975 og 0.05 kjkvadratfordelge (jfr. Fgur 1 edefor) med 1 36 frhetsgrader. Tabell E6 (D6) gr ku 0.975=0.57 og 0.05 53.0 for de ærmeste kj- er kke represetert tabell E6 (D6), me v ka bruke CHIINV- kvadratfordelge som er -fordelge 36 fuksjoe Excel for 36 frhetsgrader som gr 0.975=1.34 og 0.05 54.44 35 -fordelge. Ut fra merkad 5 blr 95% kofdestervallet for bereget tl 36S 36S 36 36, S, S (0.81) S, (1.30) S 4.4, 6.80 obs 54.44 1.34 0.05 0.975 obs obs Merk at estmatet ˆ obs 5.3 kke lgger mdt kofdestervallet (det er altså større uskkerhet tl høyre for estmatet e tl vestre - som skyldes ar kj-kvadratfordelge er e skjev fordelg). Dette ebærer at begrepet stadardfel kke kommer som oe yttg begrep dette tlfellet (og blr derfor kke brukt forbdelse med estmerg av eller ), motsetg tl kofdestervall basert på ormalfordelge eller t-fordelge som ovefor. 5 Data ka lastes ed fra http://folk.uo.o/haraldg/

15 Om v øsker et 95% kofdestervall for varase,, får v det, på gru av merkad 5, ved rett og slett å kvadrere tallee tervallet for : (4.4),(6.80) 17.94, 46., der jeg bare tok med to desmaler svaret for å gjøre tervallet lettere å lese e evetuell rapport (de sste desmalee har lte tolkgsverd uasett). Merkad 7. Noe gager fer v altså kke akkurat de kvatle tabelle (E6 (D6)) v er ute etter., Tl eksame, for eksempel, har v kke tlgag tl Excel. Da er det lov å bruke øyemålsmetode ( magel av terpolasjosmetoder som kke er pesum). I så fall ser v på de to ærmeste fordelgee som er represetert tabelle: Frhets- 0.975 0.05 grader 35 0.57 53.0 40 4.43 59.34 På øyemål aslår v for eksempel 0.975=1.5 og 0.05 54. omtret for 36 frhetsgrader, som er godt ok e eksamesbesvarelse. Fgur 1 -fordelge. Graf laget med STATA.01.0.03.04.05 y Sasylghetstetthete kj-kvadratfordelge med 36 frhetsgrader 0.95 0 0.05 0.05 10 0 30 40 50 60 70 x 1.34 54.44

16 3 Aktuelle modelltyper Tabell 3 Tlærmet kofdestervall basert på regel 5.0 (ormaltlærmg for bomsk, hypergeometrsk og posso fordelg) Modell Estmator X X ~ b(, p ) pˆ X ~ hypergeom. ( M, N, ) X pˆ ( p M N ) X ~ pos( t) 6 ˆ X t ˆ Stadardfel var( ˆ ) Estmert stadardfel SE( ˆ ) Betgelse for akseptabel ormaltlærmelse p(1 p) pˆ(1 pˆ) var( X ) 5 ( p(1 p) 5 p(1 p) N N 1 t pˆ(1 pˆ) N N 1 var( X ) 5 ˆ var( X ) 5 ( t t 5) Grulag for KI-et ˆ SE( ˆ ) pˆ p pˆ(1 pˆ) tlærmet ~ N(0,1) Kofdestervall ( kofdesgrad tlærmet 1 ) ˆ z SE( ˆ ) pˆ z tlærmet pˆ p ~ N(0,1) pˆ(1 pˆ) N N 1 ˆ tlærmet ~ N(0, 1) ˆ t pˆ z ˆ z pˆ(1 pˆ) pˆ(1 pˆ) N N 1 ˆ t 6 Husk at otasjoe X ~ pos( m ) er valgt slk at det som står på m s plass alltd er lk EX ( ) (som også er lk var( X ) posso-fordelge). Hvs det for eksempel e oppgave fremgår at X ~ pos(3.7), følger automatsk at E( X ) var( X ) 3.7. Av modelle tabelle følger således at E( X ) var( X ) t som mplserer at 1 1 ˆ er forvetgsrett sde ( ˆ X E ) E E( X ) t. Varase (lk kvadrert stadardfel) blr ˆ X 1 1 var( ) var var( X) t. t t t t t t t

17 Merkad 7 Merk at de tre KI-ee tabell 3 samt KI-ee stuasjo 1 og 3 tabell 1 alle har de geerelle forme agtt regel 6.8 (6.7) der SE står for stadardfel eller estmert stadardfel dersom avheger av ukjete parametre. Utak fra regel 6.8 (6.7) er gtt tabell og stuasjo uder tabell 1. Argumetasjoe fra pvotal-utsaget tl kofdestervallet er gtt avstt 6.3.1. rett etter regel 6.8 (6.7). SE( ˆ ) Merkad 8 I mage KI (jfr tabell 1 og 3) bruker v altså de estmerte versjoe av stadardfele ( tlfelle stadardfele er ukjet) år v utleder et KI. Det er kke på oe måte opplagt at v har lov tl dette. Det er rmelg å teke seg at e slk fremgagsmåte vlle kue ødelegge tlærmelse tl N(0, 1), oe som vlle gjøre kofdesgrade tvlsom. Det at v følge modfsert regel 6.8 (6.7) (b) faktsk har lov tl å erstatte SE med e estmert versjo ute å berøre kofdesgrade vesetlg (år kke er for lte), er egetlg gaske overraskede sett lys av e ofte betydelg uskkerhet estmerge av. For eksempel for kvehøydee regeeksempel 3 ble kofdestervallet for 4.4, 6.80 som dkerer e kke ubetydelg uskkerhet Lkevel vl etter modfsert regel 6.8 (6.7) (b) kofdesgrade for KI-et for kke bl vesetlg berørt om v bytter ut med ˆ S stadardfele for ˆ X. Merkad 9 Det at v har formler for uskkerhetsdele, c SE( ˆ ), et kofdestervall for der utvalgsstørrelse går, gjør det mulg å bestemme ødvedg størrelse () på utvalget for å oppå at uskkerhete kke overstger e gtt (akseptabel) grese. Slke beregger ka være vktge ved plaleggge av e statstsk udersøkelse. Eksempler på slke beregger er gtt eksemplee 6.9, 6.11 og 6.14 Løvås. Et eksempel fes også regeeksempel ovefor. 4 Regresjosmodelle KI-ee for ukjete parametre de ekle stadard regresjosmodelle med ormalfordelte restledd følger samme møsteret som stuasjo tabell 1 (t-tervall), med eeste forskjell at frhetsgrader beyttes t-fordelge stedefor 1 som stuasjo. KI-et har alle tlfeller forme ˆ t, SE( ˆ )

18 3. Det du treger tllegg er derfor bare formler for og kofdesgrade 1 gjelder eksakt for alle og 7, eller regresjo-ii otatet som sart legges ut på ettet. Notatet gr også eksempler på beregg av slke KI-er. ˆ SE( ˆ ), som du fer Løvås kap.