Oversikt over konfidensintervall i Econ 2130

Like dokumenter
Oversikt over konfidensintervall i Econ 2130

Oversikt over konfidensintervall i Econ 2130

Oversikt over konfidensintervall i Econ 2130

Econ 2130 Forelesning uke 11 (HG)

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Mer om utvalgsundersøkelser

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

MOT310 Statistiske metoder 1, høsten 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Kap. 9: Inferens om én populasjon

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Statistikk og økonomi, våren 2017

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Kap. 9: Inferens om én populasjon

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

Kapittel 8: Estimering

Estimering 1 -Punktestimering

ECON240 Statistikk og økonometri

Estimering 1 -Punktestimering

Estimering 2. -Konfidensintervall

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

TMA4240 Statistikk Høst 2016

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen august 2015

TMA4245 Statistikk Eksamen mai 2017

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Oppgaver fra boka: X 2 X n 1

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Løsningsforslag Oppgave 1

Hypotesetesting, del 4

Oversikt over tester i Econ 2130

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

STK1100 våren 2017 Estimering

Løsningsforslag ST2301 øving 3

Oversikt over konfidensintervall i Econ 2130

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

Påliteligheten til en stikkprøve

Populasjon, utvalg og estimering

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Metoder for politiske meningsmålinger

TMA4240 Statistikk Høst 2009

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

EKSAMEN Løsningsforslag

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

TMA4240 Statistikk Eksamen desember 2015

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

OM TAYLOR POLYNOMER. f x K f a x K a. f ' a = lim x/ a. f ' a z

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

MOT310 Statistiske metoder 1, høsten 2012

Lineær regresjonsanalyse (13.4)

TMA4240 Statistikk H2010

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Løsningsforslag til eksamen i STK desember 2010

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

«Uncertainty of the Uncertainty» Del 4 av 6

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

Transkript:

1 HG Revidert april 014 Oversikt over kofidesitervall i Eco 130 Merk at dee oversikte ikke er met å leses istedefor framstillige i Løvås, me som et supplemet. De ieholder tabeller med formler for kofidesitervaller for situasjoer som er aktuelt å kjee til i dette kurset. De ieholder også oe eksempler på bruk av formlee. Utfordrige for studetee i oppgaver blir således derfor først og fremst å kue gjekjee situasjoe i oppgave og derfor plukke ut korrekt formel for kofidesitervallet. Oversikte ieholder også oe detaljer som jeg ikke rekker å sakke om på de få forelesigee som gjestår. 1 Geerell iledig med oe presiseriger og et regeeksempel La være e ukjet parameter (populasjos-størrelse) i e statistisk modell. Uttrykket ukjet parameter betyr at de sae verdie av i populasjoe er ukjet. Når vi setter opp e statistisk modell (som represeterer populasjoe vi trekker data fra og trekigsprosedyre), atar vi i utgagspuktet at modelle er sa for e viss (ukjet) verdi av parametere og usa for alle adre verdier. Aførselstegee rudt sa ovefor skyldes at begrepet sa parameterverdi ku gir god meig i relasjo til populasjoe dersom forutsetigee som er foretatt i modelle er realistiske forutsetiger om populasjoe og måte data er trukket på. La ˆ være e aktuell estimator for, og E E( ˆ ) står for e eller ae estimert versjo av stadardfeile til ˆ. (Husk (NB!) at hvis ˆ er forvetigsrett, er stadardfeile til ˆ ikke oe aet e stadardavviket til ˆ, emlig var( ˆ ).)

Det viser seg at alle kofidesitervall (KI) i pesum (iklusivt regresjosaalyse) - med et utak i tabell koker ed til samme form: ˆ c E( ˆ ) der c er e kvatil bestemt av de valgte kofidesgrade. Dee kvatile er som oftest fra N(0,1) -fordelige og oe gager fra t- fordelige (se situasjo i tabell 1 (. Med kofidesgrade 1, er for eksempel c z (dvs -kvatile i N (0,1) ) i situasjo 1 og 3 i tabell 1 og i alle situasjoer i tabell 3. Årsake til at dee type av KI er så valig er at det ofte fies teoremer (som for eksempel setralgreseteoremet og regel 5.0 og adre ligede) som viser at estimatore ˆ er tilærmet (i oe få tilfeller eksakt) ormalfordelt, ˆ ~ N(, var( ˆ )) N(, E( ˆ )). Dette iebærer (jfr. regel 1 og (side 1) i forelesige uke 10 om ormalfordelige) at tilærmet (*) ˆ E( ˆ ) tilærmet ~ N(0, 1) (*) gjelder bare hvis utvalgsstørrelse (atall observasjoer) ikke er for lite (se eksempel 1 uder). Løvås viser side 1 40 (6) hvorda utsaget (*) leder til kofidesitervallet formulert i regel 6.8 (6.7). Dessverre er regel 6.8 (6.7) uødvedig severt formulert hos Løvås med få avedelser (det er få situasjoer der ˆ er eksakt ormalfordelt, me mage situasjoer der ˆ er tilærmet ormalfordelt ). Vi blir derfor ødt til å gi e modifisert reformulerig av regel 6.8 (6.7) for å gjøre de mer avedelig: 1 Referaser i paretes viser til utg. av Løvås. Hvis det ikke er oe paretes, er referase lik i utg. og 3.

3 Regel 6.8 (6.7) (Løvås side 40 (5)) modifisert. (Kofidesitervall basert på ormalfordelige). (a) Hvis estimatore ˆ er forvetigsrett og tilærmet ormalfordelt med stadardfeil 100(1 )% kofidesitervall for (**) [ ˆ z ˆ ˆ ˆ E( ), z E( )] E( ˆ ), vil følgede itervall være et tilærmet Hvis ˆ E( ˆ ) i (*) er eksakt ormalfordelt, N (0,1), vil itervallet ha eksakt kofidesgrad 1 (eller 100(1 )% ). (b) Videregåede teoremer i sasylighetsteori viser at i situasjoer der stadardfeile, E( ˆ ) var( ˆ ) er ukjet (dvs avheger av ukjete parametre i modelle) så vil uder geerelle betigelser kofidesitervallet fortsatt ha kofidesgrad tilærmet 100(1 )% om stadardfeile byttes ut med e estimert versjo. Med adre ord, utsaget (*) - og dermed (**) - gjelder fortsatt om E( ˆ ) å står for estimert stadardfeil. (a) begrues som i Løvås side 40 (6) der de eeste forskjelle er at det første likhetsteget byttes ut med : ˆ 1 Pz z som i Løvås side 40 (6) (gjør det selv!) P ˆ z ˆ ˆ ˆ E( ) z E( ) E( ˆ ) (b) bygger på videregåede sasylighetsteori (delvis tatt opp i tat-kurset og mye brukt i økoometrisk teori) og som ikke behadles her i tat1. For øvrig: Når det gjelder tolkige av begrepet kofidesgrad, les diskusjoe til figur 6.3 i Løvås side 5( 11). Dette er e viktig maipulasjo som vi krever at studetee behersker og forstår.

4 Regeeksempel 1 (Basert på oppgave 5.6 i Løvås med y problemstillig). E spesialpedagog skal udersøke læreeve til 900 tilfeldig utvalgte elever. I oppgave 5.6 atas at adele av alle skolebar (populasjoe) som har lærevasker, er p 0,15, altså kjet. Vi skal å i stedet ata at p er ukjet og at 0.15 er et estimat for p basert på utvalget av 900 elever. Vi er iteressert i å berege usikkerhete ved dette aslaget uttrykt ved et 95% kofidesitervall for p. For å komme oe vei, treger vi e statistisk modell for populasjoe og utvalgsmetode. Modell. La X være atall bar med lærevasker i et ret tilfeldig utvalg på 900 elever trukket fra populasjoe av alle skolebar. Ata X ~ bi(, p ) der p er adele av skolebar i populasjoe med lærevasker og atas ukjet. Merkad til modelle. Merk at utvalget er forutsatt represetativt. Dette ligger i forutsetige om at utvalget er ret tilfeldig som ideelt sett (sjelde eksakt oppfylt i praksis, me ofte akseptabelt bra oppfylt) betyr at alle mulige utvalg på 900 fra populasjoe har samme sasylighet for å bli trukket ut. X er, uder dee forutsetige, stregt tatt hypergeometrisk fordelt, me, side populasjoe er stor, ka vi ute vesetlig tap av realisme ata at X er biomisk fordelt - som gir e eklere modell. Ata at pedagoge fat 135 bar med lærevasker i utvalget. Tallet 135 er å å oppfatte som e observasjo av de stokastiske X variabele, X. De valige estimatore i dee modelle er. Estimatet (dvs de observerte verdie p ˆobs basert på data) får vi 135 ved å sette data i i estimatore, obs 0.15. Oppgave er altså å berege et kofidesitervall for de ukjete p med 900 kofidesgrad (tilærmet) 95%: Om estimatore ˆp vet vi følgede ut fra teorie som er etablert i kurset til å: (a) ˆp er forvetigsrett. [Begruelse: X 1 1 E( ) E E( X ) p p (jfr. regel 5.3)]

5 (b) tadardfeile for ˆp er E( ) p(1 p) X [Begruelse: 1 1 p var( ˆ) var var( ) (1 ) (1 p p X p p ). Dermed p(1 p) E( ) var( ) ] (c) ˆp er tilærmet ormalfordelt, tilærmet ~ N( E( ), var( )) N( p, E( )). [ Begruelse. Dette følger av regel 5.0 som sier at hvis var( X ) p(1 p) 5 og p ikke er veldig ær 0 tilærmet eller 1, så er X tilærmet ormalfordelt, X ~ N( E( X ), var( X )) N( p, p(1 p)). ide 900, syes betigelse klart å være oppfylt. Dermed ka vi bruke regel 1 (i forelesig uke 10 om ormalfordelige) som viser at 1 tilærmet 1 1 p(1 p) X ~ N E( X ), D( X ) N p, N p, E( ) ] Av dette 3 p følger at de stadardiserte ˆp,, er tilæmet N(0,1) -fordelt. Nå er stadardfeile, E( p ˆ ) ukjet side p er E( ) ukjet. Dermed, år er stor ok (slik at var( X ) p(1 p) 5), vil i følge modifisert regel 6.8 (6.7) (b) dee tilærmelse (1 ) fortsatt være akseptabel om vi erstatter de ukjete stadardfeile med estimert stadard feil. I tråd med otasjoe slik Løvås (og Excel og TATA og adre pakker) bruker de, lar vi å E( p ˆ) stå for de estimerte versjoe. Utsaget (*) blir i dee situasjoe dermed seede ut som 3 e det adre eksempelet etter regel 1 i forelesig uke 10.

6 ˆ p E( ˆ ) (1 ) tilærmet ~ N(0, 1) (1 ) som gir et tilærmet (1 )100% KI for p: z ˆ ˆ E( p) p z Med øsket kofidesgrad 95% treger vi kvatile z0.05 1.96 (se tabell E4 (D4) bak i Løvås), og kofidesitervallet blir utreget som (1 ˆ obs pobs ) (0.15)(0.85) obs 1.96 0.15 (1.96) 0.15 0.0 [0.13, 0.17] 900 Merkad 1. Usikkerhete ved aslaget obs 0.15 er således i dette eksemplet bereget til 0.0 (geerelt z ˆ E( ) ). Vi ser dermed at begrepet usikkerhet ved e estimerig ikke er oe absolutt størrelse. De avheger ikke bare av utvalgsstørrelse () og populasjosvariase til X (her p(1 p) som er variase for atall suksesser i et ekelt biomisk forsøk), me også av de subjektivt valgte kofidesgrade! Merkad. (For å berolige lesere). Om du til eksame blir bedt om å berege et kofidesitervall som i eksemplet, treger du aturligvis ikke, om du ikke eksplisitt blir spurt om det, å komme opp med hele begruelse ovefor. Det vil valigvis være tilstrekkelig simpelthe å velge riktig formel i forhold til de aktuelle modelle og å kue sette i tallee korrekt. Du ka aturligvis ved tilleggsspørsmål risikere å bli bedt om å gjeomføre deler av argumetasjoe ovefor for aktuelle modell-typer som omfattes av pesum.

7 Aktuelle modelltyper 1 E valig modelltype er uid-modelle (1) (egelsk iid) (1) La X1, X,, X være uavhegige og idetisk fordelte stokastiske (uid) variable med E( Xi) og var( Xi), der og tolkes som størrelser (som oftest ukjete) i e eller ae populasjo som data, x1, x,, x trekkes fra. 1 Aktuelle estimatorer: ˆ X og ˆ ( X i X ) som begge er forvetigsrette (jfr avsittet uder regel 6. og regel 6.3). 1 i1 La -kvatile i N(0,1) - fordelige beteges med z (slik at P( z Z z ) 1, der Z ~ N (0,1) ) La -kvatile i t ( 1) - fordelige beteges med t 1, (slik at P( t 1, T t 1, ) 1, der T ~ t( 1) ). Merk at fordeligee t( 1) og N(0,1) liger på hveradre: De er begge etoppet (klokkeformet) og symmetrisk rudt 0. Når er stor (dvs. 30 omtret), er forskjelle eglisjerbar. For små er t ( 1) karakterisert ved litt tygre haler e N (0,1) og litt flatere kurve rudt 0 (jfr. figur 5.6 side 05 (19) i Løvås). Tabell 1 Kofidesitervall for ituasjo Forutsetiger (modell) 1 3 (1) pluss forutsetige X ~ N(, ), i 1,,, Vilkårlig Kjet i (1) pluss forutsetige X ~ N(, ), i 1,,, Vilkårlig Ukjet i Bare (1) der X er vilkårlig fordelt i stor, 30 Ukjet (til ød tadardfeil var( ˆ ) Estimert stadardfeil Pivotal ˆ E( ˆ ) X ~ N(0, 1) X ~ t ( 1) X tilærmet 1 KI for X z X t 1, ~ N(0, 1) X z Kofidesgrad Eksakt 1 Eksakt 1 Tilærmet 1

8 4 Bare (1) der X er vilkårlig fordelt i 0) lite Ukjet Ikke pesum Merkad 3. Uttrykket pivotal beteger e stokastisk variabel som avheger av ukjete parametre i modelle - e variabel som derfor ikke er observerbar - me som har kjet sasylighetsfordelig. Pivotaler er bl.a yttige ved kostruksjo av kofidesitervaller og tester. Merkad 4. ide t( 1)-fordelige er tilærmet lik N(0, 1) for 30, vil forskjelle mellom KI-ee i situasjo og 3 være eglisjerbar år 30. Tabell. Kofidesitervall for år X1, X,, X er uavhegige og ormalfordelte med Xi ~ N(, ). (Jeg vil atakelig ikke rekke å sakke om dette på forelesigee, så dette må leses på egehåd 4.) Hvis e stokastisk variabel, V, er kji-kvadratfordelt (avsitt 5.9.1) med k frihetsgrader, skriver vi kort: V greske bokstave kji ). p-kvatile i dee fordelige kaller Løvås, p ~ k -fordelt ( er de, som er det tallet som oppfyller P( V ) p. Noe kvatiler fies i tabell D6. Merk at kji-kvadrat fordelige ikke er symmetrisk (jfr. figur 5.5 side 190 i Løvås) slik at vi treger kvatiler i begge eder av fordelige for å utlede kofidesitervallet. e merkad 6.) p Modell Estimator Pivotal X1, X,, X er uavhegige og ( 1) ~ idetisk fordelte (uid) Vilkårlig ˆ med X ~ N(, ), i 1,,, (Regel 5.) i 1 Nedre kofidesgrese ( 1) Øvre kofidesgrese Kofidesgrad ( 1) 1 Eksakt 1 4 Les avsitt 5.9.1 (side 04 (190)) om kji-kvadratfordelige, med spesiell vekt på regel 5., og avsitt 6.3.4 (side 45 (30)) for relevat avedelse.

9 Merkad 5. Har vi fuet et KI for populasjosvariase, 1 KI for (der A og B er positive stokastiske variable) slik at være gitt ved [ A, B ]. Dette skyldes at begivehetee fuksjoe y ( A B), ka vi lett fie et for stadardavviket,, også. Hvis [ AB, ] er et P( A B) 1, så vil et 1 KI for rett og slett og ( A B) er logisk ekvivalete og derfor like sasylige (side x er e voksede fuksjo av x). [Illustrer selv de siste setige med et diagram over fuksjoe y x!]. Merkad 6. Utledig av kofidesitervallet for. (Jfr. avsitt 6.3.4 i Løvås.) ett V ( 1). I følge regel 5. er V - ~ 1 fordelt. For kvatilee 5 1 og har vi i følge defiisjoe av kvatiler og det at kji-kvadratfordelige er kotiuerlig, P( V 1 ) 1 P( V 1 ) 1 P( V 1 ) 1 (1 ) og PV ( /). Dermed blir (se figur 1): P( 1 V ) 1. Ved isettig for V får vi dermed ( 1) 1 1 1 P1 P 1 ( 1) ( 1) ( 1) ( 1) ( 1) P P 1 1 I de siste likhete har vi bare ordet om på ulikhete slik at de miste verdie kommer til vestre. Merk også at de adre likhete skyldes at år ma tar de iverse av begge sider av e ulikhet mellom positive tall, sur ulikhete rudt (for eksempel 4 1 4 1 ). 5 Hvis geerelt V er k -fordelt (med k frihetsgrader), er p-kvatile i Løvås defiert som et tall, skrevet, som oppfyller P( V ) p. p p

10 Regeeksempel. For de 37 kviehøydee (døtree), y1, y,, y 37 vi samlet i på forelesige 5. mars 01, ble estimatet for populasjos-stadardavviket,, lik 1 ˆ obs obs ( yi y) 5.9457 1 i1. Vi øsker et 95% KI for. om modell bruker vi (1) for de bakeforliggede stokastiske variablee, Y1, Y,, Y 37, og atar i tillegg at de er ormalfordelte, Yi ~ N(, ) for i 1,,,. (Normalfordeligsatakelse ases valigvis for realistisk for høydemåliger i homogee grupper.) Kofidesgrad 0.95, gir 0.05 og 0.05. Vi treger altså kvatilee 0.975 og 0.05 i kjikvadratfordelige med 1 36 frihetsgrader. Tabell E6 (D6) gir ku 0.975=0.57 og 0.05 53.0 for de ærmeste kji-kvadratfordelige som er 35 -fordelige. -fordelige 36 er ikke represetert i tabell E6 (D6), me vi ka bruke CHIINV-fuksjoe i Excel for 36 frihetsgrader som gir 0.975=1.34 og 0.05 54.44 Ut fra merkad 5 blir 95% kofidesitervallet for bereget til 36 36 36 36,, (0.81), (1.30) 4.4, 6.80 obs 54.44 1.34 0.05 0.975 obs obs Merk at estimatet ˆ obs 5.3 ikke ligger midt i kofidesitervallet (det er altså større usikkerhet til høyre for estimatet e til vestre - som skyldes ar kji-kvadratfordelige er e skjev fordelig). Dette iebærer at begrepet stadardfeil ikke kommer i som oe yttig begrep i dette tilfellet (og blir derfor ikke brukt i forbidelse med estimerig av eller ), i motsetig til kofidesitervall basert på ormalfordelige eller t-fordelige som ovefor. Om vi øsker et 95% kofidesitervall for variase,, får vi det, på gru av merkad 5, ved rett og slett å kvadrere tallee i itervallet for : (4.4),(6.80) 17.94, 46., der jeg bare tok med to desimaler i svaret for å gjøre itervallet lettere å lese i e evetuell rapport (de siste desimalee har lite tolkigsverdi uasett).

0 y 11 Merkad 7. Noe gager fier vi altså ikke akkurat de fraktile i tabelle (E6 (D6)) vi er ute etter., Til eksame, for eksempel, har vi ikke tilgag til Excel. Da er det lov å bruke øyemålsmetode (i magel av iterpolasjosmetoder som ikke er pesum). I så fall ser vi på de to ærmeste fordeligee som er represetert: Frihets- 0.975 0.05 grader 35 0.57 53.0 40 4.43 59.34 På øyemål aslår vi for eksempel 0.975=1.5 og 0.05 54. omtret for 36 frihetsgrader, som er godt ok i e eksamesbesvarelse. Figur 1 -fordelige. Graf laget med TATA.01.0.03.04.05 asylighetstetthete i kji-kvadratfordelige med 36 frihetsgrader 0.95 0.05 0.05 10 0 30 40 50 60 70 x 1.34 54.44

1 3 Aktuelle modelltyper Tabell 3 Tilærmet kofidesitervall basert på regel 5.0 (ormaltilærmig for biomisk, hypergeometrisk og poisso fordelig) Modell Estimator ˆ X X ~ bi(, p ) X ~ hypergeom. (, M, N) ( p M N) X tadardfeil var( ˆ ) Estimert stadardfeil E( ˆ ) Betigelse for akseptabel ormaltilærmelse p(1 p) (1 ) var( X ) 5 ( p(1 p) 5 p(1 p) N N 1 (1 ) N N 1 var( X ) 5 p (1 ) Pivotal ˆ E( ˆ ) tilærmet ~ N(0,1) Kofidesitervall ( kofidesgrad tilærmet 1 ) ˆ z E( ˆ ) z p (1 ) N N 1 tilærmet ~ N(0,1) z (1 ) (1 ) N N 1 X ~ pois( t) 6 ˆ X t t ˆ var( X ) 5 ( t t 5) ˆ ˆ t tilærmet ~ N(0, 1) ˆ z ˆ t Merkad 7 Merk at de tre KI-ee i tabell 3 samt KI-ee i situasjo 1 og 3 i tabell 1 alle har de geerelle forme agitt i regel 6.8 (6.7) der E står for stadardfeil eller estimert stadardfeil dersom E( ˆ ) avheger av ukjete parametre. Utak fra regel 6.8 (6.7) er gitt i 6 Husk at otasjoe X ~ pois( m ) er valgt slik at det som står på m s plass alltid er lik EX ( ) (som også er lik var( X ) i poisso-fordelige). Hvis det for eksempel i e oppgave fremgår at X ~ pois(3.7), følger automatisk at E( X ) var( X ) 3.7. Av modelle i tabelle følger således at E( X ) var( X ) t som impliserer at ˆ er forvetigsrett side ˆ X 1 1 E( ) E E( X ) t. Variase (lik kvadrert stadardfeil) blir t t t ˆ X 1 1 var( ) var var( X) t. t t t t

13 tabell og situasjo uder tabell 1. Argumetasjoe fra pivotal-utsaget til kofidesitervallet er gitt i avsitt 6.3.1. rett etter regel 6.8 (6.7). Merkad 8 I mage KI (jfr tabell 1 og 3) bruker vi altså de estimerte versjoe av stadardfeile (i tilfelle stadardfeile er ukjet) år vi utleder et KI. Det er ikke på oe måte opplagt at vi har lov til dette. Det er rimelig å teke seg at e slik fremgagsmåte ville kue ødelegge tilærmelse til N(0, 1), oe som ville gjøre kofidesgrade tvilsom. Det at vi ifølge modifisert regel 6.8 (6.7) (b) faktisk har lov til å erstatte E med e estimert versjo ute å berøre kofidesgrade vesetlig, er egetlig gaske overraskede sett i lys av e ofte betydelig usikkerhet i estimerige av. For eksempel for kviehøydee i merkad 6 ble kofidesitervallet for 4.4, 6.80 som idikerer e ikke ubetydelig usikkerhet Likevel vil etter modifisert regel 6.8 (6.7) (b) kofidesgrade for KI-et for ikke bli vesetlig berørt om vi bytter ut med ˆ i stadardfeile. Merkad 9 Det at vi har formler for usikkerhetsdele, c E( ˆ ), i et kofidesitervall for der utvalgsstørrelse igår, gjør det mulig å bestemme ødvedig størrelse () på utvalget for å oppå at usikkerhete ikke overstiger e gitt (akseptabel) grese. like beregiger ka være viktige ved plaleggige av e statistisk udersøkelse. Eksempler på slike beregiger er gitt i eksemplee 6.9, 6.11 og 6.14 i Løvås. 4 Regresjosmodelle KI-ee for ukjete parametre i de ekle stadard regresjomodelle med ormalfordelte restledd følger samme møsteret som situasjo i tabell 1, med eeste forskjell at frihetsgrader beyttes i t-fordelige istedefor 1 som i situasjo. KI-et har i alle tilfeller forme ˆ t, E( ˆ ) og kofidesgrade 1 gjelder eksakt for alle 3. Det du treger i tillegg er derfor bare formler for ˆ og E( ˆ ), som du fier i Løvås kap. 7, eller regresjo-ii otatet som sart legges ut på ettet. Notatet gir også eksempler på beregig av slike KI-er.