Oversikt over konfidensintervall i Econ 2130

Like dokumenter
Oversikt over konfidensintervall i Econ 2130

Oversikt over konfidensintervall i Econ 2130

Oversikt over konfidensintervall i Econ 2130

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Econ 2130 Forelesning uke 11 (HG)

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

MOT310 Statistiske metoder 1, høsten 2011

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Mer om utvalgsundersøkelser

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

ECON240 Statistikk og økonometri

Estimering 2. -Konfidensintervall

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Statistikk og økonomi, våren 2017

Kap. 9: Inferens om én populasjon

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk Eksamen mai 2017

Kap. 9: Inferens om én populasjon

Estimering 1 -Punktestimering

Kapittel 8: Estimering

Løsningsforslag Oppgave 1

Estimering 1 -Punktestimering

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Hypotesetesting, del 4

Oppgaver fra boka: X 2 X n 1

TMA4240 Statistikk Høst 2015

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

TMA4245 Statistikk Eksamen august 2015

Oversikt over tester i Econ 2130

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

TMA4240 Statistikk Høst 2016

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

STK1100 våren 2017 Estimering

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Løsningsforslag til eksamen i STK desember 2010

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

TMA4240 Statistikk Eksamen desember 2015

Løsningsforslag ST2301 øving 3

Populasjon, utvalg og estimering

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

TMA4240 Statistikk Høst 2009

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

Lineær regresjonsanalyse (13.4)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Påliteligheten til en stikkprøve

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

TMA4240 Statistikk H2010

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

«Uncertainty of the Uncertainty» Del 4 av 6

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

Oversikt over konfidensintervall i Econ 2130

EKSAMEN Løsningsforslag

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Transkript:

HG April 00 Oversikt over kofidesitervall i Eco 30 Merk at dee oversikte ikke er met å leses istedefor framstillige i Løvås, me som et supplemet. Løvås ieholder mage verdifulle kommetarer og eksempler. Geerell iledig med oe presiseriger. La θ være e ukjet parameter (populasjos-størrelse) i e statistisk modell. Uttrykket ukjet parameter betyr at de sae verdie av θ i populasjoe er ukjet. Når vi setter opp e statistisk modell (som represeterer populasjoe vi trekker data fra og trekigsprosedyre), atar vi i utgagspuktet at modelle er sa for e viss (ukjet) verdi av parametere θ og usa for alle adre verdier. Aførselstegee rudt sa ovefor skyldes at begrepet sa parameterverdi ku gir god meig i relasjo til populasjoe dersom forutsetigee som er foretatt i modelle er realistiske forutsetiger om populasjoe og måte data er trukket på. Uttrykket sa modell må også tas med e klype salt. Det ka argumeteres sterkt for at ige modell er sa som beskrivelse av e populasjo fra virkelighete. For eksempel fies det atakelig ige rettferdig terig i verde som i streg forstad oppfyller at alle de seks utfallee ved et kast er eksakt like sasylige (/6).. Det er mer sakk om at modelle er mer eller midre realistisk som beskrivelse av populasjoe. Modelle rettferdig terig (der alle utfallee har sasylighet /6) ka for eksempel godt være realistisk (og meget yttig) som modell for e kokret terig der sasylighetee for de seks utfallee i virkelighete bare er este like. På de ae side, år vi utleder kosekveser og koklusjoer basert på modelle, resoerer vi som om modelle var sa som iebærer at slike koklusjoer må være like realistiske som modelle, tolket som utsag om populasjoe. Det er utviklet mage statistiske metoder for å evaluere realisme av slike modeller. Slike metoder tas ikke opp i dette kurset, me er et viktig tema i videregåede økoometri. Løvås er så vidt ie på det i avsitt 7.3.8 (frivillig lesig) i forbidelse med regresjosaalyse.

La ˆ θ være e aktuell estimator for θ, og SE = SE( ˆ θ ) står for e eller ae estimert versjo av stadardfeile til ˆ θ. (Husk (NB!) at hvis ˆ θ er forvetigsrett, er stadardfeile til ˆ θ ikke oe aet e stadardavviket til ˆ θ, emlig var( ˆ θ ).) Det viser seg at alle kofidesitervall (KI) i pesum (iklusivt regresjosaalyse) - med et utak i tabell koker ed til samme form: ˆ θ ± c SE( ˆ θ ) der c er e kvatil bestemt av de valgte kofidesgrade. Dee kvatile er som oftest fra N(0,) -fordelige og oe gager fra t- fordelige (se situasjo i tabell (. Med kofidesgrade α, er for eksempel c = z α (dvs α -kvatile i N (0,) ) i situasjo og 3 i tabell og i alle situasjoer i tabell 3. Årsake til at dee type av KI er så valig er at det ofte fies teoremer (som for eksempel setralgreseteoremet og regel 5.0 og adre ligede) som viser at estimatore ˆ θ er tilærmet (i oe få tilfeller eksakt) ormalfordelt, ˆ θ ~ N( θ, var( ˆ θ)) = N( θ, SE( ˆ θ )). Dette iebærer (jfr. regel R i otat til kap. 5 om ormalfordelige) at tilærmet (*) ˆ θ θ SE( ˆ θ ) tilærmet ~ N(0, ) (*) gjelder bare utvalgsstørrelse (atall observasjoer) ikke er for lite (se eksempel uder). Løvås viser side 6 hvorda utsaget (*) leder til kofidesitervallet formulert i regel 6.7. Dessverre er regel 6.7 uødvedig severt formulert hos Løvås med få avedelser (det er få situasjoer der ˆ θ er eksakt ormalfordelt, me mage situasjoer der ˆ θ er tilærmet ormalfordelt ). Vi blir derfor ødt til å gi e modifisert reformulerig av regel 6.7 for å gjøre de mer avedelig:

3 Regel 6.7 (Løvås side 5) modifisert. (Normalfordelt kofidesitervall). (a) Hvis estimatoreθ ˆ er forvetigsrett og tilærmet ormalfordelt med stadardfeil SE( ˆ θ ), vil følgede itervall være et tilærmet 00( α )% kofidesitervall for θ (**) [ ˆ θ z ˆ ˆ ˆ α SE( θ), θ + zα SE( θ)] Hvis ˆ θ θ SE( ˆ θ ) i (*) er eksakt ormalfordelt, N(0,), vil itervallet ha eksakt kofidesgrad α (eller 00( α )% ). (b) Videregåede teoremer i sasylighetsteori viser at i situasjoer der stadardfeile, SE( ˆ θ ) = var( ˆ θ ) er ukjet (dvs avheger av ukjete parametre i modelle) så vil uder geerelle betigelser kofidesitervallet fortsatt ha kofidesgrad tilærmet 00( α )% om stadardfeile byttes ut med e estimert versjo. Med adre ord, utsaget (*) - og dermed (**) - gjelder fortsatt om SE( ˆ θ ) å står for estimert stadardfeil. (a) begrues som i Løvås side 6 der de eeste forskjelle er at det første likhetsteget byttes ut med : ˆ θ θ α P zα zα = som i Løvås side 6 = P θ zα SE( θ) θ θ + zα SE( θ) SE( ˆ θ ) ( ˆ ˆ ˆ ˆ ) (b) bygger på videregåede sasylighetsteori (delvis tatt opp i Stat-kurset og mye brukt i økoometrisk teori) som ikke behadles her i Stat. Eksempel (Basert på oppgave 5.6 i Løvås med y problemstillig). E spesialpedagog skal udersøke læreeve til = 900 tilfeldig utvalgte elever. I oppgave 5.6 atas at adele av alle skolebar (populasjoe) som har lærevasker, er p = 0,5, altså kjet. Vi skal å i stedet ata at p er ukjet og at 0,5 er et estimat for p basert på utvalget av 900 elever. Vi er iteressert i å berege

4 usikkerhete ved dette aslaget uttrykt ved et 95% kofidesitervall for p. For å komme oe vei, treger vi e statistisk modell for populasjoe og utvalgsmetode. Modell. La X være atall bar med lærevasker i et ret tilfeldig utvalg på = 900 elever trukket fra populasjoe av alle skolebar. Ata X ~bi(, p ) der p er adele av skolebar i populasjoe med lærevasker og atas ukjet. Merkad til modelle. Se for eksempel løsige på oppgave 5.6 på ettet for uke 4 for e mulig begruelse av modelle i dee situasjoe. Merk også at utvalget er forutsatt represetativt. Dette ligger i forutsetige om at utvalget er ret tilfeldig som ideelt sett (sjelde eksakt oppfylt i praksis, me ofte akseptabelt bra oppfylt) betyr at alle mulige utvalg på 900 fra populasjoe har samme sasylighet for å bli trukket ut. Ata at pedagoge fat 35 bar med lærevasker i utvalget. Tallet 35 er å å oppfatte som e observasjo av de stokastiske X variabele, X. De valige estimatore i dee modelle er =. Estimatet (dvs de observerte verdie p ˆ obs basert på data) får vi 35 ved å sette data i i estimatore, p ˆ obs = = 0,5. Oppgave er altså å berege et kofidesitervall for de ukjete p med 900 kofidesgrad (tilærmet) 95%: Om estimatore ˆp vet vi følgede ut fra teorie som er etablert i kurset til å: (a) ˆp er forvetigsrett. X [ E( ) = E = E( X) = p = p ] (b) Stadardfeile for ˆp er SE( ) = p( p)

5 X var( ˆ) var var( ) p ( ) ( p p = = X = p p = ). Dermed [ p( p) SE( ) = var( ) = ] (c) ˆp er tilærmet ormalfordelt, tilærmet ~ N( E( ), var( )) = N( p, SE( )). [ Dette følger av regel 5.0 som sier at hvis σ = var( X) = p( p) 5 og p ikke er veldig ær 0 eller, så er X tilærmet tilærmet ormalfordelt, X ~ N( E( X), var( X)) = N( p, p( p)). Side = 900 syes betigelse klart å være oppfylt. Dermed ka vi bruke regel R (i otat til kap. 5) som viser at tilærmet p( p) = X ~ N E( X), SD( X) = N p, = N( p, SE( p ˆ) ) ] p Av dette følger at de stadardiserte ˆp,, er tilæmet N(0,) -fordelt. Nå er stadardfeile, SE( ) ukjet side p er SE( ) ukjet. Dermed, år er stor ok (slik at var( X) = p( p) 5), vil i følge modifisert regel 6.7 (b) dee tilærmelse fortsatt ( ) være akseptabel om vi erstatter de ukjete stadardfeile med estimert stadard feil. I tråd med otasjoe slik Løvås (og Excel og STATA og adre pakker) bruker de, lar vi å SE( ) stå for de estimerte versjoe. Utsaget (*) blir i dee situasjoe dermed seede ut som ˆ θ θ p = SE( ˆ θ ) ( ) tilærmet ~ N(0, ) som gir et tilærmet ( α )00% KI for p: ± z ˆ ˆ α SE( p) = p± zα ( )

6 Med øsket kofidesgrad 95% treger vi kvatile z 0,05 =, 96, og kofidesitervallet blir utreget som ( ˆ obs pobs ) (0,5)(0,85) obs ±,96 = 0,5 ±,96 = 0,5 ± 0.0 = [0,3, 0,7] 900 Merkad. Usikkerhete ved aslaget p ˆobs = 0,5 er således i dette eksemplet bereget til ± 0,0 (geerelt ± z ˆ α SE( θ )). Vi ser dermed at begrepet usikkerhet ved e estimerig ikke er oe absolutt størrelse. De avheger ikke bare av utvalgsstørrelse () og populasjosvariase (her p( p) som er variase for atall suksesser i et ekelt biomisk forsøk), me også av de subjektivt valgte kofidesgrade! Merkad. (For å berolige lesere). Om du til eksame blir bedt om å berege et kofidesitervall som i eksemplet, treger du aturligvis ikke, om du ikke eksplisitt blir spurt om det, å komme opp med hele begruelse ovefor. Det vil valigvis være tilstrekkelig simpelthe å velge riktig formel i forhold til de aktuelle modelle og å kue sette i tallee korrekt. Du ka aturligvis ved tilleggsspørsmål risikere å bli bedt om å gjeomføre deler av argumetasjoe ovefor for aktuelle modell-typer som omfattes av pesum. Aktuelle modelltyper E valig modelltype er uid-modelle (egelsk iid) () La X, X,, X være uavhegige og idetisk fordelte stokastiske (uid) variable med E( Xi) = μ og var( Xi) = σ, der μ og σ tolkes som størrelser (som oftest ukjete) i e eller ae populasjo som data, x, x,, x trekkes fra.

7 Aktuelle estimatorer: ˆ μ = X og ˆ σ = S = ( X ) X som begge er forvetigsrette. i i= La α -kvatile i N (0,) - fordelige beteges med z α (slik at P( zα Z zα ) = α, der Z ~ N(0,)) La α -kvatile i t - fordelige beteges med t, α (slik at P( t, α T t, α ) = α, der T ~ t ). Merk at fordeligee t og N(0,) liger på hveradre: De er begge etoppet (klokkeformet) og symmetrisk rudt 0. Når er stor (dvs. 30 omtret), er forskjelle eglisjerbar. For små er t karakterisert ved litt tygre haler e N(0,) og litt flatere kurve rudt 0. Tabell Kofidesitervall for μ Situasjo Forutsetiger (modell) σ 3 4 () i tillegg til forutsetige X ~ N( μ, σ ), i =,,, Vilkårlig Kjet i () i tillegg til forutsetige X ~ N( μ, σ ), i =,,, Vilkårlig Ukjet i Bare () der X er vilkårlig fordelt i Bare () der X er vilkårlig fordelt i stor, 30 (til ød 0) Ukjet Stadardfeil var( ˆ μ ) σ σ σ Estimert stadardfeil σ S S Pivotal ˆ μ μ SE( ˆ μ) X μ ~ N(0,) σ X μ ~ t S X μ S tilærmet ~ N(0,) α KI for μ X ± z X ± t X ± z α, α α σ S lite Ukjet Ikke pesum S Kofidesgrad Eksakt α Eksakt α Tilærmet α Merkad 3. Uttrykket pivotal beteger e stokastisk variabel som avheger av ukjete parametre i modelle - e variabel som derfor ikke er observerbar - me som har kjet sasylighetsfordelig. Pivotaler er bl.a yttige ved kostruksjo

8 av kofidesitervaller og tester. Merkad 4. Side t -fordelige er tilærmet lik N(0,) for 30, vil forskjelle mellom KI-ee i situasjo og 3 være eglisjerbar år 30. Tabell. Kofidesitervall for σ år X, X,, X er uavhegige og ormalfordelte med Xi ~ N( μ,σ ). (Hvis e stokastisk variabel, V, er kji-kvadratfordelt (avsitt 5.9.) med k frihetsgrader, skriver vi kort: V ~ χ k. p-kvatile i dee fordelige kaller Løvås, χ, som er det tallet som oppfyller PV ( > χ ) = p. Noe kvatiler fies i tabell D6. p Merk at kji-kvadrat fordelige ikke er symmetrisk (jfr. figur 5.5 side 90 i Løvås) slik at vi treger kvatiler i begge eder av fordelige for å utlede kofidesitervallet. Se merkad 6.) p Modell Estimator Pivotal X, X,, X er uavhegige og ( ) S ~ χ idetisk fordelte (uid) Vilkårlig ˆ σ = S σ med X ~ N( μ, σ ), i =,,, (Regel 5.) i Nedre kofidesgrese ( ) S χ α Øvre kofidesgrese ( ) S χ α Kofidesgrad Eksakt α Merkad 5. Har vi fuet et KI for populasjosvariase, σ, ka vi lett fie et for stadardavviket, σ, også. Hvis [ A,B ] er et α KI for σ (slik at PA ( σ B) = α ), så vil et α KI for σ rett og slett være gitt ved [ A, B ]. Dette skyldes at begivehetee fuksjoe y ( A σ B) og ( A σ B) er logisk ekvivalete (og derfor like sasylige) side = x er e voksede fuksjo av x. [Illustrer selv de siste setige med et diagram over fuksjoe y = x!].

9 Merkad 6. Utledig av kofidesitervallet for σ. (Jfr. avsitt 6.3.4 i Løvås.) Sett V = ( ) S σ. I følge regel 5. er V χ. For kvatilee χ α og χ α har vi i følge defiisjoe og det at kji-kvadratfordelige er kotiuerlig, PV ( < χ ) = PV ( χ ) = PV ( > χ ) = ( α ) =α og α α α P( χ α V χα ) = α. Ved isettig for V får vi dermed α ~ PV ( > χ ) = α. Dermed blir (teg figur) ( ) S σ α = P χ α χ α = P = σ χ α ( ) S χ α ( ) S ( ) S ( ) S ( ) S = P σ = P σ χ α χ α χα χ α I de siste likhete har vi bare ordet om på ulikhete slik at de miste verdie kommer til vestre. Merk også at de adre likhete skyldes at år ma tar de iverse av begge sider av e ulikhet mellom positive tall, sur ulikhete rudt (for eksempel 4> 4< ). Regeeksempel. For de = 4 kviehøydee (døtree), y, y,, y 4 vi samlet i på forelesige. mars 00, ble estimatet for populasjos-stadardavviket, σ, lik ˆ σ obs = Sobs = ( yi y) = 5,889. Vi øsker et 95% KI for σ. Som modell i= bruker vi () for de bakeforliggede stokastiske variablee, Y, Y,, Y, og atar i tillegg at de er ormalfordelte, 4 Yi ~ N( μ, σ ) for i =,,,. (Normalfordeligsatakelse ases valigvis for realistisk for høydemåliger i homogee grupper.) Kofidesgrad 0,95, gir α = 0,05 og α = 0,05. Vi treger altså kvatilee χ og χ i kjikvadratfordelige med 0,975 0,05 = 4 frihetsgrader. Akkurat dee fordelige er ikke represetert i tabell D6 så vi ser på de to ærmeste fordeligee:

0 Frihetsgrader χ 0,975 χ 0,05 40 4,43 59,34 45 8,37 65,4 På øyemål aslår vi for eksempel χ =5, og χ = 60,9 omtret for 4 frihetsgrader. Ut fra merkad 5 blir 95% kofidesitervallet for σ bereget til 0,975 0,05 4S 4S 4 4,, (0,8), (.8) 4,77, 7,4 = S S = S S = obs χ0.05 χ0.975 60,9 5, obs obs [ ] [ ] Merk at estimatet ˆ σ obs = 5,8 ikke ligger midt i kofidesitervallet (det er altså større usikkerhet til høyre for estimatet e til vestre), og således at begrepet stadardfeil ikke kommer i som oe yttig begrep her i motsetig til kofidesitervall basert på ormalfordelige eller t-fordelige som ovefor. Øyemålsmetode er fullt akseptabel til eksame. Ellers ville lieær iterpolasjo (ikke pesum) gi litt bedre resultat. Aller best er å bruke CHIINV-fuksjoe i Excel som bereger de to kvatilee øyaktig til 5,45 og 60,56057 heholdsvis.

3 Aktuelle modelltyper Tabell 3 Tilærmet kofidesitervall basert på regel 5.0 (ormaltilærmig for biomisk, hypergeometrisk og poisso fordelig) Modell X ~bi( p, ) X ~ hypergeom. ( M,, N) ( p = M N) Estimator ˆ θ X = X = Stadardfeil var( ˆ θ ) Estimert stadardfeil SE( ˆ θ ) Betigelse for akseptabel ormaltilærmelse p( p) ( ) var( X ) 5 ( p( p) 5 p( p) N N ( ) N N var( X ) 5 p ( ) Pivotal ˆ θ θ SE( ˆ θ ) tilærmet ~ N(0,) Kofidesitervall ( kofidesgrad tilærmet α ) ˆ θ ± z SE( ˆ θ ) α ± z α p ( ) N N tilærmet ~ N (0,) ( ) ( ) N ± zα N X ~ pois( tλ) ˆ X λ = t λ t ˆ λ var( X ) 5 t ( tλ 5 ) ˆ λ λ ˆ λ t tilærmet ~ N(0, ) ˆ λ ± z α ˆ λ t Husk at otasjoe X ~ pois( m ) er valgt slik at det som står på m s plass alltid er lik EX ( ) (som også er lik var( X ) i poisso-fordelige). Hvis det for eksempel i e oppgave fremgår at X ~ pois(3,7), følger automatisk at EX ( ) = var( X) = 3,7. Av modelle i tabelle følger således at EX ( ) = var( X) = tλ som impliserer at ˆλ er forvetigsrett side ( ˆ X E λ ) = E = E( X) = t t t t λ = λ. Variase (lik kvadrert stadardfeil) blir ˆ X λ var( λ) = var = var( X) = tλ =. t t t t

Merkad 7 Merk at de tre KI-ee i tabell 3 samt KI-ee i situasjo og 3 i tabell alle har de geerelle forme agitt i regel 6.7 der SE står for stadardfeil eller estimert stadardfeil dersom SE( ˆ θ ) avheger av ukjete parametre. Utak fra regel 6.7 er gitt i tabell og situasjo uder tabell. Argumetasjoe fra pivotal-utsaget til kofidesitervallet er gitt i avsitt 6.3.. rett etter regel 6.7. Merkad 8 I mage KI (jfr tabell og 3) bruker vi altså de estimerte versjoe av stadardfeile (i tilfelle stadardfeile er ukjet) år vi utleder et KI. Det er ikke på oe måte opplagt at vi har lov til dette. Det er rimelig å teke seg at e slik fremgagsmåte ville kue ødelegge tilærmelse til N(0, ), oe som ville gjøre kofidesgrade tvilsom. Det at vi ifølge modifisert regel 6.7 (b) faktisk har lov til å erstatte SE med e estimert versjo ute å berøre kofidesgrade vesetlig, er egetlig gaske overraskede sett i lys av e ofte betydelig usikkerhet i estimerige av σ. For eksempel for kviehøydee i merkad 6 ble kofidesitervallet for σ [ 4,77, 7, 4 ] som idikerer e ikke ubetydelig usikkerhet Likevel vil etter regel 6.7 (b) kofidesgrade for KI-et for μ ikke bli vesetlig berørt om vi bytter ut σ med ˆ σ = S i stadardfeile. 4 Regresjosmodelle KI-ee for ukjete parametre i de ekle stadard regresjomodelle med ormalfordelte restledd følger samme møsteret som situasjo i tabell, med eeste forskjell at frihetsgrader beyttes i t-fordelige istedefor som i situasjo. KI-et har i alle tilfeller forme ˆ θ ± t, α SE( ˆ θ ) og kofidesgrade α gjelder eksakt for alle 3.