Eco 130 uke 15 (HG) Kofdestervall Løvås: 6.1., 6.3.1 3. (Avstt 6.3.4 6 leses på ege håd. Se også overskt over kofdestercvall ekstra otat på ettet.) 1
Defsjo av kofdestervall La θ være e ukjet parameter e statstsk modell med stokastske varable X1, X, (som geererer data x1, x, ) Et kofdestervall for θ, [ AB, ], med kofdesgrad 1, er et tervall der gresee A og B er erverbare stokastske varable som oppfyller PA ( θ B) = 1 (oe gager 1 ) (uasett hvlke verd de ukjete θ har), og der kofdesgrade, 1, er et tall subjektvt valgt av forskere F.eks. et 95% kofdestervall for θ betyr at kofdesgrade er 1 = 0.95 og = 0.05 Valge valg av kofdesgrad: (100% kofdes leder tl ubrukelge store tervall!) Kofdesgrad 1 0.90 (90%) 0.95 (95%) 0.99 (99%) 0.10 0.05 0.01
Kofdestervall (KI) for ud-modelle (stuasjo I) µ Stuasjo I: X, X,, X uavhegge og detsk ormalfordelte, X ~ N( µ, ), 1 der µ er ukjet og er kjet. Atall ervasjoer,, er vlkårlg. Eksempel 6.9 Løvås: E lettvt me uøyaktg metode å måle kroppstemperatur på, er å måle øret. La X represetere resultatet av e slk målg på e gtt paset. V atar X ~ N( µ, ), der = 0.5 C ases som kjet fra tdlgere udersøkelser. DATA: V har = 8 gjetatte og uavhegge målger på samme paset: 39.1, 38.8, 39.9, 38.9, 38.8, 38.7, 39.0, 38.5 MODELL (for data): X1, X,, X ud og ormalfordelte, X ~ N ( µ, ), med = 8 og = 0.5 kjet. OPPGAVE: Kostruer og bereg et 95% KI for µ (de sae kroppstemperature). Hva er uskkerhete ved estmerg av µ? 3
Kostruksjo av Z-tervall (stuasjo I): FL uke 1 s. 8 X ˆ 1, X,, X ud og ormalfordelte, X ~ N( µ, ) µ = X ~ N( E( X ), SD( X )) = N µ, X E( X) ˆ µ µ ˆ µ µ Z = = = ~ N(0, 1) SD( X ) Valgt kofdesgrad: 1 z = -kvatle N(0,1). Dvs. PZ ( > z ) = Utledg: ˆ µ µ 1 = P( z Z z ) = P z z = P z ˆ µ µ z = = P ˆ µ z µ ˆ µ + z P ˆ z ˆ z = µ + µ µ = = P ˆ µ z µ ˆ µ + z = P ( A µ B) = 1 Et 1 KI for µ stuasjo I er ˆ µ ± z (kalt " Z-tervall") der z er et uttrykk for uskkerhete tl ˆ µ. Uskkerhete avtar hvs atall ervasjoer,, øker, me øker hvs øke r. 4
Sde SE( ˆ µ ) = SD( ˆ µ ) =, ka v skrve formele for kofdestervallet for µ : 1 KI for µ : ˆ µ ± z ˆ ˆ = µ ± z SE( µ ) I eksemplet, = 8, = 0.5 SE( ˆ µ ) = 0.5 8 = 0.1768 og estmatet: ˆ µ = X = 38.96 95% kofdesgrad = 0.05 og z = z = 1.960 (tabell E.4 (D.4)) 0.05 [ ] Observert KI: ˆ µ ± z ˆ ˆ ˆ SE( µ ) = µ ± z SE( µ ) = 38.96 ± (1.96)(0.1768) = 38.61, 39.31 Estmergsuskkerhete varerer med de subjektvt valgte kofdesgrade. Kofdesgrad 1 z SE ( ˆ µ ) Uskkerhet SE( ˆ ) ˆ ± z µ 1 KI µ z SE( ˆ µ ) Legde Valgt 0.90 0.10 0.05 1.645 0.1768 0.9 [38.67, 39.5] 0.58 0.95 0.05 0.05 1.960 0.1768 0.35 [38.61, 39.31] 0.70 0.99 0.01 0.005.576 0.1768 0.46 [38.50, 39.4] 0.9 5
Ae problemstllg: Kofdestervall brukes av og tl som hjelp tl plaleggg av e udersøkelse - dvs. ved valg av utvalgsstørrelse (). I eksemplet: Hvor mage ervasjoer tregs for at uskkerhete tl skal bl ca. ± 0.1 C (dvs. der tervallets legde = 0.)? ˆµ Dvs. bestem slk at z0.05 0.5 = (1.96) = 0.1 (0.5) = (1.96) = [ 5 (1.96)] = 96.04 dvs = 96 0. 1 V fat: = 8 gr e uskkerhet (kofdesgrad 95%) på ± z ˆ 0.05 SE( µ ) =± 0.35 C Merk at v fat e eksakt løsg her sde var kjet lk 0.5. Hvs er ukjet, vl løsge avhege av e mer eller mdre foruftg gjetg på. 6
(Frekvetstsk) tolkg av kofdesgrade - f.eks. 95% Merk at det er OK å s (A) P ˆ µ z µ ˆ µ + z P 0.05 0.05 = ( A µ B) = 0.95 me det er forbudt (selvmotsgede) å s (Tllatt) (B) P (38.61 µ 39.31) = 0.95 (Forbudt) Dette skyldes at tervallet (A) er et stokastsk tervall (som represeterer de statstske metode brukt) og sasylghete (0.95) for at tervallet skal dekke de ukjete µ er bestemt på forhåd før data er kjet. Itervallet (B) er et kokret ekelt ervert tervall som resulterte tre gtte tall, 38.6, µ og 39.31, og utsaget 38.61 µ 39.31 ka kke ha oe ae sasylghet e 0 eller 1. Sasylghete er 0 hvs utsaget er galt og lk 1 hvs utsaget er sat. Adre mulgheter fs kke (dvs. frekvetstsk sasylghetsteor som represeterer skole brukt dette kurset). 7
I de frekvetstske tradsjoe bruker ma å erstatte sasylghetsutsaget (B), med adre formulerger som f.eks. V har e kofdes på 95% for at 38.61 µ 39.31 eller V er 95% skre på at 38.61 µ 39.31. eller - rett og slett - vse tl at tervallet har kofdesgrad 95%. er sat. Kofdese kommer fra at v teker oss det erverte tervallet, [38.61, 39.31], som ett av e sere tervaller oppådd ved å gjeta ekspermetet mage gager (hver gag med 8 ye ervasjoer) uder samme betgelser. Om dee (tekte) sere av tervaller vet v at ca. 95% av dem dekker de ukjete µ. 8
Kofdestervall (KI) for µ ud-modelle (stuasjo II) Stuasjo I er sjelde sde valgvs er ukjet. V ka lkevel beytte Z-tervallet for stuasjo I som KI for µ (selv om er ukjet) der erstattes med estmatore ˆ = S x, hvs er stor (tommelfgerregel 30 ) (følger av vderegåede sasylghetsteor) Stuasjo II X, X,, X ud der X har e vlkårlg (ukjet) fordelg f( x), 1 der både µ og er ukjete. Atall ervasjoer,, er st o r ( 30). Eksempel. Megde av Col-bakterer va er av og tl brukt som e dkator på foruresg. Atall col-bakterer er regstrert = 30 vaprøver tlfeldg trukket fra e elv DATA: x1, x,, x30 9 13 9 8 7 11 9 13 8 9 7 8 5 9 8 5 8 8 8 7 8 9 5 6 5 7 7 7 13 8 x = 8.13 ( = ˆ µ ) s = Σ( x x) x 1 1 =.1613 ( = ˆ ) Desty 0.1..3 Hstogram for atall colbakterer pr. vaprøve (med best tlpasset ormalfordelgstetthet, N(gj.stt(x), sd(x)) ) 4 6 8 10 1 14 x 9
Kostruksjo av Z-tervall for µ (stuasjo II): X, X,, X ud og vlkårlg med E( X ), var( X ) 1 FL uke 1 s. 9 setralgreseteoremet fordelte = µ = tlærmet ˆ µ = X ~ N( E( X ), SD( X )) = N µ, X E( X) ˆ µ µ = = SD( X ) ˆ µ µ tlærmet samme fordelg som ~ Z ~ N( 0, 1) ( 0) Vderegåede teor vser at sste utsag kke edres vesetlg om de ukjete 1 byttes ut med estmatore ˆ = S = Σ( X X) for stor ( 30 ca.) (ka vses) Dermed: x 1 ˆ µ µ har tlærmet samme fordelg s om Z ~ N(0, 1) ( 30) ˆ ˆ µ µ 1 = P( z Z z ) P z z ˆ ˆ som sde 4 = P ˆ µ z µ ˆ µ + z = ˆ Et KI med kofdesgrad tlærmet for µ er ˆ ˆ µ ± z ˆ ˆ = µ ± z SE( µ ) (Der SE å betyr estmert stadardfel). 1 10
ˆ Tlærmet 100(1 )% kof. tervall for µ stuasjo II - formel: ˆ µ ± z ˆ ˆ = µ ± z SE( µ ) ˆ ˆ P ˆ µ z ˆ µ µ + z 1 I colbaktere-eksemplet: = 30, ˆ µ = x = 8.13, ˆ = s =.1613 x Kofdesgrad 95% 1 = 0.95 / = 0.05 z = z = 1.96 ˆ.1613 Stadardfel: SE( ˆ µ ) = = = 0.3946... 30 0.05 0.05 Uskkerhet (95% kofdes): z SE ( ˆ µ ) = (1.96)(0.3946..) = 0.7734.. Tlærmet 95% kofdestervall for µ ˆ µ ± z ˆ SE( µ ) = 8.13 ± 0.77 = [7.36, 8.91] 11
Bestemmelse av utvalgsstørrelse () stuasjo II (ukjet ). 1 KI for µ (tlærmet): ˆ µ ± z Uskkerhet ( ): z ± Øsket uskkerhet (c): ˆ = ˆ estmerer z Bestem slk at ( z ) c Treger e (a pror) gjetg på Ofte brukt fremgagsmåte: Estmer z = c = z for å bestemme (omtretlg). fra e lte forudersøkelse (plotudersøkelse) c I Col-eksemplet: Ata utvalget på 30 vaprøver var e plotudersøkelse. V øsker å estmere med uskkerhet c = 0.. µ Kofdesgrad 95% z = 1.96 Aslag på fra plotudersøkelse: ˆ = (.16...) Dermed aslag på : = ( ) 1.96 (.16..) = 448.6... 4 49 0. 1
Kofdestervall (KI) for µ ud-modelle (stuasjo III) Stuasjo III: X, X,, X uavhegge og detsk ormalfordelte, X ~ N( µ, ), 1 der både µ og er ukjete. Atall ervasjoer,, er vlkårlg. Dee stuasjoe leder tl et såkalt T-tervall som er et raffemet av Z-tervallet med eksakt kofdesgrad selv for små hvs v ka ata at ervasjoee kommer fra e ormalfordelg. T-tervallet bygger på et klasssk teorem (utvklet av W.S. Gosset begyelse på 1900-tallet og publsert uder psevdoymet Studet ): Teorem. Jfr. Løvås avstt 6.3.3. Uder forutsetgee stuasjo III (med ormalfordelte ervasjoer), har X µ ˆ µ µ T = = eksakt e fordelg som heter t-fordelg (eller studet S S fordelg ) med 1 frhetsgrader, (skrevet kort: T~ t ( 1) (Om t-fordelge se este sde) 1 S = ˆ = ( X X) 1 = 1 13
Ltt om(studet) t-fordelge T-fordelge med r frhetsgrader ( tr ( )) lger på N(0,1)-fordelge. De er klokkeformet og symmetrsk om y-akse. Dessute ærmer de seg N(0,1) år r øker. For r 9 (ca.) er forskjelle eglsjerbar. (Matematsk formel avstt 5.9. kke pesum.) Z = X µ ~ N(0,1) T X µ = ~ t ( 1) S kvatle, t tr ( ), defert ved PT ( > t ) = (tabell E.5 (D.5)) Noe 0.05-kvatler r t-kvatl N(0,1) 3 3.18 1.96 7.365 1.96 9.045 1.96 14
Kostruksjo av T-tervall for µ (stuasjo III) X1, X,, X uavhegge og detsk ormalfordelte, X ~ N( µ, ), der både µ og er ukjete. Vlkårl g. X µ ˆ µ µ T= = ~ t ( 1) S ˆ Kofdesgrad 1, og PT ( > t ) = PT ( < t ) = S = ˆ ˆ µ µ ˆ ˆ 1 = P( t T t ) = P t t som sde 4 P ˆ µ t µ ˆ µ t = = + ˆ ( ˆ µ ( ˆ µ ) µ ˆ µ + t SE( ˆ µ ) ) = P t SE 1 kofdestevall for µ stuasjo III ( T-tervall med 1 frhetsgrader) ˆ ˆ µ ± t som gjelder for alle (kke defert for = 1). ˆ ˆ (Merk at ˆ µ ± t ˆ µ ± z ( Z-tervall) for 30.) 15
Kroppstemperatur-eksemplet. DATA: V har = 8 gjetatte og uavhegge målger på samme paset: 1 39.1, 38.8, 39.9, 38.9, 38.8, 38.7, 39.0, 38.5 x = 38.96 og s= Σ( x x) = 0.407 7 MODELL: X1, X,, X ud og ormalfordelte, X ~ N( µ, ), med = 8, µ og ukjete. [ ] Atakelse kjet lk 0.5 ga et 95% KI: 38.61, 39.31 95% KI å: Forutsetgee for T-tervall er oppfylt. tabell E.5(D.5) X µ T ~ t ( 1) t(7) t t0.05.365 S = = = = S 95% KI: ˆ 38. 96 (.365) 0.407 µ ± t = ± = 38.96 ± 0.35 = 38.61, 39.31 8 ( ) [ ] At dette tervallet ga samme verd som Z-tervallet, 38.96 (1.96) 0.5 ±, 8 skyldes e re tlfeldghet. Det kue lke gjere bltt større eller mdre avhegg av estmatet ˆ. 16
Merkader. Overskt over kofdestervall for adre parametre pesum er beskrevet et supplerede otat på ettet (se speselt regeeksempel 1 og avstt 3). Det gjelder p bomsk-, λ posso-, og M hypergeometrsk fordelg (Z-tervall basert på regel 5.0). Jeg rekker kke å ta dette på forelesgee, så det må leses på ege håd. Dsse tlfellee ka dukke opp oppgaver og tl eksame. Det samme gjelder også kj-kvadrat-tervall for og T-tervall for β, og µ ( x) = + βx regresjosmodelle. Behadlge av stuasjo II er særdeles ty Løvås. V går ltt mer detaljert fram her sde stuasjo II er mye brukt økoometr mer komplekse sammeheger, og økoomstudeter bør kjee ltt tl ratoale bak slk metodkk. (Mer Stat.) De fleste statstkk-pakker reger rutemessg ut T-tervaller for populasjosgjeomstt µ stedefor Z-tervall - uasett. Dette gjøres uasett om forutsetge om ormalfordelte ervasjoer er realstsk eller kke. Årsake er selvsagt at T-tervallet alltd er ltt større e det tlsvarede Z-tervallet slk at fele ma gjør om ormaltetsforutsetge er urealstsk ku fører tl at kofdesgrade øker ltt forhold tl de omelle ( 1 ) oe som kke er substaselt fel. V ser at T-tervallet er ltt mer koservatvt e det tlsvarede Z-tervallet. 17