Kapittel 9: Estimeing TMA445 Statistikk 9.8,9.9: Estimeing, to utvalg. 9.6: Pediksjonsintevall Tuid.Follestad@math.ntnu.no p.1/13 Repetisjon: Punkt-og intevall-estimeing, eitt utvalg La X 1, X,..., X n vee eit tilfeldig utvalg få ein n(x; µ, σ)-populasjon. Geneelt: Kan finne punktestimato ved intuisjon/tolking av paameteen elle ved matematisk metode, fo eksempel SME. Estimato fo µ: ˆµ = X = 1 n n i=1 X i, med E( X) = µ, Va( X) = σ n. Desom σ e ukjent e S = 1 n 1 n i=1 (X i X) ein estimato fo σ. (1 α)100% konfidensintevall fo µ: [ x z α σ, x + z α σ (σ kjent) [ x t α,(n 1) s n, x + t α,(n 1) s (σ ukjent) Mek: Konfidensintevalla kan skivast (Kap. 9.5) punktestimat ± z α std.avvik til punktestimat og punktestimat ± t α,(n 1) std.avvik til punktestimat TMA445: Kapittel 9-del4 p./13
To utvalg Eksempel: Medisin: Test av ny blodtykksmedisin. Ko mykje bete e han enn noveande maknadsleiande blodtykksmedisin? Epidemiologi: E andelen kefttilfelle blant tidlegae kjemi-studenta ved Rosenbog støe enn i befolkninga elles? Mateialslitasje: Kva gi støst slitasje - italiensk mamo elle nosk ganitt? Bensinfobuk: Kva fo ein av to biltype buke minst bensin? Kva fo ein av to bensintype e dygast? Statistisk situasjon: Ønskje å samanlikne to populasjona baset på eit tilfeldig utvalg få kva populasjon. Ønskje å anslå diffeansen mellom foventningsvedi (elle andel) i dei to populasjonene, og eit intevall de vi ha sto tillit til at den sanne diffeansen i foventningsvedi (elle andel) ligg. Samanlikningane kan vee pavise elle ikkje pavise. TMA445: Kapittel 9-del4 p.3/13 To utvalg: Estimatoa (nomalfodeling) X (1) 1, X(1) X () 1, X(),..., X(1) : tilfeldig utvalg få ein n(x; µ 1, σ 1 )-populasjon,..., X() n : tilfeldig utvalg få ein n(x; µ, σ )-populasjon. Estimato fo µ 1 µ : ˆµ 1 ˆµ = X 1 X = 1 n1 i=1 X(1) i 1 n n j=1 X() j (intuitiv og SME). X 1 X e nomalfodelt med Desom σ 1 og σ e kjente så e E( X 1 X ) = µ 1 µ Va( X 1 X ) = σ 1 + σ n Z = ( X 1 X ) (µ 1 µ ) σ 1 + σ n n(z; 0, 1). TMA445: Kapittel 9-del4 p.4/13
To utvalg: konfidensintevall fo µ 1 µ nå σ 1 og σ e kjente Desom X 1 og X e gjennomsnitta til to tilfeldige utvalg av stoleik og n få populasjona med kjent vaians σ 1 og σ, så e eit (tilnæma) (1-α)100% konfidensintevall fo µ 1 µ ( x 1 x ) z α σ 1 + σ n (µ 1 µ ) ( x 1 x ) + z α σ 1 + σ n de z α e vedien i standad nomalfodelinga som ha aeal α til høge, dvs. P(Z > z α ) = α. TMA445: Kapittel 9-del4 p.5/13 Eksempel: Bensinfobuk Poblemstilling: Vil samanlikne to biltype A og B med tanke på skilnade i divstoffobuk. La Xi A vee #km/lite fo bil numme i, type A. La Xj B vee #km/lite fo bil numme j, type B. Anta at Xi A N(µ A, σa ), med kjent σ A =. Anta at Xj B N(µ B, σb ), med kjent σ B = 3. Obsevasjona: Gje n A = 1 målinga på bil A, med gjennomsnitt x A = 10 km/lite. Gje n B = 10 målinga på bil B, med gjennomsnitt x B = 8 km/lite. Vil finne 95% konfidensintevall fo µ A µ B. Estimato: ˆµ A ˆµ B = X A X B. Punktestimat: x A x B = km/lite. 95% konfidensintevall: α = 0.05, zα = z 0.05 = 1.96, [ 1.96 1 + 3, + 1.96 10 1 + 3 10 = [0.66,3.34 TMA445: Kapittel 9-del4 p.6/13
To utvalg: σ 1 = σ, men ukjente Desom σ 1 σ laga vi S 1 = 1 1 i=1 i X 1 ) og S = 1 n n 1 (X (1) j=1 (X () j X ) Desom vi veit at σ 1 = σ = σ så kan vi lage ein estimato S p (pooled) fo σ som ein lineækombinasjon av S 1 og S : S p = 1 1 + n 1 S 1 + n 1 1 + n 1 S = ( 1)S 1 + (n 1)S + n de X 1 = 1 n1 i=1 X(1) i og X = 1 n n j=1 X() j. TMA445: Kapittel 9-del4 p.7/13 To utvalg: konfidensintevall (1 α)100% konfidensintevall fo µ 1 µ : nå σ1 og σ e kjente: [( x 1 x ) ± z α s σ 1 + σ n nå σ 1 = σ = σ, men ukjente: s 1 [( x 1 x ) ± t α,( +n )s p + 1 n nå σ1 og σ e ukjente og ulike (tilnæma (1 α)100% konfidensintevall): s s 1 [( x 1 x ) ± t α,ν + s n de ν = (s 1 / + s /n ) [(s 1 /) /( 1) + [(s /n ) /(n 1) TMA445: Kapittel 9-del4 p.8/13
Eksempel: Bensintype Poblemstilling: (Henta få "The Catoon Guide to Statistics".) Vil samanlikne to type bensin, med tanke på fobuk pe km. To fosøksstategia: 1. Utsty n A tilfeldig valgte dosje med bensin av type A, og n B tilfeldig valgte dosje med bensin av type B. La X A i, i = 1,..., n A vee bensinfobuk (i km/l) til bilane med type A-bensin. La X B j, j = 1,..., n B vee bensinfobuk (i km/l) til bilane med type B-bensin. X A 1, XA,..., XA n A, X B 1, XB,..., XB n B alle uavhengige.. Utsty n tilfeldig valgte dosje med type A-bensin ein dag, og type B-bensin ein annan dag. La Xi A, i = 1,..., n vee bensinfobuk av type A-bensin på dei n bilane. La Xi B, i = 1,..., n vee tilsvaande bensinfobuk av type B-bensin på dei n bilane. X A i og X B i e ikkje uavhengige, typisk e Cov(X A i, XB i ) > 0. Paa (X1 A, XB 1 ),(XA, XB ),...,(XA n, XB n ) e uavhengige. Kva fo ein stategi e best? TMA445: Kapittel 9-del4 p.9/13 Konfidensintevall fo µ 1 µ fo pavise obsevasjona Desom d og s d e gjennomsnittet og standadavviket til nomalfodelte diffeansa av n pa av tilfeldige obsevasjona, så e eit (1-α)100% konfidensintevall fo µ D = µ 1 µ d t α,(n 1) s d µ D d + t α,(n 1) s d de t α,(n 1) e vedien i t-fodelinga med n 1 fidomsgade som ha aeal α til høge, dvs. P(T > t α,(n 1) ) = α. Se at dette e i tåd med konfidensintevall fo µ fo eitt utvalg: x t α,(n 1) s µ x + t α,(n 1) s TMA445: Kapittel 9-del4 p.10/13
Eksempel: Bensintype (fots.) Velge stategi. Obsevasjona (få "The Catoon Guide to Statistics"): n = 10 fosøk med obsevete vedia fo D i = Xi A Xi B (miles/gallon): i 1 3 4 5 6 7 8 9 10 d i 0.06-0.44-1.64-1.10 0.55-1.05-0.70-0.45-0.50-0.79 Anta D 1, D,..., D n u.i.f, D i N(µ D, σd ), de både µ D og σd e ukjente. Estimato fo µ D : ˆµ D = D, estimat d = 0.60. Estimato fo σ D : ˆσ D = S D = 1 n 1 P n i=1 (D i D), estimat s d = 0.38. 95% konfidensintevall fo µ D = E(D i ): α = 0.05, t α,n 1 = t 0.05,9 =.6, s d s d [ d t α,(n 1), d + t α n,(n 1) n = [ 0.60.6 0.38 0.38, 0.60 +.6 = [ 1.04, 0.16 10 10 Mek: Konfidensintevallet inneheld ikkje 0, og begge gensene e negative. Det e defo imelig å konkludee med at det e skilnad på bensintypene, dvs. µ D < 0. TMA445: Kapittel 9-del4 p.11/13 9.6 Pediksjonsintevall fo famtidig obsevasjon, nomalfodeling Fo ei nomalfodeling med ukjent foventningsvedi µ, men kjent vaians σ, e eit (1-α)100% pediksjonsintevall fo ein famtidig obsevasjon x 0 gitt som x z α σ 1 + 1 n < x 0 < x + z α σ 1 + 1 n de z α e vedien i standad nomalfodelinga som ha aeal α P(Z > z α ) = α. til høge, dvs. Fo ei nomalfodeling med ukjent foventningsvedi µ, og ukjent vaians σ, e eit (1-α)100% pediksjonsintevall fo ein famtidig obsevasjon x 0 gitt som x t α,(n 1)s 1 + 1 n < x 0 < x + t α,(n 1)s 1 + 1 n de t α,(n 1) e vedien i t-fodelinga med n 1 fidomsgade som ha aeal α til høge, dvs. P(T > t α,(n 1)) = α, og s = P n i=1 (x i x) TMA445: Kapittel 9-del4 p.1/13
Eksempel: Høgde studenta Menn Kvinne tettleik 0.00 0.01 0.0 0.03 0.04 0.05 0.06 tettleik 0.00 0.01 0.0 0.03 0.04 0.05 0.06 160 170 180 190 00 hogde, menn 155 160 165 170 175 180 185 hogde, kvinne Raudt: ˆµ og 95% konfidensintevall fo µ. Blått: 95% pediksjonsintevall fo famtidig obsevasjon av høgda til ein student. TMA445: Kapittel 9-del4 p.13/13