ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 1 / 53
Oppsummering, del 3 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 2 / 53
Oppsummering, del 3 Oppsummering, del 3 Styrke, styrkefunksjon Tosidige tester Test for p i binomisk modell;. t-fordeling Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 3 / 53
, Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 4 / 53
Oversikt, del 4, t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 5 / 53
t-fordeling, Rett på definisjon: Utgangspunktet er målemodellen med normalantakelse: X 1,...,X n, u.i.f. tilf. var. der X i N(µ, σ 2 ). La σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2, og T = X µ S 2 n Def. Student s t-fordeling: Dersom X 1,...,X n, er n u.i.f. tilf. var. der X i er normalfordelt med forventning µ og varians σ 2, i = 1,...,n, så er T (Student s) t-fordelt med n 1 frihetsgrader: T t(n 1) Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 6 / 53
t-fordeling Obs: I den beskrevne situasjonen har vi: X µ σ 2 n N(0, 1) og X µ S 2 n t(n 1), Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 7 / 53
t-fordeling, Egenskaper til t-fordelingen: 0.5 0.4 0.3 0.2 0.1 0-4 -2 0 2 4 t-fordelingen er avhengig av antall frihetsgrader (n). Den blir mer og mer lik N(0, 1)-fordelingen når antall frihetsgrader øker. symmetrisk omkring 0 t-tabell!! n(x) f1(x) f2(x) f15(x) tyngre haler enn N(0, 1)-fordelingen Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 8 / 53
t-fordeling, Fraktiler i t-fordelingen: Def. t α,d Dersom T er (Student s) t-fordelt med d frihetsgrader, defineres tallet t α,d ved at P(T > t α,d ) = α. (Tilsvarer z α i N(0,1)-fordelingen.) Skisse av t(d)-fordeling; arealet P(T > t α,d ) = α er farget. 0 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 9 / 53
t-test, Situasjon der vi bruker t-test: Målemodellen m/normalantakelse og ukjent varians, σ 2 : n målinger: x 1,..., x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 ukjent. Obs. 1: X i normalfordelt Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 10 / 53
t-test, Obs. 1: X i normalfordelt Obs. 2: (Dersom n er stor, trenger vi ikke bry oss med t-fordeling.) Obs. 3: Målemodell 3 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 11 / 53
t-test, Eksempel: 10 blodsukkerinnholdmålinger: 4.1, 5.1, 4.3, 3.8, 3.7, 5.2, 4.5, 4.8, 3.6, 4.4 Ønsker å teste H 0 : µ = 4.0 mot H 1 : µ > 4.0 Vi antar at: De n = 10 målingene: x 1,..., x n ; kan betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable, der E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n, og der X i er normalfordelt og σ 2 er ukjent. Variansen,σ 2, estimeres med: σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 12 / 53
t-test, Vil teste: H 0 : µ = 4 mot H 1 : µ > 4 Under H 0 er (teststørrelse, nullfordeling) T = X 4 S 2 10 t(9) (jf. def. av t-fordeling) Forkaster H 0 dersom µ = X peker klart i retning av at H 1 er korrekt. Test (sign.nivå α): Forkast H 0 dersom 0.5 0.4 0.3 0.2 0.1 f9(x) T t α,9 0-3 -2-1 0 1 2 3 t(9) tetthet Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 13 / 53
t-test, Gjennomføring av test på 5% nivå: Sign.nivå, α = 0.05 t 0.05,9 = 1.83 Data: (Gj.sn. = 4.35, emp. varians = 0.3183) Utfall av: X 4 S 2 10 : 4.35 4 0.3183 10 = 1.962 Siden 1.962 > t 0.05,9 = 1.83, kan vi forkaste H 0. Dataene tyder på at virkelig blodsukkerinnhold, µ, er større enn 4. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 14 / 53
µ, målemodell, normalantakelse, ukjent varians, Oppsummering, t-tester, Målemodellen: n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 ukjent. Målemodell 3 Estimator for variansen: S 2 = σ 2 = 1 n 1 n i=1 ( Xi X ) 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 15 / 53
µ, målemodell, normalantakelse, ukjent varians,. t-test, ensidig., Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 S 2 n t α,n 1 0 Skisse av t-fordeling og forkastningsområde. Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom X µ 0 S 2 n t α,n 1 0 Skisse av t-fordeling og forkastningsområde. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 16 / 53
µ, målemodell, normalantakelse, ukjent varians,. t-test, tosidig., Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ µ 0 Forkast H 0 dersom X µ 0 S 2 n X µ 0 S 2 n t α/2,n 1, eller t α/2,n 1 0 Skisse av t-fordeling og forkastningsområde. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 17 / 53
µ, målemodell, normalantakelse, ukjent varians,. t-test, tosidig., Eksempel: Hardhet til et spesielt stål blir undersøkt; seks målinger (i kg/mm 2 ): 351, 322, 297, 291, 354, 322. Gjennomsnitt: 322.8; estimert varians (empirisk varians): 689.4 Man er interessert i om hardheten er forskjelig fra 300 kg/mm 2. Tyder resultatene på at hardheten er ulik 300? Målemodell med normalantakelse; ukjent varians. Estimator for variansen: S 2 = σ 2 = 1 n ( n 1 i=1 Xi X ) 2 Forventningen, µ: virkelig hardhet Vil teste: H 0 : µ = 300 mot H 1 : µ 300 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 18 / 53
µ, målemodell, normalantakelse, ukjent varians,. t-test, tosidig., Vil teste: H 0 : µ = 300 mot H 1 : µ 300 Under H 0 er (teststørrelse, nullfordeling) T = X 300 S 2 6 t(n 1) Forkaster H 0 dersom µ = X peker klart i retning av at H 1 er korrekt. Test (sign.nivå α): Forkast H 0 dersom T t α/2,n 1 eller T t α/2,n 1 0.1 0 0.5 0.4 0.3 0.2-3 -2-1 0 1 2 3 Skisse av t(5)-fordeling. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 19 / 53
µ, målemodell, normalantakelse, ukjent varians,. t-test, tosidig., Gjennomføring av test på 5% nivå: Sign.nivå, α = 0.05 α/2 = 0.025; t 0.025,5 = 2.57 Data: Utfall av: X 300 S 2 6 : 322.8 300 689.4 6 Siden 2.13 t 0.025,5 = 2.57 (og 2.13 t 0.025,5 = 2.57), kan vi ikke forkaste H 0. Det er ikke grunnlag i dataene for å hevde at virkelig hardhet, µ, er ulik 300 kg/mm 2. = 2.13 0.5 0.4 0.3 0.2 0.1 0-3 -2-1 0 1 2 3 Obs.: Jf. konklusjon med kjent varians: forkast H 0 ; z 0.025 = 1.96. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 20 / 53
Oversikt, del 4, t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 21 / 53
t-intervall, Med målemodell 1 (normalantakelse og kjent varians): (1 α) 100% konfidensintervall for µ er ) σ (X z 2 α/2 n, X + z σ 2 α/2 n Dette er basert på 1. kjent verdi av σ 2 2. Z = X µ σ 2 n N(0, 1) (normalantakelsen) Med målemodell 3 (normalantakelse og ukjent varians) må vi basere oss på t-fordelingen. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 22 / 53
t-intervall, Med målemodell 3 (normalantakelse og ukjent varians): (1 α) 100% konfidensintervall for µ er ) S (X t 2 α/2,n 1 n, X + t S 2 α/2,n 1 n Dette er basert på 1. σ 2 estimeres med σ 2 = S 2 = 1 n 1 n i=1 2. Normalantakelse og 3. T = X µ S 2 n t(n 1) ( X i X) 2, Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 23 / 53
t-intervall,, Eksempel: 10 blodsukkerinnholdmålinger: 4.1, 5.1, 4.3, 3.8, 3.7, 5.2, 4.5, 4.8, 3.6, 4.4 Ønsker et 95% konfidensintervall for virkelig blodsukkerinnhold. Vi antar at: De n = 10 målingene: x 1,..., x n ; kan betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable, der E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n, og der X i er normalfordelt og σ 2 er ukjent. µ: virkelig blodsukkerinnhold Variansen, σ 2, estimeres med: σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 24 / 53
t-intervall,, n = 10; 95% α = 0.05 t α/2,n 1 = t 0.025,9 = 2.262 Et 95% ( konfidensintervall for virkelig blodsukkerinnhold, µ, er ) S gitt ved: X 2.262 2 10, X + 2.262 S 2 10 Innsatt data (Gj.sn. = 4.35, emp. varians = 0.3183), blir utregnet intervall: ( ) ( ) 0.3183 0.3183 4.35 2.262 10, 4.35 + 2.262 10 = 3.95, 4.75 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 25 / 53
t-intervall, begrunnelse, Jf.: Generell definisjon av konfidensintervall: Situasjon: Data x 1,...,x n ; utfall av : X 1,..., X n ; n u.i.f. tilfeldige variable Ukjent parameter (i fordelingen til X i ene): θ Dersom L og U (L < U) er to funksjoner av X 1,...,X n, som er slik at: ( ) 1 α = P L θ U, sier vi at det utregnete intervallet (l, u) er et (1 α) 100% konfidensintervall for θ. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 26 / 53
t-intervall, begrunnelse, Obs. 1: Det utregnete intervallet (l, u): Framkommer når vi setter dataverdiene x 1,..., x n inn i funksjonene L og U. Obs. 2: Eventuelt tilnærmede intervall For t-intervallet er: L = X t α/2,n 1 S 2 n og U = X + t α/2,n 1 S 2 n Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 27 / 53
t-intervall, begrunnelse, ( S 2 X t α/2,n 1 } {{ n } L ) S 2, X + t α/2,n 1 }{{ n } U er et (1 α) 100% konfidensintervall for µ, fordi ( 1 α = P t α/2,n 1 X µ S 2 n t α/2,n 1 ) ( S 2 S 2 = P X t α/2,n 1 µ X + t }{{ n α/2,n 1 }}{{ n } L U = P ( L µ U ) ) Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 28 / 53
Konfidensintervall,, Målemodell 1; (1 α) 100% konfidensintervall for µ er ) σ (X z 2 α/2 n, X + z σ 2 α/2 n Målemodell 2; tiln. (1 α) 100% konfidensintervall for µ er ) S (X z 2 α/2 n, X + z S 2 α/2 n Binomisk modell; tiln. (1 α) 100% konfidensintervall for p er ( ) p(1 p) p(1 p) p z α/2 n, p + z α/2 n Målemodell 3; (1 α) 100% konfidensintervall for µ er S (X t 2 α/2,n 1 n, X + t α/2,n 1 S 2 n ) Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 29 / 53
Oversikt, del 4, t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 30 / 53
Test for forventningen, λt, i Poissonmodell, n liten, Eksempel: Overvåking av dødsrate for fugler (jf. fugleinfluensa); For et bestemt vann registreres det gjennomsnittlig 2.5 døde fugler pr. døgn under normale forhold. En dag registreres det 6 døde fugler. Gir dette grunnlag for å påstå at virkelig dødsrate har økt til over det normale? Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 31 / 53
Test, Poissonmodell,, Statistisk tenking: Vi betrakter resultatet (6 registrerte døde fugler i et døgn) som utfall av en tilfeldig variabel Y, der Y Poisson(λt), λ: ukjent, t = 1. Obs.: det er rimelig med Poissonfordeling for Y! λ 1, er forventet antall døde fugler ved det aktuelle vannet i løpet av et døgn. Normalt har vi: λ normalt = 2.5. Vi vil teste H 0 : λ = 2.5 mot H 1 : λ > 2.5 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 32 / 53
Test, Poissonmodell,, Vi vil teste H 0 : λ = 2.5 mot H 1 : λ > 2.5 Teststørrelse: Y ; nullfordeling: Y Poisson(2.5): 0.3 0.225 0.15 0.075 0 0 2 4 6 8 10 12 Dette beskriver hva som er tenkelige utfall under H 0 Store verdier av Y indikerer at H 1 er riktig. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 33 / 53
Test, Poissonmodell,, Store verdier av Y indikerer at H 1 er riktig. Derfor: Test: Forkast H 0 dersom Y k, der k (kritisk verdi) er slik at testen får nærmest mulig ønsket signifikansnivå. Kritisk verdi, k, finnes vha. Poissontabell (λt = 2.5) slik at sign.nivå = P(forkaste H 0 H 0 riktig) = P(Y k λt = 2.5) er nærmest mulig ønsket sign.nivå Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 34 / 53
Test, Poissonmodell,, Fra Poissontabell (λt = 2.5): y P(Y = y) 0 0.0821 1 0.0252 2 0.2565 3 0.2138 4 0.1336 5 0.0668 6 0.0278 7 0.0099 8 0.0031 9 0.0009 10 0.0002 11 0.0000 12 0.0000 13 0.0000 Vi må prøve oss fram med forskjellige verdier av k. Dersom vi ønsker sign.nivå (nærmest mulig) 0.05, ser vi at: P(Y 9) = 0.0009 + 0.0002 + 0 = 0.0011 P(Y 8) = P(Y = 8) + P(Y 9) = 0.0031 + 0.0011 = 0.0042 P(Y 7) = 0.0099 + 0.0042 = 0.0141 P(Y 6) = 0.0278 + 0.0141 = 0.0419 P(Y 5) = 0.0668 + 0.0419 = 0.1087 Dvs., med k = 6 får vi en test med sign.nivå 0.0419 0.05. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 35 / 53
Test, Poissonmodell,, Gjennomføring/konklusjon: Data: utfall av Y : 6 = k = 6 Konklusjon: Forkast H 0 ; (Test: Forkast H 0 dersom Y k) Det er grunnlag for å påstå at virkelig dødsrate (rate av registrerte døde fugler) har økt til over det normale. Skisser styrkefunksjonen til denne testen! Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 36 / 53
Oversikt, del 4, t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 37 / 53
Konfidensintervall, En (tosidig) test kan gjennomføres vha. av et konfidensintervall. For, dersom vi i målemodell 1 vil teste: H 0 : µ = µ 0 mot H 1 : µ µ 0, kan vi bruke: Test (sign.nivå α): Forkast H 0 dersom X µ 0 σ 2 n z α/2 eller Vi skal se at dette er det samme som: X µ 0 σ 2 n z α/2 Forkast H 0 dersom µ 0 ikke er inkludert i konfidensintervallet for µ. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 38 / 53
Konfidensintervall, Eksempel: Vi skal kjøpe smolt av en smoltoppdretter. Det hevdes at gjennomsnittsvekten til smolten i merden er 80 gram. Vekt av ni tilfeldig valgte smolt: gj.sn.-vekt: 76.87 gram. Vi er interessert i om vekten (gjennomsnittsvekt for alle smolt i merden) kan være ulik 80 gram. Tyder resultatene på at vekten kan er ulik 80 gram? Målemodell med normalantakelse; kjent varians, σ 2 = 10 2. Forventningen, µ: vekt (gjennomsnittsvekt for alle smolt i merden) Vil teste: H 0 : µ = 80 mot H 1 : µ 80 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 39 / 53
Konfidensintervall, Vil teste: H 0 : µ = 80 mot H 1 : µ 80 Test (sign.nivå α = 0.10): Forkast H 0 dersom X 80 10 2 9 z 0.05 eller Er det samme som: Forkast H 0 dersom X 80 10 2 9 z 0.05 10 X 80 z 2 10 0.05 9 eller X 80 + z 2 0.05 9 Er det samme som: Behold H 0 dersom 80 z 0.05 10 2 10 2 9 X 80 + z 0.05 9 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 40 / 53
Konfidensintervall, Behold H 0 dersom 10 2 80 z 0.05 10 2 9 X 80 + z 0.05 9 Er det samme som: behold H 0 dersom 10 2 10 X z 0.05 9 80 X + z 2 0.05 9 Dette siste betyr: behold H 0 dersom µ 0 = 80 90% konfidensintervall for µ. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 41 / 53
Konfidensintervall, Gjennomføring / konklusjon: 90% α = 0.1 z α/2 = z 0.05 = 1.645 Et 90% konfidensintervall for vekten, µ, er (innsatt data, gj.sn. = 76.87): ( ) ( ) 10 76.87 1.645 2 9, 76.87 + 1.645 10 2 9 = 71.4, 82.4 Dvs.: siden µ 0 = 80 ikke grunnlag for å hevde at µ 80. ( ) 71.4, 82.4, beholdes H 0. Dataene gir Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 42 / 53
Konfidensintervall, Generelt: La (L, U) være et (ev. tilnærmet) 100(1 α)% konfidensintervall for parameteren θ. Vi vil teste H 0 : θ = θ 0 mot H 1 : θ θ 0 Test: Forkast H 0 dersom θ 0 (L, U). Testen har signifikansnivå α (ev. tilnærmet). Veldig god måte å gjennomføre (tosidige) tester på! Obs.: dersom dette blir brukt for ensidig test får vi en annen sammenheng mellom intervallets konfidensgrad og sign.nivået til testen. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 43 / 53
Konfidensintervall, Eksempel: Hardhet til et spesielt stål blir undersøkt; seks målinger (i kg/mm 2 ): 351, 322, 297, 291, 354, 322. Gjennomsnitt: 322.8; estimert varians (empirisk varians): 689.4 Man er interessert i om hardheten er forskjelig fra 300 kg/mm 2. Tyder resultatene på at hardheten er ulik 300? Målemodell med normalantakelse; ukjent varians. Estimator for variansen: S 2 = σ 2 = 1 n ( n 1 i=1 Xi X ) 2 Forventningen, µ: virkelig hardhet Vil teste: H 0 : µ = 300 mot H 1 : µ 300 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 44 / 53
Konfidensintervall, Ønsker å bruke 5% signifikansnivå. Gjennomfører test vha. konfidensintervall; dvs., testen er: Forkast H 0 dersom et 95% konfidensintervall for µ ikke inneholder 300. Et 95% konfidensintervall for µ er gitt ved: ) S (X t 2 0.025,5 6, X + t S 2 0.025,5 6 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 45 / 53
Konfidensintervall, Et 95% konfidensintervall for µ er gitt ved: ) S (X t 2 0.025,5 6, X + t S 2 0.025,5 6 Innsatt data (Gj.sn. = 322.8, emp. varians = 689.4, t 0.025,5 = 2.571), blir utregnet intervall: ( ) ( ) 689.4 689.4 322.8 2.571 6, 322.8 + 2.571 6 = 295.2, 350.4 Konklusjon: Behold H 0 siden µ 0 = 300 (295.2, 350.4) siden µ 0 = 300 er inneholdt i konfidensitervallet. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 46 / 53
Konfidensintervall, Eksempel: Sammenligne meningsmålinger Forrige meningsmåling: 28% oppslutning Denne meningsmåling: 31% oppslutning Er det endring i virkelig oppslutning? Obs.: Sammenligner resultater fra to grupper; ikke standardmetode i dette kurset. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 47 / 53
Konfidensintervall, Modell: Forrige meningsmåling: X 1 B(n 1, p 1 ) Denne meningsmåling: X 2 B(n 2, p 2 ) X 1 og X 2 antas å være statistisk uavhengige. Vi vil teste H 0 : p 1 = p 2 mot H 1 : p 1 p 2 Vi vil teste H 0 : p 1 p 2 = 0 mot H 1 : p 1 p 2 0 Det vil være best å lage et konfidensintervall for p 1 p 2, og bruke dette til testen. p 1 p 2 estimeres med: p 1 p 2 = X 1 n 1 X 2 n 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 48 / 53
Konfidensintervall, p 1 = X 1 n 1, p 2 = X 2 n 2 E ( p 1 p 2 ) = E ( p1 ) E ( p2 ) = p1 p 2 Var ( p 1 p 2 ) = Var ( p1 ) + Var ( p2 ) = p 1 (1 p 1 ) n 1 + p 2(1 p 2 ) n 2 p 1 og p 2 er begge tilnærmet normalfordelte og de uavhengige. Vi kan da slutte at også p 1 p 2 er tilnærmet normalfordelt. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 49 / 53
Konfidensintervall, p 1 p 2 er tilnærmet normalfordelt. Altså: p 1 p 2 (p 1 p 2 ) p1 (1 p 1 ) n 1 + p 2(1 p 2 ) n 2 N(0, 1), tilnærmet Nevneren (standardavviket til p 1 p 2 ) kan tilnærmes med: p1 (1 p 1 ) + p 2(1 p 2 ). n 1 n 2 Bruker symbolet ŜD( p 1 p 2 ) for denne. Vi har: p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) N(0, 1), tilnærmet Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 50 / 53
Konfidensintervall, Vi har: Medfører: ( P Derfor: p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) N(0, 1), z α/2 p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) L ({}}{ P p 1 p 2 z α/2 ŜD( p 1 p 2 ) p 1 p 2 p 1 p 2 + z α/2 ŜD( p 1 p 2 ) }{{} U tilnærmet z α/2 ) 1 α ) 1 α Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 51 / 53
Konfidensintervall, Vi har altså at (L, U) er et tilnærmet (1 α)100% konfidensintervall for differansen p 1 p 2. Data: n 1 = 1120, n 2 = 1050; α = 0.05 α/2 = 0.025 og z 0.025 = 1.96 Utfall av p 1 p 2 : 0.28 0.31 = 0.03 p1 Utfall av ŜD( p (1 p 1 ) 1 p 2 ) = + p 2(1 p 2 ) : n 1 n 2 0.28(1 0.28) 1120 + 0.31(1 0.31) 1050 = 0.01959 Derfor, konfidensintervall: ( 0.03 1.96 0.01959, 0.03+1.96 0.01959 ) = ( 0.008, 0.068 ) Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 52 / 53
Konfidensintervall, Derfor, konfidensintervall: ( 0.03 1.96 0.01959, 0.03+1.96 0.01959 ) = ( 0.008, 0.068 ) Konklusjon: Siden 0 er inneholdt i intervallet kan vi ikke forkaste H 0. Det er ikke grunnlag for å påstå at virkelig oppslutning er endret. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 53 / 53