ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 3. april Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 1/ 35 Oppsummering, del 4 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 2/ 35

Oppsummering, del 4 Oppsummering, del 4 t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell; n liten. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 3/ 35 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 4/ 35

Oversikt, del 5 Eksempler fra slutten av forrige uke Konfidensintervall Eksempler Eksempler (styrke, dimensjonering,...) Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 5/ 35 Konfidensintervall Generelt: La (L, U) være et (ev. tilnærmet) 100(1 α)% konfidensintervall for parameteren θ. Vi vil teste H 0 : θ = θ 0 mot H 1 : θ θ 0 Test: Forkast H 0 dersom θ 0 (L, U). Testen har signifikansnivå α (ev. tilnærmet). Veldig god måte å gjennomføre (tosidige) tester på! Obs.: dersom dette blir brukt for ensidig test får vi en annen sammenheng mellom intervallets konfidensgrad og sign.nivået til testen. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 6/ 35

Konfidensintervall Eksempel: Hardhet til et spesielt stål blir undersøkt; seks målinger (i kg/mm 2 ): 351, 322, 297, 291, 354, 322. Gjennomsnitt: 322.8; estimert varians (empirisk varians): 689.4 Man er interessert i om hardheten er forskjelig fra 300 kg/mm 2. Tyder resultatene på at hardheten er ulik 300? Målemodell med normalantakelse; ukjent varians. Estimator for variansen: S 2 = σ 2 = 1 n ( n 1 i=1 Xi X ) 2 Forventningen, μ: virkelig hardhet Vil teste: H 0 : μ = 300 mot H 1 : μ 300 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 7/ 35 Konfidensintervall Ønsker å bruke 5% signifikansnivå. Gjennomfører test vha. konfidensintervall; dvs., testen er: Forkast H 0 dersom et 95% konfidensintervall for μ ikke inneholder 300. Et 95% konfidensintervall for μ er gitt ved: ) S (X t 2 0.025,5 6, X + t S 2 0.025,5 6 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 8/ 35

Konfidensintervall Et 95% konfidensintervall for μ er gitt ved: ) S (X t 2 0.025,5 6, X + t S 2 0.025,5 6 Innsatt data (Gj.sn. = 322.8, emp. varians = 689.4, t 0.025,5 =2.571), blir utregnet intervall: ( ) ( ) 689.4 689.4 322.8 2.571 6, 322.8+2.571 6 = 295.2, 350.4 Konklusjon: Behold H 0 siden μ 0 = 300 (295.2, 350.4) siden μ 0 = 300 er inneholdt i konfidensitervallet. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 9/ 35 Konfidensintervall Eksempel: Sammenligne meningsmålinger Forrige meningsmåling: 28% oppslutning Denne meningsmåling: 31% oppslutning Er det endring i virkelig oppslutning? Obs.: Sammenligner resultater fra to grupper; ikke standardmetode i dette kurset. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 10 / 35

Konfidensintervall Modell: Forrige meningsmåling: X 1 B(n 1,p 1 ) Denne meningsmåling: X 2 B(n 2,p 2 ) X 1 og X 2 antas å være statistisk uavhengige. Vi vil teste H 0 : p 1 = p 2 mot H 1 : p 1 p 2 Vi vil teste H 0 : p 1 p 2 =0 mot H 1 : p 1 p 2 0 Det vil være best å lage et konfidensintervall for p 1 p 2,og bruke dette til testen. p 1 p 2 estimeres med: p 1 p 2 = X 1 n 1 X 2 n 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 11 / 35 Konfidensintervall p 1 = X 1 n 1, p 2 = X 2 n 2 E ( p 1 p 2 ) = E ( p1 ) E ( p2 ) = p1 p 2 Var ( p 1 p 2 ) = Var ( p1 ) + Var ( p2 ) = p 1 (1 p 1 ) n 1 + p 2(1 p 2 ) n 2 p 1 og p 2 er begge tilnærmet normalfordelte og de uavhengige. Vi kan da slutte at også p 1 p 2 er tilnærmet normalfordelt. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 12 / 35

Konfidensintervall p 1 p 2 er tilnærmet normalfordelt. Altså: p 1 p 2 (p 1 p 2 ) p1 (1 p 1 ) n 1 + p 2(1 p 2 ) n 2 N(0, 1), tilnærmet Nevneren (standardavviket til p 1 p 2 ) kan tilnærmes med: p1 (1 p 1 ) + p 2(1 p 2 ). n 1 n 2 Bruker symbolet ŜD( p 1 p 2 ) for denne. Vi har: p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) N(0, 1), tilnærmet Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 13 / 35 Konfidensintervall Vi har: Medfører: ( P Derfor: p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) z α/2 p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) ( {}}{ P p 1 p 2 z α/2 ŜD( p 1 p 2 ) L N(0, 1), tilnærmet p 1 p 2 p 1 p 2 + z α/2 ŜD( p 1 p 2 ) }{{} U z α/2 ) 1 α ) 1 α Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 14 / 35

Konfidensintervall Vi har altså at (L, U) er et tilnærmet (1 α)100% konfidensintervall for differansen p 1 p 2. Data: n 1 = 1120,n 2 = 1050; α =0.05 α/2 =0.025 og z 0.025 =1.96 Utfall av p 1 p 2 :0.28 0.31 = 0.03 Utfall av ŜD( p p1 (1 p 1 ) 1 p 2 )= + p 2(1 p 2 ) : n 1 n 2 0.28(1 0.28) 1120 + 0.31(1 0.31) 1050 =0.01959 Derfor, konfidensintervall: ( ) ( ) 0.03 1.96 0.01959, 0.03+1.96 0.01959 = 0.008, 0.068 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 15 / 35 Konfidensintervall Derfor, konfidensintervall: ( ) ( ) 0.03 1.96 0.01959, 0.03+1.96 0.01959 = 0.008, 0.068 Konklusjon: Siden 0 er inneholdt i intervallet kan vi ikke forkaste H 0. Det er ikke grunnlag for å påstå at virkelig oppslutning er endret. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 16 / 35

Konfidensintervall Hva er problemet med å gjennomføre ensidige tester på denne måten? Det er ikke noe problem dersom vi er nøye!! Illustrer med eksempelet med smoltdata: Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 17 / 35 Konfidensintervall Eksempel: Vi skal kjøpe smolt av en smoltoppdretter. Det hevdes at gjennomsnittsvekten til smolten i merden er (minst) 80 gram. Vekt av ni tilfeldig valgte smolt: gj.sn.-vekt: 76.87 gram. Vi er interessert i om vekten (gjennomsnittsvekt for alle smolt i merden) er mindre enn 80 gram. Tyder resultatene på at vekten er mindre enn 80 gram? Målemodell med normalantakelse; kjent varians, σ 2 =10 2. Forventningen, μ: vekt(gjennomsnittsvekt for alle smolt i merden) Vil teste: H 0 : μ =80 mot H 1 : μ<80 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 18 / 35

Konfidensintervall Vil teste: H 0 : μ = 80 mot H 1 : μ<80 Anta at vi ønsker å bruke sign.nivå α =0.10, og at vi vil bruke konfidensintervall for å gjennomføre testen. 90% konfidensitervall for μ: ( ) 10 2 10 2 X z 0.05, X + z 0.05 }{{ 9 }}{{ 9 } L U Dersom hele intervallet er nedfor (til venstre for) μ 0 =80, indikerer dette at H 1 er riktig. Mao., Testen er: Forkast H 0 dersom U<μ 0 =80. Sign.nivå til denne testen? Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 19 / 35 Konfidensintervall Forkast H 0 dersom U<μ 0 =80. Dette er det samme som: Forkast H 0 dersom: U = X + z 0.05 10 2 9 < 80 X 80 10 2 9 < z 0.05 Dvs. En slik måte å gjennomføre testen på svarer til en test med signifikansnivå på 5% (α/2). Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 20 / 35

Oversikt, del 5 Eksempler fra slutten av forrige uke Konfidensintervall Eksempler Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke Konfidensintervall Eksempler Eksempler (styrke, dimensjonering,...) Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 21 / 35 Tester kan gjennomføres vha.. Svært mye brukt. (Kombinasjon av og konfidensintervall er ideell!) Obs: Vi snakker ikke om suksessannsynligheten i en binomisk modell. Introduserer vha. eksempel: Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 22 / 35

Eksempel: Vi har gjort 20 kast med et pengestykke; 5 gav kron. Vi er interessert i p = P (kron). Vi betrakter resultatet (5 partall av 20 kast ) som utfall av en tilfeldig variabel Y, der Y B(n, p), n =20, p: ukjent. Vil teste H 0 : p =0.5 mot H 1 : p<0.5; Ønsker å bruke signifikansnivå 0.05. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 23 / 35 Vi vil teste H 0 : p =0.5mot H 1 : p<0.5 Teststørrelse: Y ; nullfordeling: Y B(20, 0.5): 0.2 0.15 0.1 0.05 0 0 5 10 15 20 Dette beskriver hva som er tenkelige utfall under H 0 Små verdier av Y indikerer at H 1 er riktig. Rødt: sannsynligheten for å få 5 eller et utfall som i enda sterkere grad peker i retning av at H 1 er riktig. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 24 / 35

H 0 : p =0.5 mot H 1 : p<0.5 Nullfordeling: Y B(20, 0.5): 0.2 0.15 0.1 0.05 0 0 5 10 15 20 B(20, 0.5)-fordeling; farget. en for resultatet er sannsynligheten som svarer til rødt areal. Dvs.: Sannsynligheten i nullfordelingen for å få 5 eller mindre. Liten p indikerer at H 1 er riktig. ( Lite sannsynlig å få et slikt resultat som vi har fått, dersom H 0 skal forutettes å være sann.) Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 25 / 35 Fra binomisk tabell (n =20,p =0.5): y P (Y y) 0 0.0000 1 0.0000 2 0.0002 3 0.0013 4 0.0059 5 0.0207 6 0.0577 7 0.1316 8 0.2517 9 0.4119 10 0.5881 11 0.7483 12 0.8684 13 0.9423 14 0.9793 15 0.9941 16 0.9987 17 0.9998 18 1.0000 19 1.0000 20 1.0000 Beregning av : Her: = P ( Y 5 p = 0.5 ) Her: = P ( Y 5 p =0.5 ) =0.0207 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 26 / 35 0.2 0.15 0.1 0.05 0 0 5 10 15 20 B(20, 0.5)-fordeling; farget.

Tosidig test, binomisk, n liten Gjennomføring/konklusjon: Siden en er mindre enn 0.05, forkastes H 0. Obs.1: Dette er nøyaktig det samme som å gjennomføre en test med kritiske verdier på 5% signifikansnivå. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 27 / 35 Generelt: Dersom en er lavere enn fastlagt signifikansnivå, forkastes H 0. (Da har teststørrelsen verdi i forkastningsområdet.) Generell definisjon av : Def.: en til et resultat er sannsynligheten beregnet under H 0 for å få det observerte resultatet eller et som i enda sterkere grad peker i retning av at H 1 er riktig. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 28 / 35

Eksempel: Vi skal kjøpe smolt av en smoltoppdretter. Det hevdes at gjennomsnittsvekten til smolten i merden er (minst) 80 gram. Vekt av ni tilfeldig valgte smolt: gj.sn.-vekt: 76.87 gram. Vi er interessert i om vekten (gjennomsnittsvekt for alle smolt i merden) er mindre enn 80 gram. Tyder resultatene på at vekten er mindre enn 80 gram? Målemodell med normalantakelse; kjent varians, σ 2 =10 2. Forventningen, μ: vekt(gjennomsnittsvekt for alle smolt i merden) Vil teste: H 0 : μ =80 mot H 1 : μ<80 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 29 / 35 Vil teste: H 0 : μ =80 mot H 1 : μ<80 Ønsker å bruke sign.nivå α =0.10 Teststørrelse og nullfordeling: Z = X 80 10 2 /9 N(0, 1) 0.5 0.4 0.3 0.2 Data, utfall av teststørrelse: 76.87 80 10 2 /9 = 0.94 0.1 0-3 -2-1 0 1 2 3 Null-fordeling; fargelagt. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 30 / 35

Teststørrelse og nullfordeling: Z = X 80 10 2 /9 N(0, 1) Data, utfall av teststørrelse: 76.87 80 10 2 /9 = 0.94 0.5 0.4 0.3 0.2 0.1 0-3 -2-1 0 1 2 3 Null-fordeling; fargelagt. H 1 : μ<80; små verdier av Z tyder på at H 1 er riktig. Derfor: = P ( Z< 0.94 ) =0.1736 >α=0.1 Dvs.: Behold H 0. Det er klart at: <α=0.1 er nøyaktig det samme som: Z< z α = z 0.1 = 1.282 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 31 / 35 Eksempel: Vi vil undersøke et tilsettingsstoff sin innvirkning på herdetiden til betong. Normal betong herder på 120 timer ved en gitt temperatur. Med tilsettingsstoffet ble 40 blokker laget og herdetiden registrert: gjennomsnitt = 113.5 timer; emp.standardavvik = 18.7. Tyder resultatene på at virkelig herdetid m/tils.stoff er annerledes enn for normal betong? Målemodell med normaltilnærming; dataene x 1,...,x 40 utfalll av n =40u.i.f. tilf.var. X 1,...,X 40. Forventningen, μ = E(X i ): virkelig herdetid m/tils.stoff Vil teste: H 0 : μ = 120 mot H 1 : μ 120 Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 32 / 35

H 0 : μ = 120 mot H 1 : μ 120 Ønsker å bruke sign.nivå α =0.05 Teststørrelse og nullfordeling: Z = X 120 S 2 /40 N(0, 1), tiln. 0.5 0.4 0.3 0.2 Data, utfall av teststørrelse: 113.5 120 18.7 2 /40 = 2.2 0.1 0-3 -2-1 0 1 2 3 Null-fordeling; fargelagt. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 33 / 35 Teststørrelse og nullfordeling: Z = X 120 S 2 /40 N(0, 1), tiln. Data, utfall av teststørrelse: 113.5 120 18.7 2 /40 = 2.2 0.5 0.4 0.3 0.2 0.1 0-3 -2-1 0 1 2 3 Null-fordeling; fargelagt. H 1 : μ 120; Z-utfalll langt fra 0 (positive eller negative) tyder på at H 1 er riktig. Derfor: = P ( Z< 2.2 ) +P ( Z>2.2 ) =2 P ( Z< 2.2 ) =2 0.0139 = 0.0278 <α=0.05 Dvs.: Forkast H 0. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 34 / 35

= P ( Z< 2.2 ) + P ( Z>2.2 ) =2 P ( Z< 2.2 ) =2 0.0139 = 0.0278 <α=0.05 Det er klart at: <α=0.05 er nøyaktig det samme som: Z< z α/2 = z 0.025 = 1.96 eller Z>z α/2. 0.5 0.4 0.3 0.2 0.1 0-3 -2-1 0 1 2 3 Null-fordeling; fargelagt. Bjørn H. Auestad Kp. 6: Hypotesetesting del 5 35 / 35