Ecn 213 uke 18 (HG) Hyptesetesting II P-verdi
Testing av µ i uid- mdellen (Z-test) MODELL (Situasjn I) : X1, X2,, Xn uavhengige g identisk nrmalfrdelte ( N ( µσ, ) ) E X X i n n MODELL (Situasjn II): 2 ( i) = µ ( ukjent) g var( i) = σ ( kjent), = 1,2,,, der X1, X2,, Xn 2 ( i) µ ( ) g var( i) σ ( ), er vilkårlig. uavhengige g identisk frdelte (vilkårlig frdeling) E X = ukjent X = ukjent i = 1,2,, n der n 3. Skal teste H: µ µ (mt µ < µ ), H: µ µ (mt µ > µ ), eller H: µ = µ (mt µ µ ) Situasjn I X µ W = ~ N(,1) uansett µ. σ n X µ Testervatr: Z = σ n ( µ kjent hyptetisk verdi) Situasjn II X µ W = ~ N(,1) uansett µ ( n 3) S n X µ Testervatr: Z = S n eksakt Z ~ N (,1) hvis (g bare hvis) µ = µ Z ~ N (,1) hvis (g bare hvis) µ = µ S = Σ X X n 2 ( i ) ( 1) 2
Skal vi frkaste fr stre eller små verdier av Z? H Situasjn I Z X µ X µ + µ µ = = = W σ n σ n µ µ + σ n ~ N µ = µ! (,1) bare hvis Situasjn II X µ X µ + µ µ µ µ Z = = = µ µ S n S n W + ~ N (,1) bare hvis =! S n Frd. fr Z hvis µ < µ Frd. fr Z hvis µ = µ N (,1) Frd. fr Z hvis µ > µ Kritisk verdi er bestemt av ligningen Pµ = µ (frkast H ) = 3
Vanlige prblemstillinger (uid mdellen situasjn I g II). Prblem (i): H : µ µ mt H : µ < µ 1 -nivå test : " Frkast H hvis Z z " Ensidig prblem Prblem (ii) H: µ µ mt H1: µ > µ Ensidig prblem -nivå test: " Frkast H hvis Z z " Prblem (iii) H: µ = µ mt H1: µ µ `Tsidig prblem µ -nivå test : " Frkast s Z z eller Z z " H hvi 2 2 = P (frkast H ) = P ( Z z ) + P ( Z z ) = 2 + 2 µ = µ µ 2 µ 2 Frd. fr Z hvis µ = µ eksakt nivå men H 1 H H 1 µ i situasjn I, µ H µ H niv å i stuasjn II. H 1 H 1 µ µ Frd. fr Z hvis µ < µ N (,1) Frd. fr Z hvis µ > µ 4
Eksempel. Er feltet drivverdig fr utvinning av kadmium? Data stammer fra n = 3 steinprøver. La X være % kadmium i prøve i, i = 1,2,,3 i 2 MODELL: X1, X2,, Xn er uid med E( Xi) = µ ( ukjent), var( Xi) = σ ( ukjent), der µ er gjennmsnittlig % kadmium i feltet. Feltet regnes drivverdig hvis µ > 8. Vi ønsker å teste H : µ 8( µ ) mt H : µ > 8( µ ) 1 X Testervatr Z = ~ N(,1) hvis µ = µ = 8. S µ n.1 tabell E4(D4) Velg nivå =.1 z = 2.326 (kritisk verdi) ( n 3 situasjn II) ( Tilnærmet) 1%- nivå test: " Frkast H hvis Z z = 2.326"..1 DATA: n = 3, X = 9.6, S = 3.1 Knklusjn: Frkast H. (dvs. feltet drivverdig). Z X 8 9.6 8 = = = S 3 3.1 3 2.827 5
P-verdi ( signifikanssannsynlighet ) Definisjn. P-verdien er det minste signifikansnivå, sm ut fra data gir knklusjnen, "Frkast H ". Skriv: ˆ fr p-verdien. ˆ er bestemt av data (ikke frskeren). Alternativt (ekvivalent) testkriterium: " Frkast H h vis ˆ ", der er det valgte nivået. I eksemplet: H: µ 8 ( µ ) mt H1: µ > 8( µ ) X µ -nivå test: " Frkast H hvis Z = z ". S n Observert verdi: z = Z = 2.827 ˆ her mtrent Nivå ( ) Kritisk verdi ( ) Knklusjn 5% 1.645 Frkast 1% 2.326 Frkast.5% 2.576 Frkast.1% 3,9 Ikke frkast z H H H H 6
La z være ervert Z ( z = Z = 2.827 i eksemplet) Bruksanvisning fr å finne p-verdien ( fr prblemet H : µ µ (mt µ > µ )) Finner p-verdien sm den slik at kritisk verdi blir lik ervert verdi av testervatren dvs. slik at z z ˆ = Siden kritisk verdi, z, ppfyller Pµ = µ ( Z z) = fr alle, må vi ha ˆ ( ) ( ) = Pµ = µ Z z ˆ = Pµ = µ Z z Dermed blir frmelen fr p-verdien: ˆ = Pµ = µ ( Z z ) I eksemplet ˆ = P ( Z z ) = P ( Z 2.827) = P ( Z > 2.827) = µ = µ µ = µ µ = µ tabell E3(D3) = 1 P ( Z 2.827) = 1.9977 =.23 µ = µ En ekvivalent test med signifikansnivå, er " frkast H ˆ hvis ", slik at en p-verdi på.23% sier at enhver sm aksepterer et signifikansnivå ver.23% (f.eks. 5% eller 1%), ville frkaste H. 7
Naturlig tlkning av p-verdien, alternativet, H. 1 ˆ, er sm et mål på graden av evidens i data fr Dest lavere ˆ er, dest mer evidens innehlder data fr H. 1 Tilsvarende fr de t andre prblemene: Prblem (i): H: µ µ mt H1: µ < µ -nivå test : " Frkast H hvis Z z " P-verdi: ˆ = P Z z ) µ = µ ( (Sm før: z = Z ) Prblem (iii): H: µ = µ mt H1: µ µ -nivå test : " Frkast H hvis Z z eller Z z " " Frkast H ( G z ) 2 2 hv is Z z " 2 P-verdi: ˆ = Pµ = µ ( Z z ) = 2 Pµ = µ ( Z z ) = = 2 1 ( ) Merk at, fr a>, P( Z> a) = PZ ( < a) + PZ ( > a) = 2 PZ ( > a) siden N (,1)-frdelingen er symmetrisk m. 8
T-test fr µ i uid-mdellen (situasjn III) Hvis vi i tillegg til frutsetningene under situasjn II, kan frutsette at enkeltervasjnene kmmer fra en nrmalfrdeling, kan vi bruke T-test, sm gjelder eksakt fr alle n. MODELL (situasjn III): X1, X2,, Xn uavhengige g identisk nrmalfrdelte, ( X ~ N ( µσ, ) ), der både µ g σ er ukjente. n er vilkårlig. i X µ Sm før (fr knfidensintervall, regel 6.1 (6.9)), W= ~ tn ( 1) frdelt uansett µ. S n Testervatr: X µ µ µ T =, sm er lik W hvis µ = µ T = W + S n S n T ~ tn ( 1 ) hvis µ = µ (sm er nk til å bestemme kritisk verdi ). Hvis, f.eks. prblemet er H: µ µ mt H1: µ > µ, skal vi frkaste H fr stre verdier av T, dvs. fr T k der den kritiske verdien k bestemmes av ligningen P ( T k) k t = = = µ µ ( -kvantilen i tn ( 1)-frdelingen) Eksakt -nivå test: "Frkast hvis " H T t (Tilsvarende fr de andre prblemene side 4 - se regel 6.19 (6.16)). 9
Eksempel 6.28 (6.26) i Løvås: Påstått vekt av hamburgere, µ = 1g Gjertrud mistenker lavere g veier tilfeldige hamburgere. µ 8 n = DATA: 1.4, 97.3, 98.4, 94., 96.7, 11.2, 99.2, 97. x = 98.3, s x = 2.29 Skal teste H: µ 1 ( µ ) mt H1: µ < 1 Oppgave: Finn p-verdien. Mdell: Antar X, X,, X uid g nrmalfrdelt, X ~ N ( µσ, ), 1 2 der både µ g σ er ukjente. n i Testervatr: X 1 T =, sm er t (7)-frdelt hvis µ = 1. S n Vi frkaster H fr tilstrekkelig små verdier av T (dvs. fr T en kritisk verdi). ( P ( T t ) µ = 1 = ) En -nivå test: " Frkast hvis " µ 1 (der t H T t er -kvantilen i t(7)-frdelingen) P-verdi: ˆ = P = ( T t ), der t = T er ervert verdi. 1
Observert verdi av testervatren (T): t X 1 98.3 1 = T = = = S n 2.29 8 2.43 p-verdien = = Pµ = 1 T ˆ ( 2.43) Løvås angir denne sm ˆ.2 uten begrunnelse. Hvis µ = 1, er T eksakt t(7)-frdelt, så, m vi har tilgang til Excel, kan vi bestemme P ( T 2.43) nøyaktig. Til eksamen har vi ikke det, så vi må nøye ss µ = 1 begrenset infrmasjn fra tabell E.5 (D. 5): Nivå.25.1.5.25.1.5 Kritisk verdi -.711-1.415-1.895-2.365-2.998-3.499 Knklusjn frkast frkast frkast frkast ikke frkast ikke frkast (Merk at siden t(7)-frdelingen er symmetrisk m, Pµ = 1( T t ) = Pµ = 1( T t) = ) på øyemål P ( T 2.365) =.25 g P ( T 2.998) =.1 P ( T 2.43).2 µ = 1 µ = 1 µ = 1 En p-verdi på ca. 2% regnes sm ganske sterk evidens fr at H 1 : µ < 1 gjelder. 11
Eksempel på binmisk test Zener-krt fr en enkel test på «telepatisk evne». Frsøksleder (FL) stkker krtene g trekker et krt (rent tilfeldig). Frsøkspersnen (FP) sitter bak en skjerm g gjetter på hvilket krt FL har trukket. Dette gjentas (f.eks.) n = 3 ganger. MODELL: La X være antall riktige gjetninger i n = 3 frsøk. X~ bin( np, ), der per P(gjette riktig) i enkelt-frsøk. Hvis det ikke freligger nen «telepatisk evne» hs FP, vil hver gjetning være rent tilfeldig p = P(gjette riktig) = 1 5 =.2. Ønsker å knstruere en 5% -nivå test fr H: p.2 ( p) mt H1: p>.2 ( p). 12
Knstruksjn. X ~ bin( n, p) E( X ) = np g var( X ) = np(1 p) pˆ = X n er frventningsrett ( E( pˆ) = ( np) n = p) p(1 p) med standardfeil, SE( pˆ) = SD( pˆ) = n Hvis p> p =.2, vil X ha tendens til stre verdier naturlig test: " Frkast H hvis X k" der kritisk verdi, k, sm svarer til nivå, er bestemt av ligningen, P = ( X k) = ( =.5) Med Excel kan vi enkelt finne en passende k. Siden X bare kan anta hele verdier, er det ikke sikkert vi finner en k med nivå akkurat.5. Da velger vi k med tilsvarende nivå så nær.5 sm mulig. I praksis, hvis n ikke er fr liten, lager vi sm ftest en Z-test (med nivå ) basert på regel 5.2: p p ( ) var( X ) = np(1 p) 5 (ca.) X ~ N ( E( X ), SD( X )) = N np, np(1 p) ( ) I ligningen, Pp= p( X k) =, er p = p=.2 g X ~ N np, np(1 p) 13
I eksemplet er np (1 p ) = 3(.2)(.8) = 4.8, sm er litt på grensen fr akseptabel nrmaltilnærming. ( 1 p) ) X np Anta p = p. X ~ N np, np( Z = ~ N(,1) hvis p = p. np (1 p ) Nivå () =.5 gir kritisk verdi: k np = Pp= p(frkast H ) = Pp= p( X k) = P p= p Z np(1 p) k np 5% nivå = z k = np + z np(1 p) = 3(.2) + (1.645) 4.8 np (1 p ) k = 9.6 Tilnærmet 5% test : " Frkast H hvis X 9.6" " Frkast H hvis X 1" Nminelt nivå: =.5 (dvs. nivå) Eksakt nivå: eksakt = Pp= p( X 1) = 1 P ( 9) 1.9389.611 p= p X = = Excel ( P-verdi fr en ervasjn, x : ˆ = X = Pp= p( X x) ) 14
I praksis, hvis n ikke er fr liten, frmulerer vi dette sm en Z-test: Prblem: Å teste H: p p mt H1: p> p. Testervatr: Z = X np ˆ p p = np(1 p) p(1 p) n ~ N(,1) hvis p = p Tilnærmet -nivå test: " Frkast H hvis Z z " (der z er kritisk verdi her). Med data: x = X, får vi ervert testervatr, z = Z = X np np (1 p ) g p-verdi ˆ = P ( Z z ) 1 G( z ) p= p (der Gz ( ) er den kumulative frd. funksjnen i N(,1).) 15
Duke University 1938: 32 studenter deltk. n = 6 gjetninger. Resultat: 12 489 riktige gjetninger. Estimat: ˆ X x = Xs b = pb s = =.2815 n Observert testervatr når p =.2 pˆ z = Z bs = = p p ( 1 p n ) 4. 99 Excel P-verdi: ˆ = Pp= p( Z 4.99) =. 3 Altså veldig sterk evidens fr at p > 1 5! Eksperimentet imidlertid senere sterk kritisert av sannsynlighetsteretikere («vanskelig å kntrllere fr mange ptensielle feil-kilder, bl.a. stkking av krt»). Se gså kritisk diskusjn av slike eksperimenter i http://www.skepdic.cm/zener.html 16
Styrkefunksjnen () i n = 3 - tilfellet. ( ) Fr vilkårlig p (ikke fr nær eller 1): X ~ N 3 p, 3 p(1 p) γ ( p) Def heltallskrreksjn = P (frkast H ) = P ( X 1) = 1 P ( X 9) = 1 P ( X 9.5) p p p p 9. 5 3 p 1 G (der Gz ( ) er den kum. frd.-funksjnen i N(,1) ) 3 p(1 p) 17