Kapittel 9 og 10: Hypotesetesting

Kapittel 9 og 1: Hypotesetesting Hypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker vi å undersøke påstander om verdien på populasjonsparametre som for eksempel μ og p. Dette formuleres som en hypotesetest: eller eller H H H : θ θ : θ θ : θ θ mot mot mot H H H : θ > θ : θ < θ : θ θ Merk: Ofte skrives alternativ hypotese som H 1 i stedet for H. 1

Eksempel: Juks på meieriet? Melkemengden som fylles i 1-liters melkekartonger er normalfordelt med forventning μ og kjent standardavvik σ.2. μ skal være 1., men det påstås at μ < 1., dvs at det systematisk tappes for lite melk på melkekartongene. Undersøk dette. Hypotesetest: H : μ 1. mot H : μ < 1. For å undersøk dette måles nøyaktig mengde melk i n5 tilfeldig valgte kartonger. Disse målinger gav et gjennomsnitt på.996. Dvs ˆ μ x.996 Gir dette grunnlag for å påstå at μ < 1.? 2

Generelt Ut fra informasjonen i et tilfeldig utvalg vil man enten forkaste H og påstå H, eller ikke forkaste H (akseptere H ). Mulige utfall: H sann H gal Forkaster H Type I feil OK Forkaster ikke H OK Type II feil Prinsipp: Vi antar i utgangspunktet at H er korrekt, påstår først H dersom dataene peker klart i retning av H. Vi prioriterer derfor å holde sannsynligheten for type I feil liten. Setter derfor: P(type I feil) P(forkaste H H er sann) kalles (signifikans-)nivået til testen. 3

Sette opp hypoteser: Når man skal formulere en problemstilling som en hypotesetest er det ofte best å starte med å sette opp den alternative hypotesen. Den alternative hypotesen er den påstanden vi skal undersøke om er tilfelle. I eksemplet med Juks på meieriet? om forventet mengde melk er mindre en 1 liter, dvs om μ < 1.. Vi setter da som nullhypotese at dette ikke er tilfelle, dvs i melkeeksemplet at μ 1. og får H : μ 1. mot H : μ < Eventuelt kan vi skrive (betyr i praksis det samme): Merk: 1. H : μ 1. mot H : μ < 1. En hypotesetest er alltid en test om verdien på en parameter, for eksempel om μ eller p. En test skal derfor alltid formuleres med parametre i nullhypotesen og alternativ hypotese aldri 4 tilfeldige variable eller lignende.

Hypotesetester for μ når σ kjent X 1, X 2,, X n uavhengige og N(μ, σ 2 ) Eksempel: Juks på meieriet? H : μ 1. mot H : μ< 1. Generelt: H : μ μ mot H : μ < μ Vi antar i utgangspunktet at H er korrekt, dvs at μμ. Får da: Z X E( X ) X μ Var( X ) σ / n ~ N(,1) Vi forkaster H dersom μˆ retning av H 1 - her dersom enn μ. X peker klart i er klart mindre Hvor mye mindre er klar mindre enn? X 5

-z Vi forkaster H dersom X er så mye mindre enn μ at Z -z der P(Z -z H ) P(type I feil) Sanns. for at Z -z dersom H er sann er så liten,, at dersom dette skjer velger vi heller å tro at H er sann. Helt analogt vil man for hypotesetesten H μ mot μ> μ : μ H : forkaste H dersom Z z z

For den tosidige hypotesetesten H : μ μ mot H : μ μ forkaste vi H dersom Z - z /2 eller Z z /2 /2 /2 -z /2 z /2 Merk: Testene vi har sett på så langt gjelder for situasjonen med normalfordelte data med kjent standardavvik/varians. Dersom dataene ikke er normalfordelte, men antall målinger, n, er stor vil testene fremdeles gjelde tilnærmet pga sentralgrenseteoremet. 7

Eksempel: Juks på meieriet? For melkemengde i ulike kartonger kan vi anta at X 1, X 2,, X n er uavhengige og N(μ,.2 2 ). Vi skal teste: H : μ 1. mot H : μ < 1. Vi velger nivået.5. Vi forkaster da H dersom Z -z - z.5-1.645 n5 målinger gav et gjennomsnitt på: ˆ μ x.996 Dette gir: x z σ / μ.996.2 1. n / 5 1.41-1.41>-1.645, dvs vi beholder H. Dataene gir ikke grunnlag for å hevde at μ < 1.. 8

Eksempel: Høyde menn. Vi antar at høyde menn er normalfordelt med ukjent forventningsverdi μ og kjent standardavvik σ 7.8. Ønsker å teste: H : μ 179 mot H : μ 179 n 35 målinger i klassen gav Bruk 5% nivå og utfør testen. x 182.2 9

Hypotesetester for μ når σ ukjent X 1, X 2,, X n uavhengige og N(μ, σ 2 ) Vi begynner med å se på testen: H : μ μ mot H : μ > μ Vi har som før at: Z X E( X ) X μ Var ( X ) σ / n ~ N(,1) Men nå er σ ukjent og må erstattes med estimatoren S. Vi får da at: T X μ ~ t( n S / n 1) Dette gjelder dersom H er korrekt, dvs dersom μμ. Vi forkaster da H dersom μˆ X peker klart i retning av H - her dersom X er klart større enn 1 μ.

Mer presist så forkaster vi H dersom X mye større enn μ at T t,n-1 der: P(T t,n-1 H ) P(type I feil) er så Sanns. for at T t,n-1 dersom H er sann er så liten,, at dersom dette skjer velger vi heller å tro at H er sann. t,n-1 Helt analogt vil man for hypotesetesten H : μ μ mot H : μ < μ forkaste H dersom T -t,n-1 -t,n-1 11

For den tosidige hypotesetesten H mot μ μ : μ μ H : forkaste vi H dersom T - t /2,n-1 eller T t /2,n-1 /2 /2 -t /2, n.1 t /2,n-1 Merk: Disse testene (hvor vi bruker t-fordeling) gjelder kun for situasjonen med normalfordelte data med ukjent standardavvik/varians. 12

Eksempel: En påstand om at forventet årslønn i en bestemt næring (dvs gj.sn. årslønn for alle i næringen/hele populasjonen) er større enn 4 skal undersøkes. Vi antar at årslønnen til personer i næringen er normalfordelt med ukjent forventning μ og ukjent standardavvik σ. For å undersøke denne påstanden blir årslønnen til 24 tilfeldig valgte personer i næringen registrert. Dette gav et gjennomsnitt på 437 og et standardavvik på 63. Utfør testen på 5% nivå. H : μ 4 mot H : μ > 4 Med.5 og n24 blir t,n-1 t.5,23 1.714, dvs vi forkaster H dersom T 1.714. T X S μ / n 437 63 / 4 24 2.88 Dvs vi forkaster H og kan påstå at forventet årslønn i næringen er større enn 4! 13

Eksempel: Høyde menn. Vi antar at høyde menn er normalfordelt med ukjent forventningsverdi μ og ukjent standardavvik σ. Ønsker å teste: H : μ 179 mot H : μ 179 n 35 målinger i klassen gav x 182.2 og s 7.8. Bruk 5% nivå og utfør testen. 14

Hypotesetester for p (når n er stor) p P( suksess ) andel suksesser i populasjonen. X Bin(n,p). Estimator for p: Eksempel: p ˆ Vareprøve. ksepterer kun en ny type vare dersom vi er sikre på at andel defekte varer, p, er mindre enn.1. Basert på en stikkprøve av n varer ønsker vi å fastslå om p <.1 Generelt: X n H : p.1 mot H : p<.1 H : p p mot H : p< p Vi antar i utgangspunktet at H er korrekt, dvs at pp. pˆ E( pˆ) pˆ p Får da: Z N(,1 ) Var( pˆ) p (1 p )/ n (ok når np (1-p ) 5) 15

Vi forkaster H dersom enn p at Z -z der : pˆ er så mye mindre P(Z -z H ) P(type I feil) Sanns. for at Z -z dersom H er sann er så liten,, at dersom dette skjer velger vi heller å tro at H er sann. -z Helt analogt vil man for hypotesetesten H p p mot p> p : H : forkaste H dersom Z z z

For den tosidige hypotesetesten H : p p mot H : p p forkaste vi H dersom Z - z /2 eller Z z /2 /2 /2 -z /2 z /2 Merk: Disse siste testene gjelder for situasjoner der vi har gjort et binomisk forsøk med np (1-p ) 5. 17

Eksemplet: Vareprøve H : p.1 mot H : p <.1 I en stikkprøve på n15 varer ble det observert x 7 defekte varer, dvs x 7 pˆ n 15.47 Velger.5. Vi forkaster da H dersom Z -z - z.5-1.645 Z p pˆ (1 p p ) / n.47.1(1.1.1) / 15 2.16-2.16 < -1.645 dvs vi forkaster H. Dataene gir grunnlag for å påstå at p <.1 dvs varen aksepteres! 18

Eksempel: På en sykehusavdeling fikk tidligere 2% av pasientene en bestemt infeksjon. Etter en omlegging av rutinene fikk 32 av de 11 første pasientene denne infeksjonen. Tyder dette på at sannsynligheten for å få infeksjonen, p, har endret seg? Formuler problemstillingen som en hypotesetest og utfør testen. Bruk 1% nivå. 19

Til slutt: Utfallet av en hypotesetest er enten at vi forkaster H eller at vi ikke forkaster H. Tolkningen av disse to utfallene er: Forkaster H : Betyr at vi påstår at H er rett. Forkaster ikke H : Betyr at situasjonen er uavklart. Enten så er H korrekt, eller så er H korrekt men vi har ikke nok data til å påvise det. Merk spesielt at vi aldri kan bevise at en nullhypotese er korrekt, vi kan bare eventuelt bevise at en alternativ hypotese er korrekt. Dersom vi ikke forkaster H betyr det altså bare at situasjon er uavklart - ikke at vi har bevist at H er rett! 2

Oppsummering Hypotesetester for μ, σ kjent: X 1, X 2,, X n uavh. og N(μ, σ 2 ) H : μ μ mot H : μ < μ Z X σ / μ n ~ N (,1) Forkaster H dersom Z -z -z H : μ μ mot H : μ > μ Forkaster H dersom Z z z H : μ μ mot H : μ μ Forkaster H dersom Z - z /2 eller Z z /2 /2 /2 -z /2 z /2

Hypotesetester for μ, σ ukjent: X 1, X 2,, X n uavh. og N(μ, σ 2 ) H : μ mot H : μ μ< μ X μ T ~ t ( n 1) S / n Forkaster H dersom T -t,n-1 -t,n-1 H : μ mot H : μ μ> μ Forkaster H dersom T t,n-1 t,n-1 H : μ μ mot H : μ μ Forkaster H dersom T -t /2,n-1 eller T t /2,n-1 /2 /2 -t /2,n-1 t /2,n-1

Hypotesetester for p (n stor): X Bin(n, p) H : p p mot H : p < p Z p pˆ (1 Forkaster H dersom Z -z p p ) / n N(,1) -z H : p p mot H : p > p Forkaster H dersom Z z z H : p p mot H : p p Forkaster H dersom Z - z /2 eller Z z /2 /2 /2 -z /2 z /2