Kapittel 9 og 1: ypotesetesting ypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker vi å undersøke påstander om verdien på populasjonsparametre som for eksempel og p. Dette formuleres som en hypotesetest: Eksempel: Juks på meieriet? Melkemengden som fylles i 1-liters melkekartonger er normalfordelt med forventning og kjent standardavvik =.2. skal være 1., men det påstås at < 1., dvs at det systematisk tappes for lite melk på melkekartongene. Undersøk dette. ypotesetest: : 1. mot : 1. eller eller : : : mot mot mot : : : For å undersøk dette måles nøyaktig mengde melk i n=5 tilfeldig valgte kartonger. Disse målinger gav et gjennomsnitt på.996. Dvs ˆ x.996 Gir dette grunnlag for å påstå at < 1.? Merk: Ofte skrives alternativ hypotese som 1 i stedet for. 1 2
Generelt Ut fra informasjonen i et tilfeldig utvalg vil man enten forkaste og påstå, eller ikke forkaste (akseptere ). Mulige utfall: sann gal Forkaster Type I feil OK Forkaster ikke OK Type II feil Prinsipp: Vi antar i utgangspunktet at er korrekt, påstår først dersom dataene peker klart i retning av. Vi prioriterer derfor å holde sannsynligheten for type I feil liten. Setter derfor: P(type I feil) = P(forkaste er sann) = Sette opp hypoteser: Når man skal formulere en problemstilling som en hypotesetest er det ofte best å starte med å sette opp den alternative hypotesen. Den alternative hypotesen er den påstanden vi skal undersøke om er tilfelle. I eksemplet med Juks på meieriet? om forventet mengde melk er mindre en 1 liter, dvs om < 1.. Vi setter da som nullhypotese at dette ikke er tilfelle, dvs i melkeeksemplet at 1. og får Eventuelt kan vi skrive (betyr i praksis det samme): Merk: : 1. mot : 1. : 1. mot : 1. En hypotesetest er alltid en test om verdien på en parameter, for eksempel om eller p. En test skal derfor alltid formuleres med parametre i nullhypotesen og alternativ hypotese aldri kalles (signifikans-)nivået til testen. 3 4 tilfeldige variable eller lignende.
ypotesetester for når kjent X 1, X 2,, X n uavhengige og N(, 2 ) Eksempel: Juks på meieriet? 1- : 1. mot : 1. Generelt: : mot : Vi antar i utgangspunktet at er korrekt, dvs at =. Får da: Z Vi forkaster dersom ˆ X peker klart i retning av 1 - her dersom X er klart mindre enn. vor mye mindre er klar mindre enn? X E( X ) X Var( X ) / n ~ N(,1) 5 -z Vi forkaster dersom X er så mye mindre enn at Z -z der P(Z -z ) = P(type I feil) = Sanns. for at Z -z dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. elt analogt vil man for hypotesetesten : mot : forkaste dersom Z z 1- z
For den tosidige hypotesetesten : mot : forkaste vi dersom Z - z /2 eller Z z /2 Eksempel: Juks på meieriet? For melkemengde i ulike kartonger kan vi anta at X 1, X 2,, X n er uavhengige og N(,.2 2 ). Vi skal teste: : 1. mot : 1. Merk: /2 1- -z /2 z /2 /2 Testene vi har sett på så langt gjelder for situasjonen med normalfordelte data med kjent standardavvik/varians. Dersom dataene ikke er normalfordelte, men antall målinger, n, er stor vil testene fremdeles gjelde tilnærmet pga sentralgrenseteoremet. 7 Vi velger nivået =.5. Vi forkaster da dersom Z -z =- z.5 =-1.645 n=5 målinger gav et gjennomsnitt på: ˆ x.996 Dette gir: x z / n.996.2 1. / 5 1.41-1.41>-1.645, dvs vi beholder. Dataene gir ikke grunnlag for å hevde at < 1.. 8
Eksempel: øyde menn. Vi antar at høyde menn er normalfordelt med ukjent forventningsverdi og kjent standardavvik =7.8. Ønsker å teste: : 179 mot : 179 n =35 målinger i klassen gav Bruk 5% nivå og utfør testen. x 182.2 ypotesetester for når ukjent X 1, X 2,, X n uavhengige og N(, 2 ) Vi begynner med å se på testen: : mot : Vi har som før at: X E( X ) X Z ~ N(,1) Var ( X ) / n Men nå er ukjent og må erstattes med estimatoren S. Vi får da at: T X S / ~ t( n 1) n 9 Dette gjelder dersom er korrekt, dvs dersom =. Vi forkaster da dersom ˆ X peker klart i retning av - her dersom X er klart større enn 1.
Mer presist så forkaster vi dersom X er så mye større enn at T t,n-1 der: P(T t,n-1 ) = P(type I feil) = For den tosidige hypotesetesten : mot : forkaste vi dersom T - t /2,n-1 eller T t /2,n-1 1- Sanns. for at T t,n-1 dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. 1- t,n-1 /2 /2 -t /2, n.1 t /2,n-1 elt analogt vil man for hypotesetesten : mot : forkaste dersom T -t,n-1 -t,n-1 1-11 Merk: Disse testene (hvor vi bruker t-fordeling) gjelder kun for situasjonen med normalfordelte data med ukjent standardavvik/varians. 12
Eksempel: En påstand om at forventet årslønn i en bestemt næring (dvs gj.sn. årslønn for alle i næringen/hele populasjonen) er større enn 4 skal undersøkes. Vi antar at årslønnen til personer i næringen er normalfordelt med ukjent forventning og ukjent standardavvik. For å undersøke denne påstanden blir årslønnen til 24 tilfeldig valgte personer i næringen registrert. Dette gav et gjennomsnitt på 437 og et standardavvik på 63. Utfør testen på 5% nivå. : 4 mot : 4 Eksempel: øyde menn. Vi antar at høyde menn er normalfordelt med ukjent forventningsverdi og ukjent standardavvik. Ønsker å teste: : 179 mot : 179 n =35 målinger i klassen gav x 182.2 og s =7.8. Bruk 5% nivå og utfør testen. Med =.5 og n=24 blir t,n-1 = t.5,23 =1.714, dvs vi forkaster dersom T 1.714. T X S / n 437 4 63 / 24 2.88 Dvs vi forkaster og kan påstå at forventet årslønn i næringen er større enn 4! 13 14
ypotesetester for p (når n er stor) p = P( suksess ) = andel suksesser i populasjonen. XBin(n,p). Estimator for p: Eksempel: pˆ Vareprøve. ksepterer kun en ny type vare dersom vi er sikre på at andel defekte varer, p, er mindre enn.1. Basert på en stikkprøve av n varer ønsker vi å fastslå om p <.1 Generelt: X n : p.1 mot : p.1 : p p mot : p p Vi antar i utgangspunktet at er korrekt, dvs at p=p. pˆ E( pˆ) pˆ p Får da: Z N(,1 ) Var( pˆ) p (1 p )/ n Vi forkaster dersom pˆ er så mye mindre enn p at Z -z der : -z P(Z -z ) = P(type I feil) = 1- elt analogt vil man for hypotesetesten : p p mot : p p forkaste dersom Z z Sanns. for at Z -z dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. 1- (ok når np (1-p ) 5) 15 z
For den tosidige hypotesetesten : p p mot : p p forkaste vi dersom Z - z /2 eller Z z /2 Eksemplet: Vareprøve : p.1 mot : p.1 I en stikkprøve på n=15 varer ble det observert x =7 defekte varer, dvs pˆ n x 7 15.47 1- Velger =.5. Vi forkaster da dersom Z -z =- z.5 =-1.645 /2 -z /2 z /2 /2 Z p pˆ (1 p p ) / n.47.1.1(1.1) / 15 2.16 Merk: Disse siste testene gjelder for situasjoner der vi har gjort et binomisk forsøk med np (1-p ) 5. 17-2.16 < -1.645 dvs vi forkaster. Dataene gir grunnlag for å påstå at p <.1 dvs varen aksepteres! 18
Eksempel: På en sykehusavdeling fikk tidligere 2% av pasientene en bestemt infeksjon. Etter en omlegging av rutinene fikk 32 av de 11 første pasientene denne infeksjonen. Tyder dette på at sannsynligheten for å få infeksjonen, p, har endret seg? Formuler problemstillingen som en hypotesetest og utfør testen. Bruk 1% nivå. Til slutt: Utfallet av en hypotesetest er enten at vi forkaster eller at vi ikke forkaster. Tolkningen av disse to utfallene er: Forkaster : Betyr at vi påstår at er rett. Forkaster ikke : Betyr at situasjonen er uavklart. Enten så er korrekt, eller så er korrekt men vi har ikke nok data til å påvise det. Merk spesielt at vi aldri kan bevise at en nullhypotese er korrekt, vi kan bare eventuelt bevise at en alternativ hypotese er korrekt. Dersom vi ikke forkaster betyr det altså bare at situasjon er uavklart - ikke at vi har bevist at er rett! 19 2
Oppsummering ypotesetester for, kjent: X 1, X 2,, X n uavh. og N(, 2 ) ypotesetester for, ukjent: X 1, X 2,, X n uavh. og N(, 2 ) : mot : Z X / n ~ N (,1) Forkaster dersom Z -z -z 1- : mot : X T ~ t ( n 1) S / n Forkaster dersom T -t,n-1 -t,n-1 1- : mot : : mot : Forkaster dersom Z z 1- Forkaster dersom T t,n-1 1- z t,n-1 : mot : : mot : Forkaster dersom Z - z /2 eller Z z /2 1- /2 /2 -z /2 z /2 Forkaster dersom T -t /2,n-1 eller T t /2,n-1 1- /2 /2 -t /2,n-1 t /2,n-1
ypotesetester for p (n stor): XBin(n, p) : p p mot : p p Z pˆ p p (1 p Forkaster dersom Z -z ) / n N(,1) -z 1- : p p mot : p p Forkaster dersom Z z 1- z : p p mot : p p Forkaster dersom Z - z /2 eller Z z /2 1- /2 /2 -z /2 z /2