1 8-1: Oversikt 2 8-2: Grunnleggende hypotesetesting 3 Section 8-3: Å teste påstander om andeler 4 Section 8-5: Teste en påstand om gjennomsnittet
Definisjoner Hypotese En hypotese er en påstand om noe i en populasjon En hypotesetest er en standard prosedyre for å teste om en hypotese er sann eller ikke. Example Hypotese: Andelen iphone brukere på BI er p = 0.23 Hypotesetest for en andel: 1 Hent inn en representativ stikkprøve 2 Beregn andelen iphone brukere i stikkprøven 3 Bruk denne andelen til å avgjøre om hypotesen p = 0.23 er sann 4 Detaljer om dette kommer i seksjon 8-3...
Hypotesetesting Rare event rule Vi har en hypotese om noe. Vi antar den er sann. Vi observerer noe i stikkprøven som ser uvanlig ut Konklusjon: Da er det noe galt med hypotesen, og vi avgjør at den er usann. Hypotesetest = Beslutningsregel Du må velge en av to konkurrerende hypoteser. Nullhypotesen H 0 inneholder alltid = Alternativhypotesen H 1 inneholder <, > eller = Du må velge H 0 eller H 1. Du antar H 0 er sann Beslutningsgrunnlaget er stikkprøven. Dersom stikkprøven ser "uvanlig"ut, så velger vi H 1 Dersom stikkprøven ikke er uvanlig, så velger vi H 0
Fiktivt eksempel: FemiPower Example Selskapet FemiPower selger piller til kvinner som prøver å bli gravide. Selskapet påstår at pillene øker sjansen for å få en jente For å teste om FemiPower gir økt sjanse til jente så gir vi pillene til flere kvinner, og 100 av disse blir gravide. Som utgangspunkt antar vi at FemiPower ikke virker. (Nullhypotesen) Bruk sunn fornuft. Hva vil du konkludere med i disse to scenariene: 1 52 av 100 kvinner fikk jente? 2 91 av 100 kvinner fikk jente?
Scenarie 1; 52 av 100 er jenter 52 av 100 er jenter Nullhypotesen er at FemiPower ikke virker. Da vil vi normalt forvente omkring 50 jenter Vi fikk 52, noe som er nær 50, og det kan lett skje ved en tilfeldighet. Antagelsen om ingen effekt ser ut til å være korrekt Det er ikke tilstrekkelig grunnlag til å hevde at FemiPower virker
Scenarie 2; 91 av 100 er jenter 91 av 100 er jenter Nullhypotesen er at FemiPower ikke virker. Da skal det utrolig mye til at 91 av 100 babyer er jenter! Vi kan forklare dette på to måter 1 En ekstremt uvanlig ting har skjedd, eller 2 FemiPower virker Det ekstremt usannsynlige i 91 av 100 jenter tyder på at FemiPower virker Det er tilstrekkelig grunnlag til å hevde at FemiPower virker
Grunnleggende begreper Kapittel 8 Nullhypotese Alternativ hypotese Testobservator Kritisk område og Kritisk verdi Signifikansnivå p-verdi Type I og Type II feil Gjør en innsats for å forstå disse ordene.
Postbanken eksempel Example µ er gjennomsnittet på spørsmålet Anbefale for alle kunder Ledelsen: Hvis µ<7.0 sett inn tiltak for å øke µ I fila Bank2008 : x = 6.4 for 91 kunder Nullhypotesen er at gjennomsnittet i populasjonen er µ = 7.0 Må tiltak iverksettes, mao. er µ<7? Vi må finne ut om det er uvanlig at 91 kunder gir et gjennomsnitt x = 6.4 når µ = 7 Sannsynligheten viser seg (se senere) å være 2.3% for å få 6.4 eller lavere dersom µ = 7 Dette er så uvanlig at vi må anta at µ<7.0 Nullhypotesen forkastes: Iverksett tiltak!
Hva er nullhypotesen og hva er alternativhypotesen? H 0 og H 1 Hypotesene er alltid påstander om parametere som µ og p. Skriv påstanden ned på symbolsk form Skriv også ned på symbolsk form det motsatte av påstanden La H 1 være den av påstandene som ikke inneholder = Den andre påstanden skrives nå med = og den blir nullhypotesen H 0 Figur 8-2 i boka Hvis du selv vil vise at en påstand er sann, så formuler den som H 1 med <, > eller = H 0 H 1 = <>=
Hva er nullhypotesen og hva er alternativhypotesen? Example Her er to påstander. Andelen studenter som sykler til skolen er mer enn 0.5 Gjennomsnittshøyden til volleyballspillere i eliten er 189 cm Skriv opp hypotesene for hver påstand. Svar: H 0 : p = 0.5, H 1 : p > 0.5 H 0 : µ = 189, H 1 : µ = 189.
Testobservator Testobservatoren brukes til å velge H 0 eller H 1 Example Testobservatoren(eng: test statistic) beregnes ifra stikkprøven Den er beregnet under forutsetning av at H 0 er sann For å teste hypoteser om andelen bruker vi testobservatoren z = q ˆp p 0 p0 (1 p 0 ) n Av n = 880 studenter bruker 56% lesesalen ukentlig Vi forutsetter at H 0 : p = 0.5 er sann. Da blir testobservatoren z = = 3.56 Vi vet at en z-verdi på 3.56 er uvanlig. 0.56 0.5 q 0.5(1 0.5) 880 Stikkprøve andelen på 56% er derfor signifikant forskjellig fra 50% (figur neste side) Vi konkluderer med at mer enn halvparten bruker lesesalen ukentlig
Critical Region, Critical Value, Test Statistic Forkastningsområdet (eng: critical region) er de verdiene til testobservatoren som gjør at vi må forkaste nullhypotesen. Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Testens signifikansnivå α Signifikansnivået angis med α Det er sannsynligheten for at testobservatoren havner i forkastningsområdet dersom H 0 er sann Analogi til rettssal: Sannsynligheten for at en uskyldig blir dømt Vanlige valg er α = 0.1, α = 0.5 og α = 0.01. Kritisk verdi En kritisk verdi separerer forkastningsområdet fra de verdier av testobservatoren som ikke resulterer i å forkaste H 0 I figuren på forrige side er kritisk verdi z = 1.645
Tosidig hypotesetest Two-tailed Test H 0 : = H 1 :! " likt fordelt i de to halene til forkastningsområdet Betyr mindre enn eller større enn Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Høyresidig hypotesetest Right-tailed Test H 0 : = H 1 : > Mot høyre Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Venstresidig hypotesetest Mot venstre Left-tailed Test H 0 : = H 1 : < Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
p-verdien p-verdien Antar at H 0 er sann Regner ut testobservatoren for testen p-verdien er sannsynligheten for å få en verdi på testobservatoren som er minst like uvanlig som den du fikk Nullhypotesen forkastes hvis p-verdien er mindre enn signifikansnivået
To metoder for hypotesetesting Hypotesetesting Konklusjonen av testen er enten 1 Forkast nullhypotesen, eller 2 Ikke forkast nullhypotesen Den tradisjonelle metoden 1 Forkast nullhypotesen dersom testobservatoren er i forkastningsområdet 2 Ikke forkast nullhypotesen dersom testobservatoren ikke er i forkastningsområdet p-verdi metoden 1 p-verdien er mindre enn signifikansnivået α Forkast H 0 2 p-verdien er større enn signifikansnivået α Ikke forkast H 0
p-verdi metoden Tradisjonell metode Comprehensive Hypothesis Test P-Value Method Co Hyp Trad Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley. Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison
Bestemme p-verdien Dersom H 1 er tosidig, er p-verdien arealet i to haler Dersom H 1 er ensidig, er p-verdien arealet i en hale Procedure for Finding P-Values Figur 8-6 Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Eksempel A Example Signifikansnivået er α = 0.05 og vi skal teste påstanden om at andelen p > 0.25. Stikkprøven gir testobservatoren z = 1.18 Spørsmål Svar Er testen en- eller tosidig? Finn p-verdien Kom til en konklusjon om nullhypotesen H 0 Høyresidig test. A2: arealet til høyre for z = 1.18 er 0.1190 p-verdien 0.1190 er større enn α = 0.05 p verdien er relativt stor, så dette kunne ha skjedd ved en tilfeldighet Vi har ikke grunnlag til å forkaste H 0 : p = 0.25
Eksempel B Example Signifikansnivået er α = 0.05 og vi skal teste påstanden om at andelen p = 0.25. Stikkprøven gir testobservatoren z = 2.34 Spørsmål Svar Er testen en- eller tosidig? Finn p-verdien Kom til en konklusjon om nullhypotesen H 0 Tosidig test. A2: arealet til høyre for z = 2.34 er 0.0096 p-verdien 2 0.0096 = 0.0192 er mindre enn α = 0.05 p verdien er relativt liten, så dette kunne ikke ha skjedd ved en tilfeldighet Vi har grunnlag til å forkaste H 0 : p = 0.25
Type I og Type II feil En hypotesetest kan gi feil konklusjon. Det kan skje på to måter. Type I feil H 0 er egentlig sann, men du forkaster H 0 α - signifikansnivået- er sannsynligheten for å begå en type I feil. Type II feil H 0 er egentlig gal, men du forkaster ikke H 0 β er symbolet for sannsynligheten for en Type II feil, også kalt testens styrke (eng: power)
Type I og Type II feil Type I and Type II Errors Fire ting kan skje når du tester en hypotese: Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Oppsummering Vi har diskutert: Null- og alternativ hypoteser Testobservator Signifikansnivå p-verdi Beslutningsregel (tradisjonell og p-verdi metoden) Type I og II feil
Testen for en andel i populasjonen Notasjon n: størrelsen på stikkprøven ˆp: andelen i stikkprøven p: andelen i populasjonen, ifølge nullhypotesen q = 1 p Forutsetninger for testen Stikkprøven er et tilfeldig utvalg Betingelser for binomialfordeling holder (section 5-3) np 5 og n(1 p) 5
Testobservatoren for test om en andel Testobservator z = ˆp p p(1 p) n er tilnærmet normalfordelt når forutsetningene på forrige side holder.
Example I en spørreundersøkelse oppgir 56% av 880 studenter at de bruker lesesalen ukentlig Studentavisa OUTSIDE skriver i en overskrift at flere enn halvparten av BI studentene bruker lesesalen ukentlig Har OUTSIDE grunnlag for denne påstanden? H 0 : p = 0.5 og H 1 : p > 0.5. Høyresidig test Vi bruker p-verdi metoden: 1 np = 880 0.5 = 440 5 and n(1 p) =880 0.5 = 440 5 2 ˆp = 0.56 Testobservator er z = q 0.56 0.5 0.5(1 0.5) = 3.56 880 3 Tabel A2: Arealet til venstre for z = 3.56 er 0.9999 4 p-verdien er 1 0.9999 = 0.0001, mye lavere enn α = 0.05 5 OUTSIDE har grunnlag for påstanden sin
Example: An article distributed by the Associate Press Lesesalincluded eksempel these results from a nationwide survey: Of 880 randomly selected drivers,! 56% p-verdien er svært liten, så nullhypotesen forkastes. H 0 : p = 0.5 H 1 : p > 0.5 " = 0.05 z = 3.56 Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Lesesal eksempel; Tradisjonell metode Example Vi kan også bruke tradisjonell metode: 1 En høyrehalet test, så α = 0.05 forkastningsområdet ligger i høyre hale 2 Den kritiske verdien er da z = 1.645 3 ˆp = 0.56 Testobservator er z = 0.56 0.5 0.5(1 0.5) 880 = 3.56 4 Siden testobservatoren z = 3.56 er større enn den kritiske verdien z = 1.645, så forkaster vi H 0 5 Det er tilstrekkelig grunnlag til å si at andelen er over 0.5
Example Vi kan også bruke tradisjonell metode: 1 En høyrehalet test, så α = 0.05 forkastningsområdet ligger i høyre hale 2 Den kritiske verdien er da z = 1.645 3 ˆp = 0.56 Testobservator er z = 0.56 0.5 0.5(1 0.5) 880 = 3.56 4 Siden testobservatoren z = 3.56 er større enn den kritiske verdien z = 1.645, så forkaster vi H 0 5 Det er tilstrekkelig grunnlag til å si at andelen er over 0.5
Bank2008.jmp Example 1 En leder i Sparebank1 påstår at andelen kunder med universitetsutdannelse er mer enn 50 % 2 I stikkprøven har 48 av 91 universitetsutdannelse 3 H 0 : p = 0.5 versus H 1 : p > 0.5. Vi tester på α = 0.05 nivået 4 ˆp = 0.527 Testobservator er z = 0.527 0.5 0.5 0.5 91 = 0.52 5 Siden testen er ensidig, er p-verdien arealet i halen fra z = 0.52 og oppover Tabell A2: 0.70. Den kritiske verdien er da 1 0.7 = 0.3 6 Siden p-verdien er større enn α = 0.05, konkluderer vi med at det ikke er tilstrekkelig grunnlag til å forkaste H 0
z-testen for én andel Example Svar Stortingsvalget 2009: FrP fikk 26.5 % i Rogaland 2010 meningsmåling: av 186 av 784 ville stemt FrP Er det en signifikant forskjell fra 2009? Signifikansnivå α = 0.1 Tosidig test med hypotesene H 0 : p = 0.265 vs H 1 : p = 0.265. Testobservator er z = 186 784 0.265 0.265(1 0.265) 784 = 1.76 Tabell A2: arealet til venstre for z = 1.76 er 0.0392 så p-verdien er 2 0.0392 = 0.0784. p-verdien mindre enn 0.1: Det er grunnlag til å hevde at FrP sin oppslutning er endret
FrP eksempel p-verdien er 0.0784, dvs. arealet i de to halene. Siden signifikansnivået var satt til α = 0.1 så forkastes H 0. Standard Normalfordeling dnorm(x, 0, 1) 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 x
Hypotesetest for gjennomsnittet Forutsetninger Vi forutsetter at: Stikkprøven er tilfeldig Dataene er normalfordelt, eller at n > 30 Hypotesene Nullhypotesen er at gjennomsnittet i populasjon µ er en spesifikk verdi Alternativhypotesen kan være tosidig (=), eller ensidig (< eller >) Testobservator t = x µ s/ n er t-fordelt med n 1 frihetsgrader. Kritiske verdier i Tabell A3
Tabell A3 For hypotesetest om en andel er p-verdi metoden enklest. Tabell A2 gir p-verdier. For hypotesetest om gjennomsnitt er det bedre med tradisjonell metode, der testingen skjer med kritiske verdier Example: Assuming that neither software nor a Tabell TI-83 A3 Plus gir kritiske calculator verdier is og available, forkastningsområdet use Table A-3 to find a range of values for the P-value corresponding to the given results. Dersom testobservatoren er mer ekstrem enn den kritiske verdien, så forkastes H 0 Copyright 2007 Pearson Education, Inc Publishing as Pearson Addison-Wesley.
Hypotesetest for gjennomsnittet Example Tenk deg følgende 3 situasjoner. Bruk tabell A3 til å avgjøre om H 0 forkastes 1 Venstresidig test. n = 12, α = 0.05 og testobservatoren er t = 2.01 2 En høyresidig test med n = 12, α = 0.1 og t = 1.22 3 En tosidig test med n = 12 og α = 0.01 og t = 3.45 Svar 1 Kritisk verdi er t = 1.796. Forkastningsområdet er fra 1.796 og ned. Vår t-verdi ligger her. Konklusjon: Vi forkaster H 0 2 Kritisk verdi er t = 1.363. Dvs at forkastningsområdet er fra 1.363 og opp. Vår t-verdi ligger ikke her. Behold H 0 3 Kritisk verdi t = 3.106.Forkastningsområdet er utenfor ±3.106. Forkaster H 0
Hypotesetest for gjennomsnittet Example Tenk deg følgende 3 situasjoner. Bruk tabell A3 til å avgjøre om H 0 forkastes 1 Venstresidig test. n = 12, α = 0.05 og testobservatoren er t = 2.01 2 En høyresidig test med n = 12, α = 0.1 og t = 1.22 3 En tosidig test med n = 12 og α = 0.01 og t = 3.45 Svar 1 Kritisk verdi er t = 1.796. Forkastningsområdet er fra 1.796 og ned. Vår t-verdi ligger her. Konklusjon: Vi forkaster H 0 2 Kritisk verdi er t = 1.363. Dvs at forkastningsområdet er fra 1.363 og opp. Vår t-verdi ligger ikke her. Behold H 0 3 Kritisk verdi t = 3.106.Forkastningsområdet er utenfor ±3.106. Forkaster H 0
Example På side 9 så vi at p-verdien var 0.023 for en venstresidig test av H 0 : µ = 7.0 versus H 1 : µ<7.0. Vi brukte JMP til å finne det ut. Vi skal nå gjøre testen uten JMP, ved å bruke A3. Vi bruker α = 0.05 Postbanken har x = 6.410 og s = 2.753 for 91kunder Testobservator er da t = 6.41 7.0 2.753/ 91 = 2.02 Tabell A3 med 91 90 frihetsgrader gir da kritisk verdi 1.662 Vi forkaster H 0 : Det er grunnlag for å hevde at µ<7i populasjonen
Arealet er p-verdien. JMP gir at dette er 0.023. Students t med df=90 dt(x, df = 90) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x