Sentrale begreper for hypotesetesting Begrep Nullhypotesen H 0 Definisjon/forklaring Utrykker "status quo"/"situation normal"/"ting er slik produsenter påstår"/"alt er greit" Signifikansnivå α Sannsynligheten for å forkaste H 0, selv om den er riktig Kritisk verdi k Den største/minste verdien stikkprøven kan ha før vi forkaster H 0. Bestemmes ut i fra definisjonen av signifikansnivå Signifikanssannsynlighet (p verdi) Sannsynligheten for at stikkprøven skyldes tilfeldigheter; sanns. for å få en minst like "ekstrem" verdi som stikkprøven, gitt at H 0 er sann Styrkefunksjon β(µ) Mål på hvor "følsom" hypotesetesten er, f.eks. om den får oss til å konkludere med at det faktisk er for lite brus i 0,5 l flasker dersom det reelle snittet er µ = 0,42 l (når produsenten påstår µ = 0,50 l) β(µ) = P(akseptere H 1 µ) 1
Fra forrige gang Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: H 0 : µ = µ 0 H 1 : µ < µ 0 eller µ > µ 0 Signifikanssannsynlighet p Angir sannsynligheten for å få en X som er minst like ekstrem som den observerte verdien x gitt at H 0 er riktig Signifikansnivå α Angir sannsynligheten for å få en X som er minst like ekstrem som den kritiske verdien k gitt at H 0 er riktig evt. evt. Her er x kjent, og brukes til å beregne p. Gir sannsynligheten for at stikkprøven skyldes tilfeldigheter dersom H 0 er riktig. Her er α kjent, og brukes til å beregne k. Gir sannsynligheten for å forkaste H 0, selv om den er riktig. Hvis f.eks. α = 5 %, vil vi i 5 % av tilfellene få en stikkprøve som grunnet tilfeldigheter ligger "utenfor" kritisk verdi, selv om H 0 er riktig og da forkaster vi H 0, selv om den er riktig. Tosidige tester: samme testobservator som ensidig, men sammenlikner med kvantilen u α/2 istedet for u α 2
Quiz Vi kjøper potetgull i poser der produsenten hevder at mengden potetgull er normalfordelt med µ = 250 g og standardavvik på 10 g. For å sjekke om vi får for lite potetgull for penga, gjør vi en stikkprøve der vi kontrollveier innholdet i 10 slike poser, og gjennomfører en hypotesetest med 5 % signifikansnivå. Vi får et gjennomsnitt på 240 g for de 10 posene. Hvilke av følgende påstander er riktige? A. Kritisk verdi k bestemmes ved P(X k H 0 ) = 0,05 B. Kritisk verdi k bestemmes ved P(X k H 0 ) = 0,05 C. Signifikanssannsynligheten (p verdien) beregnes ved p = P(X 240 H 0 ) D. Signifikanssannsynligheten (p verdien) beregnes ved p = P(X 240 H 0 ) E. Hypotesetesten konkluderer med at det er for lite potetgull i posen F. Vi får en "strengere" hypotesetest hvis vi velger en mindre verdi for signifikansnivået α (dvs. det "skal mindre til" før vi klager) 3
Avgjørelse av hypotesetesten (bruker her kritisk verdi): 4
Angående påstand F: blir testen "strengere" med mindre α? Med 5 % signifikansnivå starter "klagestormen" ved 244,8 g. Ved 1 % signifikansnivå er vi "fornøyde" så lenge det er minst 242,3 g i posen dvs. "mindre strengt". 5
6.3: Hypotesetesting ved normaltilnærming (egentlig: hypotesetesting i binomisk modell) omhandler hypotesetesting rundt den binomiske parameteren p (istedet for et gjennomsnitt µ) baserer seg på at en binomisk fordeling tilnærmes med en normalfordeling Vi oppsummerer hele dette kapitlet med étt praktisk regneeksempel som handler om å beregne en p verdi (uavhengig av normaltilnærming osv.). 6
Eksempel: eksperiment for å påvise el overfølsomhet (fra NRKs "Folkeopplysningen") 10 kofferter er utplassert i et rom. I hver koffert er det en mobiltelefon som enten er av, eller på. En forsøksperson skal identifisere hvilke kofferter som inneholder en påslått mobiltelefon. 1 2 3 4 5 9:20 6 7 8 9 10 Hva er sannsynligheten for at personen identifiserer minst 7 ved ren flaks (dvs. signifikanssannsynligheten/p verdien)? A. Tilnærmet 0 B. 5 % C. 17 % D. 25 % E. 34 % F. 50 % G. 68 % H. 83 % I. 95 % J. Tilnærmet 1 7
8
6.4: Styrkefunksjonen 9
Konkret eksempel på styrkefunksjon Hvis vi mistenker at vi blir svindla når vi kjøper brus på 0,5 l flasker er det naturlig å bruke hypotesetesten H 0 : µ=0,5 l H1: µ < 0,5 l Vi bestemmer et signifikansnivå, og hvis det skulle vise seg at β(0,45) = 0,80, er det 80 % sjanse for at hypotesetesten "plukker opp" det faktum at nullhypotesen er feil, gitt at den reelle µ = 0,45 (dvs. testen oppdager med 80 % sannsynlighet at vi blir svindlet i dette tilfellet). 10
Praktisk beregning av styrkefunksjon 11
Fra eksamen juni 2017 12
13