Kap. 6: Hypotesetesting 6.1: Generelt om hypotesetesting Bakgrunn: visse størrelser har naturlig variabilitet. Hvor stort avvik må til før vi konkluderer at noe er unormalt? Hypotesetesting i et nøtteskall: vi skal vurdere en påstand/hypotese om en statistisk parameter (typisk gjennomsnitt µ eller binomisk sannsynlighet p), basert på en stikkprøve. 1
Eksempler på "hypotesetester" i dagliglivet Hvor stor må sikkerhetsmarginen i et promilleapparat være for å sikre færre enn 1 % falske positive utslag? Et stålstag skal ha en strekkfasthet på µ = 600 MPa, men en ingeniør måler prøven til kun 550 MPa, basert på 10 målinger. Hvor sikker kan man være på at stålstaget faktisk har for liten strekkfasthet, dvs. µ < 600 MPa? Vi kaster mynt og kron 100 ganger, og får 65 "mynt". Grenseverdien for astmamedisinen Salbutamol i en urinprøve er µ = 1000 nanogram/milliliter. Hvor sikre kan vi være på at mynten er "fiksa", dvs. p = 1/2? Basert på 5 målinger har en utøver et snitt på 1200 nanogram/milliliter. Hvor sikkert er det at konsentrasjonen faktisk er større enn grenseverdien, dvs. at µ > 1000 ng/ml? 2
Prosedyre for hypotesetesting 3
Scenario Nullhypotese H 0 Mothypotese H 1 En pose Maarud potetgull skal inneholde 275 g potetgull. Jeg har kjøpt og målt 10 poser, og snittinnholdet er 250 g. Er det for lite potetgull i posene til Maarud? Forsvaret tester et nytt rakettsystem som skal ha bedre treffsikkerhet enn det gamle, som hadde 75 % treff. En test av 20 raketter gir 79 % treff. Er det nye systemet mer treffsikkert? Produksjonssjefen på Nidar sjekker at poser med julemarsipan inneholder 300 g hverken mer eller mindre. En stikkprøve av 50 poser gir et snitt på 314 g. Er marsipanpakkemaskina feilkalibrert? µ = 275 g µ < 275 g p = 0,75 p > 0,75 µ = 300 g µ = 300 g 4
6.2: Hypotesetesting om µ; kjent standardavvik σ Har 3 ekvivalente metoder for å utføre en hypotesetest om µ dersom σ er kjent: 5
6
Hypotesetesting vha. kritisk verdi, vist ved et eksempel Potetgullmengden X (i gram) i en Maarud pose skal være normalfordelt som X~N(275,10 2 ). Vi veier innholdet i 10 poser, og finner at snittet er 250 g. Vi skal avgjøre om vi blir snytt av Maarud, dvs. om vi kan hevde ut fra stikkprøven at snittmengden i Maarud poser egentlig er mindre enn 275 g. Spørsmålet: er stikkprøven på 250 g «ekstrem» nok hvor går grensa? Vi setter såkalt signifikansnivå, som er et mål på "slingsmonnet", til 5 %. Svar: vi velger å løse dette eksemplet ved hjelp av kritisk veri. Vi skal altså bestemme en kritisk verdi k ut i fra det valgte signifikansnivået, og så sammenlikner vi det faktiske snittet på 250 g med den kritiske verdien. 7
8
9
Illustrasjon av kvantilene i standard normalfordeling N(0,1) 10 % av x verdiene ligger under u 0,10 10 % av x verdiene ligger over u 0,10 5 % av x verdiene ligger under u 0,05 1 % av x verdiene ligger under u 0,01 5 % av x verdiene ligger over u 0,05 1 % av x verdiene ligger over u 0,01 Kvantiltabell 3 u 0,01 u 0,05 u 0,10 2 1 1u 0,10 u 0,05 2 u 0,01 3 x For eksempel: IQ er normalfordelt som N(100,15 2 ). Hvis du ligger på 1 % kvantilen, som er ca. IQ = 135, er du ganske smart kun 1 % av befolkningen har høyere IQ enn deg. 1 % av x verdiene ligger over denne kvantilen µ = 100 135 σ = 15 IQ 10
Fra eksamen mai 2018 Start på denne til tirsdag. 11