ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. 6 Hypotesetesting Hypotesetesting (kp. 6) Tre deler av faget/kurset:. Beskrivende statistikk. Sannsynlighetsteori, sannsynlighetsregning 3. Statistisk inferens estimering konfidensintervall hypotesetesting Begrep: nullhypotese alternativhypotese ensidig, tosidig teststørrelse (testobservator) nullfordeling kritisk verdi, forkastningsområde signifikansnivå 3

Oversikt over emner:. Mer om hva hypotesetesting er. Hypotesetesting i ulike situasjoner: i. for forventningen, μ, i målemodellen med normalantakelse og kjent varians, σ. ii. for forventningen, μ, i målemodellen med stor n og normaltilnærming. iii. for suksessannsynligheten, p, i binomisk modell med stor n og normaltilnærming. iv.... 4 Oversikt over emner:.... Hypotesetesting i ulike situasjoner: iv.... for suksessannsynligheten, p, i binomisk modell med liten n. v. for forventningen, μ, i målemodellen med normalantakelse og ukjent varians, σ. (Og n liten; t-fordeling; t-test.) vi. test for forventningen i Poissonmodell. 5 Oversikt over emner:. Mer om hva hypotesetesting er 6

Eks.: Vi har gjort n= målinger (x, x,..., x n ) av ph i Breiavatnet; 6., 5.59 5.74 3.43 5.3 6.48 5.5 4.8 4.5 6. Problem: Er virkelig ph lavere enn 6.? 7 Eks.: Vi har gjort n= målinger (x, x,..., x n ) av ph i Breiavatnet; 6., 5.59 5.74 3.43 5.3 6.48 5.5 4.8 4.5 6. Problem: Er virkelig ph lavere enn 6.? Gjennomsnitt er 5.7; men noen målinger er større enn 6., og det er en del variasjon...?? Hvordan konkludere??? 3, 4, 5, 6, 7, 8 Statistisk metode for å trekke konklusjon: (i en situasjon som denne). Vi antar (i denne situasjonen): målemodellen: x, x,..., x n utfall av X, X,..., X n, n u.i.f. tilf. var. normalantakelse: X i ene er normalfordelte kjent varians: Var(X i ) er et kjent tall,. i dette tilfellet. Vi vil teste: H : μ = 6. mot H : μ < 6. ( μ = E( X )) i H uttrykker det utsagnet vi må tro i utgangspunktet; H kan vi hevde dersom dataene tyder klart på at dette i virkeligheten er tilfelle. 9 3

3. Gjennomsnitt betydelig lavere enn 6. indikerer at H er riktig i virkeligheten. 4. Dersom gjennomsnittet lavere enn 5.48, så forkast H, og påstå H : virkelig ph er mindre enn 6.. 5. Data: gjennomsnittet er 5.7 som er mindre enn 5.48. Dvs.: forkast H! Hvorfor akkurat 5.48?? Hvorfor, hvorfor...? Først noen kommentarer. Statistisk hypoteser: alternativhypotesen, H : μ < 6., uttrykker at virkelig ph er mindre enn 6.. nullhypotesen, H : μ = 6., ville det gjerne vært naturlig å hatt som: H : μ 6., men det er en forenkling åbruke =; dette spiller i praksis ingen rolle for resultatet i de fleste situasjoner.. Vi forblir ved å tro på H inntil noe annet er bevist. 4

Først noen kommentarer 3. Vi legger til grunn: målemodellen: x, x,..., x n utfall av X, X,..., X n, n u.i.f. tilf. var. normalantakelse: X i ene er normalfordelte kjent varians: Var(X i ) er et kjent tall,. i dette tilfellet 3 Statistisk tenking:. Dersom H er riktig i virkeligheten, så kommer dataene fra en normalfordeling med forventning 6. (og varians ), grønn kurve: 3, 4, 5, 6, 7,. Dette kan brukes som utgangspunkt for å vurdere om vi kunne fått det aktuelle resultatet ved en tilfeldighet når H faktisk er riktig. 4 Vi baserer testen på gjennomsnittet ikke på enkeltmålingene; Teststørrelse (testobservator): (tilf.var.) X = X L + X ( + ) Vi har (i dette eksempelet): og når H forutsettes å være riktig: X ~ N 6., σ X ~ N μ, n σ = n ( H : μ = 6.) 5 5

Teststørrelsen sin fordeling når H er riktig: nullfordelingen. X ~ N 6., 3, 4, 5, 6, 7, Denne fordelingen nullfordelingen kan brukes til å vurdere om vi kunne fått det aktuelle gjennomsnittsresultatet ved en tilfeldighet dersom H faktisk er riktig. 6 Et lavt (i forhold til 6.) gjennomsnittsresultat indikerer at H er riktig. 3, 4, 5, 6, 7, Vi bruker nullfordelingen til å fastsette hva som lavt nok for å konkludere med H. 7 Dersom vi setter (som i eks.) grensen til 5.48, 3, 4, 5, 6, 7, er det kun 5% sjanse for å få gj.sn.resultat lavere enn dette ved en tilfeldighet dersom H er riktig. P( X 5.48 H riktig) = P( X 5.48 μ = 6) X 6 5.48 6 5.48 6 = P μ = 6 = P Z =.5 / / 443 /.645 ( Z ~ N(,) ) 8 6

5.48: kritisk verdi Intervallet (, 5.48) : forkastningsområde 3, 4, 5, 6, 7, Når H o er riktig er det kun 5% sjanse for ved en tilfeldighet å få utfall av teststørrelsen i forkastningsområdet. Denne sannsynligheten kalles signifikansnivået til testen. 9 5.48: kritisk verdi Intervallet (, 5.48) : forkastningsområde Når H o er riktig er det kun 5% sjanse for ved en tilfeldighet å få utfall av teststørrelsen i forkastningsområdet. 3, 4, 5, 6, 7, Dvs.: kun 5% sjanse for å konkludere feil dersom i virkeligheten ph en er 6. H : μ = 6. ( ) 5.48: kritisk verdi Den kritiske verdien fastlegges av signifikansnivået (5% i eksempelet). 3, 4, 5, 6, 7, Eksempel: La k være den kritiske verdien. Vi ønsker da at k skal være slik at: ( X k H riktig).5 P = 7

P Beregne kritisk verdi: ( X k H riktig) =.5 X 6 P / k 6 = z / k 6 /.5 k = 6.645 k 6 H riktig P =.5 = Z / =.645 = 5.48,5,4,3,,, Z ~ N -4, -,,, 4, (,) Det er vanlig å bruke standardisert teststørrelse. X - μ σ /n Når vi skal teste (f.eks.): H < : μ = μ mot H : μ μ 3 Eksempelet: H : μ = 6. mot H : μ < 6. Standardisert teststørrelse: Dersom H er riktig, er Z N(,)-fordelt. X - 6. Z = / Små verdier (utfall) av Z indikerer at H i virkeligheten er riktig. (Hva som er små verdier ses i forhold til nullfordelingen til Z; N(,)-fordelingen.) 4 8

Eksempelet: H : μ = 6. mot H : μ < 6. Standardisert teststørrelse: X - 6. Z = Kritisk verdi, k: / P( Z k H riktig) =.5,5 k =.645 ( = -z.5 ),4,3,,, -4, -,,, 4, -, 5 Eksempelet: H : μ = 6. mot H : μ < 6. Gjennomføring: Test : Vi forkaster H dersom Z - utfallet k =.645 X - 6. Z = / Data, utfall av Z : 5.7-6. =.3 / Konklusjon : forkast H, siden Z- utfall = -.3 < -.645. 6 Begrep: nullhypotese alternativhypotese ensidig, tosidig teststørrelse (testobservator) nullfordeling kritisk verdi, forkastningsområde signifikansnivå 7 9

Hypotesetesting Oversikt over emner:. Mer om hva hypotesetesting er. Hypotesetesting i ulike situasjoner: i. for forventningen, μ, i målemodellen med normalantakelse og kjent varians, σ. ii. for forventningen, μ, i målemodellen med stor n og normaltilnærming. iii. for suksessannsynligheten, p, i binomisk modell med stor n og normaltilnærming. iv.... 8