ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag

2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger om den korresponderende populasjonsparameter. Typiske populasjonsparametre: µ Forventningen i populasjonen σ Standardavvik i populasjonen p Andel i populasjonen/sannsynlighet for suksess Tilsvarende utvalgsobservatorer: x Gjennomsnittet i utvalget s Standardavvik i utvalget x/n Relativ frekvens/andel i utvalget

4 Hovedtyper av statistisk inferens 1. Estimering. Hva er størrelsen på parameteren? Punktestimering: Gitt ved ett enkelt tall Intervallestimering: Gitt ved et intervall der parameteren antas å ligge med en høy sannsynlighet 2. Hypotesetesting: Velger mellom to konkurrerende påstander om størrelsen på parameteren, for eksempel om den er større eller mindre enn en gitt verdi.

5 Innhold i kap. 8 Betrakt en populasjon karakterisert ved forventning µ og standardavvik σ. Det ønskes informasjon om µ, mens σ i dette kapitlet antas å være en kjent parameter. 8.2 Generelt om estimering Punktestimat Intervallestimat 8.3 Estimering av µ 8.4 Generelt om hypotesetesting 8.5 Hypotesetesting om µ: p-verdi 8.6 Hypotesetesting av µ: klassisk

6 Punktestimering (8.2) Punktestimat for en parameter: Et anslag for verdien av en parameter gitt ved ett tall, som regel den tilsvarende utvalgsobservatoren. Parameter Punktestimat µ x = Σx n σ s = Σx 2 (Σx) 2 /n n 1 σ 2 s 2 = Σx 2 (Σx) 2 /n n 1 p p = x n

7 Kvaliteten til et punktestimat Følgende egenskaper ønskes av et godt punktestimat: Forventningsrett. En observator kalles forventningsrett ( unbiased ) hvis dens forventning er lik parameteren som skal estimeres. Hvis ikke, kalles den forventningsskjev ( biased ). Merk at x har forventning µ og er altså forventningsrett. Liten standardfeil. Merk at x har standardfeil σ/ n som blir liten hvis n er stor (og σ ikke er for stor).

8 Intervallestimering Intervallestimat Et intervall som med stor grad av konfidens (confidence) inneholder parameterverdien. Nedre og øvre grense i intervallet er observatorer beregnet fra utvalget (og er derfor tilfeldige variable). Konfidensnivå Sannsynligheten for at intervallestimatet skal inneholde den ukjente parameteren. Skrives 1 α hvor α er et lite tall, f.eks. α = 0.05 som gir 1 α = 0.95. Konfidensintervall Et intervallestimat med et spesifisert konfidensnivå1 α. Konfidensnivået oppgis ofte i prosent, dvs. f.eks. 95% istedenfor 0.95.

9 Konfidensintervall for µ (8.3) Antagelse: x er tilnærmet normalfordelt, dvs. enten populasjonen er normalfordelt eller n er stor. σ er kjent Vi ønsker å finne et intervall (a, b) slik at P(a < µ < b) = 1 α Merk: Her er a og b beregnet ut fra utvalget. 1 α er konfidensnivået. Vi skal bruke at er standard normalfordelt. z = x µ σ/ n

For å finne et 95% konfidensintervall, dvs. α = 0.05, går vi fram slik: med 0.95 = P( z(0.025) < z < z(0.025)) = P( 1.96 < z < 1.96)) = P( 1.96 < x µ σ/ n < 1.96) = P( 1.96σ/ n < x µ < 1.96σ/ n) = P( 1.96σ/ n < µ x < 1.96σ/ n) = P( x 1.96σ/ n < µ < x + 1.96σ/ n) = P(a < µ < b) a = x 1.96 σ n b = x + 1.96 σ n (dvs. tilnærmet gjennomsnitt pluss-minus to standardavvik )

Hvis vi bytter ut 0.95 med 1 α og z(0.025) med z(α/2) får vi det generelle 1 α konfidensintervall: med 1 α = P( z(α/2) < z < z(α/2)) = P( z(α/2) < x µ σ/ n < z(α/2)) = P( z(α/2)σ/ n < x µ < z(α/2)σ/ n) = P( z(α/2)σ/ n < µ x < z(α/2)σ/ n) = P( x z(α/2)σ/ n < µ < x + z(α/2)σ/ n) = P(a < µ < b) a b = x z(α/2) σ n = x + z(α/2) σ n

12 Oppsummering: Konfidensintervall for µ Et 1 α konfidensintervall for µ når σ er kjent er gitt ved ( x z(α/2) σ n, x + z(α/2) σ n ) 1 α kalles konfidensnivået. σ n kalles standardfeilen ( standard error ) for gjennomsnittet x. z(α/2) kalles konfidenskoeffisienten. z(α/2) σ n kalles maksimum feil for estimatet ( maximum error of estimate ), betegnet E.

Eksempel: En maskin produserer deler med lengde som er normalfordelt med ukjent forventning µ cm og kjent standardavvik σ = 0.5 cm. Et utvalg på 10 deler har gjennomsnittslengde 75.92 cm. Finn et punktestimat for µ. Finn et 95% konfidensintervall for µ.

Punktestimat: x = 75.92 cm. 95% konfidensintervall: ( x 1.96 σ n, x + 1.96 σ n (75.92 1.96 0.5 10, 75.92 + 1.96 0.5 10 ) (75.92 0.31, 75.92 + 0.31) (75.61, 76.23) Merk at følgende antagelse er gjort: x er tilnærmet normalfordelt. Diskuter!

Oppgave: Lengden til 200 fisk har (utvalgs)gjennomsnitt 36.3 cm. Populasjonsstandardavviket er kjent og lik 6.4 cm. Finn et 90% konfidensintervall for populasjonens gjennomsnittslengde µ.

16 Tolkning av konfidensintervall Med P(a < µ < b) = 1 α menes at dersom vi gjør et stort antall repeterte utvalg, der vi hver gang regner ut nedre grense a og øvre grense b, vil populasjonsverdien µ (ukjent) ligge i dette intervallet i en andel 1 α av gangene. Merk: a og b er observatorer, som endrer seg når vi tar nye utvalg. (a og b er jo lik x ± E) Vårt utvalg gir bare ett av disse mange intervallene, og vi vet ikke om µ er i akkurat dette intervallet. Men sjansen er altså stor hvis α er rimelig liten!

18 Egenskaper ved konfidensintervall 1 α konfidensintervall: x ± z(α/2) σ = x ± E n Maksimal feil: E = z(α/2) σ n Lengde på intervall: 2E Intervall blir: Kortere hvis n vokser Kortere hvis σ blir mindre Kortere hvis α blir større (Hva innebærer det siste punktet?)

19 Bestemmelse av n Maksimal feil: E = z(α/2) σ n Hvor stor må vi velge n for å få en bestemt maksimal feil E? ( z(α/2)σ n = E ) 2

Eksempel: En maskin produserer deler med lengde som er normalfordelt med standardavvik σ = 0.5 cm. Hvor stort må utvalget være for å få E lik 0.1 cm (dvs. intervalllengde lik 0.2 cm) med 95% konfidensnivå? ( ) z(α/2)σ 2 n = E ( ) z(0.025) 0.5 2 = 0.1 ( ) 1.96 0.5 2 = 0.1 = 96.04 Dermed: n = 96 gir tilnærmet ønsket maksimal feil.

Oppgave: Hva må utvalgsstørrelsen være dersom forventningen µ skal estimeres med feil E mindre enn 7.5 med 99% konfidensnivå? Populasjonsstandardavviket er 90.

22 Hypotesetesting (8.4) Sentrale termer: Hypotese Påstand om at noe er sant Hypotesetesting Å velge mellom to konkurrerende hypoteser Nullhypotese, H 0 Den hypotesen som er riktig inntil det motsatte er bevist (den konservative hypotesen) Alternativ hypotese, H a Den hypotesen vi prøver å bevise er riktig; årsaken til undersøkelsen. Eksempel: H 0 : Klimaet har ikke endret seg H a : Klimaet har endret seg H 0 : Medisin A og B virker like bra H a : Medisin A virker bedre enn medisin B

To mulige avgjørelser: 1. Forkaste H 0 og påstå H a 2. Ikke forkaste H 0 (mangler bevis for å kunne påstå H 0. Dette gir fire situasjoner: H 0 sann H 0 usann Ikke forkast H 0 Korrekt avgjørelse Type II-feil Forkast H 0 Type I-feil Korrekt avgjørelse Analogi: Straffesak H 0 : Tiltalte er uskyldig (riktig inntil det motsatte er bevist). H a : Tiltalte er skyldig (prøver å bevise). Type I-feil:justismord Type II-feil:skyldig går fri.

Mest alvorlig er type I-feil. Vi ønsker liten sannsynlighet for denne. Vi krever P(type I-feil) = α der α er et lite tall. α kalles signifikansnivået til testen og velges av brukeren. (Oppgis ofte i prosent, f.eks. 5%). Vi definerer også P(type II-feil) = β 1 β kalles styrken til testen og er sannsynligheten for korrekt forkastning av H 0. Testobservator: En tilfeldig variabel (beregnet fra utvalget) som brukes til å treffe avgjørelsen.

25 Hypotesetesting om µ (σ kjent) (8.5) Eksempel: For en standard språktest for ungdomsskoleelever er gjennomsnittsresultatet for hele landet µ N = 125 og σ N = 16.4 (N står for Norge). Skoleledelsen i en bestemt by mener imidlertid at elevene i denne byens skoler er bedre enn lands-gjennomsnittet. Det tas så et utvalg på n = 86 elever fra ungdomsskolene i denne byen. Disse skolene blir vår nye populasjon. Vi lar µ betegne populasjonsgjennomsnittet for denne populasjonen. Dette leder til testingssituasjonen H 0 : µ = 125 mot H a : µ > 125, der σ = 16.4 antas kjent og utvalget består av de n = 86 elevene. Resultatet blir et gjennomsnitt x = 128.5 for de 86 elevene. Kan det dermed påstås at elevene i denne byen er bedre enn landsgjennomsnittet? Vi skal gjennomføre en hypotesetest med signifikansnivå α = 0.05.

Vi ser altså på H 0 : µ = 125 mot H a : µ > 125 med kjent σ = 16.4. Vi bruker testobservatoren z = x 125 σ/ n Store verdier av z tyder på at H a gjelder. Poenget med å bruke z er at når H 0 er riktig, er z standard normalfordelt. Vi kan derfor forkaste H 0 hvis den beregnede verdi for z er så stor at den er urimelig for en standard normalfordelt variabel. Her blir z = 128.5 125 16.4/ 86 = 1.98 så spørsmålet er om dette er for høyt til rimeligvis å kunne komme fra en standard normalfordeling.

Vi beregner P(z > 1.98) = 1 0.5 P(0 < z < 1.98) = 1 0.5 0.4761 = 0.0239 Da dette er en liten sannsynlighet, dvs. mindre enn signifikansnivået α, forkaster vi H 0. Vi konkluderer: Det er tilstrekkelig grunnlag på signifikansnivå 0.05 til å si at elevene i denne byen scorer bedre enn landsgjennomsnittet på språktesten. Den beregnede sannsynlighet P(z > 1.98) = 0.0239 kan generelt skrives P(z > z ) og kalles p-verdien for testen.

28 Hypotesetesting ved å bruke p-verdi (8.5) Definisjon av p-verdi: Sannsynligheten for at vår testobservator z får en verdi som er lik den vi har fått eller en som er mer ekstrem (i retning av den alternative hypotese) når nullhypotesen gjelder. Beslutningsregel: Hvis p-verdien er mindre enn eller lik signifikansnivået α, så er beslutningen å forkaste nullhypotesen H 0. Hvis p-verdien er større enn α, så er beslutningen å ikke forkaste H 0. I vårt tilfelle tester vi H 0 : µ = 125 mot H a : µ > 125 så p-verdien blir den høyre halen P(z > z ):

Anta isteden at de 86 elevene hadde et gjennomsnitt x = 127.0. Dette er også bedre enn landsgjennomsnittet. Men nå blir Da blir p-verdien z = 127.0 125 16.4/ 86 = 1.13 P(z > 1.13) = 1 0.5 P(0 < z < 1.13) = 1 0.5 0.3708 = 0.1292 som er større enn signifikansnivået 0.05. Altså forkastes ikke H 0 og vi kunne konkludere: Det er ikke tilstrekkelig grunnlag på signifikansnivå 0.05 til å si at elevene ved gjeldende ungdomsskole scorer bedre enn landsgjennomsnittet på språktesten. Men merk at vi heller ikke kan påstå at de er dårligere enn landsgjennomsnittet eller at de ligger på landsgjennomsnittet. Vanligvis er det bare når vi forkaster nullhypotesen at vi kan komme med klare konklusjoner.

30 Hypotesetesting: klassisk metode (8.6) Situasjonen er som før og vi bruker samme testobservator, nemlig z x 125 = σ/ n At signifikansnivå er valgt til α betyr at vi krever P(forkaste H 0 ) = α hvis H 0 er sann Dette får vi til ved å forkaste H 0 hvis z > z(α), der z(α) er definert tidligere (og kalt kritisk verdi) ved at der z er standard normalfordelt. P(z > z(α)) = α

Altså: Vi forkaster H 0 dersom z = x 125 σ/ n > z(α) Med α = 0.05 får vi z(α) = 1.65 mens altså x = 128.5, σ = 16.4, n = 86 z 128.5 125 = 16.4/ = 1.98 > 1.65 86 så vi forkaster H 0 med signifikansnivå 0.05. (Men igjen forkaster vi ikke hvis x = 127.0.)

33 Kortfattet Hypoteser: H 0 : µ = 125 mot H a : µ > 125. Kjente verdier: n = 86, σ = 16.4, α = 0.05. Observert: x = 128.5. Testobservator: z = x 125 σ/ n = 128.5 125 16.4/ 86 = 1.98 (standardisering av den observerte x når H 0 gjelder). Egenskaper ved z : Hvis H 0 gjelder er z standard normalfordelt. Hvis H a gjelder vil z bli for stor.

Metode med p-verdi: p-verdi = P(z > z ) = P(z > 1.98) = 0.0239 H 0 forkastes hvis p-verdi < α Klassisk metode: Finn kritisk verdi z(α) dvs. at P(z > z(α)) = α. Forkast H 0 hvis beregnet z er > z(α). Her er α = 0.05 og z(0.05) = 1.645 så H 0 forkastes med begge metoder.

35 Endret alternativ hypotese Anta at vi (for en annen by) skal teste: H 0 : µ = 125 mot H a : µ < 125. Anta igjen kjente verdier: n = 86, σ = 16.4, α = 0.05. Men anta nå at det er observert: x = 123.0. Testobservator: z = x 125 σ/ n = 123.0 125 16.4/ 86 = 1.13 Egenskaper ved z : Hvis H 0 gjelder er z standard normalfordelt. Hvis H a gjelder vil z bli for liten (dvs. for langt ute på den negative siden).

Metode med p-verdi: Husk at p-verdien er sannsynligheten for å få det som er observert eller noe mer ekstremt i retning av den alternative hypotesen. Dermed blir p-verdi = P(z < z ) = P(z < 1.13) som videre er lik P(z > 1.13) = 0.5 P(0 < z < 1.13) = 0.5 0.3708 = 0.1292. H 0 forkastes hvis p-verdi < α (som før), dvs. H 0 forkastes ikke.

Klassisk metode: Vi ønsker P(forkaste H 0 ) = α hvis H 0 er sann og vi ønsker å forkaste for små (negative) verdier av z. Dette får vi til ved å forkaste H 0 dersom z < z(α), siden for en standard normalfordelt z har vi P(forkaste H 0 ) = P(z < z(α)) = α Med α = 0.05 er z(0.05) = 1.645, så H 0 forkastes ikke siden vi har z = 1.13.

Eksempel: H 0 : µ = 125 mot H a : µ 125, σ = 16.4 Rimelig å forkaste H 0 hvis z = x 125 σ/ n er enten for stor eller for liten. Vi ønsker igjen at P(forkaste H 0 ) = α hvis H 0 er sann Vi forkaster da H 0 dersom z < z(α/2) eller z > z(α/2). Da har vi nemlig hvis H 0 er sann: P(forkaste H 0 ) = P(z < z(α/2)) + P(z > z(α/2)) = α/2 + α/2 = α

Altså: Vi forkaster H 0 dersom z = x 125 σ/ n > z(α/2) eller z = x 125 σ/ n < z(α/2) Sett α = 0.05. Da er z(α/2) = 1.96 Anta nå at x = 128.5, σ = 16.4, n = 86 Da er z 128.5 125 = 16.4/ = 1.98 > 1.96 86 så vi forkaster fremdeles H 0 med signifikansnivå 0.05.

p-verdien er som før sannsynligheten for at vår testobservator z får en verdi som er lik den vi har fått eller en som er mer ekstrem (i retning av den alternative hypotese) når nullhypotesen gjelder. Dette blir her (litt vanskeligere å begrunne enn for de tidligere situasjonene) p-verdi = P(z < 1.98 eller z > 1.98) = 2 P(z > 1.98) = 2(0.5 P(0 < z < 1.98)) = 2(0.5 0.4761) = 2 0.0237 = 0.0474 som er mindre enn α = 0.05, så vi forkaster H 0 med signifikansnivå α = 0.05.

41 Oppsummering: Klassisk hypotesetesting med kjent σ Tre typer situasjoner. Her er µ 0 et gitt tall (f.eks. 125). H 0 H a Forkast H 0 hvis µ = µ 0 µ > µ 0 z > z(α) µ = µ 0 µ < µ 0 z < z(α) µ = µ 0 µ µ 0 z < z(α/2) eller z > z(α/2) z = x µ 0 σ/ n De to første testene kalles ensidige ( one-tailed ) tester, mens den siste er tosidig ( two-tailed )

42 Oppsummering: Hypotesetesting med p-verdi (og kjent σ) Tre typer situasjoner. H 0 H a p-verdi µ = µ 0 µ > µ 0 P(z > z ) µ = µ 0 µ < µ 0 P(z < z ) = P(z > z ) for z < 0 µ = µ 0 µ µ 0 P(z < z ) + P(z > z ) z = x µ 0 σ/ n

Oppgave: Jeg har trukket 10 tall fra en populasjon som er normalfordelt med gjennomsnitt µ og standardavvik σ = 10. Tallene ble 111.30 111.53 106.34 96.98 92.30 107.57 93.37 112.50 114.59 115.75 med gjennomsnitt x = 106.23 Finn et punktestimat for populasjonsparameteren µ Finn et intervallestimat for populasjonsparameteren med konfidensnivå 0.90. Jeg påstår at µ = 100 for populasjonen. Ta stilling til dette utsagnet med en hypotesetest. Bruk signifikansnivå α = 0.1. Bruk både klassisk metode og metode med p-verdi.