Kapittel 9 og 10: Hypotesetesting

Like dokumenter
Kapittel 9 og 10: Hypotesetesting

Hypotesetesting. mot. mot. mot. ˆ x

Kapittel 9 og 10: Hypotesetesting

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Hypotesetest: generell fremgangsmåte

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

6.2 Signifikanstester

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

HØGSKOLEN I STAVANGER

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

TMA4240 Statistikk Høst 2015

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

i x i

b) Hva er sannsynligheten for at re tilfeldig utvalgte bilmotorer alle har en levetid på minst 17 år?

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk Høst 2016

Kapittel 10: Hypotesetesting

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Fasit for tilleggsoppgaver

Test, 3 Sannsynlighet og statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Hypotesetesting av λ og p. p verdi.

ST0202 Statistikk for samfunnsvitere

Introduksjon til inferens

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

TMA4240 Statistikk Høst 2007

Estimering og hypotesetesting

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Estimering og hypotesetesting

Løsning eksamen desember 2017

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

ST0202 Statistikk for samfunnsvitere

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Kapittel 3: Studieopplegg

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Econ 2130 uke 16 (HG)

HØGSKOLEN I STAVANGER

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2009

ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens

TMA4245 Statistikk Eksamen desember 2016

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk Høst 2015

Mer om hypotesetesting

Løsningsforlag statistikk, FO242N, AMMT, HiST 2.årskurs, 7. desember 2006 side 1 ( av 8) LØSNINGSFORSLAG

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

QED Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Emnekode: LGU Emnenavn: Matematikk 2 (5 10), emne 2. Semester: VÅR År: 2016 Eksamenstype: Skriftlig

Inferens i fordelinger

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

TMA4240 Statistikk Eksamen desember 2015

ST0202 Statistikk for samfunnsvitere

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl.

Statistikk og dataanalyse

LØSNINGSFORSLAG ) = Dvs

TMA4240 Statistikk 2014

TMA4245 Statistikk Eksamen august 2014

HØGSKOLEN I STAVANGER

Løsningsforslag eksamen 25. november 2003

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

TMA4240 Statistikk H2010

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Om eksamen. Never, never, never give up!

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Transkript:

Kapittel 9 og 1: ypotesetesting ypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker vi å undersøke påstander om verdien på populasjonsparametre som for eksempel og p. Dette formuleres som en hypotesetest: Eksempel: Juks på meieriet? Melkemengden som fylles i 1-liters melkekartonger er normalfordelt med forventning og kjent standardavvik =.2. skal være 1., men det påstås at < 1., dvs at det systematisk tappes for lite melk på melkekartongene. Undersøk dette. ypotesetest: : 1. mot : 1. eller eller : : : mot mot mot : : : For å undersøk dette måles nøyaktig mengde melk i n=5 tilfeldig valgte kartonger. Disse målinger gav et gjennomsnitt på.996. Dvs ˆ x.996 Gir dette grunnlag for å påstå at < 1.? Merk: Ofte skrives alternativ hypotese som 1 i stedet for. 1 2

Generelt Ut fra informasjonen i et tilfeldig utvalg vil man enten forkaste og påstå, eller ikke forkaste (akseptere ). Mulige utfall: sann gal Forkaster Type I feil OK Forkaster ikke OK Type II feil Prinsipp: Vi antar i utgangspunktet at er korrekt, påstår først dersom dataene peker klart i retning av. Vi prioriterer derfor å holde sannsynligheten for type I feil liten. Setter derfor: P(type I feil) = P(forkaste er sann) = Sette opp hypoteser: Når man skal formulere en problemstilling som en hypotesetest er det ofte best å starte med å sette opp den alternative hypotesen. Den alternative hypotesen er den påstanden vi skal undersøke om er tilfelle. I eksemplet med Juks på meieriet? om forventet mengde melk er mindre en 1 liter, dvs om < 1.. Vi setter da som nullhypotese at dette ikke er tilfelle, dvs i melkeeksemplet at 1. og får Eventuelt kan vi skrive (betyr i praksis det samme): Merk: : 1. mot : 1. : 1. mot : 1. En hypotesetest er alltid en test om verdien på en parameter, for eksempel om eller p. En test skal derfor alltid formuleres med parametre i nullhypotesen og alternativ hypotese aldri kalles (signifikans-)nivået til testen. 3 4 tilfeldige variable eller lignende.

ypotesetester for når kjent X 1, X 2,, X n uavhengige og N(, 2 ) Eksempel: Juks på meieriet? 1- : 1. mot : 1. Generelt: : mot : Vi antar i utgangspunktet at er korrekt, dvs at =. Får da: Z Vi forkaster dersom ˆ X peker klart i retning av 1 - her dersom X er klart mindre enn. vor mye mindre er klar mindre enn? X E( X ) X Var( X ) / n ~ N(,1) 5 -z Vi forkaster dersom X er så mye mindre enn at Z -z der P(Z -z ) = P(type I feil) = Sanns. for at Z -z dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. elt analogt vil man for hypotesetesten : mot : forkaste dersom Z z 1- z

For den tosidige hypotesetesten : mot : forkaste vi dersom Z - z /2 eller Z z /2 Eksempel: Juks på meieriet? For melkemengde i ulike kartonger kan vi anta at X 1, X 2,, X n er uavhengige og N(,.2 2 ). Vi skal teste: : 1. mot : 1. Merk: /2 1- -z /2 z /2 /2 Testene vi har sett på så langt gjelder for situasjonen med normalfordelte data med kjent standardavvik/varians. Dersom dataene ikke er normalfordelte, men antall målinger, n, er stor vil testene fremdeles gjelde tilnærmet pga sentralgrenseteoremet. 7 Vi velger nivået =.5. Vi forkaster da dersom Z -z =- z.5 =-1.645 n=5 målinger gav et gjennomsnitt på: ˆ x.996 Dette gir: x z / n.996.2 1. / 5 1.41-1.41>-1.645, dvs vi beholder. Dataene gir ikke grunnlag for å hevde at < 1.. 8

Eksempel: øyde menn. Vi antar at høyde menn er normalfordelt med ukjent forventningsverdi og kjent standardavvik =7.8. Ønsker å teste: : 179 mot : 179 n =35 målinger i klassen gav Bruk 5% nivå og utfør testen. x 182.2 ypotesetester for når ukjent X 1, X 2,, X n uavhengige og N(, 2 ) Vi begynner med å se på testen: : mot : Vi har som før at: X E( X ) X Z ~ N(,1) Var ( X ) / n Men nå er ukjent og må erstattes med estimatoren S. Vi får da at: T X S / ~ t( n 1) n 9 Dette gjelder dersom er korrekt, dvs dersom =. Vi forkaster da dersom ˆ X peker klart i retning av - her dersom X er klart større enn 1.

Mer presist så forkaster vi dersom X er så mye større enn at T t,n-1 der: P(T t,n-1 ) = P(type I feil) = For den tosidige hypotesetesten : mot : forkaste vi dersom T - t /2,n-1 eller T t /2,n-1 1- Sanns. for at T t,n-1 dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. 1- t,n-1 /2 /2 -t /2, n.1 t /2,n-1 elt analogt vil man for hypotesetesten : mot : forkaste dersom T -t,n-1 -t,n-1 1-11 Merk: Disse testene (hvor vi bruker t-fordeling) gjelder kun for situasjonen med normalfordelte data med ukjent standardavvik/varians. 12

Eksempel: En påstand om at forventet årslønn i en bestemt næring (dvs gj.sn. årslønn for alle i næringen/hele populasjonen) er større enn 4 skal undersøkes. Vi antar at årslønnen til personer i næringen er normalfordelt med ukjent forventning og ukjent standardavvik. For å undersøke denne påstanden blir årslønnen til 24 tilfeldig valgte personer i næringen registrert. Dette gav et gjennomsnitt på 437 og et standardavvik på 63. Utfør testen på 5% nivå. : 4 mot : 4 Eksempel: øyde menn. Vi antar at høyde menn er normalfordelt med ukjent forventningsverdi og ukjent standardavvik. Ønsker å teste: : 179 mot : 179 n =35 målinger i klassen gav x 182.2 og s =7.8. Bruk 5% nivå og utfør testen. Med =.5 og n=24 blir t,n-1 = t.5,23 =1.714, dvs vi forkaster dersom T 1.714. T X S / n 437 4 63 / 24 2.88 Dvs vi forkaster og kan påstå at forventet årslønn i næringen er større enn 4! 13 14

ypotesetester for p (når n er stor) p = P( suksess ) = andel suksesser i populasjonen. XBin(n,p). Estimator for p: Eksempel: pˆ Vareprøve. ksepterer kun en ny type vare dersom vi er sikre på at andel defekte varer, p, er mindre enn.1. Basert på en stikkprøve av n varer ønsker vi å fastslå om p <.1 Generelt: X n : p.1 mot : p.1 : p p mot : p p Vi antar i utgangspunktet at er korrekt, dvs at p=p. pˆ E( pˆ) pˆ p Får da: Z N(,1 ) Var( pˆ) p (1 p )/ n Vi forkaster dersom pˆ er så mye mindre enn p at Z -z der : -z P(Z -z ) = P(type I feil) = 1- elt analogt vil man for hypotesetesten : p p mot : p p forkaste dersom Z z Sanns. for at Z -z dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. 1- (ok når np (1-p ) 5) 15 z

For den tosidige hypotesetesten : p p mot : p p forkaste vi dersom Z - z /2 eller Z z /2 Eksemplet: Vareprøve : p.1 mot : p.1 I en stikkprøve på n=15 varer ble det observert x =7 defekte varer, dvs pˆ n x 7 15.47 1- Velger =.5. Vi forkaster da dersom Z -z =- z.5 =-1.645 /2 -z /2 z /2 /2 Z p pˆ (1 p p ) / n.47.1.1(1.1) / 15 2.16 Merk: Disse siste testene gjelder for situasjoner der vi har gjort et binomisk forsøk med np (1-p ) 5. 17-2.16 < -1.645 dvs vi forkaster. Dataene gir grunnlag for å påstå at p <.1 dvs varen aksepteres! 18

Eksempel: På en sykehusavdeling fikk tidligere 2% av pasientene en bestemt infeksjon. Etter en omlegging av rutinene fikk 32 av de 11 første pasientene denne infeksjonen. Tyder dette på at sannsynligheten for å få infeksjonen, p, har endret seg? Formuler problemstillingen som en hypotesetest og utfør testen. Bruk 1% nivå. Til slutt: Utfallet av en hypotesetest er enten at vi forkaster eller at vi ikke forkaster. Tolkningen av disse to utfallene er: Forkaster : Betyr at vi påstår at er rett. Forkaster ikke : Betyr at situasjonen er uavklart. Enten så er korrekt, eller så er korrekt men vi har ikke nok data til å påvise det. Merk spesielt at vi aldri kan bevise at en nullhypotese er korrekt, vi kan bare eventuelt bevise at en alternativ hypotese er korrekt. Dersom vi ikke forkaster betyr det altså bare at situasjon er uavklart - ikke at vi har bevist at er rett! 19 2

Oppsummering ypotesetester for, kjent: X 1, X 2,, X n uavh. og N(, 2 ) ypotesetester for, ukjent: X 1, X 2,, X n uavh. og N(, 2 ) : mot : Z X / n ~ N (,1) Forkaster dersom Z -z -z 1- : mot : X T ~ t ( n 1) S / n Forkaster dersom T -t,n-1 -t,n-1 1- : mot : : mot : Forkaster dersom Z z 1- Forkaster dersom T t,n-1 1- z t,n-1 : mot : : mot : Forkaster dersom Z - z /2 eller Z z /2 1- /2 /2 -z /2 z /2 Forkaster dersom T -t /2,n-1 eller T t /2,n-1 1- /2 /2 -t /2,n-1 t /2,n-1

ypotesetester for p (n stor): XBin(n, p) : p p mot : p p Z pˆ p p (1 p Forkaster dersom Z -z ) / n N(,1) -z 1- : p p mot : p p Forkaster dersom Z z 1- z : p p mot : p p Forkaster dersom Z - z /2 eller Z z /2 1- /2 /2 -z /2 z /2