Kapittel 9 og 10: Hypotesetesting

Like dokumenter
Kapittel 9 og 10: Hypotesetesting

Kapittel 9 og 10: Hypotesetesting

Hypotesetesting. mot. mot. mot. ˆ x

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

6.2 Signifikanstester

Hypotesetest: generell fremgangsmåte

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Hypotesetesting av λ og p. p verdi.

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Kapittel 8: Estimering

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

TMA4240 Statistikk H2010 (22)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

i x i

ST0202 Statistikk for samfunnsvitere

HØGSKOLEN I STAVANGER

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk Høst 2016

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Econ 2130 uke 16 (HG)

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4240 Statistikk H2010

ST0202 Statistikk for samfunnsvitere

b) Hva er sannsynligheten for at re tilfeldig utvalgte bilmotorer alle har en levetid på minst 17 år?

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Introduksjon til inferens

TMA4240 Statistikk Høst 2015

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Løsningsforslag eksamen 25. november 2003

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

TMA4240 Statistikk Høst 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

TMA4240 Statistikk Høst 2009

Løsning eksamen desember 2017

ST0202 Statistikk for samfunnsvitere

Fasit for tilleggsoppgaver

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Test, 3 Sannsynlighet og statistikk

Inferens i fordelinger

Eksamensoppgave i TMA4240 Statistikk

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2007

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Kapittel 3: Studieopplegg

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

LØSNINGSFORSLAG ) = Dvs

Estimering og hypotesetesting

Kap. 9: Inferens om én populasjon

Løsningsforslag Til Statlab 5

Estimering og hypotesetesting

TMA4245 Statistikk Eksamen august 2014

HØGSKOLEN I STAVANGER

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2010

STK1100 våren 2019 Mere om konfidensintevaller

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Om eksamen. Never, never, never give up!

TMA4240 Statistikk Høst 2018

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Om eksamen. Never, never, never give up!

Statistikk og dataanalyse

Binomisk sannsynlighetsfunksjon

ECON2130 Kommentarer til oblig

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Kapittel 10: Hypotesetesting

ST0202 Statistikk for samfunnsvitere

Transkript:

Kaittel 9 og 1 yotesetesting yotesetesting er en standard vitenskaelig fremgangsmåte for å sjekke åstander. Generell roblemstilling Basert å informasjonen i data fra et tilfeldig utvalg ønsker vi å undersøke åstander om verdien å oulasjonsarametre som for eksemel og. Dette formuleres som en hyotesetest Eksemel Juks å meieriet? Melkemengden som fylles i 1-liters melkekartonger er normalfordelt med forventning og kjent standardavvik =.2. skal være 1., men det åstås at < 1., dvs at det systematisk taes for lite melk å melkekartongene. Undersøk dette. yotesetest 1. 1. eller eller For å undersøk dette måles nøyaktig mengde melk i n=5 tilfeldig valgte kartonger. Disse målinger gav et gjennomsnitt å.996. Dvs ˆ x.996 Gir dette grunnlag for å åstå at < 1.? Merk Ofte skrives alternativ hyotese som 1 i stedet for.

Generelt Ut fra informasjonen i et tilfeldig utvalg vil man enten forkaste og åstå, eller ikke forkaste (aksetere ). Mulige utfall sann gal Forkaster Tye I feil OK Forkaster ikke OK Tye II feil Prinsi Vi antar i utgangsunktet at er korrekt, åstår først dersom dataene eker klart i retning av. Vi rioriterer derfor å holde sannsynligheten for tye I feil liten. Setter P(tye I feil) = P(forkaste er sann) = kalles (signifikans-)nivået til testen. Sette o hyoteser Når man skal formulere en roblemstilling som en hyotesetest er det ofte best å starte med å sette o den alternative hyotesen. Den alternative hyotesen er den åstanden vi skal undersøke om er tilfelle. I eksemlet med Juks å meieriet? om forventet mengde melk er mindre en 1 liter, dvs om < 1.. Vi setter da som nullhyotese at dette ikke er tilfelle, dvs i melkeeksemlet at 1. og får Eventuelt kan vi skrive (betyr i raksis det samme) Merk 1. 1. 1. 1. En hyotesetest er alltid en test om verdien å en arameter, for eksemel om eller. En test skal derfor alltid formuleres med arametre i nullhyotesen og alternativ hyotese aldri tilfeldige variable eller lignende.

yotesetester for når kjent. X 1, X 2,, X n uavhengige og N(, 2 ) Vi forkaster dersom X er så mye mindre enn at Z -z der Eksemel Juks å meieriet? 1. 1. Generelt -z 1- P(Z -z )= Sanns. for at Z -z dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. Vi antar i utgangsunktet at er korrekt, dvs at =. Får da Z X E( X ) X Var( X ) / n ~ N(,1) elt analogt vil man for hyotesetesten Vi forkaster dersom ˆ X eker klart i retning av 1 -her dersom X er klart mindre enn. forkaste dersom Z z 1- vor mye mindre er klar mindre enn? z

/2 Merk 1- -z /2 z /2 /2 For den tosidige hyotesetesten forkaste vi dersom Z - z /2 eller Z z /2 Testene vi har sett å så langt gjelder for situasjonen med normalfordelte data med kjent standardavvik/varians. Dersom dataene ikke er normalfordelte, men antall målinger, n, er stor vil testene fremdeles gjelde tilnærmet ga sentralgrenseteoremet. Eksemel Juks å meieriet? For melkemengde i ulike kartonger kan vi anta at X 1, X 2,, X n er uavhengige og N(,.2 2 ). Vi skal teste 1. 1. Vi velger nivået =.5. Vi forkaster da dersom Z -z =- z.5 =-1.645 n=5 målinger gav et gjennomsnitt å ˆ x.996 Dette gir x z / n.996 1..2 / 5 1.41-1.41>-1.645, dvs vi beholder. Dataene gir ikke grunnlag for å hevde at < 1..

Eksemel øyde menn. Vi antar at høyde menn er normalfordelt med ukjent forventningsverdi og kjent standardavvik =6.3. Ønsker å teste 179 179 n=49 målinger i klassen gav Bruk 5% nivå og utfør testen. x 18.1 yotesetester for når ukjent. X 1, X 2,, X n uavhengige og N(, 2 ) Vi begynner med å se å testen Vi har som før at Z X E( X ) X Var( X ) / n ~ N(,1) Men nå er ukjent og må erstattes med estimatoren S. Vi får da at T X ~ t( n 1) S / n Dette gjelder dersom er korrekt, dvs dersom =. Vi forkaster da dersom ˆ X eker klart i retning av 1 -her dersom X er klart større enn.

Mer resist så forkaster vi dersom X er så mye større enn at T t,n-1 der For den tosidige hyotesetesten 1- t,n-1 P(T t,n-1 )= Sanns. for at T t,n-1 dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. 1- /2 /2 -t /2, n.1 t /2,n-1 forkaste vi dersom T - t /2,n-1 eller T t /2,n-1 elt analogt vil man for hyotesetesten Merk Disse testene (hvor vi bruker t-fordeling) gjelder kun for situasjonen med normalfordelte data med ukjent standardavvik/varians. forkaste dersom T -t,n-1 1- -t,n-1

Eksemel En åstand om at forventet årslønn i en bestemt næring (dvs gj.sn. årslønn for alle i næringen/hele oulasjonen) er større enn 3 skal undersøkes. Vi antar at årslønnen til ersoner i næringen er normalfordelt med ukjent forventning og ukjent standardavvik. For å undersøke denne åstanden blir årslønnen til 24 tilfeldig valgte ersoner i næringen registrert. Dette gav et gjennomsnitt å 337 og et standardavvik å 63. Utfør testen å 5% nivå. 3 3 Eksemel øyde menn. Vi antar at høyde menn er normalfordelt med ukjent forventningsverdi og ukjent standardavvik. Ønsker å teste 179 179 n=49 målinger i klassen gav x 18.1 og s = 6.3. Bruk 5% nivå og utfør testen. Med =.5 og n=24 blir t,n-1 = t.25,23 =2.69, dvs vi forkaster dersom T 2.69. X 337 3 T 2.88 S / n 63 / 24 Dvs vi forkaster og kan åstå at forventet årslønn i næringen er større enn 3!

yotesetester for (når n er stor) = P( suksess ) = andel suksesser i oulasjonen. X XBin(n,). Estimator for ˆ n Eksemel Varerøve. kseterer kun en ny tye vare dersom vi er sikre å at andel defekte varer,, er mindre enn.1. Basert å en stikkrøve av n varer ønsker vi å fastslå om <.1 Generelt.1.1 Vi antar i utgangsunktet at er korrekt, dvs at =. Får da ˆ E( ˆ) ˆ N(,1) Var( ˆ) (1 ) / n Z (ok når n (1- ) 5) -z 1- Vi forkaster dersom ˆ er så mye mindre enn at Z -z der P(Z -z )= elt analogt vil man for hyotesetesten forkaste dersom Z z Sanns. for at Z -z dersom er sann er så liten,, at dersom dette skjer velger vi heller å tro at er sann. 1- z

/2 Merk 1- -z /2 z /2 /2 For den tosidige hyotesetesten forkaste vi dersom Z - z /2 eller Z z /2 Disse siste testene gjelder for situasjoner der vi har gjort et binomisk forsøk med n (1- ) 5. Eksemlet Varerøve.1.1 I en stikkrøve å n=15 varer ble det observert x =7 defekte varer, dvs x ˆ n 7 15 Velger =.5..47 Vi forkaster da dersom Z -z =- z.5 =-1.645 Z ˆ (1 ) / n.47.1.1(1.1) /15 2.16-2.16 < -1.645 dvs vi forkaster. Dataene gir grunnlag for å åstå at <.1 varen akseteres!

Eksemel På en sykehusavdeling fikk tidligere 2% av asientene en bestemt infeksjon. Etter en omlegging av rutinene fikk 32 av de 11 første asientene denne infeksjonen. Tyder dette å at sannsynligheten for å få infeksjonen,, har endret seg? Formuler roblemstillingen som en hyotesetest og utfør testen. Bruk 1% nivå. Til slutt Utfallet av en hyotesetest er enten at vi forkaster eller at vi ikke forkaster. Tolkningen av disse to utfallene er Forkaster Betyr at vi åstår at er rett. Forkaster ikke Betyr at situasjonen er uavklart. Enten så er korrekt, eller så er korrekt men vi har ikke nok data til å åvise det. Merk sesielt at vi aldri kan bevise at en nullhyotese er korrekt, vi kan bare eventuelt bevise at en alternativ hyotese er korrekt. Dersom vi ikke forkaster betyr det altså bare at situasjon er uavklart - ikke at vi har bevist at er rett!

Osummering yotesetester for, kjent X 1, X 2,, X n uavh. og N(, 2 ) yotesetester for, ukjent X 1, X 2,, X n uavh. og N(, 2 ) Z X / n ~ N(,1) Forkaster dersom Z -z 1- -z X T ~ t( n 1) S / n Forkaster dersom T -t,n-1 -t,n-1 1- Forkaster dersom Z z 1- Forkaster dersom T t,n-1 1- z t,n-1 Forkaster dersom Z - z /2 eller Z z /2 1- /2 /2 -z /2 z /2 Forkaster dersom T -t /2,n-1 eller T t /2,n-1 1- /2 /2 -t /2,n-1 t /2,n-1

yotesetester for (n stor) XBin(n, ) Z ˆ (1 Forkaster dersom Z -z ) / n N(,1) 1- -z Forkaster dersom Z z 1- z Forkaster dersom Z - z /2 eller Z z /2 /2 1- /2 -z /2 z /2