Kapittel 10: Hypotesetesting

Like dokumenter
TMA4240 Statistikk H2010 (19)

TMA4240 Statistikk H2010 (20)

Estimering og hypotesetesting

Estimering og hypotesetesting

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Hypotesetest: generell fremgangsmåte

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Kapittel 9 og 10: Hypotesetesting

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Om eksamen. Never, never, never give up!

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Hypotesetesting. mot. mot. mot. ˆ x

TMA4240 Statistikk Høst 2007

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

TMA4240 Statistikk H2010 (22)

Om eksamen. Never, never, never give up!

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2009

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

6.2 Signifikanstester

Verdens statistikk-dag.

i x i

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Høst 2015

Kapittel 9 og 10: Hypotesetesting

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Eksamensoppgåve i TMA4240 Statistikk

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Hypotesetesting av λ og p. p verdi.

Introduksjon til inferens

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen desember 2016

β(µ) = P(akseptere H 1 µ)

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

LØSNINGSFORSLAG ) = Dvs

ST0202 Statistikk for samfunnsvitere

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

ÅMA110 Sannsynlighetsregning med statistikk, våren

Løsning eksamen desember 2017

ST0202 Statistikk for samfunnsvitere

Norske hoppdommere og Janne Ahonen

TMA4240 Statistikk H2010

ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Fasit for tilleggsoppgaver

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

estimert verdi ± feilmargin = X ± et visst antall standardavvik for snittet = X ± u α/2 σ n

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Løsning eksamen desember 2016

STK Oppsummering

TMA4240 Statistikk Eksamen desember 2015

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i TMA4240 Statistikk

Løsningsforslag eksamen 27. februar 2004

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

TMA4240 Statistikk 2014

Oppsummering av STK2120. Geir Storvik

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Kapittel 2: Hendelser

Eksamensoppgåve i TMA4255 Anvendt statistikk

Econ 2130 uke 16 (HG)

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

6.5 Normalapproksimasjon til. binomisk fordeling

Eksamensoppgave i TMA4240 Statistikk

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

TMA4240 Statistikk H2010

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

6.1: Generelt om hypotesetesting Bakgrunn: visse størrelser har naturlig variabilitet. Hvor stort avvik må til før vi konkluderer at noe er unormalt?

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Oppgaver til Studentveiledning I MET 3431 Statistikk

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

ST0202 Statistikk for samfunnsvitere

Kapittel 3: Studieopplegg

Transkript:

Kapittel 10: Hypotesetesting TMA445 Statistikk 10.1, 10., 10.3: Introduksjon, 10.5, 10.6, 10.7: Test for µ i normalfordeling, 10.4: p-verdi Turid.Follestad@math.ntnu.no p.1/19 Estimering og hypotesetesting Situasjon: Eks 1: Studentar si oppfatning av køyreeigenskapar Eks : Høgda til studentar Problemstilling Synest studentar dei er flinkare enn gj.snittet til å køyre bil? Kor høge er studentane? Populasjon Vil observere Alle studentar, (evt. menn og kvinner som to pop.) Om dei synest dei er "bedre enn gj.snittet" eller ikkje Alle studentar, (evt. menn og kvinner som to pop.) Høgda Fordeling Binomisk Normal Parameter θ Utvalg, storleik n Data: observert verdi av X 1,..., X n u.i.f. SV Andelen p som synest dei er flinkare enn gj.snittet Alle studentar som svarte på spørreundersøking "Bedre enn gj.snittet" eller ikkje. X = X 1 + + X n = antall "bedre" Forventa høgde, µ. Alle studentar som svarte på spørreundersøking Høgda, X 1,..., X n TMA445: Kap.10, del 1- p./19

Estimering og hypotesetesting (forts) Spørsmål, estimering: Eks 1: Studentar si oppfatning av køyreeigenskapar Kor stor andel av studentane synest dei er flinkare enn gj.snittet til å køyre bil? Estimator ˆp = X, andel "betre" blant n dei n spurte ˆp p Storleik med kjent fordeling Z = pˆp(1 ˆp)/n N(0, 1) for stor n, og p ikkje nær 0 eller 1. Konfidensintervall: Spørsmål, hypotesetesting: Eks : Høgda til studentar Kva er forventa høgde for ein student? ˆµ = X, gjennomsnittleg høgde i utvalget. T = X µ S/ er t-fordelt n med n 1 fridomsgrader. [ˆp z α/ q ˆp(1 ˆp) n, [ x t α/,(n 1)) s n, ˆp + z α/ q ˆp(1 ˆp) n ] x + t α/,(n 1)) s n ] Synest fleire enn 50% av studentene at dei er betre enn gj.snittet til å køyre bil? Trur fleire menn enn kvinner at dei er betre enn gj.snittet? Er forventa høgde på kvinnelige studentar mindre enn 170 cm? TMA445: Kap.10, del 1- p.3/19 Eks: Kvalitetskontroll av skruar Ser på produksjon av skruar, der lengda på ein skrue skal vere 15 mm. I praksis er det små variasjonar, og lengda på skruane har standardavvik σ = 0.1 mm. Skruane vert antatt å følgje spesifikasjonen dersom forventa lengde er 15 mm. Tar jamnlig stikkprøver frå prosessen, for å sjekke om skruane svarer til spesifikasjonen. Dersom stikkprøva tyder på at dei produserte skruane ikkje er 15 mm, må maskina som lagar skruane kalibrerast på nytt. Vil bruke hypotesetesting basert på stikkprøva til å avgjere om maskina må kalibrerast. Figur frå http://www.neuestatistik.de/ p.4/19

Hypotese DEF 10.1: Ein statistisk hypotese er ein antakelse eller påstand om eigenskapar ved ein eller fleire populasjonar. Nullhypotese (H 0 ): Hypotesen vi vil undersøke om vi har grunnlag frå data for å forkaste. Ein bestemt verdi for ein parameter. Alternativ hypotese (H 1 ): Hypotesen vi aksepterer dersom vi forkastar nullhypotesen. Ofte meir enn ein verdi for ein parameter. Eks: Bilkøyring: H 0 : p 1 p = 0, H 1 : p 1 p > 0 Høgde: H 0 : µ = 170, H 1 : µ < 170 Skruar: H 0 : µ = 15, H 1 : µ 15 Figur frå http://www.neuestatistik.de/ p.5/19 Statistisk hypotesetesting Undersøke om dataene gir tilstrekkelig "bevis" for at den alternative hypotesen er sann. Sml. rettssak: Tiltalte er uskuldig inntil det motsette er bevist. To typer testar: To-sidig test: H 0 : θ = θ 0 mot H 1 : θ θ 0 Ein-sidig test: H 0 : θ = θ 0 mot H 1 : θ < θ 0, eller H 0 : θ = θ 0 mot H 1 : θ > θ 0 TMA445: Kap.10, del 1- p.6/19

To typer feil Type I-feil: Forkasting av nullhypotesen når denne er sann (DEF 10.) Eks, skruar: Type I-feil kan føre til unødvendig produksjonsstans. Vil ikkje stoppe produksjonen for å kalibrere utan at vi er sikre på at skruane ikkje er 15 mm. Type II-feil: Ikkje forkaste nullhypotesen når denne er usann (DEF 10.3). Eks, skruar: Type-II-feil kan føre til mangel på nødvendig kalibrering. noko som er ugunstig overfor kundar. For lange og for korte skruar påfører kjøpar problem. Signifikansnivået for ein test = P (Type I-feil) = α TMA445: Kap.10, del 1- p.7/19 Type-I og type-ii-feil H 0 sann H 0 falsk Aksepter H 0 Korrekt Type-II feil Forkast H 0 Type-I feil Korrekt Analogi, rettssak: H 0 sann H 0 falsk Aksepter H 0 Uskyldig, frikjent Skyldig, går fri Forkast H 0 Uskyldig, dømt Skyldig, dømt TMA445: Kap.10, del 1- p.8/19

Eitt utvalg: to-sidig test for µ med σ kjent La X 1, X,..., X n vere u.i.f., X i N(µ, σ ), der σ er kjent. 1. Sett opp hypoteser: H 0 : µ = µ 0 mot H 1 : µ µ 0. Bestem signifikansnivå α. 3. Velg testobservator: Z = X µ σ/ n Under H 0 er Z 0 = X µ 0 σ/ n N(0, 1) Finn forkastningsområde: Forkast H 0 dersom z 0 > z α, der z 0 er observert verdi for Z 0. 4. Berekn x frå utvalget, og vidare observert verdi for Z 0 : z 0 = x µ 0 σ/ n. Samanlikn z 0 med z α, og forkast H 0 dersom z 0 > z α. TMA445: Kap.10, del 1- p.9/19 Eks, test for µ, σ kjent: Skruar Vil undersøke om det er grunn til å tru at skruane som blir produserte ikkje er 15 mm lange i forventning. Generell framgangsmåte Utvalg: X 1, X,..., X n uavhengige, med X i N(µ, σ ), der σ er kjent. 1. Hypoteser: Kvalitetskontroll av skruar Stikkprøve med n = 10 skruar, antar normalfordeling, kjent σ = 0.1mm. H 0 : µ = µ 0 vs. H 1 : µ µ 0 H 0 : µ = 15 vs. H 1 : µ 15. Bestem signifikansnivå α Velger α = 0.05 3. Testobservator Z = X µ σ/ n, Z 0 = X µ 0 σ/ n N(0,1) under H 0 Forkastingsområde: Forkast H 0 dersom z 0 > z α eller z 0 < z α. 4. Observerer x frå utvalget x = 15.05 mm. Bereknar z 0 = x µ 0 σ/ n z 0 = 15.05 15 0.1/ 10 = 1.58 Finn z α z 0.05 = z 0.05 = 1.96 Samanliknar z α, z 0 og z α -1.96<1.58<1.96 Forkast H 0 og konkluder med H 1, eller hald på H 0. Forkastar ikkje H 0. Har ikkje sterke nok bevis for at µ 15 mm. TMA445: Kap.10, del 1- p.10/19

Hypotesetesting, generell prosedyre 1. Spesifisér nullhypotese og alternativ hypotese.. Bestem signifikansnivå α. 3. Velg passande testobservator, med kjent fordeling, og etablér forkastningsområde (kritisk område) basert på denne og α. 4. Berekn observert verdi av testobservatoren. Forkast H 0 dersom denne verdien ligg i forkastningsområdet, og behald H 0 dersom ikkje. 5. Trekk konklusjonar. TMA445: Kap.10, del 1- p.11/19 10.4: p-verdi DEF 10.5: Ein p-verdi er det lavaste (signifikans-)nivået som gjer at den observerte verdien for testobservatoren er signifikant. Alternativ def: Ein p-verdi er sannsynet for å få det vi har observert eller noko meir ekstremt, gitt at H 0 er sann. Generell prosedyre, hypotesetest ved bruk av p-verdi: Bestem null- og alternativ hypotese. Velg passande testobservator. Berekn p-verdien basert på observert verdi av testobservatoren. Bestem om vi vil forkaste eller behalde nullhypotesen på grunnlag av p-verdien og kunnskap om systemet. TMA445: Kap.10, del 1- p.1/19

10.6: Hypotesetest og konfidensintervall Anta X 1, X,..., X n u.i.f., X i N(µ, σ ) der σ er kjent. To-sidig test: H 0 : µ = µ 0 mot H 1 : µ µ 0 Signifikansnivå α. Testobservator Z 0 = X µ 0 σ/ n N(0,1) under H 0 Konfidensintervall for µ: Forkastingsområde: Forkast H 0 dersom z 0 > z α eller z 0 < z α Under H 0 har vi P( z α < Z 0 < z α ) = 1 α x z α σ n < µ 0 < x + z α σ n Dersom eit (1 α)100% konfidensintervall inneheld µ 0 vil vi ved hypotesetesting ikkje forkaste H 0 på nivå α. Dersom eit (1 α)100% konfidensintervall ikkje inneheld µ 0 vil vi ved hypotesetesting forkaste H 0 på nivå α. TMA445: Kap.10, del 1- p.13/19 10.7: Eitt utvalg, to-sidig test for µ med σ ukjent La X 1, X,..., X n vere u.i.f., X i N(µ, σ ), der σ er ukjent. Estimator for σ : S = 1 n 1 n i=1 (X i X). 1. Sett opp hypoteser: H 0 : µ = µ 0 mot H 1 : µ µ 0. Bestem signifikansnivå α. 3. Testobservator: T = X µ S/ n Under H 0 er T 0 = X µ 0 S/ t-fordelt med n 1 fridomsgrader. n Forkastingsområde: Forkast H 0 dersom t 0 > t α,n 1, der t 0 er observert verdi for T 0. 4. Berekn x og s frå utvalget, og vidare observert verdi for T 0 : t 0 = x µ 0 s/ n. Samanlikn t 0 med t α,n 1, og forkast H 0 dersom t 0 > t α,n 1. TMA445: Kap.10, del 1- p.14/19

Rep: Viktige begrep, hypotesetesting Hypoteser: Nullhypotese (H 0 ): Hypotesen vi vil undersøke om vi har grunnlag frå data for å forkaste. Ein bestemt verdi for ein parameter. Alternativ hypotese (H 1 ): Hypotesen vi aksepterer dersom vi forkastar nullhypotesen. Ofte meir enn ein verdi for ein parameter. Statistisk hypotesetesting: hypotesen er sann. Undersøke om dataene gir tilstrekkelig "bevis" for at den alternative To typer testar: To-sidig test: H 0 : θ = θ 0 mot H 1 : θ θ 0 Ein-sidig test: H 0 : θ = θ 0 mot H 1 : θ < θ 0, eller H 0 : θ = θ 0 mot H 1 : θ > θ 0 To typer feil: Type-I og type-ii-feil. H 0 sann H 0 falsk Aksepter H 0 Korrekt Type-II feil Forkast H 0 Type-I feil Korrekt TMA445: Kap.10, del 1- p.15/19 Signifikansnivå og teststyrke Definerer α = P(Type I-feil) β = P(Type II-feil) Har at Signifikansnivået for ein test = P(Type I-feil) = α. Styrken for ein test er sannsynet for å forkaste H 0 når eit bestemt alternativ er sant (DEF 10.4), dvs. Styrken = 1 P(Type II-feil, bestemt alternativ) = 1 β. Reduserer α β aukar og 1 β (styrken) minkar (og omvendt). Aukar n α minkar og 1 β (styrken) aukar. TMA445: Kap.10, del 1- p.16/19

Teststyrke, illustrasjon Testar hypotesen H 0 : µ = µ 0 mot H 1 : µ < µ 0. Forkastar H 0 dersom z 0 < z α, eller ekvivalent x < a, der a = µ 0 z α σ/ n. Anta sann verdi µ = µ 1, kva er β = P(Type II-feil, µ = µ 1 ) og teststyrken 1 β? Areal: α Areal: β a Forkast H0 Aksepter H0 µ 1 µ 0 TMA445: Kap.10, del 1- p.17/19 Teststyrke, illustrasjon (forts) Testar hypotesen H 0 : µ = µ 0 mot H 1 : µ < µ 0. Forkastar H 0 dersom z 0 < z α, eller ekvivalent x < a, der a = µ 0 z α σ/ n. La α = 0.05. Teststyrke 1 β for µ = µ 1 (n høgre = n venstre ): Areal: α Areal: β Areal: α Areal: β Forkast H0 a Aksepter H0 µ 1 µ 0 Forkast H0 a Aksepter H0 µ 1 µ 0 TMA445: Kap.10, del 1- p.18/19

Valg av utvalgsstorleik Einsidig test for µ, σ kjent. H 0 : µ = µ 0 mot H 1 : µ > µ 0 (eller H 1 : µ < µ 0 ) Dersom vi vil ha sannsyn (1 β) for å oppdage µ = µ 0 + δ (for gitt δ), og ønskjer signifikansnivå α, må storleiken n på utvalget vere minst n = (z α + z β ) σ δ Tosidig test for µ, σ kjent. H 0 : µ = µ 0 mot H 1 : µ µ 0 Med tilsvarande situasjon som over, blir minste utvalgsstorleik (tilnærma) n = (z α + z β) σ δ TMA445: Kap.10, del 1- p.19/19