Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte



Like dokumenter
Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

Kontinuerlige sannsynlighetsfordelinger.

Hypotesetesting. mot. mot. mot. ˆ x

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

TMA4240 Statistikk H2010 (20)

Kapittel 9 og 10: Hypotesetesting

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Litt mer om eksponensialfordelingen

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Kapittel 9 og 10: Hypotesetesting

> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

EKSAMEN I TMA4245 Statistikk

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Mer om hypotesetesting

Regler i statistikk STAT 100

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

TMA4240 Statistikk Høst 2007

HØGSKOLEN I STAVANGER

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

ST0202 Statistikk for samfunnsvitere

MOT310 Statistiske metoder 1, høsten 2010 Løsninger til regneøving nr. 11 (s. 1) der

Fasit for tilleggsoppgaver

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

TMA4240 Statistikk H2010 (19)

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

Om eksamen. Never, never, never give up!

Kp. 13. Enveis ANOVA

ÅMA110 Sannsynlighetsregning med statistikk, våren

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Oppgave 1: Feil på mobiltelefoner

Eksamensoppgave i TMA4240 Statistikk

Om eksamen. Never, never, never give up!

Kapittel 10: Hypotesetesting

ST0202 Statistikk for samfunnsvitere

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen desember 2016

HØGSKOLEN I STAVANGER

Utvalgsfordelinger (Kapittel 5)

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

Eksamensoppgave i TMA4245 Statistikk

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Eksamen desember 2015

Statistikk og dataanalyse

TMA4240 Statistikk H2010 (22)

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4240 Statistikk

Estimering og hypotesetesting

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2015

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Kp. 9.8 Forskjell mellom to forventninger

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Løsningsforslag statistikkeksamen desember 2014

Løsningsforslag Til Statlab 5

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Kapittel 2: Hendelser

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

6.2 Signifikanstester

Kap. 8: Utvalsfordelingar og databeskrivelse

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

TMA4240 Statistikk Høst 2016

i x i

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Introduksjon til inferens

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Transkript:

Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger. Eksempel: Bærebjelker. Bæreevnen antas normalfordelt med forventning μ og varians σ 2. Før vi eventuelt tar i bruk bjelker av denne typen stiller vi som krav at μ>5.5 og σ 2 < 0.25. Tyder målingene 5.9, 6.1, 5.4, 5.9, 5.7, 6.5, 5.8, 6.0, 5.3, 6.3, 5.8, 5.8, 5.8 og 6.0 på at dette er oppfylt? Eksempel: Levetid til ny type kretskort. Levetiden antas eksponensialfordelt med parameter β. Et mål i utviklingen av kretskortet var at det skulle ha en forventet levetid på mer enn 700. Tyder de observerte tidene 612, 1009, 95, 1303, 599, og 780 på at dette er oppfylt? 1

Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som: H 0 : θ = θ 0 mot H 1 : θ>θ 0 Når vi skal test om θ<θ 0 skriver vi: H 0 : θ = θ 0 mot H 1 : θ<θ 0 Når vi skal test om θ θ 0 skriver vi: H 0 : θ = θ 0 mot H 1 : θ θ 0 Merk at H 1 er påstanden vi skal undersøke om er riktig. Prinsipp: Konservativ fremgangsmåte - ønsker ikke åpåstå at det vi skal undersøke om er tilfelle, H 1, virkelig er tilfelle med mindre dataene peker klart i denne retningen. Vi antar derfor i utgangspunktet at H 0 er korrekt, og gjør all regning under denne antagelsen. Påstår bare H 1 dersom de observerte dataene er lite sannsynlige under H 0 -modellen og peker klart i retning av H 1 -modellen. 2

Setter derfor α = P (forkaste H 0 H 0 er rett) liten. α kalles (signifikans-)nivået til testen. NB! Resultatet av en hypotesetest er: Enten at vi forkaster H 0 -somvilsiatvi påstår at H 1 er rett. Eller at vi ikke forkaster H 0 -somvilsiat både H 0 og H 1 er mulige (H 1 er fremdeles mulig selv om dataene ikke peker sterkt i den retning!). 3

Hypotesetesting (I de situasjonene vi skal se på i dette kurset) X 1,...,X n u.i.f. f(x; θ). H 0 : θ = θ 0 mot H 1 : a) θ>θ 0 b) θ<θ 0 c) θ θ 0 1. Finn estimator for θ: ˆΘ. 2. Finn en testobservator W = h( ˆΘ,θ 0 )som har en kjent fordeling under H 0. 3. Dersom testobservatoren W = h( ˆΘ,θ 0 )er stor når ˆΘ er stor og liten når ˆΘ er liten så: a) Forkaster vi H 0 dersom W w α (der P (forkaste H 0 H 0 )=P (W w α H 0 )=α). b) Forkaster vi H 0 dersom W w 1 α (der P (forkaste H 0 H 0 )=P (W w 1 α H 0 )=α). c) Forkaster vi H 0 dersom W w 1 α/2 eller W w α/2 (der P (forkaste H 0 H 0 )= P (W w α/2 H 0 )+P (W w 1 α/2 H 0 )=α). 4

Eksempel: Bæreevne til bærebjelker. X 1,...,X n u.i.f. N(μ, σ 2 ). Både μ og σ 2 er ukjente. Vi ønsker åtesteomμ>5.5 ogomσ 2 < 0.25. Test for μ: H 0 : μ =5.5 mot H 1 : μ>5.5 Estimator: ˆμ = X Testobservator: T = X μ 0 S/ n t n 1 under H 0 Vi forkaster H 0 dersom T t α,n 1. Velger vi α =0.05 får vi med n =14atvi forkaster H 0 dersom T t 0.05,13 =1.771. Meddeobservertedataenefår vi x =5.8786 og s = 0.0972 = 0.312 som gir t = 5.8786 5.5 0.312/ 14 =4.54 >t 0.05,13 =1.771 dvs vi forkaster H 0 på5%nivå. Dataene gir grunnlag for åhevdeatμ>5.5. Dvs ˆμ = x =5.8786 er så mye større enn 5.5 at det gir grunnlag for åhevdeatμ>5.5 5

Test for σ 2 : H 0 : σ 2 =0.25 mot H 1 : σ 2 < 0.25 Estimator: ˆσ 2 = S 2 = 1 n 1 Teorem 8.4/tabell s. 27 gir at: (n 1) S2 σ 2 0 = n i=1 (X i X) 2 σ 2 0 n (X i X) 2 i=1 χ 2 n 1 under H 0 Vi forkaster H 0 dersom (n 1) S2 χ 2 σ 1 α,n 1. 0 2 Med α =0.05 og n = 14 blir χ 2 1 α,n 1 = χ 2 0.95,13 =5.892 Observert: (n 1) s2 σ 2 0 =(14 1) 0.0972 0.25 =5.05 <χ2 0.95,13 =5.892 dvs vi forkaster H 0 på5%nivå. Dataene gir grunnlag for åhevdeatσ 2 < 0.25. Dvs ˆσ 2 = S 2 =0.0972 er så mye mindre enn 0.25 at det gir grunnlag for åhevdeatσ 2 < 0.25. 6

Eksempel: Levetid kretskort. Levetiden antas eksponensialfordelt med forventning β. Ønsker åtesteommålet β>700 ser ut til åvære oppfylt. H 0 : β = 700 mot H 1 : β>700 Estimator: ˆβ = T = 1 n n i=1 Fra tidligere (se notatene om estimering) får vi: T i 2n β 0 ˆβ χ 2 2n under H 0 Vi forkaster H 0 dersom 2n β 0 ˆβ χ 2 α,2n. Med α =0.05 og n = 6 blir χ 2 α,2n = χ 2 0.05,12 = 21.026 Observert: 2n 12 ˆβ = β 0 700 733 = 12.57 <χ2 0.05,12 =21.026 dvs vi forkaster ikke H 0 på5%nivå. Dataene gir ikke grunnlag for åhevdeatβ>700. 7

Eksempel: I en produksjonsprosess har det tidligere blitt produsert 18% B-varer. Etter en omlegging av rutinene lurer man på om andelen B-varer har endret seg. Blant 75 varer produsert etter omleggingen blir 17 klassifisert som B-varer. Tyder dette på at andelen B-varer har endret seg? Merk først: X= antall B-varer blant n tilfeldig valgte varer vil være B(n, p)-fordelt, der p er sannsynligheten for at en tilfeldig vare er B-vare (=andel B-varer). H 0 : p =0.18 mot H 1 : p 0.18 Estimator: ˆp = X n Fordeling til ˆp? Fra kap. 6 har vi at når X B(n, p) ognp > 5 og n(1 p) > 5såerX N(np, np(1 p)). Dette er oppfylt her, og når X er tilnærmet normalfordelt vil også ˆp = X n være tilnærmet normalfordelt. 8

E(ˆp) = E( X n )= 1 n E(X) = 1 n np = p Var(ˆp) = 1 n 2 Var(X) = 1 p) np(1 p) =p(1 n2 n ˆp p 0 Z = p0 (1 p 0 )/n N(0, 1) under H 0 Vi forkaster H 0 dersom Z z α/2 eller Z z α/2. Velger vi α =0.05 får vi z α/2 = z 0.025 =1.96. Observerte data gir ˆp =17/75 = 0.227 og dermed: z = 0.227 0.18 0.18(1 0.18)/75 =1.06 dvs vi forkaster ikke H 0 på5%nivå. Dataene gir ikke grunnlag for åhevdeatp 0.18. Sammenheng mellom (tosidig) hypotesetesting og konfidensintervall: Les selv i boka, kap. 10.6! 9