Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Like dokumenter
Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Kapittel 9 og 10: Hypotesetesting

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk Høst 2007

Løsningsforslag eksamen 27. februar 2004

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Hypotesetesting. mot. mot. mot. ˆ x

Kapittel 10: Hypotesetesting

Estimering 2. -Konfidensintervall

Estimering og hypotesetesting

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Norske hoppdommere og Janne Ahonen

TMA4240 Statistikk H2010

Estimering og hypotesetesting

TMA4240 Statistikk H2010 (22)

Oppgave 1. Kilde SS df M S F Legering Feil Total

Kapittel 9 og 10: Hypotesetesting

Om eksamen. Never, never, never give up!

TMA4240 Statistikk H2010 (19)

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Om eksamen. Never, never, never give up!

STK Oppsummering

Oppgave 14.1 (14.4:1)

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Løsningsforslag statistikkeksamen desember 2014

Kp. 9.8 Forskjell mellom to forventninger

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

TMA4240 Statistikk 2014

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

ST0202 Statistikk for samfunnsvitere

Løsningsforslag, eksamen statistikk, juni 2015

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2015

LØSNINGSFORSLAG ) = Dvs

ÅMA110 Sannsynlighetsregning med statistikk, våren

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

Løsningsforslag eksamen 25. november 2003

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Løsningsforslag oblig 1 STK1110 høsten 2014

TMA4240 Statistikk Eksamen desember 2015

STK Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

TMA4245 Statistikk Eksamen august 2014

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Hypotesetest: generell fremgangsmåte

Fasit og løsningsforslag STK 1110

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ÅMA110 Sannsynlighetsregning med statistikk, våren

ST0202 Statistikk for samfunnsvitere

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Løsning eksamen desember 2016

Fasit for tilleggsoppgaver

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Kapittel 2: Hendelser

ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Oppsummering av STK2120. Geir Storvik

UNIVERSITETET I OSLO

Kap. 8: Utvalsfordelingar og databeskrivelse

TMA4240 Statistikk Høst 2016

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Utvalgsfordelinger (Kapittel 5)

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Forslag til endringar

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Løsningsforslag: STK2120-v15.

TMA4240 Statistikk Høst 2015

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Emnenavn: Deleksamen i Statistikk. Eksamenstid: Faglærer: Tore August Kro. Oppgaven er kontrollert:

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk 2014

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Løsningsforslag til oppgaver brukt i STA100

Transkript:

Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger. Eksempel: Bærebjelker. Bæreevnen antas normalfordelt med forventning μ og varians σ. Før vi eventuelt tar i bruk bjelker av denne typen stiller vi som krav at μ>5.5 og σ < 0.5. Tyder målingene 5.9, 6.1, 5.4, 5.9, 5.7, 6.5, 5.8, 6.0, 5.3, 6.3, 5.8, 5.8, 5.8 og 6.0 på at dette er oppfylt? Eksempel: Levetid til ny type kretskort. Levetiden antas eksponensialfordelt med parameter β. Et mål i utviklingen av kretskortet var at det skulle ha en forventet levetid på mer enn 700. Tyder de observerte tidene 61, 1009, 95, 1303, 599, og 780 på at dette er oppfylt? Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som: H 0 : θ = θ 0 mot H 1 : θ>θ 0 Når vi skal test om θ<θ 0 skriver vi: H 0 : θ = θ 0 mot H 1 : θ<θ 0 Når vi skal test om θ θ 0 skriver vi: H 0 : θ = θ 0 mot H 1 : θ θ 0 Merk at H 1 er påstanden vi skal undersøke om er riktig. Prinsipp: Konservativ fremgangsmåte - ønsker ikke åpåstå at det vi skal undersøke om er tilfelle, H 1, virkelig er tilfelle med mindre dataene peker klart i denne retningen. Vi antar derfor i utgangspunktet at H 0 er korrekt, og gjør all regning under denne antagelsen. Påstår bare H 1 dersom de observerte dataene er lite sannsynlige under H 0 -modellen og peker klart i retning av H 1 -modellen. 1

Hypotesetesting (I de situasjonene vi skal se på i dette kurset) Setter derfor α = P (forkaste H 0 H 0 er rett) liten. α kalles (signifikans-)nivået til testen. X 1,...,X n u.i.f. f(x; θ). H 0 : θ = θ 0 mot H 1 : a) θ>θ 0 b) θ<θ 0 c) θ θ 0 NB! Resultatet av en hypotesetest er: Enten at vi forkaster H 0 -somvilsiatvi påstår at H 1 er rett. Eller at vi ikke forkaster H 0 -somvilsiat både H 0 og H 1 er mulige (H 1 er fremdeles mulig selv om dataene ikke peker sterkt i den retning!). 1. Finn estimator for θ: ˆΘ.. Finn en testobservator W = h( ˆΘ,θ 0 )som har en kjent fordeling under H 0. 3. Dersom testobservatoren W = h( ˆΘ,θ 0 )er stor når ˆΘ er stor og liten når ˆΘ er liten så: a) Forkaster vi H 0 dersom W w α (der P (forkaste H 0 H 0 )=P (W w α H 0 )=α). b) Forkaster vi H 0 dersom W w 1 α (der P (forkaste H 0 H 0 )=P (W w 1 α H 0 )=α). c) Forkaster vi H 0 dersom W w 1 α/ eller W w α/ (der P (forkaste H 0 H 0 )= P (W w α/ H 0 )+P (W w 1 α/ H 0 )=α). 3 4

Eksempel: Bæreevne til bærebjelker. X 1,...,X n u.i.f. N(μ, σ ). Både μ og σ er ukjente. Vi ønsker åtesteomμ>5.5 ogomσ < 0.5. Test for μ: H 0 : μ =5.5 mot H 1 : μ>5.5 ˆμ = X Testobservator: T = X μ 0 S/ n t n 1 under H 0 Vi forkaster H 0 dersom T t α,n 1. Velger vi α =0.05 får vi med n =14atvi forkaster H 0 dersom T t 0.05,13 =1.771. Meddeobservertedataenefår vi x =5.8786 og s = 0.097 = 0.31 som gir 5.8786 5.5 t = 0.31/ 14 =4.54 >t 0.05,13 =1.771 dvs vi forkaster H 0 på5%nivå. Dataene gir grunnlag for åhevdeatμ>5.5. Dvs ˆμ = x =5.8786 er så mye større enn 5.5 at det gir grunnlag for åhevdeatμ>5.5 Test for σ : H 0 : σ =0.5 mot H 1 : σ < 0.5 ˆσ = S = 1 n 1 Teorem 8.4/tabell s. 7 gir at: (n 1) S σ 0 = σ 0 n (X i X) n (X i X) χ n 1 under H 0 Vi forkaster H 0 dersom (n 1) S χ σ 1 α,n 1. 0 Med α =0.05 og n = 14 blir χ 1 α,n 1 = χ 0.95,13 =5.89 Observert: (n 1) s σ 0 =(14 1) 0.097 0.5 =5.05 <χ 0.95,13 =5.89 dvs vi forkaster H 0 på5%nivå. Dataene gir grunnlag for åhevdeatσ < 0.5. Dvs ˆσ = S =0.097 er så mye mindre enn 0.5 at det gir grunnlag for åhevdeatσ < 0.5. 5 6

Eksempel: Levetid kretskort. Levetiden antas eksponensialfordelt med forventning β. Ønsker åtesteommålet β>700 ser ut til åvære oppfylt. H 0 : β = 700 mot H 1 : β>700 ˆβ = T = 1 n n Fra tidligere (se notatene om estimering) får vi: T i n β 0 ˆβ χ n under H 0 Vi forkaster H 0 dersom n β 0 ˆβ χ α,n. Med α =0.05 og n = 6 blir χ α,n = χ 0.05,1 = 1.06 Observert: n 1 ˆβ = β 0 700 733 = 1.57 <χ 0.05,1 =1.06 dvs vi forkaster ikke H 0 på5%nivå. Dataene gir ikke grunnlag for åhevdeatβ>700. Eksempel: I en produksjonsprosess har det tidligere blitt produsert 18% B-varer. Etter en omlegging av rutinene lurer man på om andelen B-varer har endret seg. Blant 75 varer produsert etter omleggingen blir 17 klassifisert som B-varer. Tyder dette på at andelen B-varer har endret seg? Merk først: X= antall B-varer blant n tilfeldig valgte varer vil være B(n, p)-fordelt, der p er sannsynligheten for at en tilfeldig vare er B-vare (=andel B-varer). H 0 : p =0.18 mot H 1 : p 0.18 Fordeling til ˆp? ˆp = X n Fra kap. 6 har vi at når X B(n, p) ognp > 5 og n(1 p) > 5såerX N(np, np(1 p)). Dette er oppfylt her, og når X er tilnærmet normalfordelt vil også ˆp = X n være tilnærmet normalfordelt. 7 8

E(ˆp) = E( X n )= 1 n E(X) = 1 n np = p Var(ˆp) = 1 n Var(X) = 1 p) np(1 p) =p(1 n n ˆp p 0 Z = p0 (1 p 0 )/n N(0, 1) under H 0 Vi forkaster H 0 dersom Z z α/ eller Z z α/. Velger vi α =0.05 får vi z α/ = z 0.05 =1.96. Observerte data gir ˆp =17/75 = 0.7 og dermed: z = 0.7 0.18 0.18(1 0.18)/75 =1.06 dvs vi forkaster ikke H 0 på5%nivå. Dataene gir ikke grunnlag for åhevdeatp 0.18. Sammenheng mellom (tosidig) hypotesetesting og konfidensintervall: Les selv i boka, kap. 10.6! 9