ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Like dokumenter
ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Kp. 9.8 Forskjell mellom to forventninger

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Hypotesetesting, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

TMA4240 Statistikk H2010 (20)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Fasit for tilleggsoppgaver

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2015

LØSNINGSFORSLAG ) = Dvs

TMA4245 Statistikk Eksamen desember 2016

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Kapittel 9 og 10: Hypotesetesting

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4240 Statistikk Høst 2016

Løsning eksamen desember 2017

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

HØGSKOLEN I STAVANGER

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

MOT310 Statistiske metoder 1, høsten 2011

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

TMA4240 Statistikk Høst 2015

i x i

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2016

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Løsningsforslag eksamen 25. november 2003

TMA4240 Statistikk 2014

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Hypotesetesting. mot. mot. mot. ˆ x

Eksamensoppgave i TMA4240 Statistikk

Hypotesetest: generell fremgangsmåte

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

STK Oppsummering

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

STK Oppsummering

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Kapittel 10: Hypotesetesting

UNIVERSITETET I OSLO

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Løsningsforslag statistikkeksamen desember 2014

STK1100 våren 2019 Mere om konfidensintevaller

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Foreleses onsdag 13.oktober, 2010

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk 2014

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Løsning eksamen desember 2016

Løsningsforslag, eksamen statistikk, juni 2015

UNIVERSITETET I OSLO

Kapittel 2: Hendelser

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Norske hoppdommere og Janne Ahonen

TMA4240 Statistikk H2010

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

Econ 2130 uke 16 (HG)

Løsningsforslag eksamen 27. februar 2004

Kapittel 9 og 10: Hypotesetesting

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4240 Statistikk H2010 (19)

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Transkript:

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 1 / 53

Oppsummering, del 3 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 2 / 53

Oppsummering, del 3 Oppsummering, del 3 Styrke, styrkefunksjon Tosidige tester Test for p i binomisk modell;. t-fordeling Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 3 / 53

, Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 4 / 53

Oversikt, del 4, t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 5 / 53

t-fordeling, Rett på definisjon: Utgangspunktet er målemodellen med normalantakelse: X 1,...,X n, u.i.f. tilf. var. der X i N(µ, σ 2 ). La σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2, og T = X µ S 2 n Def. Student s t-fordeling: Dersom X 1,...,X n, er n u.i.f. tilf. var. der X i er normalfordelt med forventning µ og varians σ 2, i = 1,...,n, så er T (Student s) t-fordelt med n 1 frihetsgrader: T t(n 1) Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 6 / 53

t-fordeling Obs: I den beskrevne situasjonen har vi: X µ σ 2 n N(0, 1) og X µ S 2 n t(n 1), Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 7 / 53

t-fordeling, Egenskaper til t-fordelingen: 0.5 0.4 0.3 0.2 0.1 0-4 -2 0 2 4 t-fordelingen er avhengig av antall frihetsgrader (n). Den blir mer og mer lik N(0, 1)-fordelingen når antall frihetsgrader øker. symmetrisk omkring 0 t-tabell!! n(x) f1(x) f2(x) f15(x) tyngre haler enn N(0, 1)-fordelingen Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 8 / 53

t-fordeling, Fraktiler i t-fordelingen: Def. t α,d Dersom T er (Student s) t-fordelt med d frihetsgrader, defineres tallet t α,d ved at P(T > t α,d ) = α. (Tilsvarer z α i N(0,1)-fordelingen.) Skisse av t(d)-fordeling; arealet P(T > t α,d ) = α er farget. 0 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 9 / 53

t-test, Situasjon der vi bruker t-test: Målemodellen m/normalantakelse og ukjent varians, σ 2 : n målinger: x 1,..., x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 ukjent. Obs. 1: X i normalfordelt Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 10 / 53

t-test, Obs. 1: X i normalfordelt Obs. 2: (Dersom n er stor, trenger vi ikke bry oss med t-fordeling.) Obs. 3: Målemodell 3 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 11 / 53

t-test, Eksempel: 10 blodsukkerinnholdmålinger: 4.1, 5.1, 4.3, 3.8, 3.7, 5.2, 4.5, 4.8, 3.6, 4.4 Ønsker å teste H 0 : µ = 4.0 mot H 1 : µ > 4.0 Vi antar at: De n = 10 målingene: x 1,..., x n ; kan betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable, der E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n, og der X i er normalfordelt og σ 2 er ukjent. Variansen,σ 2, estimeres med: σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 12 / 53

t-test, Vil teste: H 0 : µ = 4 mot H 1 : µ > 4 Under H 0 er (teststørrelse, nullfordeling) T = X 4 S 2 10 t(9) (jf. def. av t-fordeling) Forkaster H 0 dersom µ = X peker klart i retning av at H 1 er korrekt. Test (sign.nivå α): Forkast H 0 dersom 0.5 0.4 0.3 0.2 0.1 f9(x) T t α,9 0-3 -2-1 0 1 2 3 t(9) tetthet Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 13 / 53

t-test, Gjennomføring av test på 5% nivå: Sign.nivå, α = 0.05 t 0.05,9 = 1.83 Data: (Gj.sn. = 4.35, emp. varians = 0.3183) Utfall av: X 4 S 2 10 : 4.35 4 0.3183 10 = 1.962 Siden 1.962 > t 0.05,9 = 1.83, kan vi forkaste H 0. Dataene tyder på at virkelig blodsukkerinnhold, µ, er større enn 4. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 14 / 53

µ, målemodell, normalantakelse, ukjent varians, Oppsummering, t-tester, Målemodellen: n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 ukjent. Målemodell 3 Estimator for variansen: S 2 = σ 2 = 1 n 1 n i=1 ( Xi X ) 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 15 / 53

µ, målemodell, normalantakelse, ukjent varians,. t-test, ensidig., Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 S 2 n t α,n 1 0 Skisse av t-fordeling og forkastningsområde. Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom X µ 0 S 2 n t α,n 1 0 Skisse av t-fordeling og forkastningsområde. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 16 / 53

µ, målemodell, normalantakelse, ukjent varians,. t-test, tosidig., Test (sign.nivå α) for: H 0 : µ = µ 0 mot H 1 : µ µ 0 Forkast H 0 dersom X µ 0 S 2 n X µ 0 S 2 n t α/2,n 1, eller t α/2,n 1 0 Skisse av t-fordeling og forkastningsområde. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 17 / 53

µ, målemodell, normalantakelse, ukjent varians,. t-test, tosidig., Eksempel: Hardhet til et spesielt stål blir undersøkt; seks målinger (i kg/mm 2 ): 351, 322, 297, 291, 354, 322. Gjennomsnitt: 322.8; estimert varians (empirisk varians): 689.4 Man er interessert i om hardheten er forskjelig fra 300 kg/mm 2. Tyder resultatene på at hardheten er ulik 300? Målemodell med normalantakelse; ukjent varians. Estimator for variansen: S 2 = σ 2 = 1 n ( n 1 i=1 Xi X ) 2 Forventningen, µ: virkelig hardhet Vil teste: H 0 : µ = 300 mot H 1 : µ 300 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 18 / 53

µ, målemodell, normalantakelse, ukjent varians,. t-test, tosidig., Vil teste: H 0 : µ = 300 mot H 1 : µ 300 Under H 0 er (teststørrelse, nullfordeling) T = X 300 S 2 6 t(n 1) Forkaster H 0 dersom µ = X peker klart i retning av at H 1 er korrekt. Test (sign.nivå α): Forkast H 0 dersom T t α/2,n 1 eller T t α/2,n 1 0.1 0 0.5 0.4 0.3 0.2-3 -2-1 0 1 2 3 Skisse av t(5)-fordeling. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 19 / 53

µ, målemodell, normalantakelse, ukjent varians,. t-test, tosidig., Gjennomføring av test på 5% nivå: Sign.nivå, α = 0.05 α/2 = 0.025; t 0.025,5 = 2.57 Data: Utfall av: X 300 S 2 6 : 322.8 300 689.4 6 Siden 2.13 t 0.025,5 = 2.57 (og 2.13 t 0.025,5 = 2.57), kan vi ikke forkaste H 0. Det er ikke grunnlag i dataene for å hevde at virkelig hardhet, µ, er ulik 300 kg/mm 2. = 2.13 0.5 0.4 0.3 0.2 0.1 0-3 -2-1 0 1 2 3 Obs.: Jf. konklusjon med kjent varians: forkast H 0 ; z 0.025 = 1.96. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 20 / 53

Oversikt, del 4, t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 21 / 53

t-intervall, Med målemodell 1 (normalantakelse og kjent varians): (1 α) 100% konfidensintervall for µ er ) σ (X z 2 α/2 n, X + z σ 2 α/2 n Dette er basert på 1. kjent verdi av σ 2 2. Z = X µ σ 2 n N(0, 1) (normalantakelsen) Med målemodell 3 (normalantakelse og ukjent varians) må vi basere oss på t-fordelingen. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 22 / 53

t-intervall, Med målemodell 3 (normalantakelse og ukjent varians): (1 α) 100% konfidensintervall for µ er ) S (X t 2 α/2,n 1 n, X + t S 2 α/2,n 1 n Dette er basert på 1. σ 2 estimeres med σ 2 = S 2 = 1 n 1 n i=1 2. Normalantakelse og 3. T = X µ S 2 n t(n 1) ( X i X) 2, Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 23 / 53

t-intervall,, Eksempel: 10 blodsukkerinnholdmålinger: 4.1, 5.1, 4.3, 3.8, 3.7, 5.2, 4.5, 4.8, 3.6, 4.4 Ønsker et 95% konfidensintervall for virkelig blodsukkerinnhold. Vi antar at: De n = 10 målingene: x 1,..., x n ; kan betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable, der E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n, og der X i er normalfordelt og σ 2 er ukjent. µ: virkelig blodsukkerinnhold Variansen, σ 2, estimeres med: σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 24 / 53

t-intervall,, n = 10; 95% α = 0.05 t α/2,n 1 = t 0.025,9 = 2.262 Et 95% ( konfidensintervall for virkelig blodsukkerinnhold, µ, er ) S gitt ved: X 2.262 2 10, X + 2.262 S 2 10 Innsatt data (Gj.sn. = 4.35, emp. varians = 0.3183), blir utregnet intervall: ( ) ( ) 0.3183 0.3183 4.35 2.262 10, 4.35 + 2.262 10 = 3.95, 4.75 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 25 / 53

t-intervall, begrunnelse, Jf.: Generell definisjon av konfidensintervall: Situasjon: Data x 1,...,x n ; utfall av : X 1,..., X n ; n u.i.f. tilfeldige variable Ukjent parameter (i fordelingen til X i ene): θ Dersom L og U (L < U) er to funksjoner av X 1,...,X n, som er slik at: ( ) 1 α = P L θ U, sier vi at det utregnete intervallet (l, u) er et (1 α) 100% konfidensintervall for θ. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 26 / 53

t-intervall, begrunnelse, Obs. 1: Det utregnete intervallet (l, u): Framkommer når vi setter dataverdiene x 1,..., x n inn i funksjonene L og U. Obs. 2: Eventuelt tilnærmede intervall For t-intervallet er: L = X t α/2,n 1 S 2 n og U = X + t α/2,n 1 S 2 n Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 27 / 53

t-intervall, begrunnelse, ( S 2 X t α/2,n 1 } {{ n } L ) S 2, X + t α/2,n 1 }{{ n } U er et (1 α) 100% konfidensintervall for µ, fordi ( 1 α = P t α/2,n 1 X µ S 2 n t α/2,n 1 ) ( S 2 S 2 = P X t α/2,n 1 µ X + t }{{ n α/2,n 1 }}{{ n } L U = P ( L µ U ) ) Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 28 / 53

Konfidensintervall,, Målemodell 1; (1 α) 100% konfidensintervall for µ er ) σ (X z 2 α/2 n, X + z σ 2 α/2 n Målemodell 2; tiln. (1 α) 100% konfidensintervall for µ er ) S (X z 2 α/2 n, X + z S 2 α/2 n Binomisk modell; tiln. (1 α) 100% konfidensintervall for p er ( ) p(1 p) p(1 p) p z α/2 n, p + z α/2 n Målemodell 3; (1 α) 100% konfidensintervall for µ er S (X t 2 α/2,n 1 n, X + t α/2,n 1 S 2 n ) Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 29 / 53

Oversikt, del 4, t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 30 / 53

Test for forventningen, λt, i Poissonmodell, n liten, Eksempel: Overvåking av dødsrate for fugler (jf. fugleinfluensa); For et bestemt vann registreres det gjennomsnittlig 2.5 døde fugler pr. døgn under normale forhold. En dag registreres det 6 døde fugler. Gir dette grunnlag for å påstå at virkelig dødsrate har økt til over det normale? Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 31 / 53

Test, Poissonmodell,, Statistisk tenking: Vi betrakter resultatet (6 registrerte døde fugler i et døgn) som utfall av en tilfeldig variabel Y, der Y Poisson(λt), λ: ukjent, t = 1. Obs.: det er rimelig med Poissonfordeling for Y! λ 1, er forventet antall døde fugler ved det aktuelle vannet i løpet av et døgn. Normalt har vi: λ normalt = 2.5. Vi vil teste H 0 : λ = 2.5 mot H 1 : λ > 2.5 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 32 / 53

Test, Poissonmodell,, Vi vil teste H 0 : λ = 2.5 mot H 1 : λ > 2.5 Teststørrelse: Y ; nullfordeling: Y Poisson(2.5): 0.3 0.225 0.15 0.075 0 0 2 4 6 8 10 12 Dette beskriver hva som er tenkelige utfall under H 0 Store verdier av Y indikerer at H 1 er riktig. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 33 / 53

Test, Poissonmodell,, Store verdier av Y indikerer at H 1 er riktig. Derfor: Test: Forkast H 0 dersom Y k, der k (kritisk verdi) er slik at testen får nærmest mulig ønsket signifikansnivå. Kritisk verdi, k, finnes vha. Poissontabell (λt = 2.5) slik at sign.nivå = P(forkaste H 0 H 0 riktig) = P(Y k λt = 2.5) er nærmest mulig ønsket sign.nivå Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 34 / 53

Test, Poissonmodell,, Fra Poissontabell (λt = 2.5): y P(Y = y) 0 0.0821 1 0.0252 2 0.2565 3 0.2138 4 0.1336 5 0.0668 6 0.0278 7 0.0099 8 0.0031 9 0.0009 10 0.0002 11 0.0000 12 0.0000 13 0.0000 Vi må prøve oss fram med forskjellige verdier av k. Dersom vi ønsker sign.nivå (nærmest mulig) 0.05, ser vi at: P(Y 9) = 0.0009 + 0.0002 + 0 = 0.0011 P(Y 8) = P(Y = 8) + P(Y 9) = 0.0031 + 0.0011 = 0.0042 P(Y 7) = 0.0099 + 0.0042 = 0.0141 P(Y 6) = 0.0278 + 0.0141 = 0.0419 P(Y 5) = 0.0668 + 0.0419 = 0.1087 Dvs., med k = 6 får vi en test med sign.nivå 0.0419 0.05. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 35 / 53

Test, Poissonmodell,, Gjennomføring/konklusjon: Data: utfall av Y : 6 = k = 6 Konklusjon: Forkast H 0 ; (Test: Forkast H 0 dersom Y k) Det er grunnlag for å påstå at virkelig dødsrate (rate av registrerte døde fugler) har økt til over det normale. Skisser styrkefunksjonen til denne testen! Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 36 / 53

Oversikt, del 4, t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall t-fordeling, t-test, t-intervall Test for forventningen, λt, i Poissonmodell;. Konfidensintervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 37 / 53

Konfidensintervall, En (tosidig) test kan gjennomføres vha. av et konfidensintervall. For, dersom vi i målemodell 1 vil teste: H 0 : µ = µ 0 mot H 1 : µ µ 0, kan vi bruke: Test (sign.nivå α): Forkast H 0 dersom X µ 0 σ 2 n z α/2 eller Vi skal se at dette er det samme som: X µ 0 σ 2 n z α/2 Forkast H 0 dersom µ 0 ikke er inkludert i konfidensintervallet for µ. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 38 / 53

Konfidensintervall, Eksempel: Vi skal kjøpe smolt av en smoltoppdretter. Det hevdes at gjennomsnittsvekten til smolten i merden er 80 gram. Vekt av ni tilfeldig valgte smolt: gj.sn.-vekt: 76.87 gram. Vi er interessert i om vekten (gjennomsnittsvekt for alle smolt i merden) kan være ulik 80 gram. Tyder resultatene på at vekten kan er ulik 80 gram? Målemodell med normalantakelse; kjent varians, σ 2 = 10 2. Forventningen, µ: vekt (gjennomsnittsvekt for alle smolt i merden) Vil teste: H 0 : µ = 80 mot H 1 : µ 80 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 39 / 53

Konfidensintervall, Vil teste: H 0 : µ = 80 mot H 1 : µ 80 Test (sign.nivå α = 0.10): Forkast H 0 dersom X 80 10 2 9 z 0.05 eller Er det samme som: Forkast H 0 dersom X 80 10 2 9 z 0.05 10 X 80 z 2 10 0.05 9 eller X 80 + z 2 0.05 9 Er det samme som: Behold H 0 dersom 80 z 0.05 10 2 10 2 9 X 80 + z 0.05 9 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 40 / 53

Konfidensintervall, Behold H 0 dersom 10 2 80 z 0.05 10 2 9 X 80 + z 0.05 9 Er det samme som: behold H 0 dersom 10 2 10 X z 0.05 9 80 X + z 2 0.05 9 Dette siste betyr: behold H 0 dersom µ 0 = 80 90% konfidensintervall for µ. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 41 / 53

Konfidensintervall, Gjennomføring / konklusjon: 90% α = 0.1 z α/2 = z 0.05 = 1.645 Et 90% konfidensintervall for vekten, µ, er (innsatt data, gj.sn. = 76.87): ( ) ( ) 10 76.87 1.645 2 9, 76.87 + 1.645 10 2 9 = 71.4, 82.4 Dvs.: siden µ 0 = 80 ikke grunnlag for å hevde at µ 80. ( ) 71.4, 82.4, beholdes H 0. Dataene gir Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 42 / 53

Konfidensintervall, Generelt: La (L, U) være et (ev. tilnærmet) 100(1 α)% konfidensintervall for parameteren θ. Vi vil teste H 0 : θ = θ 0 mot H 1 : θ θ 0 Test: Forkast H 0 dersom θ 0 (L, U). Testen har signifikansnivå α (ev. tilnærmet). Veldig god måte å gjennomføre (tosidige) tester på! Obs.: dersom dette blir brukt for ensidig test får vi en annen sammenheng mellom intervallets konfidensgrad og sign.nivået til testen. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 43 / 53

Konfidensintervall, Eksempel: Hardhet til et spesielt stål blir undersøkt; seks målinger (i kg/mm 2 ): 351, 322, 297, 291, 354, 322. Gjennomsnitt: 322.8; estimert varians (empirisk varians): 689.4 Man er interessert i om hardheten er forskjelig fra 300 kg/mm 2. Tyder resultatene på at hardheten er ulik 300? Målemodell med normalantakelse; ukjent varians. Estimator for variansen: S 2 = σ 2 = 1 n ( n 1 i=1 Xi X ) 2 Forventningen, µ: virkelig hardhet Vil teste: H 0 : µ = 300 mot H 1 : µ 300 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 44 / 53

Konfidensintervall, Ønsker å bruke 5% signifikansnivå. Gjennomfører test vha. konfidensintervall; dvs., testen er: Forkast H 0 dersom et 95% konfidensintervall for µ ikke inneholder 300. Et 95% konfidensintervall for µ er gitt ved: ) S (X t 2 0.025,5 6, X + t S 2 0.025,5 6 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 45 / 53

Konfidensintervall, Et 95% konfidensintervall for µ er gitt ved: ) S (X t 2 0.025,5 6, X + t S 2 0.025,5 6 Innsatt data (Gj.sn. = 322.8, emp. varians = 689.4, t 0.025,5 = 2.571), blir utregnet intervall: ( ) ( ) 689.4 689.4 322.8 2.571 6, 322.8 + 2.571 6 = 295.2, 350.4 Konklusjon: Behold H 0 siden µ 0 = 300 (295.2, 350.4) siden µ 0 = 300 er inneholdt i konfidensitervallet. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 46 / 53

Konfidensintervall, Eksempel: Sammenligne meningsmålinger Forrige meningsmåling: 28% oppslutning Denne meningsmåling: 31% oppslutning Er det endring i virkelig oppslutning? Obs.: Sammenligner resultater fra to grupper; ikke standardmetode i dette kurset. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 47 / 53

Konfidensintervall, Modell: Forrige meningsmåling: X 1 B(n 1, p 1 ) Denne meningsmåling: X 2 B(n 2, p 2 ) X 1 og X 2 antas å være statistisk uavhengige. Vi vil teste H 0 : p 1 = p 2 mot H 1 : p 1 p 2 Vi vil teste H 0 : p 1 p 2 = 0 mot H 1 : p 1 p 2 0 Det vil være best å lage et konfidensintervall for p 1 p 2, og bruke dette til testen. p 1 p 2 estimeres med: p 1 p 2 = X 1 n 1 X 2 n 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 48 / 53

Konfidensintervall, p 1 = X 1 n 1, p 2 = X 2 n 2 E ( p 1 p 2 ) = E ( p1 ) E ( p2 ) = p1 p 2 Var ( p 1 p 2 ) = Var ( p1 ) + Var ( p2 ) = p 1 (1 p 1 ) n 1 + p 2(1 p 2 ) n 2 p 1 og p 2 er begge tilnærmet normalfordelte og de uavhengige. Vi kan da slutte at også p 1 p 2 er tilnærmet normalfordelt. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 49 / 53

Konfidensintervall, p 1 p 2 er tilnærmet normalfordelt. Altså: p 1 p 2 (p 1 p 2 ) p1 (1 p 1 ) n 1 + p 2(1 p 2 ) n 2 N(0, 1), tilnærmet Nevneren (standardavviket til p 1 p 2 ) kan tilnærmes med: p1 (1 p 1 ) + p 2(1 p 2 ). n 1 n 2 Bruker symbolet ŜD( p 1 p 2 ) for denne. Vi har: p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) N(0, 1), tilnærmet Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 50 / 53

Konfidensintervall, Vi har: Medfører: ( P Derfor: p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) N(0, 1), z α/2 p 1 p 2 (p 1 p 2 ) ŜD( p 1 p 2 ) L ({}}{ P p 1 p 2 z α/2 ŜD( p 1 p 2 ) p 1 p 2 p 1 p 2 + z α/2 ŜD( p 1 p 2 ) }{{} U tilnærmet z α/2 ) 1 α ) 1 α Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 51 / 53

Konfidensintervall, Vi har altså at (L, U) er et tilnærmet (1 α)100% konfidensintervall for differansen p 1 p 2. Data: n 1 = 1120, n 2 = 1050; α = 0.05 α/2 = 0.025 og z 0.025 = 1.96 Utfall av p 1 p 2 : 0.28 0.31 = 0.03 p1 Utfall av ŜD( p (1 p 1 ) 1 p 2 ) = + p 2(1 p 2 ) : n 1 n 2 0.28(1 0.28) 1120 + 0.31(1 0.31) 1050 = 0.01959 Derfor, konfidensintervall: ( 0.03 1.96 0.01959, 0.03+1.96 0.01959 ) = ( 0.008, 0.068 ) Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 52 / 53

Konfidensintervall, Derfor, konfidensintervall: ( 0.03 1.96 0.01959, 0.03+1.96 0.01959 ) = ( 0.008, 0.068 ) Konklusjon: Siden 0 er inneholdt i intervallet kan vi ikke forkaste H 0. Det er ikke grunnlag for å påstå at virkelig oppslutning er endret. Bjørn H. Auestad Kp. 6: Hypotesetesting del 4 53 / 53