ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Like dokumenter
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

Kp. 9.8 Forskjell mellom to forventninger

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

Fasit for tilleggsoppgaver

Hypotesetesting, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

Oversikt, del 5. Vi har sett på styrkefunksjon for ensidige tester. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

Eksempler fra slutten av forrige uke. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

Kapittel 9 og 10: Hypotesetesting

TMA4240 Statistikk Høst 2009

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

TMA4240 Statistikk H2010 (20)

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Hypotesetest: generell fremgangsmåte

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

TMA4240 Statistikk Høst 2015

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

LØSNINGSFORSLAG ) = Dvs

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

TMA4240 Statistikk Høst 2007

MOT310 Statistiske metoder 1, høsten 2011

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

Hypotesetesting. mot. mot. mot. ˆ x

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010 (22)

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

ST0202 Statistikk for samfunnsvitere

Econ 2130 uke 16 (HG)

TMA4240 Statistikk 2014

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Løsning eksamen desember 2017

TMA4240 Statistikk Høst 2016

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TMA4240 Statistikk Høst 2015

Kapittel 9 og 10: Hypotesetesting

i x i

HØGSKOLEN I STAVANGER

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

UNIVERSITETET I OSLO

β(µ) = P(akseptere H 1 µ)

TMA4240 Statistikk H2010 (19)

TMA4240 Statistikk H2010

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ST0202 Statistikk for samfunnsvitere

Løsningsforslag statistikkeksamen desember 2014

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

ST0202 Statistikk for samfunnsvitere

Kapittel 10: Hypotesetesting

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

HØGSKOLEN I STAVANGER

Løsningsforslag, eksamen statistikk, juni 2015

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

STK Oppsummering

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

Hypotesetesting av λ og p. p verdi.

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Løsningsforslag eksamen 25. november 2003

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

STK Oppsummering

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Estimering og hypotesetesting

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Oppgaver fra 8.3, 8.4, , 8.51, 8.52, 8.231, 8.232, 8.250, 8.252

Transkript:

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 1 / 55

Oversikt, rep. uke 11 µ, målemodell, 1 µ, målemodell, 2 binomisk; n stor Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 2 / 55

Oversikt, rep. uke 11 Oversikt, rep. uke 11 µ, målemodell, 1 µ, målemodell, 2 binomisk; n stor H 0, H 1 ; teststørrelse, nullfordeling, kritisk verdi, forkastningsområde, signifikansnivå Hypotesetesting i ulike sitausjoner: 1. for forventingen, µ, i målemodellen med normalantakelse og kjent varians, σ 2. 2. for forventingen, µ, i målemodellen med n stor og normaltilnærming (variansen, σ 2, ukjent). 3. for suksessannsynligheten, p, i binomisk modell; n stor og normaltilnærming. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 3 / 55

µ, målemodell, normalantakelse, kjent varians Oversikt, rep. uke 11 µ, målemodell, 1 µ, målemodell, 2 binomisk; n stor Målemodellen m/normalantakelse og kjent σ 2 : n målinger: x 1,..., x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 kjent. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 4 / 55

µ, målemodell, normalantakelse, kjent varians Oversikt, rep. uke 11 µ, målemodell, 1 µ, målemodell, 2 binomisk; n stor Test (m/ sign.nivå α) for H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 σ 2 n z α Test (m/ sign.nivå α) for H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom X µ 0 σ 2 n z α Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 5 / 55

µ, målemodell, n stor og tilnærmet normalfordeling Oversikt, rep. uke 11 µ, målemodell, 1 µ, målemodell, 2 binomisk; n stor Målemodellen: n målinger: x 1,...,x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n. σ 2 (og µ ) ukjent; (ingen forutsetnning om fordeling til X i ene eller om kjent varians) Estimator for variansen: S 2 = σ 2 = 1 n 1 n i=1 ( Xi X ) 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 6 / 55

µ, målemodell, n stor og tilnærmet normalfordeling Oversikt, rep. uke 11 µ, målemodell, 1 µ, målemodell, 2 binomisk; n stor Test (m/ tilnærmet sign.nivå α) for H 0 : µ = µ 0 mot H 1 : µ < µ 0 Forkast H 0 dersom X µ 0 S 2 n z α Test (m/ tilnærmet sign.nivå α) for H 0 : µ = µ 0 mot H 1 : µ > µ 0 Forkast H 0 dersom X µ 0 S 2 n z α Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 7 / 55

p, i binomisk modell; n stor og normaltilnærming Oversikt, rep. uke 11 µ, målemodell, 1 µ, målemodell, 2 binomisk; n stor Generelt Situasjon: Binomisk modell (ev. som tilnærming til hypergeom.) Data: antall suksesser av n mulige er registrert. Resultatet betraktes som utfall av den tilfeldige variable Y der Y B(n, p) n og p er slik at fordelingen til Y kan tilnærmes med normalfordelingen. La p = Y n (estimator for p). Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 8 / 55

p, i binomisk modell; n stor og normaltilnærming Oversikt, rep. uke 11 µ, målemodell, 1 µ, målemodell, 2 binomisk; n stor Test (m/ tilnærmet sign.nivå α) for Forkast H 0 dersom H 0 : p = p 0 mot H 1 : p < p 0 p p 0 p 0 (1 p 0 ) n z α Test (m/ tilnærmet sign.nivå α) for H 0 : p = p 0 mot H 1 : p > p 0 Forkast H 0 dersom p p 0 p 0 (1 p 0 ) n z α Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 9 / 55

binomisk, n Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 10 / 55

Oversikt, del 3 binomisk, n Styrke Tosidige tester 1. for forventingen, µ, i målemodellen med normalantakelse og kjent varians, σ 2. 2. for forventingen, µ, i målemodellen med n stor og normaltilnærming (variansen, σ 2, ukjent). 3. for suksessannsynligheten, p, i binomisk modell; n stor og normaltilnærming. Test for p i binomisk modell; n. t-fordeling, t-test, t-intervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 11 / 55

Styrke binomisk, n Signifikansnivå til test = P(forkaste H 0 H 0 riktig) Dvs.: signifikansnivå til test = P(gjøre type I-feil ) Virkeligheten H 0 riktig H 1 riktig Konklusjon på test: Forkast H 0 I-feil ok! Konklusjon på test: Behold H 0 ok! II-feil Lavt sign.nivå: sannsynlighet for type I-feil. Type II-feil. Sannsynligheten for å ikke gjøre type II-feil når H 1 riktig har med testens styrke å gjøre; jf. kp. 6.4 i boken. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 12 / 55

Styrke binomisk, n Sannsynligheten for å ikke gjøre type II-feil når H 1 riktig: = P(forkaste H 0 H 1 riktig) Virkeligheten H 0 riktig H 1 riktig Konklusjon på test: Forkast H 0 I-feil ok! Konklusjon på test: Behold H 0 ok! II-feil Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 13 / 55

Styrke binomisk, n Styrke: = P(forkaste H 0 H 1 riktig) ph-eksempel: Test (m/ sign.nivå α = 0.05) for H 0 : µ = 6.0 mot H 1 : µ < 6.0 (Forkast H 0 dersom X 5.48.) Dersom ph en i virkeligheten var 5.5 (H 1 riktig), hva er da sannsynligheten for at vi vil oppdage det (at H 1 er riktig i virkeligheten)? Tenk: vi skal innhente dataene; vi skal få et utfall av X. Se inntil videre bort fra utfallet (x = 5.27) vi i praksis har. Mao.: Hva er sannsynligheten for å forkaste H 0 (med vår test), dersom i virkeligheten µ = 5.5? Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 14 / 55

Styrke binomisk, n Sannsynligheten for å forkaste H 0 (med vår test), dersom i virkeligheten µ = 5.5, er: P(forkaste H0 µ = 5.5) = P(X 5.48 µ = 5.5) = P( X 5.5 1 10 = P(Z 0.06) = 0.4761 5.48 5.5 µ = 5.5) 1 } 10 {{ } = 0.06 (Her er Z N(0, 1). Kritisk verdi, 5.48 = 6.0 1.645 1 10.) Dvs.: En dag virkelig ph er 5.5, er det 47.61% sjanse for at vi vil konludere at ph< 6 med bruk av vår test. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 15 / 55

Styrke binomisk, n Styrke til testen i alternativet µ = 5.5 Styrken vil åpenbart variere avhengig hvilken alternativ µ-verdi vi betrakter. Styrken til testen er en funksjon av aktuell parameter; her: P(forkaste H 0 µ = µ 1 ) = P(X 5.48 µ = µ 1 ) = P( X µ 1 1 10 = P(Z 5.48 µ 1 1 10 5.48 µ 1 1 10 ) = γ(µ 1 ) µ = µ 1 ) Obs.: boken bruker β som symbol for styrke; Vi bruker γ Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 16 / 55

Styrke binomisk, n Styrken: γ(µ 1 ) = P(forkaste H 0 µ = µ 1 ) = P(Z 5.48 µ 1) 1 10... er en funksjon av µ 1 Styrke i alternativene µ 1 = 5.75, 5.25 og 5.0: µ 1 5.0 5.25 5.5 5.75 (6.0) 5.48 µ 1 1/10 0.06 γ(µ 1 ) 0.48 µ 1 5.0 5.25 5.5 5.75 (6.0) 5.48 µ 1 1/10 0.73 0.06 γ(µ 1 ) 0.77 0.48 Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 17 / 55

Styrke binomisk, n Plott av styrkefunksjonen: Plott av styrkefunksjonen for ph-eksempelet; test m/5% nivå. µ 1 5.0 5.25 5.5 5.75 (6.0) 5.48 µ 1 1/10 1.52 0.73 0.06 0.85 ( 1.645) γ(µ 1 ) 0.94 0.77 0.48 0.20 (0.05) 1 0.8 0.6 0.4 0.2 0 4 4.5 5 5.5 6 µ 1 på x-aksen og γ(µ 1 ) på y-aksen. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 18 / 55

Styrke binomisk, n Plott av styrkefunksjonen for ph-eksempelet; test m/5% nivå. 0 Ideell styrkefunksjon: 1 0.8 0.6 0.4 0.2 4 4.5 5 5.5 6 µ 1 på x-aksen og γ(µ 1 ) på y-aksen. 1 0.8 0.6 0.4 0.2 0 4 4.5 5 5.5 6 µ 1 på x-aksen og γ(µ 1 ) på y-aksen. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 19 / 55

Styrke binomisk, n Styrke vs. signifikansnivå For fast n (antall data) kan vi ikke få både lavt sign.nivå og stor styrke. Vi prioriterer lavt sign.nivå. (Usymmetri i valg av H 0 og H 1 ) Lag en test med sign.nivå 0.01 for ph-dataene. Beregn styrken i alternativene 5.75, 5.5, 5.25, og skisser grafen til styrkefunksjonen. Kommenter! Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 20 / 55

Styrke binomisk, n Plott av styrkefunksjonen for ph-eksempelet; test m/5% nivå: rød, og test m/1% nivå: grønn 1 0.8 0.6 0.4 0.2 0 4 4.5 5 5.5 6 µ 1 på x-aksen og γ(µ 1 ) på y-aksen. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 21 / 55

Styrke binomisk, n Generell definisjon... Situasjon og modell fastlagt; test ang. parameteren θ Følgende er også fastlagt: H 0 og H 1 Teststørrelse, sign.nivå og forkastningsområde / kritisk verdi Def.: Styrkefunksjonen, γ, er definert ved: γ(θ) = P(forkaste H 0 θ). For en bestemt verdi θ 1 (slik at H 1 er riktig), kalles sannsynligheten γ(θ 1 ) for styrken i alternativet θ 1. Styrke (ev. tilnærmet styrke) kan finnes for alle testene vi har sett på til nå, på tilsvarende måte som i de to foregående eksemplene. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 22 / 55

Styrke binomisk, n Eksempel, meningsmåling: Resultat: 91 av n = 500 vil stemme aktuelt parti. Er det grunnlag for å hevde at (virkelig) oppslutning har gått ned fra 0.2? Vi vil teste: H 0 : p = 0.2 mot H 1 : p < 0.2 Test med tiln. 5% sign.nivå: Forkast H 0 dersom p = Y/n 0.17. Styrken til testen er en funksjon av andelen, p. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 23 / 55

Styrke binomisk, n Styrken er en funksjon av andelen, p. For p 1 < 0.2: P(forkaste H 0 p = p 1 ) = P( p 0.17 p = p 1 ) = P( p p 1 p 1 (1 p 1 ) 500 P(Z 0.17 p 1 p 1 (1 p 1 ) 500 0.17 p 1 p 1 (1 p 1 ) 500 p 1 0.16 0.17 0.18 0.19 (0.2) γ(p 1 ) 0.73 0.50 0.28 0.13 (0.05) ) = γ(p 1 ) p = p 1 ) Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 24 / 55

Oversikt, del 3 binomisk, n Styrke Tosidige tester 1. for forventingen, µ, i målemodellen med normalantakelse og kjent varians, σ 2. 2. for forventingen, µ, i målemodellen med n stor og normaltilnærming (variansen, σ 2, ukjent). 3. for suksessannsynligheten, p, i binomisk modell; n stor og normaltilnærming. Test for p i binomisk modell; n. t-fordeling, t-test, t-intervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 25 / 55

Tosidige tester binomisk, n Utgangspunkt: målemodellen med normalantakelse og kjent varians. n målinger: x 1,..., x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 kjent. Test av H 0 : µ = µ 0 mot H 1 : µ < µ 0 Ensidig alternativ ; tilhørende test: Ensidig test (Tilsvarende ved test av H 0 : µ = µ 0 mot H 1 : µ > µ 0 ) Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 26 / 55

Tosidige tester binomisk, n Ofte vil man være interessert i å teste: H 0 : µ = µ 0 mot H 1 : µ µ 0 Tosidig alternativ ; tilhørende test: Tosidig test Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 27 / 55

Tosidige tester binomisk, n Eksempel: Hardhet til et spesielt stål blir undersøkt; seks målinger (i kg/mm 2 ): 351, 322, 297, 291, 354, 322. Gjennomsnitt: 322.8; Man er interessert i om hardheten er forskjelig fra 300 kg/mm 2. Tyder resultatene på at hardheten er ulik 300? Målemodell med normalantakelse; kjent varians, σ 2 = 25 2. Forventningen, µ: virkelig hardhet Vil teste: H 0 : µ = 300 mot H 1 : µ 300 Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 28 / 55

Tosidige tester binomisk, n Vil teste: H 0 : µ = 300 mot H 1 : µ 300 Under H 0 er (teststørrelse, nullfordeling) Z = X 300 25 2 6 N(0, 1) Forkaster H 0 dersom µ = X peker klart i retning av at H 1 er korrekt. Test (m/sign.nivå α): Forkast H 0 dersom 0.5 0.4 0.3 0.2 0.1 Z z α/2 eller Z z α/2 0-3 -2-1 0 1 2 3 N(0, 1) tetthet Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 29 / 55

Tosidige tester binomisk, n Gjennomføring av test på 5% nivå: Sign.nivå, α = 0.05 α/2 = 0.025; z 0.025 = 1.96 Data: Utfall av: X 300 25 2 6 : 322.8 300 25 2 6 = 2.23 Siden 2.23 > z 0.025 = 1.96, kan vi forkaste H 0. Dataene tyder på at virkelig hardhet, µ, er ulik 300 kg/mm 2. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 30 / 55

Tosidig test, binomisk, n Generelt; tosidig test for µ i målemodellen med normalantakelse og kjent varians, σ 2 : Teststørrelse: Z = X µ 0 σ 2 n Test (m/ sign.nivå α) for H 0 : µ = µ 0 mot H 1 : µ µ 0 Forkast H 0 dersom, Nullfordeling: N(0, 1) 0.5 0.4 0.3 Z z α/2 eller Z z α/2 0.1 0.2 0-3 -2-1 0 1 2 3 N(0, 1) tetthet Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 31 / 55

Tosidig test, binomisk, n Generelt; tosidig test for µ i målemodellen med n stor og normaltilnærming: Teststørrelse: Z = X µ 0 S 2 n Test (m/ tilnærmet sign.nivå α) for H 0 : µ = µ 0 mot H 1 : µ µ 0 Forkast H 0 dersom, Nullfordeling: N(0, 1), (tiln.) 0.5 0.4 0.3 0.2 Z z α/2 eller Z z α/2 0.1 0-3 -2-1 0 1 2 3 N(0, 1) tetthet Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 32 / 55

Tosidig test, binomisk, n Generelt; tosidig test for p i binomisk modell med n stor og normaltilnærming: Teststørrelse: Z = p p 0 p 0 (1 p 0 ) n Test (m/ tilnærmet sign.nivå α) for H 0 : p = p 0 mot H 1 : p p 0 Forkast H 0 dersom, Nullfordeling: N(0, 1), (tiln.) 0.5 0.4 0.3 Z z α/2 eller Z z α/2 0.1 0 0.2-3 -2-1 0 1 2 3 N(0, 1) tetthet Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 33 / 55

Oversikt, del 3 binomisk, n Styrke Tosidige tester 1. for forventingen, µ, i målemodellen med normalantakelse og kjent varians, σ 2. 2. for forventingen, µ, i målemodellen med n stor og normaltilnærming (variansen, σ 2, ukjent). 3. for suksessannsynligheten, p, i binomisk modell; n stor og normaltilnærming. Test for p i binomisk modell; n. t-fordeling, t-test, t-intervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 34 / 55

Test, binomisk, n binomisk, n Test for p i binomisk modell, n Eksempel: En ny medisin for en bestemt sykdom skal prøves ut. Gammel medisin for denne sykdommen helbreder i 60% av tilfellene (fastslått etter lang tids erfaring). Forsøk for å prøve ut den nye: 20 tilfeldig valgte individ med sykdommen får medisinen og det blir registrert at 14 blir helbredet; 14 av 20 er 70%. Tyder dette resultatet på at den nye er bedre enn den gamle? Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 35 / 55

Test, binomisk, n binomisk, n Statistisk tenking: Vi betrakter resultatet (14 av 20 helbredet) som utfall av en tilfeldig variabel Y, der Y B(n, p), n = 20, p: ukjent. Obs.: det er rimelig med binomisk fordeling for Y! p er helbredelsessannsynligheten for ny medisin. For den gamle har vi: p = 0.6. Vi vil teste H 0 : p = 0.6 mot H 1 : p > 0.6 Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 36 / 55

Test, binomisk, n binomisk, n Vi vil teste H 0 : p = 0.6 mot H 1 : p > 0.6 Teststørrelse: Y ; nullfordeling: Y B(20, 0.6): 0.2 0.15 0.1 0.05 0 0 5 10 15 20 Dette beskriver hva som er tenkelige utfall under H 0 Store verdier av Y indikerer at H 1 er riktig. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 37 / 55

Test, binomisk, n binomisk, n Store verdier av Y indikerer at H 1 er riktig. Derfor: Test: Forkast H 0 dersom Y k, der k (kritisk verdi) er slik at testen får ønsket signifikansnivå (...). Kritisk verdi, k, finnes vha. binomisk tabell (n = 20, p = 0.6) slik at sign.nivå = P(forkaste H 0 H 0 riktig) = P(Y k p = 0.6) er nærmest mulig ønsket sign.nivå Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 38 / 55

Test, binomisk, n binomisk, n Fra binomisk tabell: y P(Y y) 0 0.0000 1 0.0000 2 0.0000 3 0.0000 4 0.0003 5 0.0016 6 0.0065 7 0.0210 8 0.0565 9 0.1275 10 0.2447 11 0.4044 12 0.5841 13 0.7500 14 0.8744 15 0.9490 16 0.9840 17 0.9964 18 0.9995 19 1.0000 20 1.0000 Vi må prøve oss fram med forskjellige verdier av k. Dersom vi ønsker sign.nivå (nærmest mulig) 0.05, ser vi at P(Y 16) = 1 P(Y 15) = 1 0.9490 = 0.051. Dvs., med k = 16 får vi en test med sign.nivå 0.051 0.05. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 39 / 55

Test, binomisk, n binomisk, n Gjennomføring/konklusjon: Data: utfall av Y : 14 k = 16 Konklusjon: behold H 0 ; Det er ikke grunnlag for å påstå at ny medisin har høyere helbredelsessannsynlighet. Skisser styrkefunksjonen til denne testen! Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 40 / 55

Tosidig test, binomisk, n binomisk, n Eksempel: Vi har gjort 20 kast med terning; 6 gav partall. Vi er interessert i p = P(partall). Vi betrakter resultatet (6 partall av 20 kast ) som utfall av en tilfeldig variabel Y, der Y B(n, p), n = 20, p: ukjent. Vil teste H 0 : p = 0.5 mot H 1 : p 0.5; Ønsker å bruke signifikansnivå 0.05. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 41 / 55

Tosidig test, binomisk, n binomisk, n Vi vil teste H 0 : p = 0.5 mot H 1 : p 0.5 Teststørrelse: Y ; nullfordeling: Y B(20, 0.5): 0.2 0.15 0.1 0.05 0 0 5 10 15 20 Dette beskriver hva som er tenkelige utfall under H 0 Store eller små verdier av Y indikerer at H 1 er riktig. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 42 / 55

Tosidig test, binomisk, n binomisk, n Store eller små verdier av Y indikerer at H 1 er riktig. Derfor: Test: Forkast H 0 dersom Y k 1 eller dersom Y k 2, der k 1 og k 2 (kritiske verdier) er slik at testen får ønsket signifikansnivå (...). k 1 og k 2, finnes vha. binomisk tabell (n = 20, p = 0.5) slik at sign.nivå = P(forkaste H 0 H 0 riktig) = P(Y k 1 p = 0.5) + P(Y k 2 p = 0.5) er nærmest mulig ønsket sign.nivå Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 43 / 55

Tosidig test, binomisk, n binomisk, n Fra binomisk tabell: y P(Y y) 0 0.0000 1 0.0000 2 0.0002 3 0.0013 4 0.0059 5 0.0207 6 0.0577 7 0.1316 8 0.2517 9 0.4119 10 0.5881 11 0.7483 12 0.8684 13 0.9423 14 0.9793 15 0.9941 16 0.9987 17 0.9998 18 1.0000 19 1.0000 20 1.0000 Vi må prøve oss fram med forskjellige verdier av k 1 og k 2. Dersom vi ønsker sign.nivå (nærmest mulig) 0.05, ser vi at P(Y 5) = 0.0207, og P(Y 15) = 1 P(Y 14) = 1 0.9793 = 0.0207. Dvs., med k 1 = 5 og k 2 = 15 får vi en test med sign.nivå 0.0207 + 0.0207 = 0.0414 0.05. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 44 / 55

Tosidig test, binomisk, n binomisk, n Gjennomføring/konklusjon: Data: utfall av Y : 6 k 1 = 5 (eller større enn k 2 ) Konklusjon: behold H 0 ; Det er ikke grunnlag for å påstå at p 0.5. Skisser styrkefunksjonen til denne testen! Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 45 / 55

Oversikt, del 3 binomisk, n Styrke Tosidige tester 1. for forventingen, µ, i målemodellen med normalantakelse og kjent varians, σ 2. 2. for forventingen, µ, i målemodellen med n stor og normaltilnærming (variansen, σ 2, ukjent). 3. for suksessannsynligheten, p, i binomisk modell; n stor og normaltilnærming. Test for p i binomisk modell; n. t-fordeling, t-test, t-intervall Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 46 / 55

t-fordeling binomisk, n Rett på definisjon: Utgangspunktet er målemodellen med normalantakelse: X 1,...,X n, u.i.f. tilf. var. der X i N(µ, σ 2 ). La σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2, og T = X µ S 2 n Def. Student s t-fordeling: Dersom X 1,...,X n, er n u.i.f. tilf. var. der X i er normalfordelt med forventning µ og varians σ 2, i = 1,...,n, så er T (Student s) t-fordelt med n 1 frihetsgrader: T t(n 1) Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 47 / 55

t-fordeling Obs: I den beskrevne situasjonen har vi: X µ σ 2 n N(0, 1) og X µ S 2 n t(n 1) binomisk, n Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 48 / 55

t-fordeling Egenskaper til t-fordelingen: binomisk, n 0.5 0.4 0.3 0.2 0.1 0 n(x) f1(x) f2(x) f15(x) -4-2 0 2 4 t-fordelingen er avhengig av n. Den blir mer og mer lik N(0, 1)-fordelingen når n øker. symmetrisk omkring 0 tyngre haler enn N(0, 1)-fordelingen t-tabell!! Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 49 / 55

t-fordeling Fraktiler i t-fordelingen: binomisk, n Def. t α,d Dersom T er (Student s) t- fordelt med d frihetsgrader, defineres tallet t α,d ved at P(T > t α,d ) = α. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 50 / 55

t-test Situasjon der vi bruker t-test: binomisk, n Målemodellen m/normalantakelse og ukjent varians, σ 2 : n målinger: x 1,..., x n ; betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n X i normalfordelt og σ 2 ukjent. Obs. 1: X i normalfordelt Obs. 2: n (Dersom n er stor, trenger vi ikke bry oss med t-fordeling.) Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 51 / 55

t-test binomisk, n Eksempel: 10 blodsukkerinnh.målinger: 4.1, 5.1, 4.3, 3.8, 3.7, 5.2, 4.5, 4.8, 3.6, 4.4 Ønsker å teste H 0 : µ = 4.0 mot H 1 : µ > 4.0 Vi antar at: De n = 10 målingene: x 1,..., x n ; kan betraktes som utfall av: X 1,...,X n, u.i.f. tilfeldige variable, der E(X i ) = µ og Var(X i ) = σ 2, i = 1,...,n, og der X i er normalfordelt og σ 2 er ukjent. Variansen,σ 2 estimeres med: σ 2 = S 2 = 1 n 1 n i=1 (X i X) 2 Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 52 / 55

t-test binomisk, n Vil teste: H 0 : µ = 4 mot H 1 : µ > 4 Under H 0 er (teststørrelse, nullfordeling) T = X 4 S 2 10 t(9) Forkaster H 0 dersom µ = X peker klart i retning av at H 1 er korrekt. Test (m/sign.nivå α): Forkast H 0 dersom 0.5 0.4 0.3 0.2 f9(x) 0.1 Z t α/2,9 0-3 -2-1 0 1 2 3 t(9) tetthet Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 53 / 55

t-test binomisk, n Gjennomføring av test på 5% nivå: Sign.nivå, α = 0.05 t 0.05,9 = 1.83 Data: (Gj.sn. = 4.35, emp. varians = 0.3183) Utfall av: X 4 S 2 10 : 4.35 4 0.3183 10 = 1.962 Siden 1.962 > t 0.05,9 = 1.83, kan vi forkaste H 0. Dataene tyder på at virkelig blodsukkerinnhold, µ, er større enn 4. Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 54 / 55

t-test Generelt, tosidig... binomisk, n Bjørn H. Auestad Kp. 6: Hypotesetesting del 3 55 / 55