Econ 2130 uke 18 (HG) Hypotesetesting II P-verdi

Like dokumenter
Econ 2130 uke 16 (HG)

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

s = 0, b) H0: d = 0 mot H1: d 0. T = D 0,81 s 10 SE(μˆ ) =

Løsningsforslag øving 5, ST1301

Løsningskisse seminaroppgaver uke 15

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Løsningskisse for oppgaver til undervisningsfri uke 14 (6.-9. april)

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

Oppfølging av funksjonskontrakter SOPP SOPP

Kapittel 9 og 10: Hypotesetesting

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Løsning eksamen desember 2017

Oversikt over tester i Econ 2130

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

TMA4240 Statistikk Høst 2009

Dato. Alle skrevne og trykte. kalkulator som ikke kan kommunisere med andre.

Løsningsforslag eksamen 4MX230UM2-K 5.desember 2013

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Kapittel 9 og 10: Hypotesetesting

β(µ) = P(akseptere H 1 µ)

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

STK1100 våren 2019 Mere om konfidensintevaller

STK desember 2007

ST0202 Statistikk for samfunnsvitere

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Vi fryser for å spare energi

Brukermanual. Oppgavebasert versjon, for montører. Gjennomgår de vanligste gjøremålene for en montør!

ECON240 VÅR / 2016 BOKMÅL

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

ST0202 Statistikk for samfunnsvitere

Sikkerhets- og samhandlingsarkitektur ved intern samhandling

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

Løsning eksamen desember 2016

Fasit for tilleggsoppgaver

Ny arbeidstaker-organisasjon

Retningslinjer for søknad om og tildeling av klinisk korttidsstipend 2014

Ingeniørenes hverdag

TMA4240 Statistikk H2010 (22)

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Årsplan: Naturfag 5 trinn

Høgskoleni østfold EKSAMEN

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Emne:Menneske/daumaskin-interaksjon ~mnekode: LVa'l3A Faglig veileder: Ann-Mari T orvatn

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

TMA4240 Statistikk Eksamen desember 2015

HØGSKOLEN I STAVANGER

Hypotesetesting. mot. mot. mot. ˆ x

Regneøvelse 22/5, 2017

Det samfunnsvitenskapelige fakultet Universitetet i Oslo

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4245 Statistikk Eksamen desember 2016

ST0202 Statistikk for samfunnsvitere

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Sjekkliste for vurdering av en oversiktsartikkel

Eierskapskontroll 2013 Chrisfestivalen AS. RAPPORT OM EIERSKAPSKONTROLL Chrisfestivalen AS. Kontrollør: KONTROLLUTVALGAN IS, Sissel Mietinen Side 1

Høgskoleni Øs fold EKSAMEN. Om noe er uklart eller mangelfullt i oppgaven inngår det som en del av oppgaven å ta de nødvendige forutsetninger.

GLATTING AV DØDELIGHETSRATER SOM ER BASERT PA DATA FRA EN TOARSPERIODE. Tor Haldorsen INNHOLD

Eksamensoppgave i ST0103 Brukerkurs i statistikk

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

i x i

Telefoner er gått til kommunens sentralbord. Her har innringer fått svar på sine spørsmål.

Det er et krav at dere gjennom prosjektet demonstrerer en beherskelse av:

Verdens statistikk-dag.

Evaluering av tiltak i skjermet virksomhet. AB-tiltaket

I Kalkulator som ikke kan kommunisere med andre

estimert verdi ± feilmargin = X ± et visst antall standardavvik for snittet = X ± u α/2 σ n

Løsningsforslag til obligatorisk oppgave i ECON 2130

Econ 2130 Forelesning uke 11 (HG)

STORM&KULING VARSEL FOR NOVEMBER & DESEMBER PIRATENE

Introduksjon til inferens

6.1: Generelt om hypotesetesting Bakgrunn: visse størrelser har naturlig variabilitet. Hvor stort avvik må til før vi konkluderer at noe er unormalt?

Årsplan: Naturfag 5 trinn

TMA4240 Statistikk H2010 (19)

Fortsatt sterke kjønnsrollemønstre blant unge

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Dagens situasjon... 1 Hano Systemet inneholder følgende funksjonalitet: Problemer:... 4 Fixit... 4

Universitetet i Oslo Institutt for statsvitenskap

Tema Kompetansemål Læringsmål Metoder og læringsressurser Vurdering Uke Tema Kompetansemål Læringsmål Metoder og læringsressurser Vurdering

Hypotesetest: generell fremgangsmåte

Rapport fra kompetansenettverket Opplæring av ungdom med kort botid

Eksamenssystemet Inspera finner du som ansatt fra Interne sider eller på nettadressen: hihm.inspera.no/admin

Hypotesetesting av λ og p. p verdi.

Boligpolitisk handlingsplan Leirfjord kommune

Transkript:

Ecn 213 uke 18 (HG) Hyptesetesting II P-verdi

Testing av µ i uid- mdellen (Z-test) MODELL (Situasjn I) : X1, X2,, Xn uavhengige g identisk nrmalfrdelte ( N ( µσ, ) ) E X X i n n MODELL (Situasjn II): 2 ( i) = µ ( ukjent) g var( i) = σ ( kjent), = 1,2,,, der X1, X2,, Xn 2 ( i) µ ( ) g var( i) σ ( ), er vilkårlig. uavhengige g identisk frdelte (vilkårlig frdeling) E X = ukjent X = ukjent i = 1,2,, n der n 3. Skal teste H: µ µ (mt µ < µ ), H: µ µ (mt µ > µ ), eller H: µ = µ (mt µ µ ) Situasjn I X µ W = ~ N(,1) uansett µ. σ n X µ Testervatr: Z = σ n ( µ kjent hyptetisk verdi) Situasjn II X µ W = ~ N(,1) uansett µ ( n 3) S n X µ Testervatr: Z = S n eksakt Z ~ N (,1) hvis (g bare hvis) µ = µ Z ~ N (,1) hvis (g bare hvis) µ = µ S = Σ X X n 2 ( i ) ( 1) 2

Skal vi frkaste fr stre eller små verdier av Z? H Situasjn I Z X µ X µ + µ µ = = = W σ n σ n µ µ + σ n ~ N µ = µ! (,1) bare hvis Situasjn II X µ X µ + µ µ µ µ Z = = = µ µ S n S n W + ~ N (,1) bare hvis =! S n Frd. fr Z hvis µ < µ Frd. fr Z hvis µ = µ N (,1) Frd. fr Z hvis µ > µ Kritisk verdi er bestemt av ligningen Pµ = µ (frkast H ) = 3

Vanlige prblemstillinger (uid mdellen situasjn I g II). Prblem (i): H : µ µ mt H : µ < µ 1 -nivå test : " Frkast H hvis Z z " Ensidig prblem Prblem (ii) H: µ µ mt H1: µ > µ Ensidig prblem -nivå test: " Frkast H hvis Z z " Prblem (iii) H: µ = µ mt H1: µ µ `Tsidig prblem µ -nivå test : " Frkast s Z z eller Z z " H hvi 2 2 = P (frkast H ) = P ( Z z ) + P ( Z z ) = 2 + 2 µ = µ µ 2 µ 2 Frd. fr Z hvis µ = µ eksakt nivå men H 1 H H 1 µ i situasjn I, µ H µ H niv å i stuasjn II. H 1 H 1 µ µ Frd. fr Z hvis µ < µ N (,1) Frd. fr Z hvis µ > µ 4

Eksempel. Er feltet drivverdig fr utvinning av kadmium? Data stammer fra n = 3 steinprøver. La X være % kadmium i prøve i, i = 1,2,,3 i 2 MODELL: X1, X2,, Xn er uid med E( Xi) = µ ( ukjent), var( Xi) = σ ( ukjent), der µ er gjennmsnittlig % kadmium i feltet. Feltet regnes drivverdig hvis µ > 8. Vi ønsker å teste H : µ 8( µ ) mt H : µ > 8( µ ) 1 X Testervatr Z = ~ N(,1) hvis µ = µ = 8. S µ n.1 tabell E4(D4) Velg nivå =.1 z = 2.326 (kritisk verdi) ( n 3 situasjn II) ( Tilnærmet) 1%- nivå test: " Frkast H hvis Z z = 2.326"..1 DATA: n = 3, X = 9.6, S = 3.1 Knklusjn: Frkast H. (dvs. feltet drivverdig). Z X 8 9.6 8 = = = S 3 3.1 3 2.827 5

P-verdi ( signifikanssannsynlighet ) Definisjn. P-verdien er det minste signifikansnivå, sm ut fra data gir knklusjnen, "Frkast H ". Skriv: ˆ fr p-verdien. ˆ er bestemt av data (ikke frskeren). Alternativt (ekvivalent) testkriterium: " Frkast H h vis ˆ ", der er det valgte nivået. I eksemplet: H: µ 8 ( µ ) mt H1: µ > 8( µ ) X µ -nivå test: " Frkast H hvis Z = z ". S n Observert verdi: z = Z = 2.827 ˆ her mtrent Nivå ( ) Kritisk verdi ( ) Knklusjn 5% 1.645 Frkast 1% 2.326 Frkast.5% 2.576 Frkast.1% 3,9 Ikke frkast z H H H H 6

La z være ervert Z ( z = Z = 2.827 i eksemplet) Bruksanvisning fr å finne p-verdien ( fr prblemet H : µ µ (mt µ > µ )) Finner p-verdien sm den slik at kritisk verdi blir lik ervert verdi av testervatren dvs. slik at z z ˆ = Siden kritisk verdi, z, ppfyller Pµ = µ ( Z z) = fr alle, må vi ha ˆ ( ) ( ) = Pµ = µ Z z ˆ = Pµ = µ Z z Dermed blir frmelen fr p-verdien: ˆ = Pµ = µ ( Z z ) I eksemplet ˆ = P ( Z z ) = P ( Z 2.827) = P ( Z > 2.827) = µ = µ µ = µ µ = µ tabell E3(D3) = 1 P ( Z 2.827) = 1.9977 =.23 µ = µ En ekvivalent test med signifikansnivå, er " frkast H ˆ hvis ", slik at en p-verdi på.23% sier at enhver sm aksepterer et signifikansnivå ver.23% (f.eks. 5% eller 1%), ville frkaste H. 7

Naturlig tlkning av p-verdien, alternativet, H. 1 ˆ, er sm et mål på graden av evidens i data fr Dest lavere ˆ er, dest mer evidens innehlder data fr H. 1 Tilsvarende fr de t andre prblemene: Prblem (i): H: µ µ mt H1: µ < µ -nivå test : " Frkast H hvis Z z " P-verdi: ˆ = P Z z ) µ = µ ( (Sm før: z = Z ) Prblem (iii): H: µ = µ mt H1: µ µ -nivå test : " Frkast H hvis Z z eller Z z " " Frkast H ( G z ) 2 2 hv is Z z " 2 P-verdi: ˆ = Pµ = µ ( Z z ) = 2 Pµ = µ ( Z z ) = = 2 1 ( ) Merk at, fr a>, P( Z> a) = PZ ( < a) + PZ ( > a) = 2 PZ ( > a) siden N (,1)-frdelingen er symmetrisk m. 8

T-test fr µ i uid-mdellen (situasjn III) Hvis vi i tillegg til frutsetningene under situasjn II, kan frutsette at enkeltervasjnene kmmer fra en nrmalfrdeling, kan vi bruke T-test, sm gjelder eksakt fr alle n. MODELL (situasjn III): X1, X2,, Xn uavhengige g identisk nrmalfrdelte, ( X ~ N ( µσ, ) ), der både µ g σ er ukjente. n er vilkårlig. i X µ Sm før (fr knfidensintervall, regel 6.1 (6.9)), W= ~ tn ( 1) frdelt uansett µ. S n Testervatr: X µ µ µ T =, sm er lik W hvis µ = µ T = W + S n S n T ~ tn ( 1 ) hvis µ = µ (sm er nk til å bestemme kritisk verdi ). Hvis, f.eks. prblemet er H: µ µ mt H1: µ > µ, skal vi frkaste H fr stre verdier av T, dvs. fr T k der den kritiske verdien k bestemmes av ligningen P ( T k) k t = = = µ µ ( -kvantilen i tn ( 1)-frdelingen) Eksakt -nivå test: "Frkast hvis " H T t (Tilsvarende fr de andre prblemene side 4 - se regel 6.19 (6.16)). 9

Eksempel 6.28 (6.26) i Løvås: Påstått vekt av hamburgere, µ = 1g Gjertrud mistenker lavere g veier tilfeldige hamburgere. µ 8 n = DATA: 1.4, 97.3, 98.4, 94., 96.7, 11.2, 99.2, 97. x = 98.3, s x = 2.29 Skal teste H: µ 1 ( µ ) mt H1: µ < 1 Oppgave: Finn p-verdien. Mdell: Antar X, X,, X uid g nrmalfrdelt, X ~ N ( µσ, ), 1 2 der både µ g σ er ukjente. n i Testervatr: X 1 T =, sm er t (7)-frdelt hvis µ = 1. S n Vi frkaster H fr tilstrekkelig små verdier av T (dvs. fr T en kritisk verdi). ( P ( T t ) µ = 1 = ) En -nivå test: " Frkast hvis " µ 1 (der t H T t er -kvantilen i t(7)-frdelingen) P-verdi: ˆ = P = ( T t ), der t = T er ervert verdi. 1

Observert verdi av testervatren (T): t X 1 98.3 1 = T = = = S n 2.29 8 2.43 p-verdien = = Pµ = 1 T ˆ ( 2.43) Løvås angir denne sm ˆ.2 uten begrunnelse. Hvis µ = 1, er T eksakt t(7)-frdelt, så, m vi har tilgang til Excel, kan vi bestemme P ( T 2.43) nøyaktig. Til eksamen har vi ikke det, så vi må nøye ss µ = 1 begrenset infrmasjn fra tabell E.5 (D. 5): Nivå.25.1.5.25.1.5 Kritisk verdi -.711-1.415-1.895-2.365-2.998-3.499 Knklusjn frkast frkast frkast frkast ikke frkast ikke frkast (Merk at siden t(7)-frdelingen er symmetrisk m, Pµ = 1( T t ) = Pµ = 1( T t) = ) på øyemål P ( T 2.365) =.25 g P ( T 2.998) =.1 P ( T 2.43).2 µ = 1 µ = 1 µ = 1 En p-verdi på ca. 2% regnes sm ganske sterk evidens fr at H 1 : µ < 1 gjelder. 11

Eksempel på binmisk test Zener-krt fr en enkel test på «telepatisk evne». Frsøksleder (FL) stkker krtene g trekker et krt (rent tilfeldig). Frsøkspersnen (FP) sitter bak en skjerm g gjetter på hvilket krt FL har trukket. Dette gjentas (f.eks.) n = 3 ganger. MODELL: La X være antall riktige gjetninger i n = 3 frsøk. X~ bin( np, ), der per P(gjette riktig) i enkelt-frsøk. Hvis det ikke freligger nen «telepatisk evne» hs FP, vil hver gjetning være rent tilfeldig p = P(gjette riktig) = 1 5 =.2. Ønsker å knstruere en 5% -nivå test fr H: p.2 ( p) mt H1: p>.2 ( p). 12

Knstruksjn. X ~ bin( n, p) E( X ) = np g var( X ) = np(1 p) pˆ = X n er frventningsrett ( E( pˆ) = ( np) n = p) p(1 p) med standardfeil, SE( pˆ) = SD( pˆ) = n Hvis p> p =.2, vil X ha tendens til stre verdier naturlig test: " Frkast H hvis X k" der kritisk verdi, k, sm svarer til nivå, er bestemt av ligningen, P = ( X k) = ( =.5) Med Excel kan vi enkelt finne en passende k. Siden X bare kan anta hele verdier, er det ikke sikkert vi finner en k med nivå akkurat.5. Da velger vi k med tilsvarende nivå så nær.5 sm mulig. I praksis, hvis n ikke er fr liten, lager vi sm ftest en Z-test (med nivå ) basert på regel 5.2: p p ( ) var( X ) = np(1 p) 5 (ca.) X ~ N ( E( X ), SD( X )) = N np, np(1 p) ( ) I ligningen, Pp= p( X k) =, er p = p=.2 g X ~ N np, np(1 p) 13

I eksemplet er np (1 p ) = 3(.2)(.8) = 4.8, sm er litt på grensen fr akseptabel nrmaltilnærming. ( 1 p) ) X np Anta p = p. X ~ N np, np( Z = ~ N(,1) hvis p = p. np (1 p ) Nivå () =.5 gir kritisk verdi: k np = Pp= p(frkast H ) = Pp= p( X k) = P p= p Z np(1 p) k np 5% nivå = z k = np + z np(1 p) = 3(.2) + (1.645) 4.8 np (1 p ) k = 9.6 Tilnærmet 5% test : " Frkast H hvis X 9.6" " Frkast H hvis X 1" Nminelt nivå: =.5 (dvs. nivå) Eksakt nivå: eksakt = Pp= p( X 1) = 1 P ( 9) 1.9389.611 p= p X = = Excel ( P-verdi fr en ervasjn, x : ˆ = X = Pp= p( X x) ) 14

I praksis, hvis n ikke er fr liten, frmulerer vi dette sm en Z-test: Prblem: Å teste H: p p mt H1: p> p. Testervatr: Z = X np ˆ p p = np(1 p) p(1 p) n ~ N(,1) hvis p = p Tilnærmet -nivå test: " Frkast H hvis Z z " (der z er kritisk verdi her). Med data: x = X, får vi ervert testervatr, z = Z = X np np (1 p ) g p-verdi ˆ = P ( Z z ) 1 G( z ) p= p (der Gz ( ) er den kumulative frd. funksjnen i N(,1).) 15

Duke University 1938: 32 studenter deltk. n = 6 gjetninger. Resultat: 12 489 riktige gjetninger. Estimat: ˆ X x = Xs b = pb s = =.2815 n Observert testervatr når p =.2 pˆ z = Z bs = = p p ( 1 p n ) 4. 99 Excel P-verdi: ˆ = Pp= p( Z 4.99) =. 3 Altså veldig sterk evidens fr at p > 1 5! Eksperimentet imidlertid senere sterk kritisert av sannsynlighetsteretikere («vanskelig å kntrllere fr mange ptensielle feil-kilder, bl.a. stkking av krt»). Se gså kritisk diskusjn av slike eksperimenter i http://www.skepdic.cm/zener.html 16

Styrkefunksjnen () i n = 3 - tilfellet. ( ) Fr vilkårlig p (ikke fr nær eller 1): X ~ N 3 p, 3 p(1 p) γ ( p) Def heltallskrreksjn = P (frkast H ) = P ( X 1) = 1 P ( X 9) = 1 P ( X 9.5) p p p p 9. 5 3 p 1 G (der Gz ( ) er den kum. frd.-funksjnen i N(,1) ) 3 p(1 p) 17