ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Like dokumenter
Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

TMA4240 Statistikk H2010 (20)

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

TMA4240 Statistikk Høst 2009

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010 (19)

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

TMA4240 Statistikk H2010 (22)

Kapittel 10: Hypotesetesting

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

TMA4240 Statistikk Høst 2007

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Hypotesetesting. mot. mot. mot. ˆ x

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

ST0202 Statistikk for samfunnsvitere

6.2 Signifikanstester

β(µ) = P(akseptere H 1 µ)

ST0202 Statistikk for samfunnsvitere

Kp. 9.8 Forskjell mellom to forventninger

Fasit for tilleggsoppgaver

Hypotesetest: generell fremgangsmåte

ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

Kapittel 9 og 10: Hypotesetesting

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

ST0202 Statistikk for samfunnsvitere

Estimering og hypotesetesting

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Estimering og hypotesetesting

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4240 Statistikk Høst 2015

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk H2010

Statistikk og dataanalyse

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Hypotesetesting av λ og p. p verdi.

i x i

TMA4240 Statistikk Høst 2016

Verdens statistikk-dag.

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Kapittel 3: Studieopplegg

STK Oppsummering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

HØGSKOLEN I STAVANGER

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Løsning eksamen desember 2017

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Løsning eksamen desember 2016

estimert verdi ± feilmargin = X ± et visst antall standardavvik for snittet = X ± u α/2 σ n

STK Oppsummering

Econ 2130 uke 16 (HG)

TMA4245 Statistikk Eksamen desember 2016

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,

Antall oppgavesider: 4 Vedlegg: Ett internt notat (8 sider)

Introduksjon til inferens

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Kapittel 9 og 10: Hypotesetesting

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

Løsningsforslag statistikkeksamen desember 2014

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Om eksamen. Never, never, never give up!

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Løsningsforslag, eksamen statistikk, juni 2015

MOT310 Statistiske metoder 1, høsten 2011

Løsningsforslag eksamen 27. februar 2004

Transkript:

ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. 6 Hypotesetesting Hypotesetesting (kp. 6) Tre deler av faget/kurset:. Beskrivende statistikk. Sannsynlighetsteori, sannsynlighetsregning 3. Statistisk inferens estimering konfidensintervall hypotesetesting Begrep: nullhypotese alternativhypotese ensidig, tosidig teststørrelse (testobservator) nullfordeling kritisk verdi, forkastningsområde signifikansnivå 3

Oversikt over emner:. Mer om hva hypotesetesting er. Hypotesetesting i ulike situasjoner: i. for forventningen, μ, i målemodellen med normalantakelse og kjent varians, σ. ii. for forventningen, μ, i målemodellen med stor n og normaltilnærming. iii. for suksessannsynligheten, p, i binomisk modell med stor n og normaltilnærming. iv.... 4 Oversikt over emner:.... Hypotesetesting i ulike situasjoner: iv.... for suksessannsynligheten, p, i binomisk modell med liten n. v. for forventningen, μ, i målemodellen med normalantakelse og ukjent varians, σ. (Og n liten; t-fordeling; t-test.) vi. test for forventningen i Poissonmodell. 5 Oversikt over emner:. Mer om hva hypotesetesting er 6

Eks.: Vi har gjort n= målinger (x, x,..., x n ) av ph i Breiavatnet; 6., 5.59 5.74 3.43 5.3 6.48 5.5 4.8 4.5 6. Problem: Er virkelig ph lavere enn 6.? 7 Eks.: Vi har gjort n= målinger (x, x,..., x n ) av ph i Breiavatnet; 6., 5.59 5.74 3.43 5.3 6.48 5.5 4.8 4.5 6. Problem: Er virkelig ph lavere enn 6.? Gjennomsnitt er 5.7; men noen målinger er større enn 6., og det er en del variasjon...?? Hvordan konkludere??? 3, 4, 5, 6, 7, 8 Statistisk metode for å trekke konklusjon: (i en situasjon som denne). Vi antar (i denne situasjonen): målemodellen: x, x,..., x n utfall av X, X,..., X n, n u.i.f. tilf. var. normalantakelse: X i ene er normalfordelte kjent varians: Var(X i ) er et kjent tall,. i dette tilfellet. Vi vil teste: H : μ = 6. mot H : μ < 6. ( μ = E( X )) i H uttrykker det utsagnet vi må tro i utgangspunktet; H kan vi hevde dersom dataene tyder klart på at dette i virkeligheten er tilfelle. 9 3

3. Gjennomsnitt betydelig lavere enn 6. indikerer at H er riktig i virkeligheten. 4. Dersom gjennomsnittet lavere enn 5.48, så forkast H, og påstå H : virkelig ph er mindre enn 6.. 5. Data: gjennomsnittet er 5.7 som er mindre enn 5.48. Dvs.: forkast H! Hvorfor akkurat 5.48?? Hvorfor, hvorfor...? Først noen kommentarer. Statistisk hypoteser: alternativhypotesen, H : μ < 6., uttrykker at virkelig ph er mindre enn 6.. nullhypotesen, H : μ = 6., ville det gjerne vært naturlig å hatt som: H : μ 6., men det er en forenkling åbruke =; dette spiller i praksis ingen rolle for resultatet i de fleste situasjoner.. Vi forblir ved å tro på H inntil noe annet er bevist. 4

Først noen kommentarer 3. Vi legger til grunn: målemodellen: x, x,..., x n utfall av X, X,..., X n, n u.i.f. tilf. var. normalantakelse: X i ene er normalfordelte kjent varians: Var(X i ) er et kjent tall,. i dette tilfellet 3 Statistisk tenking:. Dersom H er riktig i virkeligheten, så kommer dataene fra en normalfordeling med forventning 6. (og varians ), grønn kurve: 3, 4, 5, 6, 7,. Dette kan brukes som utgangspunkt for å vurdere om vi kunne fått det aktuelle resultatet ved en tilfeldighet når H faktisk er riktig. 4 Vi baserer testen på gjennomsnittet ikke på enkeltmålingene; Teststørrelse (testobservator): (tilf.var.) X = X L + X ( + ) Vi har (i dette eksempelet): og når H forutsettes å være riktig: X ~ N 6., σ X ~ N μ, n σ = n ( H : μ = 6.) 5 5

Teststørrelsen sin fordeling når H er riktig: nullfordelingen. X ~ N 6., 3, 4, 5, 6, 7, Denne fordelingen nullfordelingen kan brukes til å vurdere om vi kunne fått det aktuelle gjennomsnittsresultatet ved en tilfeldighet dersom H faktisk er riktig. 6 Et lavt (i forhold til 6.) gjennomsnittsresultat indikerer at H er riktig. 3, 4, 5, 6, 7, Vi bruker nullfordelingen til å fastsette hva som lavt nok for å konkludere med H. 7 Dersom vi setter (som i eks.) grensen til 5.48, 3, 4, 5, 6, 7, er det kun 5% sjanse for å få gj.sn.resultat lavere enn dette ved en tilfeldighet dersom H er riktig. P( X 5.48 H riktig) = P( X 5.48 μ = 6) X 6 5.48 6 5.48 6 = P μ = 6 = P Z =.5 / / 443 /.645 ( Z ~ N(,) ) 8 6

5.48: kritisk verdi Intervallet (, 5.48) : forkastningsområde 3, 4, 5, 6, 7, Når H o er riktig er det kun 5% sjanse for ved en tilfeldighet å få utfall av teststørrelsen i forkastningsområdet. Denne sannsynligheten kalles signifikansnivået til testen. 9 5.48: kritisk verdi Intervallet (, 5.48) : forkastningsområde Når H o er riktig er det kun 5% sjanse for ved en tilfeldighet å få utfall av teststørrelsen i forkastningsområdet. 3, 4, 5, 6, 7, Dvs.: kun 5% sjanse for å konkludere feil dersom i virkeligheten ph en er 6. H : μ = 6. ( ) 5.48: kritisk verdi Den kritiske verdien fastlegges av signifikansnivået (5% i eksempelet). 3, 4, 5, 6, 7, Eksempel: La k være den kritiske verdien. Vi ønsker da at k skal være slik at: ( X k H riktig).5 P = 7

P Beregne kritisk verdi: ( X k H riktig) =.5 X 6 P / k 6 = z / k 6 /.5 k = 6.645 k 6 H riktig P =.5 = Z / =.645 = 5.48,5,4,3,,, Z ~ N -4, -,,, 4, (,) Det er vanlig å bruke standardisert teststørrelse. X - μ σ /n Når vi skal teste (f.eks.): H < : μ = μ mot H : μ μ 3 Eksempelet: H : μ = 6. mot H : μ < 6. Standardisert teststørrelse: Dersom H er riktig, er Z N(,)-fordelt. X - 6. Z = / Små verdier (utfall) av Z indikerer at H i virkeligheten er riktig. (Hva som er små verdier ses i forhold til nullfordelingen til Z; N(,)-fordelingen.) 4 8

Eksempelet: H : μ = 6. mot H : μ < 6. Standardisert teststørrelse: X - 6. Z = Kritisk verdi, k: / P( Z k H riktig) =.5,5 k =.645 ( = -z.5 ),4,3,,, -4, -,,, 4, -, 5 Eksempelet: H : μ = 6. mot H : μ < 6. Gjennomføring: Test : Vi forkaster H dersom Z - utfallet k =.645 X - 6. Z = / Data, utfall av Z : 5.7-6. =.3 / Konklusjon : forkast H, siden Z- utfall = -.3 < -.645. 6 Begrep: nullhypotese alternativhypotese ensidig, tosidig teststørrelse (testobservator) nullfordeling kritisk verdi, forkastningsområde signifikansnivå 7 9

Hypotesetesting Oversikt over emner:. Mer om hva hypotesetesting er. Hypotesetesting i ulike situasjoner: i. for forventningen, μ, i målemodellen med normalantakelse og kjent varians, σ. ii. for forventningen, μ, i målemodellen med stor n og normaltilnærming. iii. for suksessannsynligheten, p, i binomisk modell med stor n og normaltilnærming. iv.... 8