6.1: Generelt om hypotesetesting Bakgrunn: visse størrelser har naturlig variabilitet. Hvor stort avvik må til før vi konkluderer at noe er unormalt?

Like dokumenter
estimert verdi ± feilmargin = X ± et visst antall standardavvik for snittet = X ± u α/2 σ n

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

β(µ) = P(akseptere H 1 µ)

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Løsning eksamen desember 2017

TMA4240 Statistikk H2010 (20)

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

TMA4240 Statistikk H2010 (19)

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Kapittel 10: Hypotesetesting

LØSNINGSFORSLAG ) = Dvs

ST0202 Statistikk for samfunnsvitere

Løsning eksamen desember 2016

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Kapittel 9 og 10: Hypotesetesting

Hypotesetest: generell fremgangsmåte

ST0202 Statistikk for samfunnsvitere

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk Høst 2007

Hypotesetesting av λ og p. p verdi.

TMA4240 Statistikk Høst 2015

i x i

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Estimering og hypotesetesting

Estimering og hypotesetesting

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Løsningsforslag statistikkeksamen desember 2014

ST0202 Statistikk for samfunnsvitere

Kræsjkurs i statistikk

Test, 3 Sannsynlighet og statistikk

TMA4240 Statistikk Høst 2016

ST0202 Statistikk for samfunnsvitere

ÅMA110 Sannsynlighetsregning med statistikk, våren

HØGSKOLEN I STAVANGER

ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

HØGSKOLEN I STAVANGER

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Kapittel 9 og 10: Hypotesetesting

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Sannsynlighet og statistikk S2 Løsninger

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Geogebra hjelp - S2. Funksjonsanalyse. Innhold. Kommando. Funksjonsanalyse 1. Undersøke om dataene er normalfordelt 1.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Hypotesetesting. mot. mot. mot. ˆ x

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

ÅMA110 Sannsynlighetsregning med statistikk, våren

Kan vi stole på resultater fra «liten N»?

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

ST0202 Statistikk for samfunnsvitere

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Seksjon 1.3 Tetthetskurver og normalfordelingen

HØGSKOLEN I STAVANGER

Fasit for tilleggsoppgaver

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Sensurveiledning for eksamen i lgu52003 våren 2015

Emnekode: LGU Emnenavn: Matematikk 2 (5 10), emne 2. Semester: VÅR År: 2016 Eksamenstype: Skriftlig

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

ECON240 VÅR / 2016 BOKMÅL

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Binomisk sannsynlighetsfunksjon

Eksamensoppgave i TMA4240 Statistikk

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

b) Hva er sannsynligheten for at re tilfeldig utvalgte bilmotorer alle har en levetid på minst 17 år?

6.2 Signifikanstester

Sannsynlighet og statistikk S2 Oppgaver

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

Eksamensoppgave i ST0103 Brukerkurs i statistikk

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Et lite notat om og rundt normalfordelingen.

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

HØGSKOLEN I SØR-TRØNDELAG Avdeling for lærer- og tolkeutdanning

TMA4240 Statistikk Høst 2009

Statistikk og dataanalyse

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

TMA4240 Statistikk 2014

Ekstreme bølger. Geir Storvik Matematisk institutt, Universitetet i Oslo. 5. mars 2014

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Eksamensoppgave i TMA4245 Statistikk

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

Eksamensoppgave i TMA4240 Statistikk

ST0202 Statistikk for samfunnsvitere

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

Transkript:

Kap. 6: Hypotesetesting 6.1: Generelt om hypotesetesting Bakgrunn: visse størrelser har naturlig variabilitet. Hvor stort avvik må til før vi konkluderer at noe er unormalt? Hypotesetesting i et nøtteskall: vi skal vurdere en påstand/hypotese om en statistisk parameter (typisk gjennomsnitt µ eller binomisk sannsynlighet p), basert på en stikkprøve. 1

Eksempler på "hypotesetester" i dagliglivet Hvor stor må sikkerhetsmarginen i et promilleapparat være for å sikre færre enn 1 % falske positive utslag? Et stålstag skal ha en strekkfasthet på µ = 600 MPa, men en ingeniør måler prøven til kun 550 MPa, basert på 10 målinger. Hvor sikker kan man være på at stålstaget faktisk har for liten strekkfasthet, dvs. µ < 600 MPa? Vi kaster mynt og kron 100 ganger, og får 65 "mynt". Grenseverdien for astmamedisinen Salbutamol i en urinprøve er µ = 1000 nanogram/milliliter. Hvor sikre kan vi være på at mynten er "fiksa", dvs. p = 1/2? Basert på 5 målinger har en utøver et snitt på 1200 nanogram/milliliter. Hvor sikkert er det at konsentrasjonen faktisk er større enn grenseverdien, dvs. at µ > 1000 ng/ml? 2

Prosedyre for hypotesetesting 3

Scenario Nullhypotese H 0 Mothypotese H 1 En pose Maarud potetgull skal inneholde 275 g potetgull. Jeg har kjøpt og målt 10 poser, og snittinnholdet er 250 g. Er det for lite potetgull i posene til Maarud? Forsvaret tester et nytt rakettsystem som skal ha bedre treffsikkerhet enn det gamle, som hadde 75 % treff. En test av 20 raketter gir 79 % treff. Er det nye systemet mer treffsikkert? Produksjonssjefen på Nidar sjekker at poser med julemarsipan inneholder 300 g hverken mer eller mindre. En stikkprøve av 50 poser gir et snitt på 314 g. Er marsipanpakkemaskina feilkalibrert? µ = 275 g µ < 275 g p = 0,75 p > 0,75 µ = 300 g µ = 300 g 4

6.2: Hypotesetesting om µ; kjent standardavvik σ Har 3 ekvivalente metoder for å utføre en hypotesetest om µ dersom σ er kjent: 5

6

Hypotesetesting vha. kritisk verdi, vist ved et eksempel Potetgullmengden X (i gram) i en Maarud pose skal være normalfordelt som X~N(275,10 2 ). Vi veier innholdet i 10 poser, og finner at snittet er 250 g. Vi skal avgjøre om vi blir snytt av Maarud, dvs. om vi kan hevde ut fra stikkprøven at snittmengden i Maarud poser egentlig er mindre enn 275 g. Spørsmålet: er stikkprøven på 250 g «ekstrem» nok hvor går grensa? Vi setter såkalt signifikansnivå, som er et mål på "slingsmonnet", til 5 %. Svar: vi velger å løse dette eksemplet ved hjelp av kritisk veri. Vi skal altså bestemme en kritisk verdi k ut i fra det valgte signifikansnivået, og så sammenlikner vi det faktiske snittet på 250 g med den kritiske verdien. 7

8

9

Illustrasjon av kvantilene i standard normalfordeling N(0,1) 10 % av x verdiene ligger under u 0,10 10 % av x verdiene ligger over u 0,10 5 % av x verdiene ligger under u 0,05 1 % av x verdiene ligger under u 0,01 5 % av x verdiene ligger over u 0,05 1 % av x verdiene ligger over u 0,01 Kvantiltabell 3 u 0,01 u 0,05 u 0,10 2 1 1u 0,10 u 0,05 2 u 0,01 3 x For eksempel: IQ er normalfordelt som N(100,15 2 ). Hvis du ligger på 1 % kvantilen, som er ca. IQ = 135, er du ganske smart kun 1 % av befolkningen har høyere IQ enn deg. 1 % av x verdiene ligger over denne kvantilen µ = 100 135 σ = 15 IQ 10

Fra eksamen mai 2018 Start på denne til tirsdag. 11