1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver. 2 9-4: Sammenligne gjennomsnitt for to relaterte stikkprøver

Like dokumenter

1 10-2: Korrelasjon : Regresjon

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Oppgaver til Studentveiledning I MET 3431 Statistikk

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Oppgaver til Studentveiledning II MET 3431 Statistikk

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010 (20)

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

TMA4240 Statistikk H2010 (19)

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

7.2 Sammenligning av to forventinger

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Hypotesetest: generell fremgangsmåte

ST0202 Statistikk for samfunnsvitere

β(µ) = P(akseptere H 1 µ)

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Løsningsforslag til obligatorisk innlevering 3.

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Kapittel 10: Hypotesetesting

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Kan vi stole på resultater fra «liten N»?

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

Hypotesetesting. mot. mot. mot. ˆ x

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

1 11-1: Kji-kvadrat fordelingen : Krysstabeller og kji-kvadrattesten. 3 Kji-kvadrattesten i JMP

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Forelesning 10 Kjikvadrattesten

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl.

Kapittel 7: Inferens for forventningerukjent standardavvik

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

Fasit for tilleggsoppgaver

TMA4240 Statistikk H2010 (22)

Inferens i fordelinger

ECON240 VÅR / 2016 BOKMÅL

6.2 Signifikanstester

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

ST0202 Statistikk for samfunnsvitere

Regler i statistikk STAT 100

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Estimering og hypotesetesting

UNIVERSITETET I OSLO

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Mer om hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Kapittel 9 og 10: Hypotesetesting

Kapittel 3: Studieopplegg

Testobservator for kjikvadrattester

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Målenivå: Kjønn: Alle bør kunne se at denne variabelen må plasseres på nominalnivå

Kapittel 9 og 10: Hypotesetesting

Skoleeksamen i SOS Kvantitativ metode

Estimering og hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

ST0202 Statistikk for samfunnsvitere

10.1 Enkel lineær regresjon Multippel regresjon

Testobservator for kjikvadrattester

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

TMA4240 Statistikk Høst 2007

UNIVERSITETET I OSLO

Løsning eksamen desember 2017

Løsningsforslag eksamen STAT100 Høst 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Løsningsforslag Til Statlab 5

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

Løsningsforlag statistikk, FO242N, AMMT, HiST 2.årskurs, 7. desember 2006 side 1 ( av 8) LØSNINGSFORSLAG

Eksamen REA3028 Matematikk S2. Nynorsk/Bokmål

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Kap. 12: Variansanalyse

ST0202 Statistikk for samfunnsvitere

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Transkript:

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver 2 9-4: Sammenligne gjennomsnitt for to relaterte stikkprøver 3 Oppvarming til kap 10: Rette linjer

Sammenligne to populasjoner Data fra to stikkprøver Ofte ønsker vi å sammenligne data som kommer fra to stikkprøver I kapittel 9 så bruker vi stoffet fra kap 7 (estimering) og kap 8 (hypotesetesting) til å sammenligne to populasjoner Section 9-3 Pensum er Part 1. Variansen i de to populasjonen antas ikke å være like.

Relaterte stikkprøver Relaterte stikkprøver Vi sier at stikkprøvene er relaterte dersom en verdiene i de to stikkprøvene høres naturlig sammen i par To relaterte stikkprøver har derfor alltid den samme størrelsen Relaterte stikkprøver får vi fra: 1 Matchede par, eller 2 Samme objektet målt to ganger (før og etter) Example Slankeprogram: Du sammenligner vekten før og etter dietten. En vekt til en person i den første stikkprøven matches naturlig med vekten til den samme personen etter dietten

Uavhengige stikkprøver Uavhengige stikkprøver Vi sier at stikkprøvene er uavhengige dersom en verdi i den ene stikkprøven ikke kan matches med en bestemt verdi fra den andre stikkprøven Example To uavhengige stikkprøver kan derfor ha forskjellig størrelse Sammenligne gjennomsnittsvekt hos røykere og ikke-røykere En stikkprøve med røykere, og en annen stikkprøve med ikke-røykere En røyker kan ikke naturlige matches med en bestemt ikke-røyker Stikkprøvene er uavhengige

Forutsetninger Sjekk disse kravene For at prosedyrene i seksjon 9-3 skal virke må: Begge stikkprøvene er uavhengige og tilfeldige Enten er begge stikkprøvene store (mer enn 30 i hver stikkprøve) Eller så kommer begge stikkprøvene fra normalfordelte populasjoner

Hypoteser for to uavhengige stikkprøver Hypoteser Vi ønsker å teste om gjennomsnittet er det samme i de to populasjonene: H 0 : µ 1 = µ 2 og alternativet kan være en- eller tosidig. Et tosidig alternativ skrives H 1 : µ 1 µ 2. Et ensidig alternativ kan f.eks. være H 1 : µ 1 > µ 2.

Testobservator for to uavhengige stikkprøver Testobservatoren t = x 1 x 2 s 2 1 n 1 + s2 2 n2 x 1 og x 2 er stikkprøve gjennomsnittene s 1 og s 2 er stikkprøve standardavvikene Hvis H 0 er sann, så har t i formelen over en t-fordeling Frihetsgraden er lik en mindre enn den størrelsen på den minste stikkprøven. Da kan tabell A-3 brukes til å finne kritiske verdier.

Eksempel: Lønn 1 Example Du ønsker å sammenligne gjennomsnittlig startlønn BI master kandidater i Bergen og Stavanger. H 0 : µ S = µ B vs.h 1 : µ B µ S Figur: Boksplott lønn menn vs kvinner og vi bruker α = 0.05. Stikkprøvene gir: Stavanger n = 70, x S = 418500 og s S = 45500 Bergen n = 73, x B = 403700 og s B = 30600

Eksempel: Lønn 2 Example Vi har df = 69 (rund ned til 65 for å være på den sikre siden) Tabell A-3 gir da kritisk verdi Testobservatoren blir t = t 0.025 = 1.997 418500 403700 45500 2 70 + 306002 73 = 2.273 Testobservatoren er mer ekstrem enn kritisk verdi: Forkast H 0 Konklusjon: Det er grunn til å hevde at det er en forskjell i startlønn mellom Stavanger og Bergen

Figur: Testobservator og kritisk verdi for lønns-eksempelet

Eksempel: Reisetid Drammen vs. Trondheim Example BI Drammen ligger mer sentralt enn BI Trondheim. Vi ønsker å teste på α = 0.1 nivået om det er lengre reisetid i Trondheim. H 0 : µ D = µ T vs. H 1 : µ D < µ T Figur: Boksplott reisetid I fila klassens data alle: Drammen n = 65, x D = 23.45 og s D = 21.20 Trondheim n = 291, x T = 26.71 og s B = 15.86

Example Tabell A3 gir kritisk verdi (df=64, rundes ned til 60) t 0.1 = 1.296 mens testobservatoren blir t = 26.71 23.45 15.86 2 291 + 21.202 65 = 1.17 Vi forkaster ikke H 0. Det er ikke tilstrekkelig grunnlag til å hevde at reisetiden i Trondheim er høyere enn i Drammen.

Test for to relaterte stikkprøver Regn ut differansen i hvert par Er stikkprøven relatert, så regner vi ut differansene parvis Da har vi egentlig bare en stikkprøve av differanser d Da vil µ 1 = µ 2 være det samme som at gjennomsnittet av differansene er null: µ d = 0 Forutsetninger Tilfeldig stikkprøve Enten større enn n = 30 Eller par av differanser kommer fra en normalfordelt populasjon

Notasjon d er differansen mellom to verdier i et par µ d er populasjonsgjennomsnittet for alle differansene d er gjennomsnittet av differansene i stikkprøven s d er standardavviket for differansene i stikkprøven n er antall par i stikkprøvene (begge stikkprøvene har denne størrelsen)

Test for to relaterte stikkprøver Testobservator For to relaterte stikkprøver: Nullhypotesen er H 0 : µ 1 = µ 2 Testobservatoren blir da Har n 1 frihetsgrader t = d s d n

Test for to relaterte stikkprøver To relaterte stikkprøver og t-testen To relaterte stikkprøver x og y: Regn ut de parvise differansene Regn ut differansenes gjennomsnitt d og standardavvik s d Hypotesene er H 0 : µ x = µ y vs. H 1 : µ x µ y Dersom H 0 er sann, er d gjennomsnittlig lik null. Da blir testobservatoren t = d s d n Forkast H 0 dersom t går utenfor kritisk verdi t α fra tabell A-3

Example Selger man flere pakker Cornflakes hvis pakkene står i øyehøyde? Her er salgstall for 13 par av butikker, der hvert par er likt iforhold til beliggenhet, nabolag, størrelse. x er salgstall for øyehøyde, y er for plassering nede ved gulvet. x 111 150 130 154 67 112 84 123 71 62 38 51 77 y 71 121 133 126 93 49 109 96 27 58 36 37 69 d 40 29-3 28-26 63-25 27 44 4 2 14 8 Ensidig test: Er øyehøyde best? H 0 : µ x = µ y vs. H 1 : µ x > µ y d = 15.8 og s d = 26.2 gir t- verdi t = 15.8 26.2 13 = 2.17 Kritisk verdi fra tabell A-3 t α = 1.78 (for α = 0.05). t-verdien er større enn kritisk verdi: Forkast H 0 Det er tilstrekkelig grunnlag til å hevde at øyehøyde selger bedre

Example Værmeldingen angir minimumstemperaturen fem dager frem i tid. For fem datoer noterte vi den meldte temperaturen og den faktiske temperaturen (i F ) 4 dager senere. Vi ønsker å teste om værmeldingen i gjennomsnitt har rett (bruker α = 0.5): H 0 : µ meldt = µ faktisk vs H 1 : µ meldt µ faktisk d = 13.2, s = 10.7, n = 5 og t α/2 = 2.776 med df = 4. Testobservatoren t = 13.2 10.7/ 5 = 2.759 Vi kan ikke forkaste H 0, det er ikke tilstrekkelig grunnlag til å hevde at værmeldingen i gjennomsnitt bommer

JMP Example BI Drammen: Bruker studentene i gjennomsnitt like mye tid på jobb som på studier? JMP for relaterte stikkprøver Analyze > Matched Pairs

Example Vi setter α = 0.05 H 0 : µ jobb = µ studier vs. H 1 : µ jobb µ studier Figur: klassens data alle ny Testobservatoren t = d s d / n = 3.84 3.12 = 1.23 Vi kan bruke tradisjonell metode med kritisk verdi fra tabell A3. Men JMP gir p-verdien: 0.22 Siden 0.22 > α = 0.05, forkastes ikke H 0. Det er ikke grunnlag til å hevde at antall timer brukt på jobb og på studier i gjennomsnitt er forskjellige ved BI Drammen

Alle rette linjer har sin egen formel Rett linje Formelen for en rett linje i x y koordinatsystemet er y = b 0 + b 1 x b 0 er et tall som angir hvor linja krysser y-aksen b 1 er stigningstallet som angir hva stigningen til linja er

Example Krysser y-aksen i 1: b 0 = 1 Stiger med 2 hver gang x øker med 1: b 1 = 2 Formelen til linja er derfor y = 1 + 2x

Øvingsoppgaver y = 1 + 2x y = 2 + 3x y = 1 + x y = 1 + x y = 4x y = 1 x

Skriv opp likningen for disse linjene: y = 3 1 3 x y = 1 + 4x y = 2 y = 1 + 1 3 x

Oppgaver Les Bla gjennom kapittel 10 i boka til neste gang. Oppgaver kapittel 9 9-3: 5, 7, 10, 24 9-4: 3, 5, 23