Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Like dokumenter

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Eksamensoppgave i ST3001

Kapittel 3: Studieopplegg

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Utsatt individuell skriftlig eksamen. STA 400- Statistikk

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Løsningsforslag Til Statlab 5

EKSAMENSOPPGAVER STAT100 Vår 2011

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Beskrivende statistikk Litt om SPSS

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Kapittel 7: Inferens for forventningerukjent standardavvik

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

7.2 Sammenligning av to forventinger

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

ST0202 Statistikk for samfunnsvitere

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

ST0202 Statistikk for samfunnsvitere

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

ST0202 Statistikk for samfunnsvitere

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Eksamensoppgave i TMA4255 Anvendt statistikk

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Til bruk i metodeundervisningen ved Høyskolen i Oslo

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

TMA4240 Statistikk H2010 (20)

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

6.2 Signifikanstester

Lineære modeller i praksis

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Statistikk og dataanalyse

Løsningsforslag eksamen STAT100 Høst 2010

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Konfidensintervall for µ med ukjent σ (t intervall)

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Løsningsforslag til obligatorisk innlevering 3.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

EKSAMEN I TMA4255 ANVENDT STATISTIKK

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2016

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Forelesning 10 Kjikvadrattesten

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

STUDIEÅRET 2011/2012. Utsatt individuell skriftlig eksamen. STA 200- Statistikk. Mandag 27. august 2012 kl

Variansanalyse. Uke Variansanalyse. ANOVA=ANalysis Of Variance

Bakgrunn. KLMED 8006 Anvendt medisinsk statistikk - Vår 2008 Repeterte målinger. Overvekt: løp for livet

Medisinsk statistikk Del I høsten 2009:

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Skoleeksamen i SOS Kvantitativ metode

Generelle lineære modeller i praksis

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Formelsamling i medisinsk statistikk

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

UNIVERSITETET I OSLO

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

Kort overblikk over kurset sålangt

Fasit for tilleggsoppgaver

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

EKSAMEN I TMA4255 ANVENDT STATISTIKK

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Eksamensoppgave i ST3001

Transkript:

Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1

Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives med normalfordelingen Fordelingen er symmetrisk og har to parametere: Forventning: µ Standardavvik (Standard deviation): σ Disse angir tyngdepunkt og spredning i fordelingen Viktig: Et intervall som er 1.96 standardavvik på hver side av forventningen dekker 95% av fordelingen 2

Normal distribution mean = 165, std. deviation=5 148,0 180,0 178,0 176,0 174,0 172,0 170,0 168,0 166,0 164,0 162,0 160,0 158,0 156,0 154,0 152,0 150,0 3 HEIGHT

Standardfeil (standard error) La oss si at du har samlet et utvalg på n observasjoner for å beregne et gjennomsnitt Samler du flere utvalg av samme størrelse får du ikke samme gjennomsnitt Standardavviket til gjennomsnittet kalles standardfeil og estimeres med s n Hvis observasjonene er normalfordelt, kan du være 95% sikker på at det sanne gjennomsnittet (forventningen) ligger i intervallet gj.snitt+/- 1.96*standardfeil 4

Konfidensintervall i SPSS Analyze- Descriptive Statistics - Explore Descriptives WEIGHT Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Lower Bound Upper Bound Statistic Std. Error 70,7000 2,6548 65,1435 76,2565 70,5000 69,0000 140,958 11,8726 50,00 95,00 45,00 10,0000,427,512,263,992 5

t-fordelingen Få observasjoner: Dårlig estimat for standardavviket Konfidensintervall basert på normalfordelingen vil være for smalt Betyr at et 95% konfidensintervall IKKE vil dekke 95% av den sanne fordelingen Må bruke t-fordelingen isteden: Er også symmetrisk, men har større standardavvik 6

Eksempel: Gjennomsnittlig daglig energiinntak i kj hos 11 friske kvinner målt over 10 dager SUBJECT INTAKE 1 5260 2 5470 3 5640 4 6180 5 6390 6 6515 7 6805 8 7515 9 7515 10 8230 11 8770 7

INTAKE Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Descriptives Lower Bound Upper Bound Statistic Std. Error 6753,64 344,36 5986,35 7520,93 6724,60 6515,00 1304445 1142,12 5260 8770 3510 1875,00,428,661 -,793 1,279 8

Ønsker å teste om kvinnenes energi-inntak er likt det anbefalte energi-inntaket (ett-utvalgs t-test): Anbefalt energi-inntak: 7725kJ Nullhypotese H o : Energi-inntaket er 7725kJ Alternativ hypotese H 1 : Energi-inntaket er forskjellig fra 7725 kj Test = observert gj.snitt - forventet gj.snitt standardfeil til observert gj.snitt = 6753.6 1142.1/ 7725 2.821 Denne størrelsen er t-fordelt med 10 frihetsgrader (antall personer -1) En stor positiv eller negativ verdi av testen indikerer at nullhypotesen er gal Hvordan vite om man skal forkaste H o eller ikke? 11 = 9

To VIKTIGE begreper P-verdi: Sannsynligheten for at det observerte gjennomsnittet er likt det forventede gjennomsnittet etter at testen er gjort Hvis p-verdien er lavere enn signifikansnivået forkastes nullhypotesen Signifikansnivået gir den øvre sannsynligheten for å forkaste nullhypotesen hvis den er sann Vanlige signifikansnivåer: 5% eller 1% Signifikansnivå 5% betyr at det er 5% sannsynlighet for å forkaste nullhypotesen når den er sann Medfører at man er minst 95% sikker på å ikke forkaste nullhypotesen hvis den er sann Eller: Man vil være minst 95% sikker på at man ikke forkaster nullhypotesen på grunn av tilfeldigheter Dette er begreper som benyttes i alle statistiske tester, ikke 10 bare for t-tester

I SPSS: Analyze - Compare means - One-sample t test Test variable: intake Test value: 7725 One-Sample Statistics INTAKE Std. Deviation Std. Error Mean N Mean 11 6753,64 1142,12 344,36 One-Sample Test INTAKE Test Value = 7725 Sig. (2-tailed) 95% Confidence Interval of the Difference Mean Difference Lower Upper t df -2,821 10,018-971,36-1738,65-204,07 11

Hva blir konklusjonen av testen? Vi samlet inn data på energi-inntaket til 11 kvinner for å studere om dette var signifikant forskjellig fra det anbefalte energi-inntaket på 7725kJ. I gjennomsnitt lå energi-inntaket til kvinnene 971kJ lavere enn det anbefalte inntaket. 95% konfidensintervall for differansen er (-1739, -205). Dette betyr at vi kan være 95% sikre på at den sanne differansen (ergo differansen vi hadde funnet hvis vi hadde data på alle kvinner istedenfor kun 11) ligger i dette intervallet. Differansen er signifikant på 5%-signifikansnivå, p- verdien er 0.02. 12

MERK FØLGENDE: Hvis konfidensintervallet hadde omsluttet verdien 0, hadde p-verdien vært over 5% Det er altså en 1-1 sammenheng mellom p- verdier og konfidensintervall. Den gjennomsnittlige differansen mellom målingene og den forventede verdien er effektmålet i studien I en rapport oppgir man vanligvis effektmål, 95% konfidensintervall for effektmålet, samt p-verdien i konklusjonen 13

Eksempel: Energiintak i kj hos 11 friske kvinner målt før menstruasjon og etter menstruasjon SUBJECT PREMENST POSTMENS 1 5260.0 3910.0 2 5470.0 4220.0 3 5640.0 3885.0 4 6180.0 5160.0 5 6390.0 5645.0 6 6515.0 4680.0 7 6805.0 5265.0 8 7515.0 5975.0 9 7515.0 6790.0 10 8230.0 6900.0 11 8770.0 7335.0 Number of cases read: 11 Number of cases listed: 11 14

To målinger på samme individ: Parret t-test Hvis du har to like målinger per individ i et utvalg, sier vi at de er parrede Målingene vil være avhengige Eksempel: To blodtrykksmålinger av samme mann på en uke, vil ligge nær hverandre Baserer testen på differansen mellom målingene, reduserer dataene til ett utvalg H 0 : Pre - og post menstruelle energiinntak er like 15

Konfidensintervall og p-verdier for paret t-test i SPSS Analyze - Compare Means - Paired-Samples T Test. Klikk på de to variabelene du vil teste, og flytt dem over til høyre 16

Konklusjonen av testen blir: Vi gjennomførte en studie for å undersøke om energi-inntaket hos kvinner forandrer seg før og etter menstruasjon. Vi samlet inn data på 11 kvinner, og i gjennomsnitt var energi-inntaket 1320kJ høyere etter menstruasjon sammenlignet med før. 95% konfidensintervall for forskjellen er (1074kJ, 1566kJ). Forskjellen er signifikant på 5%-nivå, p-verdien er <0.01. 17

8 000 7 000 6 000 5 000 Grafisk fremstilling I SPSS: Graphs->error bar->simple Kryss av på summaries of separate variables Variable: Premenst og postmenst Premenst Postmenst 18 95% CI

ID GROUP ENERGY 1 0 6.13 2 0 7.05... 12 0 10.15 13 0 10.88 14 1 8.79 15 1 9.19... 21 1 11.85 22 1 12.79 Number of cases read: 22 Number of cases listed: 22 Eksempel: 24 timers energiforbruk (MJ/dag) i 2 grupper av kvinner: 13 tynne og 9 overvektige 19

To-utvalgs t-test Har her to uavhengige grupper: De som er tynne og de som er overvektige Vil teste om det er forskjellig energiforbruk H 0 : energiforbruket er det samme for tynne og overvektige I SPSS: Analyze - Compare Means - Independent- Samples T Test Flytt Energy til Test-variable Flytt Group til Grouping variable Trykk på Define Groups og skriv 0 og 1 for de to gruppene 20

ENERGY ENERGY Equal variances assumed Equal variances not assumed Group Statistics GROUP lean obese Std. Error N Mean Std. Deviation Mean 13 8.0662 1.2381.3434 9 10.2978 1.3979.4660 Independent Samples Test Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper 1.002.329-3.946 20.001-2.2316.5656-3.4115-1.0518-3.856 15.919.001-2.2316.5788-3.4592-1.0041 Over 0.05: Les første linje (Equal variances assumed) Ellers: Les andre linje (Equal variances not assumed) 21

Konklusjon Gjennomsnittlig energiforbruk for tynne og overvektige kvinner var henholdsvis 8.1MJ/dag og 10.3MJ/dag Den gjennomsnittlige forskjellen mellom gruppene var -2.2MJ/dag, 95% KI (-3.4,-1.1) Forskjellen mellom gruppene var signifikant på 5%-nivå, med p-verdi <0.01. Hva hvis vi har mer enn 2 uavhengige grupper? Enveis variansanalyse, ANOVA 22

12,00 11,00 10,00 9,00 8,00 7,00 Grafisk fremstilling I SPSS: Graphs->error bar->simple Variable: Energy Category axis: Group Lean Obese Group 23 95% CI Energy

Styrkeberegninger Alle eksemplene bruker små datasett Hvis man har mye data, vil usikkerheten bli mindre, og konfidensintervallene smalere Dette gjør at det er lettere å få signifikante forskjeller/resultater Ikke bare positivt: Med svært mye data vil alle nullhypoteser kunne forkastes. Dette betyr at vi kan få signifikante funn som ikke har klinisk relevans Vanlig å gjøre styrkeberegninger før studiestart, dvs man bestemmer seg for hvor stor forskjell må være for å være klinisk relevant, så beregner man hvor mye data man trenger for å kunne påvise denne forskjellen 24

Antagelser 1. Uavhengighet: Alle observasjoner er uavhengige. Oppnåes ved tilfeldig trekning av individer; for parret t-test får vi uavhengighet ved å se på differansen mellom målingene. 2. Normalfordelte data (Sjekk: histogram, tester, Q-Q plott imorgen) 3. Lik varians eller standardavvik i gruppene 25

Hva hvis antagelsene ikke holder? Bruk ikke-parametriske metoder Par data: Sign test eller Wilcoxon To-utvalg: Mann-Whitney Eller Transformer dataene (log-transformasjon) 26

Parametriske metoder vi har sett: Effektmål: m estimert ved gjennomsnitt Estimering: Konfidensintervall for m Konfidensintervall for m 1 -m 2 (basert på gjennomsnitt og standardavvik) Testing: Ett-utvalgs t-test To-utvalgs t-test Metodene baserer seg på at dataene er normalfordelte (evt. gjennomsnittet normalfordelt) 27

Ikke-parametriske metoder: Effektmål: Median, siden den ikke påvirkes av noen få ekstreme observasjoner i motsetning til gjennomsnittet Estimering Vanlig å oppgi 25%-fraktilen og 75%-fraktilen som et konfidensintervall for medianen Testing: Parrede data: Sign test og Wilcoxon signed rank test To uavhengige utvalg: Mann-Whitney test/wilcoxon rank-sum test Gjør (nesten) ingen antagelser om spesielle fordelinger 28

Ikke-parametriske tester De fleste testene baserer seg på rangsummer, og ikke de observerte verdiene. Summer av ranger antas tilnærmet normalfordelt, så vi kan bruke normaltilnærming for testobservatoren Ved to eller flere like verdier, gis de en gjennomsnittsrang 29

Parrede data (ett utvalg) Eksempel: Daglig energi-inntak i kj hos de 11 kvinnene SUBJECT PREMENST POSTMENS 1 5260.0 3910.0 2 5470.0 4220.0 3 5640.0 3885.0 4 6180.0 5160.0 5 6390.0 5645.0 6 6515.0 4680.0 7 6805.0 5265.0 8 7515.0 5975.0 9 7515.0 6790.0 10 8230.0 6900.0 11 8770.0 7335.0 Number of cases read: 11 Number of cases listed: 11 30

Sign test Nullhypotesen er at differansen er 0 Antar uavhengige observasjoner, ingen fordelingsantakelse Under nullhypotesen vil vi forvente at like mange differanser er over og under 0 Testen teller opp antall positive differanser P-verdi fra binomisk fordeling når n er liten, normalfordeling når n stor SPSS: Analyze->nonparametric tests->two related samples. Kryss av sign under test 31

To uavhengige utvalg: Wilcoxon/Mann-Whitney Nullhypotesen er her at fordelingene i de to gruppene/utvalgene er like For t-test: Forventningene like Antagelser: Uavhengighet innen og mellom grupper, lik fordeling i begge grupper Rangerer alle observasjonene som om de kom fra samme gruppe P-verdien beregnes fra tabeller eller normalfordelingen 32

ID GROUP ENERGY 1 0 6.13 2 0 7.05... 12 0 10.15 13 0 10.88 14 1 8.79 15 1 9.19... 21 1 11.85 22 1 12.79 Number of cases read: 22 Number of cases listed: 22 14 33

I SPSS: Analyze->nonparametric tests->two independent samples tests Test type: Mann-Whitney U 34

Oppsummering, ikke-parametriske tester Fordeler: Ingen strenge antakelser om fordeling Ulemper: For normalfordelte data vil ikkeparametriske tester ha dårligere styrke, dvs. hvis utvalgene er små, vil man ikke finne noen signifikante forskjeller Får ikke noe annet enn p-verdier fra ikkeparametriske tester 35