Utvalgsstørrelse, styrke



Like dokumenter
Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Kapittel 10: Hypotesetesting

Hypotesetest: generell fremgangsmåte

Fasit for tilleggsoppgaver

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Hypotesetesting. mot. mot. mot. ˆ x

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Kapittel 3: Studieopplegg

ST0202 Statistikk for samfunnsvitere

KLH 3002 Epidemiologi Eksamen Høst 2011 Eksaminator: Geir W. Jacobsen, ISM

i x i

TMA4240 Statistikk Høst 2016

Statistikk og dataanalyse

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Kausalitet - Hvordan komme litt nærmere sannheten

Hypotesetesting av λ og p. p verdi.

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

TMA4240 Statistikk H2010 (20)

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

ST0202 Statistikk for samfunnsvitere

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ST0202 Statistikk for samfunnsvitere

6.2 Signifikanstester

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

EKSAMENSOPPGAVE KLH3004 Medisinsk statistikk (Medical statistics) KLMED8004 Medisinsk statistikk, del I (Medical Statistics, Part I)

Klinisk utprøving. Fase IIIb. Human famakologi (Fase I) Terapeutisk eksplorativ (Fase II) Terapeutisk konfirmerende (Fase III)

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Formelsamling i medisinsk statistikk

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Innhold. Del 1 Grunnleggende begreper og prinsipper... 39

Kapittel 1 Vitenskap: grunnleggende antakelser

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Eksamensoppgave i ST3001

Løsningsforslag Til Statlab 5

Ibuprofen versus mecillinam for uncomplicated cystitis in adult, non-pregnant women

Kapittel 7: Inferens for forventningerukjent standardavvik

Genetikkens plass i klinikken noen overordnede tanker

TMA4240 Statistikk H2010 (19)

Kan vi stole på resultater fra «liten N»?

Regional forskingskonferanse for Psykiatri og rusfeltet Vår Olav M. Linaker PH, St. Olavs Hospital/INM, NTNU

Mer om hypotesetesting

Metodevurderingen har to store metodefeil og kan ikke brukes

ST0202 Statistikk for samfunnsvitere

Estimering og hypotesetesting

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Eksamensoppgave i ST3001

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Epidemiologi - en oppfriskning. Epidemiologi. Viktige begreper Deskriptiv beskrivende. Analytisk årsaksforklarende. Ikke skarpt skille

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal

Epidemiologi - en oppfriskning. En kort framstilling. Er det behov for kunnskaper om epidemiologi?

Verdens statistikk-dag.

Læringsnettverk, Drammen, 13. oktober Forebygging av fall. Hilde H. Holte, seniorforsker

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

Kunnskapshierarkiet- Hva betyr det for oss? Olav M. Linaker 2011

Bjørn H. Grønberg PRC & Kreftklinikken, St. Olavs Hospital. European Palliative Care Research Centre (PRC)

Analytisk strategier for persontilpasset medisin og helseovervåkning

β(µ) = P(akseptere H 1 µ)

Kapittel 9 og 10: Hypotesetesting

TMA4240 Statistikk Høst 2015

Kapittel 9 og 10: Hypotesetesting

Løsningsforslag til obligatorisk innlevering 3.

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Nasjonal registrering av hjerte- og karsykdom Nyttig ekstraarbeid?

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Klagesak: Føflekk eller melanoma? Nevus doctor et dataprogram for beslutningsstøtte i primærhelsetjenesten

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

ST0202 Statistikk for samfunnsvitere

Estimering og hypotesetesting

Repeated Measures Anova.

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Testobservator for kjikvadrattester

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Slutninger fra data FRODE SVARTDAL UIT 2015

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

Kap. 5.2: Utvalgsfordelinger for antall og andeler

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Kurs i kunnskapshåndtering å finne, vurdere, bruke og formidle forskningsbasert kunnskap i praksis. Hege Kornør og Ida-Kristin Ørjasæter Elvsaas

ÅMA110 Sannsynlighetsregning med statistikk, våren

Econ 2130 uke 16 (HG)

Norsk Biotekforum. Forsøksdesign og statistikk i planleggingen av tidligfase kliniske studier. Statistikerens rolle.

Brystkreft: hyppigheten øker men dødeligheten går ned hvorfor? Lars Vatten, dr med Professor i epidemiologi. Det medisinske fakultet NTNU, Trondheim

Oppgaver til Studentveiledning I MET 3431 Statistikk

ST0202 Statistikk for samfunnsvitere

Dental faginformasjon og bruk av digitale medier

Løsning eksamen desember 2017

PBF356 Klinisk utprøvning og dokumentasjon av legemidler. FRM 5730 Klinisk legemiddelutprøvning

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Statistikk for språk- og musikkvitere 1

Definisjoner av begreper Eks.: interesse for politikk

Transkript:

Utvalgsstørrelse, styrke Lise Lund Håheim DDS, PhD Professor II, Forskerlinjen, UiO Seniorforsker, Nasjonalt kunnskapssenter for helsetjenesten, Oslo Seniorforsker, Institutt for oral biologi, UiO Introduksjonskurset, forskerutdanningen Det medisinske fakultet, UiO

Hypotesetesting Teststyrke Beregning av utvalgsstørrelse

Beregning nødvendig for Planlegging Pasienter Ressursbruk Tid Bemanning Kostnader Søknader Litteratur: Laake P et al. Forskning i medisin og biofag. Kap.9

Å teste en hypotese Ho Den du forkaster Ha Den du ønsker å vise

Hypotesetesting Ho er sann Ho er feil Ho forkastes ikke A B Ho forkastes C D

A og D er ønskelige begivenheter P (A) er sannsynligheten for at Ho ikke forkastes når Ho er sann P (D) er sannsynligheten for at Ho forkastes når Ho ikke er sann B og C er feil konklusjoner P (C) er sannsynligheten for at Ho forkastes når den er sann P (B) er sannsynligheten for at Ho ikke forkastes selv om den er feil

Hypotesetesting Ho er sann Ho er feil Ho forkastes ikke Korrekt konklusjon P(A)=1-α Type 2 feil P(B)=β Ho forkastes Type 1 feil P(C)=α Korrekt konklusjon P(D)=1 β Teststyrke/Power

Signifikansnivå Sannsynligheten for å forkast Ho når Ho er sann Den ønsker vi skal være lav Vanligst brukt nivå er α= 5% eller 1% P< 0.05, p<0.01 Teststyrke / Power Sannsynligheten for å forkaste Ho når den faktisk er feil Den ønsker vi skal være høy Vanligst brukt nivå er 1-β= 80-95%

Effektstudier - styrkeberegning Hvor stor forskjell i effekt anser man for klinisk relevant? Hva er effektmålet? Hvor stort utvalg må man ha for å vise denne forskjellen med stor nok sikkerhet? Ved en styrkeberegning ønsker man å beregne en studie slik at man kan vise en sann effekt hvis den virkelig er det.

Størrelsen på kliniske studier hvor mange trenger vi? 1. Statistisk/vitenskapelig tilnærming - Hvor mange trengs for å få sikker evidens på behandlingseffekt hvis en slik effekt eksisterer? 2. Økonomisk tilnærming - Hvor mange pasienter er tilgjengelig? - Hvor mye tid, arbeid og kostnader vil medgå? 3. Etisk tilnærming - Når kan vi stoppe studien for å unngå at pasienter får den minst effektive behandlingen

Utvalgsstørrelse, binomisk respons Antagelse: Standard behandling gir 40% overlevelse over 5 år Ny behandling forventes å gi 10 prosentpoeng bedret overlevelse Ps (0.40) Pn (0.50) n= Pn (1-Pn) + Ps (1-Ps). c (Pn Ps) 2 = n i hver gruppe

n= 0.50 (1-0.50) + 0.40 (1-0.40). c (0.50 0.40) 2 n= 0.25 + 0.24. c 0.01 Velger her: Signifikansnivå α= 5 Teststyrke 1-β= 80 Dette gir c= 7.9 Vi får: n= 387 i hver gruppe

Utvalgsberegning konstanten c Signifikansnivå (tosidig) Teststyrke 0.80 0.90 0.95 0.10 6.2 8.6 10.8 0.05 7.9 10.5 13.0 0.01 11.7 14.9 17.8

Eksempel: medikament versus placebo i sekundærprofylakse etter hjerteinfarkt Vi ønsker å studere om medikamentet A reduserer risikoen for å dø Dødsfall innen et år Antar 20% et års dødelighet for pasienter på placebo Anses viktig å oppnå en 25% reduksjon i dødelighet Hvis sant, da ønsker vi å være 80 % sikre på å oppnå en p-verdi < 0.05

Utregning n= Pn (1-Pn) + Ps (1-Ps). c (Pn Ps) 2 = n i hver gruppe Ps (0.20)= 20% Pn (0.15)= 15% α= 0.05 1-β= 80 % power n= Pn (1-Pn) + Ps (1-Ps). c (Pn Ps) 2 n= 0.2(1-0.2) + 0.15(1-0.15). 7.9 (0.2-0.15) 2 n = 0.2 (0.8) + 0.15 (0.85). 7.9 0.0025 n = 0.16 + 0.1275. 7.9 0.0025 n = 909 i hver gruppe

Alt. 1: 2% reduksjon / endring Ps (0.20)= 20% Pn (0.18)= 18% α= 0.01 β = 0.05; 1-β= 95 % power n= Pn (1-Pn) + Ps (1-Ps). c (Pn Ps) 2 n= 0.2(1-0.2) + 0.18(1-0.82). 17.8 (0.2-0.18) 2 n = 0.16 + 0.1476. 17.8 0.0004 n = 13,684 i hver gruppe

Alt. 2: 50% reduksjon / endring Ps (0.20)= 20% Pn (0.10)= 10% α= 0.05 % β =0.5: 1-β= 50 % power n= Pn (1-Pn) + Ps (1-Ps). c (Pn Ps) 2 n= 0.2(1-0.2) + 0.10(1-0.10). 3.8 (0.2-0.15) 2 n = 0.2 (0.8) + 0.1 (0.9). 3.8 0.01 n = 0.16 + 0.09. 3.8 0.01 n = 95 i hver gruppe

Vi ser: N øker når: Effektmålet p n p s minker Type 1 feil α minker Styrke / power 1- β øker Styrke /power for å oppdage en forskjell hvis den virkelig er der

Utvalgsstørrelse, kontinuerlig respons. Par av observasjoner Par av observasjoner (samme person); for eksempel crossover studie n = (σd/ ) 2. C Der er forskjell i den behandlingseffekt man ønsker å se σd er standardavvik til differansen mellom behandlingseffektene n= totalt antall deltakere

Utregning. Par av observasjoner Intervensjon: Effekt av to legemidler mot astma. Effekt måles ved hjelp av PEF (peak respiratory flow rate i l/min) = 30 l/min σd = 50 l/min n = (σd/ ) 2. C n = (50 / 30) 2. 7.9 n= 22 (totalt)

Utvalgsstørrelse, kontinuerlig respons. Parallelle grupper Parallelle grupper, σ antas å være lik i gruppene: n = 2 (σ/ ) 2. C n = antall i hver gruppe

Utregning. Parallelle grupper Intervensjon: Effekt av to legemidler mot astma. Effekt måles ved hjelp av PEF (peak respiratory flow rate i l/min) = 30 l/min σd = 60 l/min σd er større her fordi vi sammenlikner forskjellige personer og ikke samme personer. n = 2 (σ/ ) 2. C n = 2(60 / 30) 2. 7.9 n= 63 ( 126 totalt)

2 X 2 faktoriell design Fordeler: Kan teste to behandlingshypoteser uten å øke antall Få erfaring av kombinasjonen Ulemper: Problem med tolkning hvis det er tegn til interaksjon Praktiske begrensninger

Non-inferiority studier. Likeverdighet Spesielt ved legemidler: Nok å vise at medikamenter er like: Ved effektstudier ønsker å vise forskjell: Ho = behandlingene er ulike Ha = behandlingene er like Ho = intervensjons- og kontrollgruppene er like Ha = intervensjons- og kontrollgruppene er forskjellige

Utvalg versus populasjon Utvalg Populasjon

Hvor representativ er studiepopulasjonen? Generalisering / ekstern validitet

Referanser for beregning av utvalgsstørrelse Hein Stigum, FHI, UiO: http://folk.uio.no/heins/ Google Sample size, power, calculator http://stat.uiowa.edu/~rlenth/power/