Eksperimentelle design



Like dokumenter
Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal

Oppsummering & spørsmål 20. april Frode Svartdal

Innhold. Del 1 Grunnleggende begreper og prinsipper... 39

Kapittel 1 Vitenskap: grunnleggende antakelser

STUDIEÅRET 2013/2014. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Fredag 25. april 2014 kl

Noen momenter ved vurdering av eksamen PSY1010 PSYC1100 våren 2019.

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT mars 2015

STUDIEÅRET 2012/2013. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 27. august 2013 kl

FORSKNINGSMETODE NOEN GRUNNLEGGENDE KONSEPTER

Noen momenter ved vurdering av eksamen PSY1010 PSYC1100 høsten 2018.

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT april 2016

Repeated Measures Anova.

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 25. august 2015 kl

Forskningsmetoder. Måling, målefeil. Frode Svartdal. UiTø V Frode Svartdal FRODE SVARTDAL 1

Slutninger fra data FRODE SVARTDAL UIT 2015

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

Oppgåver Oppgåvetype Vurdering Status. 1 DEL 1 Vitenskapsteori Skriveoppgave Manuell poengsum Levert

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Forskningsmetoder. Data: Måling og målefeil. Frode Svartdal. UiTø FRODE SVARTDAL 1 V Frode Svartdal

KVANTITATIV METODE. Marit Schmid Psykologspesialist, PhD HVL

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Mandag 13. april 2015 kl

STUDIEÅRET 2012/2013. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Onsdag 24. april 2013 kl

Oppgåver Oppgåvetype Vurdering Status. 1 DEL 1 Vitenskapsteori Skriveoppgave Manuell poengsum Levert

Oppgåver Oppgåvetype Vurdering Status. 1 DEL 1 Vitenskapsteori Skriveoppgave Manuell poengsum Levert

Epidemiologi - en oppfriskning. Epidemiologi. Viktige begreper Deskriptiv beskrivende. Analytisk årsaksforklarende. Ikke skarpt skille

Forsterkerkartlegging

1 10-2: Korrelasjon : Regresjon

Pilot folkehelseundersøkelser i fylkene statistiske utfordringer. Rune Johansen, Nasjonalt folkehelseinstitutt Kristiansand 4.

Kausalanalyse og seleksjonsproblem

Epidemiologi - en oppfriskning. En kort framstilling. Er det behov for kunnskaper om epidemiologi?

6.2 Signifikanstester

Forskningsmetoder i menneske-maskin interaksjon

Utvalgsstørrelse, styrke

Prosjektbeskrivelsen består av

Kan vi stole på resultater fra «liten N»?

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Innhold. Forord... 11

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Introduction to the Practice of Statistics

2. Forklar med egne ord de viktigste forutsetningene for regresjonen og diskuter om forutsetningene er oppfylt i oppgave 1.

Kapittel 3: Studieopplegg

Sjekkliste for vurdering av en kasuskontrollstudie

Lineære modeller i praksis

Statistikk er begripelig

Resultater, studentundersøkelsen Frode Svartdal UiT / Diakonhjemmet Høgskole

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Prokrastinering. Frode Svartdal MASTER 11. september 2017

Etablering av Discrete Trials Teaching trenerferdigheter ved bruk av videokonferanse. Hay-Hansson & Eldevik

Tabell 1: Antallet besøkende pasienter og gjennomsnittlig ventetid i minutter (fiktive data).

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

SJEKKLISTE FOR VURDERING AV EN RANDOMISERT KONTROLLERT STUDIE (RCT)

Samfunnsvitenskapelig metode. SOS1120 Kvantitativ metode. Teori data - virkelighet. Forelesningsnotater 1. forelesning høsten 2005

Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable

Prosjektbeskrivelsen består av

Diskusjonsoppgaver Hvilke fordeler oppnår man ved analytisk evaluering sammenliknet med andre tilnærminger?

effekter av forebyggende psykisk helsearbeid i videregående skole et longitudinelt intervensjonsstudie med Solomons design Bærum DPS

Repeterte målinger. Repeterte målinger. Eirik Skogvoll

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Komplekse intervensjoner Metodiske utfordringer. Liv Wensaas PhD, RN, Leder for FOU enheten Helse og omsorg Asker kommune

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

Sosial ferdighetstrening basert på ART

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Behandling av data bli treffsikker!

Det er alltid feil i registreringer

Undersøkelse om utdanning

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Vurdering av kvaliteten på undersøkelser om virkninger av trafikksikkerhetstiltak

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Kapittel 3. Datainnsamling Dataproduksjon

SJEKKLISTE FOR VURDERING AV EN RANDOMISERT KONTROLLERT STUDIE (RCT) Målgruppe: studenter og helsepersonell Hensikt: øvelse i kritisk vurdering

Statistikk og dataanalyse

Oppgave 13.1 (13.4:1)

Detaljerte forklaringer av begreper og metoder.

Eksamensoppgave i (emnekode) (emnenavn)

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2006

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

Psykososiale målemetoder og psykometri.

7.2 Sammenligning av to forventinger

Bruk data fra tabellen over (utvalget) og opplysninger som blir gitt i oppgavene og svar på følgende spørsmål:

Sjekkliste for vurdering av en randomisert kontrollert studie (RCT)

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

EKSAMEN I PSY1001/PSY1011/PSYPRO4111/ PSYKOLOGIENS METODOLOGI HØSTEN 2012 BOKMÅL

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Eksamensoppgave i PSY1011/4111 Psykologiens metodologi

Sensorveiledning SOS1120 vår

Fra idé til publikasjon

Forkurs i kvantitative metoder ILP 2019

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Utsatt individuell skriftlig eksamen. STA 400- Statistikk

EN PROFIL AV SPANSKLÆRERE I NORSK SKOLE: HVA MENER ELEVENE? HVORDAN PÅVIRKER LÆREREN ELEVENES MOTIVASJON?

Verdens statistikk-dag.

Eksamensoppgave i PSYPRO4064 Klinisk psykologi II

ARBEID MED FORSTERKNING

Inferens i fordelinger

UNIVERSITETET I OSLO

Tidlig innsats for barn i risiko (TIBIR): Positive effekter i barnehage og skole? John Kjøbli

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Transkript:

Eksperimentelle design Frode Svartdal UiTø April 2015 Frode Svartdal

Eksperimentelle design Design = plan for en undersøkelse, her eksperiment Eksperimenter har som hensikt å dokumentere at variabler har kausal effekt på andre variabler The experiment is a matter of logic, not of location.

Eksperimentet Kjennetegn: Manipulasjon av uavhengige variabler Måling av effekt av denne manipulasjonen på avhengige variabler Kontroll for at andre forhold ikke påvirker den avhengige variabel Confounding variabler Annet

Eksperimentet: Sentrale begreper Manipulasjon av UV, måling av AV Kontroll, randomisering Indre validitet, confounding Signifikans, effektstørrelse Type I og Type II feil i statistiske slutninger Power

Eksperimentet: Design Mellomgruppe-design: Ulike grupper av eltakere inngår i hver betingelse Flere varianter! Innen-gruppe: Samme gruppe eksponeres for ulike betingelser i eksperimentet Mixed design: Mellomgruppe + innengruppe Kvasi-eskperimentelt design: Ligner på eksperiment (manipulasjon), men NOE mangler N=1: En deltaker undersøkes om gangen

Eksperimentelle design Samme problemstilling kan undersøkes på ulike måter (ulike design) Design som velges avhenger av mange faktorer (praktisk, teoretisk, ) Hovedhensikt: Trekke slutning om kausal variabel på en mest mulig sikker måte (dvs. ingen confounding variabler truer vår konklusjon)

Indre validitet og confounding Kan vi påvise kausalitet, dvs. at en variabel påvirker en annen? Et eksperiment er indre valid når slik kausalitet påvises Eksperimenter kontrollerer for mulig effekt av tredje-variabler, og kan derfor ivareta kravet om indre validitet Confounding foreligger når man er i tvil om eksperimentet faktisk kontrollerer for en gitt tredjevariabel

Eksperimentelle design MANIPULASJON OG KONTROLL Arrangere ulike nivåer av uavhengig variabel Gjøre dette i en kontekst hvor andre forhold ikke varierer systematisk

Variasjon i data Prinsipielt sett tre kilder: 1. Tilfeldig variasjon variasjon som ikke kan tilskrives noen manipulert faktor Eks.: Variasjon mellom individer gir forskjeller i prestasjon 2. Systematisk variasjon som kan tilskrives en manipulert faktor Eks.: Variasjon i prestasjon som følge av høy vs. lav motivasjon 3. Systematisk variasjon som kan tilskrives confounding (forstyrrende) variabler Eks.: Variasjon i prestasjon som følge av testing om morgen vs. ettermiddag (men tidspunkt er ikke med i designet)

Design med uavhengige grupper

Uavhengige grupper Deltakere fordeles tilfeldig til to eller flere grupper (randomisering) Manipulasjonen(e) innføres på gruppenivå Effekt måles ved å sammenligne grupper

Uavhengige grupper Når foretrekkes design med uavhengige grupper? Ofte! Når vi har lett tilgang på deltakere Når vi antar at deltakerne ikke er veldig forskjellige på relevante variabler Kan løses ved matching Når det er en fordel eller et krav at forsøkspersonen er naiv for betingelsene i eksperimentet

Randomisering Populasjon utvalg Ikke alltid tilfredsstilt i eksperimentell forskning: Vi bruker folk som er lett tilgjengelige (eks. studenter) Kreves i undersøkelser der utvalget skal være representativt for populasjonen Randomisert fordeling betingelser Ufravikelig krav i eksperimenter. Forskjeller mellom deltakere blir ikke borte, men de utvannes på gruppenivå

Matching Mål: Aggresjon Vi vet at det er stor variasjon i aggresjon mellom folk Vi rangerer deltakere i kategorier (lav, middels, høy) jfr. presjekk To med høy i et par Tilfeldig fordeling til betingelsene Sikrer rimelig like grupper på relevant variabel, men samtidig randomisering

Kjennetegn ved gruppedesign Uavhengige grupper Mellomgruppe-design Unike personer i hver betingelse Enkel randomisering vanligst Matchet randomisering hvis det er store forskjeller mellom deltakerne

Post-test design R E K Manipulasjon X Test Enkelt, rimelig, godt!

Post-test design Problemstilling: Kan subliminale stimuli påvirke humøret vårt? Manipulasjon: Stimuli som ikke registreres bevisst (presentert < 50 ms) Manipulasjon Test E kreft, kakerlakk, K tre, skrivebord, Humør negativt Humør nøytralt Jfr. Chartrand & Bargh (2000); S & P, s. 185

Data-analyse Deltakere (24) Betingelser (negativ og nøytral) Humør

VURD Data-analyse t (22) = -2,92, p = 0,008 36 34 32 30 Box & Whisker Plot: VURD Snitt nøytr: 27,7 Snitt neg: 16,9 28 26 24 22 20 18 16 14 12 NEG MANIP NOYT Mean Mean±SE Mean±1,96*SE

Data-analyse t-test Variasjon som tilskrives betingelsene i eksperimentet systematisk variasjon i data usystematisk variasjon i data Variasjon som ikke tilskrives betingelsene i eksperimentet

Pre-test post-test R E K Pretest Manipulasjon X Test + Sjekk av gruppene før manipulasjon + Info om grunner til mortalitet - Pretest kan gi info om hypotese, manipulasjon

Pre-test post-test Problemstilling: Virker hypnose av røykere på røykekutt? Manipulasjon: Posthypnotisk suggesjon: Du klarer å slutte å røyke vs. nøytral Pretest Manipulasjon Test E Sjekk Du klarer å slutte å røyke Røyking? K Sjekk Du er en god sjåfør Røyking? Mål på variabler av betydning for røykekutt. Hvilke?

Aktivering Faktorielle design To eller flere variabler (faktorer) manipuleres i samme design Oppgavetype Enkel Vanskelig Høy Gr. 1 Gr. 2 Lav Gr. 3 Gr. 4 Merk: Uavgengige grupper i hver betingelse Hver gruppe får en unik kombinasjon av faktorene Deltakerne fordeles tilfeldig til betingelsene

Faktorielle design Unike individer i hver betingelse: Randomisering Hver gruppe får en unik kombinasjon av de to faktorene Gruppe 1: Høy aktivering + enkel oppgave Gruppe 2: Høy aktivering + vanskelig oppgave Gruppe 3: Lav aktivering + enkel oppgave Gruppe 4: Høy aktivering + vanskelig oppgave

Faktorielle design Hovedeffekter Hva betyr hver av de to faktorene hver for seg? Aktivering? Oppgavetype? Interaksjonseffekt Hvordan samspiller de? Effekten av en variabel påvirkes av nivåer på en annen variabel Virker aktivering forskjellig, avhengig av om oppgaven er vanskelig eller lett?

Faktorielle design Hovedeffekt av aktivering 30 25 20 (30+16)/2 =23 15 10 5 Lett Vanskelig (14+22)/2 =18 0 Høy akt. Lav akt.

Faktorielle design Hovedeffekt av oppgavetype 30 (30+14)/2 = 22 25 20 15 10 Lett Vanskelig 5 0 Høy akt. Lav akt. (16+22)/2 = 19

Faktorielle design Effekt av aktivering avhenger av oppgave: Interaksjonseffekt aktivering og oppgavetype 30 25 20 15 10 Lett Vanskelig 5 0 Høy akt. Lav akt.

Faktorielle design To eller flere uavhengige variabler Aktivering, oppgavetype, kjønn, alder, Enkleste form: 2 X 2 design (Aktivering x oppgavetype) Komplekse former: Flere faktorer, flere nivåer på hver faktor Egentlig det samme som å kjøre separate eksperimenter med en uavhengig variabel i hvert, bortsett fra Fordel?

Faktorielle design Antall faktorer (variabler) = mulige hovedeffekter Kjønn mulig hovedeffekt Motivasjon mulig hovedeffekt Hver faktor kan inngå i interaksjon med de andre faktorene Kjønn * motivasjon

Faktorielle design Faktorer: Kjønn (SEX); motivasjon (MOT) Avhengig mål: Prestasjon (PREST) Datafilen er organisert slik; det er 12 deltakere i dette eksemplet

Statistisk analyse Prediktorvariabler Avhengig variabel

Statistisk analyse F = Signal: Variasjon Mellom gruppene Støy: Variasjon mellom individene

PREST Faktorielle design Ingen hovedeffekt av kjønn 36 Current effect: F(1, 8)=,49370, p=,50221 34 32 30 28 26 24 22 20 18 K SEX M

PREST Faktorielle design Signifikant effekt av motivasjon 50 Current effect: F(1, 8)=31,597, p=,00050 45 40 35 30 25 20 15 10 5 L MOT H

PREST Faktorielle design Ikke signifikant interaksjon SEX * MOT 50 SEX*MOT Current effect: F(1, 8)=1,2191, p=,30163 45 40 35 30 25 20 15 10 5 0 K NB!!! Lav power!!!!!!!!!! SEX M MOT L MOT H

Within-subjects (innen-gruppe) E Pretest Manip. Test Test Test

Within-subjects (innen-gruppe) Effekt av manipulasjon: Skoleklasse sosial ferdighetstrening sjekk etter 1, 2, 3, mnd. 60 50 Nivå etter 40 Nivå før 30 20 10 0 Pretest MANIP test2 test3 test4 test5

Repeterte målinger Innen-gruppe-design ( within groups ) Samme deltakere i alle betingelsene Fordeler: Trenger færre forsøkspersoner Mindre variasjon som skyldes variasjon mellom personer, dvs. lettere å oppdage eksperimentell effekt Ulemper Order-effects: Rekkkefølgen på betingelsene kan ha betydning Løsning: Motbalansering Carry-over-effekter: Effekt av en betingelse kan påvirke neste betingelse Løsning: Øke tid mellom betingelsene

Motbalansering Problemstilling: Har mørketiden en negativ effekt på kognisjon? Mål: Ulike kognitive oppgaver Testtidspunkt: Sommer og vinter 100 deltakere Testing Problem: Har rekkefølge på testtidspunktene en effekt? Løsning: Gruppe 1 (50): Sommer vinter Gruppe 2 (50): Vinter sommer Data Sommer = data fra 1. gangs testing i Gruppe 1 og 2. gangs testing i Gruppe 2 Vinter = data fra 2. gangs testing i Gruppe 1 og 1. gangs testing i Gruppe 2

Mixed design Dvs: Både manipulasjon mellom grupper og innen hver gruppe E Pretest Manip. Test Test Test K Pretest Test Test Test

Mixed design Tolman & Honzik, 1930: Rotter (tre grupper), læring i labyrint, 17 dager, en test per dag E 1 Test B Test B Test B Test B Test B Test B 17 E 2 Test Test Test Test B 11 Test B Test B Test B 17 K Test Test Test... Test 17

Tolman & Honzik, 1930 Bel. fra dag 11 Kontroll Bel. hele tiden

Kvasi-eksperimentelle design Ikke randomisering Skoleklasse A vs. skoleklasse B Prøveordning i Tromsø vs. Harstad Ikke kontrollgruppe Dvs. randomisering mangler Comparison group

Kvasi-eksperimentelle design Problemstilling: Virker tiltak X fartsdempende på en bestemt veistrekning? Tiltak (manipulasjon): Nytt skilt 50 45 40 35 30 25 20 15 10 5 0 Fart Tiltak

Kvasi-eksperimentelle design Hva kan vi gjøre for å sannsynliggjøre at det er TILTAK som gir observert effekt? Tidspunkt for tiltak Sammenligning med tilsvarende situasjoner

Kvasi-eksperimentelle design Viktige sjekkpunkter: 1. Endring i gjennomsnitt Snitt før vs. snitt etter tiltak: 55 vs. 42 2. Endring i nivå Nivå dagen før tiltak vs. nivå dagen etter osv. 3. Endring i tendens Synkende, stigende, 4. Latenstid for endring Hvor kjapt ses en evt. endring etter tiltaket?

Design med enkeltindivider

N=1-design A B A B A = observasjonsfase, B = tiltaksfase Multiple baseline To uavhengige atferdsformer behandles på ulike tidspunkter Changing criterion Krav til målatferd skjerpes gradvis Individet er sin egen kontroll

ABA Barnehage; Anne (4) leker for lite med andre barn A (observasjonsfase) Anne leker mye alene voksne kommer til (forsterker denne atferden) Anne leker lite med de andre barna B (tiltaksfase) Anne leker alene ignoreres Anne leker med andre barn forsterkes A (ny observasjonsfase) Anne leker mindre alene, mer med de andre barna

N=1 Kontroll for effekt? Tid; personene egen atferd under ulike betingelser Eksperiment Ja! Fordi vi har manipulasjon + kontroll

Multiple baseline Målatferd Verbal aggresjon Fysisk aggresjon Begge observeres Målatferd 1 utsettes for tiltak Målatferd 2 utsettes for tiltak Differensiell effekt = dokumentasjon av eksperimentell kontroll

Multiple baseline 25 20 15 10 Verbal Fysisk 5 0 t1 t2 t3 t4 t5 t6 Tiltak verbal Tiltak fysisk

Changing criterion 15 10 5 20 18 16 14 12 10 8 6 4 2 0 t1 t2 t3 t4 t5 t6 t7 t8 t9 t1 Kaffekopper

Problemer med tolkning Historie: Mye skjer mellom de to testtidspunktene i tilllegg til manipulasjonen Modning: Folk endres over tid Testing: Testing ved T1 endrer testsituasjonen ved T2 Instrumentering: Målemetoden(e) kan endres Statistisk regresjon Mortalitet: Frafall fra undersøkelsen Utvanning mellom betingelsene