Fra statistisk konklusjonsvaliditet til dataevalueringsvaliditet

Like dokumenter
Det er alltid feil i registreringer

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

Symposium: Selveksperimentering, selvendring og atferdsanalyse III inkludert MI, og fortsatt i startgropen Årsmøteseminaret NAFO 2014

Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal

Hvordan ser pasientene oss?

Dialogkveld 03. mars Mobbing i barnehagen

Innhold. Del 1 Grunnleggende begreper og prinsipper... 39

Juridiske aspekter ved publisering i åpne institusjonelle arkiv

Kapittel 1 Vitenskap: grunnleggende antakelser

Enighet og presisjon i registrering av data fra EFA. Lars Rune Halvorsen (Høgskolen i Akershus) & Jon A. Løkke (Høgskolen i Østfold)

Ph.d-utdanningen. Harmonisering av krav i Norden

Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2013

Hvordan kontrollere det ukontrollerte? Et ledelsesperspektiv. Geir Arild Engh-Hellesvik, Leder IPBR / KPMG Advisory 02.

Kritisk lesning og skriving To sider av samme sak? Geir Jacobsen. Institutt for samfunnsmedisin. Kritisk lesning. Med en glidende overgang vil denne

Psychology as the Behaviorist Views it. John B. Watson (1913).

Kurskategori 2: Læring og undervisning i et IKT-miljø. vår

Plagiat og PhD: Hva gjør man med det? Kunnskapsløs eller juksemaker? Plagiatsaker

EN Skriving for kommunikasjon og tenkning

Information search for the research protocol in IIC/IID

Perpetuum (im)mobile

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

ADDENDUM SHAREHOLDERS AGREEMENT. by and between. Aker ASA ( Aker ) and. Investor Investments Holding AB ( Investor ) and. SAAB AB (publ.

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

Metodisk kvalitetsvurdering av systematisk oversikt. Rigmor C Berg Kurs H, mars 2019

Samarbeidsbasert forskning er det mulig også i arbeidet med systematiske kunnskapsoversikter?

Implementeringen av ROP retningslinjen; er GAP analyser et

Elektronisk innlevering/electronic solution for submission:

Valg av metode og design

Hva har vi lagt merke til:

Beyond... Beyond gruppedesign og randomisering? N=1-designens muligheter utover gruppedesignen i evidenssammenheng. Beyond på hvilke måter?

Etablering av imitasjon ved å forsterke promptede responser. Espen Kåsa (Lørenskog kommune) og Kim Liland (STI) NAFO 14.mai kl. 16:00 16:45.

Univariate tabeller. Bivariat tabellanalyse. Forelesning 8 Tabellanalyse. Formålet med bivariat analyse:

Sikkert Drillingnettverk på CAT-D Rig

Regional forskingskonferanse for Psykiatri og rusfeltet Vår Olav M. Linaker PH, St. Olavs Hospital/INM, NTNU

CONSORT Consolidated Standards of Reporting Trials

SFI-Norman presents Lean Product Development (LPD) adapted to Norwegian companies in a model consisting of six main components.

Slope-Intercept Formula

Vekeplan 4. Trinn. Måndag Tysdag Onsdag Torsdag Fredag AB CD AB CD AB CD AB CD AB CD. Norsk Matte Symjing Ute Norsk Matte M&H Norsk

UNIVERSITETET I OSLO

Kapittel 10: Hypotesetesting

84 % er fornøyde med det tilbudet de får

Emneevaluering GEOV272 V17

Nærings-PhD i Aker Solutions

KVANTITATIV METODE. Marit Schmid Psykologspesialist, PhD HVL

TILLEGGSSPØRSMÅL BILLETT- OG ADMINISTRASJONSSYSTEM KINONOR AS COMPLEMENTARY QUESTIONS POINT OF SALE SOFTWARE PACKAGE KINONOR AS

MA2501 Numerical methods

Krav til analysekvalitet Forslag til fremgangsmåte

Luftfartstilsynets funn under virksomhetstilsyn.

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT mars 2015

Lovlig bruk av Cloud Computing. Helge Veum, avdelingsdirektør Cloud Inspiration Day, UBC

Bibliotekundervisningens fremtid nytt fokus på metodikk og digitalisering

Lovlig bruk av Cloud Computing. Helge Veum, avdelingsdirektør Difi, Oslo

Se vedlagte skisse som viser hvordan det er tenkt. Dette har også grunneier bekreftet til oss vil være ok.

Supplementary Materials for

Fremtidens kompetanser

SAMPOL115 Emneevaluering høsten 2014

Lære å tenke effektiv bruk av både CPU og minne når vi utvikler programvare. TOD 063: Datastrukturer og algoritmer, Kap.2

Den som gjør godt, er av Gud (Multilingual Edition)

Litteraturoversikter i vitenskapelige artikler. Hege Hermansen Førsteamanuensis

Forskningsrådets rolle som rådgivende aktør - innspill til EUs neste rammeprogram, FP9 og ERA

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

Feilsøking innen EKV. FLYTSKJEMA en strukturert tilnærming for å finne årsak til EKVavvik HVORFOR?

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT april 2016

Besvar tre 3 av følgende fire 4 oppgaver.

Kjønnsperspektiv I MNT utdanning og forskning

Informasjon om permittering og lønn

Kompetanse for omstilling

Enkel og effektiv brukertesting. Ida Aalen LOAD september 2017

Molare forsterkningsbetingelser

Administrasjon av postnummersystemet i Norge Post code administration in Norway. Frode Wold, Norway Post Nordic Address Forum, Iceland 5-6.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Undersøkelse om Skolefrukt

Exercise 1: Phase Splitter DC Operation

Eksperimentelle design

2. Forskningsdesign og sentrale begreper. I dag. Forskningsdesign: Valg i forskningsprosessen. MEVIT januar 2011.

«Best practice» ved bruk av makt og tvang. Pål-Erik Ruud / NAFO Dato:

Erfarenheter av Bilpooler i Oslo

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

FREMTIDENS SIKKERHETS- UTFORDRINGER

Assessing second language skills - a challenge for teachers Case studies from three Norwegian primary schools

FASMED. Tirsdag 21.april 2015

Nøtteknekkeren fem år etter

Innhold. Forord... 11

Hvor finner vi flått på vårbeiter? - og betydning av gjengroing for flåttangrep på lam på vårbeite

Trådløsnett med Windows XP. Wireless network with Windows XP

Arbeidsseminar som metode i opplæring av barnehagepersonell i Incidental Teaching. NAFO 5. mai 2007

Hvordan føre reiseregninger i Unit4 Business World Forfatter:

Fra tegnebrett til 2D/3D verktøy for plattform prosjektering.

Likhet i helsetjenesten

Naturomgivelser som helsefremmede faktor Ruth Kjærsti Raanaas, Post Doc. UMB, IPM

6350 Månedstabell / Month table Klasse / Class 1 Tax deduction table (tax to be withheld) 2012

Mathematics 114Q Integration Practice Problems SOLUTIONS. = 1 8 (x2 +5x) 8 + C. [u = x 2 +5x] = 1 11 (3 x)11 + C. [u =3 x] = 2 (7x + 9)3/2

Kritisk lesning og skriving To sider av samme sak?

Endringer i neste revisjon av EHF / Changes in the next revision of EHF 1. October 2015

17. desember 2015 kl December 2015 at (CET) 4. FORSLAG OM ENDRING AV VEDTEKTENE 5 4 PROPOSAL FOR CHANGE OF ARTICLES OF ASSOCIATIONS 5

Retten til behandling etter grove menneskerettighetsbrudd

Last ned Bunader og tradisjoner fra Setesdal - Laila Duran. Last ned

TDT4117 Information Retrieval - Autumn 2014

Småskalatesting og målinger. - stikkprøver og lek med tall??

Transkript:

Fra statistisk konklusjonsvaliditet til dataevalueringsvaliditet - og tilbake til validitetstypologien Jon A. Løkke (dosent i atferdsanalyse ved Høgskolen i Østfold)

Varighet i minutter Latenstid før elevene er inne etter pause 12 A 1 B 1 A 2 B 2 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Dager

Kort sagt I Validitetstypologien («Oversikt over 4 typer feil») til Cook & Campbell er et utmerket rammeverk for å analysere effekter av tiltak (og planlegge). Med gruppedesign blir effekten, forskjellen mellom det vi kan kalle betingelse A (kontroll eller kontrafaktisk betingelse) og betingelse B (eksperimentgruppe), analysert med statistiske prosedyrer. Statistiske prosedyrer og validitetstypen statistisk konklusjonsvaliditet (SKV) har vært lite aktuell i anvendt atferdsanalyse. Atferdsanalytikere har vært negative til statistiske prosedyrer og dermed også litt negative til generell kausal metodologi det er nok ikke lurt.

Kort sagt II Alternativet til statistiske prosedyrer og SKV er visuelle analyser og dataevalueringsvaliditet (DEV). Spørsmålet er: Hva skal til for at vi, ved å se på data, kan ha begrunnet tro på at et tiltak er effektivt? Hvilke validitetstrusler er aktuelle? Med dataevalueringsvaliditet kan vi takke «ja» til resten av validitetstypologien og nyte godt av kunnskap om kjente validitetstrusler. Atferdsanalyse kan knytte seg til vanlig epistemologi der det er mulig og lurt for atferdsanalysen.

Validitetstyper TYPER INDRE VALIDITET YTRE VALIDITET BEGREPS- VALIDITET? ÅRSAK; ER DET X 1, X 2 som fører til Y? Trusler HISTORIE MODNING INSTRUMENT- ERING TESTING STATISTISK REGRESJON SYKLISITET.. GENERALISERING MÅLING; operasjonalisering STATISTISK KONKLUSJONS- VALIDTITET RELASJON; ER B FORSKJELLIG FRA A? Grunner til at slutninger om samvariasjon mellom to variabler (X og Y) kan være feil a) Brudd på statistiske forutsetninger b)

Type-I & Type-II feil Nullhypotesen = ingen effekt (litt depressivt anlagt)... er sann... er falsk... og aksepteres Ok; korrekt godtakelse Type-II-feil; feilaktig godtakelse og vi oppdager ikke effekter som kan være viktige... og forkastes Type-I-feil; feilaktig avvisning og vi påstår effekt uten grunner Ok; korrekt avvisning

Mecca Chiesa (1994) og veien til «Radical Behaviorism» «When we were instructed, on the basis of a significance test, to assert, «Event x affects behavior in this way,» I protested that measures from some of the subjects in the group (often including my own) contradicted this assertion. How could I claim to have demonstrated a scientific fact when I could see in my own data that it did not hold, that it simply did not apply to some of the individuals involved in the experiment?» (s. vi)

Author Guidelines PREPARATION OF MANUSCRIPTS FOR JABA SUBMISSION INFORMATION Manuscripts should be submitted electronically in Word (.doc) format to the ScholarOne website: http://mc.manuscriptcentral.com/jaba. Research Articles The primary focus of JABA continues to be Research Articles of social importance. Both individual and group designs are appropriate, but in intervention studies, data on individual variation should be included. Further, the clinical significance of the effect on individuals should be discussed. In most cases, direct measures of behavior will be critical for acceptance, but in some instances, self-reports (e.g., headaches) will be acceptable, especially when such studies bear on issues relevant to types of interventions that might be used in applied behavior analysis. Use the following guidelines when preparing research articles (adapted from the APA manual, 6th Ed):

RCT

Varighet i minutter Latenstid før elevene er inne etter pause 12 A 1 B 1 A 2 B 2 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Dager

Dataevalueringsvaliditet (DEV) og trusler For mye variasjon i data Andre variabler enn X Slingrefeil (reliabilitet) Dårlig behandlingsintegritet Biologisk variasjon Sykluser av ulik art Trender i data Andre variabler enn X; reaktivitet Ønsket eller uønsket Utilstrekkelig med data Ett punkt kan være nok, men hva med fem? Uklare mønster Kan skyldes variasjon, trending og utilstrekkelig med data Mønsterproblemet: «Jeg elsker deg på en måte»

Hvor skal vi se I? Innen enkeltfaser; A & B Antall datapunkter (5)? Stabilitet eller variasjon? (Sentraltendens (snitt, median + variasjonsbreddeliner) Trend innen faser? (mer data)

Hvor skal vi se II? Over (sml.) ulike faser; A 1, B 1 Nivå (stor forskjell ønsket) Latens Trend (god effekt ved dramatisk endring) Konsistens (konsistens i «minireplikasjoner» indikerer effekt) Grad av overlapp

Hvor skal vi se III? Mellom (sml.) like faser; A 1, A 2 Konsistens innen like faser (eksperimentell kontroll)

Fritidsaktivitet (oppgaveanalyse) 1. Henter radio og blad 2. Sitter i lenestolen 3. Skrur på radio 4. Velger stasjon 5. Setter på hodetelefoner riktig vei* 6. Leser 7. Stopper på signal 8. Tar av hodetelefoner 9. Skrur av radio 10. Legger vekk radio og blad*

Fordeler med den mer avanserte visuelle fremstillingen Kan identifisere feil; steg 2 trenger ikke trening steg 6 kan bli vanskelig i fremtiden Funksjonell gjennomføring kan skje ved 80 % mestring (- steg 5 & 10) Mønsteret hjelper til å kartlegge vanskelige steg (feilmønster) Et funksjonelt kriterium kan anlegges

Syv deskriptive og preskriptive dimensjoner med relevans for måling i anvendt atferdsanalyse 1. Anvendt 2. Atferdsorientert (BV) 3. Analytisk (IV) 4. Teknologisk (BV) 5. Konseptuelt systematisk (BV/YV) 6. Effektiv (DEV) 7. Generaliserbar (YV)