Forskningsmetoder i menneske-maskin interaksjon

Like dokumenter
Eksamen PSY1011/PSYPRO4111: Sensorveiledning

6.2 Signifikanstester

Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal

Verdens statistikk-dag.

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Komplekse intervensjoner Metodiske utfordringer. Liv Wensaas PhD, RN, Leder for FOU enheten Helse og omsorg Asker kommune

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

STUDIEÅRET 2013/2014. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Fredag 25. april 2014 kl

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Kapittel 3: Studieopplegg

Introduksjon til inferens

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010 (20)

Forskningsmetoder i menneske-maskin interaksjon (MMI)

GRUPPE 5, UKE 11 EVALUERING IN1050

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

TMA4240 Statistikk H2010 (19)

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Oppsummering & spørsmål 20. april Frode Svartdal

FORSKNINGSMETODE NOEN GRUNNLEGGENDE KONSEPTER

Effektstørrelse. Tabell 1. Kritiske verdier for Pearson s produkt-moment-korrelasjon med 5% og 1% signifikansnivå. N 5% 1% N 5% 1%

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Mandag 13. april 2015 kl

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

STUDIEÅRET 2012/2013. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 27. august 2013 kl

SCRIBE The Single-Case Reporting Guideline In BEhavioural Interventions

TMA4245 Statistikk Eksamen desember 2016

Hypotesetest: generell fremgangsmåte

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Introduction to the Practice of Statistics

ST0202 Statistikk for samfunnsvitere

Testobservator for kjikvadrattester

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

3. Multidimensjonale tabeller. SOS1120 Kvantitativ metode. Årsaksmodeller. Forelesningsnotater 8. forelesning høsten 2005

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

Eksamensoppgave i TMA4240 Statistikk

Hva er evidens? Eva Denison

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Kapittel 10: Hypotesetesting

Komparative design. Forelesning 12 Mer om kvantitative forskningsdesign. Sammenligninger av to eller flere case i rom og tid

Forskningsmetoder. INF1050: Gjennomgang, uke 13

Kapittel 9 og 10: Hypotesetesting

Eksamensoppgave i TMA4240 Statistikk

Skoleeksamen i SOS Kvantitativ metode

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Statistikk og dataanalyse

ME Metode og statistikk Candidate 2511

i x i

ST0202 Statistikk for samfunnsvitere

Tema Kvalitativ og kvantitativ forskningsmetode. Forskningsmetode. Kausalitet. Reliabilitet og validitet. Usikkerhet. IA mandag 5/9-2014

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

Løsning eksamen desember 2017

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

KVANTITATIV METODE. Marit Schmid Psykologspesialist, PhD HVL

Om betydningen av offentlig informasjon om behandlingsbeslutninger.

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Kapittel 1 Vitenskap: grunnleggende antakelser

TMA4245 Statistikk Eksamen desember 2016

CAG repetisjoner og gråsonen

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT mars 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Innhold. Del 1 Grunnleggende begreper og prinsipper... 39

EKSAMENSOPPGAVE KLH3004 Medisinsk statistikk (Medical statistics) KLMED8004 Medisinsk statistikk, del I (Medical Statistics, Part I)

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT april 2016

TMA4240 Statistikk Høst 2015

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Kapittel 9 og 10: Hypotesetesting

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

EKSAMEN 4016/4016N VITENSKAPSTEORI OG NATURSYN. Tid : 1 time (9-10)

Definisjoner av begreper Eks.: interesse for politikk

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

UNIVERSITETET I OSLO

Hypotesetesting. mot. mot. mot. ˆ x

Eksamensoppgave i samfunnsfaglig forskningsmetode 16. mai 2003

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Kapittel 7: Inferens for forventningerukjent standardavvik

EKSAMEN I PSY1001/PSY1011/PSYPRO4111/ PSYKOLOGIENS METODOLOGI HØSTEN 2012 BOKMÅL

ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

- The dynamic of Distribution Processes and Decision-Making in Foundations -

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksperimentelle design

TMA4240 Statistikk Høst 2016

Allmenndel - Oppgave 2

HCI, Interaksjon, grensesnitt og kontekst. Intervju, spørsmålstyper og observasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 25. august 2015 kl

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

ÅMA110 Sannsynlighetsregning med statistikk, våren

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

SJEKKLISTE FOR VURDERING AV EN RANDOMISERT KONTROLLERT STUDIE (RCT)

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Transkript:

Forskningsmetoder i menneske-maskin interaksjon Kapittel 2- Eksperimentell forskning

Oversikt Typer atferdsforskning Forskningshypoteser Grunnleggende om eksperimentell forskning Signifikanstesting Begrensninger i eksperimentell forskning

Typer atferdsforskning Beskrivende undersøkelser fokuserer på å bygge en nøyaktig beskrivelse av hva som skjer. Relasjonelle undersøkelser gjør det mulig for forskeren å identifisere relasjoner mellom flere faktorer. Imidlertid kan relasjonelle studier sjelden fastslå årsakssammenheng mellom flere faktorer. Eksperimentell forskning tillater etablering av årsakssammenheng.

Typer atferdsforskning

Forskningshypotese Et eksperiment starter normalt med en prosjekthypotese. En hypotese er en presis problemuttalelse som kan testes gjennom en empirisk undersøkelse. Sammenlignet med en teori, er en hypotese et mindre, mer fokusert, utsagn som kan undersøkes av et enkelt eksperiment.

Hypotesetyper Nullhypotesen: sier vanligvis at det er ingen forskjell mellom eksperimentelle behandlinger. Alternativ hypotese: en setning som er gjensidig utelukkende med nullhypotesen. Målet med et eksperiment er å finne statistisk bevis for å avkrefte eller forkaste nullhypotesen og dermed støtte den alternative hypotesen. En hypotese bør angi uavhengige variabler og avhengige variabler.

Avehngige og uavhengige variabler Uavhengige variabler (IV) refererer til faktorer som forskerne er interesserte i å studere, eller den mulige "årsaken" av endringen i den avhengige variabelen. IV er uavhengig av en deltakers atferd. IV er vanligvis behandlinger eller forhold som forskerne kan kontrollere. Avhengige variabler (DV) refererer til utfallet eller effekten som forskerne er interessert i. DV er avhengig av en deltakers atferd eller endringer i IVer. DV er vanligvis resultatene som forskerne trenger å måle.

Typiske uavhengige variabler I MMI De som er knyttet til teknologi Typer teknologi eller maskiner (apparater, redskaper) Typer design De som forholder seg til brukere: alder, kjønn, erfaring med datamaskiner, profesjon, utdanning, kultur, motivasjon, humør og funksjonshemninger De som er knyttet til brukskonteksten: Fysisk status Bruker status Sosial status

Typiske avhengige variabler I MMI Effektivitet: f.eks, oppgavens ferdigstillelsestid, hastighet Nøyaktighet : f.eks, antall feil Subjektiv tilfredshet: f.eks, Likert skala graderingen Enkelhet av læring og retensjon (hukommelse) Fysisk eller kognitiv etterspørsel: f.eks, NASA oppgavemengde indeks NASA task load index

Komponenter av eksperimentet Fremgang, eller vilkår: de forskjellige teknikkene, enhetene eller prosedyrene som vi ønsker å sammenligne. Enheter: gjenstanden som blir utsatt for eksperimentell behandling. I MMI forskning er enhetene vanligvis mennesker med spesifikke egenskaper, som kjønn, alder eller dataerfaring. Tildelingsmetode: måten de eksperimentelle enhetene blir tildelt forskjellige behandlinger.

Randomisering Randomisering: tilfeldig tildeling av oppdrag til de eksperimentelle enheter eller deltakere. I en helt randomisert eksperiment vil ingen, inkludert forskerne selv, kunne forutsi tilstanden som en deltaker vil bli tildelt. Randomiseringsmetoder Preprosesseringsmetoder Randomiseringsmatrise Software drevet randomisering

Signifikanstest Hvorfor trenger vi signifikanstester? Når alle verdiene av elementene i sammenligningsgruppene er kjente, kan du sammenligne dem direkte, og trekke en konklusjon. Ingen signifikanstest er nødvendig ettersom det ikke er usikkerhet involvert. Når befolkningen er stor, kan vi bare prøve et utvalg mennesker fra hele befolkningen. Signifikanstester tillater oss å avgjøre hvor sikre vi er på at resultatene som er observerte fra prøve-utvalget kan generaliseres til hele befolkningen.

Type I og Type II feil Alle betydning tester er underlagt risikoen for Type I og Type II feil. En Type I feil (også kalt α feil eller en "falsk positiv") refererer til den feilen å forkaste nullhypotesen når den er sann. En Type II feil (også kalt β feil eller en "falsk negativ") refererer til den feilen å ikke forkaste nullhypotesen når den er usann og dermed bør avvises.

Type I og Type II feil

Type I og Type II feil Det er generelt antatt at Type I feil er verre enn Type II feil. Statistikere kaller Type I feil en feil som involverer "godtroenhet". En Type I feil kan resultere i en tilstand verre enn den nåværende tilstanden. Type II-feil er feil som involverer "blindhet" En Type II feil kan forårsake at man mister muligheten til å forbedre nåværende tilstand.

Kontroll av feil-risiko I statistikk blir sannsynligheten for å gjøre en Type I feil kalt alfa (eller signifikansnivå, p- verdi). Sannsynligheten for å gjøre Type II feil kalles beta. Den statistiske styrken til en test, definert som 1-β, refererer til sannsynligheten for vellykket avvisning av en nullhypotese når den er usann og bør avvises.

Kontroll av feilrisiko Alfa og beta er ikke uavhengige verdier. Det å redusere alfa reduserer sjansen for Type I feil, men øker sjansen for Type II feil. I eksperimentell forskning, er det generelt antatt at Type I feil er verre enn Type II feil. En meget lav p-verdi (0,05) er allment brukt som en verdi som kontrollerer forekomsten av Type I feil.

Begrensninger av eksperimentell forskning Eksperimentell forskning krever veldefinerte, testbare hypoteser som består av et begrenset antall avhengige og uavhengige variabler. Eksperimentell forskning krever streng kontroll av faktorer som kan påvirke de avhengige variablene. Lab-baserte eksperimenter kan er ofte ikke en god representasjon av brukernes typiske interaksjonsatferd.

Slutten av kapittelet Oppsummering Diskusjon Øvelse

Individuell oppgave En e-handel har bestilt 3 nye, forskjellige webløsninger. De har bestemt seg å teste de med 30 deltagere og implementere den beste. 1) Hvordan ville du velge de deltagerene? 2) Formuler noen null og alternative hypoteser og gi eksempel på noen fornuftige avhengige og uavhengige variabler. 3) Hvordan ville du tildele oppgavene for deltakerne slik at du ungår feil (læringseffekt og andre) 4) Kan du få noen feil av Type I aller II? Gi eksempel eller forklaring på hvorfor kan du ikke gjøre det.