INF1500 Høst 2016 Magnus Li Martine Rolid Leonardsen EVALUERING / DECIDE

Like dokumenter
Diskusjonsoppgaver Hvilke fordeler oppnår man ved analytisk evaluering sammenliknet med andre tilnærminger?

INF1500 Høst 2015 Magnus Li Martine Rolid Leonardsen. Evaluering

Evaluering vol. 1. Plenum IN1050 Uke 11 Maria og Helle

Evaluering vol. 2. Plenum IN1050 Uke 12 Maria og Helle

INF Introduksjon til design, bruk, interaksjon Evaluering del 2

INF Introduksjon til design, bruk, interaksjon Evaluering, del 2

INF Introduksjon til design, bruk, interaksjon Evaluering del 2

FORSKNINGSMETODE NOEN GRUNNLEGGENDE KONSEPTER

Repetisjon. Plenum IN1050 Uke 14 Maria og Helle

GRUPPE 5, UKE 11 EVALUERING IN1050

Evaluering. INF 1500; introduksjon 9l design, bruk og interaksjon 24 oktober 2011

Sist oppdatert: 18.november Øvelsesoppgaver til INF1500

UNIVERSITETET I OSLO

UKE 2 Forstå bruk/ datainnsamling. Plenum IN1050 Julie og Maria

Design, bruk, interaksjon

UNIVERSITETET I OSLO

Gjennomgang - prøveeksamen. Plenum IN1050 Maria og Helle

UNIVERSITETET I OSLO

INF1500 Høst 2015 Magnus Li Martine Rolid Leonardsen. Design og prototyping

INF Introduksjon til design, bruk, interaksjon Evaluering, del 1

HCI, Interaksjon, grensesnitt og kontekst. Intervju, spørsmålstyper og observasjon

Datainnsamling. Gruppetime 15. Februar Lone Lægreid

UNIVERSITETET I OSLO

STUDIEÅRET 2012/2013. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Onsdag 24. april 2013 kl

Innhold. Login. Påvirkningskraft som kvalitetskriterium Forskjeller mellom evalueringsmetoder? En til? Kanskje litt vanskeligere denne

Introduksjon til kurset

STUDIEÅRET 2012/2013. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 27. august 2013 kl

UNIVERSITETET I OSLO

INF Introduksjon til design, bruk, interaksjon Evaluering

INF Introduksjon til design, bruk, interaksjon Evaluering

CHAPTER 11 - JORUN BØRSTING, ANALYZING QUALITATIVE DATA

Interaksjonsdesign Utvikling for og med brukere

Notater: INF1510. Veronika Heimsbakk 20. mai 2015

Sist oppdatert: 10.november Ukesoppgaver til INF1500 (Uke 1-13)

Introduksjon til kurset

UKE 7 Design og prototyping. Plenum IN1050 Julie og Maria

UKE 4 Analyse. Plenum IN1050 Julie og Maria

STUDIEÅRET 2013/2014. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Fredag 25. april 2014 kl

Children s search on web

Hjernetrim. Hva er det?

INF Introduksjon til design, bruk, interaksjon Evaluering del 1

Prototyping. Plenumstime Uke 6. Med Maria og Helle

Ulike metoder for bruketesting

INF1500 Høst 2015 Magnus Li Martine Rolid Leonardsen. Utviklingsprosesser & krav og behov

INF Introduksjon til design, bruk, interaksjon Introduksjon

Diskuter egen vitenskapsteoretiske posisjon

Metodisk arbeid. Strukturert arbeidsmåte for å nå målet

Inf1510: Oppsummering. Rune Rosseland

Temaer for obligatoriske oppgaver

INF1510: Obligatorisk oppgave 2: prosjektforslag

Forskningsmetoder. INF1050: Gjennomgang, uke 13

2. Gjør rede for IPA. Legg spesielt vekt på datainnsamling og analyse. Diskuter hva som bidrar til kvalitet i forskning hvor IPA benyttes.

Usability testing Brukertester

INF1500 Høst 2016 Lone Lægreid Martine Rolid Leonardsen. Utviklingsprosesser, krav og behov & Analyse

Brukersentert design Kapittel 3 i Shneiderman

Notat om design for og med brukere, inkludert evaluering av Tone Bratteteig

Metoder for evaluering. Flere generelle RRISC

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Learning activity 2 Webdesign Malin Jonsson

INF1500 Introduksjon til design, bruk, interaksjon Kapittel 10 Identifisere behov og etablere krav

Introduksjon til kurset

Prototyping. Håkon Tolsby Håkon Tolsby

F.I.F.F.I.G. Fleksibelt og Innovativt system For FakultetsInformasjon og andre Greier

KVANTITATIV METODE. Marit Schmid Psykologspesialist, PhD HVL

Inf 1510: Bruksorientert design

INF Introduksjon til design, bruk, interaksjon Evaluering del 1

Stikkordene her peker på at musikk kan skapes og deles på mange ulike måter, i mange ulike situasjoner, av mange ulike mennesker.

Tilnærminger til og erfaringer fra forsknings- og utviklingsarbeid. Thomas Nordahl

Brukertest Universitetsbiblioteket uio.no. 7. oktober 2010 Eirik Hafver Rønjum & Ida Aalen

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Metodisk arbeid. Strukturert arbeidsmåte for å nå et bestemt mål

Informasjonsarkitektur og Prototyping

Obligatorisk oppgave 0

VELKOMMEN. UKE 1: Introduksjon Plenum IN1050. Julie og Maria

Brukerundersøkelser. Tid: Torsdag 14 februar 2019 Sted: Simula Jo

Testrapport. Studentevalueringssystem

Løsningsforslag: Oblig 1. INF1050: Gjennomgang, uke 12

INF1510: Bruksorientert design. Intro til design, bruk, interaksjon

Metodisk arbeid. Strukturert arbeidsmåte for å nå et bestemt mål

VEDLEGG 3 SJEKKLISTE FOR Å VURDERE KVALITATIV FORSKNING

Iden%fisere behov og etablere krav. INF 1500; introduksjon %l design, bruk og interaksjon 8 september 2014

Prototyping og kommunikasjon med brukere

INF1500 Høst 2015 Magnus Li Martine Rolid Leonardsen. Designprinsipper

Web Accessibility Toolbar. Struktur. Funksjonene. Headinger. Mer om tilgjengelighet og Flash.

Beat the Competition. Forelesning 17. januar, Utvikling av interaktive nettsteder

Forskningsmetoder i informatikk

Test og kvalitet To gode naboer. Børge Brynlund

Analyse. Plenumstime Uke 5. Med Maria og Helle

Evaluering av informasjonsystemer

Ofte stilte spørsmål.

En enkel modell. Hvorfor?

Evaluering av informasjonsystemer

Forskningsmetoder i informatikk

AB-Konferansen 2011 Delseminar L)

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

Hvordan evaluerer man kvaliteten på et IT-system?

Sensurveiledning IN1050, høsten 2018

UKE 6 Utviklingsprosesser og tjenestedesign. Plenum IN1050 Julie og Maria

Rigorøs evaluering EVALUERINGSPLAN KAN INNEHOLDE ROLLER I EVALUERINGEN FORBEREDELSE

Mål for seminaret. Elementer. Et eksempel. Agenda (noen ønsker?) Kvalitativ (vs. kvantitativ) Kvalitativ metode i naturfagdidaktikk

Transkript:

INF1500 Høst 2016 Magnus Li Martine Rolid Leonardsen EVALUERING / DECIDE

I DAG GENERELT - Oblig 3 RASK REPETISJON FRA FORRIGE UKE - Eksempler PRAKTISK EKSEMPEL KAHOOT DECIDE - Stegene - Validitet og reliabilitet

OBLIG 3 Skal leveres 20.11 (om 1 uke) Dere skal her: - Planlegge en evaluering med DECIDE-rammeverket - Gjennomføre evalueringen. - Reflektere over det dere har gjort - Benytt begreper aktivt

EKSAMENSOPPGAVER Evaluering Definisjonsteori - Hva er de tre hovedtilnærmingene til evaluering? - Nevn de seks stegene i DECIDE. - Gi et eksempel på en måte å gjøre indirekte observasjon. - Hva ligger i begrepene pålitelighet (reliability), gyldighet (validity) og økologisk gyldighet (ecological validity)? Begrepsteori - Hvilke fordeler har man ved å gjennomføre en evaluering i kontrollerte omgivelser kontra naturlige omgivelser? - I noen situasjoner er det ikke hensiktsmessig å involvere brukere ved evaluering. Diskuter hva en slik situasjon kan være og gi eksempler på metoder eller teknikker man kan bruke. - Hva vil du si er fordelen med en ekspert- (analytisk) evaluering? - Har du noen eksempler på evalueringsformer hvor observasjon kan inngå? Hvorfor tror du observasjon kan være et nyttig verktøy her? - Hva går brukbarhetstesting (usability testing) ut på og hvilke fordeler har denne typen testing? Diskusjonsoppgaver - Hvilke fordeler oppnår man ved analytisk evaluering sammenliknet med andre tilnærminger?

EVALUERING Hva, hvordan, når - Hva vil man finne ut av? - Bestemme konsept? - Store eller små designvalg? - Finne designproblemer? - Hvordan skal man finne ut av det? - Vise skisser / storyboards til brukere? - Teste interaktiv prototype med brukere i lab? - Bruke eksperter innen HCI eller domene? - Teste prototype i naturlig miljø? DECIDE - Praktiske ting - Hvor, når, hvem?

EVALUERING Tilnærminger - Naturlige omgivelser - Kontrollerte omgivelser - Uten brukere

I NATURLIGE OMGIVELSER Brukere benytter prototype i naturlige omgivelser. Metoder - Observasjon - Spørreskjema / intervju etter naturlig interaksjon - Systemlogg - Contextual inquiry

I KONTROLLERTE OMGIVELSER Brukere gjør definerte oppgaver i kontrollerte omgivelser, for eksempel i lab. Kontrollert, i den betydning at vi har kjennskap til, og mulighet til å regulere de fleste variabler. Metoder - Observasjon - A/B -testing - Presentere storyboards / skisser - Intervju og diskusjon

EVALUERING

UTEN BRUKERE / ANALYTISK Eksperter benytter etablerte prinsipper og erfaring til å evaluere et grensesnitt. Metoder - Cognitive walkthrough - Heuristisk evaluering

UTEN BRUKERE / ANALYTISK Heuristisk Evaluering - Designere og domeneeksperter er evaluatorene - 3-5 deltakere - Plukker ut heuristikker man skal se etter - Eksempelvis: 10 usability Heruistics for User Interface Design - Kan avdekke opptil 80% ved 3-5 deltakere (Nielsen) Heuristikk: bygger på (nedfelte) erfaringer og prinsipper.

UTEN BRUKERE / ANALYTISK Cognitive walkthrough - Designet evalueres av eksperter - Fokus på om designet støtter brukeren i oppgaveløsning - Bruker psykologiske prinsipper For hvert steg: - Hvilken påvirkning vil interaksjonen ha? - Hvilke kognitive prosesser kreves fra brukeren? - Hvilke læringsproblemer kan oppstå?

EKSEMPLER EVALUERINGSMETODE

EKSEMPEL Evalueringsmetode Martine har laget wireframes for en nettside og ønsker å gjennomføre en rask, første evaluering av plassering av knapper og andre elementer. Analytisk evaluering med HCI-ekspert. eller/og Brukbarhetstesting i kontrollerte omgivelser med brukere. Hva slags evaluering burde hun gjennomføre?

PLANLEGGE EVALUERING MED DECIDE

D etermine the goals - Bestemme mål E xplore the questions - Utforske spørsmål C hoose evaluation method - Velg tilnærming I dentify the practical issues - Identifisere praktiske forhold D ecide how to deal with the ethical issues - Beslutte hvordan etiske forhold skal håndteres E valuate, interpret and present data - Evaluere, analysere, tolke og presentere data

DECIDE Determine the goals Beskrive hovedmålene i evalueringen. Hva ønsker vi å finne ut av? Målene er med på å bestemme hva slags evalueringsmetode man burde bruke. - Kontrollere at brukerens behov og at kravene er imøtekommet - Forbedre brukbarhet - Sjekke at grensesnittet er konsekvent

DECIDE Explore the questions Beskrive sentrale spørsmål i evalueringen. Spørsmålene kan brytes ned til spesifikke underspørsmål Eksempler: - Er det vanskelig å navigere i systemet? - Hva er din holdning til lignende tjenester? - Er denne funksjonen forvirrende?

DECIDE Choose evaluation method Beskrive hva slags metode man vil benytte i evalueringen, og begrunne hvorfor. Hva slags type data trenger du å samle inn? Hvilke teorier eller rammeverk er passende for konteksten? - Brukbarhetstesting i kontrollerte omgivelser? - A/B-testing i naturlige omgivelser? - Feltstudie? - Observasjon i naturlige omgivelser?

DECIDE Identify the practical issues Beskrive hvordan de praktiske forhold rundt evalueringen skal løses. - Valg av deltakere - Valg av utstyr - Lokasjon - Kostnader - Tidsrammer

DECIDE Decide how to deal with the ethical issues Vurdere om det er noen spesielle etiske utfordringer knyttet til evalueringen, og beskrive hvordan disse skal løses. Alle deltakere må få god informasjon om hva de er med på, og signere et informert samtykke. Dette skal legges frem for deltakerne i forkant av evalueringen Obs obs! Hvis man evaluerer med barn

DECIDE Evaluate, interpret and present data Valg av metode påvirker hva slags data man får ut, og hvordan disse skal behandles og presenteres. Det burde reflekteres rundt: - Validitet - Økologisk validitet (Hawthorne effekten) - Reliabilitet - Bias (HALO-effekten) - Omfang / scope (generaliserbarhet)

EVALUERING Faktorer Når man skal designe en evaluering er noen grunnbegreper viktige. Scope / generaliserbarhet - Kan funnene generaliseres utover utvalget? Indre validitet (i boken bare validity) - Måler jeg det jeg hevder å måle? Økologisk validitet - Gjør miljøet i studien det mulig å generalisere til situasjoner i ekte omgivelser? Reliabilitet - Vil jeg få samme resultat ved nye målinger?

FAKTORER Bias Eller skjevhet kan gi systematiske feil i resultatet. Disse oppstår ubevisst eller bevisst hos både deltaker og forsker. Eksempler - Utvalgsbias - Intervjuer-bias - Respons-bias - Observasjons-bias / Hawthorne effect - Ytelsesbias

FAKTORER Indre validitet Kalles i boken bare validitet Begrepet beskriver problemet vi har snakket mye om. Hvor sikkert kan man si at fenomenet observert i studien skyldes variablene som hevdes? Studier i kontrollerte omgivelser vil dermed ha en høyere indre validitet enn studier gjennomført i naturlige omgivelser. Bias er også en viktig faktor. For å sikre høy validitet må det tas høyde for alle mulige typer bias.

FAKTORER Økologisk validitet En bestemt type ytre validitet, som går på hvor vidt omgivelsene i studien legger til rette for å kunne generalisere til de naturlige omgivelsene for fenomenet. Her vil åpenbart studier i naturlige omgivelser gi en høyere økologisk validitet enn studier i kontrollerte omgivelser.

FAKTORER Reliabilitet Hvor vidt kan resultatene fra studien reproduseres? Dersom samme studie gjøres på nyttpå samme måte, vil man få det samme resultatet? Målinger er ofte gjenstand for både tilfeldige og systematiske feil. Tilfeldige feil kan man ikke gjøre noe med annet enn å foreta flere målinger for å få et så riktig snitt som mulig. Systematiske feil kommer ofte fra ulike bias. Disse kan vi forsøke å kontrollere.

FAKTORER Validitet og reliabilitet

EKSEMPEL EVALUERINGSPROSESSEN

Vi skal evaluere! To grensesnitt for utforskskjerm i app (Snapsale.com) vs. Eksempel fra 2015

EVALUERINGSPLAN Mål - Hvilke type utforming er mest hensiktsmessig for brukeren? - Primærmålgruppe jenter 18-30 år Sentrale spørsmål - Hvilket av de to legger opp til enklest navigasjon? - Hvilken av de to presenterer informasjonen på den mest optimale måten? - Skjønner brukeren hva de forskjellige knappene gjør? Evalueringsmetode - Formativ A/B-test i kontrollerte omgivelser - Kvalitativ data - Think-a-loud evt. spørreskjema - Gi oppgaver

EVALUERINGSPLAN Praktiske forhold: - Lokasjon: Grupperom på IFI - Varighet 15 minutter - Deltakere: 10 personer (Jenter mellom 18 og 30 år) - Kostnad: Print, - Utstyr: Båndopptager, penn

EVALUERINGSPLAN Etikk: - Samtykkeerklæring Datakvalitet og presentasjon - Målet er ikke å kunne generalisere til alle i målgruppen - Men vi har valgt ut representative deltakere med tanke på generaliserbarhet - Data vi får inn er kvalitative, og analyse er dermed avhengig av subjektive meninger hos de som analyserer, dette svekker reliabiliteten. - Da undersøkelsene gjøres i kontrollerte omgivelser har vi kontroll på mange variable, noe som gjør at vi enklere kan si at vi måler det vi mener å måle. Det er fortsatt rom for flere typer bias, særlig mellom deltaker og observatør/intervjuer, så vi prøver å holde en nøytral stemning for å sikre sterkere validitet.

GJENNOMFØRING Evalueringen dokumenteres.

REFLEKSJON Forventninger: - Vi forventet at deltakerne forsto grensesnittets funksjonalitet Opplevelser: - Kunne ha dokumentert mer underveis - Deltakerne hadde forskjellige oppfatninger Avvik fra plan: - Vi trodde at det skulle ta 15 minutter, tok noe mer tid Lærdom vi tar med oss: - Planleggingsprosessen er svært viktig - Dokumentering er viktig - Viktig å lage gode oppgaver