INF Introduksjon til design, bruk, interaksjon Evaluering

Like dokumenter
INF Introduksjon til design, bruk, interaksjon Evaluering, del 1

INF Introduksjon til design, bruk, interaksjon Evaluering

INF Introduksjon til design, bruk, interaksjon Evaluering del 1

INF Introduksjon til design, bruk, interaksjon Evaluering del 1

Evaluering vol. 1. Plenum IN1050 Uke 11 Maria og Helle

INF Introduksjon til design, bruk, interaksjon Evaluering del 2

GRUPPE 5, UKE 11 EVALUERING IN1050

INF1500 Høst 2015 Magnus Li Martine Rolid Leonardsen. Evaluering

INF Introduksjon til design, bruk, interaksjon Evaluering del 2

INF Introduksjon til design, bruk, interaksjon Evaluering, del 2

Sist oppdatert: 18.november Øvelsesoppgaver til INF1500

INF1500 Høst 2016 Magnus Li Martine Rolid Leonardsen EVALUERING / DECIDE

Diskusjonsoppgaver Hvilke fordeler oppnår man ved analytisk evaluering sammenliknet med andre tilnærminger?

Repetisjon. Plenum IN1050 Uke 14 Maria og Helle

Evaluering vol. 2. Plenum IN1050 Uke 12 Maria og Helle

Forskningsmetoder i menneske-maskin interaksjon

Brukersentert design Kapittel 3 i Shneiderman

INF Introduksjon til design, bruk, interaksjon Introduksjon

INF Introduksjon til design, bruk, interaksjon Introduksjon

Prototyping. Plenumstime Uke 6. Med Maria og Helle

Notater: INF1510. Veronika Heimsbakk 20. mai 2015

Gjennomgang - prøveeksamen. Plenum IN1050 Maria og Helle

Design, bruk, interaksjon

UKE 7 Design og prototyping. Plenum IN1050 Julie og Maria

UNIVERSITETET I OSLO

Evaluering. INF 1500; introduksjon 9l design, bruk og interaksjon 24 oktober 2011

Forskningsmetoder. INF1050: Gjennomgang, uke 13

INF1500 Høst 2015 Magnus Li Martine Rolid Leonardsen. Design og prototyping

UNIVERSITETET I OSLO

Interaksjonsdesign Utvikling for og med brukere

VELKOMMEN. Til plenumstime i IN1050. Med Maria og Helle

UNIVERSITETET I OSLO

Inf1510: Oppsummering. Rune Rosseland

UKE 2 Forstå bruk/ datainnsamling. Plenum IN1050 Julie og Maria

Kapittel 1 Vitenskap: grunnleggende antakelser

HCI, Interaksjon, grensesnitt og kontekst. Intervju, spørsmålstyper og observasjon

Stikkordene her peker på at musikk kan skapes og deles på mange ulike måter, i mange ulike situasjoner, av mange ulike mennesker.

Innhold. Login. Påvirkningskraft som kvalitetskriterium Forskjeller mellom evalueringsmetoder? En til? Kanskje litt vanskeligere denne

FORSKNINGSMETODE NOEN GRUNNLEGGENDE KONSEPTER

Forskningsmetoder i informatikk

Obligatorisk oppgave 0

UNIVERSITETET I OSLO

VELKOMMEN. UKE 1: Introduksjon Plenum IN1050. Julie og Maria

inf1510: bruksorientert design

KVANTITATIV METODE. Marit Schmid Psykologspesialist, PhD HVL

Forskningsmetoder i menneske-maskin interaksjon (MMI)

F.I.F.F.I.G. Fleksibelt og Innovativt system For FakultetsInformasjon og andre Greier

Innhold. Del 1 Grunnleggende begreper og prinsipper... 39

Prosjektbeskrivelsen består av

Introduksjon til kurset

inf 1510: bruksorientert design intro våren 2012

in1060: bruksorientert design Helle Heiestad Marte Rimer Anna So:ie Schei

STUDIEÅRET 2012/2013. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 27. august 2013 kl

Notat om design for og med brukere, inkludert evaluering av Tone Bratteteig

Forskningsmetoder i informatikk

Kvalitetskrav til løsninger

Metoder for å forstå bruk. Tone Bra2eteig inf1510 7/3 2011

INF1510: Obligatorisk oppgave 2: prosjektforslag

inf 1510: bruksorientert design

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

Temaer for obligatoriske oppgaver

Hva er nytten av brukersentrerte metoder og aktiviteter? En litteraturgjennomgang

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Mandag 13. april 2015 kl

Metodevalg i et tilgjengelighetsperspektiv: erfaringer, fallgruver og anbefalinger

Eksamensoppgave i PSY2018/PSYPRO Kvalitative forskningsmetoder

inf 1510: å lage skisser og prototyper

Forskningsopplegg og metoder. Pensum: Dag Ingvar Jacobsen (2005): Hvordan gjennomføre undersøkelser?, s

Forskningsopplegg. Pensum: Dag Ingvar Jacobsen (2005): Hvordan gjennomføre undersøkelser?, s

UNIVERSITETET I OSLO

INF Introduksjon til design, bruk, interaksjon Design, prototyping og konstruksjon

Heuristisk evaluering Ekspertevaluering

STUDIEÅRET 2012/2013. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Onsdag 24. april 2013 kl

UKE 4 Analyse. Plenum IN1050 Julie og Maria

Datainnsamling. Gruppetime 15. Februar Lone Lægreid

Emneevalueringsrapport for MAT1110, vår 2016

Forskningsmetoder i informatikk

INF1500 Introduksjon til design, bruk, interaksjon Kapittel 10 Identifisere behov og etablere krav

Dokumentstudier, innholdsanalyse og narrativ analyse. Pensum: Dag Ingvar Jacobsen (2005): Hvordan gjennomføre undersøkelser, s

Hjemmeeksamen Gruppe. Formelle krav. Vedlegg 1: Tabell beskrivelse for del 2-4. Side 1 av 5

UKE 3 Krav og behov. Plenum IN1050 Julie og Maria

Systemutvikling. Universitetet i Oslo, Institutt for informatikk Vår 2017

STUDIEÅRET 2013/2014. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Fredag 25. april 2014 kl

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

INF Introduksjon til design, bruk, interaksjon Design, prototyping og konstruksjon

INF Introduksjon til design, bruk, interaksjon Brukeropplevelser (UX)

inf 1510: bruksorientert design Tone Bratteteig + Roger Antonsen

Prototyping og kommunikasjon med brukere

Introduksjon til kurset

Prosjektbeskrivelsen består av

Usability testing Brukertester

Sist oppdatert: 10.november Ukesoppgaver til INF1500 (Uke 1-13)

Beat the Competition. Forelesning 17. januar, Utvikling av interaktive nettsteder

Feedback og debrief - teori og fallgruver

Obligatorisk oppgave INF3221/4221

Grunnleggende om Evaluering av It-systemer

VELKOMMEN TIL MAT-INF1100

- På Farten - Midttermsrapport

)RUVNQLQJVPHWRGLNNLQQHQ.XQVWLJLQWHOOLJHQV

in1060: hva & hvorfor prototyping? Tone Bratteteig

Introduksjon til design, bruk, interaksjon. Litt om fagets historie. Gisle Hannemyr Ifi, høstsemesteret Design, bruk, interaksjon

Transkript:

INF1500 - Introduksjon til design, bruk, interaksjon Evaluering 1. november 2016 Institutt for Informatikk, Universitetet i Oslo joshi@ifi.uio.no INF1500 Evaluering 1

Resultater fra evalueringen INF1500 Evaluering 2

Ukene fremover I dag er temaet evaluering (del 1) Vi går gjennom DECIDE-rammeverket neste uke (del 2) Forberedelse til neste pensumforelesning: les utdraget om «DECIDE» Viktige aktiviteter som gjenstår: Tirsdag 08. november foreleses del 2 om evaluering: DECIDE Tirsdag 15. november blir det gjesteforelesning om etikk (Maja van der Velden) Mandag 21. november blir det gjesteforelesning om fagets historie (Gisle Hannemyr) + M & M (plenum) Tirsdag 22. november holder jeg siste pensumforelesning om Tangible Interaction Mandag 28. november kommer Tone Bratteteig for å snakke om INF1510 og det blir sosial avslutning Tirsdag 29. november blir det repetisjonsforelesning Mandag 30. november blir eksamenstrening og gjennomgang En gang i desember blir det prøveeksamen mer informasjon kommer så snart vi får beskjed fra fakultetet INF1500 Evaluering 3

Evaluering "Everything that can be counted does not necessarily count; everything that counts cannot necessarily be counted (A. Einstein) "True genius resides in the capacity for evaluation of uncertain, hazardous, and conflicting information" (W. Churchill) The only man who behaves sensibly is my tailor; he takes my measurements anew every time he sees me, while all the rest go on with their old measurements and expect me to fit them (G. B. Shaw) INF1500 Evaluering 4

Nøkkelbegreper fra dagens forelesning Evaluering s. 9 Opportunistisk evaluering s. 15 Brukbarhetstesting s. 21 Formativ testing s. 23 Summativ testing s. 23 Effektivitet, flittighet og tilfredshet s. 24 Lærbarhet og memorerbarhet s. 24 Hypotese s. 26 Uavhengig variabel s. 26 Avhengig variabel s. 26 Kontrollert variabel s. 27 Presisjon og generaliserbarhet s. 27 Between-subject testing s. 30 Within-subject testing s. 30 Feltstudier s. 31 Etnografisk evaluering s. 33 Analytisk evaluering s. 36 Heuristikk s. 36 Kognitiv gjennomgang s. 37 Ekspertevaluering s. 39 Metrikk s. 26 INF1500 Evaluering 5

Oversikt over dagens forelesning Hva er evaluering? Hvorfor evaluere? Tre tilnærminger til evaluering Brukbarhetstesting Feltstudier Analytisk evaluering Metoder, teknikker og paradigmer Evaluering analyse Obligatorisk oppgave 1 Behovsanalyse kravspesifikasjon Eksempler på tilnærminger Eksempler fra virkeligheten Obligatorisk oppgave 3 Obligatorisk oppgave 3 Design prototype Obligatorisk oppgave 2 INF1500 Evaluering 6

Evaluering Evaluering - etymologi: évaluation, évaluer "å finne verdien av" Eksempler på generelle typer evalueringsstudier: Kvantitativt numeriske studier, statistikk Kvalitativt studier av mening, tekst, samtale Case study lavt antall, men høyt detaljerte beskrivelser Etnografi studier i naturlige omgivelser Software testing er ikke det samme som HCI-evaluering INF1500 Evaluering 7

Evaluering Krever en artefakt: en simulering, en prototype, et ferdig produkt, et funn, en analyse På samme måte med low-fi/hi-fi prototyper finnes det ulike grader av «ekthet» i evalueringen vi gjør Ulike typer evalueringstilnærminger vil gi ulike typer svar hva ønsker vi egentlig å finne ut av? F.eks. vil man tidlig benytte seg mye av heuristikk, men senere ekte brukere Man må ofte eksperimentere med ulike metoder for å finne metoden som gir best gyldighet i resultatene INF1500 Evaluering 8

Evaluering Definisjoner: - Evaluering Evaluering er en aktivitet som gir oss tilbakemelding og innspill: prototyper, antagelser, funn, analyser Evaluering er en sentral del av brukersentrert design og generell HCI Inngår på forskjellige måter i de ulike modellene, men er viktig i alle Mange av teknikkene som benyttes under kravinnsamling kan også brukes under evaluering Å jobbe med begrensinger er en sentral utfordring for evaluatorer Tre tilnærminger: Brukbarhetstesting Feltstudier Analytisk evaluering INF1500 Evaluering 9

Hva, hvordan, hvorfor og når? Hvorfor: bør vi evaluere? Hva: kan vi evaluere? Hvor: kan vi evaluere? Når: kan vi evaluere? INF1500 Evaluering 10

Hva, hvordan, hvorfor og når? Hvorfor: for å undersøke om brukerne kan benytte løsningen For å kontrollere at designet vårt på riktig vei møter vi brukernes behov? Identifiserer bruksproblemer, frustrasjonsmomenter og forbedringspotensialer Hva: konseptuelle modeller, tidlige prototyper, endelige prototyper Alt som kan gi brukeren en idé om endelig løsning kan evalueres Hvor: i laboratorium eller «naturlige omgivelser» Avgjøres av en rekke faktorer, f.eks. modenhet, tilgang, deltagere, formål etc. Når: tidlig, sent, når som helst, så ofte som mulig Kan gjøres som en gjennomgående aktivitet eller hovedsakelig tilknyttet milepæler INF1500 Evaluering 11

Hvorfor evaluere? Avgjøre hvor brukbar en løsning er for ulike brukere og brukergrupper Identifisere gode og dårlige egenskaper for å drive videre design Sammenlikne designalternativer og hjelpe oss med å ta beslutninger Observere effekten spesifikken interaksjoner og grensesnitt har på brukeren Husk: Evaluering er en prosess, ikke en hendelse Gode designideer stammer ofte fra evaluering av eksisterende løsninger "Making things better" starter alltid med evaluering INF1500 Evaluering 12

Tre tilnærminger til evaluering Brukbarhetstesting Brukere gjør definerte oppgaver i kontrollerte omgivelser Observasjoner, målinger og feil blir rapportert Feltstudier Brukere utfører oppgaver i "naturlige" omgivelser Observasjoner og beskrivelser blir rapportert Analytisk evaluering Brukere holdes utenfor evaluering og kan gjøres hvor som helst Problemer og tilbakemeldinger blir rapportert INF1500 Evaluering 13

Metoder og teknikker Brukbarhetstesting Observasjon Spørre brukere Testing Feltstudier Observasjon Spørre brukere Spørre eksperter Analytisk evaluering Spørre eksperter (HCI eller domene) Modellere INF1500 Evaluering 14

Kombinasjon Definisjoner: - Opportunistisk evaluering Kombinerte tilnærminger (s.442 i 3. utgave) Opportunistisk evaluering vi benytter «anledning» til å velge tilnærming Feltstudie for å evaluere utkast til designideer og få tidlig feedback Gjøre designendringer Brukbarhetsteste for å sjekke spesifikke designegenskaper Feltstudie for å se hvordan designet fungerer i naturlige omgivelser Gjøre endelige designjusteringer INF1500 Evaluering 15

Evalueringsmetoder og teknikker Flere tilnærminger kan brukes samtidig, og ulike metoder og teknikker kan brukes i flere av tilnærmingene: Metode/teknikk Kontrollerte omgivelser Naturlige omgivelser Uten brukere Observasjon Spørre brukere Spørre eksperter Sett kryss i riktige ruter Testing Modellering INF1500 Evaluering 16

Evalueringsmetoder og teknikker Flere tilnærminger kan brukes samtidig, og ulike metoder og teknikker kan brukes i flere av tilnærmingene: Metode/teknikk Kontrollerte omgivelser Naturlige omgivelser Uten brukere Observasjon X X Spørre brukere X X Spørre eksperter X X Testing X Modellering X INF1500 Evaluering 17

Evalueringsmetoder og teknikker Eksempler på teknikker som brukes: Metode/teknikk Kontrollerte omgivelser Naturlige omgivelser Uten brukere Observasjon Video og interaksjonslogg Etnografiske teknikker: skygging, flue-på-veggen - Spørre brukere Pre- og posttestingsspørsmål, strukturerte intervjuer Intervjuer og diskusjoner - Spørre eksperter - Heuristisk evaluering, diskusjoner Heuristisk evaluering Testing Testing av typiske oppgaver (brukbarhetstesting) - - Modellering - - HTA, GOMS og annen teori INF1500 Evaluering 18

Evalueringsparadigmer Evalueringsparadigme: Quick and dirty Brukbarhetstesting Feltstudier Analytisk evaluering Hvilken rolle har brukeren i evalueringen Naturlig oppførsel Å gjennomføre oppgaver Naturlig oppførsel Ingen Hvem styrer evalueringen Evaluatoren har minimalt med kontroll Evaluatoren har sterk kontroll Forholdet mellom evaluatoren og deltagerne Eksperter Hvor foregår evalueringen Naturlig omgivelser eller laboratorium Laboratorium Naturlig omgivelser Naturlig omgivelser eller laboratorium Når gjennomfører man evalueringen Når som helst Når ferdig prototype er klar Tidlig Med prototype Hvilken type data samles inn under evalueringen Kvalitativ; uformell diskusjon Kvantitativ; statistisk Kvalitativ, skisser Liste over problemer Hvordan blir dataen tilført designprosessen Skisser og sitater Rapport på prestasjoner Beskrivelse på workshop, rapport og skisser Rapport Hvilken filosofi eller teori ligger bak evalueringen Brukersentrert design Vitenskapelig/eksper imentell Etnografisk Praktisk heuristikk, annen teori (Tabellen er hentet fra førsteugaven av læreboken) INF1500 Evaluering 19

Evaluering begreper fra boka Analytisk evaluering Kontrollerte eksperimenter Feltstudier Formativ evaluering Heuristisk evaluering Prediktiv evaluering Summative evaluering Brukerstudier Brukbarhetsstudier Brukbarhetstesting Brukertesting INF1500 Evaluering 20

Brukbarhetstesting Definisjoner: - Brukbarhetstesting Eksempel på evaluering i kontrollerte omgivelser Evaluering av en løsning isolert sett Som regel bes brukeren om å utføre en spesifikk oppgave Observerer og måler som ofteste med følgende metrikker: Tid Fullføringsrate Antall feil Antall forsøk Tilfredshet Men viktigst av alt: du får observert noen som bruker løsningen INF1500 Evaluering 21

INF1500 Evaluering 22

Formativ og summativ testing Definisjoner: - Formativ testing - Summativ testing Formativ Summativ Validering Utføres i en tidlig fase Typisk low-fi prototyper Fokus på hvordan grensesnittet oppfattes (fremfor oppgaveløsing) Billig, raskt og kan utføres på flere alternativer Lettere å være kritisk Utføres i en senere fase Formell prototype er klar Høy-nivåbeslutninger er allerede tatt F.eks. evaluering av brukbarheten ved et designvalg Grensnittet eller funksjonalitet måles opp mot andre tilsvarende løsninger (benchmarking) F.eks.: klarer brukeren å løse en oppgave på 30 sekunder? Brukes mer sjeldent Dette er pensum i INF2260, så dere behøver kun å kjenne til disse begrepene i dette kurset. INF1500 Evaluering 23

Hva ønsker vi å finne ut av? Definisjoner: - Effektivitet - Flittighet - Tilfredshet - Lærbarhet - Memorerbarhet Tre standard ISO-definerte dimensjoner på brukbarhet: Effektivitet Hvor godt vi klarer å løse oppgaver (effectiveness) Flittighet Hvor raskt vi klarer å løse oppgaver (efficiency) Tilfredshet Hvor tilfreds vi er med å løse oppgaver (satisfaction) I tillegg legger man gjerne på: Lærbarhet: Hvor lett kan vi lære oss å løse oppgaver (learnability) Memorerbaret: Hvor mye som huskes hvis vi etter stund skal løse oppgaver (memorability) INF1500 Evaluering 24

Eksperimentell evaluering (1) I eksperimentell testing tester vi en hypotese for å generere ny kunnskap Vi studerer forholdet mellom to eller flere faktorer også kalt variabler Brukbarhetstesting er anvendt eksperimentering Relevante begreper: Hypotese Avhengige, uavhengige og kontrollerte variabler Presisjon og generaliserbarhet Eksempel på atferdsforskning Type Formål Beskrivelse Deskriptiv Beskriver forhold x skjer Relasjonell Ser sammenhenger x er relatert til y Eksperimentell Forklarer årsaker x er ansvarlig for y INF1500 Evaluering 25

Eksperimentell evaluering (2) Definisjoner: - Hypotese - Uavhengig variabel - Avhengig variabel - Metrikk Hypotese Et forsøk på en forklaring en utestet antagelse om virkeligheten Må være etterprøvbar for å være gyldig Uavhengig variabel (IV) Hva er du manipulerer? som regel en del av grensesnittet eller interaksjonen Eksempler: ulike måter å representere en løsning på (slik dere gjorde i oblig 2) Faktorer vi ønsker å studere, eller mulig årsak til endring i en avhengig variabel Uavhengig av deltagers atferd Forhold og tilstander som forskere normal kan kontrollere Avhengig variabel (DV) Hva er det du skal måle? avhenger av ditt oppsett og de faktorene du manipulerer Eksempler: nøyaktighet, emosjonell, feilantall etc. Avhengig av deltagers atferd (eller endring i IV) Vi bruker metrikker for å måle utfallet gjennom denne variabelen Metrikk: et målbart og kvantifiserbart forhold vi kan bruke til sammenlikning Eksempler: Tid sekunder Vekt gram Prestasjon # feil INF1500 Evaluering 26

Eksperimentell evaluering (3) Definisjoner: - Kontrollert variabel - Presisjon - Generaliserbarhet Kontrollerte variabler (CV) Hvilke forhold holder vi bevisst like mellom rundene i eksperimentene? Faktorer som kontrolleres gjennom eksperimentet for å unngå IVs effekt på DV Presisjon Beskrives som intern validitet hvis vi gjorde dette igjen, vil jeg få det samme resultatene? Fokus på konsistens, fjerne alle forstyrrende faktorer, dokumentasjon etc. Generaliserbarhet Beskrives som ekstern validitet er det vi måler noe vi finner igjen i den virkelige verden? Det er ikke slik at «iboende funn» (intrinsic validity) automatisk gjør oss i stand til å generalisere INF1500 Evaluering 27

Eksperimentell evaluering: eksempel Oppgave: vi ønsker å studere hvorvidt ulike mengden med gjødsel påvirker en plantes vekst Hypotese: det er ingen forskjell i mengden gjødsel sin påvirkning på plantens vekst Uavhengig variabel: mengde gjødsel Avhengig variabler: høyde, vekt, bær Kontrollerte variabler: potta, vann, temperatur, sollys Vi bruker ni like planter og tre forskjellige mengder gjødsel Plante 1-3 utsettes for mengde 1, plante 4-6 utsette for mengde 2, og plante 7-9 utsettes for mengde 3 Måler avhengige variabler for å si noe om den uavhengige variabelen har en påvirkning Bruker dette for å bekrefte eller avkrefte hypotesen INF1500 Evaluering 28

Eksperimentell evaluering: oblig 3 Bakgrunn: i oblig 2 har jeg laget to prototyper for musikkopplevelser én app og én smartklokke Oppgave: formålet er å se om det er noen forskjell på prototype 1 og 2 Hypotese: det er ingen forskjell i prestasjon ved bruk av prototype 1 og prototype 2 Uavhengig variabel: prototypene Avhengig variabler: tid og antall feil Kontrollerte variabler: musikkvalg, setting, humør Vi bruker seks brukere Alle brukere tester begge prototypene Måler tid og feil for å si noe om smartklokken skaper en lik, bedre eller dårligere prestasjon enn appen INF1500 Evaluering 29

Ting vi må passe på (i oblig 3) Definisjoner: - Between-subject - Within-subject Skal alle deltagerne teste alle tilstandene? Skal alle seks deltagerne teste begge prototypene? eller skal vi dele det opp i to, dvs. at gruppe 1 og 2 (på tre personer) tester tre tilstander hver Det kan oppstå læringseffekter: vi kjenner systemet etter én tilstand, humør, ivrighet Det optimale er om vi har tilfeldig tildeling av deltager til tilstand ingen måte å påvirke dette på Between-subject: vi deler inn i grupper som tester hver sin tilstand (like mange grupper som tilstander) Within-subject: alle detalgere tester alle tilstander INF1500 Evaluering 30

Feltstudier i naturlige omgivelser Definisjoner: - Feltstudier Evaluering av en prototype i brukssituasjonens naturlige omgivelser Foretas ofte i en senere fase når: Prototypen er mer sofistikert og utviklet Ikke bare horisontale, men også vertikale funksjoner Prototypen allerede er evaluert i kontrollerte omgivelser Fordeler: Representative omgivelser (beliggenhet og kontekst) Bruker oppfører seg mer naturlig Mer realistisk (støy, andre personer, dekningsproblemer etc.) Kan utvides til langtidsstudier Men hvilke ulemper? INF1500 Evaluering 31

INF1500 Evaluering 32

Etnografisk evaluering Definisjoner: - Etnografisk evaluering Feltstudier er eksempel på evaluering i naturlige omgivelser En kvalitativ forskningsmetode som stammer fra sosialvitenskapen Brukes mye for å forstå brukere og brukskontekst Typiske observasjonsteknikker inkluderer skygging og flue-på-veggen Kan også bruke intervjuteknikker, for eksempel in-situ intervjuer med designer Ulik grad av deltagelse: fra passiv til aktiv (deltagende) observasjon INF1500 Evaluering 33

INF1500 Evaluering 34

INF1500 Evaluering 35

Analytisk evaluering Definisjoner: - Analytisk evaluering - Heuristikk Analytisk: teori, modeller, retningslinjer (eksperter) Empirisk: observasjoner, spørreundersøkelser, litteratur (brukere) Finnes flere metoder som kan benyttes for analytisk evaluering: Gjennomganger Finnes flere ulike typer, f.eks. kognitiv eller pluralistisk gjennomgang Inkluderer domeneeksperter Gjøres ofte i grupper med HCI-eksperter og domeneeksperter Heuristisk evaluering Gjennomgang etter retningslinjer Nielsen mente man kun trengte 3-5 brukere for å finne 80 % Brukes mye i næringslivet og industrien Heuristikk: bygger på (nedfelte) erfaringer og prinsipper. «tommerfingerregel»- vurdering INF1500 Evaluering 36

Kognitiv gjennomgang Definisjoner: - Kognitiv gjennomgang Kalles cognitive walkthrough på engelsk Designet evalueres av eksperter (ofte i kognitiv psykologi) Formålet er å undersøke hvor godt designet støtter brukeren i oppgaveløsning Ekspertene følges gjennom designet steg for steg for å identifisere potensielle problemer (ved å f.eks. bruke psykologiske prinsipper) Bruker ofte skjemaer til å guide analysen For hvert steg: Hvilken påvirkning vil interaksjonen ha? Hvilke kognitive prosesser kreves fra brukeren? Hvilke læringsproblemer kan oppstå? Fokus i analysen på mål og kunnskap leder designet til de riktige målene? INF1500 Evaluering 37

INF1500 Evaluering 38

Ekspertevaluering Definisjoner: - Ekspert-evaluering Eksempel på analytisk evaluering En eller flere eksperter evaluerer en løsning og påpeker problemer og svakheter Ekspertene setter seg inn i brukers rolle Kan være både HCI-eksperter og domeneeksperter INF1500 Evaluering 39

Eksempler MIT: innendørstesting med UAV http://venturebeat.files.wordpress.com/2012/10/ipad-4-gen.jpg http://psipunk.com/wp-content/uploads/2009/11/nasas-sprlunar-rover-01.jpg http://www.fonearena.com/blog/wpcontent/uploads/2009/01/india-mobile.jpg?9d7bd4 http://www.blogcdn.com/www.engadget.com/media/2006/11/ mit_indoor_uav.jpg HISP: mobiltelefoner i India Apple: ipadens oppstandelse JPL & NASA: simulering i 3D-programmer og kunstige omgivelser INF1500 Evaluering 40

INF1500 Evaluering 41

Hvilken type evaluering er egnet? DNT prototyper en løsning for elektroniske kompass for turgåere Studentgruppe som lager iphone-app for oversikt over dagens rett i kantina NASA-ansatte lager et nytt dusjsystem som skal utplasseres på ISS i verdensrommet Mozilla ønsker å teste ut sin siste versjon av nettleseren Firefox IT-selskap utvikler en ny touchskjerm for eldre mennesker som lider av demens Medisinske forskere som har fremstilt medisiner som skal løse fremtidens kreftgåter Undervisningsledelsen som jobber med å kartlegge digital eksamen DnB vil ha tilbakemelding på hvordan deres eksisterende «mobilbank» fungerer INF1500 Evaluering 42

Obligatorisk oppgave 3 Obligatorisk oppgave 3 handler om å planlegge og gjennomføre en evaluering av designforslagene dere har laget i obligatorisk oppgave 2 Dere skal sette opp en evalueringsplan ved hjelp av DECIDE-rammeverket (gjennomgås neste uke) Dere velger selv omfanget på evalueringen, men den skal altså gjennomføres Obligen er allerede lagt, og dere bør begynne på den med en gang! Begynn å tenke på: Hvilke oppgaver vil du be deltagerne om å utføre? Hvilke metrikker du vil bruke under evalueringen? Hvordan du har tenkt å måle brukernes prestasjoner når de utfører oppgaver? Skal prototypene evalueres opp mot hverandre eller evalueres isolert? Hvilke egenskaper innehar deltagere du inkluderer i evalueringen? Formålet er å få trening i planlegging og gjennomføring av en evaluering omfanget på evalueringen er ikke så viktig! INF1500 Evaluering 43

Oppsummering Evaluering er en vital aktivitet som gir oss tilbakemelding og innspill fra bruker til videre designprosess Krever at vi har noe som lar seg evaluere, f.eks. en prototype Evaluering har tre hovedtilnærminger: brukbarhetstesting, feltstudier, analytisk evaluering...med mange ulike metoder som gir ulike fordeler og ulemper hvilken du velger avhenger av formål Eksperimentell evaluering er et alternativ på hypotesedreven testing hvor du ønsker å bekrefte noe Formativ og summativ testing angir hvor i designfasen vi er ulike formål I oblig 3 skal dere jobbe med å planlegge og gjennomføre en evaluering INF1500 Evaluering 44