Hvordan evaluerer man kvaliteten på et IT-system?

Like dokumenter
IN2002: Software Engineering og prosjektarbeid 12. februar Forskningsmetoder / Evaluering av IT-systemer. IN2000/ 12.2.

Forskningsmetoder / Evaluering av systemutvikling Pensum: kap. 12 i lærebok (artikkel) + kap

Forskningsmetoder. INF1050: Gjennomgang, uke 13

Brukersentert design Kapittel 3 i Shneiderman

Oppgave 1: Multiple choice (20 %)

Repetisjon. Plenum IN1050 Uke 14 Maria og Helle

INF1500 Høst 2015 Magnus Li Martine Rolid Leonardsen. Evaluering

Diskusjonsoppgaver Hvilke fordeler oppnår man ved analytisk evaluering sammenliknet med andre tilnærminger?

Løsningsforslag: Oblig 1. INF1050: Gjennomgang, uke 12

Evaluering vol. 1. Plenum IN1050 Uke 11 Maria og Helle

Kravhåndtering. INF1050: Gjennomgang, uke 03

INF Introduksjon til design, bruk, interaksjon Evaluering, del 2

F.I.F.F.I.G. Fleksibelt og Innovativt system For FakultetsInformasjon og andre Greier

GRUPPE 5, UKE 11 EVALUERING IN1050

Evaluering vol. 2. Plenum IN1050 Uke 12 Maria og Helle

11 Planlegging og dokumentasjon

Erfaringer fra semi-strukturerte intervjuer innenfor Software Engineering. 10. oktober 2005 Siw Elisabeth Hove

UKE 2 Forstå bruk/ datainnsamling. Plenum IN1050 Julie og Maria

INF1500 Høst 2016 Magnus Li Martine Rolid Leonardsen EVALUERING / DECIDE

GJENNOMGANG UKESOPPGAVER 9 TESTING

Datainnsamling. Gruppetime 15. Februar Lone Lægreid

Sist oppdatert: 18.november Øvelsesoppgaver til INF1500

Modellering IT konferanse

Kap 11 Planlegging og dokumentasjon s 310

Kravhåndtering. Plan. INF1030: Systemer, krav og konsekvenser

Agenda. TDT4140: Kravinnhenting. Kravprosessen Forståelsesproblemet Teknikker for innhenting av krav. Den organisatoriske dimensjonen

KVANTITATIV METODE. Marit Schmid Psykologspesialist, PhD HVL

Konfigurasjonsstyring. INF1050: Gjennomgang, uke 11

Inf 1510: Bruksorientert design

Grunnleggende testteori

Komparative design. Forelesning 12 Mer om kvantitative forskningsdesign. Sammenligninger av to eller flere case i rom og tid

Design, bruk, interaksjon

INF Introduksjon til design, bruk, interaksjon Evaluering del 2

GJENNOMGANG UKESOPPGAVER 3 KRAVHÅNDTERING

Evaluering. INF 1500; introduksjon 9l design, bruk og interaksjon 24 oktober 2011

TJORA: TIØ10 + TIØ11 FORELESNING 1 - HØSTEN 2003

Livsløpstesting av IT-systemer

INF1500 Introduksjon til design, bruk, interaksjon Kapittel 10 Identifisere behov og etablere krav

Grunnleggende testteori

BRUKERSENTRERTE metoder i innovasjon av IT-systemer

Prøveeksamen INF1050: Gjennomgang, uke 15

SOS H KVALITATIVE METODER - FORELESNING 2 - TJORA 2007

GJENNOMGANG UKESOPPGAVER 2 PROSESSMODELLER OG SMIDIG PROGRAMVAREUTVIKLIG

Brukerundersøkelser. Tid: Torsdag 14 februar 2019 Sted: Simula Jo

Brukertesting i et nøtteskall

Introduksjon til evaluering av It-systemer. Hvordan vurdere og verdsette?

Utviklingsprosesser. INF 1500; introduksjon 9l design, bruk og interaksjon 27 september 2010

Introduksjon til evaluering av It-systemer. Hvordan vurdere og verdsette?

Metodisk arbeid. Strukturert arbeidsmåte for å nå et bestemt mål

Children s search on web

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Kravhåndtering. Plan. Generelt om krav Funksjonelle krav Ikke-funksjonelle krav Domenekrav Kravspesifikasjoner Kravhåndteringsprosessen Quiz 31/01/17

Eksamensoppgave i PSY1011/4111 Psykologiens metodologi

Grunnleggende testteori. Etter Hans Schaefer

GJENNOMGANG OBLIGATORISK OPPGAVE 1

UKE 3 Krav og behov. Plenum IN1050 Julie og Maria

Veileder. Undervisningsvurdering en veileder for elever og lærere

Hjemmeeksamen Gruppe. Formelle krav. Vedlegg 1: Tabell beskrivelse for del 2-4. Side 1 av 5

Sluttrapport Prosjektleder: Jorid Løkken Prosjektnr: 2015/RB4249

DRI 3001 Våren 2014 Arild Jansen AFIN

DRI 3001 Litteratur og metode Arild Jansen AFIN

inf 1510: bruksorientert design intro våren 2012

Klinisk veiledning også en praktisk ferdighet?

inf 1510: bruksorientert design

Innhold. Login. Påvirkningskraft som kvalitetskriterium Forskjeller mellom evalueringsmetoder? En til? Kanskje litt vanskeligere denne

Rapport Basismodul i Universitets pedagogikk 2016

Testdokumentasjon. Testdokumentasjon Side 1

Kort og godt hva er Biaton

Forbedringskunnskap. Forståelse for virksomheter og tjenester som systemer med gjensidig avhengighet

Kravspesifikasjon

Konfigurasjonsstyring

Kapittel 1 Vitenskap: grunnleggende antakelser

LEVER OFTERE TEST SMARTERE

Nettredaktørskolen, Høst Google Analytics Brukertesting Brukerundersøkelser

FORPROSJEKT. Gruppemedlemmer: Raja Zulqurnine Ali Muddasar Hussain (Gruppeleder/Prosjektleder) Zain-Ul-Mubin Mushtaq Christopher Llanes Reyes

Forelesning IMT mars 2011

Prosjektoppgave INF3290 høsten 2017

UKE 10 Kravhåndtering. Gruppetime INF1055

Sikkerhet, risikoanalyse og testing: Begrepsmessig avklaring

Prosjektoppgave INF3290 høsten 2017

Arbeidslivsportalen: status for prosjektet. Sven Petter Næss Lydia Nicolaysen

Prosjektoppgave INF3290 høsten 2018

UKEOPPGAVER 2: SYSTEMUTVIKLINGSPROSESSER OG PROSJEKTARBEID INNSPILL TIL SVAR

Inf1510: Oppsummering. Rune Rosseland

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Prosessmodeller og smidig programvareutvikling. INF1050: Gjennomgang, uke 02

Brukersentrert utvikling av elektronisk forordning, medisinering og kurve Erfaringer fra POCMAP-prosjektet

Oppsummering : IMT2243 Systemutvikling. Hensikt med kurset. Innfallsvinkel : Tom Røise IMT2243 : Systemutvikling 1

Kvalitetssikring av mobil selvhjelpsteknologi ta pasienten med på laget

Trener-2-kurs, 15. april O-teknikk - Analyse. Av Sindre Jansson Haverstad

1. Hvilke type krav angår sikkerhet og pålitelighet?

Gjennomgang av prøveeksamen. Gruppetime INF1055 Julie Hagen Nilsen & Maria Stolinski

Brukskvalitet TDT4180, vår 2017

Systemutviklingsprosesser Forelesning 2 - INF1050 Systemutvikling

Systemutviklingsprosesser Forelesning 2 - INF1050 Systemutvikling

1. Hvilke type krav angår sikkerhet og pålitelighet?

INF1050/ / Dag Sjøberg Slide 1

Slide 1. Slide 2 Statistisk inferens. Slide 3. Introduction to the Practice of Statistics Fifth Edition

Psykososiale målemetoder og psykometri.

STUDIEÅRET 2012/2013. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 27. august 2013 kl

Transkript:

IN2001: Software Engineering og prosjektarbeid 19. februar 2018 Forskningsmetoder / Evaluering av ITsystemer med fokus på prosjektet Professor Dag Sjøberg IN2001/ 19.2.2018 / Dag Sjøberg Slide 1 Hvordan evaluerer man kvaliteten på et IT-system? IN2001/ 19.2.2018 / Dag Sjøberg Slide 2 1

Anta at et firma vil utvikle en tjeneste for å finne filmer & serier Finnes fire versjoner av en prototype på en app med denne tjenesten (utviklet av studenter ved UiO) Hvilken versjon bør firmaet velge? IN2001/ 19.2.2018 / Dag Sjøberg Slide 3 Hvordan evaluere kvaliteten på app en? IN2001/ 19.2.2018 / Dag Sjøberg Slide 4 2

Gruppeoppgave 1 Hvilke kriterier kan man vurdere tjenesten utfra? Tenk på det dere har lært om kravene til systemet Funksjonelle krav Ikke-funksjonelle krav Tenk over kriterier som kan variere mellom ulike interessenter (stakeholders) IN2001/ 19.2.2018 / Dag Sjøberg Slide 5 Fra forrige forelesning: IN2001/ 19.2.2018 / Dag Sjøberg Slide 6 3

Dimensjoner ved evaluering av IT-systemer: ISO 25010 har erstattet ISO 9126 Functional suitability* Reliability Usability Performance efficiency Maintainability Portability Compatibility Security *Changes from ISO 9126 in red IN2001/ 19.2.2018 / Dag Sjøberg Slide 7 Funksjonelle krav Hva systemet skal gjøre Hvilke tjenester (funksjoner) skal systemet tilby? Hvordan skal det reagere på ulike typer input? For å avgrense systemet, vil man også kunne beskrive hva systemet ikke skal gjøre IN2001/ 19.2.2018 / Dag Sjøberg Slide 8 4

Ikke-funksjonelle krav Hvordan systemet skal implementere de funksjonelle kravene IN2001/ 19.2.2018 / Dag Sjøberg Slide 9 Typer av ikke-funksjonelle krav Spesielt viktige for app en? Non-functional Product Organizational External Efficiency Dependability Security Regulatory Ethical Usability Environmental Operational Development Legislative Performance Space Accounting Safety/security IN2001/ 19.2.2018 / Figur Dag Sjøberg fra Ian Sommerville Slide 10 5

Brukskvalitet (usability) Tips fra PhD-student Raluca Florea: How to make a usability study: https://www.usability.gov/how-to-and-tools/methods/running-usability-tests.html Guidelines on usability : Android: https://developer.android.com/guide/practices/ui_guidelines/index.html Advisable to do paper prototyping before development and test on users: https://www.youtube.com/watch?v=yafagnfu8eg IN2001/ 19.2.2018 / Dag Sjøberg Slide 11 Gruppearbeid Del inn i 4 grupper (samme som prosjektgruppene hvis mange nok tilstede i hver gruppe) Diskuter 15 minutter Oppsummering i plenum IN2001/ 19.2.2018 / Dag Sjøberg Slide 12 6

Gruppe 1 Ikke funksjonelle: Nedetid på maks 15 minutter, tid mellom hver gang nede? God arkitektur for videreutvikling Mulig å drive versjonshåndtering Høy nok sikkerhet (hva betyr det konkret?) Lav feilrate (mål på dette?) Rask responstid (mål på dette?) Følger designplattformer Ikke vise offensive bilder (nakenhet/blasfemi osv) (følge rating filmprodusenter) IN2001/ 19.2.2018 / Dag Sjøberg Slide 13 Gruppe 2 Som bruker ønsker jeg å benytte appen på både mine Android og mine ios devices. Jeg ønsker å ha samme opplevelse over alle plattformene. Som produkteier ønsker jeg at appen skal være enkel og billig å vedlikeholde i fremtiden (hvordan teste ut det? Hva betyr enkel og billig?) Som bruker ønsker jeg at appen skal være lett altså ta lite blass både i minne og lagring Som produkteier ønsker jeg at appen skal se profesjonell ut slik at jeg kan fremme mine interesser (hva betyr profesjonell? Følge standarder som brukes i app er som brukes i arbeidslivet/profesjonelt seriøsitet) Som produkteier ønsker jeg at appen skal være lett å koble opp mot mine andre produkter (f.eks. felles innlogging, lenker til relaterte tjenester) kompatibilitet Som buker ønsker jeg å kunne benytte meg av tredjeparts verifisering gjennom f.eks google eller facebook. IN2001/ 19.2.2018 / Dag Sjøberg Slide 14 7

Gruppe 3 Ikke-funksjonelle krav: Legal: ikke lekke søkehistorikk (konfidensialitet, personvern) Performance: 40 requests per 10. sekund Usability: easy to use. verdiløs dersom bruker ikke klarer å bruke appen (hvordan teste dette?) Development req: det skal være mulig å oppdatere og vedlikeholde appen (hva betyr mulig?) IN2001/ 19.2.2018 / Dag Sjøberg Slide 15 Gruppe 4 Videreutvikling (relativt enkelt å videreutvikle, kompatibilitet) Enkel kode som følger godtatte standarder God versjonskontroll og dokumentasjon Brukbarhet (usability testing) Fart på spørringer (ytelse/performance efficieny) Sikker (hva betyr det i praksis?) Dersom vi har brukerinformasjon så er dette ekstra viktig Etiske hensyn, personvern, Selge informasjon til tredjepart? IN2001/ 19.2.2018 / Dag Sjøberg Slide 16 8

Når kriteriene for evaluering er klare, hvordan gjennomføre evalueringen? Hvilke (forsknings/undersøkelses)metoder egner seg? Eksperiment Case-studie Etnografi (observasjon) Spørreskjema-undersøkelse (survey) IN2001/ 19.2.2018 / Dag Sjøberg Slide 17 (Kontrollert) eksperiment Et eksperiment undersøker årsak-virkning hva fører til hva? Manipulerer (endrer) det fenomenet man studerer, og så måler man virkningen Enkeltindivider eller team (deltakere) utfører like oppgaver der hensikten er å sammenligne ulike treatments IN2001/ 19.2.2018 / Dag Sjøberg Slide 18 9

Eksperiment Uavhengige variable (treatment) IT-system/app Effekt Avhengige variable (resultat) Tid & Kvalitet Moderator variable (kontekst), f.eks. kompetanse IN2001/ 19.2.2018 / Dag Sjøberg Slide 19 Case-studier Eksperimenter svarer på hva effekten er, casestudier mer på hvordan og hvorfor Case-studier legger vekt på å studere fenomener i sine naturlige omgivelser Case-studier har få datapunkter og mange variable. Derfor generalisering ved bruk av teori, ikke statistikk som i eksperimenter IN2001/ 19.2.2018 / Dag Sjøberg Slide 20 10

Intervjuer ofte brukt i case-studier Strukturerte intervjuer Ø Spørsmålene definert på forhånd, veldefinerte svaralternativer. Kan kvantifisere (telle opp) hvor mange som svarer hva på hvert spørsmål Semistrukturerte intervjuer Ø Intervjuerne baserer seg på stikkord og spørsmål som evt. kan droppes underveis, og nye spørsmål kan stilles avhengig av hvordan intervjuet forløper Åpne (ustrukturerte) intervjuer Ø Forløper seg mer som en samtale mellom intervjuer og intervjuobjekt IN2001/ 19.2.2018 / Dag Sjøberg Slide 21 Etnografi/observasjon IN2001/ 19.2.2018 / Dag Sjøberg Slide 22 11

Metode Dyp forståelse av folk, organisasjon og konteksten for arbeidet Forskeren observerer over lengre tid hva folk gjør og er mer involvert i gruppen som studeres enn i case-studier Personene som studeres trenger ikke å forklare hva de gjør IN2001/ 19.2.2018 / Dag Sjøberg Slide 23 Spørreskjemaundersøkelser (Surveys ) IN2001/ 19.2.2018 / Dag Sjøberg Slide 24 12

Spørreskjemaer type spørsmål Numeriske verdier, for eksempel alder Svarkategorier, for eksempel stillingstype Ja/Nei-svar Ordinalskala som vanligvis er bedre for holdninger og preferanser. Tre typer Enighetsskalaer, f.eks. 5-nivå Likert-skala med kategoriene: sterkt uenig, uenig, verken uenig eller enig, enig, sterkt enig Frekvensskala, for eksempel aldri, sjelden, av og til, ofte, alltid Evalueringsskalaer: svært dårlig, dårlig, passe, god, veldig god Åpne spørsmål IN2001/ 19.2.2018 / Dag Sjøberg Slide 25 Pålitelighet og gyldighet Se https://www.socialresearchmethods.net/kb/relandval.php IN2001/ 19.2.2018 / Dag Sjøberg Slide 26 13

Gruppeoppgave 2 Hvilken metoder kan anvendes på hvilke kriterier? (Innspill fra gruppene angitt i rødt på de neste slidene. Fikk bare 2,5 minutter til å registrere innspill fra hver gruppe i plenum, så ikke fullstendig oppsummering.) IN2001/ 19.2.2018 / Dag Sjøberg Slide 27 Gruppe 1 Ikke funksjonelle: Nedetid på maks 15 minutter, tid mellom hver gang nede? Samle inn data over tid, evt. gjennomføre scenarier ved å pushe ny versjon eller oppdatering og teste om dette kan gjøres innen 15 minutter God arkitektur for videreutvikling Ekstern ekspertvurdering / tredjepart (ulempe å bruke en av app utviklerne fordi han/hun kjenner denne) Mulig å drive versjonshåndtering Høy nok sikkerhet (hva betyr det konkret?) Lav feilrate (mål på dette?) Rask responstid (mål på dette?) Følger designplattformer Ikke vise offensive bilder (nakenhet/blasfemi osv) (følge rating filmprodusenter) IN2001/ 19.2.2018 / Dag Sjøberg Slide 28 14

Gruppe 2 Som bruker ønsker jeg å benytte appen på både mine Android og mine ios devices. Jeg ønsker å ha samme opplevelse over alle plattformene. Observasjon/etnografi evt. spørreundersøkelser for å se om app en tilfredsstiller brukeren Som produkteier ønsker jeg at appen skal være enkel og billig å vedlikeholde i fremtiden (hvordan teste ut det? Hva betyr enkel og billig?) Som bruker ønsker jeg at appen skal være lett altså ta lite plass både i minne og lagring La folk bruke den og observer, men også intervjue brukerne (semistrukturert, men viktig å være åpen for at folk kan si det de har på hjertet). Som produkteier ønsker jeg at appen skal se profesjonell ut slik at jeg kan fremme mine interesser (hva betyr profesjonell? Følge standarder som brukes i app er som brukes i arbeidslivet/profesjonelt seriøsitet) Som produkteier ønsker jeg at appen skal være lett å koble opp mot mine andre produkter (f.eks. felles innlogging, lenker til relaterte tjenester) kompatibilitet Som buker ønsker jeg å kunne benytte meg av tredjeparts verifisering gjennom f.eks google eller facebook. IN2001/ 19.2.2018 / Dag Sjøberg Slide 29 Gruppe 3 Ikke-funksjonelle krav: Legal: ikke lekke søkehistorikk (konfidensialitet, personvern) La uavhengige sikkerhetsselskaper prøve å hente ut info som de ikke skal ha tilgang til Performance: 40 requests per 10. sekund Stresstesting Usability: easy to use. verdiløs dersom bruker ikke klarer å bruke appen (hvordan teste dette?) Observasjon Development req: det skal være mulig å oppdatere og vedlikeholde appen (hva betyr mulig?) Statisk og dynamiske analyseverktøy, spørreundersøkelse blant utviklere (hva synes de om koden de har jobbet med) IN2001/ 19.2.2018 / Dag Sjøberg Slide 30 15

Gruppe 4 Videreutvikling (relativt enkelt å videreutvikle, kompatibilitet) Eksperiment med et team som skal videreutvikle app en (test en ny tjeneste på alle 4 appene) Evt. ekstern ekspert som ser på koden til alle 4 app ene Enkel kode som følger godtatte standarder God versjonskontroll og dokumentasjon Brukbarhet (usability testing) Fart på spørringer (ytelse/performance efficieny) eksperimenter Sikker (hva betyr det i praksis?) Dersom vi har brukerinformasjon så er dette ekstra viktig Etiske hensyn, personvern, Selge informasjon til tredjepart? IN2001/ 19.2.2018 / Dag Sjøberg Slide 31 16