Estimering av IT-prosjekter: Hva vet vi? Hvordan bli bedre?

Like dokumenter
Estimering av IT-prosjekter:

Hvordan estimering av ideell tid gjør deg mer realistisk (med innlagt NM i estimering)

Estimering av IT-prosjekter: Hvorfor bommer vi og hvordan kan vi

Estimater, usikkerhet, kommunikasjon

Estimering av IT-utvikling

Making IT your winning asset.

ESTIMERING I SMIDIGE PROSJEKTER

Planleggingsfasen.. Estimering av kostnader i IT-prosjekter. Gjennomføringen. Hvor gode er vi til å planlegge (estimere kostnader) ihht Standish Group

Hvordan kundens anbudsprosess får deg til å estimere overoptimistisk og hva du kan gjøre med det

Hvem passer offshoring for? Hva er viktig for å lykkes? Magne Jørgensen Simula Research Laboratory

Hvordan forbedre estimering av tid og kostnader i IT-prosjekter. Magne Jørgensen Simula Research Laboratory

Viktige faktorer ved outsourcing

Figur 1: Estimat per gruppe

Bedre valg av leverandør gjennom trialsourcing & Fastpris eller per time?! Oslo, 1. desember, 2014 Magne Jørgensen

Forskning på gruppe-estimeringestimering

Hvordan få tak i reell usikkerhet av kost-nytte i en skjev verden? Magne Jørgensen

Nyttestyring og viktigheten av den gode kunde

Tyve fagpersoner fra samme firma estimerte hver for seg arbeidsmengden for det samme systemutviklingsprosjektet [*]

Nyttestyring og viktigheten av den gode kunde. Magne Jørgensen

Hvorfor (ikke) fastpris?!! Vinnerens forbannelse,! informasjonsasymmetri,! utvalgsrisiko,! opportunistisk adferd,! og! IT-kontrakter!!

Estimering av kostnader i IT-prosjekter. Stein Grimstad (Simula)

ESTIMERING AV SYSTEMUTVIKLINGSARBEID

Planleggingsfasen.. Estimering av kostnader i IT-prosjekter. Overskridelser. Gjennomføringen. Stein Grimstad (Simula)

Hvordan få tak i reell usikkerhet av kostnad og nytte - i en skjev verden?

Kundetilfredshetsundersøkelse FHI/SMAP

Min bakgrunn for å mene noe

Hvordan tilrettelegge for realisme i estimater av arbeidsmengde i IT-prosjekter

Evaluering av digitalisering i offentlig sektor Hvor gode er vi? Evaluerer vi det som er viktig? Trenger vi mer eller annen type evaluering?

Hvordan unngå skuffelser i ITprosjekter

Min bakgrunn for å mene noe "

Den gode kunde. Kompetanse, involvering og kultur. Magne Jørgensen Simula Research Laboratory

Magne Jørgensen Simula Research Laboratory University of Oslo Scienta

What is is expertise expertise? Individual Individual differ diff ences ences (three (thr ee cent cen r t a r l a lones): easy eas to to test

Baltic Sea Region CCS Forum. Nordic energy cooperation perspectives

Estimering av kostnader i softwareutvikling. Hans Christian Benestad PhD, Expertware AS

Tom Røise 25. Januar 2011

Du er mer lik meg! enn jeg er lik deg!!! Asymmetri i relativ estimering!

Estimering av kostnader i ITprosjekter

Vurderinger og beslutninger Hvor rasjonelle er vi?

Making IT your winning asset.

Bærekraftig FM til tiden/ Bærekraftig FM på tid

SRP s 4th Nordic Awards Methodology 2018

Erfaringer fra en Prosjektleder som fikk «overflow»

Vinnerens forbannelse,! informasjonsasymmetri,! utvalgsrisiko,! moralsk risiko! og! IT-kontrakter!

Planleggingsfasen.. Estimering av kostnader i IT-prosjekter. Overskridelser. Gjennomføringen. Magne Jørgensen. Industriell Systemutvikling

ISO 41001:2018 «Den nye læreboka for FM» Pro-FM. Norsk tittel: Fasilitetsstyring (FM) - Ledelsessystemer - Krav og brukerveiledning

Risikofokus - også på de områdene du er ekspert

Invitation to Tender FSP FLO-IKT /2013/001 MILS OS

Requirements regarding Safety, Health and the Working Environment (SHWE), and pay and working conditions

Emneevaluering GEOV272 V17

Prosjektstyring, metodikk og løsningsutforming for SAP prosjekter. Sveinung Gehrken Fram

Skjema for spørsmål og svar angående: Skuddbeskyttende skjold Saksnr TED: 2014/S

FME-enes rolle i den norske energiforskningen. Avdelingsdirektør Rune Volla

... Annita Fjuk DESIGN THINKING

Q2 Results July 17, Hans Stråberg President and CEO. Fredrik Rystedt CFO

Smart High-Side Power Switch BTS730

Hvorfor Læring av Erfaring er Vanskelig og Hvordan Bli Bedre

Passenger Terminal World Expo 2011 Copenhagen, Denmark. Steven B. Cornell Assoc. Vice President

Midnight BBQ Light USER MANUAL

Hva vet vi om IT-bransjens evne til å levere nyttige løsninger med god kvalitet?

Fremtidens ombordproduksjon. Ari Th. Josefsson FishTech 2014 Ålesund

Prosjektestimering i norsk software-industri. Kjetil Moløkken-Østvold

Den europeiske byggenæringen blir digital. hva skjer i Europa? Steen Sunesen Oslo,

Utvikling av skills for å møte fremtidens behov. Janicke Rasmussen, PhD Dean Master Tel

Digital Transformasjon

Mål med prosjektet. proactima.com. Utvikle, markedsføre og selge den beste løsningen for Risikostyring og HMS ledelse for det globale markedet

Hva kjennetegner IT-prosjekter som lykkes?

Complete tank expertise

Estimering av kostnader i IT-prosjekter

Familieeide selskaper - Kjennetegn - Styrker og utfordringer - Vekst og nyskapning i harmoni med tradisjoner

Forecast Methodology September LightCounting Market Research Notes

HONSEL process monitoring

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

// Translation // KLART SVAR «Free-Range Employees»

Nye krav i ISO 9001, hvilke er de og hvordan implementere disse i TQM? Ragna Karoline Aasen

EURES - en tjeneste i Nav. Hjelp til rekruttering av europeisk arbeidskraft

Midler til innovativ utdanning

Quality Policy. HSE Policy

Estimering av kostnader i IT-prosjekter. Nils Christian Haugen Wasteless AS

En praktisk anvendelse av ITIL rammeverket

Tema. Informasjonsarkitektur Brukervennlighet/Usability Kommunikasjon som treffer målrettet kommunikasjon

Hva kjennetegner IT-prosjekter som lykkes?

Forskningsrådets rolle som rådgivende aktør - innspill til EUs neste rammeprogram, FP9 og ERA

HVILKE ENDRINGER KAN BRANSJEN FORVENTE SEG FREMOVER SETT FRA ET BRUKERPERSPEKTIV CHRISTIAN HEIBERG, EXECUTIVE DIRECTOR CBRE AS NORSK EIENDOM

Trust in the Personal Data Economy. Nina Chung Mathiesen Digital Consulting

2A September 23, 2005 SPECIAL SECTION TO IN BUSINESS LAS VEGAS

Horisont 2020 EUs forsknings- og innovasjonsprogram. Brussel, 6. oktober 2014 Yngve Foss, leder, Forskningsrådets Brusselkontor

Ekstraordinær generalforsamling HAVFISK ASA

GDPR og diskusjonene som går i markedet. Advokat Eva Jarbekk

Dagens tema: Eksempel Klisjéer (mønstre) Tommelfingerregler

PSi Apollo. Technical Presentation

Prinsipper for Estimering av Utviklingskostnader i IT-prosjekter

SAMPOL115 Emneevaluering høsten 2014

Hvordan jobber reiselivsgründere med sine etableringer? Sølvi Solvoll Klyngesamling, Bodø

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

Has OPEC done «whatever it takes»?

Little Mountain Housing

Lønner det seg å investere i IT-prosjekter? Magne Jørgensen

Eiendomsverdi. The housing market Update September 2013

Updated Articles of the EPCI NS8407

Transkript:

Estimering av IT-prosjekter: Hva vet vi? Hvordan bli bedre? Magne Jørgensen Simula Research Laboratory www.simula.no

Hvor gode er vi til å estimere? Stort sett så er vi ikke så aller verst. IKKE tro på rapporter fra Standish Group og andre som ikke har et bevisst forhold til seleksjon av prosjekter. Trolig er gjennomsnitlig overskridelse på 20-30%. Men, det er noen få store prosjekter som trekker veldig opp dersom vi måler i absolutt overskridelse (se figur). Det er forskjell på de skumle og de normale prosjektene og vi er ikke veldig gode i å anslå usikkerhet.

Er store prosjekter vanskeligere å estimere? (Data: Danske problemprosjekter) RE = (Act Est)/Est Høy korr. mellom faktisk arbeidsmengde og overskridelse Lav korr. mellom estimert arbeidsmengde og overskridelse

Ingen klar sammenheng mellom størrelse og overskridelse Maintenance Tasks Mixed projects 1400 1200 1000 Variable RankAct RankEst 100 80 Variable RankAct RankEst RankRE 800 600 RankRE 60 40 400 200 20 0 0 0 200 400 600 800 X-Data 1000 1200 1400 0 20 40 X-Data 60 80 100 En manglende sammenheng tyder på at overskridelser skyldes heller mange små, enn et stort problem. Dette støttes av flere rapporter, f eks, rapport fra NHS (UK) som hevder at The devil is in the details

Indikatorer på skumle prosjekter Iboende faktorer: Vi gjør ting som er grunnleggende forskjellig fra det vi har gjort før Mange grensesnitt til andre systemer og/eller mange interessenter Involverer stor grad en prosessendring Problemene som skal løses er komplekse Uflaks (mange små eller få store uflakser ) Faktorer vi kan gjøre noe med Realisme i ambisjoner Situasjoner og motivasjoner som gir over-optimisme Kompetanse til kunde og leverandør Oppfølging, støtte, og ledelsesforankring Kommunikasjon, inkludert økt oppmerksomhet rundt kulturelle forhold Anbudsprosesser (unngå winner s curse og adverse selection ) Egnede utviklingsmodeller (særlig relatert til oppdeling av leveranse)

Noen funn i ESSU (UK): Many projects are overambitious. Long-term or delayed projects are often overtaken by new technology, changes in legislation and public policy. The private sector often overstates its ability to deliver. Clients are often under-resourced and/or do not have the required skills. The procurement process is a high-risk strategy, heavily influenced by market forces in respect to who bids, the level of competition and private sector strategies to increase market share. Some projects are driven by the application of the latest information and communications technology to meet customer demand for seamless one stop contact centres combined with pressure to achieve substantial savings. However, a more incremental approach may be more desirable, effective and economical. Off-the-shelf is no guarantee for success. Many projects were based on off-the-shelf products, but nevertheless failed. http://www.european-services-strategy.org.uk/news/2007/ict-contract-chaos/105-ict-contracts.pdf

Hva kommer overoptimismen av?

Overvurdering av egne evner er normalt hos mentalt friske mennesker! 8

Undervurdering av risiko er normalt (Risiko for egen skilsmisse er for eksempel sterkt undervurdert selv om de fleste vet at nær 50% av ekteskap sprekker) 9

Biologi Evolusjonen synes å ha belønnet selvsikkerhet og risikoundervurdering. IT-ledere belønner selvsikkerhet og bruker den som indikator på dyktighet. En del indikasjoner på sammenheng mellom optimisme og biologi. F eks, så hjelper trolig optimisme på en del sykdomsforløp (styrking av immunforsvar), og håndtering av problematiske situasjoner ( coping ). Simulering indikerer at overoptimisme i noen sammenhenger gir systematisk bedre utfall enn realisme. Dette gjelder særlig når man vet lite om sannsynligheten for ulike utfall, men mer om konsekvensene av utfallene. 10

Grupper og optimisme Mange studier viser en økt risikovilje og over-sikkerhet (over-confidence), kanskje pga individenes reduserte ansvar for beslutningene. Våre studier på IT-prosjekter indikerer imidlertid mer realisme ved bruk av grupper til å estimere! Flere hoder husker på mer (union av aktiviteter) Krav om begrunnelse kan gi økt realisme Noen ganger forekommer imidlertid group think og dominerende individer F eks at alle i gruppen går ut av en estimeringsdiskusjon med opplevelsen av at estimatet ble for lavt. Effekten av grupper på realisme trolig svært kontekstavhengig, dvs vanskelig å finne generelle mønstre. Bruk av Delphi-baserte metoder (strukturerte grupper med uavhengige vurderinger) gir stort sett svært bra innvirkning på realisme. Som for eksempel Planning Poker eller Wideband Delphi 11

Motivasjon Mange resultater viser sterk sammenheng mellom motivasjon for høy ytelse (ønsketenkning) og overoptimisme. Optimisme kan påvirke ytelsen positivt, MEN Optimistiske estimater synes typisk å ha kun en kortvarig positiv effekt på gjennomføringen. Hvor stor og hvor positiv effekten av optimisme er på ytelse overvurderes oftest sterkt. 12

Kognitive prosesser Planlegging (visualisering av fremtidsscenarier) gir ofte mindre grad av realisme enn historierefleksjoner (hvordan det har gått)! Analogi-basert estimering gir ofte gode resultater Overvurdering av hvor mye vi kan kontrollere/håndtere er en viktig kilde til overoptimisme (the illusion of control) Dyktighet vs uflaks er ofte et spørsmål om man lykkes eller mislykkes 13

Kunder velger over-optimistiske leverandører Winner s curse Vektlegging av pris + mange tilbydere: Vi vinner nesten bare når vi har vært over-optimististiske. Kan gjøre gode leverandører dårlige Manipulerende informasjon Budsjettinformasjon (Lånekassens IT-system hevdes å ha blitt estimert av stortingspolitikerne, som bestemte budsjettet). Bruk av ladede ord ( lite system ) Adverse selection Jo mindre kompetanse hos leverandør, jo lavere estimat og pris Jo mindre kompetanse hos kunde, jo mer vektlegging av lav pris Kunde velger mindre kompetent og over-optimistisk leverandør 14

Ankereffekter Eksperiment: HIGH (LOW) group: The customer has indicated that he believes that 1000 (50) work-hours is a reasonable effort estimate for the specified system. However, the customer knows very little about the implications of his specification on the development effort and you shall not let the customer s expectations impact your estimate. Your task is to provide a realistic effort estimate of a system that meets the requirements specification and has a sufficient quality. Deltakere: Erfarne systemutviklere. Alle (HIGH, LOW, CONTROL) fikk samme kravspesifikasjon. 15

Resultater: Ankereffekter HIGH group gjennomsnitt: 555 timeverk CONTROL group (uten forventinger) gjennomsnitt: 456 timeverk LOW group gjennomsnitt: 99 timeverk!!! Ingen av utviklerne opplevde at de hadde blitt mye påvirket. De fleste mente at de ikke var påvirket i det hele tatt av kundens forventninger. 16

Feltstudie av det samme. The preliminary budget of the new system is $10 000 [corresponding to about 100 work-hours with typical pricing in the country in which it will be built]. The preliminary budget is not built on any knowledge about the actual cost of developing the new system, and will, if needed, be extended to cover the expenses necessary to build a quality system with the desired functionality. 100 timeverk var en svært lav verdi for dette prosjektet og alle firmaene ble instruert om å IKKE bruke dette som input til estimatet. Firmaene som deltok visste ikke at de var med i en studie, men skulle gi uavhengige estimater på et arbeid som skulle utføres av andre (mao ingen direkte grunn til å være optimistiske). Firmaene ble betalt for estimeringsarbeidet. 17

Resultater fra feltstudien Numerical Anchor Group Manipulated (client s expectation, 100 workhours) Ordinary Median estimate 724 work-hours (n=23) 956 work-hours (n=23) Mindre effekt enn i laboratoriet, men fortsatt en effekt av betydning. Trolig større effekt dersom man er i tilbuds-modus. 18

Ladede ord kan også fungere som anker Estimates of development effort (work-hours) 500 400 300 200 100 0 Minor extension New functionality

Irrelevant informasjon påvirker estimatet Estimates of development effort (work-hours) 600 500 400 300 200 100 0 Control With irrelevant information

Usikkerhetsvurderinger Minimum-maksimum intervall: Nesten helt sikker = 60-70% sikkert. Konfidensnivå betyr minimalt for bredden på intervallene. Eksperiment med fire grupper av utviklere (A: 50%, B: 75%, C: 90, D: 99% konfidensnivå) Nesten samme minimum-maksimum intervaller ble angitt. Meningsløst å be om minimum-maksimum intervaller. Be i stedet om: Angi en fordeling av estimeringsfeil for lignende prosjekter. Bruk denne til å anslå usikkerhet. Eksempel: Dersom 80% av tidligere prosjekter har overskredet estimatet med mindre enn 50%, så kan du være 80% sikker på at et budsjett som er lik 1,5*estimatet ikke vil bli overskredet. Hovedfordel er fornuftig bruk av historiske data og unngåelse av ønsketenkning. Evaluert i reelle prosjekter med god virkning.

Ja takk, begge deler. Studie viste at dersom gode analogier ble funnet, så var topdown den beste. I gjennomsnitt var imidlertid bottom-up best. Overraskende funn: Estimeringsteamene var relativt dårlige i å finne og bruke lignende prosjekter. Top-down eller bottom-up Kan være stort potensiale for opplæring og bruk av relativ estimering på prosjektnivå a la relativ estimering på user story nivå i agile.

Hva får vi når vi ber om et estimat? Planlagt arbeidsmengde (med risikobuffer)? Median arbeidsmengde (50% sannsynlighet for å overskride)? Mest sannsynlig arbeidsmengde? Mest sannsynlig arbeidsmengde under ideelle forutsetninger?

Estimat synes typisk å gjenspeile Hvis ingen ting går galt

Flere studier viser at Det er ofte liten eller ingen forskjell i prediksjoner gitt under idelle og realistiske scenarier. Dette har blant annet vært undersøkt innen: Tidsestimering Blodgiving Treningsmengde Sparing

Feil spørsmål, eller feil svar? Hva gjør man når respondentene ikke svarer på det man spør om, men på noe annet? Endrer respondentenes oppførsel gjennom bedre opplæring, bedre instruksjoner, etc? Endrer spørsmålet til å spørre om det som respondentene uansett gir svar på? Vi har evaluert en metode basert på det siste alternativet.

Eksperiment 1 IDEAL-ML: Først ideell tid, deretter mest sannsynlig tid. ML-IDEAL: Først mest sannsynlig, så ideell tid. Ideell tid: Antall timeverk antatt full konsentrasjon, uten forstyrrelser og fullt ut produktiv. Faktisk tid: Ca. 100 timeverk. Estimates (work-hours) 300 250 200 150 100 50 IDEAL-ML mest realistisk. 0 IDEAL samme som ML. Group IDEAL-ML ML-IDEAL Most likely effort IDEAL-ML ML-IDEAL Ideal effort 25% i ML-IDEAL gruppen økte ikke estimated fra ML til IDEAL.

IDEAL-ML: Først IDEAL, så ML. Eksperiment 2 ML-IDEAL: Først ML, så IDEAL. MIN-ML: Først MIN, så ML. Realistisk tid: Ca. 140 minutter. IDEAL-ML mest realistisk. IDEAL samme som ML. Effort estimates (minutes) 400 300 200 100 MINIMUM først hadde IKKE samme effekt som IDEAL først. Group 0 IDEAL-ML MIN-ML ML-IDEAL Most likely effort IDEAL-ML MIN-ML ML-IDEAL Ideal/minimum effort

IDEAL->ML metoden 1. Be om et estimat under antagelsen av ideelle betingelser. a. Ulike formuleringer av hva som menes med ideelle betingelser synes å gi noenlunde samme effekt. b. Må skille seg tydelig fra realistiske betingelser. 2. Be deretter om et estimat av hva arbeidet realistisk sett krever, f eks i form av mest sannsynlig antall timeverk). a. Vi har tidligere funnet at mer risikoanalyse kan gi mer optimistiske estimater. Denne metoden er trolig mer motstandsdyktig mot denne effekten, men det kan likevel være lurt å splitte denne estimeringen i to deler: I. Fase 1: Estimer realistisk arbeidsmengde for kjente aktiviteter og kjent risiko. II. Fase 2: Estimer tillegg for ukjente aktiviteter. Baser dette på historikk over andel timeforbruk på ikke-planlagte aktiviteter og ikke-identifiserte risiko.

Kultur: Hvor like er vi egentlig.? PDI: Power distance index IDV: Individualism MAS: Masculinity UAI: Uncertainty avoidance index LTO: Long term orientation Mer om dette på: http://www.geert-hofstede.com/

Ingen systematiske forskjeller i påvirkning (men legg merke til de lave estimatene fra India) Estimation Task 1 Estimation Task 2 Estimation Task 3 Group Low anch. High anch. Diff Minor ext. New func. Diff Control Irr. Inf. Diff India 25 150 125*** 63 80 17 30 58 28* Nepal 11 120 109*** 50 152 102* 80 90 10 Poland 12 100 88*** 102 110 8 80 100 20 Romania 10 70 60*** 95 100 5 50 70 20 Ukraine 10 100 90*** 120 120 0 60 200 140* Vietnam 25 100 75*** 90 120 30 100 100 0

Sekvenseffekt TS-TM: Estimerte først et lite system (ca. 25 tv), så det middels store. TL-TM: Estimerte først et relativt sett stort system (ca. 500 tv) så det middels store.

Kan vi prediktere hvem som vil være mest realistisk? Få robuste resultater. Eneste faktor som er noenlunde bra (men heller ikke den veldig bra) er tidligere estimeringsnøyaktighet Uklart hva estimeringsekspertise egentlig er.

Oppsummert: Hvilke godt dokumenterte forbedringsmuligheter har vi? Bruk av historiske data ( looking back ) F eks: Analogi-basert estimering og usikkerhetsvurderinger basert på tidligere fordeling av estimeringsfeil (NB: Generelle estimeringsmodeller fungere dårlig) Ansvarlig for innsamling og bruk av historiske data: Cost engineer? Special Estimation Force? Kombinering av UAVHENGIGE estimeringsmetoder og estimeringseksperter Finne relevant ekspertise (som er SMAL!) Gruppe-estimering (gitt at den ikke er dominert av en person) Unngå villedende og irrelevant informasjon, f eks ved å fjerne nøytralisere irrelevant og villedende informasjon før estimering. Unngå Winner s curse (lettere sagt enn gjort, men noe kan gjøres) Identifikasjon av skumle prosjekter og gi disse særlig oppmerksomhet.