Estimering av IT-prosjekter: Ekspertestimat eller modell? Magne Jørgensen

Like dokumenter
Estimering av IT-prosjekter: Ekspertestimat eller modell?

Prinsipper for Estimering av Utviklingskostnader i IT-prosjekter

Hvordan tilrettelegge for realisme i estimater av arbeidsmengde i IT-prosjekter

ESTIMERING I SMIDIGE PROSJEKTER

Tyve fagpersoner fra samme firma estimerte hver for seg arbeidsmengden for det samme systemutviklingsprosjektet [*]

Planleggingsfasen.. Estimering av kostnader i IT-prosjekter. Gjennomføringen. Hvor gode er vi til å planlegge (estimere kostnader) ihht Standish Group

Forskning på gruppe-estimeringestimering

Social Project Management. CIO Konferansen Prosjektstyring 09. juni 2016

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

What is is expertise expertise? Individual Individual differ diff ences ences (three (thr ee cent cen r t a r l a lones): easy eas to to test

Making IT your winning asset.

Nyttestyring og viktigheten av den gode kunde

Neural Network. Sensors Sorter

Nyttestyring og viktigheten av den gode kunde. Magne Jørgensen

Vurderinger og beslutninger Hvor rasjonelle er vi?

Utvikling av skills for å møte fremtidens behov. Janicke Rasmussen, PhD Dean Master Tel

Estimering av kostnader i IT-prosjekter. Stein Grimstad (Simula)

Generalization of age-structured models in theory and practice

Planleggingsfasen.. Estimering av kostnader i IT-prosjekter. Overskridelser. Gjennomføringen. Stein Grimstad (Simula)

Den som gjør godt, er av Gud (Multilingual Edition)

... Annita Fjuk DESIGN THINKING

TDT4117 Information Retrieval - Autumn 2014

Hvordan få tak i reell usikkerhet av kost-nytte i en skjev verden? Magne Jørgensen

Perpetuum (im)mobile

Figur 1: Estimat per gruppe

Accuracy of Alternative Baseline Methods

Dean Zollman, Kansas State University Mojgan Matloob-Haghanikar, Winona State University Sytil Murphy, Shepherd University

ELEVINVOLVERING- FRA VURDERING TIL LÆRING

Speed Racer Theme. Theme Music: Cartoon: Charles Schultz / Jef Mallett Peanuts / Frazz. September 9, 2011 Physics 131 Prof. E. F.

Hvordan få tak i reell usikkerhet av kostnad og nytte - i en skjev verden?

Hvor mye praktisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

PATIENCE TÅLMODIGHET. Is the ability to wait for something. Det trenger vi når vi må vente på noe

Gol Statlige Mottak. Modul 7. Ekteskapsloven

GEOV219. Hvilket semester er du på? Hva er ditt kjønn? Er du...? Er du...? - Annet postbachelor phd

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

HONSEL process monitoring

Hvordan estimering av ideell tid gjør deg mer realistisk (med innlagt NM i estimering)

Tom Røise 25. Januar 2011

1. Explain the language model, what are the weaknesses and strengths of this model?

M A M M estre A mbisiøs M atematikkundervisning. Novemberkonferansen 2015

Molare forsterkningsbetingelser

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

SIKKERHET SOM INVESTERING HVORDAN KONTROLLER SIKKERHETSKOSTNADENE?

Estimering av kostnader i ITprosjekter

Metodisk kvalitetsvurdering av systematisk oversikt. Rigmor C Berg Kurs H, mars 2019

Emnedesign for læring: Et systemperspektiv

Trigonometric Substitution

6350 Månedstabell / Month table Klasse / Class 1 Tax deduction table (tax to be withheld) 2012

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

Bostøttesamling

Exercise 1: Phase Splitter DC Operation

Slope-Intercept Formula

EXAM TTM4128 SERVICE AND RESOURCE MANAGEMENT EKSAM I TTM4128 TJENESTE- OG RESSURSADMINISTRASJON

Eksamen ENG1002/1003 Engelsk fellesfag Elevar og privatistar/elever og privatister. Nynorsk/Bokmål

Ole Isak Eira Masters student Arctic agriculture and environmental management. University of Tromsø Sami University College

Stordata og offentlige tjenester personvernutfordringer?

Eksamensoppgaver til SOSANT1101. Regional etnografi: jordens folk og kulturelt mangfold. Utsatt skoleeksamen 15. desember 2011 kl.

Geir Lieblein, IPV. På spor av fremragende utdanning NMBU, 7. oktober 2015 GL

Andrew Gendreau, Olga Rosenbaum, Anthony Taylor, Kenneth Wong, Karl Dusen

THE MONTH THE DISCIPLINE OF PRESSING

System integration testing. Forelesning Systems Testing UiB Høst 2011, Ina M. Espås,

Passasjerer med psykiske lidelser Hvem kan fly? Grunnprinsipper ved behandling av flyfobi

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Midler til innovativ utdanning

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Dybdelæring i læreplanfornyelsen

Du er mer lik meg! enn jeg er lik deg!!! Asymmetri i relativ estimering!

Hvordan jobber reiselivsgründere med sine etableringer? Sølvi Solvoll Klyngesamling, Bodø

Physical origin of the Gouy phase shift by Simin Feng, Herbert G. Winful Opt. Lett. 26, (2001)

UNIVERSITETET I OSLO

TEORI OG PRAKSIS. Kjønnsidentitet og polaritetsteori. En kasusstudie av en samtalegruppe med transpersoner

Epidemiologi og risikovurdering. Disposisjon. Epidemiologi. Noen begreper. Metoder epidemiologi

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

Tas vitenskapelig uredelighet tilstrekkelig alvorlig?

The Norwegian Citizen Panel, Accepted Proposals

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

EN Skriving for kommunikasjon og tenkning

FIRST LEGO League. Härnösand 2012

Bra og enkelt et dilemma i usikkerhetsanalyser? Olav Torp Førsteamanuensis NTNU, Institutt for bygg, anlegg og transport

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

Databases 1. Extended Relational Algebra

DESIGNSTRATEGI I MØTET MED EN ORGANISASJON

Eti Estimering i av kostnader i IT-prosjekter. Stein Grimstad (Simula)

Climate change and adaptation: Linking. stakeholder engagement- a case study from

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

The regulation requires that everyone at NTNU shall have fire drills and fire prevention courses.

Bedre valg av leverandør gjennom trialsourcing & Fastpris eller per time?! Oslo, 1. desember, 2014 Magne Jørgensen

2A September 23, 2005 SPECIAL SECTION TO IN BUSINESS LAS VEGAS

Viktige faktorer ved outsourcing

Planleggingsfasen.. Estimering av kostnader i IT-prosjekter. Overskridelser. Gjennomføringen. Magne Jørgensen. Industriell Systemutvikling

Litteraturoversikter i vitenskapelige artikler. Hege Hermansen Førsteamanuensis

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

Familieeide selskaper - Kjennetegn - Styrker og utfordringer - Vekst og nyskapning i harmoni med tradisjoner

Anna Krulatz (HiST) Eivind Nessa Torgersen (HiST) Anne Dahl (NTNU)

Dynamic Programming Longest Common Subsequence. Class 27

Hvordan kundens anbudsprosess får deg til å estimere overoptimistisk og hva du kan gjøre med det

Call function of two parameters

Emneevaluering GEOV272 V17

Transkript:

Estimering av IT-prosjekter: Ekspertestimat eller modell? Magne Jørgensen

Nå-situasjon Bruk av estimeringsmodeller anbefales av autoriteter, men brukes lite. Mores and Edwards: Even though estimation is regarded as a problem by almost all the respondents [91%], the use of commercial tools or the development of in-house estimating models remains low. This result holds even though more than three-quarters of companies fulfil the basic requirements for the development, calibration and use of these tools. Vår studier (foreløpig analyse) antyder en nedgang heller enn en økning i bruk av estimeringsmodeller. I de fleste andre felt finner forskerne at modeller er mer treffsikre enn ekspertene. Paul Meehl: When you are pushing 90 investigations, predicting everything from the outcomes of football games to the diagnosis of liver disease and when you can hardly come up with a half dozen studies showing even a weak tendency in favor of the clinician [the expert judgment], it is time to draw a practical conclusion. 2

Hvorfor brukes ikke modeller mer hos oss? Er systemutviklere ignoranter som ikke vet sitt eget beste? Eller kan det tenkes at modellene ikke gir de gevinstene man tror og håper? Og hva er egentlig forskjellen mellom modell og ekspert-baserte estimater? 3

Hovedforskjellen mellom modell og ekspertestimering Modell: Mekanisk, eksplisitt kvantifiseringssteg (analytisk) Ekspertvurdering: Kvantifiseringssteg basert på ubevisste, ikkeeksplisitte prosesser (magefølelse) Modell og ekspertvurdering kan være basert på nøyaktig samme informasjon om prosjektet, samme historiske data, samme sjekklister og samme nedbryting i aktiviteter. Det er feil å si at modeller er objektive og ekspertestimater subjektive. I IT-estimering er begge metoder basert på subjektive data. Baruch Fischhoff ( forecasting -guru): Serious forecasts are seldom entirely subjective, never entirely objective. At one extreme, even the most automatic (or objective ) forecasting requires some exercise of judgment: Someone must choose the model, set its initial parameters, and decide whether to use its results. 4

Vi vet lite om ekspertestimering. Hvorfor? Kvantifiseringen skjer uten at vi legger merke til det, dvs er basert på ubevisste prosesser. Stor forskjell på å kunne noe og å vite hvordan man gjør det: Lagnado et al. 2006: Studies suggest that quite different regions of the brain are involved in learning and insight about learning. Spør en systemutvikler (som ikke har brukt en modell) om hvordan kvantifiseringssteget ble gjort, og du vil få rasjonaliseringer og/eller vage beskrivelser om følelser, ekspertise og erfaringer. Ekspertene vet sjelden hvordan de estimerer, men føler at du burde vite det. 5

Magefølelse, intuisjon, ekspertvurdering Noen forsøk på definisjoner: knowing something without knowing how you know it the ability to understand or know something immediately, without conscious reasoning preliminary perception of coherence (pattern, meaning, structure) that is at first not consciously represented 6

Magefølelsen (som sitter i hodet!) synes å involvere... the median OFC, the lateral portion of the amygdala, anterior insula, and ventral occipito-temporal regions... What Neuroscience Can Tell about Intuitive Processes in the Context of Perceptual Discovery, by Kirsten G. Volz and D. Yves von Cramon, 2006. 7

Mennesker har to hovedsystemer for tenkning The dual-process theory of cognition : Both theory and a substantial body of evidence, some of it derived from neuro-imagining studies of the brain employing fmri technology, support the view that humans employ at least two distinct systems to process information, a rational system and an intuitivelyoriented experiential system (Goel & Dolan, 2003) Når magefølelsen (hjertet, intuisjonen, din indre stemme,...) sier en ting, mens hodet (analysen) sier noe annet har vi en konflikt mellom disse to systemene. De intuitive systemet er høyst sannsynlig det evolusjonsmessige eldste, og det som oftest føles(!) mest naturlig å følge. 8

Noen forskjeller mellom analyse og intuisjon (Hammond et al, 1987) Analysis: High insight into judgment process, and, hence publicly retraceable Low confidence in outcome, high confidence in method Slow rate of processing High cognitive consistency Intuition: Low insight into judgment process, and, hence difficult to retrace and defend High confidence in outcome, low confidence in method Fast rate of processing Low cognitive consistency 9

En liten avsporing: Er det forskjell mellom kjønnene? Ser ut til å være små forskjeller mhp faktisk bruk av intuisjon. Menn synes imidlertid å ha et merkbart større behov for å rapportere at prosesser har vært analytiske! Intuisjon som en typisk kvinneegenskap er derfor trolig mer en kulturell stereotype, enn en reell forskjell i tenkemåte. Individual Differences in Intuitive-Experiential and Analytical-Rational Thinking Styles, Seymour Epstein and Rosemary Pacini, Journal of Personality and Social Psychology, 1996, Vol. 71, No. 2, 390-405 Vi er alle, uavhengig av kjønn og profesjon, sterkt avhengige av intuisjon! 10

Eksempel 1: Ligger mursteinene parallelt? 11

Eksempel 2: Hvilken av bananene har noe gult i seg? A B 12

Eksperiment: Konflikt (Denesraj, V, Epstein, S: Conflict between intuitive and rational processing when people behave against their better judgment) To urner med røde og hvite kuler: Urne 1: 7 røde og 100 hvite Urne 2: 1 rød og 10 hvite Du vinner et pengebeløp ved å trekke rød kule og får opplyst antall røde og hvite per urne. Hvilken vil du velge? Det er åpenbart at det er ulønnsomt å velg Urne 1, selv om den har flere røde kuler. En del av deltakerne valgte likevel Urne 1, til tross for at de på sett og vis skjønte at det var større sannsynlighet å finne en rød kule i Urne 2. De valgte å følge magefølelsen, til tross for en korrekt analyse. Flere av de som valgte Urne 2 (analytisk valg), beskrev at de måtte kjempe mot fristelsen å velge Urne 1 fordi den var mer tiltrekkende. De mest analytiske var imidlertid ikke i tvil og hadde ingen følelsesmessige problemer med å velge Urne 2. 13

Vi har de samme konfliktene innen estimering av IT-prosjekter Anta at vi basert på historiske data har laget en enkel estimeringsregel (analytisk modell) basert på antall timeverk per enkle, middels og komplekse use cases. Estimeringsregelen (eller andre historiske data) gir at prosjektet vil ta ca. 1500 timeverk. Magefølelsen sier oss imidlertid at det umulig kan kreve så mye arbeid og at 1000 timeverk må være mer enn nok. Vi har nå en konflikt mellom de to tenke-systemene. Vi vil ofte ha mest tillit til den analytiske prosessen som prosess, men likevel stole mest på estimatet basert på magefølelsen. Hvordan løse denne konflikten? Sterkt analytisk person: Stoler på modellen (gitt at modellen er bra) Sterkt intuitiv person: Stoler på magefølelsen (nesten uansett) Konfliktunngående person: Justering av de komplekse use caseene til å bli middels e.l.. Justeringen (rasjonaliseringen av magefølelsen) kan skje både bevisst og ubevisst. 14

Eget studium: Estimeringsstrategier (1) Deltakere: 28 systemutviklere som estimerte de samme 10 vedlikeholdsoppgavene. Forskningsspørsmål: Når bruker de en analogi-basert og når en aggregerings-basert estimeringsstrategi? Relevans: Mistanke om at: Nærmeste analogi -basert estimeringsstrategi brukes av noen selv når det er klart bedre å bruke gjennomsnittet fra flere oppgaver av samme type. (Kanskje fordi den intuitivt føles mer riktig.) Mange er for dårlige til å endre strategi etter behov. Antagelse: Det er rasjonelt å bytte strategi, dersom en annen enkel strategi ville ha vært klart bedre på foregående estimeringsoppgaver. NB: Dette studiet er under arbeid... 15

Estimeringsstrategier (2) 9 PCl1 MPTot PCl2 MPJava 8 7 6 Frequency 5 4 3 2 1 0 1000 1500 EstProd 2000 2500 Figuren antyder at de fleste (for Oppgave 7) valgte en av strategiene nærmeste analogi (PCl1), nærmeste to (PCl2) eller gjennomsnitt på alle lignende Java-oppgaver (MPJava). Noen få velger annerledes (>2200), kanskje basert på forventninger om læring? 16

Estimeringsstrategier (3) Ca. halvparten innså underveis at nærmeste analogi strategien burde endres til mer gjennomsnittsbetraktninger. Alle startet med nærmeste analogi som eneste valgmulighet pga få historiske data. En del ble imidlertid værendes i en uhensiktsmessig nærmeste analogi strategi. Indikerer valg av strategi basert på magefølelse mer enn analyse? Eller at men mentale verktøykassen av estimeringsstrategier ikke inneholder strategier basert på gjennomsnittsbetraktninger? 17

Estimeringsstrategier (4) 1,0 0,9 0,8 Median BRE 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 100 200 300 400 500 600 700 Standard Deviation of Estimated Productivity (per Developer) 800 Lav variasjon (standard deviation) antyder større bruk av aggregert informasjon. Korrelerer med lav BRE (= mer nøyaktige estimater). Viser at de som valgte å anta en produktivitet nært opp til gjennomsnittet for samme type oppgave (her: samme utviklingsplattform) gjorde det bedre enn de som varierte mer, dvs var mer påvirket av den mer intuitive nærmeste analogi - strategien. 18

Estimeringsstrategier (5) Hva sier dette oss om modell vs ekspert? Egnethet av estimeringsstrategi (både for modell og ekspert) er relativ til egenskaper ved historiske data/nytt prosjekt som skal estimeres. Det er stor variasjon mellom eksperter i bruk av strategi og, ikke minst, i evne til å endre strategi etter forholdene. Det viktigste er å ha en verktøykasse av estimeringsstrategier og lære å velge mellom dem? 19

Hvilke faktorer avgjør hva som lønner seg av ekspertestimat og modell: Estimeringsmodellen Passer den til situasjonen? Brukerne av estimeringsmodellen Bruker de modellen riktig eller som magefølelse i forkledning? Ekspertene som estimerer Hvor relevant erfaring har de? Prosessen for ekspertestimering Stor forskjell på en strukturert gruppeprosess (f eks Planning Poker) med mye historiske data og en kjapp magefølelse basert på dårlig forståelse av prosjektet. Estimeringssituasjonen Er det mye som kan påvirke ekspertene irrasjonelt? 20

Modellfordeler: Bedre vekting av variable Eksperter overvekter ofte informasjon av lav viktighet. Større grad av konsistens Eksperter kan gi svært forskjellige estimater med samme input I en av våre studier lot vi samme person estimerte samme oppgaver flere ganger med minst en måned mellom. Gjennomsnittlig forskjell (median) mellom estimatene for samme person på samme oppgave var ca. 50%. Mindre biases (f eks mindre ønsketenkning) Eksperter har ofte andre mål enn nøyaktighet, f eks å ubevisst forsøke å bevare et selvbilde av seg selv som en effektiv person med god kontroll. Bedre læringsmuligheter Eksperter vet typisk ikke hvilken informasjon de har brukt og hvor mye ulik informasjon er blitt vektlagt (selv om de gir uttrykk og tror at de vet det ). 21

Ekspertfordeler Kan bruke viktig informasjon som ikke er del av modellen Svært konkret kunnskap om kunden Kåre eller utvikleren Gro er lite hensiktsmessig å integrere i modellen ( overfitting gir dårlige modeller). Har mer fleksibilitet i estimeringsprosess Eksperten kan ha kunnskap om når man står overfor uvanlige tilfelle der modell-antagelser ikke er gyldige. Manglende informasjon stopper ikke eksperten så lett, på godt og ondt. 22

Empiri (Jørgensen, 2007): Seksten studier Table 1: Experts vs Models Most Accurate Model Average Accuracy of Models Most Accurate Experts vs Models: 2 0 Experts vs Models: 2-0 Expert Expert more accurate: Expert more accurate: Average Accuracy of Experts Studies 2 and 12 Expert vs Models: 1-7 Expert more accurate: Study 6 Studies 2 and 12 Expert vs Models: 10-6 Expert more accurate: Studies 1, 2, 3, 5, 6, 7, 9, 10, 11, and, 13 Least Accurate Model Experts vs Models: 2-0 Expert more accurate: Studies 2 and 12 Experts vs Models: 6-2 Expert more accurate: Studies 1, 2, 6, 7, 9, 11 Least Accurate Expert Model more accurate: Studies 1, 2, 7, 9, 11, 12, and, 14 Experts vs Models: 0-2 Model more accurate: Studies 2 and 12 Model more accurate: Studies 4, 8, 12, 14, 15, and, 16 Experts vs Models: 0-2 Model more accurate: Studies 2 and 12 Model more accurate: Studies 12, and, 14 Experts vs Models: 0-2 Model more accurate: Study 2 and 12 23

Hovedanbefalinger: Bruk ekspertestimering når: Modellene ikke er tilpasset estimeringssituasjonen (dvs ikke basert på organisasjonens egne data) Ekspertene har vesentlig informasjon (kontekstuell informasjon) som ikke gis som input til modellene. Bruk modeller (analytisk kvantifiseringssteg) sammen med ekspertestimering når: Organisasjonen mangler gode eksperter. Det er fare for mye irrasjonell påvirkning i estimeringssituasjonen. 24

Hvordan velge estimeringsekspert? Lengde erfaring? Nei. Ingen god indikator. Erfaring fra lignende prosjekter? Ja! Gitt at prosjekt er svært likt med tidligere prosjekt. Litt likt, er en dårlig indikator. Den flinkeste utvikleren? Tja. Den flinkeste er ofte uegnet for å estimere arbeidsmengde for de uerfarne. Kanskje bruke de flinkeste til å identifisere aktiviteter og en med middels utviklingsekspertise til å estimere disse? Den de andre tror er en god estimerer? Tja. I mangel av noe bedre måte å velge på, og dersom disse har grunnlag for hva de tror. Det har de ikke alltid. 25

Hvordan velge estimeringsekspert? Den som er mest sikker på estimatet sitt? Nei. Dette er oftere en indikator på det motsatte. De mest sikre er som oftest de mest overoptimistiske! Den som har vært mest nøyaktige tidligere? Ja, men det er ingen svært god indikator. En studie indikerer at den (av to) som var mest over-optimistisk i foregående prosjekt var med ca. 70% sannsynlighet den som var mest over-optimistisk i det neste prosjektet. Basert på tester? Tvilsomt. Liten hjelp i personlighetstester m.m.. Lett depressive mennesker? Ja. De viser seg å være de mest realistiske mhp egne evner. 26

Hvordan velge prosess for ekspertestimering? Strukturer prosessen med hjelpemidler: Bruk sjekklister (en enkel form for erfaringsdatabase), standardiserte oppdelinger i aktiviteter (WBS), historiske data og krav om begrunnelse. Anvend gruppeestimering og kombinasjon av estimater Wideband Delphi Planning Poker 27