Digital eksamen. Et pedagogisk prosjekt. Per Grøttum Seksjon for medisinsk informatikk

Like dokumenter
IT i undervisningen. om E-læring og Digital eksamen. Per Grøttum Seksjon for medisinsk informatikk

Nye muligheter med digital eksamen? Per Grøttum Seksjon for medisinsk informatikk

Oslo Det medisinske fakultet, UiO. Paradigmer i medisinsk utdanning

Nasjonal delprøve veien mot en pilot

Rita Iren Olsen, Studieseksjonen. Gruppeleder for eksamen- og studentsaker tilknyttet profesjonsstudiet i medisin

8. oktober Rektoratet: Digital eksamen

3 Tid og sted Ordinær eksamen avholdes i mai/juni. Kontinuasjonseksamen/utsatt eksamen avholdes i november/desember

Retningslinjer for eksamen i modul 2, blokk 1, 2 og 3 (OD2100/OD2200)

Digitale vurderingsformer. Mikkel K. Skjeflo Seksjon For Digitale Medier i Læring

Semesterhåndbok IIID V2015

2. Veiledende normer for uttelling for undervisningsrelaterte aktiviteter

UTVIKLING AV EN ADAPTIV TEST FOR Å MÅLE LIVSKVALITET I PASIENTER MED KOLS MUIRNE PAAP

Formalia og vurderingskriterier for eksamensdel 2 av PPU3100T

Avdeling for informatikk og e-læring, Høgskolen i Sør-Trøndelag

4. desember Administrative studieledere: Status og veien videre

Semesteroppgaven vil kunne erstatte den nåværende obligatoriske oppgaven i alminnelige forvaltningsrett.

Tabell 1 Antall emner som tar i bruk Fronter fordelt på fakultet (hentet fra Undervisningsenhet samlebilde, FS)

Formalia og vurderingskriterier for eksamensdel 2 av PPU3100T

VÅR * Kull 16. Det medisinske fakultet NTNU

Pedagogisk bruk av it s learning Drøbak 22.april 2008

Revisjon av medisinutdanningen og utdanning i bevegelsesvitenskap ved NTNU

Gi et beskrivende navn Kun til internt bruk

Fagdag i MAT0010 Matematikk Lillehammer 2.november 2017 Birger Laugsand, medlem I eksamensnemda, Utdanningsdirektoratet

Har du sagt A, så må du si B og C og D og noen ganger til og med E og F

Test of English as a Foreign Language (TOEFL)

28. mai MN allmøte om digital eksamen

Om meningsskapende samsvar mellom undervisning, læringsutbytte og vurderingsform

UTVIKLING AV OPPDATERT EXPHIL. Ingvild Torsen, IFIKK

NOTAT. Forslag til obligatorisk element på JUS2111: Prosedyrekonkurranse i Folkerett

Hvordan kan vi lage gode eksamener?

Alternative opptakskriterier på medisinstudiet. En pilot på Det medisinske fakultet

Eksamen for fremtidens leger: Hvordan legger vi til rette for å vurdere studentenes profesjonskompetanse?

Nettverk for digital eksamen

UNIVERSITETET I OSLO

Eksamensformer og prestasjoner

Del 1: Prosedyre for planlegging og gjennomføring av eksamener og sensur

Sak 2 Oppnevning av møteleder og referent Even Holth Rustad var møteleder, og Helene Kolstad Skovdahl var referent.

WISEflow brukerveiledning for forfattere

Eksamensprosedyre #04 Eksamenskommisjonens interne arbeid og kvalitetssikring

Elæringsutvikling ved Det medisinske fakultet Universitetet i Oslo. Per Grøttum

Universitetet i Oslo

Plan for Fagprøve for sykepleiere utdannet utenfor EØS og Sveits HSN

Anestesisykepleie - videreutdanning

Læringsmål som ledetråd i medisinstudiet

Saksnr. Sak 5 / STUV Høst 2013

Nytt studiedesign for PPU.

Fornying av medisinstudiet

Universitetet i Oslo Avdeling for studieadministrasjon

Til Dekan og prodekan for undervisning ved Det medisinske fakultet Universitetet i Oslo

NOKUTs notater Er karakterer rettferdige?

Noen Statistiske utfordringer ved analyse av PROM

Universitetet i Oslo

Eksamen i fremmedspråk

Case: Kompetansekartlegging

REL113 1 Etikk, filosofi og fagdidatikk

Oppsummering sensur og sensorrapporter vår 2018

Anestesisykepleie - videreutdanning

Sensorveiledning REA3028 Matematikk S2

Hvordan kan IKT bidra til pedagogisk utvikling?

Fagsamling i matematikk 7. november Janneke Tangen

21. april USIT: IT-konferansen

NOKUTs oppsummeringer Nasjonal deleksamen i årsregnskap 2017

Forslag til reviderte normer for undervisning, veiledning og eksamen

Orientering til medlemmer i kommisjoner for mastergradsoppgaver ved Masterprogrammet i organisasjon, ledelse og arbeid

RETNINGSLINJER FOR EKSAMEN. REGLER FOR OBLIGATORISK UNDERVISNING Vår/Høst 2010

Karakterfordeling STE6227: Bygningsmateriallære eksamen 16.desember 2008

Sensorveiledning REA3028 Matematikk S2

REFERAT FRA MØTE I PROGRAMUTVALG MEDISIN

Retningslinjer for oppnevning og bruk av sensorer

Programplan for videreutdanning i fysioterapi for eldre personer

Rapport fra arbeidsgruppen for sensorveiledninger UiO. Del 1 (hentet fra notat til universitetsstyret 15/1 2018).

Sensorveiledning

EN INNFØRING I BRUK AV GOOGLE DOCS SOM VERKTØY

Status for revisjonen

12: Lunsj. 13:00 Båtførerprøven Statistikk Endringer Pause Veien videre og spørsmål 14:30 Takk for oss

Sensorveiledning Masteroppgave i voksnes læring og Masteroppgave i rådgivning

Sensorveiledning REA3022 Matematikk R1

Sensorveiledning REA3026 Matematikk S1

Eksamensoppgave i PSYPRO4416 Anvendt og klinisk personlighetspsykologi

Inf1510: Oppsummering. Rune Rosseland

Det juridiske fakultet Universitetet i Oslo

Forskerlinjen i medisin

Utfyllende bestemmelser for graden siv.ing/master i teknologi (300 stp) ved Matnat. fak og Med.fak.

Sensorveiledning REA3024 Matematikk R2

Forhåndssensurrapport REA3022 Matematikk R1

Oppsummert er dekanatets forslag, som ble sendt ut på høring, som følger:

2.1 Avtale Det er gjort avtale om at jeg skal ha løpene tilsyn med emnetilbudet på samfunnsgeografi.

V-sak 4 - side 1 av 7

RUTINEBESKRIVELSE FOR UNIVERSITETET I STAVANGER BEGRUNNELSE FOR OG KLAGE OVER KARAKTERSETTING

Spørreundersøkelse begrunnelse og klage og statistikk

Tilsynsensorrapport 2008

Viser til beslutningsnotat fra universitetsdirektøren hvor følgende beslutning ble tatt vedrørende fellestjeneste for eksamen og vitnemål:

Forhåndssensurrapport MAT1013 Matematikk 1T

HANDLINGSPLAN FOR KJØNNSBALANSE VED DET MEDISINSKE FAKULTET

Sensorveiledning REA3022 Matematikk R1

Digital skoleeksamen: Hvordan gjør vi det? Ja takk, begge deler, Tromsø, Ingrid Melve, Uninett

Eksamen I En Digital Verden Hva slags funksjon bør eksamen ha i en helhetlig sluttvurdering i fremtidens skole?

STUDIEPLAN. Master i pedagogikk. 120 studiepoeng. Studiested: Tromsø. Studieplanen er godkjent av styret ved ILP 15.desember 2018.

Forvaltning av løsning/ avtaler,

UNIVERSITETET I OSLO

Transkript:

Digital eksamen Et pedagogisk prosjekt Per Grøttum Seksjon for medisinsk informatikk

Disposisjon Validitet og Reliabilitet Spørmålstyper og skrivekunst Digital eksamen fra ide til gjennomføring

Validitet Måler testen det den er ment å måle

Validitet Faglig bredde

Validitet Kognitiv dybde Faglig bredde

Validitet Skape Kognitiv dybde Evaluere Analysere Anvende Forstå Huske Faglig bredde

Validitet Skape Kognitiv dybde Læringsmål Evaluere Analysere Anvende Forstå Faglig bredde Huske

Validitet Dårlig løsning: tradisjonell essay-eksamen Skape Kognitiv dybde Læringsmål Evaluere Analysere Anvende Forstå Faglig bredde Huske

Validitet Dårlig løsning: faglig ensidig Skape Kognitiv dybde Læringsmål Evaluere Analysere Anvende Forstå Faglig bredde Huske

Validitet Dårlig løsning: kognitivt ensidig Skape Kognitiv dybde Læringsmål Evaluere Analysere Anvende Forstå Faglig bredde Huske

Validitet Dårlig løsning: utenfor læringsmål Skape Kognitiv dybde Læringsmål Evaluere Analysere Anvende Forstå Faglig bredde Huske

Validitet Frittstående spørsmål Skape Kognitiv dybde Læringsmål Evaluere Analysere Anvende Forstå Faglig bredde Huske

Validitet Kognitiv dybde Stier/sekvenser Læringsmål Faglig bredde Pasienten er en 73 år gammel kvinne som kommer til kontroll fordi hun har fått langtids oksygenbehandling de siste årene... Hva tror du kan være de viktigste forklaringene på de reduserte spirometriverdiene Du føler at du ikke kommer til bunns i diagnostikken av denne pasienten. Derfor undersøker du... Hvilke andre tilstander kan være forklaringen på respirasjonssvikten

Validitet Omfang en tredje dimensjon ( blue-printing ) Omfang Faglig bredde

Validitet Klinisk kompetanse multidimensjonal validitet Millers pyramide

Reliabilitet Er resultatet (fortolkingen) stabilt og konsistent

Feilkilder - essay Spørsmål ε q Kandidat fortolker ε k Svar Sensor fortolker ε s Karakter Forfatter fortolker ε f Sensurveiledning

Reliabilitet - sensur Spørsmål ε q Kandidat fortolker ε k Svar 2 sensorer fortolker ε s Karakter Forfatter fortolker ε f Sensurveiledning Denne differansen i sensur fordrer rekalibrering av sensor A s nivåkrav. Inter-rater bias: Eksternsensor - LærerA = 13.3% Eksternsensor - LærerB = 3.3% Eksternsensor - LærerC = -1.7%

Feilkilder - avkryssingsspørsmål Spørsmål ε q Kandidat fortolker ε k Svar Karakter Forfatter fortolker ε f Svaralternativ

Reliabilitet - avkryssingsspørsmål Spørsmål ε q Kandidat fortolker ε k Svar Karakter Forfatter fortolker ε f Svaralternativ Delspørsmål 2: 0 1 2 3 4 5 6 Er denne pasientens CHA 2 DS 2 score 5 (2 for hjerneslag, 1 for alder, 1 for kvinne, 1 for karsykdom) Ja/Nei 100 90 80 70 60 50 40 30 20 10 Item analysis:

Spørsmålstyper og skrivekunst

Spørsmålstyper Essay (fritekst) Multiple choice (ett svar) Multiple response (flere svar) Pull down (system av multiple choice)

Spørsmålstyper Personlig oppfatning usubstansiert: Det meste kan spørres om med alle spørsmålstyper. Unntaket er de mer samfunnsvitenskapelige fagene som ofte trenger essay. Eksempel: atferdsfag når det er sagt eller skrevet, er det åpenbart. Utrenete forfattere finner det lettest å bruke essay til spørsmål på høyere kognitive nivå. Multiple choice er logistisk mest fordelaktig når det gjelder gjenbruk og retting.

Skrivekunst Svaralternativene ved multiple choice rangeringsspørsmål (single best answer) Hvilken diagnose er mest sannsynlig må ligge på samme kontinuum Hvilken av de følgende påstander er sann om pseudogikt A. Det forekommer hyppig hos kvinner. B. Det er sjelden assosiert med akutte leddsmerter C. Det kan knyttes til kondrokalsinose D. Det er klart arvelig i de fleste tilfelle E. Det responderer godt på behandling med allopurinol Beh E Galt Kjønn A Sammenheng Arv D Sant

Skrivekunst Svaralternativene ved multiple choice rangeringsspørsmål (single best answer) Hvilken diagnose er mest sannsynlig må ha rimelig distanse mellom det riktige alternativet og de andre (distraktorene): B A C D F Minst sannsynlig Mest sannsynlig

Skrivekunst Svaralternativene ved multiple choice rangeringsspørsmål (single best answer) Hvilken diagnose er mest sannsynlig må ha rimelig distanse mellom det riktige alternativet og de andre (distraktorene): B A C D F Minst sannsynlig Mest sannsynlig Åpenbart feil svar: Hva er viktigst for god prognose... Under Sydenturen postoperativt må han nyte spesielt gode rødviner

Skrivekunst Unngå Spørsmål av typen Hvilke av de følgende utsagn er IKKE riktig. Alternativene er sjelden langs samme dimensjon. Sant/galt spørsmål. Vurderingsspørsmål som ligger høyt på den taxonomiske skala og som vi ønsker mye av - har sjelden så klare utfall. Sant/galt spørsmål degenerer ofte til rene faktaspørsmål for at de skal bli entydige.

Skrivekunst Forståelse av relative begrep

Skrivekunst Relative begrep i Multiple response spørsmål må kvantifiseres: Hva er de viktigste mulige diagnoser hos denne pasienten A B C D E B A C D E Minst viktig Mest viktig

Skrivekunst Relative begrep i Multiple response spørsmål må kvantifiseres: Hva er de 2 viktigste mulige diagnoser hos denne pasienten A B C D E B A C D E Minst viktig Mest viktig

Skrivekunst Svaret på ett spørsmål ligger implisitt i teksten til påfølgende spørsmål: Spørsmål 4 Hva slags behandling vil du foreslå Spørsmål 5 Hva består den operative behandlingen i

Digital eksamen på med.fak. Fra ide til gjennomføring

Hva var galt med den gamle eksamenen Ekstern evaluering av medisinstudiet ved Det medisinske fakultet, Universitetet i Oslo. Knut Aspegren Kjartan Koi Torstein Vik København, Oslo, Trondheim. 12.05. 2008

5. semester skriftlig eksamen Vår 2007 Høst 2007

5. semester skriftlig eksamen =3% Vår 2007 Høst 2007 =0%

5. semester skriftlig eksamen Vår 2007 =50% Høst 2007 =25%

5. semester skriftlig eksamen Vår 2007 =35% Høst 2007 =50%

Funn og anbefalinger Lav reliabilitet på sensur (stor variasjon mellom sensorer) Mer presise spørsmål og sensurveiledning Evalueringsskjema med poengskala ( rating scale ) for muntlige prøver Lav content (face) validity (mangelfull dekning av læringsmål) Større antall spørsmål Lav sampling validity (ujevn tematisk fordeling) Blueprinting (mal) av temafordeling Overvekt av faktaspørsmål Forskyve spørsmålene mot høyere nivå i Blooms taksonomi

Fakultetets reaksjon stor revisjon av eksamen OSCE (Objective Structured Clinical Examination) Samlebånd med strukturerte, praktiske oppgaver MiniCEX varierte kliniske eksamener Digital skriftlig eksamen

Modell for digitale oppgaver Kognitiv dybde Læringsmål Hybrid: Kasuistikker er bærebjelken i oppgavene. Frittstående spørsmål fyller ut målområdet. Faglig bredde

Modell for digitale oppgaver Kognitiv dybde Læringsmål Hybrid: Kasuistikker er bærebjelken i oppgavene. Frittstående spørsmål fyller ut målområdet. Faglig bredde

Klinisk beslutningstaking = beslutningstre = sekvensielle oppgaver Opplysninger Spørsmål Opplysninger Spørsmål Opplysninger Spørsmål = = Opplysninger Spørsmål Følgefeil! Følgefeil!

Digitalisering vår pedagogiske nøtteknekker Opplysninger Spørsmål Fasit Fasit Opplysninger Spørsmål Fasit

I praksis ser det slik ut: 1 nivå i treet = 1 deloppgave = 1 innlevering akkumulert sykehistorie fasit og nye opplysninger miniessay spørsmål multiple response spørsmål multiple choice spørsmål

Typisk eksamenssett 4-12 oppgaver hver oppgave har 2 8 deler hver del har 1 15 spørsmål i alt ca 100 spørsmål på 4 timer

Praktisk gjennomføring av digital eksamen Første digitale eksamen ved UiO i juni 2011 Web-basert eksamen 200 dedikerte bærbare maskiner med minimert Windows OS Dedikert trådløst eksamensnett i 6 lesesaler Nå: Ca 1000 studenter / 100 000 eksamenssvar hvert semester Skreddersydd informasjon til studentene

Kvalitetssikring I

Kvalitetssikring - medisinsk Forfatterteam...... Eksamenskommisjon... Kollegaer...... Seniorstudenter

Kvalitetssikring - pedagogisk Kongruens med læringsmål. Blueprinting (innhold/fag, taxonomisk nivå, basal/avansert kunnskap). Spørsmålsteknisk konstruksjon. Manual fra National Board of Medical Examiners. http://www.nbme.org/pdf/itemwriting_2003/2003iwg whole.pdf

Kvalitetssikring teknisk/administrativ Studieadministrasjonen: etablert egen gruppe for digital eksamen Leder koordinering, teknisk kvalitetskontroll, setter opp alle eksamener, supervisjon, fagutvikling, rådgiving Spesialiserte studiekonsulenter arbeider fortløpende med eksamenskommisjonene bygger spørsmåls- og oppgavebanker IT senioringeniør ansvarlig for utstyr teknisk gjennomføring av eksamen brukerstøtte under eksamen

Digital sensur

Digital sensur Etter eksamen Under eksamen - simultan sensurering ved OSCE-eksamen Til dels svært komplisert karakterberegning og fordeling av sensur-arbeidet.

Sensur den ultimate utfordring Basalfag Paraklinisk fag Klinisk fag Spørsmålsbanker Sensor A basalfag- spørsmålene fra alle stud. Oppgaver Besvarelser Sensurering Sensor B parakliniske og kliniske spørsmålene fra alle stud. Sensor C alt!

Digital sensur På web Flervalgssvar rettes automatisk Essaysvar rettes manuelt

Sensur online, real-time Simultan digital sensur på avsluttende eksamen i medisin Kontinuerlig monitorering av resultatene under eksamen

Teknologi Web-basert eksamen 200 13.3 HP laptop 802.11a Minimal Win7 IE Windows Questionmark Perception IIS Oracle Web-basert administrasjon Ruby Ruby on Rails sensursystem FS Web-basert sensur Apache Passenger Oracle Oracle Linux

Kvalitetssikring II

Psykometrisk analyse Inter-rater analyse (sensorer) Item analyse (spørsmål) Klassisk test teori IRT Rasch

Inter-rater bias: Eksternsensor - LærerA = 13.3% Eksternsensor - LærerB = 3.3% Eksternsensor - LærerC = -1.7% Denne differansen i sensur fordrer rekalibrering av sensor A s nivåkrav.

Spørsmål med item facility < 0.15: 0.13: Hvilket område i medulla oblongata gir opphav til aktivitet i perifere sympatiske nerver Så lav item facility (gjennomsnittskarakter) er fakultetets problem, ikke studentenes: enten er spørsmålet utenfor læringsmålene, eller så er det undervist for dårlig, eller så er det et feil/for avansert læringsmål.

Spørsmål med item facility >= 0.95: 0.99: Hvilken funksjon har purkinjefibre i hjertet Høy item facility (gjennomsnittskarakter) er OK hvis spørsmålet er kjernepensum som studentene da viser at de faktisk kan meget godt. Hvis det ikke er kjernepensum, er spørsmålet for lett.

Høy kvalitet gjenbruk innsynsbegrensning Oppgaver som skal gjenbrukes, kan unntas offentliggjøring Retten til innsyn i besvarelser må opprettholdes, men innsyn kan skje i kontrollerte former Offentliggjøring begrenset fra høsten 2015 Ca 20% av eksamensoppgavene offentliggjøres = treningsoppgaver Ca 80% går inn i gjenbruksbank etter revisjon Kommentert utdrag av de psykometriske analysene offentliggjøres Eget datasystem for kontrollert innsyn er utviklet

Forskning & Utvikling

Forskning 2 Postdoc: Stefan Schauber, Muirne Paap - psykometriske metoder - content validity et feedbacksystem - karaktersetting (A-F) - kobling formativ og summativ testing - adaptiv læring Medfak Helsevitenskapelig Utdanningssenter

Utvikling I Digital strukturert scoring på OSCE-eksamener Samlebånd: 12 stasjoner à 7 minutter

Utvikling I Digital strukturert scoring på OSCE-eksamener ipad

Utvikling II Automatisert håndtering av oppgaveoversettelser UiO Translatør xliff

Utvikling III Kobling formativ - summativ digital testing Samme system Samme spørsmål og oppgaver I elæringsprogrammene våre: Virtuelle pasienter (klinisk beslutningstaking) Quizzer

Det er mest et spørsmål om entusiasme og pedagogisk nytenking Tiden er inne!