Slu+vurdering og karakterse8ng hva sier forskningen?? Fagdag Fylkesmannen i VesAold 2.3.17 T. S. Prøitz Et første møte med (slu+)vurdering Hvorfor kludrer læreren oppå det jeg har gjort? Hva er vurdering? Hvorfor vurdering? Hva blir vurdert? Når og hvordan skjer vurdering? Hva gir u8elling i vurdering og hvorfor? 1
Plan for presentasjon Internasjonal forskning Fra oppfatninger om den ulydige og kompetansetrengende læreren Ql anerkjennelse av profesjonalitet og betydning av stø+estrukturer Norsk forskning Norsk kontekst og tradisjon SkolelederperspekQvet LærerperspekQvet og vurdering i fem fag ElevperspekQvet Hva nå - varsler fra poliqkken og noen refleksjoner Internasjonal forskning Lærere er oppta+ av og forsøker å være rewerdige overfor elever, blant annet ved å informere om hvilke krav som sqlles for den enkelte karakter. Tester/prøver, er en vesentlig komponent ved karakterse8ng, men innsats og evne blir også oye ta+ i betraktning. Bruk av formaliserte vurderingsformer øker med trinn Det finnes individuelle variasjoner mellom læreres praksiser for karakterse8ng. Ulike lærere oppfa+er meningen og formålet med karakterer ulikt, og de vurderer faktorer som kan si noe om prestasjoner ulikt. (Brookhart 1994, Brookhart m.fl. 2013) 2
Fire bestående hovedfunn e+er et århundre med forskning 1. Det er typisk for lærere å bruke et mangfold av faktorer (faglig måloppnåelse og annet) i karakterse8ng for læring, moqvasjon og dokumentasjon. 2. Innsats er et nøkkelelement i karakterse8ng. 3. Lærere forsvarer sine elever ved å hjelpe dem Ql å oppnå høyere karakterer. 4. Læreres verdier er en essensiell del av rewerdig og presis karakterse8ng. (Brookhart m.fl. 2016) Læreres verdier i karakterse8ng Læreres rewerdighetsforståelse: Studenter som forsøker bør ikke stryke uanse+ om de har lært noe eller ikke. Lærere har oye et grunnleggende ønske om at alle eller flest mulig skal lykkes De+e innebærer at forskningen på feltet nå anser at karakterer ikke er endimensjonale mål på faglig prestasjon, slik det oye har vært anta+ og anbefalt. 3
Nye vinder i forskningen. Lenge har variasjoner i læreres karakterse8ng vært en bekymring blant eksperter i vurdering fordi det kan true karakterers validitet og reliabilitet (og svekke rewerdig og likeverdig vurdering) Forskere har oye anbefalt kompetanseutvikling for å styrke læreres vurderingskompetanse (Duncan & Noonan 2007, Brookhart 2013). Nye vinder... Nyere forskning på karakterse8ng fokuserer mer på nødvendigheten av stø+estrukturer for å sikre konsistent vurdering og rewerdige og likeverdige karakterer Det pekes også på at vi nå vet nok om læreres holdninger og praksis Nå er det behov for å finne ut hvordan det kan jobbes med vurdering se+ fra lærerens/profesjonelt perspekqv for å sikre kvalitaqv god slu+vurdering. (Wya+-Smith & Klenowski 2013, Brookhart 2013, 2016) 4
Den norske konteksten for karakterse8ng KunnskapsløYet skulle styrke elevers læringsresultater gjennom kompetansemål, økt fokus på vurdering og innhold- og metodefrihet, samqdig som skolen fikk et økt og u+alt ansvar for resultatene (Aasen m.fl. 2012; Møller m.fl. 2013). Siste st.meld. viser at vi står foran endringer, som kanskje vil føre Ql at staten vil igjen vil styre mer på innhold og metoder. Dynamisk, refleksiv og dialogisk Karakterer har tradisjonelt vært brukt for å bedømme elevers kompetanse Med reformen fulgte det at lærerne skulle bruke vurdering og karakterse8ng Ql også å styrke elevenes kompetanseoppnåelse helt frem Ql slu+en av opplæringen. De+e gir vurderingen i skolen et mer dynamisk, refleksivt og dialogisk preg (Sandvik & Buland 2014). 5
Slu+vurdering..Ql slu+? Norsk tradisjon for å hekte på slu+vurderingen Ql slu+... (Lysne 2006) Frykt for slu+vurderingens effekt og innvirkning som skjult læreplan Uforutsigbarhet og uklarhet om forventninger og om hva som gjelder Dikotomisering/skille mellom vurdering underveis og vurdering Ql slu+ KunnskapsløYet innebærer en sterkere integrering av vurdering i skolens helhetlige arbeid - i planlegging, i undervisning og i vurdering. Forskning på arbeid med karakterer i Norge Standpunktkarakterers u+rykk og funksjon: U+rykk 1. oppnådd kompetanse Ql slu+ i opplæringen, 2. oppnådd kompetanse Ql slu+ og underveis, 3. oppnådd kompetanse, holdninger, innsats og andre sider ved eleven 4. helhetlig kompetanse Funksjon 1. grunnlag for videre skole eller arbeid og 2. moqvasjonsfaktor. Ungdomsskolelærerne er mest oppta+ av karakterers funksjon som både moqvasjonsfremmende og hemmende, mens lærerne i videregående er mest oppta+ av karakterer som grunnlag for videre liv. At det for mange elever er moqverende å ha karakterer er informantene likevel i stor grad enige om. (Prøitz & Borgen 2010, Prøitz 2013, Hovdhaugen mfl. 2014) 6
ReWerdig standpunktvurdering? Å gi rewerdig standpunktvurdering er vikqg for alle lærerne og likebehandling av elever søkes både:! innenfor en gruppe (klasse),! på trinnet, historisk (fra år Ql år)! mellom skoler. Det er le+ere å være rewerdig når rommet for tolkning oppfa+es som mindre (matemaqkk, naturfag) Lærer i Vdgo: «Som realfagslærer er jeg veldig glad for å ha disse fagene, jeg kaller meg poengslave. Når jeg seaer poeng skal det være eaer mål i læreplanen og det eaer departementets retningslinjer. Så hvis det skal bli mest mulig recerdig så må det gjøres på denne måten.» Opplevelsen av å gi rewerdig vurdering styrkes av godt samarbeid mellom to eller flere kollegaer på samme trinn eller i team. Kh/Dh lærer i Uskolen. «DeAe samarbeidet jeg snakket om føler jeg er en kvalitetssikring. Det er veldig godt å ha så mange mennesker i kollegiet som er såpass trenet i deae med vurdering, at man opplever at i den prosessen står vi likt, og om vi ikke gjør det, så skaper vi den dialogen.» ReWerdig karakter - hva sier lærerne? På spørsmål om hvordan de ville definere eller beskrive hva som er en «rewerdig karakter», sier lærere at det er en karakter som viser elevens kompetanse i henhold Ql kompetansemålene. Alle intervjuene viser at lærerne bruker si+ faglige skjønn Ql å se+e det de mener er rikqg karakter, og at de+e faglige skjønnet utvikles gjennom et løpende og Qdvis innfløkt samspill mellom ulike ruqner og samhandling i fagfellesskapet. (Seeland m.fl. 2014, Prøitz & Borgen 2010) 7
Grunnlag og vekqng Grunnlag for standpunktvurdering: Kildegrunnlaget i fem fag er variert, men et fellestrekk er at skriylig dokumentasjon på elevers prestasjoner er klart vikqgst Kildegrunnlaget i fem fag er i stor grad likt i begge skoleslag i fagene Informantene fra ungdomsskole oppgir kjennskap Ql eleven over tre år som en vikqg supplerende kilde for standpunktvurdering VekQng Prestasjoner og kunnskaper har størst betydning i begge skoleslag, men i alle fag gis deltakelse betydning for svake elever. I kroppsøving er deltakelse betraktet å være av betydning for alle elever, svake som sterke. Betydning av deltakelse Norsk Matema?kk Naturfag Kroppsøving Kunst/ Design og håndverk Betydning for svake elever i vippeposisjon Oppmøte har ikke betydning, innsats kan ha det for svake elever i vippeposisjon Ikke betydning, men innsats har betydning på lang sikt Har betydning både direkte men også indirekte for alle elevtyper Liten betydning 8
Karakterse8ng i ulike fag Kunst og håndverk/design og håndverk: Vurderingspraksis basert på forhandling, samarbeid og utvikling av tolkningsfellesskap. I faget gis det karakter primært for prestasjon, informanter oppgir at det gjør vondt å ikke gi elever noe for innsats. Naturfag og matema?kk: Vurderingspraksis forankret i et standardisert vurderingsgrunnlag og poengsystemer. Poengsystemene gjør at de i stor grad oppgir å gi standpunktkarakterer likt Ql alle. Norskfaget: Vurderingspraksis basert på en del skjønn, arbeider oye e+er vurderingsmatriser, kriterier og nedbru+e målformuleringer som er et stadig tema for forhandling. Sentralt gi+ skriylig eksamen og sensorveiledninger har en betydningsfull rolle i forhandlinger om hva en god prestasjon i faget er. Kroppsøving: Vurderingspraksis e+er målbare standarder for hva en god prestasjon er, eksempelvis ved tester av ferdigheter som løping. SamQdig bruk av skjønn i dialog med eleven, men i mindre grad med kollegaer. 9
Ideal om rewerdig og likeverdig vurdering Idealet om rewerdig og likeverdig vurdering er i hovedsak definert og regulert som abstrakt og teoreqsk fenomen i regelverk og veiledninger. Det finnes nå et utvalg hjelpemidler for slu+vurdering utover regelverket: Kjennetegn for måloppnåelse: h+p://www.udir.no/vurdering-for-laring/4-prinsipper/ Mal-kriterier-og-kjennetegn/Mal-kriterier-og-kjennetegn/ Tips for arbeid med mål, kriterier og kjennetegn: h+p://www.udir.no/vurdering-for-laring/tips-og-rad/slikkan-du-arbeide-med-mal/ Veiledninger og innhold på Udirs ne+sider Det er en uaordring å omse+e de+e abstrakte idealet og det arbeides på mange måter med de+e. Skoleledelser om arbeid med vurdering og tolkningsfellesskap SQmulering, variasjon og arbeid for enhetlighet Det sqmuleres Ql denne typen samarbeid, men det varierer. Noen er gode Ql å samarbeide, andre er ikke så flinke. Vi skal prøve å bli mer enhetlige i de+e med samarbeid. Samarbeid = tolkningsfellesskap Ved denne skolen viser ledelsen Ql at der det er samarbeid er det også tolkningsfellesskap. Det vises Ql at de har ha+ de+e temaet oppe på personalmøter. 10
Team ut av kontorene! Ved en ungdomsskole forteller ledelsen at de helt bevisst har valgt å legge arbeidet med vurdering Ql fagseksjonene fremfor Ql det enkelte fagteam for at teamene ikke skal si+e på hvert si+ kontor å lage egne kriterier. Felles mapper for kjennetegn for måloppnåelse Ledelsen oppfordrer alle fagseksjonene Ql å legge ut sine arbeid med kjennetegn på måloppnåelse under mapper på fellesområder. Noen samarbeider andre ikke... Ved en ungdomsskole sier ledelsen at de har et inntrykk av at noen lærere samarbeider om standpunktkarakterse8ngen - men også at andre ikke gjør det. Regionalt samarbeid På denne skolen viser også ledelsen Ql at de har ta+ iniqaqv Ql å etablere samarbeid mellom faglærere fra ungdomsskoler i regionen. IniQaQvet ble ta+ på grunnlag av at det i pressen ble gjort sammenlikninger mellom standpunktkaraktergiving og eksamenskaraktergiving. Oppslagene i mediene medførte at de+e temaet ble en lokalpoliqsk sak. Betydningen av å bruke bundet Qd Ql samarbeid men hva slags samarbeid? Skolenes ledelser viser Ql vikqgheten av å integrere arbeidet med vurdering i lærernes Qd og kny+e ressurser Ql arenaer som åpner for samarbeid i fag på samme trinn og pa tvers av trinn Samarbeid mellom lærerne foregår oye mellom to som jobber sammen pa trinn. De+e er lærere som synes å ha en felles oppfatning av hva vurdering i faget er. Dersom utviklingen av en god vurderingskultur og tolkningsfellesskap er kjennetegnet av deling og diskusjon, er det et spørsmål om samarbeid avgrenset Ql to og to lærere pa trinn er det beste. Ved skoler der de har arbeidet mye med vurdering er de oye oppta+ av å involvere alle lærerne innenfor et fag pa alle trinn i diskusjoner, samarbeid og deling. 11
06/03/17 Elevstemmer: Elevorganisasjonen AYenposten - SiD 12
Ungdom i dag Ungdom ønsker å gjøre det bra på skolen (alle arenaer). Elever anser skolen som et vikqg og nødvendig grunnlag for videre utdanning og arbeidsliv, og ønsket om gode karakterer blir en sentral drivkray i elevenes innsats i skolehverdagen og i hjemmearbeidet (Hegna m.fl. 2013; Dæhlen m.fl. 2011; Øia & Vestel 2014). Elevens perspekqv (vdgo) Hva som er en rewerdig karakter, er et spørsmål som opptar og engasjerer elevene i stor grad. Et hovedmønster i elevenes u+alelser om standpunktvurdering er at karakterer underveis hjelper en Ql å forstå «hvordan en ligger an». Elevene viste Ql forskjeller i vilkår på individnivå, klassenivå og skolenivå. Det ble pekt på at noen kan streve mye med et fag uten å få u+elling for det, mens andre nesten ikke behøver å forberede seg og likevel oppnår gode resultater. At en kan bli bedømt uforholdsmessig strengt når en går i klasse med særlig dykqge elever, var en annen bekymring. Sammenligning av karakterer med medelever fra ungdomsskolen som nå gikk på andre videregående skoler, ga også grunnlag for antakelser om at vurderingen ved egen skole var streng. Læreren må klare å vurdere likt og rewerdig, fordi: «man går ut og konkurrerer med alle», poengterte en jente. 13
ElevperspekQvet: rewerdighet «En recerdig karakter er oppnådd uten juks og at lærer har ordentlig grunnlag for hvorfor han saae den karakteren.» (jente) Så sa hun Ll slua at, ja, ok, men det var liksom bare fordi jeg maste, da sa hun at nå kan jeg ikke snakke med deg mer, du får 5 hvis du går ut av kontoret mia. [gua) Et vikqg spørsmål for elevene er hvor grensen for hva som er fortjent, kan trekkes. Fra skolemotstand Ql elevers motspill Sivenbring (2016: 209) viser hvordan enkeltelever bruker kunnskap om skolens vurderingssystem for å oppnå best mulige karakter. Elevenes fortolkninger av samhandlingssituasjonene i skolen viser at de eksperimenterer for å «knekke kodene» for å finne ut hva læreren verdse+er. Elever med kjennskap Ql systemenes strukturer kan oppnå en grad av kontroll i det samme systemet og utny+e det Ql egen vinning. Representerer en særskilt form for skolemotstand beskrevet som «working the system». Elevers motspill i skolen (Lødding, Seland & Prøitz 2016) 14
Hva nå? St meld nr 28 (2015-2016) inkludere en fagspesifikk omtale i læreplanene av hva som skal kjennetegne vurdering i det enkelte fag revidere og forenkle kapi+el 3 i forskriy Ql opplæringsloven i lys av de endringene som gjøres i læreplanverket utvikle veiledende kjennetegn på måloppnåelse for slu+vurdering for alle fornyede fag i grunnskolen og gjennomgående fag i videregåendeopplæring Refleksjoner Omfa+ende vekst i regelverk, veiledning, råd og satsinger de siste 7 år: Hva gjør de+e med lærerens profesjonalitet i standpunktkarakterse8ng? Hva gjør de+e med skoleeiers fokus og prioriteringer i ledelse? Hva gjør de+e med elevenes læring, moqvasjon (strategiske) posisjonering? Det er fortsa+ et dilemma i regelverket å se+e standpunkt mellom det brede grunnlaget og ved avslutningen av opplæringen. 15
Refleksjoner Idealene kommunisert fra myndighetene legger stor vekt på underveisvurderingen som grunnlag for slu+vurderingen. Kan de8e innebærer en underkommunisering av hva, når og hvordan slu8vurdering skjer? Kan de8e innebære en utydeliggjøring av hva som fak?sk gjelder?l slu8? Et utvalg referanser Brookhart, S. M. (1993) Teachers` Grading PracQces: Meanings and Values. Journal of EducaLonal Measurement. Vol. 30, No. 2, pp 123-142 Brookhart, S. M. (2013). Classroom assessment in the context of moqvaqon theory and research. SAGE handbook of research on classroom assessment, 35-54. Brookhart, S. M., Guskey, T. R., Bowers, A. J., McMillan, J. H., Smith, J. K., Smith, L. F.,... & Welsh, M. E. (2016). A Century of Grading Research Meaning and Value in the Most Common EducaQonal Measure. Review of EducaLonal Research, 0034654316672069. Duncan, C. R. & Noonan, B. (2005) Factors AffecQng Teachers Grading and Assessment PracQces. The Alberta Journal of EducaLonal Research Vol. 53, No. 1, Spring 2007, 1-21 Hovdhaugen, Elisabeth; Seland, Idunn; Lødding, Berit; Prøitz, Tine Sophie; Vibe, Nils; (2014) Karakterer i offentlige og private videregående skoler: En analyse av eksamens- og standpunktkarakter i norsk og matemalkk og rulner for standpunktvurdering i offentlige og private videregående skoler. (142). NIFU Nordisk insltua for studier av innovasjon, forskning og utdanning. Lødding, B. Seeland, I. & Prøitz T. S. (2016) Kampen om karakteren. Elevers motspill i møte med læreres vurderingspraksis i videregående skole, Sosiologi i dag. Prøitz, Tine Sophie; Borgen, Jorunn Spord; (2010 ReCerdig standpunktvurdering det (u)muliges kunst?: Læreres seeng av standpunktkarakter i fem fag i grunnopplæringen. (136). NIFU STEP. Prøitz, T. S. (2013) VariaQon and validity in final grading subjects ma+er. EducaLon Inquiry, Vol. 4, No. 3, Prøitz, Tine Sophie; Borgen, Jorunn Spord; (2010) ReCerdig standpunktvurdering det (u)muliges kunst?: Læreres seeng av standpunktkarakter i fem fag i grunnopplæringen. (136). NIFU STEP. Prøitz, T. S. og Borgen, J. S. (2011). ReWerdig standpunktvurdering. På grensen av det mulige? Bedre skole. Nr. 1/2011 h+ps://www.utdanningsforbundet.no/upload/tidsskriyer/bedre%20skole/bs_nr_1_11/bs_1-11_prøitz_og_borgen.pdf Seeland, I. Lødding, B. & Prøitz, T. S. (2015) Delrapport 1 fra evaluering av forsøk med halvårsvurdering med én eller to karakterer i norsk. Oslo, NIFU rapport 33/2015 h+p://brage.bibsys.no/xmlui/handle/11250/2375095 Sandvik, L. V. og Buland, T. (red.) (2014). Vurdering i skolen. Utvikling av kompetanse og fellesskap. SluArapport fra prosjektet Forskning på individuell vurdering i skolen (FIVIS). Trondheim: NTNU Program for lærerutdanning og SINTEF Teknologi og samfunn. h+p://www.udir.no/upload/forskning/2015/fivis%20slu+rapport%20desember%202014.pdf?epslanguage=no 16