RAPPORT NASJONAL PRØVE I REGNING FOR 5. TRINN 2013. Grethe Ravlo Astrid Bondø Morten Svorkmo Olaug E. Lona Svingen Roberth Åsenhus Pål Are Andersen



Like dokumenter
RAPPORT NASJONAL PRØVE I REGNING 5. TRINN Grethe Ravlo Gina Onsrud Astrid Bondø Gjertrud Berg Vivi Pedersen Randi Egede-Nissen

RAPPORT NASJONAL PRØVE I REGNING 5. TRINN Grethe Ravlo Astrid Bondø Morten Svorkmo

RAPPORT NASJONAL PRØVE I REGNING 5. TRINN Grethe Ravlo Astrid Bondø

Rapport om nasjonal prøve Regning 5. trinn. Matematikksenteret NTNU

RAPPORT. NASJONAL PRØVE I REGNING 8. og 9. TRINN Grethe Ravlo Bård Vinje Ole Harald Johansen Roberth Åsenhus

NASJONAL PRØVE I REGNING 8. TRINN 2009

RAPPORT NASJONAL PRØVE I REGNING 5. TRINN Grethe Ravlo Gina Onsrud Astrid Bondø Gjertrud Berg Vivi Pedersen Randi Egede-Nissen

RAPPORT. NASJONAL PRØVE I REGNING 8. og 9. TRINN Grethe Ravlo Ole Harald Johansen

RAPPORT NASJONAL PRØVE I REGNING 8. TRINN Grethe Ravlo Ole Harald Johansen Tor Andersen Bård Vinje

Sammendrag av analyserapporter fra nasjonale prøver i 2012

RAPPORT. NASJONAL PRØVE I REGNING 8. og 9. TRINN Grethe Ravlo Ole Harald Johansen

Veiledning. Nasjonale prøver i regning for 5. trinn. Versjon: juli 2010, bokmål

Nasjonale prøver. Siden 2007 er det i Norge gjennomført nasjonale prøver i grunnleggende regne- og leseferdigheter

Den nasjonale prøven i lesing på 8. trinn

Rapport om nasjonal prøve Regning 8. og 9. trinn. Matematikksenteret NTNU

Nasjonale prøver

Nasjonale prøver

Trondheim 29. november 2012

Veiledning del 3. Oppfølging av resultater fra. nasjonal prøve i regning. 8. trinn

Veiledning del 3. Oppfølging av resultater fra. nasjonal prøve i regning. 5. trinn

Analysene er gjort i forhold til kvalitetskriterier som er fastsatt i rammeverk for nasjonale prøver.

Nasjonale prøver. Veiledning til lærere Regning 8. og 9. trinn. DEL Bokmål

Vurdering med nasjonale prøver

Nasjonalt senter for matematikk i opplæringen

Hva måler nasjonal prøve i regning?

Nasjonale prøver 2014

Nasjonale prøver i grunnleggende ferdigheter i å kunne regne i alle fag 5. og 8. (9.) trinn

Se hvordan Hovseter ungdomsskole arbeidet før, under og etter gjennomføring av prøven.

Analyse av nasjonale prøver i engelsk, lesing og regning på 5. trinn 2015

Veiledning. Nasjonale prøver i regning for 8. og 9. trinn. Versjon: juli 2010, bokmål

Årsplan i Matematikk

Nasjonal prøve i regning

Nasjonale prøver

Ti år med nasjonale prøver i regning

Bruken av nasjonale prøver en evaluering

Elevundersøkelsen Bergen kommune, vår 09: Et nærmere blikk på mobbing, uro, motivasjon, bruk av PC

Mål 3 flere barn og unge på høyt nivå i realfag

TIMSS 2003 med få ord

Halvårsplan i matematikk Vår 5. trinn

Mål 1 barn og unge skal få bedre kompetanse i realfag

Posisjonsystemet FRA A TIL Å

Nasjonale prøver GODESET SKOLE skoleåret

Regn i hodet: Å uttrykke tall. Ulike uttrykksmåter. Det vesentlige er utvikling. Hvordan jobbe med dette? Hvordan jobbe med dette?

ÅRSPLAN. Grunnleggende ferdigheter

Nasjonale prøver

ÅRSPLAN I MATEMATIKK FOR 4.TRINN

Alle teller. - en introduksjon. Ny GIV 1. samling 2012/2013 Anne-Gunn Svorkmo Astrid Bondø Svein Hallvard Torkildsen

NY GIV I REGNING. Brynhild Farbrot Foosnæs

Nasjonale prøver

Mestringsbeskrivelser for nasjonale prøver i regning

Nasjonal prøve i grunnleggende ferdigheter i å kunne regne 5. og 8. (9.) trinn

8 Kjønnsforskjeller, faglig selvtillit og holdninger til matematikk og naturfag

Hvorfor får elevene problemer med tekstoppgaver? Hva kan vi gjøre for at elevene skal mestre tekstoppgaver bedre?

Nasjonale prøver i lesing, regning og engelsk på 5. trinn 2015

RAPPORT NASJONAL PRØVE I REGNING 8. TRINN Prosjektgruppen for nasjonale prøver i regning v/ Grethe Ravlo

1 HOVEDFUNN OG TRENDER I TIMSS 2007

Kjennetegn på måloppnåelse TALL OG ALGEBRA. Kunne plassverdisystemet for hele- og desimaltall

Mål 2 færre barn og unge på lavt nivå i realfag

Etter en lang ferie er det en del regneferdigheter vi må friske opp:

PISA og PIRLS. Om norske elevers leseresultater

Årsplan matematikk 6.klasse, Multi 6a Temaer kan bli flyttet på. Med forbehold om større eller mindre endringer i løpet av året.

Unneberg skole ÅRSPLAN I MATEMATIKK. 3. trinn Rød skrift marker det som er fra utviklende matte.

Nasjonale prøver et skoleeierperspektiv. Øystein Neegaard,

Årsplan i matematikk for 5. trinn, skoleåret 2009/2010. Læreverk Abakus 5A og 5B (grunnbøker+oppgavebøker), digitale læringsressurser

Nasjonale prøver

SAKSFREMLEGG. Saksnummer: 15/91-1. Saksbehandler: Tove Kristensen Knudsen Sakstittel: RESULTATER NASJONALE PRØVER 2014

Årsplan matematikk 4. klasse, Læreverk: Multi 4a og 4b Lærer: Irene Jørgensen Skaret

Hovedresultater fra PISA 2015

Mål 3 flere barn og unge på høyt nivå i realfag

Matematikk årstrinn Smøla kommune

Kyrkjekrinsen skole Årsplan for perioden:

Nasjonale prøver i grunnleggende ferdigheter i å kunne regne

Hva er PIRLS, PISA og nasjonale prøver?

Forfatterne bak Multi: Multi i praksis trinn. En bred matematisk kompetanse. Oppbyggingen av Multi. Grunntanken bak Multi

ÅRSPLAN I MATEMATIKK FOR 4. TRINN 2018/2019 Læreverk: Multi Lærer: Anita Nordland og Astrid Løland Fløgstad UKE MÅL (K06) TEMA ARBEIDSFORM VURDERING

Sensurveiledning Matematikk 1, 5-10, emne 1 Høsten 2013

Kengurukonkurransen 2008 > Et sprang inn i matematikken <

Perlesnor og tom tallinje

Den nasjonale prøven i lesing på 5. trinn Rapport basert på resultatene fra utvalgsundersøkelsen

Analyse av nasjonale prøver i lesing,

GODE ALGORITMER. Mekanisk regneferdighet. Forskningens konklusjon. Hva kreves i læreplanen? Var alt bedre før?

Kapittel 1 Koordinatsystemet. godt Kommentarer. Kan. ganske godt. Kan. Kan litt. Kompetanseoversikt i matematikk, 4. trinn for: Klasse/gruppe:

Regning med tall og bokstaver

Kengurukonkurransen 2013

7. TRINN MATEMATIKK PERIODEPLAN 3, Uke 2-11

Unneberg skole ÅRSPLAN I MATEMATIKK. 5. trinn. KOMPETANSEMÅL FRA LÆREPLANEN Eleven skal kunne LOKALE KJENNETEGN FOR MÅLOPPNÅELSE. Vurderingskriterier

Oversikt over innholdet i «Tempolex matematikk, ver. 1.5», veilederversjon 1.0

Teknisk rapport og analyse av resultat frå Nasjonale prøvar i engelsk 2008

KOMPETANSEMÅL ETTER 2. TRINNET Tall:

Eksamen MAT0010 Matematikk 10. årstrinn (Elever) Del 1. Del 1 + ark fra Del 2. Bokmål

Kengurukonkurransen 2011

Mestringsforventninger i matematikk. Learning Regions Karin Sørlie, Ingrid Syse & Göran Söderlund

Kengurukonkurransen 2013

Rapport fra kartleggingsprøve i regning for Vg1 høsten 2009

Analyser karakterstatistikk for grunnskolen 2009

Ukemål (Konkretiserte mål fra Fagplan) Prøver (Hentet fra prøveplan). Småprøver kan legges inn av teamene. og organisering

Hvilken sammenheng er det mellom elevers prestasjoner på en test i naturfag og formatet til oppgavene?

Kengurukonkurransen 2015

Eksamensveiledning for elever og privatister. i praktisk matematikk på yrkesfaglige programområder. MAT1001 Vg1 P-Y. Gjelder fra våren 2016

ÅRSPLAN I MATEMATIKK FOR 4. TRINN 2015/2016 (høst)

Transkript:

RAPPORT NASJONAL PRØVE I REGNING FOR 5. TRINN 2013 Grethe Ravlo Astrid Bondø Morten Svorkmo Olaug E. Lona Svingen Roberth Åsenhus Pål Are Andersen NSMO/NTNU mars 2014

Den nasjonale prøven i regning for 5.trinn 2013 Rapport basert på resultatene fra versjon 1 av prøven Grethe Ravlo, Astrid Bondø, Morten Svorkmo, Olaug E. Lona Svingen, Roberth Åsenhus og Pål Are Andersen Nasjonalt senter for matematikk i opplæringen (NSMO) NTNU mars 2014 Innhold Innledning... 3 Validitet... 4 Resultater innen områdene tall, måling og statistikk... 6 Resultater til enkeltoppgaver... 7 Oppgaver med lav p-verdi... 7 Oppgaver med lav p-verdi - ferdigheter hos elevene... 9 Oppgaver med høy p-verdi... 9 Oppgaveformat og p-verdier... 11 Kjønnsforskjeller... 13 Kjønnsforskjeller i enkeltoppgaver... 17 Kjønnsforskjeller innen områdene tall, måling og statistikk... 18 Kjønnsforskjeller og oppgaveformat...18 Ubesvarte oppgaver... 22 Kjønnsforskjeller i ubesvarte oppgaver... 24 Teknisk rapport... 25 Itemanalyse av alle oppgavene... 25 Kilder:... 27 2

Innledning Denne rapporten er basert på resultatene til elevene som gjennomførte versjon 1 av nasjonal prøve i regning for 5.trinn høsten 2013. Dette gjelder 17 926 elever. Den nasjonale prøven for 2013 foreligger i fire versjoner, versjon 1, 2, 3 og 4. Alle versjonene inneholder 45 oppgaver. Oppgavene i versjon 1, 2 og 3 er de samme, men rekkefølgen til de ti første og de ti siste oppgavene er ulik i de tre versjonene. Versjon 4 er litt annerledes. I den er 25 av oppgavene lik oppgavene i versjon 1, 2 og 3. De resterende 20 oppgavene er fra prøven i 2012, og de skal være med i en versjon av nasjonal prøve i flere år framover. Disse oppgavene skal brukes til å måle utvikling over tid av elevenes grunnleggende ferdigheter i å kunne regne. Både oppgavene og hvor de er plassert i oppgavesettet må holdes hemmelig. Versjon 4 av prøven for 2013 er derfor ikke offentlig tilgjengelig. Det var 3 408 elever som gjennomførte versjon 4. Disse elevene fikk bare vite hvor mange poeng de fikk totalt på prøven. Analyseresultatene viser at de tre versjonene av prøven fungerte tilnærmet likt. Veiledningsmateriellet som ligger på www.udir.no, og analysematerialet som ligger i PAS, har samme rekkefølge på oppgavene som i versjon 1 av prøven. Det var til sammen 56 481 elever på 5. trinn som gjennomførte nasjonal prøve i regning for 2013. Prøven tester kompetansemålene etter 4. trinn i Kunnskapsløftet (LK06) for grunnleggende ferdighet i å kunne regne i alle fag. Prøven for 2013 er en elektronisk prøve med 45 oppgaver og prøvetid 90 minutter. Elevene hadde ark til å kladde på, men svarte elektronisk. Riktig svar ble honorert med 1 poeng per oppgave, og det ble ikke gitt delpoeng. Resultatene i denne rapporten blir presentert i form av p-verdier, som tilsvarer den prosentandelen elever som fikk poeng på hver oppgave. Rapporten inneholder gjennomsnittlige p-verdier for alle elevene og for jentene og guttene hver for seg for hele prøven. I tillegg oppgis p-verdier for hver enkelt oppgave. Oppgavene er kategorisert etter spesielle kriterier. Vi har sammenlignet p-verdier i flervalgsoppgaver og åpne oppgaver, innenfor områdene tall, måling og statistikk, og undersøkt hvor stor andel av elevene som ikke har svart på oppgavene. Videre har vi sett på hvilke oppgaver som er riktig besvart av mange elever (høy p-verdi), hvilke oppgaver som elevene i stor grad har hatt problemer med å løse riktig (lav p-verdi), og hvilke oppgaver elever med lav gjennomsnittlig poengsum har løst. Oppgavene innenfor disse kategoriene er analysert for alle elevene og for jenter og gutter hver for seg. 3

Validitet 1 I Kunnskapsløftet (LK06) presiseres det at regning er en grunnleggende ferdighet i alle fag. Dette skal i så stor grad som mulig, gjenspeiles i den nasjonale prøven i regning. Prøven skal kartlegge i hvilken grad elevenes regneferdigheter er i samsvar med kompetansemål der regneferdigheter er integrert (Jfr. Rammeverk for nasjonale prøver, Utdanningsdirektoratet 2010). Siden prøven tester kompetansemålene for de ulike fagene etter 4. trinn i LK06, blir den gjennomført tidlig på 5. trinn. Innholdsmessig er den nasjonale prøven i regning knyttet til områdene tall, måling og statistikk. Rammeverket definerer hva som inngår i de ulike områdene (Utdanningsdirektoratet 2010). Det å kunne bruke regneferdigheter i faglige og dagligdagse sammenhenger skal vektlegges, og prøven skal inneholde både åpne oppgaver og flervalgsoppgaver. Noen av oppgavene er interaktive. I åpne oppgaver skal elevene enten skrive et svar, merke antall ruter i et rutenett eller stille klokka. I flervalgsoppgaver skal elevene enten velge ett av flere svaralternativer, sortere tall i riktig rekkefølge eller koble sammen ulike representasjoner av samme tall. I interaktive oppgaver skal elevene flytte på ett eller flere objekter. Prøven for 5. trinn 2013 består av 27 flervalgsoppgaver og 18 åpne oppgaver. Mange av oppgavene i prøven er relevante for mer enn ett fag. Oppgavene i prøven for 2013 knyttes til følgende fag: 1. Oppgaver innenfor området tall: Matematikk, norsk, samfunnsfag, naturfag, mat og helse, kroppsøving, kunst og håndverk 2. Oppgaver innenfor området måling: Matematikk, naturfag, samfunnsfag, musikk, mat og helse, kroppsøving, kunst og håndverk og religion, livssyn og etikk 3. Oppgaver innenfor området statistikk: Matematikk, norsk, samfunnsfag, naturfag, mat og helse og religion, livssyn og etikk Regning i engelsk er ikke representert i denne prøven. Regneprøven for 5.trinn består av 20 oppgaver i området tall, 18 innenfor måling og 7 statistikkoppgaver. Siden området tall er grunnlaget for regneferdigheter innenfor områdene måling og statistikk, er det naturlig at det er flest talloppgaver. Kompetansekravene i statistikk etter 4. trinn er begrensende for variasjonen i oppgavene. Alle delkompetansene innenfor statistikk er dekket gjennom de 7 oppgavene. For at alle elever skal få vist sin kompetanse, inneholder prøven oppgaver med ulik vanskelighetsgrad. Det er ferdig oppstilte regneoppgaver, oppgaver som tester evne til tolkning og til å løse problemer i kontekst, og evne til resonnement, analyse og vurdering. 1 Validitet betyr at prøven måler det den er ment å skulle måle, -grunnleggende ferdigheter i regning innenfor områdene tall, måling og statistikk i alle fag, relatert til LK06. 4

Tabell 1 Oppgaverekkefølge i versjon 1 av nasjonal prøve i regning 2013. N = 17 926 5

Tabell 1 viser rekkefølgen til oppgavene i versjon 1 av nasjonal prøve i regning for 5. trinn 2013. Tabellen viser hva oppgavene handler om, hvilket område hver oppgave hører inn under, om oppgaven er åpen eller om det er en flervalgsoppgave, hvilke fag hver oppgave har relevans til, og forventet vanskelighetsgrad til oppgavene. P-verdiene angir hvor mange prosent av elevene på 5. trinn som fikk rett svar på oppgavene. Det er p-verdier for alle de 17 926 elevene som gjennomførte versjon 1 av prøven, og for jenter og gutter hver for seg. Nest siste kolonne i tabellen viser forskjellen i prosentpoeng mellom jenter og gutter (Diff j-g). Positiv verdi betyr at jentene gjorde det bedre enn guttene på en oppgave, og negativ verdi at guttene gjorde det bedre enn jentene. Oppgavene er plassert på ulike vanskelighetsgrader, relatert til kompetansemål i LK06. Forventet vanskelighetsgrad 1 betyr at oppgaven bør kunne besvares av de fleste elevene, mens oppgavene på forventet vanskelighetsgrad 3 krever analyse og evne til vurdering. Tabell 1 viser at det ikke nødvendigvis er samsvar mellom forventet vanskelighetsgrad og det som elevene faktisk mestrer (p-verdi). Poengsummen som en elev oppnår på prøven, relateres til et mestringsnivå. På 5.trinn er det tre mestringsnivåer. Laveste mestringsnivå er 1, og det høyeste er mestringsnivå 3. Ei lærergruppe med fire personer har gjennomført ekstern validering av prøvesettet. I tillegg fikk vi tilbakemelding fra en del lærere og elever da vi piloterte oppgavene. Hver oppgave er pilotert på ca. 1 000 elever. Resultater innen områdene tall, måling og statistikk Den gjennomsnittlige p-verdien for hele prøven er 56,4. Det betyr at elevene i gjennomsnitt løste 56,4 prosent av alle oppgavene riktig. Det er området tall som har høyest gjennomsnittlig p-verdi. Elevene har i gjennomsnitt løst 62,8 prosent av talloppgavene riktig. For måling- og statistikkoppgavene er løsningsprosenten henholdsvis 50,7 og 52,4. Det er viktig å være klar over at en oppgave kan inneholde elementer fra flere områder. Derfor er det vanskelig å plassere enkelte oppgaver på ett bestemt område. Innenfor alle områdene er det tallbehandling. Det typiske for måling er behandling av enheter for masse, lengde og volum, beregning av areal og regning med temperatur og tid. Statistikk handler om å lage og lese tabeller og diagram, og i tillegg gjøre beregninger i forhold til disse. Av den grunn vil både tallbehandling og riktig bruk av enheter kunne inngå i statistikkoppgaver. Alle områdene har oppgaver med ulik vanskelighetsgrad (se tabell 1). Det blir ikke riktig å sammenligne resultatene til versjon 1 av prøven i 2013 med resultatene til tidligere prøver. Oppgavene er ikke like, og det er heller ikke like mange oppgaver innenfor hvert av områdene fra år til år. Men om 3 4 år vil vi, gjennom versjon 4 av prøven som inneholder 20 oppgaver som er like fra år til år, kunne si noe om utvikling av elevenes ferdigheter over tid. 6

Resultater til enkeltoppgaver Oppgavenes p-verdier varierer fra 12,4 til 87,8 og viser at det er et oppgavesett med stor bredde. For alle oppgavene gjelder at de elevene som har løst oppgaven riktig, i gjennomsnitt har høyere poengsum på hele prøven enn de som ikke har funnet riktig løsning (se teknisk rapport tabell 18). Oppgaver med lav p-verdi De åtte oppgavene som elevene på 5. trinn skåret dårligst på, har p-verdi fra 12,4 til 39,2 (se tabell 2). Guttene gjorde det signifikant bedre enn jentene på sju av disse oppgavene. Forskjellen er større i guttefavør enn i jentefavør. I to av oppgavene er forskjellen i guttefavør 13 og 17 prosentpoeng. Dette gir effektstørrelse 0,30 og 0,36, som betyr 30 og 36 prosent av standardavviket til gruppene som sammenlignes, og viser at kjønn har middels effekt for resultatet. Dette er oppgaver innenfor temaet måling hvor elevene skal gjøre om mellom måleenheter. I de andre oppgavene i tabell 2 er effekten av kjønn liten selv om forskjellen er signifikant. Tabell 2 Prøvens åtte oppgaver med løsningsprosent lavere enn 40 prosent Oppgaver Innhold Område Format P-verdi Prosent - poeng Diff. j-g Effektstørrelse 2 kjønn Forventet vanskelighetsgrad 39 Tolke tabell Statistikk Åpen 12,4-3,8 0,12 3 28 Lengde (cm og m) Måling Åpen 21,8-7,7 0,19 3 44 Vekt (g og kg) Måling Åpen 26,9-13,4 0,30 3 8 Vekt (g-hg) Måling Åpen 34,6-2,5 0,05 3 37 Temperatur Måling Flervalg 34,7-7,2 0,15 2 13 Lengde (m og km) Måling Flervalg 35,6-17,0 0,36 2 25 Velg regneart/sammensatt Tall Flervalg 37,1 6,3 0,13 3 17 Velg regneart/sammensatt Tall Flervalg 39,2-3,1 0,06 3 I tabell 2 ser vi at seks av åtte oppgaver er plassert på høyeste vanskelighetsgrad (3), og to av oppgavene er av middels vanskelighetsgrad (2). Det er to talloppgaver, fem målings- og en statistikkoppgave og like mange åpne oppgaver som flervalgsoppgaver. Tre av oppgavene med lavest p-verdi er flerstegsoppgaver hvor elevene må forholde seg til flere opplysninger, foreta omgjøringer og/eller velge riktig regneart og metode for å finne løsningen. Dette stemmer med resultatene fra PISA 2012 (Olsen & Kjærnsli 2013) i forhold til at norske elever presterer dårligere enn OECD-gjennomsnittet når det gjelder å bruke matematikk. 2 Effektstørrelse (e) har benevning standardavvik, og sier noe om forskjeller i gjennomsnittsverdier til to grupper. For eksempel i hvilken grad det har betydning for resultatet om det er ei jente eller en gutt som løser en oppgave. For e 0,3 er effekten liten. Hvis 0,3 < e < 0,8 er effekten middels, og hvis e 0,8 er effekten av hvilken gruppe man tilhører stor. 7

Oppgave 39 som har lavest p-verdi, er en flerstegsoppgave innenfor statistikk. Elevene skal tolke tekst og tabell, multiplisere et desimaltall med et tosifret tall og avslutte med addisjon. Oppgaven krever evne til å tolke, analysere, utføre beregninger og vurdere. Figur 1 Eksempel på oppgave med lav p-verdi (12,4) som krever evne til å analysere og vurdere. Oppgave 39 i 2013 Oppgave 28 og 44 er flerstegsoppgaver innenfor måling. I oppgave 28 skal elevene gjøre om mellom meter og centimeter og dividere. I oppgave 44 skal de regne mellom vektenhetene kilogram og gram. Elevene skal også tolke teksten i forhold til hvor mye pinnekjøtt det forventes at voksne og barn skal spise. Denne oppgaven har effektstørrelse 0,30 i guttefavør som viser at kjønn har middels betydning for resultatet (se figur 2). Figur 2 Eksempel på sammensatt oppgave med lav p-verdi (26,9). Oppgave 44 i 2013 Oppgave 8 tester omgjøring mellom enhetene gram og hektogram, og i oppgave 37 skal elevene finne differansen mellom et positivt og et negativt tall ved måling av temperatur. Oppgave 13 er en flervalgsoppgave som tester omgjøring mellom meter og kilometer. Her skal det også gjøres et overslag. Denne oppgaven har effektstørrelse 0,36 i guttefavør, og er den oppgaven i settet der elevens kjønn har hatt størst betydning for resultatet. 8

I oppgave 25 testes begrepet siffer og forståelse av tallsystemet. Det er den oppgaven der forskjellen i jentefavør er størst i hele oppgavesettet (6,3 prosentpoeng), og er den eneste av de åtte vanskeligste oppgavene hvor jentene har prosentvis bedre skår enn guttene. I oppgave 17 testes multiplikasjon med desimaltall. Oppgavene 13 og 25 omtales nærmere under temaet kjønnsforskjeller. Oppgaver med lav p-verdi - ferdigheter hos elevene Oppgave 39 er eneste oppgave med en p-verdi lavere enn 20 (se figur 1). Dette er en åpen oppgave med forventet vanskelighetsgrad 3. I denne oppgaven må elevene analysere og vurdere opplysningene før de kan trekke slutninger og avgi et svar (analyse/syntese). Elever som mestrer denne typen oppgaver, kan være på nivå fire eller fem i Blooms taksonomi (Bloom mfl.1956). I sammensatte oppgaver må elevene forholde seg til flere opplysninger og velge riktig regneart og metode for å finne løsningen. Oppgave 44 har samme utfordringer som oppgave 39, men kommer lettere ut på grunn av tallene som er brukt i oppgaven (se figur 2). I denne oppgaven kan elevene benytte seg av strategier som dobling og gjentatt addisjon med hele tall. Dette forenkler tallene elevene jobber med. Oppgaven har p-verdi 26,9. Oppgaver med høy p-verdi Ni oppgaver har p-verdier fra 77,7 til 87,8 (se tabell 3). Det er en statistikkoppgave, tre målingsoppgaver og fem oppgaver fra området tall. Tre av de ni oppgavene er åpne, og sju av oppgavene har forventet vanskelighetsgrad 1. Fire av oppgavene ligger blant de ti første oppgavene i prøven. Kun en av oppgavene med høyest p-verdi ligger blant de ti siste oppgavene. Tabell 3 Prøvens ni oppgaver med løsningsprosent høyere enn 75 prosent Oppgaver Innhold Område Format P-verdi 9 Prosent - poeng Diff. j-g Forventet vanskelighetsgrad 3 Plassverdisystem Tall Åpen 87,8-0,1 1 10 Lese diagram Statistikk Flervalg 83,7 2,3 1 5 Addisjon Tall Åpen 80,3 1,3 2 2 Volum (dl og L) Måling Flervalg 80,3-6,7 2 40 Divisjon Tall Flervalg 79,6-0,9 1 1 Lengde (m-cm) Måling Åpen 79,5-5,0 1 14 Multiplikasjon Tall Flervalg 79,3 2,2 1 33 Kjøp og salg Måling Flervalg 77,7 1,9 1 20 Addisjon Tall Flervalg 77,7 3,9 1 Oppgaven som har høyest p-verdi, er en talloppgave som tester posisjonssystemet med hele tall. De øvrige oppgavene handler om å lese av diagram, utføre ferdig oppstilt addisjon og gjøre enkle omgjøringer mellom de mest kjente lengde- og volumenhetene. Oppgave 10 har høy

løsningsprosent til tross for at elevene må hente opplysninger fra tre steder for å løse oppgaven. Her skal elevene finne, sammenligne og bearbeide opplysninger i en tabell og et søylediagram (se figur 3). Figur 3 Eksempel på statistikkoppgave som de fleste elevene behersker (p-verdi 83,7). Oppgave 10 i 2013 Tabell 4 viser de sju oppgavene som mer enn 51 prosent av elevene på mestringsnivå 1 har løst riktig. Elevene på mestringsnivå 1 har fra 0 til 18 poeng. Analyser viser at disse elevene får de fleste av poengene sine i oppgaver med høyest p-verdi for alle elevene på 5. trinn (se tabell 3 og 4). Jentene på mestringsnivå 1 gjør det bedre enn guttene i fem av disse sju oppgavene. De oppgavene der guttene gjør det bedre enn jentene, tester omgjøring mellom enheter. Oppgaven som gir størst jentefavør på mestringsnivå 1, er oppgave 10 (se figur 3). Det er 5,9 prosentpoeng flere jenter enn gutter som har løst denne oppgaven. 10

Tabell 4 Oppgaver med høy p-verdi blant elever på mestringsnivå 1. En p-verdi på 69,9 vil si at 69,9 prosent av elevene på mestringsnivå 1 har løst oppgaven riktig. Forskjellen, j-g, gjelder elever på nivå 1. N= 4 710 Oppgaver Innhold Område Format P-verdi Mestringsnivå 1 Prosent - poeng Diff. j-g Forventet vanskelighetsgrad 3 Plassverdisystem Tall Åpen 69,9 2,1 1 10 Lese diagram Statistikk Flervalg 66,7 5,9 1 5 Addisjon Tall Åpen 63,0 5,1 2 2 Volum (dl og L) Måling Flervalg 56,5-9,1 2 40 Divisjon Tall Flervalg 55,2 1,7 1 1 Lengde (m-cm) Måling Åpen 52,9-7,6 1 33 Kjøp og salg Måling Flervalg 51,0 4,3 1 Oppgaveformat og p-verdier Tabell 5 viser gjennomsnittlig p-verdi til oppgaveformatene for alle elevene og fordelt på mestringsnivå. Åpne oppgaver har gjennomsnittlig p-verdi 52,3, og for flervalgsoppgavene er gjennomsnittlig p-verdi 59,0. Tabell 5 Gjennomsnittlig p-verdi til oppgaveformat for alle elever og fordelt på mestringsnivå Gjennomsnittlig p-verdi Format Mestringsnivå 1 Mestringsnivå 2 Mestringsnivå 3 Alle elever Åpne 25,3 52,7 79,1 52,3 Flervalg 32,5 59,4 85,2 59,0 Elever på alle mestringsnivåer skårer høyere i flervalgsoppgaver enn i åpne oppgaver. For elever på mestringsnivå 1 er forskjellen 7,2 prosentpoeng og høyere enn for mestringsnivå 2 og 3 hvor forskjellen er henholdsvis 6,7 og 6,1 prosentpoeng. Når elever på alle nivåer skårer høyere i flervalgsoppgaver, kan det tyde på at de er bedre i stand til å vurdere hvilke svar som er rimelige enn å regne ut svaret selv. De åpne oppgavene og flervalgsoppgavene skiller godt mellom mestringsnivåene (se figur 4 og 5). 11

Figur 4 100,0 90,0 80,0 70,0 60,0 50,0 40,0 30,0 20,0 10,0 0,0 P-verdi for de åpne oppgavene, innenfor mestringsnivå. Sortert fra laveste til høyeste p- verdi ut fra resultatene på mestringsnivå 2 Mestringsnivå 1 Mestringsnivå 2 Mestringsnivå 3 P-verdi for åpne oppgaver på mestringsnivå NP5 2013 39 28 44 8 19 11 45 43 38 32 18 35 12 6 24 5 1 3 Figur 5 100,0 90,0 80,0 70,0 60,0 50,0 40,0 30,0 20,0 10,0 0,0 P-verdi for flervalgsoppgavene, innenfor mestringsnivå. Sortert fra laveste til høyeste p- verdi ut fra resultatene på mestringsnivå 2 Mestringsnivå 1 Mestringsnivå 2 Mestringsnivå 3 P-verdi for flervalgsoppgaver på mestringsnivå NP5 2013 37 13 25 17 42 15 9 34 23 36 26 27 41 7 16 21 4 22 31 30 29 33 20 40 2 10 14 12

Kjønnsforskjeller Guttene gjør det signifikant 3 bedre enn jentene på prøven som helhet. Den gjennomsnittlige kjønnsforskjellen i guttenes favør er 3,1 prosentpoeng. Dette tilsvarer effektstørrelse 0,14 som betyr 14 prosent av standardavviket, og viser at betydningen av kjønn er liten. Forskjellen mellom kjønnene er imidlertid signifikant og på samme nivå som i prøven for 2012. Tabell 6 Gjennomsnittlige p-verdier og effektstørrelse for jenter og gutter Gjennomsnittlig p-verdi Effektstørrelse Jenter 54,8 Gutter 57,9 0,14 Det er signifikant forskjell på prestasjonene til jenter og gutter i 33 oppgaver (se figur 6 og tabell 18). Guttene gjør det best i 22 oppgaver. I de 11 oppgavene som resultatmessig går i jentenes favør, er forskjellen i gjennomsnitt lavere enn i oppgaver der guttene gjør det bedre enn jentene. Største forskjell i guttefavør er 17 prosentpoeng, mens 6,3 prosentpoeng er den største forskjellen i jentefavør. Den gjennomsnittlige kjønnsforskjellen er stabil i guttefavør og har vært det i alle år siden første gjennomføring av nasjonale prøver i 2007. Figur 6 Forskjell i løsningsprosent for jenter og gutter for hver oppgave. Positive søyler (røde) for oppgaver hvor jentene gjør det bedre enn guttene og negative søyler (blå) hvor guttene gjør det bedre enn jentene. Å betyr åpne oppgaver. Oppgavenummer på horisontal akse og prosentpoeng på vertikal akse. N(j)= 8 970 og N(g)= 8 956 10,0 Kjønnsforskjell i oppgaver NP5 2013 5,0 0,0-5,0 Å-1 2 Å-3 4 Å-5 Å-6 7 Å-8 9 10 Å-11 Å-12 13 14 15 16 17 Å-18 Å-19 20 21 22 23 Å-24 25 26 27 Å-28 29 30 31 Å-32 33 34 Å-35 36 37 Å-38 Å-39 40 41 42 Å-43 Å-44 Å-45-10,0-15,0-20,0 Forskjellen mellom kjønn er merkbart mindre i oppgaver med høy p-verdi enn i oppgaver med lav p-verdi. To oppgaver skiller seg imidlertid ut. Oppgave 1 og 2 har guttedifferanse på henholdsvis 5 og 6,7 prosentpoeng (se tabell 3). Dette er to målingsoppgaver hvor elevene skal 3 Signifikant forskjellen er så stor at den ikke kan skyldes tilfeldigheter. 5 % signifikansnivå. 13

gjøre om mellom meter og centimeter og mellom desiliter og liter. Denne typen oppgaver viser seg å være «gutteoppgaver» uansett vanskelighetsgraden til oppgavene. Det er i oppgave 20 vi finner størst forskjell i prosentpoeng i jentefavør når det gjelder oppgaver med høy p-verdi. I denne oppgaven testes elevenes evne til å telle og forstå matematisk språk. Oppgaven inneholder ingen tallsymboler det skal regnes med (se figur 7). Figur 7 Oppgave med høy p-verdi (77,7) og stor kjønnsforskjell i jentefavør. Oppgave 20 i 2013 Små signifikante kjønnsforskjeller i guttenes favør kan vi også lese av resultatet for de norske elevene i matematikk på 4. trinn i TIMSS 2007 (Grønmo mfl. 2008) og i TIMSS 2011 (Grønmo mfl. 2012). En nasjonal prøve i regning er ikke en prøve i matematikk, men har fokus på anvendelse av grunnleggende ferdigheter i regning. Derfor er det kanskje mer naturlig å sammenligne med resultatene fra PISA, som ikke er en test i oppnådde kompetansemål i fag. I PISA 2012 (Olsen & Kjærnsli 2013) konkluderes det imidlertid med at det ikke er kjønnsforskjeller i matematikk i Norge. Det er ikke signifikante forskjeller verken i poeng på prøven eller i fordeling på prestasjonsnivå for kjønn. I denne PISA-rapporten stilles det derfor spørsmål om de ulikhetene vi ser i norske prøver (PISA, TIMSS og nasjonale prøver), mer handler om at vi sammenligner ulike typer prøver. I de nordiske landene med unntak av Danmark der gutter i PISA 2012 skårer 14 poeng bedre enn jentene, er det små kjønnsforskjeller, sammenlignet med andre OECD-land. Selv om PISA-undersøkelsene gjelder 14-15 åringer, er resultatene av så stor verdi at vi velger å ta de med i denne rapporten. En amerikansk meta-studie (Lindberg, Hyde mfl. 2010) konkluderer også med at det ikke er signifikante kjønnsforskjeller i matematikk. De påpeker stereotype oppfatninger om matematikk og menns dyktighet. Disse stereotypene kan påvirke kompetanse og mestringstro, og ha skadelig effekt på prestasjon. I samme studie henvises det til en engelsk studie (Melhuish, Sylva mfl. 2008) som ser på hvilke faktorer som påvirker elevers prestasjoner i matematikk. Der undersøkes ni ulike faktorer: fødselsvekt, kjønn, sosioøkonomisk status, mors utdanning, fars utdanning, familiens inntekt, læringsmiljø i hjemmet, effekt av barnehage og effekt av 14

opplæring på 1. 4. klasse. Kjønn er den faktoren som har minst effekt, mens mors utdanning, hjemmemiljø og opplæring i 1. 4. klasse er de tre faktorene som har størst effekt på elevenes prestasjoner. I lys av dette, - er det forventninger fra hjemmet og opplæringen i 1. 4. klasse vi bør fokusere sterkere på, for å gjøre kjønnsforskjellene i nasjonale prøver mindre? Det har vist seg at guttene ofte er flinkere til å anvende kunnskap, mens jentene er flinkere rent regneteknisk (Kjærnsli mfl. 2007). De fleste av oppgavene i den nasjonale prøven tester anvendelse av kunnskaper. Dette kan kanskje være en medvirkende årsak til at guttene gjør det signifikant bedre enn jentene på prøven. Elevene er plassert på tre mestringsnivåer etter oppnådd poengsum (se tabell 7). I versjon 1 av prøven deltok 8 970 jenter og 8 956 gutter. Tabellen viser at det er prosentvis flere jenter enn gutter på mestringsnivå 1 og 2, mens det er omvendt på mestringsnivå 3. Ca. 30 prosent av guttene i utvalget oppnår en poengsum tilsvarende mestringsnivå 3, mens ca. 22 prosent av jentene oppnår det samme. Tabell 7 Prosentvis fordeling og gjennomsnittlig poengsum for jenter og gutter på mestringsnivå Poeng i gjennomsnitt Mestringsnivå Prosent av jentene Prosent av guttene Jenter Gutter 1 (0-18) poeng 27,0 25,6 13,4 13,3 2 (19-32) poeng 50,9 44,6 25,4 25,7 3 (33-45) poeng 22,1 29,8 36,9 37,5 Gjennomsnittlig poengsum er lavere for jenter enn gutter både på mestringsnivå 2 og 3, men på mestringsnivå 1 er det motsatt. Selv om det er flere jenter enn gutter på mestringsnivå 1, presterer jentene i gjennomsnitt litt bedre enn guttene. På nivå 3 er det flere gutter enn jenter, og guttene presterer i gjennomsnitt litt bedre enn jentene (se figur 8). Figur 8 Poengfordeling på nivå, fordelt på jenter og gutter 15

Sammenlignet med prøven for 2012, har prosentandelen av gutter på nivå 3 økt med 1,0 prosentpoeng. Andelen jenter på nivå 3 har også gått opp i forhold til 2012 med 1,4 prosentpoeng. Det er i år 7,7 prosentpoeng flere gutter enn jenter på nivå 3. Differansen er 0,4 prosentpoeng mindre enn i 2012. Det kan bety en svak endring i positiv retning i jentenes favør i forhold til guttene. Tendensen til at kjønnsforskjellene er tydeligst i gutters favør på det øverste nivået, ser man også i undersøkelser fra USA (Carr mfl. 2007). I undersøkelsen fra 2007 understreker forskerne at dette er bekymringsfullt i forhold til rekruttering av jenter til høyere utdanning i matematikk og realfag generelt. Flere faktorer antas å ha betydning for en gryende kjønnsforskjell allerede blant elever i barneskolen. Det kan for eksempel være hvilke strategier man velger når man skal løse oppgaver, for eksempel hukommelsesstrategier eller enkle oppskrifter (for eksempel telle på fingrene), det kan handle om tempo, mental rotasjon av informasjon, elevenes faglige selvtillit og hvilke forventninger elevene selv og omverdenen har til den enkelte elev. En del forskning viser resultater som tyder på at gutter oppfatter seg selv som bedre i matematikk enn jenter (Kimball 1994, Li 1999), og annen forskning viser til resultater om at gutter har mer positiv holdning enn jenter til matematikk (Hannula mfl. 2007). Lovisa Sumpter (2009) har forsket på lærernes oppfatning av hvordan jenter og gutter arbeider med matematikkfaget, og hun påpeker ulikheter i bruk av strategier. I følge studier basert på nederlandske data fra TIMSS, ser sosioøkonomisk status ut til å påvirke jenters tro på egne matematikkferdigheter mer enn hos gutter (Meelissen mfl. 2008). Skole- og klassekarakteristikker viste i dette studiet små effekter på elevenes holdninger til matematikk, men hadde derimot effekter på prestasjoner i faget. Følelsen av utrygghet på skolen påvirket prestasjonene, men dette gjaldt bare jentene. Meelissen & Luyten (2008) ønsker derfor at faktorer som for eksempel klasseledelse skal inkluderes i framtidige TIMSS-undersøkelser. De understreker også viktigheten av å analysere separat de faktorene som kan tenkes å påvirke jenter og gutters holdninger til og prestasjoner i matematikk. Både Carr (2007) og Grønmo (2005) nevner i sine rapporter at automatisering av basiskunnskaper i matematikkfaget bør vektlegges. Da kan mental kapasitet frigis og tankekapasiteten kan brukes på mer kognitivt krevende oppgaver. I artikkelen Kjønnsforskjeller i motivasjon, læringsstrategibruk og selvregulering i naturfag (Elstad & Turmo 2007), peker Elstad og Turmo på at gutter har en tendens til å ha større fokus på såkalt prestasjonsmotivasjon enn jenter, det vil si at de er mer motiverte for å yte sitt beste i det som kan oppfattes som en konkurransesituasjon. Dette støttes av Grønmo (2008) som nevner at gutter både kan være mer konkurranseorienterte enn jenter, og mer opptatt av å bruke kvantitative begreper. Gjennom daglige aktiviteter dannes mentale representasjoner som igjen overføres til matematisk læring (Pitta-Pantazi mfl. 2004). Derfor kan viktige begreper innenfor den tidlige matematikkopplæringen, slike som større, mindre og lengst, i større grad bli innlært hos gutter enn hos jenter. Dette kan gi gutter et forsprang når det gjelder regning. 16

Kjønnsforskjeller i å løse matematiske problemer er et komplekst område. Ulikheter mellom kjønnene kan spores tilbake til et tidlig stadium i elevenes skolegang (Zhu 2007). Det gir en indikasjon på som tidligere nevnt, at elevenes tidlige skolegang er viktig og at matematikkopplæringen på 1. 4. klasse derfor bør settes under lupen. Kjønnsforskjeller i enkeltoppgaver Guttene gjør det signifikant bedre enn jentene i 22 av de 45 oppgavene, og jentene signifikant bedre enn guttene i 11 oppgaver. De fem oppgavene som viser størst kjønnsforskjell, er en tallog fire målingsoppgaver. To av oppgavene er flervalgsoppgaver, tre er åpne oppgaver og i alle fem oppgavene er kjønnsforskjellene i guttenes favør. I likhet med tidligere år, ser vi en klar tendens til at guttene i gjennomsnitt presterer bedre enn jentene i oppgaver med omgjøring mellom enheter i masse og lengde (spesielt kg og g, km og m). Dette gjelder både rene omgjøringsoppgaver og oppgaver der konteksten kan være en hjelp til å vurdere størrelse/mengde. Oppgaven som hadde klart størst kjønnsforskjell i årets prøve (17 prosentpoeng i guttefavør og effektstørrelse 0,36) tilhører denne kategorien (se figur 9). Figur 9 Oppgaven med størst kjønnsforskjell (17 prosentpoeng i guttefavør). Oppgave 13 i 2013 I denne oppgaven gjorde guttene det bedre enn jentene på alle mestringsnivåene. Forskjellen var størst på nivå 2 og 3 (ca. 17 prosentpoeng). På nivå 1 var forskjellen 7 prosentpoeng. Oppgaven måler omgjøring fra m til km. Figur 10 P-verdier, nivå og kjønn for oppgave 13. Størst kjønnsforskjell i guttenes favør Løsningsprosenter på mestringsnivå for oppgave 13 17

Av de 11 oppgavene der kjønnsforskjellen er signifikant i jentenes favør, finner vi sju talloppgaver, en statistikkoppgave og tre målingsoppgaver. Det er åtte flervalgsoppgaver og tre åpne oppgaver. Disse oppgavene er subtraksjonsoppgaver i kontekst, ferdig oppstilte oppgaver og beregning av areal. Figur 11 viser oppgaven med størst kjønnsforskjell i jentefavør. Figur 11 Oppgave med størst kjønnsforskjell i jentefavør (6,3 prosentpoeng). Oppgave 25 i 2013 Kjønnsforskjeller innen områdene tall, måling og statistikk Siden en oppgave kan inneholde elementer fra flere områder, er det noen ganger vanskelig å plassere en oppgave på ett bestemt område. Tabell 8 viser at guttene gjør det bedre enn jentene innenfor alle områdene, og størst er kjønnsforskjellen innenfor måling hvor effektstørrelsen er 26 prosent av standardavviket. Betydningen av å være gutt eller jente er imidlertid i kategorien lav for alle tre områdene. Tabell 8 Gjennomsnittlige p-verdier, forskjell i prosentpoeng og effektstørrelser for gutter og jenter innenfor tall, måling og statistikk P-verdi jenter P-verdi gutter Prosentpoeng, diff j-g Effektstørrelse Tall 62,2 63,3-1,0 0,04 Måling 47,8 53,7-5,9 0,26 Statistikk 51,9 53,1-1,2 0,05 Kjønnsforskjeller og oppgaveformat Analysen viser at guttene gjør det bedre enn jentene uavhengig av oppgaveformat, men at forskjellen er minst i flervalgsoppgaver (se tabell 9). Betydningen av kjønn er imidlertid svært lav for begge oppgaveformatene (se effektstørrelser i tabell 9). 18

Tabell 9 P-verdier og forskjeller i prosentpoeng for jenter og gutter i åpne oppgaver og flervalgsoppgaver Prosentpoeng, Effektstørrelse Format P-verdi jenter P-verdi gutter diff j-g Åpne 50,8 53,9-3,1 0,14 Flervalg 57,6 60,5-2,9 0,14 Blant de åpne oppgavene med størst forskjell i resultatene til jenter og gutter er det en talloppgave der elevene må velge regneart, en der de skal utføre en ferdig oppstilt subtraksjon og en enkel divisjon i kontekst. Målingsoppgavene krever at elevene behersker å regne med tid og omgjøring mellom gram og kilogram. I statistikkoppgaven skal elevene tolke en oppskrift og bearbeide opplysninger. Tabell 10 Åpne oppgaver der forskjellen i p-verdier for jenter og gutter er størst Oppgaver Innhold Område Format P-verdi alle i % P-verdi jenter i % P-verdi gutter i % Prosent - poeng Diff. j-g Å-12 Desimaltall Tall Åpen 61,8 54,1 69,4-15,3 Å-11 Vekt (g og kg) Måling Åpen 41,9 34,6 49,2-14,5 Å-44 Vekt (g og kg) Måling Åpen 26,9 20,2 33,6-13,4 Å-28 Lengde (cm og m) Måling Åpen 21,8 18,0 25,7-7,7 Å-1 Lengde (m-cm) Måling Åpen 79,5 77,0 82,0-5,0 Å-39 Tolke tabell Statistikk Åpen 12,4 10,5 14,3-3,8 Tabell 10 viser at kjønnsforskjellen er i guttefavør i alle de seks oppgavene. De tre oppgavene der kjønnsforskjellen er størst er en oppgave i desimaltall; tallrekke + 0,2 (se figur 12) samt to oppgaver med omgjøring mellom masseenheter. Oppgaver med omgjøring mellom masseenheter er, i 2013 som tidligere år, i guttefavør. Figur 12 Åpen talloppgave med størst kjønnsforskjell i guttefavør (15,3 prosentpoeng). Oppgave 12 i 2013 19

Tabell 11 Oversikt over flervalgsoppgaver der kjønnsforskjellene er størst Oppgaver Innhold Område Format P-verdi alle i % P-verdi jenter i % P-verdi gutter i % Prosent - poeng Diff. j-g 13 Lengde (m og km) Måling Flervalg 35,6 27,2 44,1-17,0 9 Vekt (g og kg) Måling Flervalg 44,2 36,9 51,5-14,6 34 Tid (t og min) Måling Flervalg 44,0 38,4 49,5-11,1 15 Desimaltall Tall Flervalg 44,1 40,1 48,2-8,1 31 Desimaltall Tall Flervalg 74,7 71,0 78,3-7,3 36 Tid (t og min) Måling Flervalg 44,8 41,2 48,4-7,2 37 Temperatur Måling Flervalg 34,7 31,1 38,3-7,2 2 Volum (dl og L) Måling Flervalg 80,3 76,9 83,6-6,7 25 Velg regneart / flersteg Tall Flervalg 37,1 40,2 33,9 6,3 I oppgavesettet er det 27 flervalgsoppgaver, og guttene har i gjennomsnitt høyest p-verdi i 19 av oppgavene. Kjønnsforskjellene er størst i oppgaver der forskjellen er i guttefavør. Tabell 11 viser de ni flervalgsoppgavene med størst forskjell i p-verdi mellom jenter og gutter, alle med unntak av én er i guttefavør. Seks av disse handler om omgjøringer mellom enheter og regning med tid og temperatur. En av talloppgavene tester regneartene multiplikasjon og addisjon med enheter som inngår i konteksten (se figur 13), og en handler om rangering av desimaltall. Den siste talloppgaven er i jentefavør og tester sifferbegrepet og plassverdisystemet (se figur 11). I sju av oppgavene inngår regning med desimaltall. Figur 13 Eksempel på flervalgsoppgave med kjønnsforskjell i guttefavør (8,1 prosentpoeng). Oppgave 15 i 2013 20

Tabell 12 Flervalgsoppgaver der jentene skårer bedre enn guttene Oppgaver Innhold Område Format P-verdi alle i % P-verdi jenter i % P-verdi gutter i % Prosent - poeng Diff. j-g 25 Velg regneart/sammensatt Tall Flervalg 37,1 40,2 33,9 6,3 26 Brøk Tall Flervalg 49,0 51,6 46,4 5,2 20 Addisjon Tall Flervalg 77,7 79,6 75,7 3,9 10 Lese diagram Statistikk Flervalg 83,7 84,8 82,6 2,3 14 Multiplikasjon Tall Flervalg 79,3 80,4 78,2 2,2 21 Areal Måling Flervalg 66,6 67,6 65,6 1,9 33 Kjøp og salg Måling Flervalg 77,7 78,7 76,8 1,9 4 Subtraksjon Tall Flervalg 69,0 69,9 68,2 1,7 Tabell 12b Åpne oppgaver der jentene skårer bedre enn guttene 6 Subtraksjon Tall Åpen 63,4 64,9 61,9 3,0 18 Areal Måling Åpen 61,9 63,4 60,5 2,9 5 Addisjon Tall Åpen 80,3 81,0 79,6 1,3 Jentene har i gjennomsnitt høyere p-verdi enn guttene i 8 av 27 flervalgsoppgaver (se tabell 12). I målingsoppgavene er det utregning av priser og beregning av areal i form av opptelling av ruter. Statistikkoppgaven er å orientere seg i en tabell og et diagram. I tre av talloppgavene er det en del tekst med enkle heltall, og det er ikke opplagt hvilken regneart som bør benyttes (se figur 14). En av talloppgavene er brøk; del av mengde. Oppgaven med størst kjønnsforskjell i jentefavør er omtalt tidligere (se figur 11). Figur 14 Eksempel på flervalgsoppgave med kjønnsforskjell i jentefavør (1,7 prosentpoeng). Oppgave 4 i 2013 De åpne oppgavene i jentefavør er to ferdig oppstilte oppgaver med addisjon og subtraksjon, og en hvor det skal tegnes et kvadrat. 21

Ubesvarte oppgaver I gjennomsnitt er 1,3 prosent av oppgavene i prøven ubesvart (se tabell 18). Analysen viser at det er litt høyere andel ubesvarte blant de åpne oppgavene enn blant flervalgsoppgavene (se tabell 13). Forskjellen mellom jenter og gutter når det gjelder andel ubesvarte åpne oppgaver og flervalgsoppgaver er ubetydelig. Tabell 13 Format Prosent ubesvarte oppgaver i gjennomsnitt på hele prøven, åpne oppgaver og flervalgsoppgaver Prosent ubesvarte alle elever Prosent ubesvarte jenter Prosent ubesvarte gutter Diff j - g Åpne 2,0 2,2 1,8 0,4 Flervalg 0,9 1,0 0,8 0,2 Det er en tendens til at andelen ubesvarte oppgaver øker mot slutten av prøven (se figur 15). Størst økning finner vi blant de åpne oppgavene. I gjennomsnitt er det 1,0 prosent av guttene og 1,4 prosent av jentene som lar de seks første åpne oppgavene stå ubesvart. For de seks siste åpne oppgavene i prøvesettet finner vi at tilsvarende tall er 3,0 prosent av guttene og 3,7 prosent av jentene (se tabell 14). Tabell 14 Oversikt over gjennomsnittlig andel ubesvarte for de seks første og de seks siste åpne oppgavene i oppgavesettet. Tallene er oppgitt i prosent Åpne oppgaver Prosent Prosent Åpne Prosent ubesvarte gutter ubesvarte jenter oppgaver ubesvarte gutter Å-1 0,6 1,2 Å-35 1,6 1,8 Prosent ubesvarte jenter Å-3 0,2 0,2 Å-38 2,4 3,1 Å-5 0,3 0,3 Å-39 5,1 5,4 Å-6 0,4 0,2 Å-43 2,2 2,6 Å-8 3,6 5,1 Å-44 3,6 5,0 Å-11 0,9 1,2 Å-45 3,4 4,1 Gj.snitt 1,0 1,4 Gj.snitt 3,0 3,7 For flervalgsoppgaver er tendensen den samme, men forskjellen mellom de første og siste oppgavene er mindre. I gjennomsnitt er det 0,2 prosent av guttene og 0,3 prosent av jentene som lar de seks første flervalgsoppgavene stå ubesvart. For de seks siste flervalgsoppgavene i prøvesettet er tilsvarende tall 2,0 prosent av guttene og 2,4 prosent av jentene (se tabell 15). 22

Tabell 15 Oversikt over gjennomsnittlig andel ubesvarte for de seks første og de seks siste flervalgsoppgavene i oppgavesettet. Tallene er oppgitt i prosent Flervalgs oppgaver Prosent ubesvarte gutter Prosent ubesvarte jenter Flervalgs oppgaver Prosent ubesvarte gutter Prosent ubesvarte jenter FV-2 0,1 0,2 FV-34 1,0 1,4 FV-4 0,1 0,2 FV-36 2,5 2,9 FV-7 0,3 0,3 FV-37 1,7 2,0 FV-9 0,2 0,2 FV-40 1,8 1,9 FV-10 0,1 0,1 FV-41 2,3 3,0 FV-13 0,4 0,7 FV-42 2,7 3,1 Gj.snitt 0,2 0,3 Gj.snitt 2,0 2,4 I ni av oppgavene er den totale andelen ubesvarte to prosent eller høyere (se tabell 18). Sju av disse er åpne oppgaver og to er flervalgsoppgaver. I alle ni er det flere jenter enn gutter som lar oppgavene stå ubesvart (se figur 14). Det er tre talloppgaver, tre målingsoppgaver og tre statistikkoppgaver. Fem av de mest ubesvarte oppgavene omhandler måleenheter på en eller annen måte. Oppgave 39 har høyest andel ubesvarte (se figur 1 og 15). Det er 5,1 prosent av guttene og 5,4 prosent av jentene som ikke svarer på denne oppgaven. Dette er en åpen oppgave som krever tolking av tabell og beregninger i flere steg. I forhold til prøven i 2012 er det markant oppgang i oppgaver med ubesvart andel høyere enn 2 prosent. I 2012 var det 4 oppgaver mens i 2013 er det 9 oppgaver. 23

Kjønnsforskjeller i ubesvarte oppgaver Figur 15 Å-45 Å-43 FV-41 Å-39 FV-37 Å-35 FV-33 FV-31 FV-29 FV-27 FV-25 FV-23 FV-21 Å-19 FV-17 FV-15 FV-13 Å-11 FV-9 FV-7 Å-5 Å-3 Å-1 Prosent jenter og gutter som ikke har svart på oppgavene. Rødt for jenter og blått for gutter. Å betyr åpen oppgave, og FV betyr flervalgsoppgave. Oppgavenummer langs vertikal akse, prosent langs horisontal akse. N (j) =8 970 og N (g)= 8 956 Ubesvarte oppgaver for jenter og gutter Jente Gutt 0,0 1,0 2,0 3,0 4,0 5,0 6,0 24

Teknisk rapport Tabell 16 Antall oppgaver Tekniske data for prøven. Flervalgsoppgaver Reliabilitet Gjennomsnittlig p-verdi Gjennomsnittlig poengsum Std.avvik Std.feil til gj.sn. 45 27 0,91 56,4 25,4 9,4 0,07 Tabell 17 Antall elever i utvalget. Gjennomsnittlige resultater som poeng og prosent Antall elever 17 926 Antall gutter 8 956 Antall jenter 8 970 Gjennomsnitt gutter Poeng og prosent 26,0 p (57,9 %) Gjennomsnitt jenter Poeng og prosent 24,7 p (54,8 %) Gjennomsnitt alle Poeng og prosent 25,4 p (56,4 %) Itemanalyse av alle oppgavene Itemanalyse for alle oppgavene er vist i tabell 18 I kolonnen Diff. J-G prosentpoeng, betyr positive verdier at jentene gjør det bedre enn guttene, og negative verdier at guttene gjør det bedre enn jentene FV betyr flervalgsoppgave. A, B, C og D er svaralternativene Å betyr åpen oppgave, 0 betyr galt svar og 1 betyr rett svar Alle oppgavene diskriminerer 4 godt Noen distraktorer velges av forholdsvis få elever og kunne kanskje vært byttet ut, men vi valgte å ta de med De gale alternativene i flervalgsoppgavene blir i alle oppgavene valgt av elever som har lavere gjennomsnitt på prøven enn de som har rett på oppgaven 4 Diskriminering: Diskr (D) betyr oppgavens diskriminering, dvs. hvordan oppgaven samsvarer med summen av alle oppgavene. 25

Tabell 18 Item-analyse for alle oppgavene. Svarfordeling angitt i prosent og elevenes dyktighet i poeng. Med dyktighet menes gjennomsnittlig poengsum for de elevene som har svart det bestemte alternativet i flervalgsoppgavene, og har fått rett eller galt i de åpne oppgavene. D-verdi betyr oppgavens diskriminering (korrelasjon med summen av poeng). Guttene har høyest løsningsprosent i de oppgavene hvor differansen er negativ a) Svak diskriminering <0,30 (oppgave nr 8 og nr 12) cg) Kjønnsforskjeller i gutters favør, signifikant cj) Kjønnsforskjeller i jenters favør, signifikant 26

Kilder: Bloom, Benjamin (1956). The Taxonomy of Educational Objectives. The Classification of Educational Goals. Handbook I: Cognitive Domain. Carr, M., Steiner, H. S., Kyser, B. & Biddlecomb, B. (2007). A comparison of predictors of early emerging gender differences in mathematics competency. I Learning and Individual Differences, 18 (2008), 61 75. Elstad, E. & Turmo, A. (2007). Kjønnsforskjeller i motivasjon, læringsstrategibruk og selvregulering i naturfag. I NorDiNa 1. Grønmo, L. S. (2005). Ferdighetenes plass i matematikkundervisningen. I Namnaren, 4. Grønmo, L. S., Bergem, O. K., Nylehn, J. & Onstad, T (2008). Fortsatt store utfordringer for norsk skole. ILS, Universitet i Oslo. Grønmo, L. S., Onstad, T., Nilsen, T., Hole, A., Aslaksen, H. & Borge, I.C. (2012). Framgang, men langt fram. Norske elevers prestasjoner i matematikk og naturfag i TIMSS 2011. Akademika forlag. Hannula, M.S, Juuti, K. & Ahtee, M. (2007). Gender Issues in Finnish Mathematics and Physics Education. I E. Pehkonen, M. Ahtee & J. Lavonen (Eds.), How finns learn mathematics and science (pp. 85-96). Rotterdam: Sense Kimball, M. (1995). Feminist Visions of Gender Similarities and Differences. Harrington Park Press Kjærnsli, M., Lie, S., Olsen, R.V. & Roe, A. (2007). Tid for tunge løft: norske elevers kompetanse i naturfag, lesing og matematikk i PISA 2006. Oslo: Universitetsforlaget. Li, Q. (1999). Teachers beliefs and gender differences in mathematics: a review. Educational Research, 41(1):63 76. Lindberg, S. M., et al. (2010). "New trends in gender and mathematics performance: A meta-analysis." Psychological Bulletin 136(6): 1123-1135. Meelissen, H. & Luyten, H. (2008). The Dutch gender gap in mathematics: Small for achievement, substantial for beliefs and attitudes. Studies in Educational Evaluation, 34, 82 93. Melhuish, E. C., et al. (2008). "Preschool influences on mathematics achievement." Science 321(5893): 1161-1162. Olsen, R. V. and M. Kjærnsli (2013). Fortsatt en vei å gå: norske elevers kompetanse i matematikk, naturfag og lesing i PISA 2012, Universitetsforl. Pitta-Pantazi, D., Gray, EM. & Christou, C (2004). Elementary School Students' Mental Representation of Fractions. I Mathematics Education, 4, 41 48. Sumpter, L. (2009). On Aspects of Mathematical Reasoning. Affect and Gender, Doctoral Thesis No. 41. Department of Mathematics and Mathematical statistics, Umeå University, Sweden Utdanningsdirektoratet. (2010). Rammeverk for nasjonale prøver. 27

Zhu, Z. (2007). "Gender Differences in Mathematical Problem Solving Patterns: A Review of Literature." International Education Journal 8(2): 187-203. 28