Samordna opptak og omregningstabeller

Størrelse: px
Begynne med side:

Download "Samordna opptak og omregningstabeller"

Transkript

1 Samordna opptak og omregningstabeller Notatnr Forfattere Dato SAMBA// Ingunn Fride Tvete Anders Løland. mai

2 Norsk Regnesentral Norsk Regnesentral (NR) er en privat, uavhengig stiftelse som utfører oppdragsforskning for bedrifter og det offentlige i det norske og internasjonale markedet. NR ble etablert i 9 og har kontorer i Kristen Nygaards hus ved Universitetet i Oslo. NR er et av Europas største miljøer innen anvendt statistisk-matematisk modellering og har et senter for forskningsdrevet innovasjon, Statistics for Innovation (sfi), med finansiering fra Norges forskningsråd. Det jobbes med et bredt spekter av problemstillinger, for eksempel finansiell risiko, jordobservasjon, estimering av fiskebestander og beskrivelse av geologien i petroleumsreservoarer. NR er ledende i Norge innen utvalgte deler av informasjons- og kommunikasjonsteknologi. Innen IKT-området har NR innsatsområdene e-inkludering, informasjonssikkerhet og smarte informasjonssystemer. NRs visjon er forskningsresultater som brukes og synes.

3 Tittel Forfattere Samordna opptak og omregningstabeller Ingunn Fride Tvete <Ingunn.Fride.Tvete> Anders Løland Dato. mai Publikasjonsnummer SAMBA// Sammendrag Samordna opptak ønsker en vurdering av metodene som nå benyttes for å oversette utenlandske karaktersnitt til norske. I denne rapporten oppsummerer Norsk Regnesentrals dette arbeidet. Basert på simuleringsstudier og vårt faglige skjønn anbefaler vi følgende endringer: Å dele inn i -prosentiler istedenfor å dele inn i -prosentiler som i dagens metode. Å interpolere lineært mellom utenlandsk og norsk karakterskala ved færre enn tilgjengelige utenlandske karaktersnitt, fremfor ved færre enn tilgjengelige karaktersnitt i dagens metode. I noen tilfeller har en stor andel av søkerne fra et annet land toppkarakteren. Heller enn å ta gjennomsnittet av nedre og øvre karaktersnitt i den tilhørende prosentilgruppen, anbefaler vi å bruke midtpunktet/medianen for det aktuelle karakterområdet som oversatt karaktersnitt. Emneord Målgruppe Tilgjengelighet Prosjekt Karaktersnitt, Lineær interpolasjon, Nasjonal vitnemålsdatabase, Omregningsmetode, Prosentil Samordna opptak Konfidensiell Samordna opptak Prosjektnummer 67 Satsningsområde Teknologi, industri og forvaltning Antall sider Copyright Norsk Regnesentral

4 Innhold Innledning Bakgrunnsdata Forutsetninger Vurdering av dagens praksis Notasjon SOs omregningsmetode Alternative metoder Standardfeil Når andelen som får topp eller bunn-karaktersnittet avviker sterkt fra tilsvarende andeler i Norge Oppsummering og anbefalinger Anbefalt metode Grense for lineær interpolering Høy andel personer på ekstremverdiene Samordna opptak og omregningstabeller

5 Innledning Samordna opptak (SO) bestemmer hvordan karakterer gitt i andre land skal omregnes til norske. SO har ansvaret for driften av Nasjonal vitnemålsdatabase (NVB) som inneholder vitnemål med karakterdata for de fleste som fullfører og består norsk -årig videregående opplæring. Denne databasen omfatter nå omtrent 6 vitnemål (NVB-statistikk). SO har tilgang til tilsvarende offisiell karakterstatistikk for mange andre land. For noen land, som for eksempel Tyskland, har man god informasjon, mens man for noen land vet mindre. Man skiller mellom land med offisiell karakterstatistikk og land uten offisiell karakterstatistikk men der man har informasjon om mer enn personers karakterer og land uten offisiell karakterstatistikk, men der man har informasjon om eller færre personers karakterer En oversettelse gjøres for en persons karaktersnitt og ikke enkeltkarakterer. Oversettelsen av karaktersnittene gjøres primært ved å dele NVB-statistikken i prosentiler og matche denne med tilsvarende prosentiler for utenlandske karakterer, og deretter gjøre en stykkevis lineær interpolering. Det gjøres justeringer hvis man i andre land har en mye større andel topp (eller bunn) karakterer. Uten offisiell karakterstatistikk og uten informasjon om flere enn personers karaktersnitt gjøres en lineær omregning mellom den norske og den utenlandske karakterskalaen. SO ønsker en vurdering av metodene som nå benyttes for å oversette utenlandske karaktersnitt til norske. Denne rapporten tar for seg følgende: En vurdering av nåværende metoder. Vi tar utgangspunkt i NVB-statistikken. Vi vurderer antallet prosentiler og måten man interpolerer på. Vi sammenligner alternativ(er) med nåværende praksis. Vi fokuserer spesielt på tilfellene der andelen med ekstremkaraktersnitt avviker fra tilsvarende andel i NVB. I forbindelse med manglende tilgang til utenlandsk offisiell karakterstatistikk ser vi på hvordan det å bruke egenprodusert statistikk slår ut i forhold til en lineær (standard) omregning, sett i lys av antallet snittkarakterer man har til rådighet. Vi foreslår en grense for når en lineær omregning kan brukes. Vi oppsummerer våre funn og gir forslag til fremgangsmåter som kan gi utenlandske søkere en rettferdig oversettelse av sine karaktersnitt. Samordna opptak og omregningstabeller

6 Tabell. Antall med ulike karaktersnitt i NVB-statistikken for søkere med vitnemål som gir generell studiekompetanse, totalt 6 7 personer. Karakter Antall Karakter Antall Karakter Antall, 7, 7, 969, , 7,7 8,,,8 96, 86, 68,9 66, 76,, 8,, ,6 6,7 6, 896,7 77,8 966, 8,8,9 9, 68,9 6, 977, 77 6, 978,6 8, 96,7 7,,8 6,,9 877 Bakgrunnsdata SO har skaffet til veie en oversikt over antall med ulike karaktersnitt i NVB-statistikken for søkere med vitnemål som gir generell studiekompetanse, totalt 6 personer. Karaktersnittene spenner fra, til 6,, i alt karaktersnitt. Disse tallene er vist i tabell. Alle utenlandske søkere får sitt karaktersnitt konvertert i henhold til den norske karakterskalaen. Det antas at alle lands (kvalifiserende) videregående opplæring har samme nivå og kvalitet, og at alle elever som fullfører og består denne utdannelsen har lik fordeling av kunnskaper og ferdigheter. Et land der vi vet mye om karaktersnittene er Tyskland. Der er karaktersnittet, best og karaktersnittet, dårligst. I figur ser vi hvordan de norske og tyske karakterene fordeler seg. Fordelingene ser noe forskjellige ut. Vi ser spesielt at det er langt flere gode tyske karaktersnitt enn norske. Vi legger også merke til at for den norske karakterfordelingen er det relativt få med karakter, 9,, 9 og, 9. Andre land kan ha fordelinger av karaktersnitt som ser annerledes ut enn de norske og tyske. I Ukraina har for eksempel.% toppkarakteren. Når det gjelder fordelingen av karaktersnittene i en del andre land, som for eksempel Brasil og ikke minst Etiopia, har vi ikke en detaljert offisiell karakterstatistikk som den tyske å forholde oss til. Samordna opptak og omregningstabeller 6

7 F o rd e lin g o v e r n o rs k e k a ra k te rs n it K a ra k te rs n it Antall,,,,,6,7,8,9,,,,,6,7,8,9,,,,,6,7,8,9,,,,,6,7,8,9 6 F o rd e lin g o v e r ty s k e k a ra k te rs n it K a ra k te rs n it Antall,9,8,7,6,,,,,9,8,7,6,,,,,9,8,7,6,,,, Figur. Fordelingen av norske og tyske gjennomsnittskarakterer. Samordna opptak og omregningstabeller 7

8 Forutsetninger I litteraturen skiller man gjerne mellom to statistiske rammeverk for å studere utfordringer knyttet til ulike måleskalaer: Classical testing theory (CCT) og Item response theory (IRT). Vi vil i dette notatet se bort fra sistnevnte, da det innebærer en mer omfattende analyse utenfor oppdragets rammer. Innenfor CCT skiller man mellom gjennomsnittlig, lineær og ekviprosentil-metoder, der sistnevnte er vanlig og i hovedsak brukt av SO. Det er derfor spesielt sistnevnte metode, og utfordringer og begrensninger rundt denne vi vil ta for oss. Når man skal oversette utenlandske karaktersnitt vil det oppstå estimeringsfeil. Et mål er å ha så lite estimeringsfeil som mulig. Man skiller gjerne mellom systematisk feil, som oppstår da antagelsene som legges til grunn ikke nødvendigvis er helt korrekte, og tilfeldig feil, som oppstår da man kun har et begrenset antall karaktersnitt og ikke hele populasjonen. Alle utenlandske søkere får sitt karaktersnitt konvertert i henhold til den norske karakterskalaen. Det antas at alle lands (kvalifiserende) videregående opplæring har samme nivå og kvalitet, og at alle elever som fullfører og består denne utdannelsen har lik fordeling av kunnskaper og ferdigheter. Dette innebærer at forskjeller i karakterfordeling utover at det kan brukes ulike skalaer skal skyldes ulik bruk av karakterskalaene. Dette er forutsetninger som antas som gitt og som vi i dette notatet ikke skal ta stilling til om er rimelige eller ikke. Det vil alltid oppstå estimeringsfeil, men den kan reduseres ved å endre utvalgsstørrelsen eller selve omregningsmetoden. Typisk vil feilen være mindre midt på karakterskalaen, der man har flest observasjoner, og større i øvre og nedre del av karakterskalaen der det er færre observasjoner. Vi vil gi anslag på størrelsen av denne i lys av antall karaktersnitt tilgjengelig og valg av omregningsmetode. Da det først og fremst er i den øverste delen av karakterskalaen det er viktig å oversette riktigst mulig, vil vi spesielt fokusere på disse. Vi vil i analysene ta for oss tysk og ukrainsk karakterstatistikk for å belyse problemstillingene.. M. J. Kolen og R. L. Brennan. Test Equating, Scaling and Linking., Springer Samordna opptak og omregningstabeller 8

9 Vurdering av dagens praksis Vi vil se på omregningsmetoden SO i dag praktiserer som hovedregel, og vurdere alternativer. For disse alternativene vil vi studere standardfeilen.. Notasjon Vi lar Y angi de norske karaktersnittene, y =,,..., y = 6, (best). Videre lar vi g(y) og G(y) angi henholdsvis Y s tetthetsfunksjon og kumulative tetthetsfunksjon. Q(y) angir prosentilene. Y, g(y) og G(y) er vist i tabell. Videre lar vi X angi utenlandske karaktersnitt, for eksempel tyske: x =,,..., x =, (best). Disse har tetthetsfunksjon f(x) og kumulativ tetthetsfunksjon F (x). P (x) angir prosentilene. X, f(x) og F (x) er presentert i tabell for de tyske dataene. Det er flere måter å regne prosentiler på. Så lenge ikke noe annet er presisert vil vi definere prosentilene Q(y) og P (x) på samme måte som SO har gjort i sine beregninger.. SOs omregningsmetode Metoden SO som hovedregel benytter er å dele både de norske og utenlandske dataene i -prosentil-intervaller, og så interpolere lineært mellom disse intervallene. En oversikt er vist i tabell. La oss for eksempel si at vi er interessert i et utenlandsk karaktersnitt x sin korresponderende norske y-verdi, der x ligger mellom to -prosentiler P L (X L (x)) og P U (X U (x)). Her er P L (X L (x)) største -prosentil, slik at x L (x) x og P U (X U (x)) er minste -prosentil, slik at x U (x) > x. De korresponderende prosentilene på y-skalaen er Q L (y L (x)) og Q U (y U (x)). Da har vi at estimert y gitt x, e y (x), er gitt ved e y (x) = y U (x) + (y U (x) y L (x)) x x U (x) x U (x) x L (x). () For et tysk karaktersnitt på,9 er nærmeste -prosentil P L (x L (, 9)) = % for x L (x =, 9) = og P U (x U (, 9)) = % for x U (x =, 9) =,. Tilsvarende norske prosentiler får vi for y L (x =, 9) =, og y U (x =, 9) =,, noe som gir e y (x =, 9) =, + (, ),9,, =, 8. Et tysk gjennomsnitt på, 9 svarer altså til et norsk gjennomsnitt på, 8. Nåværende alternativ til å ikke bruke denne ekviprosentilmetoden er direkte lineær interpolering, og dette gjøres i dag når man ikke har andre lands offisielle karakterstatistikk og ikke informasjon om mer enn personers karaktersnitt. Skulle vi gjort dette på de tyske data ville vi bruke ligning () til å oversette et tysk karaktersnitt x til et norsk e Y (x) der y U (x) = 6, y L (x) =, x U (x) = og x L (x) =.. Alternative metoder Et alternativ til dagens praksis er å dele datene inn i flere prosentiler, for eksempel - prosentiler, - prosentiler og -prosentiler. Opplegget blir altså som beskrevet for ligning (), men med flere prosentil-intevaller å interpolere mellom. Et annet alternativ kunne være å se på hele fordelingen til Y og ikke bare -prosentilen. For en gitt x vil man da finne F (x) og så videre beregne e Y (x). Ved å la G L (y L (x)) og Samordna opptak og omregningstabeller 9

10 Tabell. Norske og tyske karaktergjennomsnitt for -prosentilene. Norske karaktersnitt Tyske karaktersnitt -prosentiler,,,,,6,8,8,6,, 6,, 7,6 8,9,7 9 6,, G U (y U (x)) angi henholdsvis største G(y) mindre eller lik F (x) og minste G(y) større eller lik F (x), der y L (x) og y U (x) er korresponderende y-verdier, får vi at e y (x) = y L (x) + (y U (x) y L (x)) F (x) G L (y L (x)) G U (y U (x)) G L (y L (x)) angir estimert karaktersnitt y for et gitt karaktersnitt x som vi ønsker å oversette. () For et tysk karaktersitt på, 9 får vi nå at tilhørende F (x =, 9) =,, slik at P (x =, 9) =, %. For den norske skalaen er G(y =, ) =,, slik at det korresponderende norske karaktersnittet blir,. Med et tysk karaktersitt på, 9 får vi at F (x =, 9) =, 7, slik at P (x =, 9) =, 7%. På den norske skalaen er G(y =, 6) =, og G(y =, 7) =, 6, noe som gir e y (x =, 9) =, 6+(, 7, 6),7,6 =, 6. Dette kan synes som en fornuftig ide, men med et lite datasett som skal oversettes (men også for datasett over ) får man problemer. I et slikt tilfelle vil en få en F (x) som spesielt ved små og store verdier av x vil avvike fra fordelingen til G(y), med det resultat at ekstremkarakterer vil bli dårlig oversatt.. Standardfeil Vi ønsker å si noe om størrelsen på standardfeilen omregningsmetodene genererer i lys av antall tilgjengelige observasjoner. En naturlig tilnærming kunne være å trekke et tilfeldig utvalg, på for eksempel karaktersnitt, fra den tyske populasjonen av karakterer, og så bruke omregningsmetoden til å oversette disse til korresponderende norske karaktersnitt. Ved å gjøre dette mange ganger slik kan man for hvert tyske gjennomsnitt estimere standardfeilen. Størrelsen på standardfeilen for en gitt utvalgsstørrelse vil da avhenge av omregningsmetoden, men også av de forutsetninger om den tyske populasjonen som kanskje ikke er tilfredsstilt (gjerne det man kaller en systematiske feil). Vi benytter følgende såkalte bootstrap-prosedyre:. Trekker S tyske karaktersnitt tilfeldig, med tilbakelegging, som gir oss de trukne karaktersnittene x,..., x S. Da det svært sjelden trekkes et topp- og bunn-karaktersnitt Samordna opptak og omregningstabeller

11 (sannsynligheten for å trekke et snitt på, er 67/77 87 og sannsynligheten for å trekke et snitt på, er 8/77 87) legger vi disse to til det trukne settet S. Vi beregner antall prosentiler i henhold til valgt omregningsmetode og interpolerer mellom disse. Vi interpolerer videre karaktersnittene som vi ikke har trukket med omregningsmetoden. Totalt blir altså alle de tyske karaktersnittene oversatt til norske karaktersnitt.. Bruker så omregningsmetoden for å finne koresponderende norske kraraktersnitt e Y (x ),..., e Y (x ) i henhold til ligning ().. Gjentar. og. B ganger og får {e Y (x ),..., e Y (x )},..., {e Y (x B ),..., e Y (x B )}.. Vi er interessert i variasjonen i de oversatte karaktersnittene. I dette punktet, og bare i dette, vil vi avvike fra hvordan vi så langt har beregnet prosentilene, og heller ta utgangspunkt i de kumulative fordelingene G(y) og F (x). En alternativ definisjon av prosentiler er Q (y) = G(y) og tilsvarende P (x) = F (x), der G(y) og F (x) er gitt i tabell og. For alle de tyske karakterene sine prosentiler kan vi finne de tilhørende norske prosentilene. Det gir oss tilhørende norske karaktersnitt. For eksempel vil et tyskt karaktersnitt på x =, 8 svare til en prosentil på P (x =, 8) =, %. Ser vi på den norske fordelingen svarer dette til et norsk karaktersnitt på, (nærmeste prosentil ovenfra er på, %, se tabell ). Vi kaller de tilhørende norske karaktersnittene y (x). Vi ønsker for hvert tyske karaktersnitt x å beregne B sd(x) = (y (x) e y (x)). B Vi gjentar denne prosedyren for forskjellig antall trukne karaktersnitt; S =, 7,, og, og for ulik grad av prosentilindeling; -prosentiler (nåværende praksis), -prosentiler, -prosentiler og -prosentiler. Bootstrap-rutinen gjentas B = ganger. For å gjøre beregningene beskrevet ovenfor har vi benyttet programmet R. Når vi bruker den beskrevne ekviprosentil-metoden vil vi som tidligere nevnt beregne prosentilene på samme måte som SO gjør i dag. Det er flere måter å regne prosentiler på, og disse kan gi noe forskjellig svar. Standard-metoden i R gir samme prosentilfordeling for de norske og tyske karaktersnittene som den SO har. I figurene og har vi plottet resultatene fra simuleringsprosedyren beskrevet ovenfor for henholdsvis og trukne karaktersett. Hovedtendensen er at feilen blir større med grovere prosentilindeling. Dette gjelder spesielt for de beste karaktersnittene. For disse overestimeres det tilsvarende norske karaktersnittet. Siden den tyske karakterskalaen er mer topp-tung enn den norske vil x L (x =, ) gjennomgående bli for stor, slik at e y (x =, ) overestimeres. Dette resulterer i den store toppen til høyre i figurene og. Denne feilen blir mindre med et større utvalg. Hvor uttalt dette problemet er avhenger av selve fordelingen til karakterpopulasjonen som skal oversettes. Er fordelingen enda mer topp-tung enn den tyske, vil den estimerte feilen bli enda større. For karaktersnitt midt på treet har, som forventet, ikke valgt omregningsmetode så mye å si for størrelsen på feilen. Samordna opptak og omregningstabeller

12 Standardfeil fra tilfeldige utvalg på karaktersnitt il fe rd a d n ta S,,, -prosentiler -prosentiler -prosentiler -prosentiler,,,,,,,,, Tyske karaktersnitt Figur. Estimert standardfeil for karaktersnitt, boostrapestimater for s=,, 7,, og karaktersnitt. Vi ser i gur, for -prosentilmetoden, hvordan standardfeilen som funksjon av karaktersnittet varierer med antallet karaktersnitt vi tar utgangspunkt i. Som forventet går standardfeilennednårmanøker antalletkaraktersnitt. Nåværende alternativ tildenne ekviprosentilmetoden er som tidligerebeskrevetdirekte lineær interpolering. Vi brukerda ligning () for å oversette et tysk karaktersnitt x til et norsk e Y (x). Vi beregner videre absolutt avvikmellom e Y (x) og y (x) gitt ved e y (x) y (x) foralle tyskekaraktersnitt. Resultateneervist i gur. Dettegiretmålpåabsolutt feil (det er ingenusikkerhether). Samordnaopptakogomregningstabeller

13 Standardfeil fra tilfeldige utvalg på karaktersnitt il fe rd a d n ta S,,, -prosentiler -prosentiler -prosentiler -prosentiler,,,,,,,,, Tyske karaktersnitt Figur. Estimert standardfeil for karaktersnitt, boostrapestimater for s=,, 7,, og karaktersnitt. Samordnaopptakog omregningstabeller

14 Standardfeil med -prosentil fra tilfeldige utvalg av ulik størrelse, karaktersnitt karaktersnitt karaktersnitt 7 karaktersnitt karaktersnitt il fe rd a d n ta S,,,,,,,,, Tyske karaktersnitt Figur. Absolutt feil for lineær interpolering fra tyske til norske karaktersnitt. Samordnaopptakog omregningstabeller

15 Feil ved lineær konvertering fra tyske til norske karakterer r te k ra a k tig rik g o t e n g re e b m lo e m ik v ta lu o s b A,,,,,,,,,, Tyske karaktersnitt Figur. Absolutt feil for lineær interpolering fra tyske til norske karaktersnitt. Samordnaopptakog omregningstabeller

16 Fordeling over de % beste norske karaktersnitt l ta n A Karaktersnitt Figur 6. Fordeling av de % beste norske karaktersnittene. Blå vertikal strek angir medianen i intervalletog rød vertikal strekangir verdien som gis søkeremed toppkarakter fra Ukraina i dag.. Når andelen som får topp eller bunn-karaktersnittet avviker sterkt fra tilsvarende andeler i Norge I noen land er det en ganske stor andel som får toppkarakter. I for eksempel Ukraina får, % toppkaraktersnittet,. Den nåværende prosedyren med lineær omregning innebærer atman nnerdetkorresponderende norske karaktersnittetdenne prosentilen tilsvarerog lardisse søkernefågjennomsnittetavdenneog toppkaraktersnittet. I tilfellet 6+,6 med toppkaraktersnittet på, fra Ukraina blir den norske karakteren =, når man tarutgangspunkt i 8-prosentilen. Denne fremgangsmåten vil være riktighvis fordelingenmellom karaktersnittene i NVB-statistikken er symmetrisk fordelt. Det er ikke tilfellet. Figur 6 viser et histogram over alle de norske karaktersnittene som ligger på 8-prosentilenogover. Vi serathovedtyngdenavkarakterene er inedredelavkarakterskalaen. Detvilleværemer fornuftigåbrukemidtpunktetmellomkaraktergrensene. Vi nneralle norskekaraktersnittpå, 6 (tilsvarer8-prosentilen) ogover. Medianen idettedatasettet vil etterdenne regelen angidetoversatteukrainske toppkaraktersnittet. Den er, 9. Fra omregningstabellen for Ukraina nner vi at det er 79,-prosentilen som angir grensen for toppkarakter. Det er ingen grunn til at man ikke kan ta utgangspunkt i 79,- prosentilen i stedet for 8-prosentilen. Samordnaopptakog omregningstabeller 6

17 Tabell. Antall og kumulativt antall med ulike karaktersnitt i NVB-statistikken for søkere med vitnemål som gir generell studiekompetanse, totalt 6 7 personer, sammen med fordelingene g(y) og G(y). g(y) og G(y) er avrundet til fire desimaler. Karakter Antall Antall kum. g(y) G(y), e- e-, 7 e- e-, 89 9e-, ,, 9,9,7,6 6 89,6,7 6 8,, ,7, ,, ,69, ,7 9, 96 9, 67,7 76, 78,96 6, 7 96,8,69,6 776,9,7 8 6,6,8 96 9,,77, ,7,6, ,6, ,,78, ,,6, 8 8,99,68, 68 66,8,76, ,7,776,6 8 97,,87, ,66,8,8 6 8,7,889, ,9,988, 969 8,67, ,96, 98,968, ,9788, 76 69,76,986, 86,6,99, ,8,996, ,998,8 678,9996, e- 6, 6 Samordna opptak og omregningstabeller 7

18 Tabell. Antall og kumulativt antall med ulike tyske karaktersnitt, totalt personer, sammen med fordelingene f(y) og F (y). f(y) og F (y) er avrundet til fire desimaler. Karakter Antall Antall kum. f(y) F (y), 8 8 e- e-,9 6 e- e-,8 6 8,,7 878,67,89,6 8 76,, 68 76,,79, ,,8, 96 7, 8, , , 9, 86 7,,78,9 8966,6,7, ,69,8, ,7,,6 9 87,6,97, 7 89,,, 969 8,6, ,,6, 787 8,8,78 7,,79, 86 8,,788, ,77,8, ,,876,7 78 9,9,888,6 7 86,6,96, 98 9,,97, 6 7,96, ,969, 68 66, ,8,9887, Samordna opptak og omregningstabeller 8

19 Oppsummering og anbefalinger Når man skal oversette utenlandske karaktersnitt til norske vil det oppstå estimeringsfeil. Valg av omregningsmetode og selve utvalgsstørrelsen vil påvirke størrelsen på feilen. Vi har i dette notatet studert feilen i lys av omregningsmetode og antall karaktersnitt som skal oversettes. Vi har sammenholdt dette med den absolutte feilen man får ved direkte lineær interpolasjon. Vi valgte å gjøre dette for det tyske datasettet, hvor den offisielle karakterstatistikken er tilgjengelig. Hadde vi valgt karakterstatistikk fra et annet land, ville størrelsen på feilen sett annerledes ut, men momentene i diskusjonen ville vært de samme.. Anbefalt metode Av vår simuleringsstudie fant vi at det er spesielt for gode karaktersnitt at feilen blir stor. Å dele inn i -prosentiler gir stort sett lavere feil enn å dele inn i -prosentiler, spesielt i det øvre karaktersjiktet. For denne metoden vil området å interpolere mellom bli mindre og det er en tendens til at avviket fra korrekte norske karaktersnittet blir lavere. Med karakterfordelinger som har andre topp- og bunnhale-sannsynligheter enn de norske vil vi kunne se denne forskjellen. Vi vil derfor anbefale å bruke en finere prosentilinndeling enn -prosentiler, og basert på vårt eksperiment anbefaler vi -prosentiler.. Grense for lineær interpolering Når det gjelder grensen for når man skal bruke direkte lineær interpolasjon i stedet for ekviprosentilmetoden, er det en klar forbedring når man går fra en utvalgsstørrelse på 7 til, og ikke minst fra til karaktersnitt. Dette gjelder særlig for de gode karaktersnittene. Fra til karaktersnitt er forbedringen mindre. Sammenholdt med alternativet, direkte lineær interpolasjon, kan synes å være i grenselandet til å være det foretrukne alternativet. Hvor grensen skal settes vil avhenge av hvor mye den (ukjente!) utenlandske karakterfordelingen avviker fra den norske. Svært topptunge karakterfordelinger, som for eksempel den ukrainske, bør rutinemessig bli håndtert på en særskilt måte. Vi vil allikevel anbefale å heve denne grensen til, basert på følgende argumenter: Andre lands karakterfordeling kan avvike mer fra den norske enn den tyske gjør. Vår simuleringsstudie er basert på et tilfeldig utvalg av karaktersnitt. I praksis vil trolig utenlandske søkere til norske studiesteder ikke utgjøre et representativt utvalg av alle landets studenter. I et større prosjekt ville vi kunne ha studert dette i større grad, med oversettelse av flere lands karakterpopulasjoner der disse har ulik grad av haletunghet.. Høy andel personer på ekstremverdiene Når det gjelder svært topptunge karakterfordelinger som den ukrainske anbefaler vi å endre dagens prosedyre. Den norske karaktersnittfordelingen for den øvre -prosentilgruppen Samordna opptak og omregningstabeller 9

20 er asymmetrisk; skjev med en lang høyre hale. Heller enn å ta gjennomsnittet av nedre og øvre karaktersnitt i denne prosentilgruppen, anbefaler vi å bruke midtpunktet/medianen for det aktuelle toppområdet som oversatt karaktersnitt. Tilsvarende kan denne metoden benyttes dersom en stor andel av personene har laveste karakter. Samordna opptak og omregningstabeller

Falske positive i lusetellinger?

Falske positive i lusetellinger? Falske positive i lusetellinger? 50 % grense = 0,2 grense = 0,5 Sannsynlighet for en falsk positiv 40 % 30 % 20 % 10 % 0 % 0,0 0,1 0,2 0,3 0,4 0,5 Faktisk lusetall Notatnr Forfatter SAMBA/17/16 Anders

Detaljer

Følsomme lusetellinger ved forslag til ny forskrift. Anders Løland

Følsomme lusetellinger ved forslag til ny forskrift. Anders Løland Følsomme lusetellinger ved forslag til ny forskrift Notatnr Forfatter SAMBA/01/12 Anders Løland Dato 11. januar 2012 Norsk Regnesentral Norsk Regnesentral (NR) er en privat, uavhengig stiftelse som utfører

Detaljer

Rekrutteringsfunksjoner for sild, torsk og lodde

Rekrutteringsfunksjoner for sild, torsk og lodde Rekrutteringsfunksjoner for sild, torsk og lodde Sild 0 50 100 150 200 250 300 Beverton-Holt Ricker linear regression paa log-skala 0 2 4 6 8 10 12 14 Gytebimoasse (millioner tonn) Torsk 0 5 10 15 20 25

Detaljer

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker

Detaljer

Kvalitetssikring av rapport om GTT-gjennomgang i norske sykehus. Hanne Rognebakke

Kvalitetssikring av rapport om GTT-gjennomgang i norske sykehus. Hanne Rognebakke Kvalitetssikring av rapport om GTT-gjennomgang i norske sykehus Notatnr Forfatter SAMBA/58/11 Hanne Rognebakke Dato Desember 2011 Norsk Regnesentral Norsk Regnesentral (NR) er en privat, uavhengig stiftelse

Detaljer

Det er dokumentert spesielle forhold som kan gi grunnlag for særskilt vurdering.

Det er dokumentert spesielle forhold som kan gi grunnlag for særskilt vurdering. NASJONAL KLAGENEMND FOR OPPTAK GJENNOM SAMORDNA OPPTAK Postboks 1133, 0318 Oslo Dato 17. oktober 2018 PROTOKOLL FRA KLAGENEMNDAS MØTE 17. oktober 2018 28/18 Samordna opptak opptaksforskriften 2-2 og 7-12

Detaljer

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis

Detaljer

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x

Detaljer

Karakterstatistikk for viderega ende opplæring skolea ret 2013/2014

Karakterstatistikk for viderega ende opplæring skolea ret 2013/2014 Karakterstatistikk for viderega ende opplæring skolea ret / Sammendrag Et gjennomgående trekk er at mange av elevene får lave karakterer i matematikk. Dette gjelder særlig fellesfaget praktisk matematikk

Detaljer

Skoleeksamen i SOS Kvantitativ metode

Skoleeksamen i SOS Kvantitativ metode Skoleeksamen i SOS1120 - Kvantitativ metode Hjelpemidler Ordbok Alle typer kalkulatorer Tirsdag 30. mai 2017 (4 timer) Lærerbok (det er mulig mulig å ha med en annen, tilsvarende pensumbok, som erstatning

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 101 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Mandag 30. november 1992. Tid for eksamen: 09.00 15.00.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Onsdag 12. oktober 2016 Tid for eksamen: 10.00 12.00 Oppgavesettet er på

Detaljer

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Notat 3 - ST februar 2005

Notat 3 - ST februar 2005 Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk

Detaljer

Det norske karaktersystemet. land. Innlegg på UHR karakterkonferanse 2012 Grete Lysfjord, prorektor ved UiN

Det norske karaktersystemet. land. Innlegg på UHR karakterkonferanse 2012 Grete Lysfjord, prorektor ved UiN Det norske karaktersystemet og karaktersystemer i andre land Innlegg på UHR karakterkonferanse 2012 Grete Lysfjord, prorektor ved UiN Delrapport fra UHRs analysegruppe v/asbjørn Bjørnset Oversikt over

Detaljer

2P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen

2P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen 303 a For eksempel finner vi at den relative frekvensen for jenter med høyde 155 159 cm er 0,067 6,7 % 30 = =. Høyde i cm Antall Relativ (frekvens)

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Fredag 28. oktober 2016 Tid for eksamen: 14.00 16.00 Oppgavesettet er på

Detaljer

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene 1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk

Detaljer

Karakterstatistikk for viderega ende opplæring skolea ret 2010-2011

Karakterstatistikk for viderega ende opplæring skolea ret 2010-2011 Karakterstatistikk for viderega ende opplæring skolea ret 00-0 Sammendrag Eksamenskarakterene i praktisk og teoretisk matematikk på Vg på studieforberedende utdanningsprogrammer og i programfaget matematikk

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Wilcoxon Signed-Rank Test I uke, bruker vi Z test eller t-test for hypotesen H:, og begge tester er basert på forutsetningen om normalfordeling

Detaljer

Karakterstatistikk for grunnskolen

Karakterstatistikk for grunnskolen Karakterstatistikk for grunnskolen 2014-15 Innledning Denne analysen gir et innblikk i karakterstatistikken for elevene som gikk ut av 10. trinn våren 2015. Analysen baserer seg i hovedsak på tall publisert

Detaljer

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon bruker kjikvadrat-fordelingen ( chi-square distribution ) (der kji er den

Detaljer

Seksjon 1.3 Tetthetskurver og normalfordelingen

Seksjon 1.3 Tetthetskurver og normalfordelingen Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data ved tall Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver

Detaljer

Analyser karakterstatistikk for grunnskolen 2009

Analyser karakterstatistikk for grunnskolen 2009 Analyser karakterstatistikk for grunnskolen 29 Innledning Denne analysen gir et innblikk i karakterstatistikken for avgangskullet fra grunnskolen våren 29. Datagrunnlaget for analysene tilsvarer datagrunnlaget

Detaljer

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Boka (Ch 1.4) motiverer dette ved å gå fra histogrammer til tetthetskurver.

Detaljer

Verdens statistikk-dag.

Verdens statistikk-dag. Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode Sensorveiledning: skoleeksamen i SOS1120 - Kvantitativ metode Tirsdag 30. mai 2016 (4 timer) Poenggivning og karakter I del 1 gis det ett poeng for hvert riktige svar. Ubesvart eller feil svar gis 0 poeng.

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg

Detaljer

Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie,

Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie, Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie, www.statistrikk.no Kontinuerlige data er målinger som gjøres langs en skala, for eksempel tid, lengde og vekt. Noen ganger

Detaljer

Karakterstatistikk for grunnskolen 2012/13

Karakterstatistikk for grunnskolen 2012/13 Karakterstatistikk for grunnskolen 0/ Innledning Denne analysen gir et innblikk i karakterstatistikken for elevene som gikk ut av 0. trinn våren 0. Datagrunnlaget for analysene er det samme datagrunnlaget

Detaljer

Konsekvenser av innføring av nye karakterkrav ved opptak til sykepleierutdanninger

Konsekvenser av innføring av nye karakterkrav ved opptak til sykepleierutdanninger Konsekvenser av innføring av nye karakterkrav ved opptak til sykepleierutdanninger FSAT ble 14. desember bedt om å levere en utredning viser effekten av eventuell innføring av nytt opptakskrav om minimum

Detaljer

Statistikk og dataanalyse

Statistikk og dataanalyse Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/ Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 10. oktober 2012. Tid for eksamen: 15:00 17:00. Oppgavesettet

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor

Detaljer

Bokstavkarakterskalaen rapport for 2005-06. Innlegg på UHR-konferanse 29.10.07 v/analysegruppen

Bokstavkarakterskalaen rapport for 2005-06. Innlegg på UHR-konferanse 29.10.07 v/analysegruppen Bokstavkarakterskalaen rapport for 2005-06 Innlegg på UHR-konferanse 29.10.07 v/analysegruppen Per Manne 29.10.2007 Forutsetninger Absolutt skala med utgangspunkt i generelle kvalitative beskrivelser vedtatt

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Kapittel 7: Utvalgsfordeling Bo Lindqvist Institutt for matematiske fag 2 Fra kapittel 1: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13. oktober 2010. Tid for eksamen: 15:00 17:00. Oppgavesettet

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Utsatt eksamen i: ECON130 Statistikk 1 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 1306017 Sensur kunngjøres senest: 3006017 Tid for eksamen: kl 09:00 1:00 Oppgavesettet er på 5 sider Tillatte

Detaljer

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1 ECON 0 EKSAMEN 004 VÅR SENSORVEILEDNING Oppgaven består av 0 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

Møtedato: 28.08.2014 Saksbehandler: Knut Nicholas Figenschou, Marta Ranestad, Ellen Helstad & Jone Trovåg

Møtedato: 28.08.2014 Saksbehandler: Knut Nicholas Figenschou, Marta Ranestad, Ellen Helstad & Jone Trovåg Møtedato:.0.01 Saksbehandler: Knut Nicholas Figenschou, Marta Ranestad, Ellen Helstad & Jone Trovåg STi-sak /1 Opptak til NTNU Vedlegg NIFU rapport /00 UHR rapport «Internasjonale søkere til masterutdanninger

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Fra første forelesning: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av

Detaljer

EKSAMENSOPPGAVER STAT100 Vår 2011

EKSAMENSOPPGAVER STAT100 Vår 2011 EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test

Detaljer

2P-Y eksamen våren 2018 løsningsforslag

2P-Y eksamen våren 2018 løsningsforslag 2P-Y eksamen våren 2018 løsningsforslag DEL 1 Uten hjelpemidler Tid: Del 1 skal leveres inn etter 2 timer. Hjelpemidler: Del 1 Vanlige skrivesaker, passer, linjal med centimetermål og vinkelmåler. Oppgave

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2. Eksamensdag: Tirsdag 2. juni 2009. Tid for eksamen: 14.30 17.30. Oppgavesettet

Detaljer

1. Forord... 2 2. Innholdsfortegnelse... 3 3 innledning... 5. 4. Funksjonelle egenskaper og krav... 7. 5. Spesifikke krav av delsystemer...

1. Forord... 2 2. Innholdsfortegnelse... 3 3 innledning... 5. 4. Funksjonelle egenskaper og krav... 7. 5. Spesifikke krav av delsystemer... Side 1 1. Forord Dette dokumentet er en kravspesifikasjon og har blitt utarbeidet av arbeidsgiver og prosjektgruppen. Dokumentet består av ni kapitler. Det vil først bli presentert hvem prosjektgruppen

Detaljer

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).

Detaljer

Fra første forelesning:

Fra første forelesning: 2 Fra første forelesning: ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag opulasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av populasjonen

Detaljer

ECON2130 Kommentarer til oblig

ECON2130 Kommentarer til oblig ECON2130 Kommentarer til oblig Her har jeg skrevet ganske utfyllende kommentarer til en del oppgaver som mange slet med. Har noen steder gått en del utover det som det strengt tatt ble spurt om i oppgaven,

Detaljer

i x i

i x i TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale

Detaljer

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Analyser karakterstatistikk for grunnskolen

Analyser karakterstatistikk for grunnskolen Analyser karakterstatistikk for grunnskolen 009-00 Innledning Denne analysen gir et innblikk i karakterstatistikken for avgangskullet fra grunnskolen våren 00. Datagrunnlaget for analysene tilsvarer datagrunnlaget

Detaljer

Sannsynlighetsregning og Statistikk.

Sannsynlighetsregning og Statistikk. Sannsynlighetsregning og Statistikk. Leksjon Velkommen til dette kurset i sannsynlighetsregning og statistikk! Vi vil som lærebok benytte Gunnar G. Løvås:Statistikk for universiteter og høyskoler. I den

Detaljer

Bootstrapping og simulering Tilleggslitteratur for STK1100

Bootstrapping og simulering Tilleggslitteratur for STK1100 Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 (oppdatert April 2016) 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor

Detaljer

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte. Kapittel : Beskrivende statistikk Etter at vi har samlet inn data er en naturlig første ting å gjøre å prøve å oppsummere informasjonen i dataene på en hensiktsmessig måte. Hva som er hensiktsmessig måter

Detaljer

Effektevaluering av Ny GIV - foreløpige resultater

Effektevaluering av Ny GIV - foreløpige resultater 1 Effektevaluering av Ny GIV - foreløpige resultater Lars Kirkebøen (SSB), Marte Rønning (SSB), Edwin Leuven (UiO), Oddbjørn Raaum (Frischsenteret), Gaute Eielsen (SSB) Evalueringsseminar, 30. november

Detaljer

Sentralmål og spredningsmål

Sentralmål og spredningsmål Sentralmål og spredningsmål av Peer Andersen Peer Andersen 2014 Sentralmål og spredningsmål i statistikk I dette notatet skal vi se på de viktigste momentene om sentralmål og spredningsmål slik de blir

Detaljer

Løsningsforslag til obligatorisk oppgave i ECON 2130

Løsningsforslag til obligatorisk oppgave i ECON 2130 Andreas Mhre April 15 Løsningsforslag til obligatorisk oppgave i ECON 13 Oppgave 1: E(XY) = E(X(Z X)) Setter inn Y = Z - X E(XY) = E(XZ X ) E(XY) = E(XZ) E(X ) E(XY) = - E(X ) X og Z er uavhengige, så

Detaljer

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 8 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE

Detaljer

Karakterstatistikk for viderega ende opplæring skolea ret 2012/13

Karakterstatistikk for viderega ende opplæring skolea ret 2012/13 Karakterstatistikk for viderega ende opplæring skolea ret 0/ Eksamenskarakterene i samtlige fellesfag i matematikk med sentralt utarbeidet eksamen går betydelig opp etter flere års nedgang i de samme fagene.

Detaljer

Tidligere skoleprestasjoner og rekruttering til og gjennomføring av allmennlærerutdanning

Tidligere skoleprestasjoner og rekruttering til og gjennomføring av allmennlærerutdanning Tidligere skoleprestasjoner og rekruttering til og gjennomføring av allmennlærerutdanning Arne Mastekaasa Senter for profesjonsstudier, Høgskolen i Oslo Institutt for sosiologi og samfunnsgeografi, Universitetet

Detaljer

6.2 Signifikanstester

6.2 Signifikanstester 6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon

Detaljer

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 3 4 Pensumoversikt Forelesninger og øvinger

Detaljer

Karakterstatistikk for videregående opplæring skoleåret

Karakterstatistikk for videregående opplæring skoleåret Karakterstatistikk for videregående opplæring skoleåret 2009-2010 Sammendrag Det er svært små endringer i gjennomsnittskarakterene fra i fjor til i år på nasjonalt nivå, både til standpunkt og til eksamen.

Detaljer

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,

Detaljer

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,

Detaljer

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige

Detaljer

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014 Statistikk 1 Nico Keilman ECON 2130 Vår 2014 Pensum Kap 1-7.3.6 fra Løvås «Statistikk for universiteter og høgskoler» 3. utgave 2013 (eventuelt 2. utgave) Se overspringelsesliste på emnesiden Supplerende

Detaljer

Tilsynssensorrapport for 2011 fra Inger Hanssen-Bauer

Tilsynssensorrapport for 2011 fra Inger Hanssen-Bauer 1 Tilsynssensorrapport for 2011 fra Inger Hanssen-Bauer 1. Bakgrunnsinformasjon 1.1. Emner, emnegruppe(r), studieprogram eller fag rapporten er gyldig for Denne rapporten er basert på materiale mottatt

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn

Detaljer

Veiledning Tittel: Veiledning for utarbeiding av økonomiske analyser Dok.nr: RL065

Veiledning Tittel: Veiledning for utarbeiding av økonomiske analyser Dok.nr: RL065 Veiledning Tittel: Dok.nr: RL065 Rev.nr: 02 Utarbeidet av: Konkurransetilsynet Side: 1 av 5 INNHOLD 1 Bakgrunn og formål... 2 2 Generelle prinsipper... 2 2.1 Klarhet og transparens... 2 2.2 Kompletthet...

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Mål på beliggenhet (2.6) Kvartiler: Deler de ordnede dataene inn i fire like store deler: 1. kvartil Q 1 : 25% av dataene

Detaljer

Konvertering fra døgn- til timemiddelbaserte varslingsklasser for svevestøv i Bedre byluft Sam-Erik Walker

Konvertering fra døgn- til timemiddelbaserte varslingsklasser for svevestøv i Bedre byluft Sam-Erik Walker NILU: OR 60/2003 NILU: OR 60/2003 REFERANSE: O-2205 DATO: AUGUST 2003 ISBN: 82-425-1490-9 Konvertering fra døgn- til timemiddelbaserte varslingsklasser for svevestøv i Bedre byluft Sam-Erik Walker 1 Innhold

Detaljer

NOKUTs oppsummeringer Nasjonal deleksamen i årsregnskap 2018

NOKUTs oppsummeringer Nasjonal deleksamen i årsregnskap 2018 NOKUTs oppsummeringer Nasjonal deleksamen i årsregnskap 18 September 18 NOKUTs arbeid skal bidra til at samfunnet har tillit til kvaliteten i norsk høyere utdanning, høyere yrkesfaglig utdanning og godkjent

Detaljer

Formelsamling i medisinsk statistikk

Formelsamling i medisinsk statistikk Formelsamling i medisinsk statistikk Versjon av 6. mai 208 Dette er en formelsamling til O. O. Aalen (red.): Statistiske metoder i medisin og helsefag, Gyldendal, 208. Gjennomsnitt x = n (x + x 2 + x 3

Detaljer

Godkjenning av utdanning fra Nord-Amerika

Godkjenning av utdanning fra Nord-Amerika U N I V E R S I T E T E T I B E R G E N Det humanistiske fakultet Godkjenning av utdanning fra Nord-Amerika Toril Ivarsøy, rådgiver Godkjenning av utenlandsk utdanning i Norge: Hvem gjør hva? NOKUT vs

Detaljer

Karakterstatistikk for grunnskolen 2013/14

Karakterstatistikk for grunnskolen 2013/14 Karakterstatistikk for grunnskolen 0/ Innledning Denne analysen gir et innblikk i karakterstatistikken for elevene som gikk ut av 0. trinn våren 0. Datagrunnlaget for analysene er det samme datagrunnlaget

Detaljer

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett

Detaljer

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere 2 Loven om total sannsynlighet La A og Ā være komplementære hendelser, mens B er en annen hendelse. Da er: P(B) P(B oga)+p(b ogā) P(B A)P(A)+P(B Ā)P(Ā) ST0202 Statistikk for samfunnsvitere Bo Lindqvist

Detaljer

Opptaksreglement for enkeltemner ved Det teknisk-naturvitenskapelige

Opptaksreglement for enkeltemner ved Det teknisk-naturvitenskapelige 1 Opptaksreglement for enkeltemner ved Det teknisk-naturvitenskapelige fakultet Regler for opptak og rangering til enkeltemner ved Det teknisk-naturvitenskapelige fakultet fastsatt av dekan 09.10.2015

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30

Detaljer

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren

Detaljer

Skolebidragsindikatorer i videregående skole analyse

Skolebidragsindikatorer i videregående skole analyse Skolebidragsindikatorer i videregående skole 2017-18 analyse I år er første gang Utdanningsdirektoratet selv har utviklet skolebidragsindikatorer. Her kan du lese vår analyse av resultatene. STATISTIKK

Detaljer

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk Institutt for matematiske fag Eksamensoppgave i ST0103 Brukerkurs i statistikk Faglig kontakt under eksamen: Jarle Tufto Tlf: 99 70 55 19 Eksamensdato: 3. desember 2016 Eksamenstid (fra til): 09:00-13:00

Detaljer

Utprøving av metoder for deteksjon av veier i laserdata foreløpige resultater

Utprøving av metoder for deteksjon av veier i laserdata foreløpige resultater Utprøving av metoder for deteksjon av veier i laserdata foreløpige resultater LasTrak pilotprosjekt Notatnr Forfattere SAMBA/09/15 Øivind Due Trier Dato 6. mars 2015 2 Forfatterne Øivind Due Trier er seniorforsker

Detaljer

MATEMATIKK (MAT1005) Sentralmål / Spredningsmål

MATEMATIKK (MAT1005) Sentralmål / Spredningsmål ??.??.???? MATEMATIKK (MAT1005) Sentralmål / Spredningsmål DEL 1 (UTEN HJELPEMIDLER) 30 minutter DEL 2 (MED HJELPEMIDLER) 60 minutter (Del 1 må leveres inn før hjelpemidlene kan benyttes) Total poengsum:

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk Eksamensdag: Torsdag 2. desember 2010. Tid for eksamen: 09.00 13.00. Oppgavesettet er på

Detaljer

Analyse av data relatert til friksjonsmålinger og ulykkesfrekvens ved to veistrekninger i Oslo i perioden 2001-2009

Analyse av data relatert til friksjonsmålinger og ulykkesfrekvens ved to veistrekninger i Oslo i perioden 2001-2009 Analyse av data relatert til friksjonsmålinger og ulykkesfrekvens ved to veistrekninger i Oslo i perioden 2001-2009 Notatnr Forfattere SAMBA/15/10 Magne Aldrin Ragnar Bang Huseby Dato 26. mars 2010 Norsk

Detaljer

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS Denne artikkelserien handler om statistisk behandling av kalibreringsresultatene. I de fleste tilfeller

Detaljer