Frafall fra videregende skole (VGS) er et stort problem. Bare ca 70% av elevene som begynner p VGS fullfører og bestr i løpet av 5 r. For noen elever er skolen s lite attraktiv at de velger slutte før tida. Denne gruppen utgjør ca 16% av alle de som starter. Det har vært forsket mye p hva som kan forklare at noen elever velger slutte p skolen før tida. I den senere tid har forskerne rettet oppmerksomheten mot elevene sin opplevelse av det sosiale miljøet som en viktig faktor i denne sammenhengen. Tabellen nedenfor viser data fra et prosjekt (fiktive tall) der en ønsket se p sammenhengen mellom elevene sin intensjon om slutta p skolen før tida (slutte), kjønn, opplevelse av positiv relasjon til læreren (relasjon) og opplevelse av ensomhet (ensom). Variabelen ensom er en tredelt variabel, der 1=liten grad av ensomhet, 2=middels grad av ensomhet og 3=høy grad av ensomhet. For variabelen kjønn er 1=jente og 2=gutt. Variablene relasjon og slutte er kontinuerlige variabler mlt p en skala fra 1-10. Høye verdier betyr høy grad av egenskapen. kjønn ensom relasjon slutte 1 3 10 5 1 3 2 6 1 3 3 6 1 3 4 6 1 2 8 2 1 2 4 6 1 2 8 2 1 2 10 1 1 1 8 4 1 1 9 2 1 1 8 1 1 1 4 4 2 3 3 8 2 3 2 9 2 3 5 7 2 3 3 8 2 2 4 5 2 2 4 7 2 2 8 2 2 2 9 3 2 1 5 4 2 1 6 3 2 1 3 5 2 1 3 7 Bruk data fra tabellen over (utvalget) og opplysninger som blir gitt i oppgavene og svar p følgende spørsml: Oppgave 1 a) Er det statistisk signifikant forskjell mellom gutter og jenter med hensyn til intensjon om slutte p skolen før tida (slutte)? Still opp de nødvendige hypoteser og gjennomfør en hypotesetest ut fra forskningsspørsmlet. Bruk α
= 5%. Du fr opplyst at variansen for jenter er 4,205 og variansen for gutter er 5,333 p variabelen slutte. Populasjonene har ikke signifikant ulik varians p variabelen. 1. H 0 : μ 1 μ 2 = 0 H a : μ 1 μ 2 0 2. t krit = t(df,α/2) = t(22,.05/2) = 2,074 3. t obs s 2 p = (n 1-1) s 1 2 + (n 2-1) s 2 2 n 1 + n 2-2 = (12-1) 4,205 + (12-1) 5,333 12 +12-2 = 4,769 s x1 -x 2 = s 2 p ( 1 n 1 + 1 n 2 ) = 4,769 ( 1 12 + 1 12 ) = 0,892 t obs = (x 1 - x 2 ) - (m 1 - m 2 ) 3,750-5,667 = = -2,15 s x1 -x 2 0,892 4. t obs = 2,15 > t krit = 2,074 H 0 faller! Det er en statistisk signifikant forskjell mellom gutters og jenters gjennomsnitt p variabelen slutte. b) Finn et CI 95 for differansen mellom jenters og gutters gjennomsnitt p variabelen slutte. Hva forteller dette intervallet? b) CI 95 = (x1 - x2) ± t krit s x1-x s = (3,750-5,667) ± 2,074 0,892 CI 95 = -1,917 ±1,850 [ ] CI 95 = -0,07;-3,77 Konfidensintervallet er et estimat for differansen mellom gutters og jenters gjennomsnitt p variabelen slutte i populasjonene. Om en tenker seg at en lager et stort antall slike intervall basert p ulike utvalg trukket fra populasjonene, vil 95% av disse intervallene inneholde populasjonsdifferansen. En kan derfor si at intervallet er estimert med en sikkerhet p 95%. c) Sammenhold resultatene fra a) og b). c) Resultatene fra a) og b) er konsistente. I deloppgave a) forkastet vi H 0. Dette stemmer med at konfidensintervallet ikke inneholder verdien 0 (verdien under H 0 ).
Oppgave 2 a) Er det sammenheng mellom opplevd ensomhet og intensjon om slutte p skolen? Undersøk dette spørsmlet ved analysere om de tre gruppene p variabelen ensom har ulikt gjennomsnitt p variabelen slutte. Still opp de nødvendige hypoteser og gjennomfør en hypotesetest ut fra forskningsspørsmlet. Bruk α = 5%. Du fr opplyst at: Gruppen med lav grad av ensomhet skret 1 Gruppen med middels grad av ensomhet skret 2 Gruppen med høy grad av ensomhet skret 3 a) ( ) : x 1 = 30; x 2 1 = 136 ( ) : x 2 = 28; x 2 2 = 132 ( ) : x 3 = 55; x 2 3 = 391 De summerte skrene for hver gruppe er oppgitt i oppgaven. Det samme er summen av de kvadrerte skrene for hver gruppe. P grunnlag av disse regner jeg ut den totale summen av alle skrene og den totale summen av alle de kvadrerte skrene: X = 113 og X 2 = 659 SSB = ( ( x 1) 2 + ( x 2) 2 + ( x 3) 2 ) - ( X)2 n 1 n 2 n 3 N SSB = (302 + 28 2 + 55 2 ) 8-1132 24 SSW = X 2 - ( ( x 1 )2 + ( x 2 )2 + ( x 3 )2 ) n 1 n 2 n 3 SSW = 659-588,625 = 70,375 F obs = Alts: = 588,625-532,042 = 56,583 SSB / dfb SSW / dfw = 56,583 / 2 70,375 / 21 = 28,292 3,351 = 8,44 H : H : for noen m,n, m n, m=1, 2 eller 3 og n= 1, 2 eller 3 1) 0 1 2 3 a m n 2) F krit = F(2,21,.05) = 3,47
3) F obs = 8,44 4) Konklusjon: F obs = 8,44 > F krit = 3,47. Nullhypotesen om at elever med ulik grad av opplevd ensomhet har lik gjennomsnittlig skre p variabelen slutte forkastes p 5 % -nivet. b) Tolk disse to tabellene: Tabell 1 Tabell 1 viser at forutsetningen om lik varians i de tre populasjonene er oppfylt. Tabell 2 Tabell 2 viser at elever som i liten grad er ensomme og elever som i middels grad er ensomme ikke er signifikant ulike mht ville slutte p skolen. Elever som opplever en stor grad av ensomhet er statistisk signifikant ulik (p 5% nivet) begge de to andre gruppene. Elever som opplever en stor grad av ensomhet har høyere intensjon om slutte p skolen enn elever fra begge de to andre gruppene. Oppgave 3 En korrelasjonsanalyse for variablene relasjon og slutte ga dette resultatet:
Hvordan tolker du dette resultatet? Tabellen viser at det er en sterk negativ korrelasjon mellom opplevd relasjon til læreren og tanker om slutte p skolen. Dvs. at elever som opplever en god relasjon til læreren i mindre grad tenker p slutte p skolen enn elever som opplever en drlig relasjon til læreren. Korrelasjonen er statistisk signifikant med en α=5% (ogs med en α=1%). Vi kan ikke si at det er en kausal relasjon mellom variablene. Korrelasjonskoeffisienten tar bare vare p lineære sammenhenger, det er en forutsetning at denne sammenhengen er lineær om den skal gi mening. Kontroll for mulige tredjevariable ville kunne ha endret den sammenhengen vi har funnet. Korrelasjonskoeffisienten øker med økende varians (spredning) i utvalget. Hvis variablene i utvalget har mindre spredning enn i populasjonen vil r bli underestimert (for lav). Derfor er det viktig at utvalget er representativt for populasjonen mhp spredning p variablene. Oppgave 4 Forskeren gikk videre med en regresjonsanalyse med de samme variablene. Denne analysen ga dette resultatet: a) Hva er uavhengige variabel og hva er avhengig variabel i denne analysen? Forklar hva som er forskjellen p en uavhengig og en avhengig variabel. b) Skriv likninga for regresjonslinja (med verdier fra tabellen). c) Hva er den estimerte verdien for y nr x = 8? a) Uavhengig variabel: er Opplevd relasjon til læreren (relasjon), avhengig variabel er Intensjon om slutte (slutte). En uavhengig variabel er en variabel som forklarer variansen i en avhengig variabel. b) y = 8,636 0,709*x
c) y = 8,636 0,709*8 = 2,96 Oppgave 5 Svar p disse teorispørsmlene: a) Hva er forskjellen p deskriptiv statistikk og slutningsstatistikk? Nevn to eksempel p analyser fra hhv deskriptiv statistikk og slutningsstatistikk. Deskriptiv statistikk er analyser en gjør p data i et utvalg. Slutningsstatistikk er hypotesetesting og estimering mht populasjonsparametre. Eksempel p analyser fra deskriptiv statistikk er beregning av gjennomsnitt og standardavvik i et utvalg. Eksempler p slutningsstatsikkk er t-test to uavhengige utvalg og ANOVA. b) Hva er en standard normalfordeling? En standard normalfordeling er en normalfordeling der skrene er omgjort til standardskrer, for eksempel z-skrer. I en z-fordeling er gjennomsnittet 0 og standardavviket 1. Andelen av fordelingen som ligger innenfor et visst antall standardavvik fra gjennomsnittet kan lese sut fra en z-skretabell. c) Hvilke betingelser m være oppfylte om en skal benytte parametrisk statistikk? Variablene m være mlt p minst intervallniv og fordelingene p de aktuelle variablene m ikke være alt for skjevfordelte, i praksis ha en skjevhet (skewness) mindre enn 1 (tallverdi). d) Hva menes med en variabels mleniv? Gjør rede for hva som kjennetegner de mlenivene en kan kategorisere variabler etter. En variabels mleniv er en mte kategorisere variabler etter noen kriterier. Det er fire mleniv: 1. Nominalniv: verdiene p variablene er gjensidig utelukkende, men sier ikke noe om kvantitet. 2. Ordinal: verdiene variabelen mles i er et uttrykk for kvantitet, verdiene kan derfor rangeres i en stigende eller synkende rekkefølge. Intervallene mellom de ulike verdiene er ikke nødvendigvis like. 3. Intervall: Verdiene kan rangeres og intervallene mellom verdiene er like. 4. Ratio: verdiene kan rangeres, intervallene er like og skalaen har et sant nulpunkt. e) Hva er en standardfeil? En standardfeil er standardavviket i en sampelfordeling.