Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder



Like dokumenter
Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

PSYC 3101 KVANTITATIV METODE II Eksamen høst 2008

Eksamensoppgave i ST3001

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

Høye skårer indikerer høye nivåer av selvkontroll.

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Målform/språk: Bokmål Antall sider: 10. Psykologisk institutt

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Forelesning 13 Regresjonsanalyse

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Eksamensoppgave i TMA4255 Anvendt statistikk

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode Kvantitativ

Fra krysstabell til regresjon

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Eksamensoppgave i SØK Statistikk for økonomer

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Lineære modeller i praksis

2. Forklar med egne ord de viktigste forutsetningene for regresjonen og diskuter om forutsetningene er oppfylt i oppgave 1.

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

HØGSKOLEN I STAVANGER

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgave i TMA4255 Anvendt statistikk

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Eksamen PSYC3101 Kvantitativ metode II Høsten 2013

Eksamensoppgave i (emnekode) (emnenavn)

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

EKSAMENSOPPGAVER STAT100 Vår 2011

Til bruk i metodeundervisningen ved Høyskolen i Oslo

EKSAMEN I SOS1120 KVANTITATIV METODE 6. DESEMBER 2007 (4 timer)

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Eksamensoppgave i ST3001

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Institutt for økonomi og administrasjon

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = for produkt 2.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

MA Universitetet i Agder Institutt for matematiske fag EKSAMEN. Emnekode: MA-202 Emnenavn: Statistikk 2

HØGSKOLEN I STAVANGER

Skoleeksamen i SOS Kvantitativ metode

Eksamensoppgave i PSY1011/4111 Psykologiens metodologi

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar.

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

EXAMINATION PAPER. Exam in: STA-3300 Applied statistics 2 Date: Wednesday, November 25th 2015 Time: Kl 09:00 13:00 Place: Teorifagb.

10.1 Enkel lineær regresjon Multippel regresjon

EKSAMEN I SOS1120 KVANTITATIV METODE 12. DESEMBER 2011 (4 timer)

SKOLEEKSAMEN 29. september 2006 (4 timer)

Generelle lineære modeller i praksis

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

SKOLEEKSAMEN I. SOS1120 Kvantitativ metode. 13. desember timer

INSTITUTT FOR SOSIOLOGI OG SAMFUNNSGEOGRAFI EKSAMEN I SOSIOLOGI (MASTER) SOS KVANTITATIV METODE. SKOLEEKSAMEN 11. mai 2005 (4 timer)

Bruk data fra tabellen over (utvalget) og opplysninger som blir gitt i oppgavene og svar på følgende spørsmål:

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

EKSAMEN I SOS1120 KVANTITATIV METODE 23. NOVEMBER 2004 (6 timer)

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Transkript:

Psykologisk institutt Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder Faglig kontakt under eksamen: Martin Rasmussen Tlf.: 73 59 19 60 Eksamensdato: 12.12.13 Eksamenstid (fra-til): 0900-1300 Hjelpemiddelkode/Tillatte hjelpemidler: Kalkulator. Under eksamen er alle trykte og håndskrevne hjelpemidler tillatt og alle typer kalkulatorer er tillatt på eksamen. Annen informasjon: Målform/språk: Bokmål Antall sider: 7 Antall sider vedlegg: 0 Kontrollert av: Dato Sign Merk! Studenter finner sensur i Studentweb. Har du spørsmål om din sensur må du kontakte instituttet ditt. Eksamenskontoret vil ikke kunne svare på slike spørsmål.

ALLE OPPGAVER SKAL BESVARES Eksamen består av 8 oppgaver. Hvor mange poeng det er mulig å oppnå er oppgitt i starten av hver oppgave. OPPGAVE 1 (totalt 8 poeng, 2 poeng per deloppgave) A) Hvilke parametriske forutsetninger er brutt i disse to grafiske fremstillingene av forholdet mellom to variabler? B) Hvilken funksjon har konfidensintervaller? Og hvorfor har tallene 1.96 og -1.96 ofte en sentral rolle i utregningen av disse i psykologi? C) Hvorfor fjernes ofte variabler med svært lavt gjennomsnitt, svært høyt gjennomsnitt eller svært lav varians fra et datasett? D) Gjør rede for begrepene standardavvik (standard deviation) og standardfeil (standard error)? Forklar hvordan de to begrepene henger sammen. Hvordan og hvorfor ville en endring i utvalgsstørrelse (sample size) påvirket disse målene? Side 2 av 20

OPPGAVE 2 (6 poeng) A) Hva forteller en t-test oss? Gi et eksempel på en situasjon der du ville brukt denne testen. Spesifiser variablene (avhengig og uavhengig), formuler en hypotese og beskriv målenivået til variablene. B) Bruk eksemplet og vis hvordan du ville rapportert resultatet i en artikkel (bruk fiktive tall, vis rapportering i tekstform og husk at dette inkluderer relevant statistikk i parentes, tabell er ikke nødvendig). C) Gjør rede for hva de forskjellige verdiene du rapporterer betyr og forteller oss. OPPGAVE 3 (6 poeng) Du har samlet inn informasjon gjennom et spørreskjema med 15 spørsmål på forskjellige aspekter av mental helse og et spørsmål på skoleprestasjon. Du ønsker å finne ut om mental helse predikerer skoleprestasjon, men vurderer 15 variabler til å være for mange prediktorer i en regresjonsanalyse. Gjør rede for alle stegene du tar (også stegene innad i en analyse) for å ende opp med et håndterlig antall prediktorer. Side 3 av 20

OPPGAVE 4 (6 poeng) Dere forsker på et nytt medikament og har delt inn forsøkspersonene i gruppene: Placebo, lav dose, medium dose og høy dose. En variansanalyse (ANOVA) med disse fire gruppene viser et signifikant resultat. A) Gjør rede for BEGGE fremgangsmåtene som kan avdekke mellom hvilke grupper det er signifikante forskjeller og argumenter for hvilken av disse du ville valgt. B) Hvorfor er disse fremgangsmåtene bedre enn t-tester mellom alle gruppekombinasjonene? OPPGAVE 5 (3 poeng) Hvordan ville du beskrevet resultatene vist i denne korrelasjonsmatrisen i en artikkel (vis rapportering i tekstform og husk at dette inkluderer relevant statistikk i parentes, tabell er ikke nødvendig)? Correlations Time Spent Revising Exam Performance (%) Exam Anxiety Pearson Correlation 1,397 ** -,163 Time Spent Revising Exam Performance (%) Exam Anxiety Sig. (2-tailed),000,100 N 103 103 103 Pearson Correlation,397 ** 1 -,232 * Sig. (2-tailed),000,018 N 103 103 103 Pearson Correlation -,163 -,232 * 1 Sig. (2-tailed),100,018 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed). N 103 103 103 Side 4 av 20

OPPGAVE 6 (3 poeng) Drøft hvor mange faktorer du ville valgt basert på disse SPSS-utskriftene. Total Variance Explained Component Initial Eigenvalues Extraction Sums of Squared Loadings Total % of Variance Cumulative % Total % of Variance Cumulative % 1 2,157 26,962 26,962 2 1,929 24,113 51,075 3 1,125 14,067 65,142 4,954 11,920 77,062 5,669 8,364 85,426 6,549 6,858 92,284 7,365 4,565 96,849 8,252 3,151 100,000 Extraction Method: Principal Component Analysis. OPPGAVE 7 (6 poeng) Side 5 av 20

A) Hvilken analyse i SPSS gir disse tabellene? B) Gjør rede for hva de forskjellige verdiene i tabellen betyr og hva de sier oss. C) Hvordan ville en endring i disse verdiene påvirket vår vurdering av modellen og resultatene. D) Vis hvordan du ville rapportert dette resultatet i en artikkel (vis rapportering i tekstform og husk at dette inkluderer relevant statistikk i parentes, tabell er ikke nødvendig). Model R R Square Adjusted R Square Std. Error of the Estimate 1,235 a,055,051,31112 a. Predictors: (Constant), Good Diet, Time spent watching television., Use of Computer Games. Model Sum of Squares df Mean Square F Sig. Regression 3,762 3 1,254 12,956,000 b 1 Residual 64,080 662,097 Total 67,842 665 a. Dependent Variable: Aggression b. Predictors: (Constant), Good Diet, Time spent watching television., Use of Computer Games. Model Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. (Constant) -,002,012 -,182,856 1 Time spent watching television.,139,040,135 3,517,000 Use of Computer Games.,168,037,180 4,567,000 Good Diet -,062,037 -,065-1,668,096 a. Dependent Variable: Aggression Side 6 av 20

OPPGAVE 8 (3 poeng) Hvilke analyser har blitt brukt i dette avsnittet? Vis hvor de forskjellige analysene er referert til i avsnittet. Det var ingen kjønnsforskjeller (t(100) = 1.10, p >.05) eller aldersgruppeforskjeller (F(5,95) = 1.43, p >.05) i datasettet. I en modell som forklarte 51% (R²= 51, F(3,97) = 4.25, p <.05) av trivsel på jobb var «Utdanning» den sterkeste prediktoren (β =.41, p <.05) etterfulgt av «Meningsfullt arbeid» (6 items, α =.81; β =.28, p <.05). Lønn var ikke en signifikant prediktor for trivsel på jobb (β = -.03, p >.05). Side 7 av 20

ALLE OPPGAVER SKAL BESVARES Eksamen består av 8 oppgaver. Hvor mange poeng det er mulig å oppnå er oppgitt i starten av hver oppgave. Lykke til! OPPGAVE 1 (totalt 8 poeng, 2 poeng per deloppgave) E) Hvilke parametriske forutsetninger er brutt i disse to grafiske fremstillingene av forholdet mellom to variabler? (til venstre) 1p) Homoskedastisitet (Homoscedasticity). (Her er det nok å nevne hvilken forutsetning som er brutt). (til høyre) 1p) Linjæritet (Linarity) (Her er det nok å nevne hvilken forutsetning som er brutt). F) Hvilken funksjon har konfidensintervaller? Og hvorfor har tallene 1.96 og -1.96 ofte en sentral rolle i utregningen av disse i psykologi? 1p) Forklar funksjon: Gir et anslag (evt. estimat) i form av et intervall av hvor vi forventer/tror at befolkningen ligger med en viss prosent sikkerhet basert på vår sample. 1p) Forklar hvorfor 1.96 og -1.96 har en sentral rolle: I psykologi velger vi ofte konfidensintervaller med 95% sikkerhet. Disse 95% korresponderer med intervallet mellom -1.96 og 1.96 standardavvik (som brukes for å regne ut konfidensintervallet). Løsningsforslag: Konfidensintervall er et intervall som vi med en bestemt prosent sikkerhet tror inneholder den faktiske verdien (for eksempel vil et konfidensintervall rundt gjennomsnittet til et utvalg Side 8 av 20

(sample) med X% sikkerhet inneholde gjennomsnittet til befolkningen). I psykologi velger vi ofte konfidensintervall med 95% sikkerhet. Konfidensintervaller regnes ut ved hjelp av standardavvik og 95% i en normalfordeling vil befinne seg i intervallet mellom -1.96 og 1.96 standardavvik (med andre ord: Med et gjennomsnitt på 0 og standardavvik på 1 som forutsetninger vil 95% av populasjonen ha en z-skåre mellom -1.96 og 1.96). På denne måten brukes konfidensintervaller til generalisering, ved å gi intervaller som befolkningen med en viss % sikkerhet ligger innenfor. G) Hvorfor fjernes ofte variabler med svært lavt gjennomsnitt, svært høyt gjennomsnitt eller svært lav varians fra et datasett? (2p) I alle disse tilfellene er det svært lite varians i variabelen. Ettersom mange statistiske tester/analyser bruker akkurat denne variansen vil ikke disse variablene kunne bidra. Av denne grunnen blir de ofte fjernet. H) Gjør rede for begrepene standardavvik (standard deviation) og standardfeil (standard error)? Forklar hvordan de to begrepene henger sammen. Hvordan og hvorfor ville en endring i utvalgsstørrelse (sample size) påvirket disse målene? (1p) Forklaring av begrepene, forklarer de stadardfeil rett vil sammenhengen være med der: Standardavvik er kvadratroten av varians. Et mål på hvor mye spredning det er fra gjennomsnittet i en sample. Standardfeil er standardavviket av sampling distribusjonen (evt. standardavviket mellom forskjellige sampler). (1p) Endringer: Standardavviket vil sannsynligvis ikke endre seg mye om man endret utvalgstørrelse (da den er et mål på gjennomsnittlig avstand fra gjennomsnittet). Standardfeilen vil synke i et større utvalg og øke i et mindre utvalg (utvalgsstørrelse er en del av formelen til standardfeilen. Dette er logisk da et større utvalg sannsynligvis vil være likere enn mindre utvalg, og dermed blir standardavviket mellom de lavere). Side 9 av 20

OPPGAVE 2 (6 poeng) D) Hva forteller en t-test oss? Gi et eksempel på en situasjon der du ville brukt denne testen. Spesifiser variablene (avhengig og uavhengig), formuler en hypotese og beskriv målenivået til variablene. (2p) En t-test forteller oss om det er signifikant forskjell mellom 2 grupper (/gruppegjennomsnitt). Full pott gis til et eksempel hvor: - T-test er rett valg - Spesifisering (avhengig/uavhengig) - Målenivå: Avhengig skal være kontinuerlig (intervall eller ratio) - Målenivå: Uavhengig (grupperingsvariabel) skal være kategorisk (nominell, ordinal(rank)). E) Bruk eksemplet og vis hvordan du ville rapportert resultatet i en artikkel (bruk fiktive tall, vis rapportering i tekstform og husk at dette inkluderer relevant statistikk i parentes, tabell er ikke nødvendig). (2p) Tekst som beskriver resultatet i ord (t([frihetsgrader]) = [t-skåre], p= [signifikansverdien]). F) Gjør rede for hva de forskjellige verdiene du rapporterer betyr og forteller oss. (2p) T-skåren (evt. t-statistikken) (tolkes sammen med p (evt. sig.), forteller oss om det er en signifikant forskjell mellom gruppegjennomsnittene. Eller med andre ord, om forskjellen på gruppegjennomsnittene er signifikant forskjellig fra null. Frihetsgrader, hvor mange «enheter» som hadde mulighet til å variere i denne testen. Side 10 av 20

OPPGAVE 3 (6 poeng) Du har samlet inn informasjon gjennom et spørreskjema med 15 spørsmål på forskjellige aspekter av mental helse og et spørsmål på skoleprestasjon. Du ønsker å finne ut om mental helse predikerer skoleprestasjon, men vurderer 15 variabler til å være for mange prediktorer i en regresjonsanalyse. Gjør rede for alle stegene du tar (også stegene innad i en analyse) for å ende opp med et håndterlig antall prediktorer. Steg 1: Faktoranalyse (evt PCA) på de 15 spørsmålene Understeg: Velger antall faktorer basert på eigenvalue, hvor mye varians som taes med eller screeplot. Understeg: Velger en passende rotasjon. Understeg: Sorterer variablene etter hvilken faktor de lader høyest på. Steg 2: Lager nye variabler basert på resultatet. Delvis rett om man kun har med Steg 1 og 2 (4p) Full pott om man også har med understegene i faktoranalysen (6p) OPPGAVE 4 (6 poeng) Dere forsker på et nytt medikament og har delt inn forsøkspersonene i gruppene: Placebo, lav dose, medium dose og høy dose. En variansanalyse (ANOVA) med disse fire gruppene viser et signifikant resultat. C) Gjør rede for BEGGE fremgangsmåtene som kan avdekke mellom hvilke grupper det er signifikante forskjeller og argumenter for hvilken av disse du ville valgt. 2p) Post hoc tester: Et sett med sammenligninger av gruppegjennomsnitt. Ettersom dette fører til mange individuelle sammenligninger justeres signifikanskravet slik at man ikke øker sjansen for å gjøre en type 1 feil. Argumenter for å velge denne: Får testet alle kom- Side 11 av 20

binasjoner, skal brukes om man ikke har en hypotese på mellom hvilke grupper det er forskjeller (og det kan tenkes at de ikke har her). 2p) Planned contrast: Et sett med sammenligninger av gruppegjennomsnitt som skal være planlagt på forhånd i henhold til den hypotesen man har om hvor gruppeforskjellene ligger. Argumenter for: Ettersom det utføres færre sammenligninger vil ikke signifikanskravet justeres like mye som i post hoc tester (med andre ord har planned contrasts høyere power), skal brukes om man ikke har en hypotese på mellom hvilke grupper det er forskjeller (og det kan tenkes at de har her). D) Hvorfor er disse fremgangsmåtene bedre enn t-tester mellom alle gruppekombinasjonene? 2p) T-tester mellom alle gruppene vil øke sjansen for at man begår en type 1 feil (konkluderer med at man har funnet en effekt, hvor det i virkeligheten ikke er en). Kan også sies: Det øker familywise error rate. OPPGAVE 5 (3 poeng) Hvordan ville du beskrevet resultatene vist i denne korrelasjonsmatrisen i en artikkel (vis rapportering i tekstform og husk at dette inkluderer relevant statistikk i parentes, tabell er ikke nødvendig)? Correlations Time Spent Revising Exam Performance (%) Exam Anxiety Pearson Correlation 1,397 ** -,163 Time Spent Revising Exam Performance (%) Exam Anxiety Sig. (2-tailed),000,100 N 103 103 103 Pearson Correlation,397 ** 1 -,232 * Sig. (2-tailed),000,018 N 103 103 103 Pearson Correlation -,163 -,232 * 1 Sig. (2-tailed),100,018 **. Correlation is significant at the 0.01 level (2-tailed). N 103 103 103 Side 12 av 20

*. Correlation is significant at the 0.05 level (2-tailed). 3p) Eksamensprestasjon hadde en signifikant korrelasjon med tid brukt til repetering (r =.40, p <.01) og en signifikant negativ korrelasjon med eksamensangst (r = -.23, p <.05). Det var ikke en signifikant korrelasjon mellom eksamensangst og tid brukt til repetering (r =.40, p <.01). - Her godtas også: o r rapportering med for mange desimaler o signifikansnivå (alle kan rapporteres på samme nivå, eller på de 2 forskjellige) eller nøyaktig signifikans o rapportering med og uten n, o Variablene beskrevet i ord (slik som i mitt løsningsforslag) eller variabel navnet («Exam Performance» hadde en signifikant.). o Det kreves ikke at noe skal være i kursiv OPPGAVE 6 (3 poeng) Drøft hvor mange faktorer du ville valgt basert på disse SPSS-utskriftene. Total Variance Explained Component Initial Eigenvalues Extraction Sums of Squared Loadings Total % of Variance Cumulative % Total % of Variance Cumulative % 1 2,157 26,962 26,962 2 1,929 24,113 51,075 3 1,125 14,067 65,142 4,954 11,920 77,062 5,669 8,364 85,426 6,549 6,858 92,284 7,365 4,565 96,849 8,252 3,151 100,000 Extraction Method: Principal Component Analysis. Side 13 av 20

3p) Drøftingen må inneholde både vurdering av scree plot og av eigenvalue. Rett antall faktorer er 2, 3 eller 4, så lenge det argumenters godt for det. 1 faktor Lite sannsynlig valg med en så sterk 2.faktor 2 faktorer Kan argumenters med at det er et stort «fall» ned til den 3.faktoren. 3 faktorer Ville man valgt om man fulgte Kaiser s criterion. 4 faktorer Ville man valgt om man fulgte den litt mildere varianten av Kaiser s criterion på eigenvalue over 0.7. I tillegg er den nesten like sterk som faktor 3, og nesten god nok til å være med i det orginale Kaiser s criterion. 5 faktorer Lite sannsynlig valg Side 14 av 20

OPPGAVE 7 (6 poeng) A) Hvilken analyse i SPSS gir disse tabellene? 0,5 p) Regresjonsanalyse (evt multippel regresjonsanalyse) B) Gjør rede for hva de forskjellige verdiene i tabellen betyr og hva de sier oss. 4 poeng totalt for denne og oppgave C. Jeg tror mange vil svare på disse to oppgavene i lag. Disse to deloppgavene er lange og jeg vil derfor ikke kreve lange forklaringer i denne oppgaven. Kort beskrivelse av R Square (eller Adjusted R Square), Sum of Squares (alle 3), ustandardisert og standardisert koeffisient og hvordan tolkningen vil endre seg med høyere/lavere verdig må være med for 4 poeng. 4 poeng kan gis selv om ikke alle de andre er beskrevet. R Square: Hvor mye av variansen i utfallsvariabelen som blir «forklart» av prediktorene (evt prediktorvariablene). Adjusted R Square: Et (ned)-justert mål på hvor mye av variansen i utfallsvariabelen som blir ««forklart» av prediktorene (evt prediktorvariablene). Std. Error of the Estimate: Standardfeilen til estimatet. Hvor stort man estimerer standardavviket er mellom denne samplen og andre sampler fra samme populasjon å være. Sum of Squares - Regression Går også under navnet Model Sum of Squares (SS M ). Forteller oss hvor mye av variansen modellen forklarer/predikerer ved å se på forskjellen mellom gjennomsnittet og regresjonslinjen Sum of Squares Residual Går også under navnet Residual Sum of Squares (SS R ). Forteller oss hvor mye modellen ikke forklarer/predikerer. Sum of Squares Total Går også under navnet Total Sum of Squares (SS T ). Forteller oss en totale variansen i datasettet ved å se på avstanden mellom alle observasjonene og gjennomsnittet. Mean Square Regression, går også under navnet Mean Square Model (MS M ). Er «Sum of Squares Regression» (evt SS M ) delt på antall frihetsgrader (df). Forteller det samme som «Sum of Squares Regression» (evt SS M ) men ved å dele på df kontrolleres det for antall prediktorer. Side 15 av 20

Mean Square Residual, (MS R ). Er «Sum of Squares Residual» (evt SS R ) delt på antall frihetsgrader (df). Forteller det samme som «Sum of Squares Residual» (evt SS R ) men ved å dele på df kontrolleres det for antall prediktorer og deltakere. Df Frihetsgradene til forskjellige Sum of Squares-målene. F F-ratioen. Viser hvor mye mer vår modell forklarer enn ingen modell (gjennomsnittet) ved å dele «Mean Square Regression» (evt. MS M ) på «Mean Square Residual» (evt. MS R ). Sig. Signifikansen til regresjonsanalysen (evt. til F-ratioen). Unstandardized Coefficients B Ustandardiserte koeffisienten til prediktoren. Denne er stigningstallet i regresjonsligningen. Måles i samme enhet som det har i datasettet. Unstandardized Coefficients Std. Error: Standardfeilen til betakoeffisienten. Dette er et estimat på standardavviket mellom denne og andre sampler fra samme populasjon. Standardized Coefficients B: Samme som Unstandardized Coefficients B, men måler dette i standardavvik. t skåren: Brukes til å vurdere om koeffisienten til prediktoren er signifikant forskjellig fra null. Sig. Signifikansen til t-skåren til prediktoren C) Hvordan ville en endring i disse verdiene påvirket vår vurdering av modellen og resultatene. R Square: Økning: Modellen forklarer mer av variasjonen i prediktoren. Lavere: Forklarer mindre. Adjusted R Square: Modellen forklarer mer av variasjonen i prediktoren. Lavere: Forklarer mindre. Std. Error of the Estimate: Høyere vil si at man estimerer at det er større forskjell mellom denne og andre sampler fra samme populasjon. Kan for eksempel være et tegn på at man ikke har en stor nok sample. Lavere: Man estimerer mindre forskjell mellom sampler (de er med andre ord ganske like). Side 16 av 20

Sum of Squares - Regression Lavere: Man forklarer/predikerer mindre. Høyere: Man forklarer/predikerer mer. Ettersom dette er en sum vil den bli påvirket av antallet i samplen. Sum of Squares Residual Høyere: Det er mer man ikke forklarer. Lavere: Det er mindre man ikke forklarer (det gjenstår mindre som ikke er forklart). Ettersom dette er en sum vil den bli påvirket av antallet i samplen Sum of Squares Total Høyere (lavere): Den totale mengden varians er høyere (lavere), dette i seg selv sier ikke så mye om modellen vår. Det vi er ute etter er hvor mye av den variansen vi kan forklare. Ettersom dette er en sum vil den bli påvirket av antallet i samplen. Df I dette tilfellet vil en ending her være resultatet av flere eller færre respondenter eller prediktorer. Mean Square Regression, høyere: Man forklarer mer av variansen til prediktoren. Et bedre mål enn «Sum of Squares Regression», da det kontrolleres for antall prediktorer. Lavere, man forklarer mindre av variansen. Mean Square Residual, (MS R ). Hvor mye av variansen som ikke blir forklart, men gir et bedre mål på dette enn «Sum of Squares Residual» ettersom det kontrolleres det for antall prediktorer og deltakere. F F-ratioen. Økning: vi forklarer mer i forhold til det vi ikke forklarer. Lavere: Vi forklarer mindre i forhold til det vi ikke forklarer. Sig. Signifikansen til regresjonsanalysen (evt. til F-ratioen). Blir denne høyere en signifikansnivået vi jobber med (.01 eller.05) vil vi sannsynligvis forkaste hypotesen vår. Unstandardized Coefficients B Høyere (absolutt) verdi, sterkere effekt på prediktoren. Lavere (absolutt) verdi, svakere effekt. Side 17 av 20

Unstandardized Coefficients Std. Error: Høyere: vil si at man estimerer at det er større forskjell mellom dette utvalget og andre sampler fra samme populasjon (er denne svært høy kan dette være et tegn på at utvalget for lite) Standardized Coefficients B: Samme som Unstandardized Coefficients B, men måler dette i standardavvik. t skåren: høyere: Høyere skåre vil indikere en sterkere effekt (eller mindre usikkerhet (standardfeil)). En høyere skåre betyr at det er mer sannsynlig at det er en reell effekt. Sig. Signifikansverdiene for «Time spent watching television» og «use of computer games» er allerede så lave at det vil kreve instillingsendringer i SPSS for å registere dette. Med en lavere signifikansverdi ville «good diet» blitt rapportert som en signifikant prediktor (om verdien hadde vært under.05 eller.01). D) Vis hvordan du ville rapportert dette resultatet i en artikkel (vis rapportering i tekstform og husk at dette inkluderer relevant statistikk i parentes, tabell er ikke nødvendig). 1,5p) Må vise enten standardisert eller ikke-standardisert koeffisient og enten R 2 eller adjusted R 2. Trenger ikke å være perfekt APA-stil for å få full pott. Prediktorene «Time spent watching television», «Use of computer games» og «Good diet» forklarte 6% (R 2 =.06) av variansen i «Aggression». «Use of computer games» var den sterkeste prediktoren ( =.17, t(662) = 4.57, p <.01), fulgt av «Time spent watching television» ( =.14, t(662) = 3.52, p <.01) - Godtar rapportering av R 2 eller Adjusted R 2 med og uten F, frihetsgrader og sig. - Godtar også at det svares i for mange desimaler. Side 18 av 20

- Godtar også at det ikke rapporteres t(frihetsgrader). Model R R Square Adjusted R Square Std. Error of the Estimate 1,235 a,055,051,31112 a. Predictors: (Constant), Good Diet, Time spent watching television., Use of Computer Games. Model Sum of Squares df Mean Square F Sig. Regression 3,762 3 1,254 12,956,000 b 1 Residual 64,080 662,097 Total 67,842 665 a. Dependent Variable: Aggression b. Predictors: (Constant), Good Diet, Time spent watching television., Use of Computer Games. Model Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. (Constant) -,002,012 -,182,856 1 Time spent watching television.,139,040,135 3,517,000 Use of Computer Games.,168,037,180 4,567,000 Good Diet -,062,037 -,065-1,668,096 a. Dependent Variable: Aggression Side 19 av 20

OPPGAVE 8 (3 poeng) Hvilke analyser har blitt brukt i dette avsnittet? Vis hvor de forskjellige analysene er referert til i avsnittet. 3poeng om alle 4 testene vises til. Det var ingen kjønnsforskjeller (t(100) = 1.10, p >.05) (t-test) eller aldersgruppeforskjeller (F(5,95) = 1.43, p >.05) (ANOVA (evt. variansanalyse), godtar ANOVA her, trenger ikke påpeke at det er en one-way/enveis) i datasettet. I en modell som forklarte 51% (R²= 51, F(3,97) = 4.25, p <.05) (Regresjonsanalyse (evt. Regression analysis), godtar regresjon(-sanalyse), trenger ikke påpeke at det er en multippel regresjonsanalyse) av trivsel på jobb var «Utdanning» den sterkeste prediktoren (β =.41, p <.05) (fortsatt regresjon, her holder det at det blir vist en av plassene) etterfulgt av «Meningsfullt arbeid» (6 items, α =.81; β =.28, p <.05) (reliabilitetstest/reliability analysis). Lønn var ikke en signifikant prediktor for trivsel på jobb (β = -.03, p >.05) (fortsatt regresjon, her holder det at det blir vist en av plassene). Side 20 av 20