2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.



Like dokumenter
Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

H 12 Eksamen PED 3008 Vitenskapsteori og forskningsmetode

Bruk data fra tabellen over (utvalget) og opplysninger som blir gitt i oppgavene og svar på følgende spørsmål:

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Eksamensoppgave i PED 3008 høst 2015 Vitenskapsteori og forskningsmetode

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

ECON240 VÅR / 2016 BOKMÅL

Eksamensoppgave i samfunnsfaglig forskningsmetode 16. mai 2003

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Kort overblikk over kurset sålangt

1 10-2: Korrelasjon : Regresjon

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

ST0202 Statistikk for samfunnsvitere

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

Eksamensoppgave i ST3001

Løsningsforslag til obligatorisk innlevering 3.

Gjør kort rede for seks av de åtte begrepene. Bruk inntil ½ side på hvert begrep.

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

STUDIEÅRET 2011/2012. Individuell skriftlig eksamen. STA 200- Statistikk. Fredag 9. mars 2012 kl

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2003

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

ST0202 Statistikk for samfunnsvitere

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Forelesning 10 Kjikvadrattesten

Statistikk og dataanalyse

EKSAMENSOPPGAVER STAT100 Vår 2011

Kapittel 3: Studieopplegg

Effektstørrelse. Tabell 1. Kritiske verdier for Pearson s produkt-moment-korrelasjon med 5% og 1% signifikansnivå. N 5% 1% N 5% 1%

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

ST0202 Statistikk for samfunnsvitere

QED Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

ST0202 Statistikk for samfunnsvitere

Målenivå: Kjønn: Alle bør kunne se at denne variabelen må plasseres på nominalnivå

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Kan vi stole på resultater fra «liten N»?

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

7.2 Sammenligning av to forventinger

Fasit for tilleggsoppgaver

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

6.2 Signifikanstester

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Høye skårer indikerer høye nivåer av selvkontroll.

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

Noen momenter ved vurdering av eksamen PSY1010 PSYC1100 høsten 2018.

STUDIEÅRET 2011/2012. Utsatt individuell skriftlig eksamen. STA 200- Statistikk. Mandag 27. august 2012 kl

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2001

TMA4240 Statistikk Høst 2016

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

STUDIEÅRET 2016/2017. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 27. april 2017 kl

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 16. april 2015 kl

HØGSKOLEN I STAVANGER

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

10.1 Enkel lineær regresjon Multippel regresjon

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

i x i

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Regler i statistikk STAT 100

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Repeated Measures Anova.

Løsningsforslag eksamen STAT100 Høst 2010

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamen PSYC3101 Kvantitativ metode II Vår 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

PSY Kvantitativ metode

Obligatorisk oppgave 2

Transkript:

H12 - Semesteroppgave i statistikk - sensurveiledning Del 1 - teori 1. Gjør rede for resonnementet bak ANOVA. Enveis ANOVA tester om det er forskjeller mellom gjennomsnittene i tre eller flere populasjoner. Man trekker et representativt utvalg (underutvalg) fra hver populasjon. Det totale utvalget man har data på vil da bestå av tre eller flere underutvalg. Sannsynligheten for at det er signifikante forskjeller mellom populasjonsgjennomsnittene øker med økende forskjell mellom gjennomsnittene i underutvalgene. Variansen i det totale utvalget (alle underutvalgene til sammen) deles opp i to: variansen mellom underutvalgene (S 2 B) og variansen innen hvert underutvalg (S 2 W). Forholdet mellom disse to variansene er F-fordelt. Hvis H0 er sann (alle populasjonene har samme gjennomsnitt) vil begge disse variansene være uttrykk for samme feilvarians eller uforklart varians. Forventet F-verdi gitt at H0 er riktig blir derfor 1. Hvis gjennomsnittene i gruppene er forskjellig vil mellomgruppe variansen få et tillegg til feilvariansen, og F-verdien blir større enn 1. Hvis F-verdien er større enn kritisk verdi (gitt et signifikansnivå og frihetsgrader) vil en forkaste H0, og en konkluderer dermed med at minst en av populasjonene har signifikant ulikt gjennomsnitt fra de andre. En post-hoc test vil fortelle hvilke populasjoner som har ulikt gjennomsnitt. 2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger. En sampelfordeling er en fordeling av utvalgsestimat, der alle utvalgene er trukket fra samme populasjon og er like store. Eksempler: fordeling av utvalgsgjennomsnitt, fordeling av differanser mellom utvalgsgjennomsnitt, fordeling av korrelasjonskoeffisienter. De sampelfordelingene vi benytter under hypotesetesting er standardiserte fordelinger gitt nullhypotesen. Eksempler på slike fordelinger er z-fordeling (standard normalfordeling), t- fordelinger, F-fordelinger og Kjikvadratfordelinger. 3. Hva er et konfidensintervall? Nevn to eksempler på konfidensintervall. Et konfidensintervall er et intervallestimat for en populasjonsparameter. Dette estimatet gjøres på grunnlag av et utvalgsresultat. En kan for eksempel estimere populasjonens gjennomsnitt på grunnlag av gjennomsnittet i et representativt utvalg. Av alle intervallestimat som kan gjøres på grunnlag av ulike utvalg av samme størrelse trukket fra populasjonen, vil en viss andel av dem (for eksempel 95 %) inneholde populasjonens gjennomsnitt. En kan også si at intervallet med en viss sannsynlighet (for eksempel 95 %) vil inneholde populasjonens gjennomsnitt (populasjonsparameteren). Eksempler: konfidensintervall for populasjonenes gjennomsnitt, konfidensintervall for differansen mellom to populasjonsgjennomsnitt. 1

4. Hva menes med type II-feil? Hva kan gjøres for å redusere faren for å begå en slik type feil? Type II feil vil si at en ikke forkaster en usann H 0. En kan redusere faren for å begå denne feilen på tre måter: - øke sannsynligheten for å begå en type I feil, dvs. øke α - bruke en-halet test der dette er mulig - øke antall informanter i utvalget, og dermed redusere størrelsen på standardfeilen 5. Hva mens med at et resultat er signifikant på 5% nivå? 6. At et resultat er signifikant på 5% nivå vil si at sannsynligheten for utvalgsestimatet gitt at H0 er riktig (sannsynligheten for å begå type I feil) er mindre eller lik 5%. En annen, og noe mindre presis, måte å si det på er at sannsynligheten for at H0 er riktig er mindre eller lik 5%. Når et resultat er signifikant på 5% nivå forkaster vi H0 med et signifikansnivå på 5%. 7. Hva forteller Pearsons PM korrelasjon og hva forteller den ikke? Korrelasjonskoeffisienten handler bare om statistiske sammenhenger. Den må alltid tolkes i relasjon til substans for å kunne gi mening. Korrelasjonen handler ikke om årsak-virkning (kausalitet). Styrken på samvariasjonen mellom to variabler kan endres hvis vi kontrollerer for effekten av en tredjevariabel (dette kan gjøres ved partiell korrelasjon). Korrelasjonskoeffisienten r avdekker bare lineære sammenhenger. Hvis sammenhengen mellom to variabler er kurvelineær (for eksempel som forholdet mellom vanskegrad på oppgaven og motivasjon i henhold til teorien om prestasjonsmotivasjon) er ikke r et egnet mål på styrken i samvariasjonen. Skjevfordelte utvalg vil også gi underestimert r. Korrelasjonskoeffisienten øker med økende varians (spredning) i utvalget. Hvis variablene i utvalget har mindre spredning enn i populasjonen vil r bli underestimert (for lav). Hvis en for eksempel ønsker å undersøke korrelasjonen mellom IQ og matematikkprestasjon og alle i utvalget har IQ skåre lik 100, vil r bli mindre enn den egentlig er i populasjonen. Derfor er det viktig at utvalget er representativt for populasjonen mhp spredning på variablene. 2

Del 2 - analyser for hånd Oppgave 1 a) Er det signifikant forskjell mellom elevene i gruppe 2 (Middels) og gruppe 3 (Over middels) når det gjelder hvor sikre de er på å gjennomføre VGS.? Still opp og test de nødvendige hypoteser. Du får opplyst at det ikke er signifikant forskjell i variansen i de to gruppene som sammenlignes. Her må en bruke en t-test to uavhengige utvalg: 1. Hypotesene H 0 : µ 1 µ 2 = 0 H a : µ 1 µ 2 0 2. t krit = t(df, α/2) = t(18,.05/2) = 2,101 3.. t obs = - 2,32 4. t obs = 2,32 > t krit = 2,101 H0 faller, det er statistisk signifikant forskjell på gjennomsnittene på variabelen Fullføre for prestasjonsgruppene Middels og Over middels. b) Er det signifikant forskjell mellom noen av de tre populasjonene når det gjelder troen på at de kommer til å fullføre VGS? Still opp og test de nødvendige hypoteser. Her må en bruke enveis ANOVA: : 1. Hypotesene: H 0 : µ 1 = µ 2 = µ 3 H a : µ m µ n for noen m, n, m n, m = 1, 2 eller 3, og n=1, 2 eller 3 2. F krit = F (2, 27,.05) 3,39 3. F obs = 17,84 4. Konklusjon: F obs = 17,84 > F krit = 3,39 H0 faller, det er statistisk signifikant forskjell mellom gjennomsnittene i en eller flere av de tre gruppene. 3

c) Tolk tabellen nedenfor. Gruppen Under middels er forskjellig fra de to andre gruppene. Det er ikke statistisk signifikant forskjell mellom gjennomsnittene i gruppen Middels og gruppen Over Middels på 5% nivå (sig. =.082). d) Sammenhold resultatet fra analysen under deloppgave a) med det du finner i tabellen i deloppgave c). Tolk eventuelle diskrepanser i de to analysene. I deloppgave a) fant vi at gruppene Middels og Over Middels hadde statistisk signifikant ulikt gjennomsnitt på 5% nivå. Tabellen i deloppgave c) viser at gjennomsnittene ikke er signifikant forskjellige på 5% nivå. To motsatte ulike konklusjoner mao. Dette skyldes at sjansen for å gjøre type I feil øker når vi sammenligner to og to grupper ved hjelp av t-tester (parvise sammenligninger). Post hoc testen justerer for denne effekten. Oppgave 2 Det er hevdet at frafallet i VGS er større blant elever som har spesielle behov (har ekstraundervisning). For å teste om det er sammenheng mellom bortvalg og spesielle behov, ble et tilfeldig utvalg på 100 elever uten spesielle behov og 100 elever med spesielle behov trukket ut fra inntakslistene. 45 av disse 200 hadde ikke fullført VGS etter 5 år. En opptelling av hvem som hadde fullført ga som resultat 90 elever uten spesielle behov og 65 elever med spesielle behov. Er det signifikant sammenheng mellom det at en elev har spesielle behov og sjansen for å fullføre VGS? Still opp og test de nødvendige hypoteser. Benytt α=.05. Vurder resultatet. 4

Dette er en Kji-kvadrat test: Fullført Har fullført Har ikke fullført Spesielle behov Uten spesielle Med spesielle behov behov O: 90 O: 65 E: 77,5 E: 77,5 (100x155)/200=77,5 R: -1,4 R: 1,4 O: 10 E: 22,5 R: -2,6 O: 35 E: 22,5 R: 2,6 155 45 100 100 200 1. Hypotesene H 0 : I hvilken grad elever fullfører VGS er uavhengig av om de har spesielle behov. H a : I hvilken grad elever fullfører VGS er avhengig av om de har spesielle behov. 2. χ krit = χ (1,.05) = 3,841 3. χ obs = 17,92 4. χ obs = 17,92 > χ krit = 3,841, H 0 faller, dvs. at det er sammenheng mellom andelen som fullfører VGS og om eleven har spesielle behov. Når en beregner standardiserte residualer ser en at det er en større andel av elever med spesielle behov som ikke fullfører enn forventet ut fra nullhypotesen og en lavere andel av elever uten spesielle behov som ikke fullfører enn forventet ut fra nullhypotesen. Del 3 - analyser på SPSS Oppgave 1 a) Er det statistisk signifikant forskjell mellom gutter og jenter med hensyn til intensjon om å slutte på VGS? Kjør den nødvendige analysen og tolk resultatet. Finn et CI95 for forskjellen mellom gruppene. Forklar hva dette intervallet forteller. b) Er det statistisk signifikant forskjell mellom elever med og uten spesielle behov med hensyn til intensjon om å slutte på VGS? Kjør den nødvendige analysen og tolk resultatet. Finn et CI95 for forskjellen mellom gruppene. Forklar hva dette intervallet forteller. 5

a) T-test to uavhengige utvalg: Dette tallet betyr at vi ikke kan Observert t Frihetsgrader gå ut fra at populasjonene H 0 faller! CI 95 har lik varians (H 0 faller) Merk: dette gjør vi ikke for Standardfeilen hånd! Analysen viser at det er statistisk signifikant forskjell på jenter og gutter gjennomsnitt på variabelen Intensjon om å slutte på VGS. Guttene har et høyere gjennomsnitt enn jentene. Et intervallestimat for differansen mellom jenters og gutters gjennomsnitt i populasjonen viser at vi med 95% sikkerhet kan si at denne differansen ligger mellom 0,13 og 1,85. b) Er det statistisk signifikant forskjell mellom elever med og uten spesielle behov med hensyn til intensjon om å slutte på VGS? Kjør den nødvendige analysen og tolk resultatet. Finn et CI95 for forskjellen mellom gruppene. Forklar hva dette intervallet forteller. b) T-test to uavhengige utvalg: 6

Dette tallet betyr at vi kan Observert t Frihetsgrader gå ut fra at populasjonene H 0 faller! CI 95 har lik varians (H 0 står) Merk: dette gjør vi ikke for Standardfeilen hånd! Analysen viser at det er statistisk signifikant forskjell på elever med og uten spesielle behov med hensyn til gjennomsnitt på variabelen Intensjon om å slutte på VGS. Elever med spesielle behov har et høyere gjennomsnitt enn elever uten spesielle behov. Et intervallestimat for differansen mellom gjennomsnittene i populasjonen viser at vi med 95% sikkerhet kan si at denne differansen ligger mellom 0,64 og 2,59. Oppgave 2 Lag en sumskåre av de to variablene Matematikk og Norsk. Lag så en ny variabel der elevene blir delt i tre grupper etter karakternivå. Bruk følgende poenggrenser for inndelingen: Under middels (UM): 2-6, Middels (M): 7-8, Over middels (OM): 9-12. a) Er det signifikant forskjell mellom noen av de tre karaktergruppene (UM, M og OM) når det gjelder intensjon om å slutte på VGS? Still opp og test de nødvendige hypoteser. b) Kjør post hoc analyse og tolk denne analysen. Enveis ANOVA med Karaktersum tredelt som grupperingsvariabel og Intensjon om å slutte som avhengig variabel: Tabellen viser antall elever i hver gruppe og gruppenes gjennomsnitt på den avhengige variabelen. Det fremgår av tabellen at gjennomsnittet synker når prestasjonen øker. 7

Signifikanstesten viser at gruppenes gjennomsnitt på den avhengige variabelen er statistisk signifikant forskjellig med et signifikansnivå på 5%. Gruppen Under middels er forskjellig fra de to andre gruppene. Det er ikke statistisk signifikant forskjell mellom gjennomsnittene i gruppene Middels og Over Middels på 5% nivå (sig. =.17). Oppgave 3 a) Er det signifikant sammenheng mellom kjønn og plassering i karaktergruppe? Still opp og test de nødvendige hypoteser. Benytt α=.05. Vurder resultatet. b) Finn hvilke celler som eventuelt bidrar til å forklare et signifikant resultat. Vi kjører en kji kvadrat test med variablene Kjønn og Karaktersum tredelt: 8

Kjikvadrat testen viser at det er signifikant sammenheng mellom kjønn og plassering på karaktergruppe. Det er en større andel jenter som tilhører gruppen Over middels enn forventet ut fra nullhypotesen (R=2,9), og vi finner en lavere andel gutter enn forventet i denne gruppen (R=-3,1). Oppgave 4 a) Er det sammenheng mellom opplevd støtte fra lærere og medelever på den ene siden og intensjoner om å slutte på den andre? Kjør de nødvendige analyser. Tolk retning og styrke. Vi kjører en korrelasjonsanalyse med tre variabler inne: Tabellen viser at det er en signifikant og moderat negativ korrelasjon mellom Opplevd støtte fra medelever og Intensjon om å slutte og en signifikant og moderat negativ korrelasjon mellom Opplevd støtte fra lærer og Intensjon om å slutte. Sosial støtte fra henholdsvis medelever og lærer kan dermed antas å betydning for å forebygge mot at elever tenker på å slutter i VGS. 9