Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

Størrelse: px
Begynne med side:

Download "Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?"

Transkript

1 2 verdier Forelesning 13 Analyser av gjennomsnittsverdier Valg av type statistisk generalisering i bivariat analyse er avhengig av hvilke variabler vi har Avhengig variabel kategorivariabel kontinuerlig variabel Uavhengig variabel 3 eller flere Kjikvadrattest Kjikvadrattest t-test for uavhengige utvalg (Regresjonsanalyse) Variansanalyse Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik? 5 4 Menn 4 3 Kvinner Std. Dev = = 19. N = Std. Dev = = 17.3 N = OWN GROSS INCOME (BEFORE TAX) 1993 Menn: N = 179 Y = 19,45 s = 125,79 OWN GROSS INCOME (BEFORE TAX) 1993 Kvinner: N = 1513 Y = 17,35 s = 88,756 T-test for å undersøke om kvinner og menn tjener like mye Group Statistics AQ84 OWN GROSS INCOME (BEFORE TAX) 1993 SEX sex 1 MALE 2 FEMALE N Std. Deviation Std. Error GROSS INCOME (BEFORE TAX) 1993 assumed not assumed Levene's Test for Equality of Variances F Sig. Independent Samples Test t df Sig. (2-tailed) t-test for Equality of s Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper T-verdien er 22,77 og sannsynligheten for å få en så høy t-verdi hvis kvinner og menn tjener i tjener like mye er mindre enn,1 prosent (p <.1) Konklusjon: Kvinner og menn i har ulik gjennomsnittslønn 1

2 KONSTRUERT EKSEMPEL: T-tester for å sammenligne aldersgjennomsnittet for 56 kvinner og 56 menn med en person på hvert alderstrinn innenfor ulike aldersintervall Alder Alder Std. Err. T df Sig. Kvinner Menn Diff. Diff To versjoner av t-testen (for tosidig test av to uavhengige utvalg) Klassisk variant: Moderne variant: Valg av test: t-test Valg av test : t-test H : Det er ingen forskjell i H 1 : Det er forskjell i H : Det er ingen forskjell i H 1 : Det er forskjell i Velg signifikansnivå (α=,5), Velg signifikansnivå (α=,5) finn antallet frihetsgrader, og Bruk SPSS for å beregne bruk t-tabellen for å finne den utvalgsverdien av t og dennes kritiske verdien (k) p-verdi Finn utvalgsverdien av t Konkluder Konkluder t < k H beholdes t k H forkastes p > α H beholdes p α H forkastes I levekårsundersøkelsen finner vi en typisk avhengig variabel for en t-test Kan du anslå hvilken pris du/dere ville få for boligen dersom den bla solgt nå? HVIS IO IKKE KAN OPPGI VERDI: Vi ber likevel om at du anslår en verdi. Slike anslag må nødvendigvis blir svært grove. HVIS IO FORTSATT IKKE KAN OPPGI EN VERDI: Vi er fornøyd om du anslår beløpet i nærmeste hundretusen kroner. MARKEDSVERDI: Std. Dev = = 78.5 N = Kan du anslå pris for boligen dersom solgt nå 2

3 Moderne variant av t-test for to uavhengige utvalg H : Det er ingen forskjeller i gjennomsnittlig vurdering av salgsverdi på egen bolig mellom kvinner og menn H 1 : Det er forskjeller i gjennomsnittlig vurdering av salgsverdi på egen bolig mellom kvinner og menn Vi velger signifikansnivå på 5% (α=,5) Vi bruker SPSS for å beregne utvalgsverdien av t og dennes p-verdi. Så starter vi opp SPSS og kjører Independent Samples T Test Group Statistics SPM3A Kan du anslå pris for boligen dersom solgt nå IOSKJONN IOs kjønn 1 Mann 2 Kvinne Std. Error N Std. Deviation Her kommer resultatet fra t-testen SPM3A Anslå pris for boligen assumed not assumed Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of s 95% Confidence Interval of the Std. Error Difference F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper Vi ser her at t-verdien ble 2,247 og p-verdien,25 Dette viser at p-verdien (,25) er mindre enn α-verdien (,5), og at vi derfor bør forkaste hypotesen H Konklusjon: Det er forskjeller i gjennomsnittlig vurdering av salgsverdi på egen bolig mellom kvinner og menn 3

4 Hvordan kan vi teste denne tabellen? Report IOSBOSTE Bostedsstrøk 1 Spredtbygd strøk 2 Tettb Tettb Tettb Tettb. 1 + H : Ingen forskjell mellom gruppe 1 og gruppe 2 H : Ingen forskjell mellom gruppe 1 og gruppe 3 H : Ingen forskjell mellom gruppe 1 og gruppe 4 H : Ingen forskjell mellom gruppe 1 og gruppe 5 H : Ingen forskjell mellom gruppe 2 og gruppe 3 H : Ingen forskjell mellom gruppe 2 og gruppe 4 H : Ingen forskjell mellom gruppe 2 og gruppe 5 H : Ingen forskjell mellom gruppe 3 og gruppe 4 H : Ingen forskjell mellom gruppe 3 og gruppe 5 H : Ingen forskjell mellom gruppe 4 og gruppe 5 N Std. Deviation Her vil sannsynligheten for å finne en eller flere signifikante forskjeller øke med antallet tester selv om alle gjennomsnittene er like i Med mer enn to verdier på den uavhengige variabelen bør vi heller bruke denne teste Report IOSBOSTE Bostedsstrøk 1 Spredtbygd strøk 2 Tettb Tettb Tettb Tettb. 1 + N Std. Deviation Enveis variansanalyse basert på F-verdi i F- fordelingen Hypoteser: H : De ulike gjennomsnittene er like i H 1 : Minst to av disse gjennomsnittene er ulike i Enveis variansanalyse av forholdet mellom boligstrøk og verdsetting av egen bolig ANOVA Sum of Squares df Square F Sig. Between Groups Within Groups 8.77E E Her ser vi at F = 4,718 og at sannsynligheten for å få en så høy F-verdi hvis det ikke er gjennomsnittsforskjeller mellom minst to grupper i er på,1 prosent (p =,1) Det vil si at vi forkaster H, og konkluderer med at det er forskjeller i gjennomsnittlig verdsetting av egen bolig i forhold til boligens sentralitet. 4

5 Her er det mer naturlig å teste en hypotese om at boligverdien øker med befolkningstetthet, enn å teste om gjennomsnittet er likt for alle gruppene Pris på egen bolig Antall 1 kroner Spredtbygd strøk Tettb Tettb bosate Tettb Tettb. 1 + Dette gjør vi neste gang med regresjonsanalyse 5