Studier, region og h Utarbeid av Ronny Kleiven Antall ord 2190 1
3.1 GRUNNLEGGENDE STATISTISKE BEGREPER Innen statistikk opererer man med felles begreper som danner rammene for de videre forskningsprosessene. 1 2 3.1.1 Enh Enh ved kvantitativ mode kan man "se for seg" på y aksen i form av antall enher. Ved kvalitativ mode; y aksen i form av antall variabler. Enhen kan være mennesker, dyr, ting, hendelser, land m.m. Eksempel er i del 3.2; studiepreferanser blant studenter - studenter en mulig enh her. 3.1.2 Variabel Variablene begner d som man ønsker å studere ved enhen. I del 3.2 er disse kjønn, fødselsår, region, fagtilhørigh, h og Bergen. 3.1.3 Verdier Variabler varierer med ulike verdier/kategorier som kan skilles logisk. Eksempel i vårt materiell er kjønn, som har verdiene mann og kvinne. 3.1.4 Målenivå Målenivå sier oss noe om egenskapene til variablene. Man deler målenivå inn i fire hierarkiske deler. Disse er nominalnivå som for eksempel kjønn, ordinalnivå som kan være grad av interesse for noe, intervallnivå som kan være antall innbyggere sted og forholdstallsnivå som kan være inntekt. 3.1.5 Sentraltendens Sentraltendens sier noe om hva som er den vanligste verdien i en hyppighsfordeling. På nominalnivå benytter man oftest mode eller typall, og på ordinalnivå benyttes oftest median som mål på sentraltendens. På intervall/forholdstallnivå benyttes gjennomsnitt. 3.1.6 Spredning Hvor forskjellig er de verdiene vi har funn? Dte blir kalt spredning og kan måles ved hjelp av 1 (Jon Anjer; Statistikk; Kapittel. 2; 3. utg; 2005) 2 (http://www.sv.ntnu.no/iss/arild.blekesaune/forelesning10-filer/frame.htm) 2
variasjonsbredde, standardavvik og kvartilavvik. På nominalnivå benyttes variasjonsbredde, ordinalnivå benyttes kvartalavvik og intervall/forholdstallnivå benyttes standardavvik. 3.1.7 Symmri Symmrisk sammenheng tilsier at man måler statistisk sammenheng, uten at den ene variabelen braktes som årsak til den andre. Eksempel: Sammenhengen mellom ektefelles utdanningsnivå. 3.1.8 Asymmri Asymmrisk sammenheng tilsier at den uavhengige variabelen, påvirker verdien på den avhengige variabelen. Eksempel: Sammenhengen mellom foreldre og barns utdanningsnivå. 3.1.9 Avhengig variabel Avhengig variabel er knytt til uttrykk mellom f.eks to variabler x og y. Når x påvirker y og y påvirker x, sier man at x og y er gjensidig avhengig. 3.1.10 Uavhengig variabel Uavhengig variabel begner en variabel som antas å påvirke andre variabler (avhengige). 3.2 DATAMATRISE, MÅLENIVÅ, TYNGDEPUNKT OG SPREDNING 3.2.1 Enher i denne matrisen er "studenter på seminar" (mennesker). I vårt tilfelle er variablene de 'spørsmålene' vi ønsker å få svar på fra studentene; i vårt tilfelle seks spørsmål. Videre vil variablene ha ulike verdier (utfall). I vår matrise kan vi trekke frem variabelen 'region', som har sju verdier (utfall). 3.2.2 Vi lag en ny variabel; 'alder' i SPSS matrisen. Denne variabelen viser alder i antall år fremfor årstall man er født. Dte er hensiktsmessig for å danne seg en oversikt over aldersfordelingen i dataene. 3.2.3 Målenivåene til variablene våre er som følger: 3
Kjønn er nominalnivå Fødselsår er mrisk variabel på intervallnivå Region er nominalnivå Fagtilhørigh er nominalnivå Tilfredsh er ordinalnivå (rangeres) Bergen er nominalnivå Alder er mrisk variabel på intervallnivå 3.2.4 Sentraltendens Alder kom ut med gjennomsnitt 24,07 år og h med median 1,50 (h har en skala fra "1 meg til 4 ikke i d hele tatt"). Spredning Standardavvik for alder er 4,29. Dte byr at alder varierer fra nedre grense 19,80 år til øvre grense 28,40 år. Maksimum alder er 35 år og minimum alder er 20 år. Kvartilavvik ((2 1)/2) er lik 0,50. Når d kommer til h er inntil 25 prosent av enhene "meg ", inntil 50 prosent er mellom "meg og ganske " og inntil 75 prosent er "ganske ". 3.2.5 Alder kan ha mange bydninger som for eksempel mål på 'modenh', 'kritisk' og 'levd liv'. Kort sagt bør økt alder føre til økt modenh, som igjen gjør at man er mer kritisk og vurderende til påstander fra andre. Tilfredsh kan ha bydninger som 'lykke', 'sorg' og 'sinnsstemning'. Lykkefølelse kan variere mellom mennesker, og i perioder med sorg er den gjerne lavere enn når man har økt sinnstemning. 'Bergen som kulturby' er sannsynligvis en faktor når man velger studier, fordi man søker ter opplevelser. 3.2.6 Hypotese 0 (1): D eksisterer ingen sammenheng ved 5 % signifikansnivå. Hypotese 1 (1): D er en sammenheng mellom de 14 enhene hva angår h (ord) ved å studere i Bergen og alder (ord)? 4
Jeg har valgt denne hypotesen, fordi jeg ønsker å finne ut i hvilken grad d er sammenheng mellom studier i Bergen, alder og h. Hypotese 0 (2): D eksisterer ingen sammenheng ved 5 % signifikansnivå. Hypotese 1 (2): D er en sammenheng mellom de 14 enhene hva angår region (nom) studenten kommer fra og h (ord) ved å studere i Bergen? Jeg har valgt denne hypotesen, fordi jeg ønsker å finne ut i hvilken grad d er sammenheng mellom opprinnelig bosted og h ved å studere i Bergen. 3.3 KRYSSTABELLANALYSE: FYSISK AKTIVITET 3.3.1 Den avhengige V147 (hvor ofte deltok du i idrt/fysisk aktivit siste 4 uker?) er ordinal, sammen med uavhengig variabel V205 (landsdel) som er nominal. Forøvrig velger jeg V167 (bostedstype) som kan rangeres i en naturlig rekkefølge, og er dermed klassisfisert som ordinalskala. Mål for sentraltendens ved ordinale variabler er median. V147 kommer ut med median 4 ("to eller tre ganger i uken") ved deskriptiv analyse. I tabellen oppgir 376 enher trening "to eller tre ganger i uken", som er 33,20 % av utvalg på 1131 (inkludert 'missing'). V205 kommer ut med typall 2 ("Østland ellers"), men her skal man merke seg at man får oppgitt d minste typall, da flere eksisterer. I tabellen oppgir 307 enher "Østland ellers", men d samme typall oppgis også for "Vestland". Dte tilsvarere 27,10 % for hver av landsdelene. D er altså en overvekt av deltaker enher i undersøkelsen som kommer fra "Vestland" og "Østland ellers". V167 kommer ut med median 3 ("en mindre by"). I tabellen oppgir 241 enher at de kommer fra "en mindre by". Dte tilsvarer 21,30 % av utvalg. Her er imidlertid en unøyaktigh ved bruk av median, fordi av tabellen kan man lese at 285 enher (25,20 %) oppgir "en stor by" som bosted. Når man oppgir bostedstype kan enhene ha ulike preferanser hva angår bostedstype, og dte kan muligens være en gjenstand for feilkilde i disse dataene. 5
3.3.2 En bivariat analyse benyttes for å forklare mulige sammenhenger mellom to variabler. 3 Når begge variabler er på nominalnivå eller ordinalnivå, med få verdier benyttes prosentuerte krysstabeller/grafer. Eks. Medlemskap i idrtslag (ja/nei) i forhold til kjønn (mann/kvinne). 4 Andre ganger er avhengig variabel på forholdstalls-, intervall- eller ordinalnivå med mange verdier, mens den andre variabelen er på ordinalnivå med få verdier eller nominalnivå. Ved slike tilfeller kan vi sammenligne statistiske mål som gjennomsnitt, median og standardavvik. V147-"hvor ofte deltok du i fysisk aktivit de siste 4 uker?" (avhengig variabel) mot V205 "bosted" (uavhengig variabel) er på nominalnivå. Mulige sammenhenger kan være at valg av bosted og tilgjengeligh på treningsstudioer. D bør også være slik at de som bor utenfor byene er mindre preg av stress, og dermed ikke føler d samme behov for trening for å mestre stress. Dessuten kan d være slik at de som er bosatt utenfor byene har andre aktiviter som tilsier at de får "trening" hardt fysisk arbeid. Dersom man ser på V147 og V167 (bostedstype) står man overfor to ulike måleverdier og dermed benyttes gjennomsnitt, median og standardavvik som mulige vurderingskriterier ved siden av tabelltolkninger. Variabel 167 (bostedstype) benytter jeg i hypotese to delvis for å underbygge hypotese en. Hypotese 1 (5 % signifikansnivå): D er en sammenheng mellom "Lav frekvens" trening, kjønn og hvilken landsdel man oppgir? Hypotese 2 (5 % signifikansnivå): D er en sammenheng mellom "Lav frekvens" trening, kjønn og hvilken bostedstype man oppgir? 3.3.3 Trening/ Oslo, Østland Agder Vestland Trøndelag Nord- Total landsdel Akershus ellers Norge Hvor ofte 3 Vegard Johansen; ØF -notat nr. 17/2007;D lille kvantitative modeheft; s. 24 4 Vegard Johansen; ØF -notat nr. 17/2007;D lille kvantitative modeheft; s. 27 6
deltok du i fysisk aktivit siste 4 uker? En til fire 78 79 10 84 40 25 316 ganger per 42,4 % 39,1 % 26,3 % 37,2 % 50 % 41,7 % 40 % måned Minst to 106 123 28 142 40 35 474 ganger i 57,6 % 60,9 % 73,7 % 62,8 % 50 % 58,3 % 60 % uken Totalt 184 202 38 226 80 60 790 100 % 100 % 100 % 100 % 100 % 100 % 100 % Tabell 1: Oversikt enher med 'lav frekvens' trening fordelt på landsdel (Spørreundersøkelse om fritid og sport, 2007) D er 790 enher fra utvalg som har oppgitt at de trener 'lav frekvens'. 50 % av de som kommer i fra Trøndelag, oppgir at de trener-"en til fire ganger per måned". 40 % av de som kommer i fra Trøndelag oppgir at de trener -"minst to ganger i uken". 41,7 % av de som kommer i fra Nord- Norge, oppgir at de trener-"en til fire ganger per måned". 58,3 % av de som kommer i fra Nord- Norge oppgir at de trener minst to ganger i uken I utvalg er d 790 enher (totalt 1131), 140 enher fra Trøndelag og Nord-Norge - som utgjør 17,72 %. Utfra tabell 1 er d totalt st en overvekt av de som trener "minst to ganger i uken". Totalt 474 enher hvor 123 enher oppgir at de er fra "Østland ellers" og 142 enher oppgir "Vestland" som bosted. Trening/bostedstype En stor by En forstad En Et ttsted Et Total el utkanten mindre by spredtbygd av stor by strøk Hvor ofte deltok du i fysisk aktivit siste 4 uker? En til fire ganger 82 42 68 61 62 315 per måned 37,3 % 38,2 % 42,5 37,2 % 46,6 40 % 7
Minst to ganger i 138 68 92 103 71 472 uken 62,7 % 61,8 % 57,5 % 62,8 % 53,4 % 60 % Totalt 220 110 160 164 133 787 100 % 100 % 100 % 100 % 100 % 100 % Tabell 2: Oversikt enher med 'lav frekvens' trening fordelt på bostedstype (Spørreundersøkelse om fritid og sport, 2007) D er 787 enher fra utvalg som har oppgitt at de trener 'lav frekvens'. 37,2 % av de som kommer i fra ttsted, oppgir at de trener-"en til fire ganger per måned". 62,8 % av de som kommer i fra ttsted oppgir at de trener -"minst to ganger i uken". 46,6 % av de som kommer i fra spredtbygd strøk, oppgir at de trener-"en til fire ganger per måned". 53,4 % av de som kommer i fra spredtbygd strøk oppgir at de trener minst to ganger i uken I utvalg er d 787 enher (totalt 1131), herav 297 enher som oppgir ttsted og spredtbygd strøk - som utgjør 37,74 %. Utfra tabell 2 er d totalt st en overvekt av de som trener "minst to ganger i uken". Totalt 472 enher hvor 138 enher oppgir at de er fra "en stor by" og 92 enher oppgir "en mindre by" som bosted. 3.3.4 Trening/ Oslo, Østland Agder Vestland Trøndelag Nord- Total landsdel/kjønn Akershus ellers Norge Fysisk aktivit 1-8 ganger per måned Mann 83 91 22 105 42(52,5 %) 32(53,3 %) 375(47,5 %) Kvinne 101 111 16 121 38(47,5 %) 28(46,7 %) 415(52,5 %) Totalt 184 202 38 226 80 60 790 Tabell 3: Oversikt enher med 'lav frekvens trening' fordelt på kjønn og landsdel (Spørreundersøkelse om fritid og sport, 2007) D er 790 enher fra utvalg som har oppgitt at de trener lav frekvens. 52,5 % av de som kommer i fra Trøndelag er menn og 47,5 % er kvinner. 53,3 % av de som kommer i fra Nord-Norge 8
er menn og 46,7 % er kvinner. I utvalg er d 790 enher (totalt 1131), 47,5 % er menn og 52,5 % er kvinner. D er imidlertid interessant at flere menn enn kvinner kommer i fra Agder, Trøndelag og Nord-Norge. Trening/bostedstype/ kjønn Fysisk aktivit 1-8 ganger per måned En stor by En forstad el utkanten av stor by En mindre by Et ttsted Et spredtbygd strøk Total Mann 86 49 82 86(52,44%) 71(53,38%) 374(47,52 %) Kvinne 134 61 78 78(47,56%) 62(46,62%) 413(52,48 %) Totalt 220 110 160 164 133 787 Tabell 4: Oversikt enher med 'lav frekvens trening' fordelt på kjønn og bostedstype (Spørreundersøkelse om fritid og sport, 2007) D er 787 enher fra utvalg som har oppgitt at de trener 'lav frekvens'. 52,44 % av de som kommer i fra ttsted er menn og 47,56 % er kvinner. 53,38 % av de som kommer i fra Nord- Norge er menn og 46,62 % er kvinner. I utvalg er d 787 enher (totalt 1131), 47,52 % er menn og 52,48 % er kvinner. D er imidlertid interessant at flere menn enn kvinner kommer i fra en mindre by, ttsted og spredtbygd strøk. SPSS Chi test hypotese 1 (landsdel, kjønn og treningsfrekvens er layer): Pearson Chi-square (total) har verdi 4,273 < chi kritisk verdi tabell 9,4877 (4 frihsgrader;.05 sig.nivå) - Behold H0 og forkast H1. SPSS Chi test hypotese 2 (bostedstype, kjønn og treningfrekvens er layer): Pearson Chi-square (total) har verdi 10,975 > chi kritisk verdi tabell 9,4877 (4 frihsgrader;.05 sig.nivå) - Forkast H0 og behold H1. Oppsummert: Resultat av Chi testene er marginale og dermed usikre. Min vurdering går mot en forkasting (på tross av at SPSS sier; behold H1 i hypotese 2) av H1 i begge hypotesene. 9
Kilde og litteraturhenvisninger DATAFIL: Spørreundersøkelse om fritid og sport, 2007, http://www.jbi.hio.no/bibin/bos21/def.htm http://www.sv.ntnu.no/iss/arild.blekesaune/forelesning10-filer/frame.htm Sigmund Grønmo; Samfunsvitenskapelige moder; 2004; s. 328-331 Vegard Johansen; D lille kvantitative modeheft; ØF -notat nr. 17/2007 Arne Krokan; Forstå statistikk; 1998 Jon Anjer; Statistikk; 3. utg; 2005 SPSS - vedlegg del 3.2 Kjønn Fødselsår Region Fagtilhørigh Tilfredsh Bergen Alder Kvinne 1991 Oslo, Akershus Kvinne 1992 Vestland Kvinne 1981 Annen eller utland Mann 1977 Vestland Kvinne 1984 Vestland Kvinne 1989 Vestland Kvinne 1989 Østland ellers Kvinne 1990 Vestland Kvinne 1989 Vestland Kvinne 1990 Østland ellers Kvinne 1991 Østland ellers Kvinne 1988 Vestland Mann 1990 Vestland Sampol Nei 21 Nei 20 Lite Nei 31 Meg Meg Meg Meg Meg Meg Nei 35 Ja 28 Nei 23 Nei 23 Nei 22 Nei 23 Nei 22 Nei 21 Nei 24 Ja 22 Mann 1990 Vestland Meg Ja 22 10
11