ME-400, forside Emnekode: ME-400 Emnenavn: Metode og statistikk Dato: 31. mai Varighet: 5 timer Tillatte hjelpemidler: Kalkulator (enkel type) Merknader: Besvar 3 av 4 oppgaver (Oppgavene teller likt) ------------------------------- Det forekommer av og til spørsmål om bruk av eksamensbesvarelser til undervisnings- og læringsformål. Universitetet trenger kandidatens tillatelse til at besvarelsen kan benyttes til dette. Besvarelsen vil være anonym. Tillater du at din eksamensbesvarelse blir brukt til slikt formål? Velg et alternativ Ja Nei Besvart. Knytte håndtegninger til denne oppgaven? Bruk følgende kode: 0 0 4 5 4 7 2 1 ME-400, oppgaver (velg tre av de fire oppgavene) Oppgave 1: På hvilken måte er caseutvelgelse sentralt i caseanalyse? Oppgave 2: Drøft styrker og svakheter ved bruk av de komparative metodene «most-similar system design» og «most-different system design»? Kan bruk av Bolsk metode bøte på noen av svakhetene? Oppgave 3: I tabell 1 (se øverst) vises resultatet fra en regresjonsanalyse. Data er hentet fra «European Social Survey» (ESS). Utvalget består av nærmere 50 000 individer fra 31 europeiske land. Formålet med analysen er å forklare variasjon i folks plassering langs en politisk venstre-høyre skala. Følgende variabler er inkludert i analysen: 1/6
Avhengig variabel: - Plassering venstre-høyre skala: Målt på en skala fra 0 til 10, der 0 er helt til venstre og 10 er helt til høyre. Uavhengige variabler: - Kjønn: 0=Mann, 1=Kvinne - Alder: Oppgitt alder - Interesse for politikk: Målt på en skala fra 1 til 4, der 1 er veldig interessert og 4 er ikke interessert i det hele tatt. - Tilfredshet med eget lands økonomiske situasjon: Målt på en skala fra 0 til 10, der 0 er ekstremt utilfreds og 10 er ekstremt tilfreds. - Tillit til eget lands politikere: Målt på en skala fra 0 til 10, der 0 er null tillit og 10 er full tillit. a) Tolk resultatet fra analysen b) Hva er hensikten med å beregne signifikansverdi? c) På hvilken måte kan det være problematisk å analysere sammenhenger på tvers av mange land? Oppgave 4: Du skal undersøke nærmere om det er forskjeller mellom innbyggere fra tre ulike land hva angår plassering på venstre-høyre skalaen. Hvordan vil du undersøke dette? Og, hva må til for at eventuelle forskjeller mellom land skal være signifikante? Skriv ditt svar her... Jeg har valgt å besvare oppgave 2, 3 og 4. Oppgave 2: Komparativ metode anses som en gyllen middelvei mellom case-studier (én enhet) og studier med mange enheter. Som regel studerer man mellom 2 og 20 case. Hensikten er å sette casene opp mot hverandre og finne likheter og ulikheter mellom utvalget slik at man kan forklare et fenomen. Komparativ metode blir gjerne ansett som en analyse man bør ta i bruk dersom det er for få enheter å forske på til at man kan gjøre en god statistisk analyse. Dersom det er et middels antall enheter er det gjerne hensiktsmessig å gjøre en blanding av metodene, altså at forskningsdesignet inneholder både kvantitativ metode som skal ta for seg statistiskanalyse, og samtidig komparativ metode som går litt dypere inn i materien. Innenfor komparativ metode finnes det en rekke ulike teknikker for å velge ut- og studere casene man skal forske på. De to vansligste metodene kalles 'forskjellsmetoden' (most-similar systems design) og 'samsvarsmetoden' (most-different systems design). Den første metoden kalles for forskjellmetoden - most-similar systems design på engelsk. I denne metoden velger man ut case (gjerne land) som har så like verdier som mulig, på flest mulig uavhengige variabler, men som har ulik verdi på den avhengige variabelen. Logikken her er at alle de uavhengige variablene som casene scorer likt på kan utelukkes ettersom de skiller seg fra hverandre på fenomenet som skal studeres. Likhet kan ikke forklare ulikhet. Casene skal i utgangspunkt kun ha like verdier på et lite antall uavhengige variabler. Disse variablene, så lenge de anses som avgjørende for fenomenet som studeres, blir mulige forklaringsvariabler. Den andre metoden kalles for samsvarsmetoden - most-different systems design på engelsk. Med denne metoden velger man ut case som er så ulike som mulig men som likevel scorer likt på den avhengige variabelen. Alle variablene de har ulik verdi på, elimineres automatisk som mulige forklaringsvariabler. Logikken er at ettersom casene er så forskjellige er det få mulige forklaringer på fenomenet som skal forklares. Et eksempel at man sammenligner Tyskland og Rwanda når man skal forstå og forklare folkemord. Det finnes flere fordeler ved bruk av forksjells- og samsvarsmetodene: blant annet gjør disse metodene det mulig å gå i dybden på et knippe utvalgte case slik at vi kan forstå kausale mekanismer. De er dermed metoder som ofte kan brukes for å studere sjeldne fenomener som vi i utgangspunktet vet lite om. Samtidig kan de gå i dybden på, og sammenligne, såppas mange énheter slik at de blir mer generaliserbare enn hva som for eksempel er tilfellet i case-studier der man kun studerer én enhet. Til tross for at det finnes fordeler med forskjells- og samsvarsmetodene, har de fått en del kritikk: En utfordring med samfunnsvitenskapen generelt, også med disse metodene, er at man får mange variabler. Logikken i forskjellsmetoden for eksempel er at det skal være få variabler som skiller casene fra hverandre. Men er det mulig å velge to land som er så like (forskjellsmetoden) at det kun er noen få variabler som skiller seg fra hverandre? Det vil ihvertfall være utfordrende, og man vil i såfall kun ha et lite antall case å velge imellom. Jeg antar at det også er vanskelig å finne land som er såppas ulike at de 2/6
eneste likhetene de har er variabler som forklarer et spesifikt fenomen. Man sitter altså igjen med et stort antall variable som er mulige forklaringsvariabler. Det hevdes videre at problemer med mange variabler forsterkes ved at det er få enheter som skal forskes på. Det er vanskelig å kontrollere for alle mulige forklaringsvariabler. Hvordan kan vi vite sikkert at de variablene vi finner er de viktigste? Det hevdes også at et lite utvalg case, slik som det gjerne er i forskjells- og samsvarsmetoden, gjør det vanskelig å generalisere utover casene man forsker på. For eksempel: dersom man skal sammenligne Norge og Sverige for å forstå hvorfor noen land sa ja til EU og noen land sa nei (forskjellsmetoden). Kan man generalisere utover de funnene som gjøres her for å forklare årsaker til EU-medlemskap? Eller forklarer man kun tilfellet i Norge og Sverige? Dersom man ville lagt til en ekstra case er det stor sannsynlighet for at hele hypotesen vil falsifiseres. Samsvars- og forksjellsmetoden anses som deterministiske i den forstand at et avvikende case vil gjøre alle konklusjonene man har usikre. Eksempel (samsvarsmetoden): man forsker på to ulike land A og B for å forstå hva som fører til økonomisk utvikling. Både A og B har høy økonomisk utvikling, og begge landene har også et høyt utdanningsnivå. Ettersom de to landene har like verdier på variabelen utdanningsnivå, blir dette forklaringsvariabelen på økonomisk utvikling. Men dersom man legger til land C som også har høy økonomisk utvikling, men som har lavt utdanningsnivå, så blir hele forklaringen forkastet. Siden dette landet også hadde høy økonomisk utvikling kan ikke utdanningsnivå være en forklaring. Samsvars- og forskjellsmetoden kritiseres også for å ta høyde for at det kun finnes én årsak eller et knippe årsaker for et spesifikt utfall eller fenomen. De tar altså ikke høyde for at samme utfall kan ha ulike årsaker, og de tar altså ikke høyde for sammensatte årsaker. Bolsk metode presenteres som en løsning på den sistnevnte kritikken, altså som en metode som kan ta for seg sammensatte årsaker og komplisert kausalitet. Bolsk metode tar for seg både nødvendige og tilstrekkelige årsaker. Nødvendige årsaker er årsaker som må være til stede for å produsere et utfall. Tilstrekkelige årsaker er årsaker som alene kan produsere et utfall. I følge bolsk metode finnes det tre typer sammensatte årsaker: 1. Kontekstuelle 2. Kombinatoriske 3. Multiple Blant annet tas det i bolsk metode høyde for at én årsak ikke kan forklare et fenomen. Konteksten vil alltid spille inn og påvirke effekten av årsaken. Videre tar bolsk metode høyde for at både tilstedeværelsen av årsaker og fraværet av årsaker forklarer effekten av et fenomen. Det er kombinasjonen av tilstedeværelse og fraværet som forårsaker utfallet. Tilslutt regnes det inn i bolsk metode at det kan være flere ulike kombinasjoner av årsaker som kan føre til samme utfall. Dersom man for eksempel skal forklare økonomisk utvikling i land, så tar bolsk metode høyde for at det kan finnes ulike årsaker til at land opplever økonomisk utvikling, ikke et sett årsaker på tvers av alle tilfeller. På denne måten fungere bolsk metode som en løsning på to problemer ved forskjells- og samsvarsmetodene: Man blir ikke nødt til å forkaste en forklaring kun fordi en ekstra case gir et annet utslag. Med utgangspunkt i eksempelt om økonomisk utvikling antas det altså at et avvikende case kun har oppnådd økonomisk utvikling på en annen måte enn hva som var tilfellet i de foregående casene. Man blir ikke nødt til å forkaste hele forklaringen, man legger kun til en annen forklaring. Bolsk metode kan også ta for seg et større antall enheter enn samsvars- og forskjellsmetoden og på den måten kan bolsk metode løse problemet med få enheter og spørsmålet om generalitet. Resultatene kan i større grad forventes å gjelde utenfor utvalget man studerer. Til tross for at bolsk metode gjerne fremmes som en løsning på noen av svakhetene ved samsvars- og forskjellsmetoden, er det ikke alltid hensiktsmessig å bruke denne metoden fremfor de andre. Blant annet kritiseres bolsk metode for å ta for seg sammensatte årsaker og for å kreve maksimal kompleksitet. I virkeligheten er ikke alle fenomener og effekter så kompliserte og sammensatte som det bolsk metode tar høyde for at de er. Videre kan man forvente at man mister noe av dybden fra samsvars- og forskjellsmetoden, når man beveger seg mer på overflaten på tvers av et større antall case. Til syvende og sist er man nødt til å definere hva man skal finne ut av, og vurdere hvilken metode som er best egnet til akkurat det. Oppgave 3: En regresjonsanalyse tar for seg både styrken og retningen på sammenhengen mellom variabler, i tillegg til at den skiller mellom de uavhengige variablene og de avhengige variablene, og viser x sin påvirkningskraft på y. Det finnes både bivariate regresjonanalyser og multivariate regresjonsanalyser. Den bivariate regresjonsanalysen tar kun for seg forholdet mellom én uavhengig og en avhengig variabel. Den multivariate regresjonsanalysen tar for seg flere uavhengige variabler og den avhengige variabelen. Den sistnevnte analysen, som også skal brukes i denne oppgaven, har flere fordeler: Blant annet kan man sammenligne ulike forklaringsvariabler for å se hva som har størst utfall samlett sett på y. a) I denne oppgaven blir jeg bedt om å tolke regresjonsanalysen som skal ta for seg ulike uavhengige variabler 3/6
sin påvirkningskraft på den avhengige variabelen "plassering venstre-høyre skala" i politikken. Verdiene på den avhengige variabelen er på 0 til 10, hvor 0 = helt til venstre i politikken, mens 10 = helt til høyre i politikken. Det er to tall jeg kan lese av i tabellen, og som dermed vil være mitt utgangspunkt for å vurdere på hvilken måte og hvorvidt de gitte uavhengige variablene påvirker plasseringen man har i politikken. Det første jeg kan lese av er det ustandardiserte stigningstallet (B). Dette tallet tar for seg x sin påvirkningskraft på y. Det ustandardiserte stigningstallet tar utgangspunkt i helningskoeffisienten som sier noe om hvor mye y ( den avhengige variabelen) øker eller minker ved én enhets økning i x (den uavhengige variabelen) når de andre uavhengige variablene holdes konstant. Dersom det ustandardiserte stigningstallet = 0 betyr det at den uavhengige variabelen ikke har noen effekt på den avhengige variabelen. Dersom tallet er positivt betyr det at en økning i den uavhengige variabelen fører til en økning i den avhengige variabelen. X og y beveger seg altså i samme retning. Dersom tallet er negativt betyr det at en økning i den uavhengige variabelen fører til en nedgang i den avhengige variabelen. X og y beveger seg altså i motsatt retning. Her er det viktig å være klar over hvordan verdiene på de ulike variablene er målt. Det neste målet jeg kan lese av i tabellen tar for seg signifikansverdien også kalt p-verdien (Sig.). Samfunnsvitenskap handler i stor grad om hypotesetesting. Vi skal utforme en hypotese som vi senere skal teste og vurdere. I dette tilfellet er hypotesen i testen at det er en sammenheng mellom hver av de uavhengige variablene og den avhengige variabelen og at x har en effekt på y. Denne hypotesen, som antar at det finnes en sammenheng, kalles for den alternative hypotesen. Nullhypotesen sier det motsatte, at det ikke finnes en reell sammenheng. Nullhypotesen utgjør en grunnleggende tvil som burde prege all forskning, og nullhypotesen er dermed vanskelig å forkaste. Når vi altså skal vurdere resultatene fra regresjonsanalysen, er vi nødt til å vurdere hvorvidt nullhypotesen skal beholdes eller om vi forkaster nullhypotesen og beholder den alternative hypotesen som sier at det er en sammenheng. I et utvalg er det alltid en viss fare for å forkaste en nullhypotese selv om den egentlig er korrekt. Vi må dermed fastsette en kritisk verdi, et signifikansnivå som avgjør i hvor stor grad vi er villige til å forkaste nullhypotesen på feil grunnlag. I samfunnsvitenskapen er det vanlig å fastsette signifikansnivået på 1, 5 eller 10. I denne oppgaven setter jeg signifikansnivået på 5. Det vil si at jeg er villig til å forkaste en nullhypotese selv om den er korrekt 5 av 100 ganger. Det er altså 5% sjanse for at jeg forkaster en nullhypotese på feil grunnlag. Jeg kan lese av p-verdien i tabellen (Sig.) for å vurdere hvorvidt resultatene er statistisk signifikante eller ikke. Dersom p-verdien er på 0,05 eller lavere kan jeg anse resultatene som signifikante. Dersom p-verdien er høyere enn 0,05 anses ikke resultatene som signifikante og jeg beholder nullhypotesen: at det ikke er en sammenheng mellom utvalget og populasjonen. I praksis vurderer jeg hvorvidt resultatene fra utvalget jeg har (50 000 individer i dette tilfellet) er reelle eller tilfeldige, og hvorvidt vi kan forvente at utvalget representerer populasjonen den kommer fra (alle enhetene fra de 31 europeiske landene). Hensikten med signifikansnivået er altså å vurdere hvorvidt resultatene i regresjonsanalysen kan forventes at gjelder i virkeligheten (dette besvarer oppgave 3b). Den første uavhengige variabelen som jeg leser av er "kjønn". Her ble det oppgitt at mann er gitt verdien 0 og kvinne er gitt verdien 1. Spørsmålet er i utgangspunktet hvorvidt kjønn har noe å si på hvor på den politiske skalen man ligger. Det ustandardiserte stigningtallet er på -0,16. Det vil si at kvinner generelt sett ligger litt lengre på venstre side av skalaen i politikken enn hva som er tilfellet for menn. P-verdien (signifikansnivået) er på 0,00 den er altså innenfor den kritiske verdien på 5 og resultatene anses som reelle. Det er en sammenheng mellom kjønn og hvor man ligger på den politiske skalaen. Den neste uavhengige variabelen jeg leser av er "alder". Her er verdiene den alderen man har oppført i spørreundersøkelsen. Det vil si at jo høyere alder jo høyere verdi er man gitt på den avhengige variabelen. Jeg skal altså vurdere hvorvidt alder har noe å si på hvor på den politiske skalaen man ligger. Det ustandardiserte stigningstallet er på 0,09. Det vil si at man beveger seg til en viss grad mot høyre på den politiske skalaen jo eldre man blir. Likevel er dette tallet såpas lavt at stigningen kan regnes som svak. P-verdien er på 0,03. Den er altså innenfor den kritiske verdien på hva som anses som reelle sammenhenger. Statistisk sett kan man dermed konkludere med at for hver år man blir eldre kan det forventes at man til en viss grad beveger seg mot høyre i politikken. Resultatet viser ihvertfall at slik er tilfellet i dag: den eldre befolkningen er i litt større grad representert på høyre side av den politiske skalen. Den neste uavhengige variabelen jeg leser av er "interesse for politikk". Her er det viktig å merke seg at den laveste verdien representerer høyest interesse for politikk, mens den høyeste verdien representerer lavest interesse for politikk. Variabelen er nemlig målt på en skala fra 1 til 4, hvor 1 = veldig interessert, mens 4 = ikke interessert i det hele tatt. Det ustandardiserte stigningstallet er på 0,18. Det vil si at individer som er lite interessert i politikk ligger lenger på høyre siden av skalen enn hva som er tilfellet for individer som er svært interessert i politikk. Jo mindre interessert du er, jo mer beveger du deg mot høyre side på politikken. P-verdien i tabeller er på 0,00. Det vil si at resultatene fra utvalget også kan forventes at gjelder i virkeligheten. Det er altså en sammenheng mellom grad av interesse for politikk og hvor på den politiske skalaen man ligger. Det er en sammenheng mellom den uavhengige variabelen og den avhengige variabelen, og vi forkaster nullhypotesen. Videre leser jeg av den uavhengige variabelen "tilfredshet med eget lands økonomiske situasjon". Denne variabelen er målt på en skala fra 0 til 10, hvor 0 = ekstremt utilfreds, og 10 = ekstremt tilfreds. Her er det 4/6
ustandardiserte stigningstallet på 0,06. Det vil si at dersom du er tilfreds med landets økonomi er det sannsynlig at du er litt lengre på høyre siden av den politiske skalaen, enn hva som er tilfellet om du er lite tilfreds med landets økonomi. Det vil si at dersom den uavhengige variabelen øker, at man altså blir mer tilfreds med landets økonomi, så antas det at du beveger deg til en viss grad mot høyre i politikken. P-verdien er på 0,08. Det vil si p-verdien ligger over det fastsatte signifikansnivået på 5. Til tross for at vi ser en sammenheng mellom x og y i utvalget betyr dette at vi ikke kan forvente at sammenhengen gjelder i populasjonen. Vi beholder nullhypotesen som sier at det ikke finnes en sammenheng. Den siste uavhengige variabelen i analysen er "tillit til eget lands politikere". Variabelen er målt på en skala fra 0 til 10, der 0 = null tillit, og 10 = full tillit. Det ustandardiserte stigningstallet er på -0,47. Det vil si at dersom et individs tillit til politikere i landet øker, er det forventet at individet beveger seg mot venstre på den politiske skalaen. X har en negativ påvirkning på y. Altså når x øker synker y. P-verdien er på 0,00. Det vil si at sammenhengen er reell. Hvorvidt man har tillitt til politikere i landet eller ikke har en reell effekt på hvor man ligger på den politiske skalaen. Vi forkaster altså nullhypotesen. b) For å analysere tabellen jeg ble gitt, tok jeg utgangspunkt i, og forklarte, de to tallene/målene man kunne lese av i tabellen. Den ene var ustandardiserte stigningstall som altså målte x sin påvirkning på y. Den andre var signifikansverdien, som beregnet hvorvidt det var sannsynlig at resultatene var reelle og ikke tilfeldige, og om utvalget representerte populasjonen den kom fra. Jeg valgte dermed å forklare hensikten med signifikansverdien i oppgave a, før jeg leste av tabellen. c) Utvalget fra regresjonsanalysen var på 50 000 enheter fra 31 europeiske land. Med utgangspunkt i dette utvalget skulle vi vurdere ulike variablers effekt på politisk plassering fra venstre til høyre. Resultatene skal da i utgangspunktet evne å gi en forklaring på hva som påvirker politisk tilhørighet helt generelt, på tvers av de ulike landene. Utfordringen er at det systematiserte begrepet politisk tilhørighet, ikke nødvendigvis kan måles likt på tvers av ulike land. For eksempel er det ikke nødvendigvis like mange politiske partier i de ulike landene, og det er ikke nødvendigvis like åpenbart hvor på skalaen man kan plassere de forskjellige partiene i landet. I undersøkelsen har vi studert 31 europeiske land. Det kan hende at noen land kun har to politiske partier, en på venstre og en på høyre. Hvordan kan man da måle hvor på den venstre siden av skalaen eller på den høyre siden av skalaen man skal plasseres (0-10), dersom det i utgangspunktet kun er to alternativer? Andre land har muligens en rekke ulike politiske partier og de kan enklere plasserer på en venstre til høyre skala. Likevel er det ikke nødvendigvis så stor forskjell mellom de ulike politiske partiene i landet. Kanskje alle partiene i et land for eksempel må plasseres til venstre for midten av skalaen, mens det ikke finnes noen politiske partier som er særlig til høyre på skalaen? Poenget mitt er at et systematisert begrep som "politisk plassering" i utgangspunktet kan bety ulike ting i de forskjellige landene som sammenlignes. Det gjør at funnene i hver av landene ikke nødvendigvis bør generaliserers, de bør holdes innenfor konteksten hvor de gir mening. Når man begynner å analysere sammenhenger på tvers av alle de 31 landene er det fare for at man måler noe annet enn hva man ønsket. Det blir altså et spørsmål om valdiditet: måles det som man ønsker å måle? Det kan jo hende at det viser seg at målene er valdie, og at det ikke er et problem med ulike politiske skalaer i de ulike landene. Altså at resultatene kan sammenstilles. Likevel er det problematisk at man ikke blir klar over ulikheter mellom landene. Dersom man hadde sett på hvert land hver for seg kunne resultatene på de ustandardiserte stigningstallene vært helt annerledes. Kanskje det generelle resultatene ikke matchet individuelle resultater, og at for eksempel kjønn viste motsatte resultater i et utvalgt land. Dette får vi ikke et bilde av når vi tar med alle landene. Verdidimensjoner skiller seg gjerne fra land til land, mye på grunn av kultur og andre kontekstuelle betingelser. Dermed kan det være interessant å heller studere hvert land hver for seg, og senere kanskje sammenligne resultatene for å vurdere hvorvidt det er forskjeller mellom landene. Oppgave 4: En One-Way ANOVA-analyse er en løsning på det siste problemet som ble nevnt ovenfor. ANOVA står for analysis of variance og studerer variasjon. Denne analysen gjør det mulig for oss å studere forskjeller mellom ulike grupper i lys av én avhengig variabel. Målet er å vurdere hvorvidt de utvalgte gruppene scorer signifikant forskjellig på verdi på den avhengige variabelen. Dersom det er høyere varians mellom gruppene enn innen de ulike gruppene anser vi forskjellene som statistisk signifikante. Denne analysen gjør det altså mulig for oss å studere forskjeller mellom tre utvalgte land hva angår plassering på venstre-høyre skalaen. Det første steget jeg vil ta for å undersøke forskjeller mellom landene hva angår plassering på venstre-høyre skalaen i politikken, er å studere landenes gjennomsnittsverdier. I en ANOVA-analyse kan vi lese av en tabell som viser landenes gjennomsnittskonfidensintervall. Konfidensintervallverdiene viser intervallet som med 95% sannsynlighet viser landets gjennomsnittverdi på den avhengige variabelen. Den viser altså hvor enhetene fra det gitte landet i gjennomsnitt er plassert på den politiske venstre-høyre skalaen. For å sammenligne de utvalgte landene leser vi av øvre og nedre konfidensintervallverdier. Dersom noen av landene har 5/6
overlappende gjennomsnittsverdier kan man anta at de gjennomsnittlig sett ligger relativt likt på den politiske skalaen. Med utgangspunkt i dette kan man forvente at landene som overlapper ikke er særlig ulike hva gjelder den avhengige variabelen. Dette tar ikke for seg hele bildet, og for å vurdere hvorvidt det er større forskjeller mellom landene enn innen hvert av landene, og om det dermed er signifikante forskjeller, må vi gå dypere enn å se på gjennomsnittverdier. En annen tabell som kommer opp i ANOVA-analysen kan vise oss landenes 'innenlandsvarians' og 'mellomlandsvarians' hva gjelder plassering på den politiske venstre-høyre skalaen. Her tar man utgangspunkt i den såkalte "F-verdien". F-verdien er et resultat av en utregning av variansen både innad i grupper og mellom grupper. For å komme frem til F-verdien, og dermed å vurdere hvorvidt det er større mellomlandsvarians enn innenlandsvarians, må man finne kvadratsummen i landene og kvadratsummen mellom landene. Kvadratsummen = varians 2. Tallene vi får er ikke standardiserte og kan dermed ikke sammenlignes. For å gjøre kvadratsummene sammenlignbare må vi dele kvadratsummen mellom landene på antall frihetsgrader: antall enheter minus 1 (dette tilfellet, siden det er tre land, blir det 3-1) og kvadratsummen innen landene på antall frihetsgrader (alle enhetene som er med i undersøkelsen fra de tre landene - 1). Da får vi det som kalles gjennomsnittlige kvadratsummer. F-verdien er et resultat av gjennomsnittlige kvadratsummer mellom landene delt på gjennomsnittlige kvadratsummer innen landene. Dersom F-verdien er på 2 eller mer kan vi konkludere med at det er signifikante forskjeller mellom de ulike landene. Tilslutt, for å vurdere hvorvidt funnene er reelle og ikke tilfeldige, kjører vi en signifikanstest på lik som nevnt i oppgave 3. Med et signifikansnivå på 5 anser vi også her resultatene som signifikante dersom p-verdien i tabellen er på 0,05 eller lavere. ANOVA-analysen gjør det altså mulig for oss å vurdere hvorvidt det er forskjeller mellom innbyggere fra ulike land hva gjelder den avhengige variabelen "plassering på den politiske venstre-høyre skalaen". Vi kan både se om de scorer gjennomsnittlig ulikt på plassering på skalaen (ved hjelp av konfidensintervallverdiene) og vi kan videre vurdere om forskjellene mellom landene er signifikante (ved hjelp av F-verdien og signifikanstesting). Besvart. Knytte håndtegninger til denne oppgaven? Bruk følgende kode: 0 0 4 5 4 7 3 6/6