Visualisering av statistikk Fra tabell til diagram

Like dokumenter
Notater. Jan Erik Kristiansen. Visualisering av statistikk Fra tabell til diagram. 2002/47 Notater 2002

Øgrim Bakken Pettersen Skrindo Dypbukt Mustaparta Thorstensen Thorstensen. Digitalt verktøy for Sigma 2P. Microsoft Excel

Drepte i vegtrafikken 3. kvartal 2015

Manual til Excel. For mellomtrinnet. Inger Nygjelten Bakke ELEKTRONISK UNDERVISNINGSFORLAG AS

3.2 Misbruk i media KAPITTEL 3 31

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Manual til Excel. For ungdomstrinnet ELEKTRONISK UNDERVISNINGSFORLAG AS

Bruk SUMMER-funksjonen i formelen i G9. Oppgave 14. H. Aschehoug & Co Side 1

Utviklingen i uførepensjon, 30. september 2011 Notatet er skrevet av

Utviklingen i antall uførepensjonister, 31. mars 2011 Notatet er skrevet av

Øgrim Bakken Pettersen Skrindo Dypbukt Mustaparta Thorstensen Thorstensen. Digitalt verktøy for Sigma 2P. Microsoft Excel

Utvidet brukerveiledning

Drepte i vegtrafikken

Drepte i vegtrafikken 2. kvartal 2015

Statistikk Oppgaver. Innhold. Statistikk Vg2P

Utvidet brukerveiledning

Statistikknotat Nedsatt arbeidsevne, juni 2014

Komme i gang med programmet Norgeshelsa

Drepte i vegtrafikken

Brukerveiledning for Statistikkbanken

Uførepensjon pr. 31. mars 2010 Notatet er skrevet av Therese Sundell

Statistikk 2P, Prøve 1 løsning

Uføreytelser pr. 30. juni 2008 Notatet er skrevet av Nina Viten,

Drepte i vegtrafikken

Statistikk uførepensjon per 31. desember 2010 Notatet er skrevet av

Grunnleggende brukerveiledning

Tall kan temmes! Om å forstå og formidle statistikk. Jan Erik Kristiansen November 2014

Drepte i vegtrafikken

DEL 1 Uten hjelpemidler

Uførepensjon pr. 30. juni 2010 Notatet er skrevet av Marianne Lindbøl

Elever utforsker symmetri

Grafisk. design. Grafisk

Drepte i vegtrafikken

Uføreytelser pr. 30. september 2008 Notatet er skrevet av Nina Viten,

Uføreytelser pr. 31. desember 2009 Notatet er skrevet av Marianne Næss Lindbøl,

Alkoholvaner blant 40-åringer i Norge. Endring over tid

Fortsatt økning i tilgangen til uføreytelser, men veksten er avtakende

Voksne i grunnskoleopplæring 2018/19

Drepte i vegtrafikken

Grafisk håndbok. Rødt 2019 v 0.9

Drepte i vegtrafikken

Økende antall, avtakende vekst

Statistikk Løsninger. Innhold. Statistikk Vg2P

2P, Statistikk Quiz. Test, 2 Statistikk

Mot normalt: Om gjennomsnitt

Drepte i vegtrafikken

Tall fra Grunnskolens informasjonssystem (GSI) 2012/13

Store forskjeller i innvandreres utdanningsnivå

Eksamen MAT1015 Matematikk 2P Va ren 2014

Utviklingen for andre halvår 2016 Skrevet av Tor Erik Nyberg,

Uføreytelser pr. 30. september 2009 Notatet er skrevet av Nina Viten,

Uføreytelser pr. 30. juni 2009 Notatet er skrevet av Nina Viten,

I dette notatet presenterer vi statistikk om spesialpedagogisk hjelp i barnehagen og spesialundervisning på grunnskolen og i videregående opplæring.

Nedlasting av SCRIBUS og installasjon av programmet

Figur 1. Utviklingen i legemeldt sykefravær i alt og etter kjønn, 2. kvartal kvartal Prosent. 3. kv. 2004

Risiko i veitrafikken

Medlemsutvikling Fagforbundet 1. mai 2016

Uføreytelser pr. 31. mars 2008 Notatet er skrevet av Nina Viten,

Analyse av nasjonale prøver i engelsk 2013

Arbeidsmarkedet nå juni 2006

Ungdom utenfor opplæring og arbeid status fra oppfølgingstjenesten (OT) per 15. juni 2012.

Undersøkelse om frivillig innsats

Analyse av nasjonale prøver i regning 2013

Vedlegg til planprogram. Analyse av trafikkulykker i Trondheim kommune

Næringslivsindeks Hordaland

Skolebidragsindikatorer i videregående skole analyse

1 Grafisk framstilling av datamateriale

Bruk av Google Regneark

Analyse av nasjonale prøver i regning,

Elevtall ungdomsskolen utvidet analyse Nasjonalt senter for fremmedspråk i opplæringen Notat 3/2011 ( )

Hvordan kan statistikk forstås, analyseres og anvendes i planarbeid

Retningslinjer for NSTs grafiske profil.

Eksamen MAT1005 Matematikk 2P-Y Va ren 2014

Om Fylkesprognoser.no. Definisjoner

Karakter 2: 10p Karakter 3: 17p Karakter 4: 23p Karakter 5: 30p Karakter 6: 36p

Resultater fra undersøkelse om Juleøl utført i oktober 2005

FISKERIDIREKTORATETS STATISTIKKBANK

Boligmeteret oktober 2013

Svar på spørsmål til skriftlig besvarelse fra representant Arild Grande nr. 999/2019

Saksframlegg. Sykefraværsrapport for 1. kvartal Trondheim kommune. Arkivsaksnr.: 09/20831

Dere klarer kanskje ikke å komme gjennom hele heftet, men gjør så godt dere kan.

Grunnleggende. Excel

ARBEIDS- OG VELFERDSDIREKTORATET / STATISTIKKSEKSJONEN

2P eksamen våren 2016 løsningsforslag

Om statistikken. Innhold i rapporten Antall og andel av alderspensjonister som mottar gradert alderspensjon. Formål/bestiller.

Om statistikken. Innhold i rapporten Antall og andel av alderspensjonister som mottar gradert alderspensjon. Formål/bestiller.

2P eksamen våren 2018 løsningsforslag

Uføreytelser pr. 31. mars 2009 Notatet er skrevet av Nina Viten,

MARKEDSRAPPORT FRA NHR. MAI OG ÅRETS SÅ LANGT PR

Figur 1. Utviklingen i legemeldt sykefravær i prosent i alt og etter kjønn, 2. kvartal kvartal kv kv.

7 av 10 lærlinger er i arbeid første år etter fagprøven. Bygg- og anleggsteknikk har flest i arbeid.

Om tall for gjennomføring i Skoleporten august 2016

GSI 2014/15: Voksne i grunnskoleopplæring

2P-Y eksamen våren 2018 løsningsforslag

Utviklingen i alderspensjon pr. 30. juni 2013 Notatet er skrevet av: Iren Amundsen, Espen Steinung Dahl, Ole Christian Lien,

Utviklingen i uførepensjon per 31. mars 2012 Notatet er skrevet av

Teknisk mal for oppgaveskriving

Brukerundersøkelse ssb.no 2014

Regning som grunnleggende ferdighet Ny GIV! Akershus. Hefte med praktiske eksempler

Transkript:

2002/47 Notater 2002 >» fl» o z 8 1 Jan Erik Kristiansen Visualisering av statistikk Fra tabell til diagram 1.2 «i re Seksjon for informasjon og publisering Emnegruppe: 00.90

Forord "Tallenes tale" er ikke alltid like tydelig. Ofte taler tallene til oss i form av diagrammer og vår fortolk ning av disse avhenger i stor grad av hvordan de er utformet. Å lyve med statistikk er langt lettere med diagrammer enn med tabeller. Etter hvert som statistikk og diagrammer blir en stadig viktigere del av arbeidsdagen (og hverdagen) for fler og fler, blir det også viktig kjenne til de muligheter og begrens ninger som diagrammer byr på. Det følgende er en elementær innføring og veiledning i bruk og utforming av diagrammer. Mål gruppen er alle som presenterer statistikk i form av diagrammer - som avsendere eller mottakere enten det nå er i semesteroppgaver, rapporter, artikler, lærebøker, aviser, markedsundersøkelser, utredninger/notater, undervisning eller foredrag. Hovedvekten er lagt på en fyldig behandling de vanligste typene diagrammer og ulike varianter av disse. Én type grafiske framstillinger som er mye brukt, men som ikke behandles her, er ulike former for tematiske kart. Heller ikke skjematiske diagrammer, som organisasjonskart, flytdiagrammer 0.1. omtales. Hovedvekten er lagt på diagrammer som har koordinatsystemet som utgangspunkt, dvs. numerisk grafikk. Utvalget av diagrammer er nok tematisk preget av at min arbeidsplass er Statistisk sentralbyrå, seiv om jeg har forsøkt å inkludere eksempler også fra andre områder. Med tanke på en senere revisjon og utvidelse av notatet, tar jeg svært gjerne i mot kommentarer og forslag fra leserne. Oslo, juli 2002 Der x 1

Innhold 1. Innledning: Hvorfor bruke diagrammer? 3 2. Diagrammets arkitektur: Noen generelle prinsipper og regler 7 2.1. Noen tommelfingerregler 7 2.2. Grafisk misvisning 12 2.3. Hva slags diagram skal jeg lage? 14 3. Søylediagrammer: Å sammenlikne grupper 16 3.1. Enkle vertikale søylediagrammer 16 3.2. Grupperte søylediagrammer: 17 3.3. Sammensatte søylediagrammer 18 3.4. Horisontale søylediagrammer 19 4. Linjediagram: Tid og mengde 21 4.1. Enkle linjediagrammer 21 4.2. Multiple linjediagrammer 22 4.3. Gruppert linjediagram 23 4.4. Arealdiagram 4.5. To verdiakser 23 24 4.6. Indeksdiagram 25 4.7. Glatting: Glidende gjennomsnitt og trendlinjer 4.8. Delårsdata 25 26 4.9. Kumulative linjediagrammer 26 5. Sektordiagram: Prosentfordeling 27 5.1. Én enkelt fordeling 27 5.2. Sammenlikne fordelinger? 5.3. Varianter 28 28 6. Andre typer diagrammer 30 6.1. Kombinasjonsdiagrammer 30 6.2. Punktdiagram 31 6.3. Mm - maks diagram (variasjonsdiagram) 33 6.4. Flate- og volumdiagram 33 6.5. Rangdiagram 34 6.6. Z-diagram 34 6.7. Radar-diagram 35 6.8. Diagram-matrise 35 7. Kort om bruk av farger 36 7.1. Hvilke farger? 36 7.2. Fargerikt fellesskap? 37 7.3. Farger hvor? 37 Litteratur 38 De sist utgitte publikasjonene i serien Notater 39 2

1. Innledning: Hvorfor bruke diagrammer? Diagrammer og andre former for grafiske framstillinger eller illustrasjoner brukes i dag i økende grad både i lærebøker, fagbøker, brosjyrer, tidsskrifter og årsmeldinger, men også i aviser, på TV og Inter nert. Særlig er avisenes økonomi- og næringslivssider fulle av diagrammer, hvor renteendringer, oljepris, aksjekurser og børsutvikling framstilles grafisk. Også i utredninger, undervisning, presenta sjoner og foredrag blir tall og statistikk i økende grad presentert i form av diagrammer. Men diagrammene har også fått nye bruksområder: På strømreg ningen forsøker elektrisitetsleverandøren på en pedagogisk måte å tydeliggjøre strømforbruket mitt ved hjelp av et søylediagram (dette eksemplet er fra Viken Energinetts faktura, men de fleste strømleverandørene bruker liknende diagrammer). Forrige B Siste Jul OM Jan Apr Sep De* Mar Jun Også i avisenes værvarsler kan diagrammer benyttes for å presentere temperaturer og nedbør. Eksemplet her er fra danske Jyllands-Posten: FEMDØGNSPROGNOSE TIRSDAG ONSDAG TORSDAG FREDAG LORDAG 20 Q 20 10 22 SEI 25 ~ B 23 I tillegg finner vi også stadig oftere diagrammer i annonser (for eksem pel for aksjefond o.l.), mens eksemplet til høyre viser hvordan et stilisert diagram kan brukes som logo. iiife<ihlitlli*tililhftlltltl SKAGEN Fondene Denne økende bruken av diagrammer skyldes nok delvis en økt interesse for og bruk av ulike typer statistikk. Men utviklingen har nok også for en stor del sammenheng med tilgjengeligheten av grafiske dataprogrammer 1, som gjør det langt enklere å framstille ulike diagrammer. Og som de fleste andre tekniske nyvinninger kan også disse programmene misbrukes. Resultatet blir gjerne "fikse" diagram mer overlesset med effekter, hvor oljefat eller kronestykker stables på en måte som gjør at informasjonen drukner i grafisk støy. Eksemplene til høyre er fra Aftenposten for noen år tilbake (de lager heldigvis ikke så mange diagrammer av denne typen lenger). Diagrammene må vel nær mest betraktes som illustrerte tabeller, og de er mer forvir rende enn informative. Dette Forbruk av elektrisk kjgh Nedgang *~*^ Innenlandsk bruttoforbruk -ÆftaS.. i parafin- T^^^^^^^^T^fep* ^«l 1990-83637 ( '; produksjonen I j-e (itonnl F^P^^B er eksempler på det Tufte (1983)kaller ll chartjunk". Kikle: SSB III.: JohnA. Fosse» Kilrte SSfl 111. John-A. FFosseio 3

Her er det derfor fristende å gå noen år tilbake i tiden og vise et par eksempler fra den gang diagram mer ble tegnet for hand. Det første (nedenfor til venstre) er fra 1786 og er signert William Playfair. Diagrammet til høyre er fra Nederland (ca. 1937). Poenget med disse historiske eksemplene er å vise at moderne datateknologi verken er en nødvendig eller tilstrekkelig forutsetning for å lage gode, lesbare, elegante og informative diagrammer. b ««-i> «nd Irapnru w a».i hm Dksmakk <u NOKW.Vtf ftwn rr«m taifoa Titt &**m /liv u./. *v/ ia» IJmj. utr KySe h.m.l hm <«* /.AJfVW m. A Men hvorfor i det hele tatt bruke diagrammer, når en tabell i de fleste tilfeller gir langt mer informa sjon? Svaret er: Nettopp derfor! Tabeller gir ikke bare mer informasjon, men også ofte alt for mye. Særlig i store og omfattende tabeller kan det være vanskelig å se skogen for bare tall: Informasjonen drukner lett i numerisk støy. Et diagram derimot, gir et visuelt, helhetlig inntrykk som gjør det lettere raskt å oppfatte for eksempel hovedtendenser i et utviklingsforløp, forskjeller mellom grupper eller sammenhenger mellom ulike fenomener. Diagrammet demonstrerer et poeng! Ta for eksempel følgende ( tive) tal 1985 1986 1987 1988 1989 1990 1991 1992 1993 Menn: 34 37 39 40 46 48 46 45 45 Kvinner: 28 29 33 38 44 49 51 54 56 Denne tabellen viser en rekke ting, bl.a.: at andelen har økt både for menn og kvinner i perioden, men mest for kvinner (henholdsvis 11 og 28 prosentpoeng) at andelen menn i årene 1985-87 var klart høyere enn andelen kvinner at andelen menn og kvinner i 1988-90 var omtrent det samme at andelen kvinner passerte andelen menn i 1990 og siden har vært høyere, og endelig at denne forskjellen er økende. Alt dette framgår selvfølgelig av tabellen, men det kreves relativt inngående studier av tallene for å få med seg alt dette (og dette er en liten tabell!). Diagrammet derimot, gir på et øyeblikk et umiddelbart visuelt inntrykk av og overblikk over hovedtendensen i utviklingen, og er derfor spesielt godt egnet til bruk i mer populære framstillinger og presentasjoner rettet mot et publikum som ikke er trenet i å lese og bruke tabeller. Prosent 60y 1985 1987 1989 1991 1993 4

Ett annet eksempel på diagrammets komprimerende funksjon: Tabellen nedenfor viser prosentandelen jenter som hvert år har fatt fornavnet Anne i perioden 1870-1999. Ar: Pst Ar: Pst Ar: Pst.: År: Pst Ar: Pst Ar: Pst. L,UJ 936 2,49 1958 5,51 1,94 1871 3,06 1893 1,36 1915 1,06 937 2,96 1959 5,45 1981 2,24 1872 3,21 1894 1,36 1916 1,01 938 2,83 1960 5,35 1982 1,82 1873 3,23 1895 1,36 1917 0,99 939 2,96 1961 5,17 1983 1,79 1874 3,22 1896 1,36 1918 1,13 940 3,46 1962 5,10 1984 1,61 1875 3,11 1897 1,17 1919 1,12 941 3,57 1963 5,12 1985 1,45 1876 2,67 1898 1,10 1920 1,16 942 3,49 1964 4,80 1986 1,43 1877 2,53 1899 1,13 1921 1,24 943 4,19 1965 4,91 1987 1,27 1878 2,20 1900 1,11 1922 1,31 944 4,11 1966 4,58 1988 1,16 1879 2,48 1901 1,03 1923 1,32 945 4,20 1967 4,32 1989 1,06 1880 1,97 1902 1,09 1924 1,42 946 4,32 1968 3,97 1990 1,08 1881 2,07 1903 1,05 1925 1,36 947 4,18 1969 3,64 1991 0,98 1882 1,80 1904 0,96 1926 1,40 1948 4,46 1970 3,19 1992 0,87 1883 2,22 1905 0,93 1927 1,71 1949 4,50 1971 2,92 1993 0,90 1884 1,95 1906 0,94 1928 1,61 1950 4,74 1972 2,67 1994 0,78 1885 2,12 1907 0,97 1929 1,55 1951 4,77 1973 2,66 1995 0,81 1886 1,82 1908 0,91 1930 1,83 1952 5,03 1974 2,45 1996 0,83 1887 1,71 1909 1,04 1931 1,93 1953 5,00 1975 2,29 1997 0,75 1888 1,84 1910 0,99 1932 1,95 1954 4,97 1976 2,24 1998 0,62 1889 1,70 1911 0,97 1933 2,17 1955 5,22 1977 2,06 1999 0,56 1890 1,85 1912 0,94 1934 2,11 I956 4,97 1978 2,19 1891 1,50 1913 1,01 1935 2,43 1957 5,39 1979 2,16 Tabellen inneholder 130 datapunkter eller observasjoner og det er svært vanskelig å danne seg noe klart bilde av Annes "vekst og fall" bare ved å studere tallrekkene. I figuren derimot, framstår bølgebevegelsen tydelig. Figuren er intuitivt forståelig og krever ingen kunnskaper om statistikk eller prosentregning. I tillegg er diagrammet langt mindre plasskrevende (det har større datatetthet) enn tabellen og denne komprimeringsfordelen blir selvfølgelig større jo flere tall rekker som skal presenteres eller sammenliknes. Dette ser vi tydelig hvis vi legger til ytterligere en dataserie. Prosent 6 0 1870 1890 1910 1930 1950 1970 1990 Prosent 6 Dette eksemplet illustrerer også en annen viktig funksjon; 3 nemlig den pedagogiske: Et diagram sier ofte mer enn tusen 2 tall. Og visuelt framstilte sammenhenger eller forløp er ikke 1 bare lettere å oppfatte, de er også langt lettere å huske enn 0 1870 variasjoner i én eller flere tallrekker. (Jeg kan her nevne at jeg sammen med en kollega i 1998 utga en bok som nesten i sin 1890 1910 1930 1950 1970 1990 helhet besto av diagrammer (Fornavn i Norge - Navnemoter og motenavn. Ad Notam Gyldendal). Boka var vel ingen bestselger, men solgte rimelig bra. Poenget her er at en slik bok neppe kunne vært laget med tabeller i stedet for diagrammer; både fordi den da ville blitt 5-6 ganger så stor og fordi bare et lite fåtall spesielt interessert da ville funnet den interessant). Diagrammet gir altså et raskt helhetsinntrykk og overblikk. Men samtidig gir det nødvendigvis et forenklet bilde hvor detaljene går tapt, idet man sjelden kan avlese nøyaktige verdier: Man kan f.eks. ikke i diagrammet ovenfor se om andelen som fikk nzvnetanne i 1980 egentlig er 1,9, 2,0 eller 2,1 prosent (og slett ikke at det er 1,94). Derfor: I den grad det er viktig at leseren kan avlese nøyaktige verdier (f.eks. med tanke på videre bearbeiding), bør man bruke tabeller i stedet. Diagrammer er altså først og fremst egnet til en mer "populær" presentasjon av statistikk, hvor detalj er og desimaler er mindre viktig. I formidling av statistikk og forskning som primært er rettet mot kolleger og forsk- 5 4 3 2 1 5 4 5

ningsmiljøer (som seiv ønsker å bearbeide dataene) vil derfor tabeller ofte være en bedre måte å pre sentere tallene på (Eventuelt kan tallene gjengis i et eget tabellvedlegg). En annen grunn til å bruke grafiske framstillinger, er at enkelte typer informasjon er vanskelig å fram stille i tabeller eller tekst. Ett eksempel er tematiske kart med geografisk informasjon, f.eks. bo settingskart. Endelig kan figurer/diagrammer - på samme måte som bilder eller andre illustrasjoner - fungere som interessevekkende visuelle blikkfang og/eller grafiske elementer som myker opp teksten og gjør den mer innbydende og lettere å lese. Men først og fremst er altså grafiske framstillinger et effektivt hjelpemiddelfor informasjonsformidling og eventuelle dekorative eller illustrerende funksjoner bør være underordnet den informative funk sjonen. Diagrammer bør ikke brukes som fyllstoff, men skal først og fremst bidra til å understreke eller fremheve et poeng: en økning/nedgang, en forskjell, en sammenheng eller f.eks. en tendens til mindre eller større forskjeller. Én definisjon av et diagram er: "... en skjematiskframstilling som blir brukt i naturvitenskap, statistikk o.a.for å kunne gi et bilde avforholdet mellom to ellerflere størrelser" (Store norske leksikon, 1996). Det sentrale her er "to eller flere størrelser". Å sammenlikne tall er ~~~~^^^ kjernen i all deskriptiv statistikk - enten den presenteres tabellarisk / / 43% \ eller grafisk - og det gir liten mening å framstille ett enkelt tall V J grafisk. Av og til ser vi imidlertid sektordiagrammer som skal <y illustrere ett tall, for eksempel at skilsmissehyppigheten er 43 pro- =:::== --^yc^ sent. Men også et slik diagram er jo egentlig basert på to tall; nemlig prosentandelen som forventes å bli skilt og andelen som ikke blir det. Et diagram basert på bare ett tall det være seg antallet fødsler eller antallet trafikkulykker i løpet av ett år - er nokså meningsløst. Men seiv med to tall er det bare sjelden grunn til å gjøre bruk av et diagram. Først med tre tall - og dermed tre mulige sammenlikninger - begynner det å bli et behov for å framstille forholdet grafisk. Generelt kan man si at med et økende antall "størrelser" øker også antallet mulige sammenlikninger dramatisk, og dermed også behovet for den forenkling og oversikt som diagrammet tilbyr. 1. En del av de løsningene som diskuteres/anbefales i det følgende kan være avhengig av hvilket verktøy eller program som brukes. Det vanligste programmet er i dag sannsynligvis Microsofts Excel. For mange formål er dette tilfredsstillende, men programmet har sine klare begrensinger. For det første gir ikke Excel brukeren full kontroll over redigeringen, blant annet fordi programmet ikke inneholder en linjal eller andre hjelpemidler for å sette størrelsen på diagrammet. For det andre kan ikke Excel generere Postscript-filer og den eneste måten å få diagrammene inn i Word (eller et annet redigeringsverktøy) blir dermed ved å klippe og lime. Dette fører imidlertid ofte til forvrengninger av enkelte elementer i diagrammet, særlig ras ter/mønster og fonter. Et godt alternativ til Excel er DeltaGraph, fra SPSS (de fleste diagrammene i denne publikasjonen er laget med DeltaGraph). I tidligere versjoner har det bl.a. vært problemer med eksportfunksjonen når programmet kjøres under Windows NT. I den siste versjonen (5.0) synes dette å være løst, i alle fall under Windows 2000. Et tredje alternativ er selvfølgelig Adobes Illustratør. Dette generelle design-verktøyet innholder imidlertid ikke noen regneark-funksjoner. Derimot gir det full kontroll over design og layout av diagrammet. 6

2. Diagrammets arkitektur: Noen generelle prinsipper og regler Det er selvfølgelig vanskelig å gi noen helt generelle regler for hvordan grafiske framstillinger/ dia grammer skal utformes. Dette vil avhenge av flere forhold, blant annet: hvem som er målgruppen (er den vant til å lese diagrammer?) om man lager et arbeidsnotat eller en årsmelding om man hovedsakelig henvender seg til kolleger (spesialister) eller til et større publikum hvilken sammenheng diagrammene står i (publikasjonens generelle layout, om de står alene eller med forklarende tekst) og ikke minst: Hvilket dataprogram som benyttes og hvilke valgmuligheter som finnes. Det finnes likevel noen generelle regler som bør følges. På samme måte som språket har sin gramma tikk, finnes det en slags dia-grammatikk for grafisk framstilling. 2.1. Noen tommelfingerregler Typografiens første bud er: Konsekvens. Når man har valgt en layout med bestemte marger, skrift typer/størrelser, plassering av overskrifter, etc. i en publikasjon, skal denne malen følges nøye. Noe annet skaper et tilfeldig, rotete og slurvete inntrykk. Det samme gjelder også utformingen av diagram mer: Lag en mal eller modell - og følg den! Størrelse Diagrammenes bredde følger ofte av publikasjonens format og layout (1, 2 eller 3 spalter). Men også høyden bør være fast; velg 2 eller 3 ulike høydeformater og bruk disse. Ikke "tøy" diagrammet for å fylle siden eller spalten. En av diagrammets hovedfunksjoner er å forenkle og visuelt presentere hovedtendensen i et tall materiale. Dette betyr at detaljer stort sett er mindre viktig. Sått på spissen kan man si at et diagram som er utformet i samsvar med regelen om enkelhet, bør kunne reduseres til frimerkestørrelse. Som eksempel vises her (i full størrelse) ert av de to frimerkene som ble laget til Statistisk sentralbyrås 100 års jubileum i 1976. Seiv om dette formatet nok for mange formål er i minste laget, er det bare sjelden behov for å la diagrammer oppta en halv (eller hel) side. Det formatet som gjennomgående er brukt i denne publi kasjonen (50 x 35 mm) er, for de fleste formål, stort nok. Unntak finnes selvfølgelig for kompliserte, analytiske diagrammer med mange elemen ter, men hovedregelen er: Smått er godt! (Se for eksempel diagrammene i det engelske tidsskriftet The Economist). Frimerke utgitt til SSBs 100 års jubileum Strektykkelse Tynne streker gir diagrammet et "lettere" preg, mens tykke streker gir et "tyngre" preg. Valg av strektykkelse må til passes utskriftsmedium (laser skriver eller fotosetter), men vanligvis er Vi pkt passende. Strektykkelsen betyr mye for diagrammet utseende/uttrykk 7

V* pkt Vi pkt 3A pkt 1 pkt Med tanke på bruk av fotosetter og offset-trykk bør man ikke bruke svært tynne streker, da de lett kan forsvinne i trykkeprosessen. Kurver/linjer bør være klart tykkere enn diagrammets øvrige elementer, f.eks. 1,5-2 pkt. Skravering/gråtoner Utvalget av gråtoner og ulike former for skraveringer eller fyll vil variere fra program til program. Ved bruk av gråtoner er en generell regel ikke å bruke mer enn 3-4 ulike prosenter; f.eks. 1, 15, 50 og 100 prosent. Seiv om programmet har flere muligheter og de klart lar seg skille fra hverandre på en l aseroriginal, blir resultatet ofte uleselig etter trykking. Rasterene bør plasseres i "naturlig" rekkefølge, fra mørkt til lyst. Fire ulike gråtoner er imidlertid ofte ikke nok og de fleste programmer har da også en rekke andre skraveringer eller mønster å by på. Ikke alle mønster er imidlertid like egnet. Mønstrene lengst til høyre bør unngås, bl.a. fordi forklarings boksene i diagrammene ofte er små og mønsterene blir derfor vanskelig å tyde. Velg heller en type linjemønster. Men også her er det grunn til forsiktighet: Unngå horisontale og vertika le linjer, bruk heller skråstilte. Mønstrene til høyre anbefales ikke Eksemplet til høyre viser hvordan resultatet kan bli når man bruker denne typen mønster (ek semplet er hentet fra Statistisk årbok for Kyp ros). Særlig dårlig blir lesbarheten her, fordi søylene er så smale. FIGVKEIO: OVTPATIENTS ATTBNDANCBS BY SELBCTSD DISEASE CATBOOKT. 1980-1999 (ALL StEDI CAL INSTITVTIOSS) Ved bruk av gråtoneraster, er det vanlig å starte med det mørkeste rasteret i bunn, med den lyseste gråtonen på toppen (ellers blir søylene lett "topptunge"). Med liggende søyler er det vanlig med de mørkeste feltene til venstre, nærmest aksen. Slik... ikke slik 8

Hjelpelinjer Hjelpelinjer (engelsk: grids) skal hjelpe leseren til å avlese verdiene på aksene. I søylediagrammer er det stor sett bare behov for hjelpelinjer på Y-aksen. I linjediagrammer derimot, finnes det svært varie rende praksis. Enkelte bruker horisontale linjer for å hjelpe avlesningen av Y-aksen, men andre bruker vertikale linjer for lettere å identifisere tidspunktet eller perioden. Alternativ kan man bruke både horisontale og vertikale linjer. 1984 1986 1988 1990 1992 1994 1996 1998 Dette er en løsning uten hjelpelinjer og uten ramme 1984 1986 1988 1990 1992 1994 1996 1998 Med ramme, men uten hjelpelinjer blir diagrammet virkende litt "tomt" 1984 1986 1988 1990 1992 1994 1996 1998 Her er det bare horisontale hjelpelinjer, som gjør det lettere å lese av verdiene på y-aksen 1984 1986 1988 1990 1992 1994 1996 1998 Vertikale hjelpelinjer gjør det lettere å identifisere tidspunktene/-periodene 1984 1986 1988 1990 1992 1994 1996 1998 I søylediagrammer er det strengt tatt ikke behov for vertikale hjelpelinjer 0 1984 1988 1992 1996 Her er det kanskje litt for få hjelpelinjer, minimum antall bør være 4 1984 1986 1988 1990 1992 1994 1996 1998.., mens her er det litt for mange (maksi mum = 10) 2 ' 0 1984 1988 1992 1996 Denne løsningen benytter prikkete linjer, som skiller seg klart fra kurven 8 7- Dette er kanskje passe?.nßnnll * nni ii * _ nnni: _ininnii! mi i iliiiiiniiii mill i i i minimum iliiiiiniiii i 1984 1986 1988 1990 1992 1994 1996 1998 Her er hjelpelinjene lagt over søylene 4 2a 1984 1988 1992 1996 Dette er en annen løsning: Grå bakgrunn med hvite linjer 8-7" o LjLJLJLJLJLjLJLJLJLJLJLJLjLJLJ 1984 1986 1988 1990 1992 1994 1996 1998 En "minimalistisk" versjon, hvor også aksene er fjernet Uansett hvilken løsning man velger, bør antallet linjer verken være for stort eller for lite (en regel kan være minimum fire, maksimum ti). Hvilken type linjer man skal benytte (f.eks. heltrukne eller prik ker), er ofte et spørsmål om smak og behag. Men hjelpelinjene bør alltid være tynnere enn selve data linj en/kurven. 9

IlSÉ 03 02 04 2^;N gniralkrof Defleste dataprogramene tilbyr forskjelige plaseringer av tegnforklaringene, f.eks. under figuren elertil høyre. Dete blir ofte rotete og lite lesbart og i svært mange tilfeler er det derfor en bedre ninsølg å ta teksten in i diagramet (Forutsetningen er selvfølgelig at teksten (tegnforklaringen) er vitalertkort og får plas ine i diagramet). Dete er lit mer arbeidskrevende en bare å akseptere temargorpsplasering, men det øker lesbarheten betraktelig. I tileg far data-arealet på dene måten edn dominerende plasen det fortjener. 89101984 198 192 196 atl i diagramet? aksldiagramer også ineholde talene? Og i så fal; hvor mange og hvor? Generelt blir jo en grafisk nilitsmerfg brukt for å gi overblik og hovedtendenser, ike detalj er. Derfor er hovedregelen ike å gnejgitalene. Diagramer med mange tal blir en slags Ole Brum-løsning: "Ja tak, bege deler". ivhsdu likevel ønsker a gjøre eted, så anbefales det å sete nelatein i søylene. For linjeemargaidr kan det noen ganger rævenytig å opgi den første og tsise verdien i en tidserie (eventleutogså minimum/maksimum). ramnadk Finland Norge Sverige en,,,,,, w T 5: 05- ^ 89111985 1989 193 197 skett i diagramet eslerøts/repytfirks:velg én skriftype (gjerne en grotesk, f.eks. Arial/Helvetica, Frutiger, Trebuchet eler enanen skriftype som er tydelig forskjelig fra brødteksten) for hele diagramet, eventuelt med efvlaht eler kursiv som variasjoner. Hvis skriftypen ike er git av samenhengen, bruk gjerne en "woran","thin", "light" eler "condensed", dermed får du plas til mer tekst på same linje. Plase egnirnav ulike tekstelementer bør være den same i de ulike diagramene. Fontstørelsen må tilpas ess diagramets/publikasjonens format/størelse, men for de fleste formål er 7 pkt tilstrekelig. Kilde egninsivnehrog noter kan være lit mindre (6 pkt). Titel/overskrift bør være støre, for eksempel 9.tkp letit:titelen bør være kort, men presis. I den grad det kan være noen tvil om hva som "tele "netehne, må dete presiseres (hus/leilighet, familie/husholdning, person/ektepar). Også målenheten ignas ofte i titelen (antal/prosent/ rater/indeks/kroner). Titelen bør plaseres over diagramet, venst retsujert eler midtstilt. Når dataene gjelder et bestemt år, skal dete opgis. Når det gjelder tidserier, ivl årsangivelsen som oftest framgå av tidsaksen. 01

tehlekne nis reidrev/retekite-eska:som al anen tekst bør også dene eresalpshorisontalt. Man skal ike måte drive med nake itsanmygk for å lese skråstilt eler vertikal tekst, som i dete telpmeske.hvis det blir trangt om plasen, så kan man sløyfe eonnårstal. Alternativt kune man i dete tilfelet skrive årstal neleslik: '84 '85 etc. Det dårligste alternativet er å bruke en rdnimeskriftype. c 6-r 30 8 s q.4 reton.noter bør, så langt det er mulig, ungås, men er av og til likevel nødvendige for å presisere elerutdype forhold i diagramet. edlik:hvis ale diagramene i en raport/publikasjon er basert på ert og same datamateriale, er det kie nødvendig å opgi kilde i det enkelte diagram. Det er når data hentes fra mange ulike kilder, at edt er viktig at dise opgis. Kildene er vanligvis institusjoner eler publikasjoner (bøker/raporter/ retfirksdit)eler bege deler. Eksempler: edlik:statistisk årbok 201, Statistisk sentralbyrå egronsbank/oslo Børs Endatakilde som blir mer og mer vanlig, er Internert. Kildehenvisninger har da vanligvis formen: edlik:htp:/w.sb.no/konkurs/ edt er vanlig å plasere kildehenvisningen til slut, eter eventuele noter. urbkav "ramer" Avog til ser man at figuren rames in av en ytre rame eler skob. En rame brukes ofte for å samle ale elementene i figu ern (overskrift, forklaring, noter, referanser) og å avgrense dete omt teksten. Vanligvis er imidlertid dete unødvendig, særlig når erugifn har andre skriftyper en teksten. En ytre rame blir ofte lebod"t op", fordi de fleste figurer også har en indre rame, enadt av x- og y-aksen. atnal åpnede konkurser* 06 50r- 04 9'2 '93 '94 '95 '96 '97 '98 '9 * Endrede regler gjør at talene f.o.m. 194 ike er tkeride samenliknbare med tidligere år ehr blir det for trangt melom selve dia etsket/temargnog ramen emn hvis du bruker en ytre rame (eler et bakgrunsraster),, Antal åpnede konkurser* røsgda for at det blir tilstrekehg luft melom selve diagram- 60 0 etsket/temn og ramen. 30i n n n n n n 20! io o Ij N i LJ U 9'2 '93 '94 '95 '96 '97 '98 '9 * Endrede regler gjør at talene f.o.m. 194 ike er tkeride samenliknbare med tidligere år edlik:statistisk sentralbyrå og Brønøysundregisterene Enanen grunlegende regel er at diagramene bør utformes såenkelt som mulig: Dete gjelder både omfanget av data som framstiles og bruken av efekter. Ike øsrofkå si alt i ert diagram, bruk heler flere enkle diagramer en ert komplisert. Elementer som ike ernødvendig, bør fjernes eler bare brukes med stor forsiktighet (f.eks. ramer/skyger). 1

Snkelhet innebærer også at man ikke esser på med unødige effekter i form iv clip-art, bakgrunnsillustrasjoner, ogoer o.l. Bruken av såkalte pikto- *rammer anbefales heller ikke, da de >annsynligvis forvirrer langt flere enn le imponerer. 70 60 50 40 30 20 10 0 1U-] r - 1 : r- 6 J» H 4 - -I BH BJ I : jbj f f Sykkel Bil 0-I hh»_b1m_ liw H Eksempler på bruk av visuelle effekter som sjelden øker diagrammets infz-irrviooi/m-iox/qrhi cnororo tx/orf irvirtt Enkelheten må imidlertid ikke gå på bekostning av fullstendighet: Diagrammet skal stå på egne ben og må inneholde alle opplysninger som er nødvendige for forståelsen og tolkningen av data. Man skal ikke være avhengig av f.eks. å lese teksten for å få med seg forbehold eller nødvendige forklaringer. Men ingen regler uten unntak: Mange av de rådene som er gitt ovenfor er gitt med tanke på diagram mer som skal trykkes i notater, rapporter, bøker eller tidsskrifter. Et annet viktig bruksområde er for eksempel transparenter til bruk i undervisning og foredrag. Reglene om konsekvens og enkelhet gjelder selvfølgelig også her. Når det gjelder størrelsen, kan man imidlertid her med fordel lage dia grammene så store som mulig. Linjetykkelse og skriftstørrelse bør da økes tilsvarende. 2.2. Grafisk misvisning Reglene ovenfor angar hovedsakelig diagrammets utseende. Dette er selvfølgelig viktig for les barheten, men det er andre aspekter ved utformingen som har langt større betydning for informa sjonsinnholdet og tolkningen. Særlig er aksenes lengde og forholdet mellom dem viktig. Y-aksens lengde En ikke uvanlig måte å "dramatisere" data på, er å utelate verdier på y aksen og starte med minimumsverdien. Slike "kutt" av aksen kan noen ganger være berettiget, men bør vanligvis unngås. Eksempel til høyre er hentet fra Aftenposten og illustrerer antallet barn under 15 år som er pågrepet av politiet. Diagrammet gir inntrykk av en nærmest eksplosiv økning og en mangedobling av antallet, mens i realiteten er økningen "bare" 70 prosent. Også pilen i enden av kurven har en klart dramatiserende effekt, fordi den på en måte indikerer at økningen vil fortsette, noe man jo selvfølgelig ikke kan anta. (Fra Aftenposten 18/11 2001) Figuren til høyre - derimot - gir et langt mindre dramatisk (og mer korrekt) bilde av utviklingen. Grunnen til dette er at verdi aksen her ikke er kuttet, men begynner på 0. Nå finnes det selvfølgelig situasjoner hvor det er legitimt å foreta slike kutt på aksen. For eksempel ville avisenes daglige rente- og børsdiagrammer nærmest bli meningsløse uten slike kutt. Når det er detalj ene i utviklingen som er i fokus, er dette både nødvendig 12

og til latt. Men det bør ikke gjøres for å dramatisere et ellers "kjede lig" utviklingsforløp. Og hvis y-aksen ikke starter på 0, bør dette "bruddet" tydelig markeres på aksen. 14004;- 1994 '95 '96 '97 '98 '99 '00 Et annet eksempel: I Klassekampen illustrerer dette diagrammet den markert nedgang i andelen oppklarte voldtektssaker. Også her er verdi aksen kuttet, noe som kan gi inntrykk av at oppklaringsprosenten nå nær mer seg null. Når vi inkluderer o punktet på y-aksen, blir nedgangen langt mindre dramatisk. -v. % 30-28 - 26 24-21 22 20 18 1994 1995 1996 1997 1998 1999 2000 Oppklaringsprosent av anmeldte voldtekter 10 0 1994 1996 1998 2000 Diagrammet til venstre er fra Klassekampen 8/3 2002 Prosent 50- Diagrammets proporsjoner Seiv uten kutt på y-aksen, kan innholdet og fortolkningen av et diagram påvirkes av lengdene på aksene og forholdet mellom dem. Eksempelet til Prosent høyre (utviklingen i skilsmisse- 40 "XII [""PfH 20 hyppigheten) viser dette: Her har Y- 30 aksene samme skala, men dia- 20 grammenes ulike proporsioner formid- «T n ler ulike inntrykk av økningen. Det 1980 82 84 86 88 90 92 1980 83 86 89 92 "stående" diagrammet til høyre gir - på grunn av formatet - inntrykk av langt mer markert økning enn det "liggende" (kfr. diagrammet fra Aftenposten på forrige side). Det vanligste formatet er et liggende format, omtrent som standardforma tet i denne publikasjonen; bredde : høyde = ca. 1 : 1,5. Avstand mellom tidspunkter Når man presenterer tidsserier, så er det viktig at det er proporsjonal av stand mellom tidspunktene. Ofte har man i begynnelsen av en tidsserie bare tall for enkelte år, mens man på slutten har tall for hvert år, f.eks.: 1980, 1985, 1990, 1995 og 1996. Et diagram med lik avstand mellom disse fem datapunktene gir inntrykk Den markerte økningen fra 1995 til 1996 blir helt borte i diagrammet til venstre, fordi avstanden mellom de to årene er den samme som mellom f.eks. 1990 og 1995 av en jevn økning i perioden. Men når vi endrer avstanden mellom de første fire observasjonene, ser vi imidlertid at det har vært en markert økning fra 1995 til 1996. 13

"Dybde" Dagens dataprogrammer har etter hvert fatt mulighet for å lage ioo/t 1 _.. diagrammer med dybdevirkning. Dette betegnes ofte som 3-80 i r ~~zz~~ dimensjonalitet, men er det ikke. Effekten er en grafisk illusjon og 6J h-j er oftest bare egnet til å forvanske informasjonsinnholdet i grafik- "1 I I '^H_^ ken: Den minsker lesbarheten fordi den gjør det vanskeligere å 20 j :! ' avlese søylenes verdi på y-aksen. W w W I Bf I w/ 16-24 år 25-44 år 45-66 år 67-79 år Og heller ikke linjediagrammer far noen økt informasjonsverdi ved å bruke dybde-effekter; snarere tvert imot. 5 1980 1985 1990 1995 2000 5 0 2.3. Hva slags diagram skal jeg lage? Nedenfor gjengis en relativt liten, enkel tabell som viser antallet skadde og drepte menn og kvinner i perioden 1996-1999, fordelt på fire ulike grupper av trafikanter. Antallet skadde og drepte menn og kvinner, fordelt på trafikantgrupper Med utgangspunkt i denne tabellen kan det nå lages en lang rekke ulike diagrammer. Her er et utvalg: 4000 2000-1 " "" "l n 0000 _ 8000 6000 4000 2000-0-- 1996 1997 1998 1999 14000-1 1 1 a innn., -_- l UUu 10000 m m 8000- r- J I IB 6000 r 4000- r 2000-+g L_ - H^H- 1 H 1996 1997 1998 1999 "opp i i _ nii_rt_i~ 1996 ' 1997 ' 1998 ' 1999 Enkelt linjediagram som viser det totale Enkelt søylediagram som viser det samme Gruppert søylediagram som viser antallet antallet skadde og drepte i perioden som linjediagrammet til venstre skadde og drepte menn/kvinner i perioden 14

8000 7000-7000-1"» (40%) 6000. U^l 6000 _Msnn_ Z"" y T 4000 soo^f8 >"m / I \ f \ ( \ 3000- - 2000 \ \ \ / V \ \W\ TBW \ \ / 1000 1000-P v Xy v^v7 v_j^ Menn (60%) 1996 1999 1996 1997 1998 1999 1999 Linjediagram med tidsserier for menn og kvinner; viser det samme som det grupper- Sektordiagram som viser fordelingen på Sektordiagram som viser andelen kvinner i te søylediagrammet ovenfor menn og kvinner et bestemt år 1996 og 1999 4000 r 2000 ; 1 oooai 800O 6000 4000-1 2000 ; : _ Kvinner '! 100 ; 1 80 I 1996 1997 1998 1999 1996 1997 1998 1999 1996 1997 1998 1999 Arealdiagram som viser utviklingen for Arealdiagram som viser utviklingen i den Gruppert søylediagram som viser antallet menn og kvinner, og totalt relative fordelingen på menn og kvinner skadde og drepte i ulike trafikantgrupper Kvinner 40-1 Menn 20 1 10000 j- 8000 [] 6000 fl 4000-4 2000 4 r TT1' Bil Motorsykkel Sykkel Fotgjenger 10000 Bil Fotgjengere (8% 9000 Sykkel (7% V -4 i 8000/ f I Motorsykkel Motorsykkel/(10%) Bil (75%) 120 110- - 100 Wflt9r?y.kkel Sykkel 0 1996 1997 1998 1999 1999 1996 1997 1998 1999 Linjediagram som viser utviklingen for ulike trafikantgrupper Sektordiagram som viser fordelingen på trafikantgrupper et bestemt år Linjediagram som viser den relative utviklingen for ulike trafikantgrupper. Indeks 1996 = 100 60-t- 7000-1 100-7 -50- lin 600 L-a-J "I Fotgjenger 8Q : J L] Fot9ienger : n I Sfgn- jh 1^ mtmltl 1-«*l: i *ZM Bl Bil Motorsykkel Sykkel Fotgjenger Menn Kvinner Menn Kvinner Søylediagram som viser andelen Stablede søyler; viser hvordan menn og Stablede søyler som viser det samme so drepte og skadde kvinner i ulike kvinner er fordelt på ulike trafikantgrupper diagrammet til venstre, men relativt trafikantgrupper Sykkel Motor sykkel Bil Som de mange eksemplene viser, er valget av diagramtype helt avhengig av hva man ønsker å vise. Bare sjelden er det gitt i selve datamaterialet hva slags diagram som er det "beste". Diagrammet bør ha et klart budskap og utformingen avhenger av hva dette budskapet er; hva man vil poengtere eller legge vekt på. 15

3. Søylediagrammer: Å sammenlikne grupper Det vertikale søylediagrammet (også kalt stolpediagrammet) er på mange måter basisdiagrammet og utgangspunktet for de fleste andre ryper diagrammer. 3.1. Enkle vertikale søylediagrammer Enkle søylediagrammer inneholder alltid to variable og brukes for å B- sammenlikne f.eks. antall, andeler, frekvenser eller gjennomsnitt i 6 ulike grupper; f.eks. andelen arbeidsledige i ulike aldersgrupper eller 4 _^ _. - som her - folkemengden i de nordiske land. Andelen arbeidsledige 2 og folkemengde er her avhengige variabler, alder og land er uav- Q~) i i f- - i-h hengige. Danmark Finland Norge Sverige Vertikale søylediagrammer kan også brukes til å vise utviklingen over tid, f.eks. ved relativt korte tids serier (mellom 2 og 10 tidspunkter) og særlig når tidsserien viser absolutte tall og ikke rater eller hyppigheter: F.eks. er det vanlig å vise anfallet drepte i trafikken eller anfallet fødte som søylediagram, mens rater (døde pr. 100 000 innbyggere eller fødselsrater) bør vises som linjediagram (forutsatt at man har mange nok perioder eller tidspunkter, dvs. mer enn 4-5). Tid (= år) er her å betrakte som en uav hengig variabel. Mill. 10-r Når man som i dette eksemplet bare har én uavhengig variabel, (land), er det vanlig å la søylene ha samme mønster eller raster (evt. fi i ^^^^t_ farge). Om man ønsker å fremheve ett av landene (f.eks. Norge), kan dette gjøres ved å bruke et annet raster og/eller ved å bruke uthevet Mill. 10-1 lill Danmark Finland Norge Sverige Hvis diagrammet inneholder både positive og negative verdier (for eksempel overskudd/underskudd, vekst/nedgang), bør man bruke forskjellige raster/mønster /farger for å skille mellom dem. mii. I II 0-~ --f- -j-~- 'I.2 I 1995 1996 1997 1998 1999 Når det gjelder den grafiske ut- min mm. formingen, bør søylene i søyle- 10[ I I 10 diagrammer være omtrent like brede som mellomrommet mellom 6- -- 6 dem; de bør altså verken være for 4 I m 1 4f brede eller for smale. 2-fl 24 - lill I I I Danmark Finland Norge Sverige Danmark Finland Norge Sverige Her er søylene for brede... 16...oa her er de for smale De ulike graflkkprogrammene tilbyr ofte alternative utforminger av 50 A ] 50; I /~ søylene. Til høyre vises to mulig- ' i heter: Pyramider og runde søyler. ~~~ å ~t~ / Disse -og liknende utforminger - y ~w~ m\ ' m bør bare brukes med stor forsiktighet M\! i\ M\ ioi (om i det hele tatt). Fordi søylene 10 J) 1 ABCD ABCD r

inneholder en tredimensjonal effekt, blir det vanskelig å lese av verdiene på aksen. Gruppe A i de to diagrammene viser egentlig verdien 30, men ser mer ut som 27-28 (på grunn av perspektivet). Og pyramidene til venstre bør etter min mening bare brukes hvis man skal illustrerer høyden på fjelltopper i Rondane. 100 II 80 En spesiell type søylediagrammer er diagrammer hvor også bredden på søylene har betydning. For eksempel: 60 Hvis vi sammenlikner andelen jenter på ulike studie 40 retninger i videregående skole, vil et "vanlig" søyle 20 diagram se ut omtrent som det til høyre. o Men siden antallet elever er svært forskjellig på de ulike 100 studieretningene, ønsker vi kanskje også å vise dette. Dette gjøres ved å la søylenes bredde reflektere antallet ti 80 elever (allmennfag har omtrent fem ganger så mange 60 elever som de andre studieretningene). En egen 40 forklaring angir hvor mye bredden på søylene tilsvarer 20 (allmennfag = ca. 24 000 elever). o Allmennfag Helse- og sosialfag Formgivingsfag Mekaniske fag 0 15000 30000 Allmennfag Helse- og sosialfag Formgivingsfag Mekaniske fag riustjiu 3.2. Grupperte søylediagrammer: iooj- _ m^ Mange søylediagrammer inneholder bare to variable; én uavhengig og q Kvinner én avhengig (som for eksempel land og folkemengde eller alder og 60-j-^ arbeidstid). Men svært ofte ønsker vi å sammenlikne betydningen av og 40 1 j jd I I samspillet mellom to (eller flere) faktorer, f.eks. både kjønn og alder. 20-j Eksempelet til høyre viser andelen biblioteksbrukere siste år blant menn 0H 1 16-24 år'. H l 25-44 år 45-66 I l år 67-79 H. L år og kvinner i ulike aldersgrupper. Med to uavhengige variable, kan disse grupperes på to måter, avhengig av hva vi fokuserer på; pa; hvilken sammenlikning som er viktigst åata få Prosent i ~ p_ fram: Vi sammenlikner først og fremst de søylene som er gruppert io(h ~ x.. sammen (uten mellomrom). Eksemplet øverst inviterer til en sammen- 80 I 25-44 år f"] 67-79 år likning av menn og kvinner i ulike aldersgrupper: "Forskjellen mellom 60 - Bi menn og kvinner er størst blant de yngste og avtar med alderen". 40 I 20+- Det nederste grupperingen - derimot - inviterer til å sammenlikne aldersgruppene separat for menn og kvinner: "Biblioteksbruken Menn Kvinner reduseres med økende alder, men mer for kvinner enn for menn". 100 i _ Kvjnner En annen mate a plassere/gruppere søylene pa, er ala dem overlappe. I 801 I Menn enkelte grafikkprogrammer kan søylene plasseres halweis bak i I. hverandre, i stedet for ved siden av hverandre. Det vanlige er da å sette i L, søylene med lavest verdier foran, slik at "høye" søyler ikke skygger for de mindre (men dette er selvfølgelig ikke alltid mulig). HelT Xi Søylediagrammer med to uavhengige variable kan også presenteres tredimensjonalt; dvs. med en egen akse (z-akse) for den tredje variabelen. De fleste grafikkprogrammer har nå etterhvert en slik mulighet. Denne muligheten anbefales ikke og bør i alle fall bare brukes med stor forsiktighet. Legg f.eks. merke til at høye søyler i forgrunnen lett kan skygge for lavere søyler bak. 17 1 25'44 45-66 67 Kvinner Alder

3.3. Sammensatte søylediagrammer Sammensatte søylediagrammer brukes for å vise hvordan én størrelse er sammensatt av eller fordelt på ulike enkeltkomponenter. For eksempel ønsker vi å sammenlikne ikke bare hvordan det totale antallet asylsøkere har utviklet seg over tid, men om og hvordan sammensetningen av gruppen eventuelt har endret seg. Eller vi ser på alkoholkonsumets utvikling over tid, både totalt og fordelt på øl, vin og brennevin. Rekkefølgen på kategoriene kan bestemmes på forskjellige måter: Noen ganger finnes det kanskje en "naturlig" rekkefølge (f.eks. utdanningsnivå, alder). Andre ganger kan rekkefølgen bestemmes på grunnlag av størrelse eller "viktighet" (de største eller viktigste nederst). For å øke lesbarheten, legges ofte den komponenten som varierer minst i bunnen av søylene. Og som ellers, gjelder også her regelen om at mange verdier/ komponenter reduserer lesbarheten. Liter I eksemplet til høyre vises alkoholkonsumet per innbygger i absolutte 6~ tall (alkohol-liter). Siden både totalen og fordelingen kan endre seg ~~ ; i 1 r, over tid, blir det mange ganger vanskelig åse for eksempel hvilke A~~ i LJ~ kategorier som endrer seg mest. For å lette sammenlikningen, kan man se på den relative fordelingen; dvs. la totalen være 100 prosent. : øl Brennevin j Hvm \ o-j ^ l' ' r-t" -r = 1985 1990 1995 2000 De enkelte søylene iet sammensatt 100% søylediagram viser altså en inråsen J jo looyi relativ fordeling og kan således sammenliknes med et sektordiagram. n" i r i iii r Men fordi søylediagrammet har en Y-akse, er det langt letter å sammenlikne to eller flere søyler enn det er å sammenlikne for- Hi fl ihi delingene i sektordiagrammer. Dette er grunnen til at man sjelden 01 D Brennevin bruker sektordiagrammer for å sammenlikne fbrdelinger i flere ; vin grupper eller på flere tidspunkter. M 5 ' 1990 ' 1995 ; ~ Som ellers er det viktig å tilstrebe enkelhet i presentasjonen; i denne sammenhengen innebærer det at man ikke bør benytte fordelinger med mer enn 4-5 verdier eller grupper. Noen ganger ser man fordelinger presentert side om side som om det PQQ Sent var andeler, slik som til høyre. Dette gjøres for lettere å kunne 50 L_ M W sammenlikne gruppene, ved at alle har et felles nullpunkt. Men når 40 \M det er snakk om hele fordelinger som summerer til 100 prosent, er 30 I I stablede søyler å foretrekke. LJ I lihtli.hri I 01 Vin D Brennevin in spesiell situasjon er når et sammensatt 100-prosent søylediagram iser en fordeling med bare to verdier/grupper, for eksempel itviklingen i andelen mannlige og kvinner studenter i en bestemt itdanning. Dette kan da presenteres slik: 100 80 60 40 20 0 I I Menn Kvinnei 18

Men siden en slik fordeling alltid vil summere til 100 prosent, er det her vanlig å sløyfe den ene verdien eller gruppen og for eksempel bare presentere andelen kvinner: 100 80 60 40 20 0 1980 1985 1990 1995 I slike "andelsdiagrammer" er det imidlertid ikke nødvendig å la 50 verdiaksen gå til 100 prosent. Når maksimumsverdien - som her - 40 I er 43 prosent, er det naturlig å la verdiaksen gå til 50 prosent. ^B n lill 1980 1985 1990 1995 En tredje måte å presentere det samme på, er ved hjelp av et såkalt 40 g. r -j "flytende" søylediagram. (For at verdiaksene skal få en "symmetriske" inndeling, lar vi her kvinnenes akse gå til 60-20 prosent, siden mennenes går til 80). 40 60 80 1980 1985 1990 1995 3.4. Horisontale søylediagrammer Horisontale søylediagrammer har mange av de samme funksjonene som de vertikale; disse viser også antall, andeler, frekvenser eller gjennomsnitt i ulike grupper. Til forskjell fra vertikale søyle-diagrammer, brukes imidlertid de horisontale sjelden til foreta sammenlikninger over tid (unntatt endringer fra ett tidspunkt til et annet). Fylke Akershus -F I I I i Buskerud Det er særlig to situasjoner hvor horisontale søylediagrammer egner seg godt: Den ene er hvis variabelverdiene på den uavhengige variabelen har lange betegnelser. Det er da mye lettere å få plass til (og ikke minst å lese) betegnelsene når teksten står horisontalt. For å øke lesbarheten, bør teksten her høyrejusteres. En annen situasjon er når vi har mange variabelverdier, f.eks. fylker. Slike "lange" diagrammer lar seg vanskelig plassere den andre veien ("i bredden"). Hordaland Telemark Sør-Trøndelagl Aust-Agder Rogaland Vest-Agder Sogn og Fjordane Møre og Romsdal Nordland Finnmark Nord-Trøndelag Når enhetene ikke har noen naturlig rekkefølge (f.eks. alder eller utdanningslengde) kan man sortere (rangere) dem etter verdien på den avhengige variabelen. Her ser man da lettere hvilke fylker som har høyest/lavest verdi. 20 22 24 26 28 30 Legg også merke til at det her er vanlig å ta med landsgjennomsnittet, noe som er mer sjelden i stående søylediagrammer. Og på samme måte som vertikale søylediagrammer, kan også horisontale være gruppert eller sammensatt. 19

Kjønn: En tredje situasjon hvor det horisontale søylediagrammet egner seg bedre enn det vertikale, er når vi ønsker å vise hvordan én avhengig variabel varierer i mange, ulike grupper. For eksempel hvordan andelen som reiser på påskeferie varierer både med kjønn, alder og utdanning. Utdanning: j \- GrunnskoleH VidergåendeH Møyere utdanninch 0 5 10 15 20 25 En spesiell type horisontalt søylediagram er befolkningspyramiden. 80+. ^^~ Dette er i utgangspunktet to horisontale søylediagrammer som er sått i J 70-79 ~ n,.,'-."-, r1 11 c M6O-69 1 sammen, "rygg mot rygg".. Legg også merke til at - til forskjell tra fra 50-59 "vanlige" søylediagrammer - har befolkningspyramider vanligvis ikke jh^3o^39l ~H noe mellomrom mellom søylene, som ligger "vegg i vegg". 110-191 ~~^i Befolkningspyramider kan være "enkle", dvs. at de inneholder bare to gfl o-g Hg variable, vanligvis kjønn og alder. Men de kan også inneholde en tredje 30 20 10 0 0 10 20 30 variabel, f.eks. ekteskapelig status. Hver av de to seriene her er egentlig en fordeling av en kontinuerlig varabel (alder), og diagrammet er derfor et slags histogram, derfor brukes det vanligvis ikke mellomrom mellom søylene i befolkningspyramider. Ingen av de vanligste grafikkprogrammene har imidlertid befolkningspyramider som en egen diagram type. Dette betyr litt "handarbeid": Man må lage to separate diagrammer (for menn og kvinner); deretter må det ene speilvendes og de to settes sammen. Denne typen "rygg mot rygg" -diagrammer kan selvfølgelig også brukes for andre formål, særlig finner vi dem ofte brukt i sammen likning av menn og kvinner. Et eksempel kan være andelen menn og kvinner i ulike aldersgrupper med utdanning på universitets- og høyskolenivå. (Her må alltid høyre og venstre verdiakse ha samme skala, dvs. samme maksimum). Menn 80 + 67-79 45-66 n ] 25-44 11 Kvinner 40 30 20 10 0 0 10 20 30 40 Men ofte er et (vertikalt) gruppert søylediagram likevel å foretrekke i denne Ulw 111 IV- situasjonene,.m LIUI.>JV.H Id IV., fordi J.ISIUI det UV/l er VI langt H-lllUl lettere H/Utll. åcl sammenlikne.->(.ll 111 I l\~l II ll\l It. f.eks. I.VIVJ.. menn og kvinner i hver aldersgruppe, når søylene står ved siden av 30_ M_._.. i i o j.o ii M H I I Menn hverandre enn nar de star rygg mot rygg. "Rygg-mot-rygg"- diagrammer kan også brukes hvis man vil 10 illustrere ulike aspekter (måleenheter) ved et fenomen, som mengde I Jå og verdi, f.eks. fangstmengde og fangstverdi av ulike fiskeslag (målt I f '. & & & & 1624 i henholdsvis tonn og kroner). 25_44 4566 67 _79 80 + 20

4. Linjediagram: Tid og mengde Linjediagram (også kalt kurvediagram) brukes først og fremst for å vise utvikling over tid og dette er en svært vanlig diagramtype, ikke minst på avisenes økonomisider. Nå kan selvfølgelig også tidsserier vises som søylediagrammer, særlig hvis antallet tidspunkter er lite: En tommelfingerregel kan være at linjediagrammer bare skal benyttes når man har fire eller flere observasjoner (datapunkter); har man data bare for to eller tre tidspunkter/perioder, bør det benyttes (stående) søylediagrammer. En annen situasjon hvor søylediagrammer kan være å foretrekke, er når avstanden mellom datapunktene er svært uregelmessig; for eksempel 1980, 1987, 1991, 1996 og 1998. Det finnes to hovedtyper tidsseriedata: Data som gjelder perioder (for eksempel år, kvartal, måneder, dager eller også timer/minutter) og data som gjelder bestemte tidspunkter (for eksempel 1/1 hvert år). 1.1. Enkle linjediagrammer 40 _U^- 3o;^^-^"p- vlange linjediagrammer inneholder bare én linje/tidsserie, som f.eks. irbeidsløsheten i en periode, skilsmissehyppigheten, fødselsrater, enteutviklingen eller barnehagedekningen. Linjen tegnes da vanlig- 20+ 10Hyelpelinjer). ris som en enkel linje (men likevel klart tykkere enn eventuelle 0 1984 1988 1992 1996 fradisjonelt blir verdiaksen plassert på venstre side (i de fleste data- )rogrammer er dette standard eller "default"). Men i en tidsserie bregår ofte den mest "interessante" utviklingen på høyre side, derfor :an verdiaksen ofte med fordel flyttes dit. linjediagrammer plasseres alltid tiden på den horisontale aksen og illtid fra venstre mot høyre. S 1QR4 1QRR 1QQ? 1QQR 6C i 4C i rj-0 Datapunktene i en tidsserie markeres ofte med symboler eller såkalte "markører" (f.eks.: o ). Men med bare én dataserie, er det ikke noe behov for å skille mellom flere linjer og bruken av symboler er derfor unødvendig her. Alternativt kan man fylle/skravere arealet under linjen: Denne typen kalles ofte silhuett-diagrammer og er en form for arealdiagram (mer om disse senere). 1984 1988 1992 1996 21

4.2. Multiple linjediagrammer Svært ofte ønsker man å sammenlikne utviklingen over tid for ulike grupper (For eksempel menn og kvinner, ulike aldersgrupper eller flere land). En tommelfingerregel er at et linjediagram bare sjelden bør inneholde mer enn 5-6 tidsserier. Dette antallet er selvfølgelig avhengig både av størrelsen på diagrammet, om linjene ligger svært nær hverandre og om de krysser hverandre. Diagrammene til høyre viser prosentandelen menn og kvinner i alderen 19-24 år som er i høyere utdanning. I det øverste eksemp let er det brukt ulike symboler for å skille mellom de to linjene; menn og kvinner. Men med mange linjer og/eller (som her) mange datapunkter, bidrar bruken av symboler til å overlesse diagrammet. Og heller ikke med bare to linjer er det noe behov for å bruke markører. Snarere bidrar markørene til markert mindre lesbarhet. 35-r- 25 5 0 1980 1984 1988 1992 1996 I stedet kan man bruke ulike linjetyper, som her. Alternativt kan man bruke gråtoner (eller farger) i tillegg til sort. 5 0 1980 1984 1988 1992 1996 Linjediagrammer bør ikke inneholde for mange dataserier eller linjer; 4-5 serier regnes ofte for å være maksimalt. Avhengig, selvfølgelig, av avstanden mellom linjene og om de er parallelle eller om de krysser hverandre. Eksemplet til høyre (selvmords hyppighet i utvalgte aldersgrupper) inneholder bare fem serier, men er likevel på grensen til det uleselige. 40 0 1971 1981 1991 1997 Vanligvis bør linjene ha samme tykkelse, noe som signaliserer at gruppene (f.eks. menn og kvinner) er likeverdige. Ulike linje tykkelser bør reserveres for spesielle situasjoner, for eksempel når en av tidsseriene viser en total og en annen viser antallet i en undergruppe. Eksemplet til høyre viser det totale antallet drepte eller skadde i trafikken hvert år og antallet bilførere. Også når linjer ligger svært nær/krysser hverandre, kan man med fordel bruke ulik linjetykkelse. Et tredje tilfelle er når en av linjene viser gjennomsnittet for en rekke undergrupper. 15000 Drepte eller skadde i trafikken 12000 9000 6000 Herav bilførere 3000 0 1990 1992 1994 1996 1998 I noen situasjoner bør likevel symboler brukes. For eksempel: 1 situasjoner hvor man ikke har data for hvert enkelt år, bidrar sym- '<>L bolene til å markere hvilke år man har data for. I et diagram som viser valgdeltakelsen både ved kommune- og Stortingsvalgene er 4o: - dette viktig, siden de to seriene jo har data som refererer til for- 20- skjelligeår. 100 oj. 1981 1985 1989 1993 1997 2001 22

En annen situasjon der markører har en funksjon, er når det i en tids serie er ulik avstand mellom tidspunktene eller periodene. I dia- 4p:a. ^^is; grammet til høyre markerer symbolene klart hvilke år man har data 30 for. Dermed blir det også tydelig at den tilsynelatende lange, stabile 2o perioden på 1980-tallet kan henge sammen med manglende data, og Kl ikke nødvendigvis er uttrykk for at utviklingen var så stabil. 60 o:- 1981 1985 1989 1993 1997 En tredje situasjon hvor en med fordel kan bruke symboler, er for 10 eksempel ved presentasjon av kvartalsstatistikk. Her kan man. 80 bruke ulike symboler for de forskjellige årgangene, slik: 60 40 20 0 II 111 IV I II 111 IV I II 111 IV 1998 1999 2000 Alternativt kunne de ulike årgangene/periodene her markeres med 100 en egen bakgrunn, for eksempel ved at annenhver årgang gis en grå 80 bakgrunn, slik: 60 40 20 0 II 111 IV I II 111 IV I II 111 IV 1998 1999 2000 4.3. Gruppert linjediagram Noen ganger inneholder et linjediagram tre såkalte uavhengige variable; i tillegg til tidsdimensjonen 6 5 K 16-44 kan dettei*l f.eks. *, være.. kjønn _1 _a. J _ og*1 _j. alder. * 5 IIFor - å letteii 4l~^ii^ O" * ir> ^»T «*! rrnt^^!- * k 45-67 sammenlikningen er det da viktig å "gruppere" linjene (kfr. grupperte søylediagrammer). Dette kan 2 m 45-67 skje slik som til høyre, ved at mennenes kurver er i 1"' sort og kvinnenes i grått, samtidig som de yngste tit 1990 bd" 1993 iqqß 1996 1999 skilles fra de eldste ved å bruke henholdsvis prikkede og heltrukne linjer. Men det å måtte tolke to slike sett 6 -, r i r i r r,, r6 med "koder" er ikke direkte bruker- * 3 I ' o 1 *.. i... *~ vennlie. En bedre løsning er ofte å, I >jl_ / **.... ~' 4 V; lage separate diagrammer; som her 3 '*'.. L _ LJ...*** (^E ' N *' *" *'** for menn og kvinner. Disse bør da 2 _ 2 r^,-*> plasseres ved siden av hverandre, snarere enn over/under hverandre, Menn K\inmr da blir det lettere å sammenlikne 1990 1993 1996 1999 1990 1993 1996 1999 nivåene 4.4. Arealdiagram Arealdiagram tenkes vanligvis på som en form for linjediagram, hvor linjene er lagt "oppå hverandre" og arealet mellom dem er skravert (det kalles derfor også av og til "akkumulert linjediagram"). Men vi kan like gjerne se på arealdiagrammet som en variant av sammensatte søylediagram. I eksemplet 23

nedenfor blir likheten tydelig: På samme måte som et sammensatt søylediagram, viser areal diagrammet både det totale antallet/mengden og hvordan denne totalen er sammensatt. 100 100!0-80 100 -j _L io 60 60 10 40 :o 20 o 1989 1991 1993 1995 1997 0 1989 1991 1993 1995 1997 1989 1991 1993 1995 199' Når arealdiagrammet ofte betraktes som en form for linjediagram, har nok dette sammenheng med at det (på samme måte som linjediagrammet) hovedsakelig brukes for å illustrere utviklingen over tid. På samme måte som stablede søylediagrammer, finnes arealdiagrammet i to utgåver, som viser hen holdsvis absolutt og relativ fordeling (= 100 prosent). Når man utformer arealdiagrammer, er rekkefølgen av tidsseriene ofte av stor betydning for lesbarheten og fortolkningen. I det øverste diagrammet til høyre får man lett det inntrykket at den øverste serien (serie A) er synkende. 80 60 40 20 0 1990 1992 1994 1996 1998 Men diagrammet nedenfor viser at dette ikke er tilfellet. En generell regel kan derfor være at den tidsserien som varierer minst, bør ligge i "bunn" av diagrammet. Et annet tilfelle hvor rekkefølgen er viktig, er når en eller flere av seriene varierer mye. Serien med minst variasjon bør da plasseres i bunn. 100 80-4- Serieß 60 i H Serie A 40 20 o 1990 1992 1994 1996 1998 4.5. To verdiakser 250 Enkelte ganger ønsker man å sammenlikne utviklingen i fenomener OOC\ som befinner seg på svært ulike nivåer på måleskalaen. La oss anta at vi ønsker å sammenlike forbruket av øl, vin og brennevin. Et diagram 10 ~ ø... vin Brennevin som viser utviklingen (1 000 vareliter) vil da se omtrent slik ut: soj- "'TT^7^ o-m-t'l 1 M-4-4-4-1981 1985 1989 1993 1997 Men siden ølvolumet er langt høyere enn vin og brennevin, blir det vanskelig å se tydelig detalj ene i utviklingen av vin- og brennevin- 60 T jøi -f^j^l^i 250 forbruket. En løsning på dette er å operere med to skalaer; én for øl og 50i -y*- ~ 200 én for vin og brennevin, som vist i diagrammet nedenfor. Økningen i 40~- icn vinkonsumet og nedgangen for brennevin blir nå langt tydeligere. 30 : - -7,7.7.7^77^*^ Men samtidig oppstår faren for misforståelser, ved at leseren kan 20-- -^^-~r rr : <^. nndvin komme til å lese av verdien på feil akse. Det kan derfor være grunn til *».«.,.,,,,... F- 50 å bruke f.eks. piler for å gjøre det helt tydelig hvilken akse som måler oi i 0 hva. 1981 1985 1989 1993 1997 24

To akser kan også være formålstjenlig når man ønsker vise den samme utviklingen på to forskjellige måter/i forskjellige enheter; f.eks. både i kroner og dollar eller kilometer og miles. En annen situasjon hvor to skalaer er helt nødvendig, er hvis man sammenlikner "epler" og "pærer"; dvs. variabler med ulike måleenheter. For eksempel om vi sammenlikner utviklingen i vareimporten både når det gjelder verdi og mengde, f.eks. kroner og tonn. En annen måte å løse slike problemer på, er å bruke et såkalt indeksdiagram. 4.6. Indeksdiagram Et indeksdiagram viser relative verdier (vanligvis i prosent) i for- 150 Menn hold til en basisverdi et bestemt år. Denne basisverdien settes van- 125 ligvis til 100. Formålet er å lettere kunne sammenlikne utviklingen i 100 to eller flere tidsserier, hvor enten nivået er svært forskjellig eller 75 som måles på ulike skalaer. Ta for eksempel to tidsserier som viser 25 antall siktede for forbrytelser per 1 000 innbyggere for menn og kvinner. Vi ser da at begge ratene har økt siden 1980, men det er - fordi nivåene er så forskjellige - svært vanskelig for eksempel å si noe om økningen er størst for menn eller kvinner. Alternativet ii moaer daåu. å lage iii- 1et f\c\ indeksdiagram, li.'_ -i hvor begge «i nu serienes 4.n it n 4. i400_r rvvinnsr verdier i 1980 settes lik 100. Det blir nå helt tydelig at antallet 350h kvinnelige siktede har økt langt mer (relativt sett) enn antallet 250 mannlige. (Legg også merke til at rekkefølgen av Menn og Kvinner 200 i forklaringen nå er byttet om, og svarer til rekkefølgen av kurvene). 100 Problemet med indeksdiagrammer er at leseren lett kan forveksle 50 endringstakt og nivå: I diagrammet til høyre kan man komme til å 1980 1984 1988 1992 1996 tro at kvinner begår flere forbrytelser enn menn En spesiell variant av indeks- 600 diagrammet kalles viftediagram (på grunn av sin form). Dette er en forenklet versjon som bare består av to tidspunkter. Dermed kan man langt lettere vise utviklingen for flere tidsserier. Til høyre vises 500 400 300- - 200-;- -100-; 0-i- - ~\~ykytt f * :=r 300 20O1: 100-:^ 0- utviklingen i etterforskede forbrytel ser, fordelt på seks ulike typer 1980 1984 1988 1992 1996 1980 kriminalitet. Med hele tidsserien (19 tidspunkter), blir resultatet vanskelig å lese, bl.a. fordi mange av linjene krysser hverandre. Med bare to tidspunkter, blir det langt mer oversiktlig. Kvinner.3- -i ] H~~i^ 1980 1984 1988 1992 1996 1999 4.7. Glatting: Glidende gjennomsnitt og trendlinjer Mange tidsserier likner en "berg- og dalbane" fordi de ofte inneholder tilfeldige variasjoner. Dette kan bl.a. være fordi de er basert på (små) utvalg. Tidsserien blir da gjerne "hakkete" og det kan være vanskelig å se om det egentlig er noen tendens i utviklingen (kfr. den tykke linjen i diagrammet til høyre neste side). En vanlig løsning på dette problemet er å justere tallene, f.eks. med glidende gjen nomsnitt (ved f.eks. tre-års glidende gjennomsnitt brukes gjennomsnittet for de tre siste år). Dermed fjernes noe av den tilfeldige variasjonen og tendensen blir tydeligere. 25

25 En annen måte å tydeliggjøre tendensen i et tidsforløp på, er å legge inn en såkalt "trendlinje". Dette er - grovt sagt - en måte å indikere den generelle tendensen i data på. Til høyre vises en linjær trendlinje (linjær regresjon). Også glidende gjennomsnitt og andre typer justeringer benevnes ofte trendlinjer. 20 15 10 Trendlinjer benyttes ofte til å projisere eller lage en prognose for fremtidig utvikling. Dette må imidlertid ikke gjøres ukritisk; de fleste utviklingstrender snur før eller senere ("What goes up, must come down"). 1980 1984 1988 1992 1996 4.8. Delårsdata 1000 ii Diagrammet ovenfor (med kvartalsdata) er et eksempel på en j spesiell type tidsserier, nemlig såkalte delårsdata eller data med et syklisk mønster. Dette kan være daglig, ukentlig, månedlig eller 400 halvårlig statistikk. Et typisk eksempel er den månedlige trafikk ulykkesstatistikken. På samme måte som kvartalstallene, kan også disse presenteres som én fortløpende linje, slik som i diagrammet jfmamj jasondjfmamj jasond ~,, 1998 1999 til høyre. Men slike data ofte inneholder store sesongmessige variasjoner, og 1000 I r i f r i r r >KNden relevante sammenlikningsperioden er da ofte ikke forrige f?~ måned, men samme måned året før. En slik sammenlikning er ikke 600 i^^3^ lett å gjøre her. Alternativet er da å presentere seriene slik: 400 200 1998 0 JFMAMJ JASOND 4.9. Kumulative linjediagrammer For mange tidsserier vil det være interessant å ikke bare se på fore komsten av et fenomen hver måned eller hvert år, men også å se på det kumulative resultatet. Ett eksempel: De årlige skilsmissetallene kan summeres (kumuleres) for de enkelte ekteskapskohorter (år ganger). Deretter kan man beregne den totale andelen skilsmisser i de ulike kohortene. Tilsvarende kan man for eksempel vise andelen kvinner som har fatt sitt første barn ved ulike aldre eller andelen unge som har flyttet hjemmefra ved ulike aldre. Kumulativ andel skilsmisser i ulike ekteskapskohorter 26

5. Sektordiagram: Prosentfordeling 5.1. En enkelt fordeling Sektordiagram (også kalt sirkel- eller kakediagram) brukes for å vise relative fordelinger for kvalitati ve variable. Til forskjell fra andre diagrammer, har sektordiagrammet ingen akser. Men om vi sam menlikner det med et sammensatt søylecfiagram, ser vi at dette bare er to ulike måter å framstille en fordeling på: / / f Ak 75 j" Når vi "ruller ut" sirkelen, blir omkret- t M j 50 {- sen (360 grader) gjort om til en 100 \ / I \ /W 25 ill prosent akse. \/ \^C Fra sektor- til søylediagram Sektordiagrammet viser altså en relative fordeling; hvordan en helhet (som alltid er 100 prosent) fordeles på undergrupper. Eksempler kan være: hvordan arbeidsreiser fordeler seg på ulike transportmidler hvordan husholdningenes utgifter fordeler seg på ulike ryper forbruk hvordan feriereiser fordeler seg på ferietyper, eller hvordan alkoholkonsumet fordeler seg på øl, vin og brennevin Annet (41%) Bolig Transport Annet Som ellers er det vanlig å la mønsterene gå fra mørkt til lyst. Siden denne diagramtypen mangler verdiakse, er den best egnet til å gi et grovt bilde av fordelingen. Men det er også mulig å oppgi verdiene for de ulike andelene. 1 stedet for å bruke en egen boks med forklaringer, anbefales det å knytte betegnelsene direkte til de ulike sektorene, enten utenfor sirkelen eller inne i de enkelte sektorene. Også sektordiagrammer kan gis "dybde" eller 3-dimensjonalitet. Men fordi det segmentet som ligger foran dermed blir tykkere, kan det lett også få en økt betydning. Dette anbefales derfor ikke. Transport 27

Som for de fleste andre diagrammer gjelder også her regelen om ikke å bruke for mange kategorier eller grupper (maksi mum 5-6). Hvis vi ønske å fremheve eller fokusere på en av gruppene, kan dette gjøres ved å trekke ut sektoren, evt. å utheve betegnelsen. Å "eksplodere" hele diagrammet virker mot sin hensikt og er mer forvirrende enn fokuserende. Virkningen er omtrent den samme som å skrive et helt notat med uthevet skrift. 5.2. Sammenlikne fordelinger? Noen ganger ønsker vi å sammenlikne to eller flere fordelinger; for ulike grupper eller tidspunkter. Dette lar seg selvfølgelig gjøre ved å plassere to sektordiagrammer ved siden av hverandre, slik: Men vanligvis er det da mer hensiktsmessig å lage et sammensatt søylediagram. Dette har en verdiakse, noe som gjør det langt lettere å sammenlikne gruppene; særlig hvis det er snakk om mer enn to. Og dette gjelder spesielt når forskjellene - som her - er relativt små. 5.3. Varianter En variant av sektordiagrammet kalles "smult ring", fordi den har et hull i midten. Dette kan brukes til å gi tilleggsopplysninger, for eksem pel totaltall (her: total forbruksutgift). 28

Noen ganger ønsker vi å fokusere spesielt på én av gruppene i et sektordiagram; og mer enn bare ved å trekke ut gruppen. Vi vil kanskje også vise hvordan denne gruppen igjen fordeler seg på ulike undergrupper; for eksempel hvordan de som har vært på ferie, har overnattet. Dette kan gjøres ved å vise fordelingen for undergruppen som en egen søyle, på denne måten: r*^ss"'' ' fén An net / llkv \ rhjq Camping 25 Hytte /ikkepå \På ferie \ H^ ferie 12 % \ I I SlektA Slekt/venner Hotell 0.1. En annen løsning er å også vise denne fordelingen som et sektordiagram. Men det andre sektordia grammet bør da være tilsvarende mindre, for å illustrere at dette er fordelingen for en undergruppe. /. \ \ Camping/\ /'X /ikkepå >\ \ L \ I ferie På ferie \ / \\l En spesiell variant av smultringen brukes ofte når man skal illustrere fordelingen av stemmer på - eller mandatfordelingen for - ulike politiske partier. (Dette er forøvrig et eksempel på at bruk av flere farger kan ha en funksjon, siden disse fargene faktisk også har en viss forankring i "virkeligheten" (jf. diskusjonen om bruk av farger i kap. 7)). Sp V KrF \ I / B^^k. \ / ""x\ Halvdelen av en smultring gir assosiasjoner til partiers plassering i et parlament A 29

6. Andre typer diagrammer 6.1. Kombinasjonsdiagrammer I forrige kapitel så vi hvordan et sektordiagram kunne kombineres med en søyle, for å vise fordelingen for en undergruppe. Det å kombinere diagramtyper er svært vanlig og vi skal her se på noen av de mest typiske sammensetningene. Søyle - linje Den aller vanligste kombinasjonen er kanskje bruken av både linjer og søyler i samme diagram. Det kan være flere grunner til at man ikke alltid bruker bare linjer eller bare søyler. For eksempel ønsker man av og til å sammenlikne grupper eller kategorier som ikke vanligvis ikke sammenliknes ("epler og pærer", kfr. diskusjonen om to verdiakser i kap. 4). En annen situasjon er når én gruppe er en slags "referanse" for en annen. Et eksempel kan være kvinners yrkesdeltakelse i ulike alders grupper, presentert som et linjediagram. Svært ofte ønsker vi å sammenlikne dette med de tilsvarende yrkesprosentene for menn. Vi kan da legge inn disse som søyler bak kvinnene, som en slags refe ransegruppe. Linje - sektor I en periode med sterk økning i antallet studenter, har også andelen kvinner blant studentene økt og kvinnene er nå i flertall. Dette kan fremstilles i et linjediagram med to linjer og separate verdiakser for de to avhengige variablene (antall studenter og andel kvinner). Problemet med to akser er (som nevnt tidligere) at det må gjøres helt tydelig hvilken akse som gjelder hvilken variabel (hvis ikke, kunne man her lett fa inntrykk av at andelen kvinner blant studentene snart er 100 prosent). 100 80 60 40 20 0 Antall 200000 150000 100000 50000 16-19 25-29 40-49 55-59 67-69 Prosent 0 0 1980 1984 1988 1992 1996 En alternativ løsning er legge inn sektor diagrammer med andelen kvinner på linjen på utvalgte tidspunkter, som en slags tilleggsopp lysning (for ikke å overlesse diagrammet, er kjønnsfordelingen gjengitt bare for enkelte år). "Linje-som-søyle " La oss anta at vi har data om tre ulike fritids aktiviteter (A, B og C) for menn og kvinner for fire forskjellige tidspunkter. Dette blir lett for mange variable for ett linjediagram. Alternativet er å lage tre separate diagrammer. Men i stedet for å presentere dem som tre frittstående dia grammer kan de settes sammen, side ved side. Ved å skraverer arealet under linjene får det 1980 1985 1990 1995 1980 1985 1990 1995 1980 1985 1990 1995 A B C 30

enkelte diagram (den enkelte aktivitet) karakter av en søyle, og vi kan nå lett sammenlikne både nivået for de tre aktivitetene og studere utviklingen over tid for aktivitetene for menn og kvinner. Diagram m/tabell Dette består rett og slett i at man i en egen tabell oppgir verdiene som diagrammet bygger på. Denne "Ole Brumm-løsningen" anbefales ikke generelt, men kan være ønskelig eller nødvendig I "jjjjjjjjjj" ~ZT"' noen ganger. Dataprogrammer som Excel og DeltaGraph inne- 4t~ holder begge slike muligheter, og den vanligste løsningen er å 2J plassere dataene/verdiene under diagrammet, slik som i eksemplet 01... _.. r.. ~-. -,.. _ Danmark Finland Norge Sverige til høyre. Denne løsningen forutsetter lmidlertid at det er relativ fa i kategorier på x-aksen, hvis ikke blir en slik tabell uleselig. Lange I!! '. _ tidsserier egner seg derfor ikke for denne typen kombinasjon. _ En annen variant er å presentere en tabell som supplerer og "utdyper" diagrammet. Mens diagrammet viser totaltall (her: andelen som har brukt ulike massemedier en dag), kan tabellen vise fordelingen på f.eks. menn og kvinner eller ulike aldersgrupper. 100 i 75~j~ 50 :_ 11l Ved siden av slike kombinasjonsdiagrammer, finnes det også en w Avis Radio lang rekke andre diagramtyper. Noen av dem er relativt spesialiserte Menn. 86 84 63 og brukes bare for spesielle formål. Her skal vi presentere noen av Kvinner: 82 78 57 de mer generelt anvendelige. 6.2. Punktdiagram Denne diagramtypen er svært vanlig i forskning og statistisk analyse, men kan også med fordel brukes for mer populære presentasjoner. Punktdiagrammet har to kvantitative skalaer og viser en toveis for deling. Det brukes til å illustrere sammenhengen mellom to kvantitative variable (det kalles derfor også ofte korrelasjonsdiagram). Diagramtypen brukes særlig for regionale data, f.eks. kommuner, fylker og land, men kan også brukes for individ-data, når antallet ikke er for stort. Eksemplet til høyre illustrerer forholdet mellom befolknings-.250: tetthet og antallet forbrytelser pr. 100 000 innbyggere i fylkene! 2or> (det er vanlig å plotte den uavhengige variabelen på den horison- So 1 bu" tale aksen og den avhengige på den vertikale): Hvert punkt (sym- i, bol) representerer altså ett fylke og vi ser at de har en tendens til å J m gruppere seg langs diagonalen, noe som indikerer en positiv fll. 50 sammenheng: Jo høyere befolkningstetthet, jo flere forbrytelser. 01 I I.-*-4^'.... 1... 1 c-,, ~ r n 1 1 1 1 40 50 60 70 80 90 100 Siden denne typen diagram tørst og fremst skal belyse sammen- % bosatt, tettbygde strøk henger snarere enn nivå, er det vanlig å ikke la aksene gå til 0. Sammenhengen i et punktdiagram er ikke alltid like lett å få øye på (og noen ganger er det heller ikke noen sammenheng). For å tydeliggjøre tendensen i materialet er det derfor vanlig å legge inn en såkalt "trendlinje" (de fleste dataprogrammer har denne mulig- heten). Denne linjen er uttrykk for f.eks. den linjære (positive eller negative) sammenhengen mellom de to variablene. LL 250T 1 ri : c o2oo{- o 04 40 50 60 70 80 90 100 % bosatt i tettbygde strøk 31

Når punkt-diagrammet ikke inneholder alt for mange enheter, kan man identifisere de enkelte enhetene. Til høyre vises sammenheng- Jemen._^ en mellom prevensjonsbruk og samlet fruktbarhetstall (SFT) i 5 ' I -syna Veitbrfden 1 utvalgte land. Identifisering av enhetene (landene) gir tilleggsopp- J rdan lysninger som øker diagrammets informasjonsverdi. T{r^a *-f Japan# Singapore 0 20 40 60 80 100 Andel gifte kv. som bruker prevensjon SFT Hvis man for eksempel opererer med to eller flere (under-) grupper 2 av enheter, kan disse identifiseres med ulike symboler, for eksem- Frankrike Ne, ~,... i- 1 1 j Storbritannia A A Finland pel nordiske og ikke-nordiske land: 1,5 A-Belgia ØsterrikeA TysklandA 1 50 60 70 80 90 100 Andel gifte kv som bruker prevensjon I eksemplene ovenfor har alle diagrammene en uavhengig variabel Menn 50 Heiias som antas å påvirke en annen, avhengig variabel. Men denne dia- Spania Frankrike gramtypen kan generelt brukes til å studere mønstre/ grupperinger i østemkesvei ØsterrikeSvei * NederiaDndnma Nederland Italia* Belgia* Norge data. Ett eksempel: Diagrammet til høyre viser andelen menn og 30! Tyskland GB# *, Luxemburg lrland, kvinner som er dagligrøykere i en del europeiske land. Uten at noen av variablene her kan sies å være uavhengig eller avhengig av den andre, er det likevel interessant å se på sammenhengen mellom dem. Ved første øyekast er bildet litt kaotisk. Men om vi legger inn en diagonallinje, ser vi f.eks. tydeligere at noen av landene (Irland, Luxemburg, Storbritannia, Island, Norge og Danmark) befinner seg på eller nær diagonalen; dvs. at andelene mannlige og kvinnelige dagligrøykere her er omtrent like store. Sveriges spesielle situasjon, med flere kvinnelige enn mannlige dagligrøykere, blir også nå tydeligere. En annen måte å "gruppere" landene på er å se på andelene menn og kvinner over og under f.eks. 30 prosent. Diagrammet visualiserer dermed en inndeling i fire grupper: Land hvor mennenes andel er over 30 prosent og kvinnenes andel er under. Det framstår som det "typiske (sør-europiske) mønsteret". Land hvor både menns og kvinners andel er over 30 prosent Land hvor både andelen menn og kvinner lavere enn 30 prosent Til slutt ser vi at ikke i noe land er kvinnenes andel over 30 prosent og mennenes under. Spania Frankrike Portugal f Danmark ØsternkeSveits : Nederland! Italia* Belgia* i * Norge 30 Tyskland * rß# * lrland By Luxemburg 32

Menn En tredje mate a visuahser et mønster i data pa, er a se pa eventu- 50-, # elle atypiske enheter. I diagrammet til høyre er de "typiske" landene gruppert sammen ved hjelp av en sirkel, mens fire land - ania «,an e \Danmark hvert på sin måte - framstår som atypiske. Avhengig av hva man ltalial e^giia3«nnorgejnd vil framheve, kan altså utformingen av et punktdiagram være med 30 ~j Tyskland 9 GB Luxemburg på å visualisere og understreke budskapet. Island Finland* Sverige 10- -10 30 Kvinner 50 6.3. Min - maks diagram (variasjonsdiagram) 30 Også kalt "flytende" søylediagram (siden verdiaksen ikke har noe 25 "naturlig 0-punkt). Dette er en diagramtype som angir variasjons bredden i et datamateriale, f.eks. høyeste og laveste verdi, eller 10 startverdi/sluttverdi. Ett slik eksempel kan være maksimums og 5 minimumstemperaturer per måned. 1 tillegg kan man legge inn _5 f.eks. gjennomsnittstemperatur som egen linje. -10-15 J FMAMJ JASOND 6.4. Flate- og volumdiagram I kapitlet om linjediagrammer nevnte vi arealdiagrammer som en form for linjediagram, hvor linjene er stablet i høyden og arealet mellom dem er skravert. Dette er den betegnelsen som vanligvis brukes om denne typen diagrammer (f.eks. i Excel). Men historisk benyttes ofte betegnelsen "flatediagram". XhrguHmdthnaade/IiOS-Ml. m m * aismaar Denne typen diagrammer var svært populære i begynnelsen av forrige århundre. Når Statistisk årbok i 1902-utgaven brakte dette diagram- m WwmhUk.-.i"i'w hhmi met, som viste utviklingen i Norges handelsflåte, så var dette helt i tråd med tidens dominerenende praksis I sin enkleste form består et flatediagram av to eller flere kvadrater; hvor sidene i kvadratet er lik kvadratroten av verdiene. Et eksempel: Ekspor ten av en vare økte fra 9 tonn i 1997 til 81 tonn i 2000. Siden denne diagramtypen ikke har verdiakser, har ikke størrelsen noen betydning; det er forholdet mellom arealene som er viktig. Det at verdiaksene mangler, gjør at verdiene må oppgis. Volumdiagrammer bygger på samme prinsippet, men er litt mer kompli sert å beregne, siden man her får en dimensjon til. 33

Flate- og volumdiagrammer benyttes i dag svært sj elden, og med god grunn: For det første er dette diagrammer som ikke finnes i de vanligste dataverktøyene; slike diagrammer må lages "for hand". For det andre: Seiv om diagrammene ofte er elegant utformet, er de vanskelige å tolke. Blant annet fordi de er to- eller tredimensjonale; dvs. at både bredden og høyden (og cv. dybden) har betyeining. I stedet for å sammenlikne f.eks. høydene på to søyler, må vi i et flatediagram sammenliknet arealet av to flater; noe som i praksis er umulig, utover å fastslå at "den ene er større enn den andre". Denne typen diagrammer har derfor sj elden annet enn en rent illustrerende funksjon. 6.5. Rangdiagram 1. Emilie Et eksempel på en rangert liste kan være Statistisk sentralbyrås statistikk over de mest populære fornavnene i året som gikk. En slik, rangert liste kan rett og slett se slik ut: 2. Ida 3. Thea 4. Julie 5. Ingrid 6. Sara 7. Malm 8. Marte 9. Nora 10. Karoline En slik rangering sammenliknes ofte med tilsvarende liste for året før. En alternativ variant er da - for hvert navn - å angi økning/nedgang i forhold til forrige år ved hjelp av symboler. Symbolene kan være f.eks. ++ + = eller piler som peker opp og ned og symboliserer sterk eller svak økning/nedgang og stabilitet. Et slik "diagram" kan se omtrent slik ut: Emilie Ida fl Thea Julie -V Ingrid \ I diagrammet til høyre rangeres europeiske land på grunnlag av andelen dagligrøykere i landene omkring 1995. Sammenliknet med en tabell eller liste som bare viser andelene i de ulike landene, får vi her i tillegg også et visuelt inntrykk av avstanden mellom dem. På grunn av formen, kalles dette av og til et termometer-diagram. 40 30 25 20/ «Heiias Frankrike Norgean Spania, Belgia, Sveits Irland Luxemburg, Østerrike Storbritannia, Island Tyskland, Italia Portugal Sverige, Finland 0 ).6. Z-diagram Dette er egentlig ikke en egen diagramtype, men en spesiell invendelse av et kumulativt linjediagram for å lage en >rognose (eksemplet til høyre viser tydelig hvorfor det har ått navnet). Det egner seg spesielt for tidsserier med måledlige data, for eksempel antall døde i trafikkulykker. Diagrammet viser tre ulike aspekter ved en variabel, her: Månedlige verdier, kumulative månedlige verdier og 12 måneders rullerende total. Eksempel: For mai viser det antall døde i mai, antallet døde i perioden januar-mai og totalen siste 12 måneder (juni-mai). C " 12 måneders total : Kumulative verdiei 150 i VT 100 **- '*''"' Måndlige verdier i f- 4 ' ' r~i 1_ \j, fr fl *tj JFMAMJJASOND 34

Etter hvert som man får tall for årets første måneder, kan man 35 "r~y~]~~r~t~t"'~p~p bruke to av tidsseriene til å "predikere" det endelige, årlige [7- - * 250 r -^r' antallet. Dette gjøres ved å legge inn såkalte trendlinjer i både 2004- \t^' - den kumulative og totale serien. Total Kumulativt Månedlig J FMAMJ JASOND 6.7. Radar-diagram En spesiell form for linjediagram er "radar"-diagrammet. Dette er et sirkulært linjediagram og egner seg godt til å visualisere forskjellige typer månedlig statistikk (man tenker seg da året som et hjul eller sirkel). Til høyre vises fødslenes fordeling over året; dvs. antall levende fødte hver måned som et avvik fra gjennomsnittet (= 100). Jan Juli 6.8. Diagram-matrise Når man har behov for å framstille tre eller flere variable grafisk, kan en diagram-matrise ofte være løsningen: Her kan leseren sammenlikne effekten av flere variabler samtidig. I eksemplet nedenfor kan vi studere lovbrudd pr. 1 000 innbyggere, fordelt på type lovbrudd, siktedes alder og år. Siktede for forbrytelser. Etter utvalgte lovbruddsgrupper og alder. Pr. 1000 innbygger. 1993-1998 15-17 år 18-20 år 21-35 år K n Volds- _ T^. kriminalitet 10 0, i i! Narkotikakriminalitet Økonomisk og annen vinningskriminalitet «5 0 L : f '!" o,o.j^4-j^4jljjbljjbl4jb_j i " T "1 " 15 0 5,0 ; 0,0 U -Ullilll 15 0 ::t» II, 1 1 1 i illilllollj I i I I 1 i 1 I i as 1993 1994 1995 1996 1997 1998 1993 «94 1995 1996 1997 «98 1993 1994 1995 1996 1997 1998 35

7. Kort om bruk av farger I det foregående er alle diagrammer laget i sort eller sort + en farge og forskjeller mellom søyler/linjer er markert med ulike gråtoner og/eller fargetoner. Og for mange (kanskje de fleste?) formål er bruk av gråtoner og raster tilstrekkelig. Det er også det billigste: Å trykke i farger er fortsatt dyrere enn sort/hvitt. Men noen ganger er farger hensiktsmessig, og heller ikke dyrere. Dette gjelder f.eks. ved bruk av diagrammer i presentasjoner, enten det nå er via transparenter eller skjerm. Bruk av farger kan sies å ha to hovedfunksjoner: Farger er et effektiv virkemiddel som kan bidra til å forbedre lesbarheten (og dermed forståelsen) av et diagram. I tillegg kan farger bidra til å gjøre dia grammet eller presentasjonen mer attraktiv eller "spennende". Når det er sagt, bør det også sies at bruk av fargerer er vanskelig og det bør skje i samråd med noen som har kunnskap og erfaring. Særlig er dette viktig når man lager noe som skal sendes til et trykkeri. 7.1. Hvilke farger? Hvilke farger man velger er selvfølgelig i stor grad et spørsmål om "smak og behag" og individuelle preferanser. Men det finnes likevel én enkel regel: Bruk ikke rene, lyse eller svært sterke farger. Benytt heller såkalte "skitne" farger; dvs. farger som innholder sort. For det første vil de rene fargene ofte lett bli (for) intense eller "skingrende". 1 tillegg er det problematisk å benytte prosenter av rene farger (på samme måte som vi bruker gråtoner i sort/hvitt). For det tredje egner disse fargene seg også dårlig til tekst. Farger som de til venstre anbefales ikke Ved valg av farger må man også tenke på hvordan de oppfører seg i kopierings -1 ei a A- maskinen: Følgende diagram egner seg 80 ~h Sene A Serie A f.eks. ikke til kopiering. Med farger rungerer det rimelig bra, men i sort/hvitt- 60" 40~~ 60:~ ' 40~~ _^1 varianten til høyre blir det vanskeligere å 20 20 ~ skille mellom seriene. o " o-l i - '< Serie B 1990 1992 1994 1996 1998 1990 1992 1994 1996 1998 Et annet eksempel: I diagrammet til høyre lar aldersgruppene seg så vidt skille ved bruk av ulike nyanser i blått. Men etter en tur gjennom kopi maskinen blir forskjellene nesten helt borte. ProS6nt! 16-24 ér " 100-r 45-66* ProS6nt 100!" ' 45-66 ér I 25-44 år I 67-79 år 25-44 år I 67-79 år son L_,, _ I- 80 L_s!, ~ 60 60 jgb Menn Kvinner Menn Kvinner 36

7.2. Fargerikt fellesskap? 100 ~ Antallet mulige eller tilgjengelige farger er nærmest uendelig. Men som I "nig ellers gjelder også her regelen om enkelhet; Det er ikke nødvendigvis j De Vis slik atflere farger øker informasjonsverdien av et diagram. I eksempelet til høyre er det brukt fire ulike farger for å skille mellom svarene på et ; 1^ spørsmål om enighet/uenighet i en påstand. Fargebruken her virker 20T \ Heit tilfeldig og lite planlagt. S ' ven'9 Siden svaralternativene her er gradert (helt/delvis enig/uenig) er det naturlig å la fargebruken gjenspeile dette; for eksempel ved at vi bruker bare to farger og graderer disse, slik at mørke farger tilsvarer "helt (u)enig" og lysere farger: "delvis (u)enig". Dvs. at "styrken" på fargen tilsvarer graden av enighet. j Helt I enig Delvis enig.. Delvis uenig ] Helt uenig Tilsvarende i linjediagrammene til høyre. Her vises utviklingen for menn og kvinner i to aldersgrupper. I stedet for å bruke fire ulike farger, bør fargene bør her brukes til å skille mellom menn og kvinner, mens aldersgruppene skilles ved ulike strektyper. Hadde linjene representert fire ulike land - derimot 6 si-^k^ul K 16-44 44 K 45-67 0+ _ hadde kanskje fire farger vært mer naturlig. 1990 1993 1996 1999 M 16^4 M 45-67 7.3. Farger hvor? Her er hovedregelen åfargelegge data; dvs. å bruke fargene først og fremst for å gjøre det lettere å sam menlikne grupper eller serier, ikke for å pynte opp et ellers "kjedelig" diagram. Bruk av farger på andre 1990 1992 1994 1996 1998 1990 1992 1994 1996 1998 elementer enn dataseriene bidrar i stor grad til å ta oppmerksomheten bort fra det som er viktig. Seiv om en publikasjon trykkes i flere farger, er dette ingen grunn til å bruke dem alle! To farger (f.eks. sort +1) kan ofte være vel så effek tivt som mange farger. 37

Litteratur Bounford, Trevor (2000): Digital Diagrams - Effective design andpresentation ofstatistical informa tion. London: Cassell & Co. Harris, Robert L. (1999): Information Graphics - A Comprehensive Illustrated Reference. London and New York: Oxford University Press. Kristiansen, Jan Erik og Jørgen Ouren (1998): Fornavn i Norge - Navnemoter og motenavn. Oslo: Ad Notam Gyldendal. Kosslyn, Stephen M. (1994): Elements ofgraph design. New York: W. H. Freeman and Company. Plain Figures (1996). Second edition by Myra Chapman and Cathy Wykes. London: The Stationary Office. Tufte, Edward R. (1983): The Visual Display ofquantitative Information. Cheshire: Graphics Press. Wallgren, A. et. al. (1994): Statistikkens hilder - att skapa diagram. Stockholm: Statistiska centralby rån. (Finnes også i engelsk utgave) White, Jan V. (1984): Using charts and graphs: 1000 ideasfor visual persuasion. New York and London: R. R. Bowker Company. 38

De sist utgitte publikasjonene i serien Notater 2002/19 F. Gundersen og L. Solheim: Regionalise ring av FoU-statistikken. 43.s 2002/20 L. Vågane: Omnibusundersøkelsen november/desember 2001. Dokumenta sjonsrapport. 565. 2002/21 G. Claus, O. Haugen, P.M. Holt og E. Knutsen: Regnskapsstatistikk. Næringsoppgaver for ikke-finansielle ak sjeselskaper, 1999. Dokumentasjon. 345. 2002/22 M. Takle: Befolkningsstatistikk på rute nett. Dokumentasjon. 35s 2002/23 D. Roll-Hansen, S. Ferstad, M. Stålnacke, P. Tuhus og R. Nøtnæs: En spørre skjemametodisk gjennomgang av datainn salmling gjennom Grunnskolens informa sjonssystem (GS I). 109s. 2002/24 T.P. Bøe og I. Håland: Dokumentasjon av arbeidskraftundersøkelsen (AKU). 85s. 2002/33 S. Reid: Bosettingskriteriene i inntekts systemet til kommunene. Erfaringer med overgang til ny bereg ningsmåte og nye bosettingskriterier, 2002. 435. 2002/34 K.E. Engebretsen, P.E Gjedtjernet, S. Kristoffersen, P.G. Larssen og J.H. Wang: Mottak og tilrettelegging av SLN-data. 495. 2002/35 D. Rafat: Analyse av sammenheng mel lom ektefellers sysselsetting i en familie. 275. 2002/36 A. Bruvoll og T. Bye: En vurdering av avfallspolitikkens bidrag til løsning av miljø - og ressursproblemer. 3ls. 2002/37 K.I. Bøe: B.R. Joneid: KOSTRA revi sjonssystem. Malverk for generelt revi sjonssystem - KOSTRA-data. Revidert utgave. 665. 2002/25 A. Akselsen og T. Sandnes: FD - Trygd: Dokumentasjonsrapport. Stønader til ens lig forsørger. 1992-2000. 465. 2002/26 E. Renning: Statistisk sentralbyrås tids bruksundersøkelse 2000/01. Dokumenta sjon og resultater fra intervjuet. 1255. 2002/27 S. Myro og C. Torp: Stedsfesting av bedifter i Bedrifts- og foretaksregisteret. Hovedprosjekt. 375. 2002/28 C. Nordseth og T. Sandnes: FD - Trygd: Dokumentasjonsrapport. Foreløpig uføre 2002/38 N. Arnesen, G. Daugstad, O.E. Halling stad, E. Skretting Lunde og B.Vold: Kva litetssikring i KOSTRA. Forslag til do kumentasjonsrutiner med erfaring fra FyI keskostra-helsetjenester, somatikk. 545. 2002/39 H. Moafi: Omlegging av folkehøgskole statistikk. Overgang til elektronisk rap portering. 3 Is. 2002/40 0. Kleven: Mediebrukundersøkelsen 2001.Dokumentasjonsrapport. 435. stønad. 1992-2000. 375. 2002/41 0. Kleven: Samordnet levekårsundersø 2002/29 S. Derakhshanfar og T. Sandnes: FD - Trygd: Dokumentsjonsrapport. Økonomisk sosialhjelp. 1992-2000. 365. 2002/30 I. Johansen: Undersøking om foreldre betaling i barnehagar, januar 2002. 425. kelse 2000 -panelundersøkelsen. Doku mentasjonsrapport. 1295. 2002/42 L. Solheim: Foreløpige tall i FoB2OOl Utvalg,vekter, estimering og usikkerhet. 645. 2002/31 T.M. Køber, H. Moafi, E. Rønning og 0. Sivertstøl: Bruk av forløpsdatabaser i Statistisk sentralbyrå. 60s. 2002/32 T.M. Normann: Omnibusundersøkelsen februar/mars 2002. Dokumentasjonsrapport. 375. 2002/43 A. Andersen, E. Birkeland, J. Epland og M. I. Kirkeberg: Økonomi og levekår for ulike grupper trygdemottakere 2001. Fo reløpig rapport. 2145. 39

/ Depotbiblioteket 9ff# Statistisk sentralbyrå Oslo: Postboks 8131 Dep. 0033 Oslo Telefon: 2109 00 00 Telefaks: 21 09 49 73 i Kongsvinger: 2225 Kongsvinger Telefon: 62 88 50 00 Telefaks: 62 88 50 30 ISSN 0806-3745 Statistisk sentralbyrå Statistics Norway