1 Tall kan temmes! Om å forstå og formidle statistikk Jan Erik Kristiansen November 2014 jkr@ssb.no 1
Det er noget fint og forstandigt ved tal. De véd hvad de vil og de gør, hvad de skal. Kumbel (Piet Hein) 2
Statistikk er... Tallfesting av sosiale forhold ( Tabellstatistikk ) = Empirisk statistikk Metoder for å lage/fortolke statistikk = Teoretisk statistikk 3
Statistikk er: Å sammenlikne tall Og: Å sørge for at tallene er (mest mulig) sammenliknbare Misbruk/feil bruk av statistikk skyldes sjelden bevisst manipulasjon av tallene, men at vi sammenlikner tall som ikke er (helt) sammenliknbare 4
Definisjoner er viktig: Eksempel: Andelen fattige/med lav inntekt 2009-2011 OECDskala 50 prosent 4,3 OECDskala 60 prosent 8,0 2009-2011/uten studenter 3,3 6,7 EUskala 50 prosent 4,4 3,2 EU-skala 60 prosent 9,2 7,7 5
Definisjoner: (forts) Eksempel: Innvandrer (2014) 1. generasjon: 633 110 1. + 2. generasjon: 759 185 Med innvandringsbakgrunn 1 065 586 Flere eksempler: Arbeidsledighet Samboer Statistikk er altså en sosial konstruksjon og ikke uberørt av menneskehender 6
Enhet? 7
Enhet: (forts) Eksempel: 4 husholdninger: A: 1 person B: 2 personer C: 2 personer D: 3 personer Sum: 8 personer A: C: B: D: Dvs.: Enslige = 25% av husholdn./13% av personene 8
på full fart mot 50 millioner flyreiser i året, og den grensen passerer vi høyst sannsynlig i år. Det betyr at hver eneste en av oss flyr i gjennomsnitt 10 ganger årlig. Innenlands: Ankomst Avgang Utenlands: Avgang Ankomst Totalt: 14 mill. 14 mil 10 mill. 10 mill. 48 mill. Innenlands: Ankomst Avgang Utenlands: Avgang Ankomst Totalt: 14 mill. 14 mill. 10 mill. 10 mill. 34 mill. Aftenposten 30/1 2013 9
Enhet: (forts) 2 PCer 10 personer = 20 PCer per 100 innb. 2 PCer 4 husholdn. = 50 % av husholdn. 2 PCer 6 personer i husholdn. med PC = 60 % 10
11 Enhet: (forts) Dobbeltrom og enkeltrom: Ant. og % rom Ant. personer: Personer: % Enkeltrom 97 Dobbeltrom 3 I alt 100 97 6 103 94,2 5,8 100,0 11
Statistikk = å sammenlikne tall Østfold: 23,4 Hele landet: 30,4 Menn: 22,2 Kvinner: 26,7 Halden 2013: 24,5% 2012: 24,2 2010: 23,4 2009: 22,7 2008: 22,1 2007: 21,7 Sarpsborg: 21,3 Fredrikstad: 26,2.. 12
To hovedtyper sammenlikninger Utvikling over tid Sammenlikning av grupper (kjønn, alder, bosted...) Eller: Både - og Forbruk av melk og mineralvann per person/år Liter 250 200 150 100 50 Helmelk Lettmelk/skummet melk Brus/mineralvann/juice Boligareal: boliger og fritidshus m 2 200 150 100 50 Boliger Fritidshus 0 0 1983 1987 1991 1995 1999 2003 2007 2011 13
Er tallene sammenliknbare? 14
15 Er tallene sammenliknbare? Bygdejentene på utdanningstoppen : : Hele 76 prosent av Ulvik-jentene i alderen 19-24 år fortsetter å studere etter videregående, viser tall fra Statistisk sentralbyrå. Til sammenligning hadde 25,4 prosent av den norske befolkningen universitets- eller høgskoleutdanning i 2006. Nationen 24/4 08 Kvinner: Menn: Kvinner Kvinner Kv. & M Hordaland hele landet hele landet Ulvik 76 29 39 37 31 15
Er tallene sammenliknbare? Sysselsettingsprosent 15-74 år: Ikke-vestlige innvandrere 53,6 Vestlige innvandrere 71,6 Øvrige befolkning 70,1 Differanse = 16,5 25-61 år: Ikke-vestlige innvandrere 57 Vestlige innvandrere 77 Øvrige befolkning 84 Differanse = 27 (Aftenposten 1/11 2012) 16
Flere begreper Absolutte tall Antall (personer, husholdn, bedrifter, trafikkulykker, aborter, ekteskapsinngåelser, etc.) Kroner Mengder: Liter, kg., tonn Relative tall Prosent Forholdstall (elever pr. lærer, elever pr. PC) Rater: pr. 1 000 innb., skilsmissehyppighet Indekser Når bruke relative tall og absolutte tall? 17
Klassekampen 10/11 07 18
Facebook-feber Antall nordmenn i nettsamfunnet har vokst med 2600 prosent de siste fire månedene. Aftenposten.no 26/4 2007 3 000 80 000 19
Relative tall, men hvilke? Døde i trafikken Pr. 100 000 innb. Pr. 100 000 biler Pr. xxx xxx kjørte km Pr. xxx xxx personkm 20
Aftenposten 16/10 2014 21
Praktiske prosenter Én av flere måter å gjøre det lettere å sammenlikne ulike tallstørrelser på To typer prosenter Prosentandeler; viser fordeling eller forholdet mellom deler og helhet. Summerer alltid til 100. Prosentvise endringer. Kan både være negative og større enn 100 prosent kan ikke summeres. 22
Prosentpoeng Kombinasjonen av prosentandeler og prosentvise endringer kan være vrien: En økning fra 5 prosent til 10 prosent = 100 prosent økning - eller: en økning på 5 prosentpoeng 23
24 Dagens Næringsliv 29/11 2009 Menn: 36 532 Menn tjener 17,6% mer enn kvinner Kvinner: 31 057 Kvinner tjener 15% mindre enn menn Diff.: 5 475 24
Prosent (forts) 200 prosent nedgang? «Bruken av mobiltelefonen blir billigere og billigere. Fra januar 1996 til januar 2001 er prisen redusert med 200 prosent» (Computerworld 7. juni 2001) 100 prosent økning = dobling 200 prosent økning = tredobling 300 prosent økning = firedobling 50 prosent nedgang = halvering Bare en økning kan være mer enn 100 prosent; ikke en nedgang. 25
Prosent (forts) 26
Forholdstall = 0,11 eller 9,3 elever per årsverk Kilde: VOX 27
Forholdstall Elever per årsverk 14 12 10 8 6 4 2 Kilde: Utdanningsforbundet, Faktaark 2004:1 0 1997 1998 1999 2000 2001 2002 2003 28
24 970 kinobesøk per 10 000 innb. Bedre: 2,5 kinobesøk per innb.? Klassekampen 10. juni 2006 29
Gjennomsnitt eller...? Menns alder ved ekteskapsinngåelsen. 2004 1400 1200 1000 800 Vanligst/ typisk : 31 år Median: 34 år Gj.snitt: 36,3 år 600 400 200 0 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 30
Gjennomsnittlig og median månedslønn for heltidsansatte. 2013 Menn Kvinner Kv. i % av M Gjennomsnitt (kr) 44 500 39 100 87,9 Median (kr) 39 300 36 700 93,4 31
De fire årstider Økt sykefravær 32
Om store tall "Fra 1990 til 2001 økte antallet kvinnelige studenter fra 33 764 til 65 756, mens antallet mannlige studenter økte fra 28 435 til 43 567". "Fra 1990 til 2001 økte antallet kvinnelige studenter fra 33 800 til 65 800, mens antallet mannlige studenter økte fra 28 400 til 43 600". 33
"Til sammen reiste vi en distanse tilsvarende 150 000 ganger rundt ekvator med buss, bane og båt". SSB 31/10 2006 Oppslag i Dagsavisen.no og ca. 50 andre aviser 31. oktober 2006 34
De store talls lov Andelen gutter som andel av alle fødte. Kommuner % gutter 100 80 60 40 20 0 2 10 16 22 28 36 45 54 74 100 152 236 565 Ant. barn født i kommunen Først ved en viss størrelse oppnår en gruppe en viss struktur (kritisk masse): - Men hvor går grensen? 35
Usikkerhet Prosent: Når er en forskjell en forskjell? Eksempel: Andelen som mener at statistikk er interessant øker fra 46 til 49 prosent. Er dette en økning som er verdt å kommentere? Tommelfingerregel: Prosentdifferanser under 4-5 sjelden interessante NB: Gjelder utvalgsundersøkelser 36
Usikkerhet: (forts) Er det noen forskjell på en økning fra 5 til 10 prosent og... fra 40 til 45 prosent? JA!... 37
Usikkerhet: (forts) 50 40 30 20 De små talls hevn 10 0 38
Usikkerhet: En tidsserie med bare små forskjeller mellom de enkelte år kan like fullt være uttrykk for en trend Andel avislesere 1991 1992 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 84 84 85 84 82 84 81 81 77 78 77 77 75 74 74 72 68 65 64 63 39
Antall drepte i trafikken 600 500 400 300 200 100 0 1950 1960 1970 1980 1990 2000 samferdselsministeren må svare på hvorfor antall døde økte sterkt i fjor. Borghild Tenden (V) (Nettavisen 2/1 2007) 40
De små talls hevn Onsdag 19. desember 2012, kl.10:21 (Dagbladet:) Forleggerforeningen og Bokhandlerforeningen offentliggjør i dag sin tredje rapport om det digitale boknorge i 2012. Den viser at norske e-bøker går en lys fremtid i møte: salget har økt med 450 % i år. Men per i dag er e-bokmarkedet marginalt. E-boksalg utgjør knappe 0,6 prosent av det totale boksalget i Norge. Dvs.: Fra 0,11% > 0,6% = 450% 41
Fallgruver: Sammenhenger Ikke alle sammenhenger innebærer årsak og virkning: Spuriøse /tilfeldige sammenhenger? f.eks. mellom tidsserier: Rentenivå og antall drepte i trafikken Rente 20 18 16 14 12 10 8 6 4 2 Utlånsrente Trafikkdrepte Drepte 500 450 400 350 300 250 200 0 1980 1985 1990 1995 2000 2005 150 42
Om tolkning av tall Kraftmagasinene fylles opp (TV2 Nettavisen 22/9 04) Fortsatt lav vannstand (DN 22/9 04) Regnet redder magasinene (Hegnar Online 22/9 04) Sykefraværet synker (Aftenposten 21/9 04) Langt unna målet (NRK 21/9 04) 43
Dn.no 27/11 2013 Aftenposten.no 27/11 2013 44
45
46
Diagrammer gir et visuelt, helhetlig inntrykk av f.eks. hovedtendenser eller forskjeller mellom grupper er pedagogiske komprimerer data MEN! 47
Diagrammer er bra, men Grafisk misvisning: 3000 2500 2000 1500 1000 500 0 1994 '95 '96 '97 '98 '99 '00 Aftenposten 18/11 2001 48
Grafisk misvisning: 250 000 Antall barn i barnehage 1 9 9 9-2 0 0 4 215 000 200 000 210 000 205 000 200 000 195 000 190 000 150 000 100 000 185 000 180 000 1999 2000 2001 2002 2003 2004 År 50 000 (Barne- og familieminister Laila Dåvøy, pressekonfeanse 15/3 05) 0 1999 2000 2001 2002 2003 2004 49
Grafisk misvisning: 100 80 60 40 20 Kvinner 0 2000 2010 Menn 50
Spagetti -diagram: Kilde: Senter for internasjonalisering av høyere utdanning 51
Pizza -diagram: Kilde: Legemiddelindustriforeningen: Tall og fakta 2006 52
Lasagne -diagram: 53