Sentralmål og spredningsmål 3.1 Læreplanmål 1 3.1 Gjennomsnitt og typetall 2 3.2 Median 6 3.3 Variasjonsbredde og kvartilbredde 10 3.4 Varians og standardavvik 15 3.5 Digitale sentralmål og spredningsmål 21 3.6 Histogram 29 3.7 Sentralmål i et gruppert materiale 33 3.8 Gruppert materiale digitalt 43 3.9 Spørreundersøkelser 48 3.9 Symboler, formler og eksempler 49 Læreplanmål for 2P-Y Planlegge, gjennomføre og vurdere statistiske undersøkelser Beregne og drøfte sentralmål og spredningsmål Gruppere data og beregne sentralmål for et gruppert datamateriale Bruke regneark i statistiske beregninger og presentasjoner
3.1 Gjennomsnitt og typetall Oppgave 3.10 I oktober et år spilte håndballspilleren Marit Løke 12 kamper. Antallet mål hun skåret var: 5, 2, 3, 0, 4, 1, 6, 2, 7, 2, 0, 2 a) Finn typetallet. Typetallet er det tallet som forekommer flest ganger. Vi ordner tallene: 0, 0, 1, 2, 2, 2, 2, 3, 4, 5, 6, 7 og ser at tallet 2 forekommer flest ganger. Typetallet er 2. b) Finn gjennomsnittet. For å finne gjennomsnittet legger vi sammen alle målene som Marit Løke skåret og deler på antall kamper. 5 + 2 + 3 + 0 + 4 + 1 + 6 + 2 + 7 + 2 + 0 + 2 12 = 34 = 2, 833 12 Oppgave 3.11 På en prøve fikk elevene disse karakterene: 3, 5, 4, 1, 3, 4, 2, 3, 1, 4, 3, 6, 3, 3, 2, 4, 5, 2, 4, 3, 4, 3, 2, 5, 2, 4, 5 a) Finn typetallet. Typetallet er det tallet som forekommer flest ganger. Vi ordner tallene: 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6 Typetallet er 3 fordi tallet forkommer flest ganger. b) Finn gjennomsnittet. For å finne gjennomsnittet legger vi sammen alle karakterene til klassen og deler på antall karakterer (elever). 3 + 5 + 4 + 1 + 3 + 4 + 2 + 3 + 1 + 4 + 3 + 6 + 3 + 3 + 2 + 4 + 5 + 2 + 4 + 3 + 4 + 3 + 2 + 5 + 2 + 4 + 5 27 = 90 = 3, 33 27 2
Oppgave 3.12 På et tidspunkt var fraværet i gruppe 2P-Y-1 slik: Fravær (timer) Frekvens 0 8 1 5 2 6 3 2 4 3 5 2 6 1 a) Finn typetallet. Vi ser i tabellen at fravær 0 timer har frekvensen 8. Det betyr at det er 8 elever som har 0 timer fravær. Ingen av de andre timer med fravær har en høyere frekvens. Typetallet er 0. b) Finn gjennomsnittsfraværet. For å finne gjennomsnittet av fraværet vil den mest oversiktlige metoden være å utvide tabellen. I den nye kolonnen multipliserer vi Fravær (timer) med Frekvens og får da en summen (S) som er det samlede fraværet til elevene (N). Fravær (timer) x Frekvens f f x 0 8 0 1 5 5 2 6 12 3 2 6 4 3 12 5 2 10 6 1 6 N = 27 S = 51 Gjennomsnittsfraværet = Summen av fravær Antall elever = S N = 51 1, 89 27 3
Oppgave 3.13 To håndballspillere noterer hvor mange mål de skårer i hver kamp, og setter opp tallene i en frekvenstabell. Mål Kamper Heidi Marit 0 3 8 1 5 10 2 8 12 3 11 7 4 9 6 5 7 3 6 4 2 7 0 0 8 1 0 a) Finn typetallet for hver av dem. Typetallet for Heidi er 3 fordi hun i 11 av kampene skåret 3 mål. Typetallet for Marit er 2 fordi hun i 12 av kampene skåret 2 mål. b) Finn gjennomsnittet for hver av dem. Vi utvider tabellen med to nye kolonner med f x for Heidi og Marit og en rad under med N for antall kamper og S for summen av antall mål. Mål Kamper Heidi Marit Heidi Marit x f f f x f x 0 3 8 0 0 1 5 10 5 10 2 8 12 16 24 3 11 7 33 21 4 9 6 36 24 5 7 3 35 15 6 4 2 24 12 7 0 0 0 0 8 1 0 8 0 N = 48 N = 48 S = 157 S = 106 Vi kan nå regne ut gjennomsnittet av skårede mål til de to håndballspillerne: Heidi, gjennomsnittlig skårede mål = Marit, gjennomsnittlig skårede mål = Summen av antall mål (f x) Summen av antall kamper = S N = 157 3, 27 48 Summen av antall mål (f x) Summen av antall kamper = S N = 106 2, 21 48 4
Oppgave 3.14 Gruppene 2P-Y-2 og 2P-Y-3 hadde den samme prøven som 2P-Y-1. Tabellen viser karakterene i de to gruppene. Karakter 2P-Y-2 2P-Y-3 1 3 1 2 6 3 3 4 8 4 7 10 5 5 5 6 2 0 Finn typetallet og gjennomsnittskarakterene for hver av de to gruppene. Typetallet for 2P-Y-2 er 4 fordi dette forekommer flest ganger (7 ganger). Typetallet for 2P-Y-3 er 4 fordi dette forekommer flest ganger (10 ganger). Vi utvider tabellen med to nye kolonner med f x for 2P-Y-2 og 2P-Y-3 og en rad under med N for antall elever og S for summen av karakterene. Karakter Antall elever 2P-Y-2 2P-Y-3 2P-Y-2 2P-Y-3 x f f f x f x 1 3 1 3 1 2 6 3 12 6 3 4 8 12 24 4 7 10 28 40 5 5 5 25 25 6 2 0 12 0 N = 27 N = 27 S = 92 S = 96 2P Y 2 sitt gjennomsnitt = 2P Y 3 sitt gjennomsnitt = Summen av karakterer (f x) Summen av antall elever Summen av karakterer (f x) Summen av antall elever = S N = 92 3, 41 27 = S N = 96 3, 56 27 5
3.2 Median Oppgave 3.20 Håndballspilleren Marit Løke spilte 12 kamper. Tallet på mål hun skåret, var : 5, 2, 3, 0, 4, 1, 6, 2, 7, 2, 0, 2 Finn medianen. Først ordner vi serien i stigende rekkefølge: 0, 0, 1, 2, 2, 2, 2, 3, 4, 5, 6, 7 6. 7. Medianen er den midtre verdien i serien. I dette tilfellet har vi en tallserie på 12 tall. Da er medianen mellom det 6. og det 7. tallet. Vi beregner medianen: Det 6. tallet + Det 7. tallet 2 = 2 + 2 2 = 2 Oppgave 3.21 På en prøve fikk elevene disse karakterene: 3, 5, 4, 1, 3, 4, 2, 3, 1, 4, 3, 6, 3, 3, 2, 4, 5, 2, 4, 3, 4, 3, 2, 5, 2, 4, 5 Finn medianen. Medianen er den midtre verdien når vi har ordnet tallserien. Her har vi en tallserie på 27 tall. Da er den midtre verdien det 14. tallet. Vi ordner serien: 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6 Medianen er 3. Vi kan også beregne mediantallet slik: N+1 = 27+1 = 14 Der N er antall observasjoner. 2 2 6
Oppgave 3.22 Fraværet i gruppe 2P-Y-1 er gitt i denne tabellen: Fravær (timer) Frekvens 0 8 1 5 2 6 3 2 4 3 5 2 6 1 Finn medianen. I stedet for å skrive opp alle tallene etter hverandre slik som i oppgave 3.20 og 3.21 utvider vi tabellen med Kumulative frekvens. Fravær (timer) Frekvens Kumulativ frekvens 0 8 8 1 5 13 2 6 19 3 2 21 4 3 24 5 2 26 6 1 27 Som vi ser har vi da 27 observasjoner (elever). Vi beregner mediantallet: N+1 = 27+1 = 14 Der N er antall observasjoner (elever). 2 2 Elev fra og med nummer 14 og til og med nummer 19 har 2 timer fravær. Medianen er elev nummer 14 og medianen (fraværet) er da 2. 7
Oppgave 3.23 Tabellen viser antallet mål for håndballspillerne Heidi og Marit. Mål Kamper Heidi Marit 0 3 8 1 5 10 2 8 12 3 11 7 4 9 6 5 7 3 6 4 2 7 0 0 8 1 0 Finn medianen for hver av dem. Vi utvider tabellen med Kumulativ frekvens for både Heidi og Marit. Mål Kamper Kumulativ frekvens Heidi Marit Heidi Marit 0 3 8 3 8 1 5 10 8 18 2 8 12 16 30 3 11 7 27 37 4 9 6 36 43 5 7 3 43 46 6 4 2 47 48 7 0 0 47 48 8 1 0 48 48 Som vi ser har vi da 48 observasjoner (skårede mål). Vi beregner mediantallet: N+1 = 48+1 = 24,5 Det betyr mellom 24 og 25 skårede mål. 2 2 For Heidi ser vi at 24,5 ligger i intervallet 17-27 som er 3 skårede mål og som gir oss median = 3. For Marit ser vi at 24,5 ligger i intervallet 19-30 som er 2 skårede mål og som gir oss median = 2. 8
Oppgave 3.24 Tabellen viser karakterene for gruppene 2P-Y-2 og 2P-Y-3. Karakter 2P-Y-2 2P-Y-3 1 3 1 2 6 3 3 4 8 4 7 10 5 5 5 6 2 0 Finn medianen for hver av de to gruppene. Vi utvider tabellen med Kumulativ frekvens for både 2P-Y-2 og 2P-Y-3. Kumulativ frekvens Karakter 2P-Y-2 2P-Y-3 2P-Y-2 2P-Y-3 1 3 1 3 1 2 6 3 9 4 3 4 8 13 12 4 7 10 20 22 5 5 5 25 27 6 2 0 27 27 Som vi ser har vi da 27 observasjoner (elever). Vi beregner mediantallet: N+1 = 27+1 = 14 Det betyr at karakter nummer 14 er medianen. 2 2 For 2P-Y-2 ser vi at 14 ligger i intervallet 14 20 som er karakteren 4 og som gir oss median = 4. 1..1..1..2..2..2..2..2..2..3..3..3..3..4..4..4..4..4..4..4..5..5..5..5..5..6..6 For 2P-Y-3 ser vi at 14 ligger i intervallet 13 22 som er karakteren 4 og som gir oss median = 4. 1..2..2..2..3..3..3..3..3..3..3..3..4..4..4..4..4..4..4..4..4..4..5..5..5..5..5 9
3.3 Variasjonsbredde og kvartilbredde Oppgave 3.30 Vi måler høyden til sju jenter. Høydene er: 177 cm, 164 cm, 170 cm, 168 cm, 172 cm, 161 cm, 169 cm a) Finn medianen, nedre kvartil og øvre kvartil. Vi ordner observasjonene i stigende rekkefølge: 161, 164, 168, 169, 170, 172, 177 Vet at median er tallet i midten av observasjonene, tallet er 169 cm. Nedre kvartil er tallet i midten av nedre halvdel av alle observasjonene, tallet er 164 cm. Øvre kvartil er tallet i midten av øvre halvdel av alle observasjonene, tallet er 172 cm. Det vil ofte være lettere å finne median (Q 2 ), nedre kvartil (Q 1 ) og øvre kvartil (Q 3 ) når vi lager en tabell eller tegning slik som her: NEDRE HALVDEL ØVRE HALVDEL 161 cm 164 cm 168 cm 169 cm 170 cm 172 cm 177 cm nedre kvartil median øvre kvartil Q 1 Q 2 Q 3 b) Finn variasjonsbredden og kvartilbredden. Variasjonsbredden er differansen (forskjellen) mellom den høyeste og laveste observasjonsverdien. Variasjonsbredden = 177 cm 161 cm = 16 cm Kvartilbredden er differansen (forskjellen) mellom øvre kvartil og nedre kvartil. Kvartilbredden = øvre kvartil (Q 3 ) nedre kvartil (Q 1 ) = 172cm 164cm = 8 cm Oppgave 3.31 Vi veier 11 rekrutter og får disse vektene i kilogram: 73, 85, 71, 75, 74, 79, 86, 70, 74, 62, 69 a) Finn medianen, nedre kvartil og øvre kvartil. Vi ordner observasjonene i stigende rekkefølge: 62, 69, 70, 71, 73, 74, 74, 75, 79, 85, 86 Vet at median er tallet i midten av observasjonene og som vi ser er dette 74 kg. Nedre kvartil er tallet i midten av nedre halvdel av alle observasjonene, tallet er 70 kg. Øvre kvartil er tallet i midten av øvre halvdel av alle observasjonene, tallet er 79 kg. 10
Det vil ofte være lettere å finne median, nedre kvartil og øvre kvartil når vi lager en tabell eller tegning slik som her: NEDRE HALVDEL ØVRE HALVDEL 62 69 70 71 73 74 74 75 79 85 86 nedre kvartil median øvre kvartil Q 1 Q 2 Q 3 b) Finn variasjonsbredden og kvartilbredden. Variasjonsbredden er differansen (forskjellen) mellom den høyeste og laveste verdien. Variasjonsbredden = 86 kg 62 kg = 24 kg Kvartilbredden er differansen (forskjellen) mellom øvre kvartil og nedre kvartil. Kvartilbredden = øvre kvartil (Q 3 ) nedre kvartil (Q 1 ) = 79 kg 70 kg = 9 kg Oppgave 3.32 På en prøve fikk elevene disse karakterene: 3, 5, 4, 1, 3, 4, 2, 3, 1, 4, 3, 6, 3, 3, 2, 4, 5, 2, 4, 3, 4, 3, 2, 5, 2, 4, 5 a) Finn medianen, nedre kvartil og øvre kvartil. Løsningsforslag når vi ordner tallmaterialet i stigende rekkefølge: 1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 6 Q 1 Q 2 Q 3 Nedre kvartil (Q 1 ) = 2 Median (Q 2 ) = 3 Øvre kvartil (Q 3 ) = 4 11
Løsningsforslag når vi lager en frekvenstabell: Karakter Frekvens Kumulativ frekvens 1 2 2 2 5 7 3 8 15 4 7 22 5 4 26 6 1 27 Median(Q 2 ) = 27+1 2 Nedre kvartil (Q 1 ) = 13+1 2 = 14 14 ligger i intervallet 8 til 15 som gir oss karakter = 3. = 7 7 ligger i intervallet 3 til 7 som gir oss karakter = 2. Øvre kvartil (Q 3 ) = 14 + 7 = 21 21 ligger i intervallet 16 til 22 som gir oss karakter = 4. b) Finn variasjonsbredden og kvartilbredden. Variasjonsbredden = Høyeste karakter Laveste karakter = 6 1 = 5 Kvartilbredden = Øvre kvartil (Q 3 ) Nedre kvartil (Q 1 ) = 4 2 = 2 Oppgave 3.33 Tabellen viser hvor mange mobiltelefoner elevene i en klasse har hatt. Telefoner Elever 0 1 1 6 2 7 3 5 4 4 5 3 6 1 a) Finn medianen, nedre kvartil og øvre kvartil. Løsningsforslag når vi ordner tallmaterialet i stigende rekkefølge: 0 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 4 4 4 4 5 5 5 6 Q 1 Q 2 Q 3 Nedre kvartil (Q 1 ) = 1 Median (Q 2 ) = 2 Øvre kvartil (Q 3 ) = 4 12
Løsningsforslag når vi lager en frekvenstabell: Telefoner Elever Kumulativ frekvens 0 1 1 1 6 7 2 7 14 3 5 19 4 4 23 5 3 26 6 1 27 Median(Q 2 ) = 27+1 2 Nedre kvartil (Q 1 ) = 13+1 2 = 14 14 ligger i intervallet 8 til 14 som gir oss antall = 2. = 7 7 ligger i intervallet 2 til 7 som gir oss antall = 1. Øvre kvartil (Q 3 ) = 14 + 7 = 21 21 ligger i intervallet 20 til 23 som gir oss antall = 4. b) Finn variasjonsbredden og kvartilbredden. Variasjonsbredden = Høyeste antall Laveste antall = 6 0 = 6 Kvartilbredden = Øvre kvartil (Q 3 ) Nedre kvartil (Q 1 ) = 4 1 = 3 Oppgave 3.34 En klasse har gjennomført en undersøkelse om søvn blant elevene i klassen. Tabellen viser hvor mange dager i løpet av ei uke elevene la seg til å sove etter midnatt. Dager Elever 0 4 1 1 2 10 3 7 4 2 5 0 6 2 7 1 13
a) Finn medianen, nedre kvartil og øvre kvartil. Løsningsforslag når vi ordner tallmaterialet i stigende rekkefølge: 0 0 0 0 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 6 6 7 Q 1 Q 2 Q 3 Nedre kvartil (Q 1 ) = 2 Median (Q 2 ) = 2 Øvre kvartil (Q 3 ) = 3 Løsningsforslag når vi lager en frekvenstabell: Dager Elever Kumulativ frekvens 0 4 4 1 1 5 2 10 15 3 7 22 4 2 24 5 0 24 6 2 26 7 1 27 Median(Q 2 ) = 27+1 2 Nedre kvartil (Q 1 ) = 13+1 2 = 14 14 ligger i intervallet 6 til 15 som gir oss antall = 2. = 7 7 ligger i intervallet 6 til 15 som gir oss antall = 2. Øvre kvartil (Q 3 ) = 14 + 7 = 21 21 ligger i intervallet 16 til 22 som gir oss antall = 3. b) Finn variasjonsbredden og kvartilbredden. Variasjonsbredden = Høyeste antall Laveste antall = 7 0 = 7 Kvartilbredden = Øvre kvartil (Q 3 ) Nedre kvartil (Q 1 ) = 3 2 = 1 14
3.4 Varians og standardavvik Oppgave 3.40 Vi ser igjen på høyden til de sju jentene i oppgave 3.30. Høydene var: 177 cm, 164 cm, 170 cm, 168 cm, 172 cm, 161 cm, 169 cm a) Finn variansen. Finner først gjennomsnittet (g): 177 + 164 + 170 + 168 + 172 + 161 + 169 7 168, 7 cm Høyde x Kvadratisk avvik (x g) 2 177 (177 168,7) 2 = ( 8,3) 2 068,9 164 (164 168,7) 2 = ( 4,7) 2 022,1 170 (170 168,7) 2 = ( 1,3) 2 001,7 168 (168 168,7) 2 = ( 0,7) 2 000,5 172 (172 168,7) 2 = ( 3,3) 2 010,9 161 (161 168,7) 2 = ( 7,7) 2 059,3 169 (169 168,7) 2 = ( 0,3) 2 000,1 A 163,5 Vi finner da at summen av de kvadratiske avvikene (A) er 163,5 cm 2 Variansen = A N = 163,5 cm2 7 23, 4 cm 2 A er summen av de kvadratiske avvikene N er antall observasjoner b) Finn standardavviket. standardavviket = variansen = A N 163,5 cm2 = 7 4, 8 cm 15
Oppgave 3.41 De 11 rekruttene i oppgave 3.31 hadde disse vektene i kilogram: 73, 85, 71, 75, 74, 79, 86, 70, 74, 62, 69 a) Finn variansen. Finner først gjennomsnittet (g): 73 + 85 + 71 + 75 + 74 + 79 + 86 + 70 + 74 + 62 + 69 11 74, 4 kg Vekt x Kvadratisk avvik (x g) 2 73 (73 74,4) 2 = ( 01,4) 2 001,96 85 (85 74,4) 2 = ( 10,6) 2 112,36 71 (71 74,4) 2 = ( 03,4) 2 011,56 75 (75 74,4) 2 = ( 00,6) 2 000,36 74 (74 74,4) 2 = ( 00,4) 2 000,16 79 (79 74,4) 2 = ( 04,6) 2 021,16 86 (86 74,4) 2 = ( 11,6) 2 134,56 70 (70 74,4) 2 = ( 04,4) 2 019,36 74 (74 74,4) 2 = ( 00,4) 2 000,16 62 (62 74,4) 2 = ( 12,4) 2 153,76 69 (69 74,4) 2 = ( 05,4) 2 029,16 A 484,56 Vi finner da at summen av kvadratene av avvikene (A) er 484,56 kg 2 Variansen = A N = 484,56 kg2 11 44, 05 kg 2 A er summen av de kvadratiske avvikene N er antall observasjoner b) Finn standardavviket. standardavviket = variansen = A N 484,56 kg2 = 11 6, 64 kg 16
Oppgave 3.42 I en undersøkelse om matvanene i en klasse ble elevene spurt om hvor mange dager alle i familien hadde spist middag sammen i løpet av den siste uka. Her er resultatet: Ganger Elever 0 2 1 0 2 5 3 1 4 4 5 5 6 7 7 3 Finn gjennomsnittet, variansen og standardavviket. Vi utvider og får en frekvenstabell: Ganger x Elever f f x 0 2 0 1 0 0 2 5 10 3 1 3 4 4 16 5 5 25 6 7 42 7 3 21 N = 27 S = 117 Gjennomsnittet (g): Summen av antall middager som ble spist Antall elever = S N = 117 27 4, 33 ganger Ganger x Elever f. f (x g) 2 0 2 2 (0 4,33) 2 037,50 1 0 0 (1 4,33) 2 = 000,00 2 5 5 (2 4,33) 2 027,14 3 1 1 (3 4,33) 2 001,77 4 4 4 (4 4,33) 2 000,44 5 5 5 (5 4,33) 2 002,24 6 7 7 (6 4,33) 2 019,52 7 3 3 (7 4,33) 2 021,39 N = 27 A 110,00 17
Vi finner da at summen av kvadratene av avvikene (A) er 110,00 Variansen = A N = 110,00 27 4, 07 A er summen av de kvadratiske avvikene N er antall observasjoner standardavviket = variansen = A N = 110,00 27 2, 02 Oppgave 3.43 I en undersøkelse om matvanene ble elevene på vg3 spurt hvor mange typer frukt og grønt de hadde spist det siste døgnet. Her er resultatet: Antall typer frukt/grønt Frekvensen (elever) 0 5 1 12 2 28 3 42 4 32 5 8 6 6 Finn gjennomsnittet, variansen og standardavviket. Vi utvider og får en frekvenstabell: Typer x Elever f f x 0 5 0 1 12 12 2 28 56 3 42 126 4 32 128 5 8 40 6 6 36 N = 133 S = 398 Gjennomsnittet (g): Summen av antall frukt og grønt elevene hadde spist Antall elever = S = 398 2, 99 ganger N 133 18
Typer x Elever f. f (x g) 2 0 5 05 (0 2,99) 2 044,70 1 12 12 (1 2,99) 2 047,52 2 28 28 (2 2,99) 2 027,44 3 42 42 (3 2,99) 2 000,00 4 32 32 (4 2,99) 2 032,64 5 8 08 (5 2,99) 2 032,32 6 6 06 (6 2,99) 2 054,36 N = 133 A 238,98 Vi finner da at summen av kvadratene av avvikene (A) er 239 Variansen = A = 239 1, 80 A er summen av de kvadratiske avvikene N 133 N er antall observasjoner standardavviket = variansen = A N = 239 133 1, 34 Oppgave 3.44 Karakterene for begge 2P-Y gruppene på en skole finner vi i denne tabellen: Karakter Frekvens 1 5 2 12 3 18 4 9 5 6 6 2 Finn gjennomsnittet, variansen og standardavviket. 19
Vi utvider og får en frekvenstabell: Karakter x Elever f f x 1 5 5 2 12 24 3 18 54 4 9 36 5 6 30 6 2 12 N = 52 S = 161 Gjennomsnittet (g): Summen av karakterene elevene fikk Antall elever = S N = 161 52 3, 10 Karakter x Elever f. f (x g) 2 1 5 05 (1 3,10) 2 22,05 2 12 12 (2 3,10) 2 14,52 3 18 18 (3 3,10) 2 00,18 4 9 09 (4 3,10) 2 07,29 5 6 06 (5 3,10) 2 21,66 6 2 02 (6 3,10) 2 16,82 N = 52 A 82,52 Vi finner da at summen av kvadratene av avvikene (A) er 82,52 Variansen = A N = 82,52 52 1, 59 A er summen av de kvadratiske avvikene N er antall observasjoner standardavviket = variansen = A N = 82,52 52 1, 26 20
3.5 Digitale sentralmål og spredningsmål Oppgave 3.50 a) Lag et regneark som du kan bruke til å finne gjennomsnittet og standardavviket for karakterene til gruppen 2P-Y-2 i oppgave 3.24. Finne gjennomsnittet: Henter verdiene fra oppgave 3.24 og legger til x, f og f x For å finne gjennomsnittet må vi også summere f og f x og setter inn en rad til. Karakter x 2P-Y-2 f. f x 1 3 3 2 6 12 3 4 12 4 7 28 5 5 25 6 2 12 N = 27 S = 92 Gjennomsnittet (g): Summen av karakterene elevene fikk Antall elever = S = 92 3, 41 N 27 I ett regneark vil det kunne se slik ut:.feltene SOM ER GULE. inneholder disse formlene: C3 C8 B9 C9 C11 =SUMMER(A3*B3) =SUMMER(A8*B8) =SUMMER(B3:B8) =SUMMER(C3:C8) =SUMMER(C9/B9) 21
Finne standardavviket: Vi fortsetter på regnearket vi laget i Excel fordi vi har celleverdier som vi trenger for å kunne beregne standardavviket og så slipper vi å lage ett nytt regneark..feltene SOM ER GULE. inneholder disse formlene: C3 C8 D3 D8 B9 C9 D9 C11 C12 C13 =SUMMER(A3*B3) =SUMMER(A8*B8) =SUMMER(B3*(A3-$C$11)^2) =SUMMER(B8*(A8-$C$11)^2) =SUMMER(B3:B8) =SUMMER(C3:C8) =SUMMER(D3:D8) =SUMMER(C9/B9) =SUMMER(D9/B9) =ROT(C12) For å vise celleformlene i Excel kan vi bruke hurtigkommandoen Ctrl + J Her ser du ett lite utsnitt av regnearket når vi har brukt hurtigkommandoen Ctrl + J 22
b) Bruk regnearket i oppgave a til å finne gjennomsnittet og standardavviket for karakterene til gruppen 2P-Y-3 i oppgave 3.24. Finne gjennomsnittet: Henter verdiene fra oppgave 3.24 og legger til x, f og f x For å finne gjennomsnittet må vi også summere f og f x og setter inn en rad til. Karakter x 2P-Y-3 f. f x 1 1 1 2 3 6 3 8 24 4 10 40 5 5 25 6 0 0 N = 27 S = 96 Gjennomsnittet (g): Summen av karakterene elevene fikk Antall elever = S = 96 3, 56 N 27 I ett regneark vil det kunne se slik ut:.feltene SOM ER GULE. inneholder disse formlene: C3 C8 B9 C9 C11 =SUMMER(A3*B3) =SUMMER(A8*B8) =SUMMER(B3:B8) =SUMMER(C3:C8) =SUMMER(C9/B9) 23
Finne standardavviket: Vi fortsetter på regnearket vi laget i Excel fordi vi har celleverdier som vi trenger for å kunne beregne standardavviket og så slipper vi å lage ett nytt regneark..feltene SOM ER GULE. inneholder disse formlene: C3 C8 D3 D8 B9 C9 D9 C11 C12 C13 =SUMMER(A3*B3) =SUMMER(A8*B8) =SUMMER(B3*(A3-$C$11)^2) =SUMMER(B8*(A8-$C$11)^2) =SUMMER(B3:B8) =SUMMER(C3:C8) =SUMMER(D3:D8) =SUMMER(C9/B9) =SUMMER(D9/B9) =ROT(C12) For å vise celleformlene i Excel kan vi bruke hurtigkommandoen Ctrl + J Her ser vi ett lite utsnitt av regnearket når vi har brukt hurtigkommandoen Ctrl + J 24
Oppgave 3.51 a) Lag et regneark som du kan bruke til å finne gjennomsnittet og standardavviket for målene til håndballspilleren Heidi i oppgave 3.23. Finne gjennomsnittet: Henter verdiene fra oppgave 3.23 og legger til x, f og f x. For å finne gjennomsnittet må vi også summere kolonnene f og f x og setter inn en rad til. Mål Kamper Heidi x f f x 0 3 0 1 5 5 2 8 16 3 11 33 4 9 36 5 7 35 6 4 24 7 0 0 8 1 8 N = 48 S = 157 Gjennomsnittet (g): Summen av skårede mål Antall kamper = S N = 157 48 3, 27 Finne standardavviket: I ett regneark vil det kunne se slik ut: 25
For å kunne se hvilke formler som er lagt inn i den enkelte celle bruke vi hurtigkommandoen Ctrl + J b) Bruk regnearket i oppgave a til å finne gjennomsnittet og standardavviket for målene til Marit i oppgave 3.23. Finne gjennomsnittet og standardavviket: I oppgaven står det at vi skal bruke det samme regnearket som i oppgave a). Vi slipper da å lage hele regnearket på nytt og bytter bare ut de verdiene for skårede mål (f). Gjennomsnittet er som vi ser av regnearket over: 2,21 skårede mål per kamp Standardavviket er : 1,65 26
Oppgave 3.52 a) Bruk regnearket «Mål i frekvenstabeller» til å finne typetallet, medianen, gjennomsnittet, variasjonsbredden, kvartilbredden og standardavviket for målene til håndballspilleren Heidi i oppgave 3.23. Vi skriver inn verdiene for Heidi i regnearket, og leser av: Sentralmål Spredningsmål Typetall: 3 Variasjonsbredde: 8 Median: 3 Kvartilbredde: 2,5 Gjennomsnitt: 3,27 Standardavvik: 1,76 b) Bruk regnearket til å finne typetallet, medianen, gjennomsnittet, variasjonsbredden, kvartilbredden og standardavviket for målene til håndballspilleren Marit i oppgave 3.23. Vi skriver inn verdiene for Marit i regnearket, og leser av: Sentralmål Spredningsmål Typetall: 2 Variasjonsbredde: 6 Median: 2 Kvartilbredde: 2 Gjennomsnitt: 2,21 Standardavvik: 1,65 c) Hvilket sentralmål og hvilket spredningsmål syns du er det beste her? Et sentralmål forteller hvor midten i et tallmateriale er ulike typer sentralmål er: Ulike typer er: Typetall, Gjennomsnitt og Median Gjennomsnitt er det sentralmålet som for oss mennesker er den beste beskrivelsen av ett tallmateriale da det er lett å sammenligne dette tallet med andre tall i datamaterialet. Spredningsmål beskriver spredningen i ett tallmateriale: Ulike typer er: Variasjonsbredde, Kvartilbredde, Varians og Standardavvik. Standardavvik er ett spredningsmål som tar hensyn til alle tallene i et datamateriale og vil være det spredningsmålet som er best. 27
Oppgave 3.53 Tabellen gir en oversikt over antallet barn under 18 år i norske barnefamilier 1. januar 2013. Barn 1 2 3 4 5 6 Familier 212 754 249 628 98 651 18 953 3746 1725 a) Bruk regnearket «Mål i frekvenstabeller» til å finne typetallet, medianen, gjennomsnittet, variasjonsbredden, kvartilbredden og standardavviket. Vi skriver inn verdiene i regnearket, og leser av: Sentralmål Spredningsmål Typetall: 2 Variasjonsbredde: 5 Median: 2 Kvartilbredde: 1 Gjennomsnitt: 1,90 Standardavvik: 0,87 b) Hvilket sentralmål og hvilket spredningsmål syns du er det beste her? Et sentralmål forteller hvor midten i et tallmateriale er ulike typer sentralmål er: Ulike typer sentralmål er: Typetall, Gjennomsnitt og Median Gjennomsnitt er det sentralmålet som for oss mennesker er den beste beskrivelsen av ett tallmateriale da det er lett å sammenligne dette tallet med andre tall i datamaterialet. Vi kan også tenke at typetallet er det vanligste og at dette er det beste spredningsmålet. Spredningsmål beskriver spredningen i ett tallmateriale: Ulike typer spredningsmål er: Variasjonsbredde, Kvartilbredde, Varians og Standardavvik. Standardavvik er ett spredningsmål som tar hensyn til alle tallene i et datamateriale og vil være det spredningsmålet som gir den beste informasjonen om datamaterialet. Vi kan også tenke at 0,87 er omtrent 1 og at gjennomsnittet er omtrent 2 som gir oss at 2 barn ± 1 er det vanligste. Altså fra 1 til 3 barn. 28
3.6 Histogram Oppgave 3.60 Vi veier elevene på en skole og får resultatene i tabellen nedenfor. Lag et histogram som viser fordelingen. Vekt (kg) Frekvens [40, 50 18 [50, 55 38 [55, 60 33 [60, 65 46 [65, 70 35 [70, 80 29 [80, 90 11 [90, 120] 8 N = 218 Et diagram der vi korrigerer (tar hensyn til) intervallbredden kaller vi et histogram. Intervallbredden til [40, 50 er 10 fordi 50 40 = 10 Vi tar hensyn til søylehøyde og intervallbredden ved å bruke denne formelen: søylehøyden = frekvensen intervallbredden Utvider tabellen med Intervallbredde og Søylehøyde. Intervall (Vekt) [a, b Frekvens f Intervallbredde b a Søylehøyde f b a [40, 50 18 10 1,8 [50, 55 38 5 7,6 [55, 60 33 5 6,6 [60, 65 46 5 9,2 [65, 70 35 5 7,0 [70, 80 29 10 2,9 [80, 90 11 10 1,1 [90, 120] 8 30 0,3 N = 218 Her er det ferdige histogrammet som vi har tegnet manuelt: 10 8 6 4 2 40 50 55 60 65 70 80 90 120 29
Histogram i GeoGebra Utgangspunktet er en tabell med Intervallbredde og Søylehøyde: Dette skriver vi inn i Regneark i GeoGebra Intervall (Vekt) [a, b Frekvens f Intervallbredde b a Søylehøyde f b a [40, 50 18 10 1,8 [50, 55 38 5 7,6 [55, 60 33 5 6,6 [60, 65 46 5 9,2 [65, 70 35 5 7,0 [70, 80 29 10 2,9 [80, 90 11 10 1,1 [90, 120] 8 30 0,3 N = 218 NB! Husk at GeoGebra ikke vil ha komma (, ) i Regneark, men punkt (. ) Merk intervaller (A2 til A10) i GeoGebra, høyreklikk og velg Lag Liste Merk intervaller (B2 til B9)i GeoGebra, høyreklikk og velg Lag Liste Vi har nå laget to lister, Liste1 og Liste2. Nederst i kommandofeltet skriver vi inn: Histogram[Liste1, Liste2] Vi får da dette resultatet: NB! GeoGebra viser at noe som betyr at N = 219 (antall observasjoner). Vi vet at N = 218, men fordi søylehøyden er avrundet til 0,3 for intervallet [90, 120] og ikke oppgitt til 0,26666... som er den eksakte verdien får vi denne unøyaktigheten. 30
Oppgave 3.61 Denne tabellen viser folketallet i Norge 1.1.2013 fordelt etter alder. Alder (år) Folketall i tusen [0, 6 375 [6, 16 617 [16, 20 263 [20, 30 670 [30, 40 681 [40, 50 736 [50, 67 1036 [67, 100] 673 a) Finn folketallet i Norge 1.1.2013. b) Lag et histogram som viser aldersfordelingen. Vi utvider tabellen for å løse oppgave a) og b). Summerer folketallet N = 5051 som da gir oss 5 051 000. Intervall (Alder) [a, b Frekvens (Folketall i tusen) Intervallbredde b a Søylehøyde f b a [0, 6 375 6 62,50 [6, 16 617 10 61,70 [16, 20 263 4 65,75 [20, 30 670 10 67,00 [30, 40 681 10 68,10 [40, 50 736 10 73,60 [50, 67 1036 17 60,94 [67, 100] 673 33 20,39 N = 5051 80 70 60 50 40 30 20 10 6 16 20 30 40 50 67 100 31
Oppgave 3.62 Denne tabellen viser folketallet i Botswana 1.1.2010 fordelt etter alder. Alder (år) Folketall i tusen [0, 5 229 [5, 15 467 [15, 20 230 [20, 30 432 [30, 40 281 [40, 50 165 [50, 65 143 [65, 100] 77 a) Finn folketallet i Botswana 1.1.2010. b) Lag et histogram som viser aldersfordelingen. Vi utvider tabellen for å løse oppgave a) og b). Summerer folketallet N = 2024 som da gir oss 2 024 000. Intervall (Alder) [a, b Frekvens (Folketall i tusen) Intervallbredde b a Søylehøyde f b a [0, 5 229 5 45,80 [5, 15 467 10 46,70 [15, 20 230 5 46,00 [20, 30 432 10 43,20 [30, 40 281 10 28,10 [40, 50 165 10 16,50 [50, 65 143 15 9,53 [65, 100] 77 35 2,20 N = 2024 80 70 60 50 40 30 20 10 5 15 20 30 40 50 65 100 32
c) Sammenlign histogrammene i oppgave 3.61 og 3.62. Hvordan vil du beskrive forskjellen i alderssammensetningen mellom Norge og Botswana? 0 ÅR NORGE BOTSWANA 100 ÅR Her har vi lagt de to histogrammene av aldersfordelingen i de to landene oppå hverandre. Vi ser at befolkningen i Botswana reduseres kraftig med økt alder mens befolkningen i Norge holder seg stabil over en lang periode. Befolkningen i Norge har en vesentlig høyere gjennomsnittlig levealder. 33
3.7 Sentralmål i et gruppert materiale Oppgave 3.70 Vi måler høyden til elevene i en gruppe. Høydene i centimeter er : 172, 180, 160, 183, 177, 175, 180, 185, 158, 162, 179, 180, 172, 164, 162, 191, 177, 159, 178, 175, 168, 162, 188, 181, 170 a) Finn den nøyaktige verdien for medianen. Vi har 25 observasjoner, medianen (midten) i datamaterialet er da observasjon nummer 25+1 = 13 Vi sortere datamaterialet og leser av medianen som er 175 cm. 158 159 160 162 162 162 164 168 170 172 172 175 175 177 177 178 179 180 180 180 181 183 185 188 191 13 b) Lag en gruppert frekvenstabell der bredden i alle intervallene er 5 cm. La intervallene være [155, 160, [160, 165, osv. 2 Intervall (Alder) Frekvens (f) Kumulativ frekvens [155, 160 2 2 [160, 165 5 7 [165, 170 1 8 [170, 175 3 11 [175, 180 6 17 [180, 185 5 22 [185, 190 2 24 [190, 195] 1 25 N = 25 c) Bruk gruppert materiale til å finne medianen. Vi har 25 observasjoner, medianen i datamaterialet er da observasjon nummer 25+1 = 13 158 159 160 162 162 162 164 168 170 172 172 175 175 177 177 178 179 180 180 180 181 183 185 188 191 12 13 14 15 16 17 Over har vi gruppert datamaterialet i intervaller slik som i den grupperte frekvenstabellen fra oppgave b). Vi ser at medianen fra oppgave a) ligger i intervallet [175, 180 og som nummer 2 av i alt 6 observasjoner i dette intervallet. Husk at når vi nå ser på observasjonene matematisk fordeler observasjonene seg jevnt i intervallet [175, 180. Ved regning vil da den gjennomsnittlige observasjon i intervallet være: 175 + ( 2 5 ) = 176, 66 177 cm 6 2 34
176,66 En alternativ måte å finne medianen på er ved grafisk løsning. Grafisk løsning får vi ved å bruke et tegneprogram eller GeoGebra. Her er det brukt OpenOffice Draw. Vi bruker frekvenstabellen fra oppgave b)... Intervall (Høyde) Frekvens (f) Kumulativ frekvens [155, 160 2 2 [160, 165 5 7 [165, 170 1 8 [170, 175 3 11 [175, 180 6 17 [180, 185 5 22 [185, 190 2 24 [190, 195] 1 25 N = 25 - og lager en grafisk løsning (linjediagram) der vi har den kumulative frekvensen på y-aksen og høyden på x-aksen. y 25 20 15 13 10 5 155 160 165 170 175 180 185 190 195 x Fra oppgave a) vet vi at det er observasjon nummer 13 som er medianen. Vi trekker en horisontal linje fra der y-aksen har verdien 13 og bort til den røde linjen og så vertikalt til linjen treffer x-aksen. Vi kan nå lese av verdien på x-aksen som skal er 176,66 hvis vi har vært nøyaktige. 35
d) Hvorfor får du ikke helt den samme verdien som i oppgave a)? Eksempel på løsning: Vi utvider tabellen slik at vi kan lage et histogram. Intervall (Høyde) [a, b Frekvens (f) (Elever) Intervallbredde b a Søylehøyde f b a [155, 160 2 5 0,4 [160, 165 5 5 1,0 [165, 170 1 5 0,2 [170, 175 3 5 0,6 [175, 180 6 5 1,2 [180, 185 5 5 1,0 [185, 190 2 5 0,4 [190, 195] 1 5 0,2 N = 25 1,4 1,2 1,0 0,8 0,6 0,4 0,2 155 160 165 170 175 180 185 190 195 Her har vi det ferdige histogrammet. Antallet observasjoner for hvert av intervallene er den direkte årsaken til søylehøyden. Hadde alle søylene vært like høye ville også medianen vært lik for de to presentasjonene i oppgave a) og b) (sortert datamateriale og gruppert frekvenstabell). Når søylehøyden er ulik vil da også midtpunktene på den enkelte søyle variere og dermed medianen for datamaterialet. 36
Oppgave 3.71 Finn medianen i oppgave 3.60 grafisk og ved regning. Finne medianen ved regning: Lager en kumulativ frekvenstabell for datamaterialet. Intervall (Vekt) [a, b Frekvens f Kumulativ frekvens Relativ kumulativ frekvens [40, 50 18 18 0,0826 [50, 55 38 56 0,2569 [55, 60 33 89 0,4083 [60, 65 46 135 0,6193 [65, 70 35 170 0,7798 [70, 80 29 199 0,9128 [80, 90 11 210 0,9633 [90, 120] 8 218 1,0000 Vi har 218 observasjoner, medianen i datamaterialet er da observasjon nummer 218 +1 2 = 109,5 Observasjon nummer 109,5 ligger i intervallet [60, 65 som har kumulativ frekvens = 90 135. I dette intervallet har vi da 46 observasjoner (fra og med 90 og til og med 135). Observasjon nummer 109,5 89 = 20,5 i intervallet [60, 65 blir da «medianeleven». Medianelevens vekt = 60 kg + 20,5 46 5 62,2283 kg 5 fordi intervallet har bredde = 5 Finne medianen grafisk: Vi bruker GeoGebra som verktøy når vi skal lage/finne en grafisk løsning. 1: Kopier den kumulative frekvensen og lim denne inn vertikalt i Regneark. Før inn 40 og 0 i linje 1. 2: Høyreklikk i det avmerkede området i Regneark og velg: Lag Polylinje 3: 4: Lag ved å velge og så og klikk i skjæringen. J = (62.173, 0.5) sier oss at når vi er midt i tallmaterialet (0.5) så er den grafiske medianen 62,173 kg. 37
Oppgave 3.72 Finn medianen for alderen i Norge grafisk og ved regning. Se oppgave 3.61. Intervall (Alder) [a, b Frekvens f Kumulativ frekvens Relativ kumulativ frekvens [0, 6 375 375 0,0742 [6, 16 617 992 0,1964 [16, 20 263 1255 0,2485 [20, 30 670 1925 0,3811 [30, 40 681 2606 0,5159 [40, 50 736 3342 0,6616 [50, 67 1036 4378 0,8668 [67, 100] 673 5051 1,0000 Vi har 5051 observasjoner, medianen i datamaterialet er da observasjon nummer 5051 + 1 2 = 2526 Observasjon nummer 2526 ligger i intervallet [30, 40 som har kumulativ frekvens = 1926 2606. I dette intervallet har vi da 681 observasjoner (fra og med 1926 og til og med 2606). Observasjon nummer 2526 1925 = 601 i intervallet [30, 40 blir da «medianlevealder». "Medianlevealder" = 30 år + 601 681 10 38,8253 år 10 fordi intervallet har bredde = 10 Finne medianen grafisk: Vi bruker GeoGebra som verktøy når vi skal lage/finne en grafisk løsning. Se oppgave 3.71 for mer informasjon... sier oss at når vi er midt i tallmaterialet (0.5) så er den grafiske medianen 38,8205 år. 38
Oppgave 3.73 Finn medianen for alderen i Botswana grafisk og ved regning. Se oppgave 3.62. Intervall (Alder) [a, b Frekvens f Kumulativ frekvens Relativ kumulativ frekvens [0, 5 229 229 0,1131 [5, 15 467 696 0,3439 [15, 20 230 926 0,4575 [20, 30 432 1358 0,6709 [30, 40 281 1639 0,8098 [40, 50 165 1804 0,8913 [50, 65 143 1947 0,9620 [65, 100] 77 2024 1,0000 Vi har 2024 observasjoner, medianen i datamaterialet er da observasjon nummer 2024+1 2 = 1012,5 Observasjon nummer 1012,5 ligger i intervallet [20, 30 som har kumulativ frekvens = 927 1358. I dette intervallet har vi da 432 observasjoner (fra og med 927 og til og med 1358). Observasjon nummer 1012,5 926 = 86,5 i intervallet [20, 30 blir da «medianlevealder». "Medianlevealder" = 20 år + 86,5 432 10 22,0023 år 10 fordi intervallet har bredde = 10 Finne medianen grafisk: Vi bruker GeoGebra som verktøy når vi skal lage/finne en grafisk løsning. Se oppgave 3.71 for mer informasjon... sier oss at når vi er midt i tallmaterialet (0.5) så er den grafiske medianen 21,9916 år. I tegningen over har vi ikke endret farger og størrelser i GeoGebra slik som i oppgave 3.71 og 3.72. 39
Oppgave 3.74 a) Finn det nøyaktige gjennomsnittet av høydene i oppgave 3.70. Høydene er: 172, 180, 160, 183, 177, 175, 180, 185, 158, 162, 179, 180, 172, 164, 162, 191, 177, 159, 178, 175, 168, 162, 188, 181, 170 Summerer alle høydene og deler dette på antallet observasjoner: 4338 25 b) Bruk det grupperte materialet i oppgave 3.70 til å finne gjennomsnittet. = 173,52 cm Her bruker vi gjennomsnittet i hvert av intervallene (x m ) for å finne gjennomsnittshøyden. Intervall (Høyde) Frekvens (f) Midtpunkt Sum (S) x m f x m [155, 160 2 157,5 0315,0 [160, 165 5 162,5 0812,5 [165, 170 1 167,5 0167,5 [170, 175 3 172,5 0517,5 [175, 180 6 177,5 1065,0 [180, 185 5 182,5 0912,5 [185, 190 2 187,5 0375,0 [190, 195] 1 192,5 0192,5 N = 25 S = 4357,5 Gjennomsnittshøyde = 4357,5 25 = 174,3 cm c) Forklar hvorfor det ikke blir samme svar i oppgave a) og b). Det er ikke like mange observasjoner i de ulike intervallene (observasjonen fordeler seg ulikt). 40
Oppgave 3.75 Finn gjennomsnittsvekten i oppgave 3.60. Vekt (kg) Frekvens [40, 50 18 [50, 55 38 [55, 60 33 [60, 65 46 [65, 70 35 [70, 80 29 [80, 90 11 [90, 120] 8 N = 218 Bruker det grupperte materialet som vist over i oppgave 3.60 til å finne gjennomsnittet. Intervall (Vekt) Frekvens (f) Midtpunkt Sum (S) x m f x m [40, 50 18 45 810,0 [50, 55 38 52,5 199,5 [55, 60 33 57,5 1897,5 [60, 65 46 62,5 2875,0 [65, 70 35 67,5 2362,5 [70, 80 29 75 2175,0 [80, 90 11 85 935,0 [90, 120] 8 105 840,0 N = 218 S = 12 094,5 Gjennomsnittsvekt = 12 094,5 218 = 55,4793 kg 41
Oppgave 3.76 Finn gjennomsnittsalderen i Norge og i Botswana. Se oppgave 3.61 og 3.62. Alder (år) Folketall i tusen [0, 6 375 [6, 16 617 [16, 20 263 [20, 30 670 [30, 40 681 [40, 50 736 [50, 67 1036 [67, 100] 673 OPPGAVE 3.61 (NORGE) Alder (år) Folketall i tusen [0, 5 229 [5, 15 467 [15, 20 230 [20, 30 432 [30, 40 281 [40, 50 165 [50, 65 143 [65, 100] 77 OPPGAVE 3.62 (BOTSWANA) Bruker det grupperte materialet fra oppgave 3.61 til å finne gjennomsnittet i Norge. Intervall (Alder) Frekvens (f) Midtpunkt Sum (S) x m f x m [0, 6 375 3 1125,0 [6, 16 617 11 6787,0 [16, 20 263 18 4734,0 [20, 30 670 25 16750,0 [30, 40 681 35 23835,0 [40, 50 736 45 33120,0 [50, 67 1036 58,5 60606,0 [67, 100] 673 83,5 56195,5 N = 5051 S = 203 152,5 Gjennomsnittsalder = 203 152,5 5051 = 40,2203 år Bruker det grupperte materialet fra oppgave 3.62 til å finne gjennomsnittet i Botswana. Intervall (Alder) Frekvens (f) Midtpunkt Sum (S) x m f x m [0, 5 229 2,5 572,5 [5, 15 467 10 4670,0 [15, 20 230 17,5 4025,0 [20, 30 432 25 10800,0 [30, 40 281 35 9835,0 [40, 50 165 45 7425,0 [50, 65 143 57,5 8222,5 [65, 100] 77 82,5 6352,5 N = 2024 S = 51 902,5 Gjennomsnittsalder = 51 902,5 2024 = 25,6435 år 42
3.8 Gruppert materiale digitalt Oppgave 3.80 Lag et regneark som finner gjennomsnittsvekten i oppgave 3.60. Vekt (kg) Frekvens [40, 50 18 [50, 55 38 [55, 60 33 [60, 65 46 [65, 70 35 [70, 80 29 [80, 90 11 [90, 120] 8 N = 218 OPPGAVE 3.60 Alle celler i..gult.. inneholder formler Ctrl + J og formlene i regnearket vises. 43
Oppgave 3.81 Lag et regneark som finner gjennomsnittsalderen i Norge. Se oppgave 3.61. Alder (år) Folketall i tusen [0, 6 375 [6, 16 617 [16, 20 263 [20, 30 670 [30, 40 681 [40, 50 736 [50, 67 1036 [67, 100] 673 OPPGAVE 3.61 Alle celler i..gult.. inneholder formler Ctrl + J og formlene i regnearket vises. 44
Oppgave 3.82 Lag et regneark som finner gjennomsnittsalderen i Botswana. Se oppgave 3.62. Alder (år) Folketall i tusen [0, 5 229 [5, 15 467 [15, 20 230 [20, 30 432 [30, 40 281 [40, 50 165 [50, 65 143 [65, 100] 77 OPPGAVE 3.62 Alle celler i..gult.. inneholder formler Ctrl + J og formlene i regnearket vises. 45
Oppgave 3.83 Bruk et regneark til å finne gjennomsnittshøyden ut fra denne tabellen: Høyde (cm) Frekvens [150, 160 5 [160, 170 12 [170, 180 18 [180, 200 15 Alle celler i..gult.. inneholder formler Ctrl + J og formlene i regnearket vises. 46
Oppgave 3.84 Bruk det ferdige regnearket til å finne medianen og gjennomsnittsalderen i Norge. Se oppgave 3.61. Oppgave 3.85 Bruk det ferdige regnearket til å finne medianen og gjennomsnittsalderen i Botswana. Se oppgave 3.62. 47
3.9 Spørreundersøkelser Oppgave 3.90 Meningsmålingsinstituttet «Norske meninger» bruker bare fasttelefon når de intervjuer. Hva tror du det betyr eller betydde for representativiteten i dag, i 1980 og i 1950? Vi kan gå ut ifra at det menes at man ringer til de som har fasttelefon og ikke at den som ringer benytter seg av fasttelefon. Her får du hjelp av en omtrentlig historisk oversikt. Alle tall i 1000 Antall i 1000 1950 1960 1970 1980 1990 2000 2010 2016 Fasttelefonabonnenter 291 455 708 1114 2070 2446 1647 546 Befolkning i Norge 3280 3570 3866 4079 4233 4478 4858 5213 Prosentvis antall som har fasttelefon 8,9 12,7 18,3 27,3 48,9 54,6 33,9 10,5 Kilder: ssb.no - cappelendamm.no - snl.no - wikipedia.no - telenor.no Oppgave 3.91 Planlegg og gjennomfør sammen med noen andre elever en spørreundersøkelse på skolen. Velg selv en problemstilling. Bruk noe av det du har lært i kapittel 2 og 3 når du legger frem resultatet av undersøkelsen. Du kan godt gjennomføre en egen undersøkelse, altså ikke nødvendigvis samarbeide med andre. Vi har til disposisjon 90 minutter til å tenke ut spørsmål, gjennomføre utspørringen og presentere dataene i en eller annen form slik vi har lært å presentere data i kapittel 3. Vi holder oss derfor innenfor klasserommet og vi bruker de andre eleven i klassen som respondenter til undersøkelsen. Ikke lag for mange eller for personlige spørsmål. Eksempler på spørsmål: Har du katt? Hvor mange kjæledyr har du. Hva er din favorittfarge? Hvilken dag er din favorittdag? På hvilken ukedag er du født? Nevn så mange land som mulig som begynner på bokstaven N. Nevn så mange land som mulig som kun har fargene rødt, hvitt og blått i nasjonalflagget. 48
Symboler, formler og eksempler Sentralmål Typetall Gjennomsnitt Median Forteller hvor midten i et tallmateriale er (Typetall, gjennomsnitt og median ulike typer sentralmål) Det tall som forekommer flest ganger (Den observasjonsverdien som har høyest frekvens) Summen av alle observasjoner delt på antall observasjoner Tallet i midten, eller de to tallene i midten og disse to tallenes gjennomsnitt (g) (Tallmaterialet må være sortert etter observasjonsverdiene) Tallmateriale med oddetall: N+1 Eks: vi har 27 observasjoner 2 27 + 1 2 = 14 Observasjon nummer 14 er i midten. Tallmateriale med partall: N+1 2 Eks: vi har 28 observasjoner 28 + 1 = 14,5 2 Gjennomsnittet av observasjon 14 og 15 er da midten i tallmaterialet. Spredningsmål Variasjonsbredde Tall som beskriver spredningen i ett materiale. Den enkleste form for spredningsmål Variasjonsbredde = Høyeste verdi Laveste verdi Nedre kvartil (Q 1 ) Median (Q 2 ) Øvre kvartil (Q 3 ) Første kvartil. Midten (median) til den nedre halvdelen av tallmaterialet. Andre kvartil. Tredje kvartil. Midten (median) til den øvre halvdelen av tallmaterialet. Kvartilbredden Q 3 Q 1 Kvartilbredden er halvdelen av alle data. Kvartilbredde er ett bedre spredningsmål enn variasjonsbredden. Varians Ett spredningsmål som tar hensyn til alle tallene i et materiale. Kvadrere (opphøyer i andre) avvikene til alle observasjonene før de summeres: (observasjonen gjennomsnittet) 2 kvadratet av alle avvik legges sammen og får summen (A) Varians = Summen av alle kvadrerte avvik Antall observasjoner = A N 49
Standardavvik Standardavvik = variansen = A N Hvis vi har svært mange observasjoner vil disse observasjonene være det vi kaller normalfordelt. 68% av observasjonene vil da avvike mindre enn verdien av standardavviket fra gjennomsnittet (g). Symboler: [ Fra og med ] Til og med Ned mot Inntil [10, 20 Fra og med 10 og inntil 20 (10 er nedre grense og 20 er øvre grense) [10,20] Fra og med 10 og til og med 20 Excel kommandoer: =MEDIAN(A1:K1) Sorterer rekken av tall (11 stk) og returnerer det 6. tallet i rekken. GeoGebra kommandoer: x=[tall] y=[tall] Histogram[Liste1, Liste2] Tegner en vertikal linje Tegner en horisontal linje Lager et histogram med utgangspunkt i to lister 50