Kapittel 4. Statistikk Dette kapitlet handler blant annet om: Beregne gjennomsnitt og andre sentralmål. Framstille data i frekvenstabeller. Beregne standardavvik og andre spredningsmål. Framstille data i søyle-, sektor- og andre typer diagrammer. Bruke Excel til å gjøre statistiske beregninger. Kapittel 4. Statistikk Side 52
1. Hva er statistikk? Statistikk handler om å trekke informasjon ut av et datamateriale og å framstille materialet på oversiktlige måter. Et datamateriale består av mange tall, og hvert tall kaller vi gjerne en observasjon. Eksempler på datamateriale: Standpunktkarakterene til alle elevene i 2P som var oppe til eksamen Høydene til alle som er på militærsesjon et år Antall mål en bestemt fotballspiller har scoret i hver kamp han har spilt Maksimumstemperaturen på Blindern hver dag i 2013 Vi bruker karakterene i to 2P-grupper med tilsammen 50 elever som eksempel: 2 3 1 3 3 5 1 2 2 4 6 2 2 1 2 3 1 2 4 4 5 2 2 3 3 1 2 4 2 5 4 4 1 2 3 2 2 3 1 5 4 2 1 5 2 3 2 4 3 1 Dette ser uoversiktlig ut. Vi framstiller derfor tallene i en frekvenstabell og som et diagram. 2. Frekvenstabeller En frekvenstabell viser hvor mange ganger hver dataverdi forekommer. I datamaterialet ovenfor er det seks dataverdier (de seks mulige karakterene), og det er 10 elever som har fått karakteren 3. Vi sier at frekvensen til karakteren 3 er lik 10. Et annet ord for frekvens er hyppighet. Frekvenstabellen blir slik: Karakter Frekvens 1 9 2 17 3 10 4 8 5 5 6 1 Vi bør regne ut summen av alle seks frekvensene og sjekke at den blir lik antall observasjoner (her 50). Ofte er det mer opplysende å finne ut hvor stor del av datamaterialet hver frekvens utgjør. Det oppgir vi i prosent og kaller det relativ frekvens. Her er et eksempel på utregning: Relativ frekvens for karakteren 4: 8 0,16 16 % 50 = = Kapittel 4. Statistikk Side 53
Her er tabellen en gang til hvor vi har tatt med relative frekvenser: Karakter Frekvens Relativ frekvens 1 9 18 % 2 17 34 % 3 10 20 % 4 8 16 % 5 5 10 % 6 1 2 % Sjekk at summen av de relative frekvensene blir 100 %. Tabellen under er utvidet slik at den også viser kumulativ frekvens og relativ kumulativ frekvens. Ordet kumulativ betyr oppsamlet. Karakter Frekvens Relativ frekvens Kumulativ frekvens Relativ kum. fr. 1 9 18 % 9 18 % 2 17 34 % 26 52 % 3 10 20 % 36 72 % 4 8 16 % 44 88 % 5 5 10 % 49 98 % 6 1 2 % 50 100 % Dette betyr for eksempel at 36 av de 50 elevene fikk 3 eller dårligere og at dette utgjør 72 % av elevene. Oppgave 1 Løs denne oppgaven uten kalkulator. Noen elever ble spurt om hvor mange PCer, nettbrett og mobiler det til sammen var i familien. De ga følgende svar: 3 5 6 4 4 7 4 4 7 5 Framstill disse dataene i en tabell som viser frekvenser, kumulative frekvenser, relative frekvenser og relative kumulative frekvenser. Kapittel 4. Statistikk Side 54
3. Diagrammer 3.1 Søylediagram (stolpediagram) Tallene i en frekvenstabell kan vi også framstille i et diagram. Det er mest aktuelt å gjøre dette i del 2 - oppgaver, og da kan vi bruke regnearket Excel. Men du bør også kunne tegne et diagram på papir i del 1. Det er noen små forskjeller på menyer og kommandoer mellom Excel på Windows og Excel på Mac. Teksten beskriver Windows-versjonen. Hvis du bruker Mac får du et ark av læreren som beskriver forskjellene på de to versjonene. Legg inn dataene som du vil lage søylediagram av i Excel. Merk ut med pekeplate eller mus den kolonnen som bestemmer høyden av søylene. Ikke ta med eventuell overskrift. Vi bruker en tabell over elevfravær som eksempel: Velg fanen Sett inn, Stolpe og det første stolpevalget: Du får antagelig følgende diagram: Kapittel 4. Statistikk Side 55
Tallene på den vannrette aksen er bare en nummering av søylene. Vi må isteden få inn verdiene av antall fraværsdager som står i første kolonnen i tabellen vår. Det gjør vi slik: Hvis ikke diagrammet vårt har en tykk ramme lenger, klikker vi på det slik at rammen dukker opp. Så velger vi Utforming under fanen Diagramverktøy og så Merk data. Vi får opp et vindu med tittel Velg datakilde. Der klikker vi Rediger under Vannrette akseetiketter: Vi får opp et lite vindu hvor Excel vil vite hvor de riktige verdiene på vannrett akse står: Vi merker ut disse tallene (her cellene A2 til A8) og klikker OK. Vi kommer tilbake til vinduet Velg datakilde og klikker OK her også. Da har vi endelig riktige tall på vannrett akse. Til slutt kan vi fjerne Serie 1 til høyre i diagrammet ved å klikke på den og trykke Delete. Så legger vi tekst på aksene: Kapittel 4. Statistikk Side 56
Det kommer opp et felt Aksetittel under diagrammet. Vi klikker inni det, fjerner det som står og skriver Antall fraværsdager. På lignende måte lager vi tekst på den loddrette aksen. Til slutt kan du lage en diagramtittel (overskrift) hvis du vil ha det. Av og til vil du lage diagrammer hvor det er mer enn en kolonne for hver dataverdi. Et eksempel kan være fraværet i flere klasser som skal sammenlignes. Da merker du bare ut alle kolonnene det skal lages søyler av. Resten blir som før. 3.2 Sektordiagram I mange tilfelle hvor man ikke har for mange dataverdier, er det vanlig å lage et sektordiagram (populært kalt kakediagram ). Vi går fram på samme måte som for et stolpediagram, men velger Sektor istedenfor Stolpe. Vi endrer også nå på akseetikettene. Med tallene fra forrige eksempel får vi da dette diagrammet: Det er en sektor for hver av de sju verdiene til antall fraværsdager. Disse verdiene er fargekodet, og koden står til høyre. I svart-hvitt er det vanskelig å se hva som er hva. Ved å gjøre som vist nedenfor får du isteden verdien til fraværsdager skrevet inn i hver sektor, sammen med den relative frekvensen. Du ser for eksempel at 13 % av elevene var borte i 4 dager. Prøv gjerne også de andre valgene under Diagramoppsett. Til slutt kan du skrive en passende diagramtittel. Kapittel 4. Statistikk Side 57
Det er mulig å lage mye pynt på diagrammene. Ikke bruk tid på det, i hvert fall ikke på prøver! Et diagram skriver du ut på vanlig måte etter å ha klikket på det. Da får du bare med diagrammet, ikke hele regnearket. Oppgave 2 Framstill frekvenstabellen i oppgave 1 som et søylediagram og som et sektordiagram. 3.3 Linjediagram Linjediagrammer brukes nesten bare for å vise hvordan noe utvikler seg over tid. Det betyr at på vannrett akse har vi som regel timer, dager, uker, måneder eller år. I Excel lager du et linjediagram på samme måte som et stolpediagram. Kapittel 4. Statistikk Side 58
3.4 Tegne sektordiagram for hånd I del 1 kan du hende at du blir bedt om å tegne et sektordiagram på papir. Da vil det bare være noen få sektorer, og det vil være tall som skal være mulig å håndtere uten å være veldig god i hoderegning. For å tegne et bra sektordiagram trenger du passer, gradskive og linjal. Eksempel 1 En del mennesker ble spurt om de var fornøyd med regjeringen. 60 % svarte ja, 30 % svarte nei og 10 % svarte vet ikke. (Dette er altså de relative frekvensene for dataverdiene.) Vi vil lage et sektordiagram som illustrerer svarene. Vi regner da ut hvor mange grader hver av de tre sektorene må fylle. Hele sirkelen utgjør 360 o. o o Ja-sektoren må fylle 360 0, 6 = 216. Nei-sektoren må fylle o o 360 0, 3 108 =. o o Vet ikke-sektoren må fylle 360 0,1 = 36. Vi lager en litt stor sirkel med passer og bruker gradskive til å lage de tre sektorene med riktig gradtall. Til slutt skriver vi passende tekst i hver sektor. Resultatet skal være omtrent slik: Vet ikke 10 % Ja 60 % Nei 30 % Oppgave 3 To klasser på 60 elever skal ha aktivitetsdag. 12 elever ønsker langrenn, 22 slalåm, 18 aking og 8 fottur. Lag et sektordiagram på papir (og uten kalkulator) som illustrerer denne svarfordelingen. Tips: Legg merke til at 360/60 = 6. En elev svarer altså til 6 grader. Kapittel 4. Statistikk Side 59
4. Sentralmål Et sentralmål er et tall som viser hovedtendensen i et datamateriale. De vanligste sentralmålene er gjennomsnitt, median og typetall. 4.1 Gjennomsnitt Vi finner gjennomsnittet av et datamateriale ved å legge sammen alle observasjonene og dividere med antall observasjoner. Eksempel 2 Høydene til 10 gutter (i cm) er 187, 182, 175, 184, 173, 180, 182, 177, 171, 186. Vi regner ut summen av høydene: 187 + 182 + 175 + 184 + 173 + 180 + 182 + 177 + 171 +186 = 1797. Gjennomsnittet er 1797 cm /10 = 179,7 cm. Oppgave 4 Noen elever ble spurt om hvor mange PCer, nettbrett og mobiler det til sammen var i familien. De ga følgende svar: 3 5 6 4 4 7 4 4 7 5 Finn gjennomsnittlig antall datadingser i disse familiene. Oppgave 5 a) Kan en gjennomsnittshøyde være større enn alle høydene som er brukt for å regne ut gjennomsnittet? b) Kan alle høydene være lik gjennomsnittshøyden? Kapittel 4. Statistikk Side 60
Eksempel 3 Hvis datamaterialet er satt i en frekvenstabell, finner vi gjennomsnittet slik: Karakter Frekvens Karakter * Frekvens 1 9 9 2 17 34 3 10 30 4 8 32 5 5 25 6 1 6 Sum = 50 Sum = 136 Dette viser at summen av alle 50 karakterene er 136. Gjennomsnittskarakteren er 136 / 50 = 2,72 Oppgave 6 Taiba spiller håndball. Hun har laget en tabell som viser antall mål hun har scoret i kampene. Tabellen viser for eksempel at i 5 av kampene har hun scoret 2 mål i hver kamp. Frekvensene er her antall kamper hvor hun har scoret 0 mål, 1 mål, osv. a) Hvor mange kamper har hun spilt? b) Lag en ekstra kolonne og finn ut hvor mange mål hun har scoret tilsammen på disse kampene. c) Hvor mange mål har hun scoret i gjennomsnitt per kamp? 4. 2 Median Medianen i et datamateriale er den midterste verdien når materialet er sortert i stigende rekkefølge. Eksempel 4 Hva er medianen for karakterene 4, 2, 2, 5 og 1? Vi ordner dem i stigende rekkefølge: 1, 2, 2, 4, 5. Da ser vi at medianen er 2. Kapittel 4. Statistikk Side 61
Eksempel 5 Hva er medianen for karakterene 4, 2, 2, 5, 1 og 3? Vi ordner dem i stigende rekkefølge: 1, 2, 2, 3, 4, 5. Da ser vi at det er ikke noe tall nøyaktig i midten. I slike tilfelle er medianen definert som gjennomsnittet av de to verdiene nærmest midten. Derfor er medianen 2 + 3 5 = = 2,5. 2 2 Oppgave 7 a) Finn medianen i dette datamaterialet, som viser antall bøker noen tilfeldige elever hadde lest i 2012: 6, 2, 1, 0, 4, 1, 7, 0, 3. b) Finn medianen i dette datamaterialet, som viser antall fraværsdager for noen elever: 2, 4, 0, 0, 1, 2, 3, 1, 4, 1, 2, 0. Hvis datamaterialet er ordnet i en frekvenstabell, er medianen den minste dataverdien hvor den relative kumulative frekvensen er større enn eller lik 50 %. Karakter Frekvens Kumulativ frekvens Relativ kum. fr. 1 9 9 18 % 2 17 26 52 % 3 10 36 72 % 4 8 44 88 % 5 5 49 98 % 6 1 50 100 % Her er medianen lik 2. 4.3 Typetall Typetallet i et datamateriale er den dataverdien som forekommer flest ganger ( er typisk for ) i datamaterialet. Eksempel 6 Typetallet i karaktereksemplet ovenfor er 2, fordi det er flest elever som har fått 2 (17 elever). Oppgave 8 Finn typetallet i datamaterialet i oppgave 1. Kapittel 4. Statistikk Side 62
5. Spredningsmål Et spredningsmål er et tall som sier noe om hvor stor spredning det er på tallene i et datamateriale. 5.1 Variasjonsbredde Det enkleste spredningsmålet er variasjonsbredde. Variasjonsbredden i et datamateriale er forskjellen mellom største og minste verdi i materialet. Eksempel 7 I oppgave 7a hadde vi tallene 6, 2, 1, 0, 4, 1, 7, 0, 3, som var antall leste bøker i 2012. Største verdien er 7 bøker og minste er 0 bøker. Variasjonsbredden er 7 bøker 0 bøker = 7 bøker. Oppgave 9 Åtte jenter løper 100 m. Tidene i sekunder er 15,6 17,8 14,4 18,2 16,3 14,9 15,8 17,1. Finn variasjonsbredden. Kapittel 4. Statistikk Side 63
5.2 Standardavvik Ofte gir ikke variasjonsbredden et godt bilde av spredningen. For eksempel kan vi tenke oss en 2P-gruppe hvor nesten alle elevene fikk karakter 3, mens en elev fikk 1 og en fikk 6. I en annen gruppe fikk to elever 1, fire fikk 2, fem fikk 3, fire fikk 4, tre fikk 5 og to fikk 6. Variasjonsbredden er 5 i begge gruppene, men det er likevel naturlig å si at det er mer spredning i karakterene i den andre gruppen. Standardavvik er et spredningsmål som sier noe om hvor bred en fordeling er. Det venstre diagrammet nedenfor viser et datamateriale med lite standardavvik og det høyre et med stort standardavvik. Den nøyaktige definisjonen av standardavvik er litt vanskelig, så vi tar den ikke med her. Heldigvis er det bare aktuelt å beregne standardavvik i del 2-oppgaver, og da kan vi gjøre det ved å bruke regnearket Excel slik det er forklart i neste delkapittel. 6 5 4 3 2 1 0 1 2 3 4 5 6 5 4 3 2 1 0 1 2 3 4 5 6 Lite standardavvik. Stort standardavvik. 6. Beregning av sentralmål og spredningsmål i Excel De sentral- og spredningsmål i 2P som kan være aktuelle å beregne i Excel er gjennomsnitt, median og standardavvik. Men husk at gjennomsnitt og median med enkle tall må du også kunne beregne uten hjelpemidler. Vi har målt høyden til 7 jenter. Høydene i cm er: 177,164, 170, 168, 172, 161, 169. Bildet under viser hvordan vi finner medianen, gjennomsnittet og standardavviket til disse høydene i Excel. Til venstre ser vi formlene som må skrives inn og til høyre hvordan resultatene blir. En formel må starte med =. Legg også merke til at riktig formel for standardavvik er STDAV.P. Kapittel 4. Statistikk Side 64
(Formelen for antall i B11 trenger vi egentlig ikke her. Den er bare tatt med for å vise at Excel lett kan telle opp antall celler i et område; her antall høyder.) Vi kan bytte mellom å se formler og beregninger i Excel ved å taste Ctrl + J. På en prøve må du legge ved utskrift av både resultater og formler. Kapittel 4. Statistikk Side 65
7. Klassedelt (gruppedelt) materiale Når det er mange ulike dataverdier er det upraktisk å ta med alle i en frekvenstabell. Et eksempel er inntektsstatistikk hvor inntekten kan ha tusenvis av forskjellige verdier. Da grupperer vi verdiene i klasser (grupper) og finner frekvensen for hver klasse. Her er et eksempel på en klassedelt frekvenstabell som viser inntekten til lønnsmottakerne i en tenkt kommune. Inntektene er oppgitt i tusener av kroner. Inntekt Frekvens [0, 100> 467 [100, 200> 678 [200, 300> 1490 [300, 400> 2653 [400, 500> 3785 [500, 750> 4106 [750, 1000> 987 [1000, 5000> 45 N = 14211 Dette betyr for eksempel at det var 678 lønnsmottakere som hadde en inntekt fra og med 100 000 kr og inntil 200 000. En inntekt på nøyaktig 200 000 kr faller i neste klasse, nemlig [200, 300>. Nederst i frekvenstabellen har vi regnet ut det totale antall lønnsmottagere (N). Legg merke til alle klassene ikke behøver å ha samme bredde. Bredden til klassen [300, 400> er 100, mens klassebredden til [1000, 5000> er 4000. 7.1 Gjennomsnitt i klassedelt materiale Fordi vi ikke kjenner alle verdiene i et klassedelt materiale, går det ikke an å finne en nøyaktig verdi for gjennomsnittet. Det beste vi kan gjøre er å anta at alle verdiene i en klasse er lik verdien midt i klassen. Da utvider vi tabellen og regner slik: Inntekt Frekvens f Midtpunkt x m xm f [0, 100> 467 50 23350 [100, 200> 678 150 101700 [200, 300> 1490 250 372500 [300, 400> 2653 350 928550 [400, 500> 3785 450 1703250 [500, 750> 4106 625 2566250 [750, 1000> 987 875 863625 [1000, 5000> 45 3000 135000 N = 14211 Sum = 6694225 Gjennomsnittet blir da 6694225 : 14211 = 471, som tilsvarer 471 000 kr. Kapittel 4. Statistikk Side 66
7.2 Median i klassedelt materiale Heller ikke medianen er det mulig å finne nøyaktig i et klassedelt materiale. For å finne en tilnærmet verdi lager vi først en tabell som viser kumulativ frekvens: Inntekt Frekvens Kumulativ frekvens [0, 100> 467 467 [100, 200> 678 1145 [200, 300> 1490 2635 [300, 400> 2653 5288 [400, 500> 3785 9073 [500, 750> 4106 13179 [750, 1000> 987 14166 [1000, 5000> 45 14211 N = 14211 Hvis alle inntektene var ordnet i stigende rekkefølge, ville medianen være inntekten på plass nr. 14212 : 2 = 7106. Vi ser av kolonnen med kumulativ frekvens at denne inntekten ligger i klassen [400,500>. For å beregne en best mulig verdi for medianen må vi anta at alle de 3785 inntektene i denne klassen ligger jevnt fordelt innenfor klassen. Først i klassen [400,500> ligger inntekt nr. 5289 i den ordnede inntektslisten. Fra starten på klassen og opp til medianen er det 7106 5289 = 1817 inntekter. Dette utgjør 1817 = 0, 48 = 48% av alle inntektene i klassen. Da må avstanden fra starten av klassen, som 3785 er 400, opp til medianen, være 48 % av klassebredden, som er 100. Medianen er da 400 + 100 0, 48 = 448, som tilsvarer 448 000 kr. Kapittel 4. Statistikk Side 67
Eksamensoppgaver E1 (Eksamen vår 2010, Del 1) I fjor kom alle elevene i en matematikkgruppe opp til eksamen i 2P. De oppnådde disse resultatene: 1, 6, 5, 4, 3, 2, 5, 5, 2, 4, 2, 2, 6, 4, 3, 3, 5, 4, 4, 5 1) Lag en tabell som viser frekvens og kumulativ frekvens. 2) Finn medianen og gjennomsnittet for datamaterialet. E2 (Eksamen vår 2011, Del 1) Nedenfor ser du hvor mange mål som ble scoret i fotballkampene mellom Rosenborg og Brann i Eliteserien i årene fra 2005 til 2009: 5 5 0 4 3 5 2 0 2 2 1) Finn gjennomsnittet og medianen for dette datamaterialet. 2) Sett opp resultatene i en tabell. Tabellen skal vise frekvens og kumulativ frekvens. 3) Hva er den kumulative frekvensen for to mål, og hva betyr dette? E3 (Eksamen høst 2009, Del 2) Tabellen nedenfor viser karakterfordelingen på en matematikkeksamen et år. a) Framstill datamaterialet i tabellen ved hjelp av to ulike diagrammer. b) 1) Hvor mange prosent av elevene fikk karakteren 1? 2) Hva var gjennomsnittskarakteren? Året etter var det 234 elever som hadde eksamen. Gjennomsnittskarakteren dette året var 3,42. c) Hva var gjennomsnittskarakteren dersom vi ser disse to årene under ett? Kapittel 4. Statistikk Side 68
E4 (Eksamen høst 2012, Del 1) Alle som går på tur til Pollfjell, skriver navnet sitt i boka som ligger i postkassen på toppen av fjellet. Nedenfor ser du hvor mange som har skrevet seg inn i boka hver uke de 12 siste ukene. 6 12 20 4 10 15 5 12 8 12 18 10 Bestem gjennomsnittet, medianen, typetallet og variasjonsbredden for dette datamaterialet. E5 (Eksamen vår 2012, Del 1) 20 elever blir spurt om hvor mange datamaskiner de har hjemme. Se tabellen ovenfor. Finn variasjonsbredden, typetallet, medianen og gjennomsnittet. E6 (Eksamen høst 2012, Del 2) År 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Antall kamper 1 2 4 10 9 6 4 9 11 11 4 per år Antall mål 0 0 2 3 3 2 0 5 1 4 0 per år Tabellen ovenfor viser hvor mange landskamper Jan Åge Fjørtoft spilte, og hvor mange mål han skåret per år i perioden 1986 1996. Kapittel 4. Statistikk Side 69
a) Hvor mange mål skåret Fjørtoft i gjennomsnitt per kamp i denne perioden? I hvilket år skåret han flest mål per kamp? b) Tegn av tabellen nedenfor i besvarelsen din, og fyll inn tallene som mangler. Hva er den kumulative frekvensen for to mål per år, og hva forteller dette svaret? E7 (Eksamen vår 2013, Del 2) a) Lag et sektordiagram som illustrerer opplysningene gitt i tabellen ovenfor. Kapittel 4. Statistikk Side 70
b) Lag et passende diagram som illustrerer opplysningene gitt i tabellen ovenfor. E8 (Eksamen høst 2008, Del 2) Lengdehopp er en gren av friidrett som går ut på å hoppe så langt man kan i et hopp. I konkurranser har man som regel tre hopp, der det beste hoppet teller. Anna og Petra konkurrerer om å kvalifisere seg til lengdehoppkonkurransen i et friidrettsstevne. De får ti hopp hver, og den beste av dem er kvalifisert til konkurransen. Her er resultatene (oppgitt i meter) fra kvalifiseringen: Hopp 1 2 3 4 5 6 7 8 9 10 Anna 5,10 5,45 5,92 4,10 5,23 5,32 5,89 4,91 4,37 5,42 Petra 5,44 5,80 5,67 5,74 5,72 5,04 5,73 5,53 5,59 5,83 a) Finn gjennomsnitt og median for hver av de to jentenes resultater. b) Finn variasjonsbredde og standardavvik for hver av de to jentenes resultater. c) Foreta en vurdering av jentenes resultater og det du fant i a) og b), og argumenter for hvem du synes skal bli kvalifisert. E9 (Eksamen høst 2010, Del 2) I klasse 1A er det 12 jenter og 12 gutter. Nedenfor ser du hvor mange timer de bruker på lekser hver uke. Jentene: 7, 5, 5, 7, 7, 6, 8, 8, 5, 4, 6, 10 Guttene: 2, 5, 6, 7, 9, 6, 4, 9, 12, 2, 13, 3 Bruk ulike sentral- og spredningsmål og gjør rede for hva dette datamaterialet viser om jentenes og guttenes arbeidsvaner i denne klassen. Kapittel 4. Statistikk Side 71
E10 (Eksamen vår 2012, Del 2) Ovenfor ser du linjediagram som viser gjennomsnittstemperaturen per måned ved to kjente feriesteder. a) Bruk diagrammene og lag en tabell som viser gjennomsnittstemperaturen per måned for hvert av de to stedene Phuket og Antalya. b) 1) Finn gjennomsnittstemperaturen per år for hvert av de to stedene. 2) Finn standardavviket for temperaturene i a) for hvert av de to stedene. Jon påstår at det er godt samsvar mellom diagrammene og resultatene fra b). Asbjørn er enig, men mener at diagrammene lett kan tolkes feil. c) Forklar hvorfor diagrammene lett kan tolkes feil. Hvordan kunne diagrammene vært laget for å unngå dette? Kapittel 4. Statistikk Side 72
E11 (Eksamen vår 2011, Del 1) Ved en skole er det 120 elever. Elevrådet skal arrangere aktivitetsdag, og elevene kan melde seg på én av fire turer. Elevene fordeler seg slik: Tur Antall elever Tur 1 (Robåt) 15 Tur 2 (Sykkel) 30 Tur 3 (Høgfjell, kort løype) 40 Tur 4 (Høgfjell, lang løype) 35 Gjør beregninger og lag et sektordiagram som viser fordelingen. Det skal gå klart fram hvor mange grader hver av sektorene i diagrammet er på. E12 (Eksamen høst 2011, Del 1) Per, Pål og Espen selger pakker med Eventyrkjeks. Diagrammene ovenfor viser resultater fra første kvartal 2011. Kapittel 4. Statistikk Side 73
a) Bruk opplysningene i tabellen nedenfor til å lage tilsvarende diagrammer for andre kvartal 2011. b) Lag et diagram for andre kvartal som viser hvor mange pakker med Eventyrkjeks hver av de tre guttene solgte hver måned. E13 (Eksamen vår 2010, Del 2) År Antall Totalvekten av Gjennomsnittsvekten laks laksen (kg) for laksen (kg) 2000 3447 14550 4,22 2001 5694 24218 4,25 2002 3142 1) 5,51 2003 4401 22425 5,10 2004 2928 17979 2) 2005 5783 28144 4,87 2006 6507 26695 4,10 2007 3555 21074 5,93 2008 4782 28903 6,04 2009 3916 24361 6,22 Tabellen ovenfor viser hvor mange laks, totalvekten av laksen og gjennomsnittsvekten for laksen som er fanget i elva Gaula i Sør-Trøndelag de siste ti årene. a) Hvilke tall skal stå i tabellfeltene som er merket 1) og 2)? Kapittel 4. Statistikk Side 74
b) Lag et passende diagram som viser hvor mange laks som er fanget i Gaula per år de siste ti årene. c) Finn gjennomsnittet av og standardavviket for totalvekten av laksen fanget i Gaula per år de siste ti årene. E14 (Eksamen høst 2011, Del 2) a) Finn median, gjennomsnitt og standardavvik for tallmengden: 2 5 21 15 17 5 9 19 10 14 7 3 2 11 13 Vi dobler alle tallene i tallmengden og får: 4 10 42 30 34 10 18 38 20 28 14 6 4 22 26 b) Finn median, gjennomsnitt og standardavvik for denne tallmengden. Sammenlikn med resultatene fra a) og kommenter. Berit får en idé og setter opp tabellen nedenfor. Tallmengde 1 15 tall 2 5 21 15 17 5 9 19 10 14 7 3 2 11 13 Tallmengde 2 De 15 tallene 4 10 42 30 34 10 18 38 20 28 14 6 4 22 26 doblet Tallmengde 3 De 15 tallene 6 15 63 45 51 15 27 57 30 42 21 9 6 33 39 tredoblet Tallmengde 4 De 15 tallene 8 20 84 60 68 20 36 76 40 56 28 12 8 44 52 firedoblet Hun beregner median, gjennomsnitt og standardavvik for hver av tallmengdene og påstår at hun har funnet regler som sier noe om hvordan medianen, gjennomsnittet og standardavviket endrer seg når tallene i en tallmengde dobles, tredobles, firedobles osv. c) Formuler disse reglene, og gi en begrunnelse for at de er riktige. Kapittel 4. Statistikk Side 75
E15 (Eksamen høst 2012, Del 2) Ovenfor ser du verdensstatistikken fra 2010 for øvelsen lengdehopp for menn. a) Lag et sektordiagram som viser hvordan de 20 utøverne fordeler seg mellom de ulike verdensdelene. b) Finn gjennomsnittslengden og standardavviket for resultatene til de 20 utøverne. Sondre har funnet resultatene for utøverne som står som nummer 21 40 på verdensstatistikken. Standardavviket for resultatene til disse 20 utøverne er tilnærmet lik 0,0258. c) Hva forteller dette om resultatene til utøverne som står som nummer 21 40, i forhold til resultatene til de 20 beste utøverne? Kapittel 4. Statistikk Side 76
E16 (Eksamen vår 2012, Del 2) En dag gjorde klasse 1A et forsøk i naturfagtimen. Seks elever slapp hver sin stålkule fra 1 m høyde og målte tiden det tok før kulen traff bakken. Resultatene ser du i tabellen nedenfor. a) Bestem gjennomsnittet og standardavviket for måleresultatene. Klassen la merke til at elev nummer 5 målte en større falltid enn de andre. Mange mente at dette resultatet måtte skyldes målefeil, og at det derfor burde forkastes. Da ga fysikklærer Strøm dem denne regelen: b) Finn ut om måleresultatet til elev nummer 5 kan forkastes dersom vi bruker regelen ovenfor. c) Bestem gjennomsnittet og standardavviket for de fem andre måleresultatene. Hvordan har gjennomsnitt og standardavvik endret seg? Virker dette rimelig? Forklar. E17 (Eksamen vår 2013, Del 1) En kveld kjørte en taxisjåfør 10 turer. Nedenfor ser du hvor mange passasjerer han hadde med på hver av turene. 1 5 3 3 5 2 1 4 1 2 a) Bestem medianen, gjennomsnittet og typetallet for dette datamaterialet. b) Sett opp en tabell som viser frekvens og kumulativ frekvens for antall passasjerer på turene. Kapittel 4. Statistikk Side 77
E18 (Eksamen vår 2013, Del 2) Tabellene nedenfor viser resultatene for de åtte beste utøverne på 1500 m skøyter for menn under OL i 1968 og under OL i 2010. a) Hvor mange prosent sank vinnertiden med fra 1968 til 2010? b) Bestem gjennomsnittstiden for de åtte beste i 1968 og for de åtte beste i 2010. c) Bestem standardavviket for de to tallmaterialene. Hvorfor er standardavviket større i 1968 enn i 2010? E19 (Eksamen vår 2011, Del 1) I en 2P-gruppe er det 10 elever. Læreren har undersøkt hvor mye tid elevene bruker på matematikkleksene i løpet av en uke. Resultatene er gitt i tabellen nedenfor. Finn gjennomsnittet for dette grupperte datamaterialet. Kapittel 4. Statistikk Side 78
E20 (Eksamen høst 2012, Del 1) Tabellen nedenfor viser hvor mye penger hver av de 10 elevene i en 2P-gruppe bruker i kantinen i løpet av en uke. Kroner Antall elever 1 5 1 3 Gjør beregninger og avgjør om gjennomsnittet er større enn medianen for dette datamaterialet. E 21 (Eksamen vår 2011, Del 2) Politiet har gjennomført fartskontroller på to veistrekninger. Den ene veistrekningen har fartsgrense 50 km/h og den andre 80 km/h. Nedenfor ser du resultatene fra hver av de to kontrollene. a) Presenter dataene fra tabellene ovenfor i hvert sitt stolpediagram. b) Hvor mange prosent av bilførerne kjører 10 % eller mer over fartsgrensen i hver av de to kontrollene? Kapittel 4. Statistikk Side 79
c) Finn gjennomsnittsfarten til bilene i hver av de to kontrollene. d) Hvor mange prosent over fartsgrensen er gjennomsnittsfarten til bilene i hver av de to kontrollene? e) Bruk svarene i a), b), c) og d) til å vurdere om bilførerne kjører mest lovlydig på veistrekningen med fartsgrense 50 km/h eller på veistrekningen med fartsgrense 80 km/h. E22 (Eksamen vår 2012, Del 1) Nedenfor ser du hvor mange tekstmeldinger hver av de 20 elevene i en 2P-gruppe sendte i løpet av en uke: 4 88 69 21 66 8 16 57 86 21 37 22 78 27 28 44 42 71 82 95 1) Grupper datamaterialet i klasser med bredde 20. La den første klassen starte med 0. I hvilken klasse ligger medianen? 2) Finn gjennomsnittet i det klassedelte materialet. E23 (Eksamen vår 2013, Del 1) Tabellen nedenfor viser inntektene til personene i et borettslag. Bestem gjennomsnittsinntekten til personene i borettslaget. Kapittel 4. Statistikk Side 80
E24 (Eksamen høst 2011, Del 1) Politiet har gjennomført en fartskontroll i 30 km-sonen utenfor skolen. Resultatene er gitt i tabellen nedenfor. Finn gjennomsnittsfarten. E25 (Eksamen vår 2008, Del 2) Et nytt leilighetskompleks, UTSIKTEN, er fylt opp med nye beboere. En oversikt viser følgende aldersfordeling: Alder 0 19 år 20 39 år 40 59 år 60 79 år Frekvens 17 29 51 23 a) Hvor mange personer bor i leilighetskomplekset? b) Tegn et søylediagram som viser aldersfordelingen. c) Forklar hvorfor medianen må ligge i intervallet 40 59 år. d) Regn ut gjennomsnittsalderen ut fra det klassedelte materialet. Kapittel 4. Statistikk Side 81
E26 (Eksamen 2P vår 2009, Del 2) Sommeren 2007 var 175 skoleelever på sommerleir. Etter leiren ble de spurt om hvor mye penger de hadde brukt på brus, is og godteri. Resultater fra undersøkelsen er vist i skjemaet nedenfor. Klassemidt- Frekvens Relativ Penger brukt Produkt punkt Hyppighet frekvens (kr) ms m f s Fra og med 0 til 40 20 21 0,12 2,4 Fra og med 40 til 80 60 70 2) 24,0 Fra og med 80 til 120 100 49 0,28 28,0 Fra og med 120 til 160 140 21 0,12 16,8 Fra og med 160 til 200 180 1) 0,08 14,4 Totalt 175 1,00 85,6 a) Hvilke tall skal stå i feltene som ikke er fylt ut, og som er merket 1) og 2)? b) Framstill dataene over pengeforbruket i et egnet diagram. c) Hvor mye penger brukte i gjennomsnitt hver av de 175 elevene? Kristian påstår at han med én gang kan si at for dette datamaterialet er medianen lavere enn gjennomsnittet. d) Forklar hvordan Kristian kan se dette direkte ut fra tabellen ovenfor. Kapittel 4. Statistikk Side 82
Fasit øvingsoppgaver 4. 4,9 5. a) Nei b) Ja 6. a) 33 b) 108 c) 3,3 7. a) 2 b) 1,5 8. 4 9. 3,8 Fasit eksamensoppgaver E1. 2) 4 3,75 E2. 1) 2,8 2,5 E3. b1) 6,6 % b2) 3,12 c) 3,29 E4. 11, 11, 12, 16 E5. 5, 4, 3,5, 3,3 E6. a) 0,28 1993 E8. a) 5,17, 5,28, 5,61, 5,69 b) 1,82, 0,56, 0,79, 0,22 E9. Jenter: Median 6,5 Gjennomsnitt 6,5 Variasjonsbredde 6 Standardavvik 1,6 Gutter: Median 6 Gjennomsnitt 6,5 Variasjonsbredde 11 Standardavvik 3,5 E13. a) 17312 6,14 c) 22566 4576 E14. a) 10 10,2 5,99 b) 20 20,4 11,98 E15. b) 8,275 0,082 E16. a) 0,467 0,026 b) Ja c) 0,456 0,010 E17. a) 2,5 2,7 1 E18. a) 14,4 % b) 125,06 106,36 c) 0,71 0,39 E19. 78 min E20. Gjennomsnitt 105 kr, median 95 kr. E21. b) ca. 36,3 %, ca. 10,3 % c) ca. 53,4 km/h, ca. 81,2 km/h d) ca. 6,8 %, ca. 1,4 % E22. 1) [40, 60> 2) 50 E23. 440 000 kr E24. 33 km/h E25. a) 120 d) 43,3 år E26. a) 14, 0,40 c) 85,60 kr Kapittel 4. Statistikk Side 83