Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. 1 Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke I løpet av uken blir løsningsforslag lagt ut på emnesiden http://www.hig.no/toel/allmennfag/emnesider/smf11 Beskrivende statistikk. Gjør først oppgave 1 og. Hvis du mener du da allerede har kontroll på å regne ut gjennomsnitt og standardavvik, og å finne median, kan du gjøre praktiske oppgaven oppgave 6). Det er best om du finner noen å gjøre den sammen med gruppeoppgave). Oppgave 1 Hensikten med denne oppgaven er å sjekke for dere selv om dere har forstått definisjonene av x, x og s. Oppgave a, b, c og d skal derfor i første omgang regnes uten bruk av statistikkdelen på kalkulatoren. Et datasett består av observasjonene { 5,, 7, 4, 3 }. a ) Finn empirisk forventningsverdi x for dataene. Finn medianen x for dataene. Regn ut empirisk varians s og standardavvik s ved hjelp av formelen s x i x). d ) Regn ut varians s og standardavvik s ved hjelp av formelen s x i n x. e ) Finn ut hvordan statistikkdelen på kalkulatoren din finner x, x og s. For standardavviket finnes det antagelig to varianter. Bruk svaret på c og d oppgaven for å finne ut hvilken av disse som skal brukes. Oppgave Et forsøk bestod i å kaste 5 mynter, og registrere antall kron. Dette ble gjentatt 50 ganger, og resultatet når dataene er ordnet ble { 0, 1, 1, 1, 1, 1, 1, 1,,,,,,,,,,,,,,,,, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5} a ) Finn median og kvartilavstand for dette datasettet. Lag en frekvenstabell med både absolutte og relative frekvenser) for dette datasettet. Regn ut den empiriske forventningsverdien x uten bruk av statistikkdelen på kalkulatoren). Før du begynner å regne bør du finne en måte å effektivisere utregninga av x pånår det som her er mange like verdier. Sett opp denne metoden som en generell formel med summetegn). d ) Regn også ut empirisk standardavvik s. Før du begynner å regne bør du finne en måte å effektivisere formelen for s pånår det som her er mange like verdier. Sett opp begge varianter av denne metoden som en generell formel med summetegn).
Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. e ) Finn ut hvordan kalkulatoren din kan regne ut x og s, vedå utnytte at det er mange like verdier så du slipper å taste inn alle de 50 enkeltobservasjonene. Oppgave 3 Kalkulatorøvelse eksempel hentet fra Vännmann: Matematisk Statistikk, Universitetsforlaget 1989): a ) I en undersøkelse ved et steinbrudd i Gränges i Sverige ble tidsforbruk i sekunder) ved å fylle en lastebil med pukkstein målt som del av en undersøkelse om en ny type grabb ga raskere fylling enn den gamle). Finn forventningsverdi og standardavvik når vi har følgende obesrvasjoner: {155, 153, 18, 17, 69, 84, 99, 110, 11, 181, 176, 79, 94, 111, 118}. Sjekk for deg selv) at du forstår hva også de andre empiriske statistiske målene du får på kalkulatoren betyr. Egentlig består datasettet av 114 enkeltverdier, som i klasseinndelt frekvensdiagram er Intervall y j Frekvens < 60, 80] 70 13 < 80, 100] 90 8 < 100, 10] 110 41 < 10, 140] 130 0 < 140, 160] 150 8 < 160, 180] 170 < 180, 00] 190 Siden du ikke har oppgitt enkeltverdiene må du bruke midtpunktet y j i hvert intervall som observert verdi. Finn forventningsverdi og standardavvik for dette datasettet. Oppgave 4 I denne oppgaven skal dere se på og advares mot) et avrundingsproblem som kan oppstånår variasjonen standardavviket) er lite i forhold til størrelsen på de observerte dataene og x). I denne oppgaven består datasettet x av tallene x 1 13.45, x 13.55 og x 3 13.60. a) Regn ut forventningsverdien x og angi medianen x til datasettet x. b) Regn utstandardavviket s til datasettet x påfiremåter: 1. Via formelen s 1 n 1 x i x).. Via formelen s 1 n 1 x i nx), der du bruker x med tre desimaler. 3. Via formelen s 1 n 1 x i nx), der du bruker x med seks desimaler. 4. Med kalkulator. Diskuter resultatene fra b oppgaven med medstudentene, og konkluder med et par råd om hvordan tallsett der variasjonen er liten i forhold til størrelsen på tallene bør håndteres.
Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. 3 Oppgave 5 Teorioppgave. Omformingen i s xx, telleren i den empiriske variansen kan vises slik: x i x) 1) x i x i x + x ) ) x i x i x nx + nx 5) x i x + x i nx + nx 6) x 3) x i x x i nx a) La n, og gjennomfør utregningen over med x 1, x og x uten bruk av summetegn. x i + nx 4) Kommenter spesielt hva omformingen i hver likhet bygger på. En tilsvarende omforming som vi får bruk for senere i pensum) er s xy x i x)y i y) x i y i nx y Forsøk å vise dette for generell n, som i eksemplet i starten av oppgaven). Oppgave 6 Praktisk gruppeoppgave. I denne oppgaven skal dere gjøre et praktiske forsøk, med terning- og myntkast e.l. I tillegg til å være en øvelse i beskrivende statistikk skal resultatet brukes til å illustrere teorien seinere i semesteret. Det er derfor ønskelig at dere leverer den inn. Resultatet bør presenteres på ett enkelt ark for hvert forsøk. Dette skal være oversiktlig og egnet til åvisepå skjerm i klasserom. Legg litt flid i presentasjonen, korrekte utregninger og oversiktlig figur er mye viktigere enn åfåkastetså mange terninger som mulig! Lag den håndtegnet! Dette går raskere og mye penere enn ved bruk av Excel som erfaring fra tidligere viser klart.) Presentasjonen skal som sin viktigste del inneholde etstolpediagram som illustrere resultatene. På dette skal x og s være inntegnet. På den vertikale aksen skal skala både for frekvens totalt antall) og for relativ frekvens andel) være med. Den horisontale aksen skal ha med alle mulige verdier, selv om det kanskje ikke er noen observasjoner av de mer ekstreme verdiene. I tillegg skal det være med en frekvenstabell, og utregnet verdi av gjennomsnittet x og standardavviket s. Ikke glem en overskrift som forteller hva dataene handler om, og navn! I utgangspunktet skal du bare gjøre et av forsøkene men er lov til ågjøreflere, og eventuelt finne på eget forsøk). Antall kron på kast med to mynter. Kast to mynter n 00 ganger. Registrer antall kron mulige verdier {0, 1, } ). Antall øyne på enkelt terningkast. Kast en terning minst) n00 ganger. Registrer antall øyne mulige verdier {1,, 3, 4, 5, 6}).
4 Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. Sum av antall øyne på to terninger. Kast to terninger n300 ganger. Registrer summen av antall øyne mulige verdier {, 3,...,1}). Sum av antall øyne på fire terninger. Kast fire terninger n 300 ganger. Registrer summen av antall øyne mulige verdier {4, 5, 6,...,4}). Dette tar litt tid. Stor gruppe? Antall seksere på kast med fem terninger. Kast fem terninger n 00 ganger. Registrer antall seksere mulige verdier {0, 1,, 3, 4, 5}). Antall kron på kast med ti mynter. Kast 10 mynter n 10 ganger. Registrer antall kron mulige verdier {0, 1,,...,10}). Dette tar litt tid. Stor gruppe? Korrelasjon første og summen av to terninger Dette forsøket forutsetter at du er villig til å foregripe pensum litt og finne ut hvordan du regner ut korrelasjon, regresjonskoeffisienter og tegner spredningsplott. Det er fint om noen tar denne utfordringen. I dette forsøket skal dere kaste to terninger, og en av dem må identifiseres som første, og utfallet av dette i i-te forsøk kalles x i mulige verdier: {1,, 3, 4, 5, 6}). Dessutenskalsummenavantalløynepå de to terningene registreres, og utfallene kalles y i mulige verdier: {, 3, 4, 5, 6, 7, 8, 9, 10, 11, 1}). Hvis du ikke har to forskjellige terninger så kast den samme terningen to ganger. Gjenta forsøket n 50 ganger og registrer parene x, y) Antall øyne på første terning, summen av antall øyne på de to terningene ). Lag et spredningsplott av resultatene. Det blir antagelig flere like par, marker dette ved å tegne flere punkter rett ved siden av hverandre. Regn ut gjennomsnitt og standardavvik for x ene, og marker dette langs førsteaksen. Regn ut gjennomsnitt og standardavvik for y ene, og marker dette langs andreaksen. Regn ut den empiriske korrelasjonen r. Regn ut regresjonslikningen y a + bx, og tegn regresjonslinja inn i spredningsplottet. Andre forsøk Det er også lovå konstruere egne forsøk. Pass påå beskrive forsøket i overskriften så det blir forståelig for uinvidde. Noen mulige temaer: Kast med assymetrisk terning f.eks laget av en fyrstikkeske). Kast med mynt mot vegg. Registrer avstand mellom mynt og vegg. En eller annen ikke for voldsom) variant av åkastepå blink. Forslag til flere oppgaver fra læreboka Løvås). Løsningsforslag lagt ut på fagets hjemmeside: Kapittel, oppg..7,.8,.9,.10,.4. 11.01.10, Hans Petter Hornæs
Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. 5 Fasit, Beskrivende statistikk. Oppgave 1 a) x 5++7+4+3 4. 5 Det ordnede datasettet er {, 3, 4, 5, 7 }, og medianen er midterste verdi i dette, altså x 4. c) s 5 4.) + 4.) +7 4.) +4 4.) +3 4.) 3.7, s 3.7 1.9 5 1 d) s 5 + +7 +4 +3 5 4. 5 1 3.7, s 3.7 1.9 Oppgave a ) Siden settet allerede er ordnet kan vi finne midterste verdi som det står. Siden 50 er et partall vil dette bli gjennomsnittet av 5. og 6. verdi, og da begge disse er 3 er x 3 b) d ) Siden 50/41.5 finner vi q 1 mellom 1.og 13. verdi som begge er, så q 1. Tilsvarende finner vi q 3 mellom 38. og 39. verdi, som begge er 4, så q 3 4. Dermed er kvartilavstanden 4. i Frekvens Relativ frekvens 0 1 1/50 0.0 1 7 7/50 0.14 16 16/50 0.3 3 1 1/50 0.4 4 11 11/50 0. 5 3 3/50 0.06 I telleren skal vi addere 1 null, 7 enere, 16 toere, 1 treere, 11 firere og 3 femmere som gir x 0 1+1 7+ 16 + 3 1 + 4 11 + 5 3 50 Ved å ordne litt på brøken kan dette omskrives til.68 1 x 0 50 +1 7 16 1 11 + +3 +4 50 50 50 50 +5 3 50.68 som er summen av produktene mellom 1. og 3. eller 4.) kolonne i frekvenstabellen. Dette kan generelt skrives m x y j f j j1 der y j j {1,,,m} er verdiene som finnes i listene her y 1 0,y 1,..., y m y 6 5),mens f j er den relative frekvensen av y j. Dette er summen av produktet av verdiene på observasjonene med den relative frekvensen denne verdien opptrer med. Senere skal vi se på teoretisk forventningsverdi, som er det tilsvarende uttrykket med de relative frekvensene erstattet med sannsynligheten for de forskjellige verdiene. Hvis vi bruker formelen x i nx )/) kan vi gruppere summen i teller på tilsvarende måte: s 0 1+1 7+ 16 + 3 1 + 4 11 + 5 3 50.68 49 1.45, s 1.45 1.0 Generelt kan dette skrives s 1 m j1 y j x) f j 1 m yj f j x j1
6 Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. Oppgave 3 a) x 1.7, s 36.6. b) x 109.3, s 5.4. Oppgave 4 a) x 13.533333... Som sluttsvar gies vanligvis gjennomsnitt med en desimal mer enn rådataene, dvs. x 13.533, men som vi skal se kan vi trenge fler i mellomregningene. x x 3 13.55. b) 1. s xx 13.45 13.533) + 13.60 13.533) + 13.55 13.533) 0.011667. s s xx /) s xx /så s 0.011667/0.076.. s xx 13.45 + 13.60 + 13.55 3 13.533 0.5873 så s 0.5873/0.360. 3. s xx 13.45 + 13.60 + 13.55 3 13.533333 0.0119 så s 0.0119/0.0764. 4. s 0.0763766159 men som sluttsvar er det vanlig med en desimal mer enn rådataene, dvs. s 0.076). Formelen s 1 n n 1 x i nx) er følsom for avrundingsfeil på x når variasjonen er liten i forhold til størrelsen på dataene. Ta derfor med mange desimaler i mellomregningene. Et alternativ er å transformere dataene, om vi subtraherer samme verdi, f.eks. 13, fra hver verdi endres ikke standardavviket, og for 0.45, 0.60 og 0.55 er ikke variasjonen spesielt liten i forhold til størrelsen. 0.45 +0.60 +0.55 3 0.533 )/ 0.080, enda bedre ved å trekke fra 13.4 eller 13.5. Oppgave 5 a) x 1 x) +x x) 1) x 1 x 1x + x + x x x + x ) x 1 + ) x x1 x +x x)+ x + x ) 3) Andre kvadratsetning på hvertledder 1), mens ) erå bytte rekkefølge på leddene og samle ledd av samme type i parenteser dvs. i et eget summetegn). x 1 + x ) x x1 + x )+x 4) x 1 + ) x x x +x 5) I 3) er de felles faktorene x og satt utenfor parentes i midterste ledd, mens siste ledd er å addere n like tall. I 4) har vi at omformet x x 1 + x )/ tilx 1 + x x generelt x i nx). I 5) multipliseres midterste ledd sammen, og i 6) trekkes de to siste leddene sammen: x 1 + x ) x +x 6) x 1 + ) x x b) x i x)y i y) 1) x i y i y ) x i y i x i x x i y i x i y xy i + x y) ) nx y + nx y 6) y i + nx y 4) x i y i x i y i ) ) x i y i nx y x i y + y i x)+ y nx x ny + nx y 5) x i y i nx y x y 3) Hans Petter Hornæs