Beskrivende statistikk.



Like dokumenter
ST0103 Brukerkurs i statistikk Høst 2014

INNHOLD. Matematikk for ungdomstrinnet

Forelening 1, kapittel 4 Stokastiske variable

ØVINGER 2017 Løsninger til oppgaver. Øving 1

EKSAMEN. EMNEANSVARLIG: Terje Bokalrud og Hans Petter Hornæs. TILLATTE HJELPEMIDLER: Kalkulator og alle trykte og skrevne hjelpemidler.

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

1 Grafisk framstilling av datamateriale

Statistikk. Forkurs 2017

Statistikk. Forkurs 2018

STK1100 våren Betinget sannsynlighet og uavhengighet. Svarer til avsnittene 2.4 og 2.5 i læreboka

Deskriptiv statistikk., Introduksjon til dataanalyse

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Forelesning 5, kapittel 3. : 3.5: Uavhengige hendelser.

Sannsynlighet og statistikk S2 Løsninger

Sannsynlighetsregning og Statistikk.

Test, 3 Sannsynlighet og statistikk

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Sannsynlighet og statistikk S2 Oppgaver

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

Sannsynlighet i uniforme modeller. Addisjon av sannsynligheter

ECON240 Vår 2018 Oppgaveseminar 1 (uke 6)

Deskriptiv statistikk., Introduksjon til dataanalyse

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar.

Fire kort. Mål. Gjennomføring. Film. Problemløsing Fire kort Planleggingsdokument

TMA4240 Statistikk Høst 2016

ECON240 Høst 2017 Oppgaveseminar 1 (uke 35)

Simulering - Sannsynlighet

Simulering på regneark

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Sannsynlighetsregning

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Sannsynlighetsbegrepet

i x i

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Innledning kapittel 4

ECON2130 Kommentarer til oblig

Familiematematikk MATTEPAKKE 3. Trinn

Nyttige tilleggsverktøy i GeoGebra

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

Fire kort. Mål. Gjennomføring. Film. Problemløsing Fire kort

Fire kort. Mål. Gjennomføring. Film. Problemløsing Fire kort

TMA4240 Statistikk Høst 2018

Eksamensoppgave i ST0103 Brukerkurs i statistikk

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE

Tilfeldighetenes spill Undervisningsopplegg for ungdomstrinnet

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Tillegg til kapittel 2 Grunntall 9

Prøvemidtveiseksamen TMA4240 Statistikk H2004

2P kapittel 4 Statistikk Løsninger til oppgavene i læreboka

Sannsynlighet og statistikk

ST0202 Statistikk for samfunnsvitere

Grunnleggende kurs i Excel. Langnes skole

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

Bruk SUMMER-funksjonen i formelen i G9. Oppgave 14. H. Aschehoug & Co Side 1

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Innledning kapittel 4

ST0202 Statistikk for samfunnsvitere

Sannsynlighetsregning og kombinatorikk

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Regneregler for forventning og varians

Sannsynlighet og statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

7. TRINN MATEMATIKK PERIODEPLAN 1 - Uke 34-44

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Normal- og eksponentialfordeling.

4: Sannsynlighetsregning

Fasit for tilleggsoppgaver

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

6 Sannsynlighetsregning

Sannsynlighetsregning og Statistikk

Et lite notat om og rundt normalfordelingen.

Eksamensoppgave i TMA4240 Statistikk

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4245 Statistikk Eksamen desember 2016

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere

Eksamen høsten 2016 Løsninger

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Basisoppgaver til 2P kap. 3 Statistikk

Kort overblikk over kurset sålangt

Prosent- og renteregning

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Når du har arbeidet deg gjennom dette kapittelet, er målet at du skal kunne

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

SAMMENDRAG OG FORMLER. Nye Mega 9A og 9B

Transkript:

Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. 1 Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke I løpet av uken blir løsningsforslag lagt ut på emnesiden http://www.hig.no/toel/allmennfag/emnesider/smf11 Beskrivende statistikk. Gjør først oppgave 1 og. Hvis du mener du da allerede har kontroll på å regne ut gjennomsnitt og standardavvik, og å finne median, kan du gjøre praktiske oppgaven oppgave 6). Det er best om du finner noen å gjøre den sammen med gruppeoppgave). Oppgave 1 Hensikten med denne oppgaven er å sjekke for dere selv om dere har forstått definisjonene av x, x og s. Oppgave a, b, c og d skal derfor i første omgang regnes uten bruk av statistikkdelen på kalkulatoren. Et datasett består av observasjonene { 5,, 7, 4, 3 }. a ) Finn empirisk forventningsverdi x for dataene. Finn medianen x for dataene. Regn ut empirisk varians s og standardavvik s ved hjelp av formelen s x i x). d ) Regn ut varians s og standardavvik s ved hjelp av formelen s x i n x. e ) Finn ut hvordan statistikkdelen på kalkulatoren din finner x, x og s. For standardavviket finnes det antagelig to varianter. Bruk svaret på c og d oppgaven for å finne ut hvilken av disse som skal brukes. Oppgave Et forsøk bestod i å kaste 5 mynter, og registrere antall kron. Dette ble gjentatt 50 ganger, og resultatet når dataene er ordnet ble { 0, 1, 1, 1, 1, 1, 1, 1,,,,,,,,,,,,,,,,, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5} a ) Finn median og kvartilavstand for dette datasettet. Lag en frekvenstabell med både absolutte og relative frekvenser) for dette datasettet. Regn ut den empiriske forventningsverdien x uten bruk av statistikkdelen på kalkulatoren). Før du begynner å regne bør du finne en måte å effektivisere utregninga av x pånår det som her er mange like verdier. Sett opp denne metoden som en generell formel med summetegn). d ) Regn også ut empirisk standardavvik s. Før du begynner å regne bør du finne en måte å effektivisere formelen for s pånår det som her er mange like verdier. Sett opp begge varianter av denne metoden som en generell formel med summetegn).

Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. e ) Finn ut hvordan kalkulatoren din kan regne ut x og s, vedå utnytte at det er mange like verdier så du slipper å taste inn alle de 50 enkeltobservasjonene. Oppgave 3 Kalkulatorøvelse eksempel hentet fra Vännmann: Matematisk Statistikk, Universitetsforlaget 1989): a ) I en undersøkelse ved et steinbrudd i Gränges i Sverige ble tidsforbruk i sekunder) ved å fylle en lastebil med pukkstein målt som del av en undersøkelse om en ny type grabb ga raskere fylling enn den gamle). Finn forventningsverdi og standardavvik når vi har følgende obesrvasjoner: {155, 153, 18, 17, 69, 84, 99, 110, 11, 181, 176, 79, 94, 111, 118}. Sjekk for deg selv) at du forstår hva også de andre empiriske statistiske målene du får på kalkulatoren betyr. Egentlig består datasettet av 114 enkeltverdier, som i klasseinndelt frekvensdiagram er Intervall y j Frekvens < 60, 80] 70 13 < 80, 100] 90 8 < 100, 10] 110 41 < 10, 140] 130 0 < 140, 160] 150 8 < 160, 180] 170 < 180, 00] 190 Siden du ikke har oppgitt enkeltverdiene må du bruke midtpunktet y j i hvert intervall som observert verdi. Finn forventningsverdi og standardavvik for dette datasettet. Oppgave 4 I denne oppgaven skal dere se på og advares mot) et avrundingsproblem som kan oppstånår variasjonen standardavviket) er lite i forhold til størrelsen på de observerte dataene og x). I denne oppgaven består datasettet x av tallene x 1 13.45, x 13.55 og x 3 13.60. a) Regn ut forventningsverdien x og angi medianen x til datasettet x. b) Regn utstandardavviket s til datasettet x påfiremåter: 1. Via formelen s 1 n 1 x i x).. Via formelen s 1 n 1 x i nx), der du bruker x med tre desimaler. 3. Via formelen s 1 n 1 x i nx), der du bruker x med seks desimaler. 4. Med kalkulator. Diskuter resultatene fra b oppgaven med medstudentene, og konkluder med et par råd om hvordan tallsett der variasjonen er liten i forhold til størrelsen på tallene bør håndteres.

Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. 3 Oppgave 5 Teorioppgave. Omformingen i s xx, telleren i den empiriske variansen kan vises slik: x i x) 1) x i x i x + x ) ) x i x i x nx + nx 5) x i x + x i nx + nx 6) x 3) x i x x i nx a) La n, og gjennomfør utregningen over med x 1, x og x uten bruk av summetegn. x i + nx 4) Kommenter spesielt hva omformingen i hver likhet bygger på. En tilsvarende omforming som vi får bruk for senere i pensum) er s xy x i x)y i y) x i y i nx y Forsøk å vise dette for generell n, som i eksemplet i starten av oppgaven). Oppgave 6 Praktisk gruppeoppgave. I denne oppgaven skal dere gjøre et praktiske forsøk, med terning- og myntkast e.l. I tillegg til å være en øvelse i beskrivende statistikk skal resultatet brukes til å illustrere teorien seinere i semesteret. Det er derfor ønskelig at dere leverer den inn. Resultatet bør presenteres på ett enkelt ark for hvert forsøk. Dette skal være oversiktlig og egnet til åvisepå skjerm i klasserom. Legg litt flid i presentasjonen, korrekte utregninger og oversiktlig figur er mye viktigere enn åfåkastetså mange terninger som mulig! Lag den håndtegnet! Dette går raskere og mye penere enn ved bruk av Excel som erfaring fra tidligere viser klart.) Presentasjonen skal som sin viktigste del inneholde etstolpediagram som illustrere resultatene. På dette skal x og s være inntegnet. På den vertikale aksen skal skala både for frekvens totalt antall) og for relativ frekvens andel) være med. Den horisontale aksen skal ha med alle mulige verdier, selv om det kanskje ikke er noen observasjoner av de mer ekstreme verdiene. I tillegg skal det være med en frekvenstabell, og utregnet verdi av gjennomsnittet x og standardavviket s. Ikke glem en overskrift som forteller hva dataene handler om, og navn! I utgangspunktet skal du bare gjøre et av forsøkene men er lov til ågjøreflere, og eventuelt finne på eget forsøk). Antall kron på kast med to mynter. Kast to mynter n 00 ganger. Registrer antall kron mulige verdier {0, 1, } ). Antall øyne på enkelt terningkast. Kast en terning minst) n00 ganger. Registrer antall øyne mulige verdier {1,, 3, 4, 5, 6}).

4 Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. Sum av antall øyne på to terninger. Kast to terninger n300 ganger. Registrer summen av antall øyne mulige verdier {, 3,...,1}). Sum av antall øyne på fire terninger. Kast fire terninger n 300 ganger. Registrer summen av antall øyne mulige verdier {4, 5, 6,...,4}). Dette tar litt tid. Stor gruppe? Antall seksere på kast med fem terninger. Kast fem terninger n 00 ganger. Registrer antall seksere mulige verdier {0, 1,, 3, 4, 5}). Antall kron på kast med ti mynter. Kast 10 mynter n 10 ganger. Registrer antall kron mulige verdier {0, 1,,...,10}). Dette tar litt tid. Stor gruppe? Korrelasjon første og summen av to terninger Dette forsøket forutsetter at du er villig til å foregripe pensum litt og finne ut hvordan du regner ut korrelasjon, regresjonskoeffisienter og tegner spredningsplott. Det er fint om noen tar denne utfordringen. I dette forsøket skal dere kaste to terninger, og en av dem må identifiseres som første, og utfallet av dette i i-te forsøk kalles x i mulige verdier: {1,, 3, 4, 5, 6}). Dessutenskalsummenavantalløynepå de to terningene registreres, og utfallene kalles y i mulige verdier: {, 3, 4, 5, 6, 7, 8, 9, 10, 11, 1}). Hvis du ikke har to forskjellige terninger så kast den samme terningen to ganger. Gjenta forsøket n 50 ganger og registrer parene x, y) Antall øyne på første terning, summen av antall øyne på de to terningene ). Lag et spredningsplott av resultatene. Det blir antagelig flere like par, marker dette ved å tegne flere punkter rett ved siden av hverandre. Regn ut gjennomsnitt og standardavvik for x ene, og marker dette langs førsteaksen. Regn ut gjennomsnitt og standardavvik for y ene, og marker dette langs andreaksen. Regn ut den empiriske korrelasjonen r. Regn ut regresjonslikningen y a + bx, og tegn regresjonslinja inn i spredningsplottet. Andre forsøk Det er også lovå konstruere egne forsøk. Pass påå beskrive forsøket i overskriften så det blir forståelig for uinvidde. Noen mulige temaer: Kast med assymetrisk terning f.eks laget av en fyrstikkeske). Kast med mynt mot vegg. Registrer avstand mellom mynt og vegg. En eller annen ikke for voldsom) variant av åkastepå blink. Forslag til flere oppgaver fra læreboka Løvås). Løsningsforslag lagt ut på fagets hjemmeside: Kapittel, oppg..7,.8,.9,.10,.4. 11.01.10, Hans Petter Hornæs

Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. 5 Fasit, Beskrivende statistikk. Oppgave 1 a) x 5++7+4+3 4. 5 Det ordnede datasettet er {, 3, 4, 5, 7 }, og medianen er midterste verdi i dette, altså x 4. c) s 5 4.) + 4.) +7 4.) +4 4.) +3 4.) 3.7, s 3.7 1.9 5 1 d) s 5 + +7 +4 +3 5 4. 5 1 3.7, s 3.7 1.9 Oppgave a ) Siden settet allerede er ordnet kan vi finne midterste verdi som det står. Siden 50 er et partall vil dette bli gjennomsnittet av 5. og 6. verdi, og da begge disse er 3 er x 3 b) d ) Siden 50/41.5 finner vi q 1 mellom 1.og 13. verdi som begge er, så q 1. Tilsvarende finner vi q 3 mellom 38. og 39. verdi, som begge er 4, så q 3 4. Dermed er kvartilavstanden 4. i Frekvens Relativ frekvens 0 1 1/50 0.0 1 7 7/50 0.14 16 16/50 0.3 3 1 1/50 0.4 4 11 11/50 0. 5 3 3/50 0.06 I telleren skal vi addere 1 null, 7 enere, 16 toere, 1 treere, 11 firere og 3 femmere som gir x 0 1+1 7+ 16 + 3 1 + 4 11 + 5 3 50 Ved å ordne litt på brøken kan dette omskrives til.68 1 x 0 50 +1 7 16 1 11 + +3 +4 50 50 50 50 +5 3 50.68 som er summen av produktene mellom 1. og 3. eller 4.) kolonne i frekvenstabellen. Dette kan generelt skrives m x y j f j j1 der y j j {1,,,m} er verdiene som finnes i listene her y 1 0,y 1,..., y m y 6 5),mens f j er den relative frekvensen av y j. Dette er summen av produktet av verdiene på observasjonene med den relative frekvensen denne verdien opptrer med. Senere skal vi se på teoretisk forventningsverdi, som er det tilsvarende uttrykket med de relative frekvensene erstattet med sannsynligheten for de forskjellige verdiene. Hvis vi bruker formelen x i nx )/) kan vi gruppere summen i teller på tilsvarende måte: s 0 1+1 7+ 16 + 3 1 + 4 11 + 5 3 50.68 49 1.45, s 1.45 1.0 Generelt kan dette skrives s 1 m j1 y j x) f j 1 m yj f j x j1

6 Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. Oppgave 3 a) x 1.7, s 36.6. b) x 109.3, s 5.4. Oppgave 4 a) x 13.533333... Som sluttsvar gies vanligvis gjennomsnitt med en desimal mer enn rådataene, dvs. x 13.533, men som vi skal se kan vi trenge fler i mellomregningene. x x 3 13.55. b) 1. s xx 13.45 13.533) + 13.60 13.533) + 13.55 13.533) 0.011667. s s xx /) s xx /så s 0.011667/0.076.. s xx 13.45 + 13.60 + 13.55 3 13.533 0.5873 så s 0.5873/0.360. 3. s xx 13.45 + 13.60 + 13.55 3 13.533333 0.0119 så s 0.0119/0.0764. 4. s 0.0763766159 men som sluttsvar er det vanlig med en desimal mer enn rådataene, dvs. s 0.076). Formelen s 1 n n 1 x i nx) er følsom for avrundingsfeil på x når variasjonen er liten i forhold til størrelsen på dataene. Ta derfor med mange desimaler i mellomregningene. Et alternativ er å transformere dataene, om vi subtraherer samme verdi, f.eks. 13, fra hver verdi endres ikke standardavviket, og for 0.45, 0.60 og 0.55 er ikke variasjonen spesielt liten i forhold til størrelsen. 0.45 +0.60 +0.55 3 0.533 )/ 0.080, enda bedre ved å trekke fra 13.4 eller 13.5. Oppgave 5 a) x 1 x) +x x) 1) x 1 x 1x + x + x x x + x ) x 1 + ) x x1 x +x x)+ x + x ) 3) Andre kvadratsetning på hvertledder 1), mens ) erå bytte rekkefølge på leddene og samle ledd av samme type i parenteser dvs. i et eget summetegn). x 1 + x ) x x1 + x )+x 4) x 1 + ) x x x +x 5) I 3) er de felles faktorene x og satt utenfor parentes i midterste ledd, mens siste ledd er å addere n like tall. I 4) har vi at omformet x x 1 + x )/ tilx 1 + x x generelt x i nx). I 5) multipliseres midterste ledd sammen, og i 6) trekkes de to siste leddene sammen: x 1 + x ) x +x 6) x 1 + ) x x b) x i x)y i y) 1) x i y i y ) x i y i x i x x i y i x i y xy i + x y) ) nx y + nx y 6) y i + nx y 4) x i y i x i y i ) ) x i y i nx y x i y + y i x)+ y nx x ny + nx y 5) x i y i nx y x y 3) Hans Petter Hornæs