ST0103 Brukerkurs i statistikk Høst 2014

Like dokumenter
ØVINGER 2017 Løsninger til oppgaver. Øving 1

ØVINGER 2017 Løsninger til oppgaver. 3.1 Myntkast For et enkelt myntkast har vi to mulige utfall, M og K. Utfallsrommet blir

INNHOLD. Matematikk for ungdomstrinnet

Statistikk. Forkurs 2017

Beskrivende statistikk.

Statistikk. Forkurs 2018

Sannsynlighet i uniforme modeller. Addisjon av sannsynligheter

STK1100 våren Betinget sannsynlighet og uavhengighet. Svarer til avsnittene 2.4 og 2.5 i læreboka

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Kapittel 1: Data og fordelinger

Forelening 1, kapittel 4 Stokastiske variable

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Når du har arbeidet deg gjennom dette kapittelet, er målet at du skal kunne

6 Sannsynlighetsregning

ST0202 Statistikk for samfunnsvitere

Kompetansemål Hva er sannsynlighet?... 2

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Sannsynligheten for en hendelse (4.2) Empirisk sannsynlighet. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Følgelig vil sannsynligheten for at begge hendelsene inntreffer være null,

Sannsynlighet og statistikk

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Tilfeldige variable (5.2)

Deskriptiv statistikk., Introduksjon til dataanalyse

Test, 3 Sannsynlighet og statistikk

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

4: Sannsynlighetsregning

Sentralmål og spredningsmål

Sannsynlighet og statistikk

Sannsynlighetsregning og Statistikk.

ECON240 Høst 2017 Oppgaveseminar 1 (uke 35)

Sannsynlighetsregning og Statistikk

Et lite notat om og rundt normalfordelingen.

Statistikk 2. Tabellen nedenfor viser oljeproduksjonen i et OPEC-land i perioden 1990 til Produksjonen er i 1000 tonn.

Deskriptiv statistikk., Introduksjon til dataanalyse

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

MULTIPLE CHOICE ST0103 BRUKERKURS I STATISTIKK September 2016

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Kapittel 2: Sannsynlighet

ST0202 Statistikk for samfunnsvitere

Regneregler for forventning og varians

SANNSYNLIGHETSREGNING

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

STK1100 våren Betinget sannsynlighet og uavhengighet. Vi trenger en definisjon av betinget sannsynlighet! Eksempel 1

ÅMA110 Sannsynlighetsregning med statistikk, våren Grunnbegrep. Grunnbegrep, sannsynligheten for et utfall

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Sannsynlighetsbegrepet

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

ECON Statistikk 1 Forelesning 2: Innledning

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

Et lite notat om og rundt normalfordelingen.

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

2P 2012 vår ny LØSNING

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk 2014

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Kapittel 4.3: Tilfeldige/stokastiske variable

TMA4240 Statistikk Høst 2016

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Bruk SUMMER-funksjonen i formelen i G9. Oppgave 14. H. Aschehoug & Co Side 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Statistikk Løsninger. Innhold. Statistikk Vg2P

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Sannsynlighetsregning

Tema. Beskrivelse. Husk!

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

i x i

Sannsynlighetsregning og kombinatorikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Forelesning 3, kapittel 3. : 3.2: Sannsynlighetsregning. Kolmogoroffs aksiomer og bruk av disse.

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Eksamen høsten 2016 Løsninger

Statistikk. Mål. for opplæringen er at eleven skal kunne. planlegge, gjennomføre og vurdere statistiske undersøkelser

ECON Statistikk 1 Forelesning 3: Sannsynlighet. Jo Thori Lind

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

MATEMATIKK (MAT1005) Sentralmål / Spredningsmål

Kapittel 1 ser på. Statistikk i hverdagen

ECON2130 Kommentarer til oblig

TMA4245 Statistikk Høst 2016

Basisoppgaver til 2P kap. 3 Statistikk

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Løsningsforslag til utsatt eksamen 2. desember 2015

Innledning kapittel 4

TMA4240 Statistikk Høst 2013

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST0103 Brukerkurs i statistikk Høst 2014 Løsningsforslag Øving 1 2.1 Frekvenstabell For å lage en frekvenstabell må vi telle antall observasjoner av hvert antall henvendelser. Siden antall henvendelser på en gitt dag alltid ligger mellom 0 og 7 trenger vi en tabell med åtte rader. Videre lar vi tabellen ha tre kolonner. I den venstre kolonnen lister vi variabelen vi ønsker å tabulere frekvensen av, altså antall henvendelser. I den midterste kolonnen skriver vi frekvensen vi har observert hvert antall henvendelser med, altså hvor mange ganger hvert av tallene opptrer i tabellen i oppgaveteksten. I den høyre kolonnen skriver vi relativ frekvens, altså hvor stor andel av observasjonene hver observerte verdi utgjør. Vi finner de relative frekvensene ved å normalisere frekvensene i den midterste kolonnen. Siden det totalt er 100 observasjoner, normaliserer vi frekvensene ved å dele på 100. Antall henvendelser Frekvens Relativ frekvens 0 9 0.09 1 20 0.20 2 26 0.26 3 18 0.18 4 11 0.11 8 0.08 6 0.0 7 3 0.03 For å kontrollere utregningene kan vi sjekke at summen av frekvensene blir lik antall observasjoner, alstå 100, og at summen av de relative frekvensene blir 1. Merk at en frekvenstabell ikke nødvendigvis trenger å ha med både frekvenser og relative frekvenser. Histogram Histogrammet skal være et søylediagram som visualiserer innholdet i frekvenstabellen. Søylene bør være brede nok til at de er helt inntil hverandre. I tillegg ønsker vi at det totale arealet av søylene skal være lik 1. Hvis hver rad i frekvenstabellen representeres av en rektangulær søyle med bredde 1 og høyde lik den relative frekvensen, da vil arealet av søylen være lik relativ frekvens, og sammenlagt vil arealet av alle søylene være lik summen av de relative frekvensene, som er 1. Det kan være praktisk å sentrere hver søyle horisontalt på verdien den representerer, slik at søylen for null henvendelser strekker seg fra 0. til 0. på x-aksen, søylen for én henvendelse strekker seg fra 0. til 1., og så videre. 22. august 2014 Side 1 av 8

0.3 0.3 0.2 Relativ frekvens 0.2 0.1 0.1 0.0 0 0 1 2 3 4 6 7 Antall henvendelser Histogrammet har en skjev form. De høyeste søylene finner vi rundt to henvendelser. Høyden avtar gradvis når man beveger seg til høyre, dvs. mot flere henvendelser. Histogrammet har ikke noen tilsvarende hale på venstre side, siden antall henvendelser alltid er større enn eller lik null. En slik skjev form er typisk for histogrammer av ikke-negative variable. 2. Vi bør unngå å bruke gjennomsnitt som sentralmål når vi studerer inntektsforhold. Dette fordi fordelingen av inntekt ofte er svært skjev. Gjennomsnittsinntekten er gjerne mange ganger større enn inntekten til en typisk arbeidstaker. Medianinntekten er derimot et informativt sentralmål for inntekt, og er bedre skikket til å fortelle oss hvor inntektsnivået faktisk ligger. Sammenlignet med gjennomsnittet påvirkes medianen lite av den store skjevheten i utvalget, altså det at noen få arbeidstakere har svært høy inntekt. Modus kan også brukes som sentralmål for inntekt, men fungerer best dersom observasjonene er gruppert i intervaller, slik at det blir mange nok observasjoner av hvert intervall. Modus forteller da hvilket intervall en typisk inntekt ligger innenfor. 2.7 Median For å finne medianen begynner vi med å sortere tallene i stigende rekkefølge: 2 3 4 7 8 12. De to midterste tallene er 4 og 7, så medianen er (4 + 7/2 =.. Gjennomsnitt Gjennomsnittet av tallene er 2 + 3 + 4 + 7 + 8 + 12 6 = 36 6 = 6. 22. august 2014 Side 2 av 8

Standardavvik For å finne standardavviket regner vi først ut variansen, s 2 = 1 [ (2 6 2 + (3 6 2 + (4 6 2 + (7 6 2 + (8 6 2 + (12 6 2] 6 1 = 1 [ 4 2 + 3 2 + 2 2 + 1 2 + 2 2 + 6 2] = 1 70 = 14. Standardavviket er da s = 14 = 3.74. 2.8 Median Medianen er gjennomsnittet av de to midterste tallene, 1 000 004 + 1 000 007 2 = 1 000 00.. Gjennomsnitt Summen av tallene er 6 000 036, og gjennomsnittet er summen delt på 6, Standardavvik 6 000 036 6 = 1 000 006. Vi skal regne ut standardavviket, og ser først på de individuelle kvadratavvikene (1 000 002 1 000 006 2 = (2 6 2 (1 000 003 1 000 006 2 = (3 6 2 (1 000 004 1 000 006 2 = (4 6 2 (1 000 007 1 000 006 2 = (7 6 2 (1 000 008 1 000 006 2 = (8 6 2 (1 000 012 1 000 006 2 = (12 6 2. Dette er de samme kvadratavvikene som i oppgave 2.7, slik at variansen også i dette tilfellet blir s 2 = 1 [ 4 2 + 3 2 + 2 2 + 1 2 + 2 2 + 6 2] 6 1 = 1 70 = 14, og standardavviket blir 14 = 3.74. Tallene i denne oppgaven er forskjøvet oppover med 1 000 000 i forhold til tallene i oppgave 2.7. Dermed er medianen og gjennomsnittet forskjøvet tilsvarende i forhold til sentralmålene i oppgave 2.7. Spredningen til tallene er imidlertid uendret, slik at standardavviket er det samme som før. 22. august 2014 Side 3 av 8

2.9 Median Her er de to midterste tallene 400 og 700, så medianen er 400 + 700 2 = 0. Gjennomsnitt Gjennomsnittet blir 200 + 300 + 400 + 700 + 800 + 1200 6 = 3600 6 = 600. Standardavvik Variansen er s 2 = 1 [ (200 600 2 + (300 600 2 + (400 600 2 6 1 + (700 600 2 + (800 600 2 + (1200 600 2] = 1 [ 400 2 + 300 2 + 200 2 + 100 2 + 200 2 + 400 2] = 1 700 000 = 140 000, slik at standardavviket blir 140 000 = 374.17. Tallene som er gitt i denne oppgaven er de samme som i oppgave 2.7, men multiplisert med 100. Medianen og gjennomsnittet blir her 100 ganger tilsvarende sentralmål i oppgave 2.7. Til forskjell fra translasjon, som i oppgave 2.8, vil multiplikasjon endre spredningen til utvalget, så her finner vi også at standardavviket er 100 ganger større enn standardavviket i oppgave 2.7. 2.22 (19 Definisjon 2.3 gir oss følgende formel for varians: s 2 = 1 n (x i x 2, og vi skal vise at dette er det samme som ( n 1 x 2 i n x 2. Vi følger anbefalingen i oppgaveteksten, og bruker nederste linje i regel 2.2 til å utvide summen, ( s 2 = 1 n n (x i x 2 = 1 n x 2 i 2 x x i + n x 2. 22. august 2014 Side 4 av 8

Videre merker vi oss at siden x = 1/n n x i, så kan vi bytte ut n x i med n x. Dermed er ( n s 2 = 1 x 2 i 2 x(n x + n x 2 ( n = 1 x 2 i 2n x 2 + n x 2 ( n = 1 x 2 i n x 2. 3.1 Myntkast For et enkelt myntkast har vi to mulige utfall, M og K. Utfallsrommet blir S = {M, K}. Med to etterfølgende myntkast blir utfallsrommet S = {MM, MK, KM, KK }, hvor MM betyr at vi kaster mynt to ganger, MK betyr at vi først kaster mynt, deretter kron, og så videre. Terningkast Utfallsrommet er S = {1, 2, 3, 4,, 6}. At terningen viser partall kan identifiseres med hendelsen To terninger Med to terninger blir utfallsrommet A = {e S : e er et partall} = {2, 4, 6}. S = {11, 12, 13,..., 66}, det vil si alle kombinasjoner ij hvor i og j begge er elementer i {1, 2, 3, 4,, 6}. Det er seks mulige verdier av i, og seks mulige verdier for j, så totalt er det S = 6 2 = 36 utfall. Mengden som svarer til at begge terningene er like er A = {ij S : i = j} = {11, 22, 33, 44,, 66}. Mengden som svarer til at vi får minst en sekser er B = {ij S : i = 6 eller j = 6} = {ij S : i = 6} {ij S : j = 6} = {61, 62, 63, 64, 6, 66} {16, 26, 36, 46, 6, 66} = {61, 62, 63, 64, 6, 66, 16, 26, 36, 46, 6}. 22. august 2014 Side av 8

Av S = 36 mulige utfall er det B = 11 utfall som gir oss minst en sekser. Sannsynligheten for å få minst en sekser er dermed P (B = Antall gunstige utfall Antall mulige utfall = 11 36 = 0.306. Politisk meningsmåling Med utgangspunkt i kategoriene som er listet opp i Tabell 2.1, har vi utfallsrommet S = {RV, SV, AP, SP, V, KrF, H, FrP, Andre}. Anta at sentrumspartiene er SP, V og KrF. Da identifiserer vi hendelsen Personen er sentrumsvelger med delmengden A = {SP, V, KrF}. Landskamp Utfallsrommet er S = {i-j : i {0, 1, 2,...}, j {0, 1, 2,...}} = {0-0, 1-0, 0-1, 1-1, 2-0, 0-2, 2-1, 1-2, 2-2,...}, altså alle kombinasjoner av i-j hvor i og j er ikke-negative heltall. Vi får samme utfallsrom for andre spill som ikke har noen øvre grense for antall mål. Hendelsen uavgjort tilsvarer delmengden av S hvor lagene har like mange mål, A = {i-j S : i = j} = {0-0, 1-1, 2-2,...}. Antall barn Selv om antall barn i praksis er begrenset oppad, velger vi utfallsrommet S = {0, 1, 2,...} slik at vi slipper å sette en vilkårlig øvre grense. Hendelsen mer enn fire barn tilsvarer delmengden A = {e S : e > 4} = {, 6, 7,...}. Temperaturmåling Hvis vi runder av temperaturmålingen til nærmeste hele grad, kan vi betrakte de mulige utfallene som heltall. Nesbyen har tidligere opplevd temperaturer mellom 38.0 C og 3.6 C, så for å være rimelig sikre på å dekke alle mulige utfall velger vi utfallsrommet S = { 40, 39, 38,..., 40}. Anta at vi har kortbuksevær når temperaturen er større enn eller lik 18 C. Da defineres hendelsen kortbuksevær som A = {e S : e 18} = {18, 19, 20,..., 40}. 22. august 2014 Side 6 av 8

3.4 Revisoren kontrollerer en av seks permer. Alle permene velges med like stor sannsynlighet. La utfallsrommet S bestå av de seks permene, og la A være hendelsen De tvilsomme transaksjonene avsløres. Da består A kun av permen med de inkriminerende bilagene, mens komplimentet A består av de fem andre permene. Sannsynligheten for at de tvilsomme transaksjonene blir avslørt er da lik sannsynligheten for at revisoren velger riktig perm, P (A = Antall gunstige utfall Antall mulige utfall = 1 6. 3.6 La 1 bety at terningen viser ett øye, 2 at den viser to øyne, og så videre. Da er utfallsrommet S = {1, 2, 3, 4,, 6} og hendelsene A, B og C er definert som følger: A = {1}, B = {2, 4, 6}, C = {1, 2, 3}. Venn-diagrammet viser at A er en delmengde av C, og at 2 er et element i både B og C. A B er unionen av A og B. A B = {1} {2, 4, 6} = {1, 2, 4, 6} Hendelsen A B inntreffer både dersom vi får en ener og dersom vi får et partall. Sannsynligheten for dette er P (A B = P ({1, 2, 4, 6} = 4 6 = 2 3. A C er komplementet til snittet av A og C, altså alle utfall som ikke er felles for A og C. A C = {1} {1, 2, 3} = {1} = {2, 3, 4,, 6} Hendelsen A C inntreffer kun dersom vi får en ener, så komplementet A C inntreffer i alle andre tilfeller, og har sannsynlighet P (A C = P ({2, 3, 4,, 6} = 6. 22. august 2014 Side 7 av 8

A B er unionen av A og komplementet til B, alstå alle utfall som enten er i A eller ikke er i B. A B = {1} {2, 4, 6} = {1} {1, 3, } = {1, 3, } Hendelsen A B inntreffer dersom vi får et oddetall. Det skjer med sannsynlighet P (A B = P ({1, 3, } = 3 6 = 1 2. A B C er unionen av alle tre hendelsene A, B og C, alstå alle utfall som er i minst en av hendelsene. A B C = {1} {2, 4, 6} {1, 2, 3} = {1, 2, 3, 4, 6} Hendelsen A B C inntreffer dersom vi får en ener eller dersom terningen viser tre eller mindre eller dersom vi får et partall. Det eneste utfallet som ikke hører til denne hendelsen er en femmer. Sannsynligheten for at hendelsen inntreffer er P (A B C = P ({1, 2, 3, 4, 6} = 6. A B er snittet av A og komplementet til B, altså den delen av A som ikke overlapper med B. Siden A og B ikke overlapper er dette snittet identisk med A. A B = {1} {2, 4, 6} = {1} {1, 3, } = {1} Hendelsen A B inntreffer kun dersom vi får en ener. Sannsynligheten for det er P (A B = P ({1} = 1 6. A C B er snittet av komplimentet til B og komplimentet til snittet av A og C. Utfallene i denne mengden er verken elementer i B eller elementer i både A og C. A C B = {1} {1, 2, 3} {2, 4, 6} = {1} {1, 3, } = {2, 3, 4,, 6} {1, 3, } = {3, } Hendelsen A C B inntreffer dersom vi får en treer eller en femmer. Sannsynligheten for dette er P (A C B = P ({3, } = 2 6 = 1 3. 22. august 2014 Side 8 av 8