Løsningsforslag til seminar 4 Undervisningsfri uke

Like dokumenter
Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Binomisk fordeling. Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Statistikk 1 kapittel 5

Repeterbarhetskrav vs antall Trails

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Statistikk 1 kapittel 5

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

Kapittel 1. Potensregning

Sensorveiledning Oppgave 1

Olweusprogrammet. Tema i klassemøtet. Klasseregel 4 Hvis vi vet at noen blir mobbet

Løsningskisse seminaroppgaver uke 15

er et er et heltall. For eksempel er 2, 3, 5, 7 og 11 primtall, mens 4 = 2 2, 6 = 2 3 og 15 = 3 5 er det ikke.

Kap. 7 - Sannsynlighetsfordelinger

Forelesning 9 mandag den 15. september

Opptelling - forelesningsnotat i Diskret matematikk Opptelling

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 22. mai 2008

Repetisjon: høydepunkter fra første del av MA1301-tallteori.

TMA4245 Statistikk Vår 2007

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

Vekst av planteplankton - Skeletonema Costatum

NyGIV Regning som grunnleggende ferdighet

Matematisk julekalender for trinn, 2008

PRIMTALL FRA A TIL Å

TMA4240 Statistikk Høst 2009

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Fasit og løsningsforslag til Julekalenderen for mellomtrinnet

Nøkkelspørsmål til eller i etterkant av introduksjonsoppgaven:

Resonnerende oppgaver

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Matriser og Kvadratiske Former

TMA4240 Statistikk Høst 2008

Statistikk 1 kapittel 4

Forelesning 22 MA0003, Mandag 5/ Invertible matriser Lay: 2.2

Regneregler for forventning og varians

STATISTIKK FRA A TIL Å

Forelening 1, kapittel 4 Stokastiske variable

Mer om likninger og ulikheter

Basisoppgaver til 1P kap. 4 Sannsynlighet

Analyse av nasjonale prøver i lesing, regning og engelsk pa ungdomstrinnet 2015 for Telemark

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Prosent. Det går likare no! Svein H. Torkildsen, NSMO

Repeterbarhetskrav vs antall Trails

En kort innføring i sannsynlighetsregning

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Løsningsforslag til underveisvurdering i MAT111 vår 2005

ØVINGER 2017 Løsninger til oppgaver. Lineærkombinasjonen Z = 5X + 8Y har forventningsverdi

Emnekode: LV121A Dato: Alle skrevne og trykte hjelpemidler

Arbeidstid. Medlemsundersøkelse mai Oppdragsgiver: Utdanningsforbundet

Matematikk 2, 4MX25-10

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4245 Statistikk Eksamen desember 2016

SKOLEEKSAMEN I. SOS4010 Kvalitativ metode. 19. oktober timer

Obligatorisk oppgave i MAT 1100, H-03 Løsningsforslag

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

ARBEIDSHEFTE I MATEMATIKK

HØGSKOLEN I STAVANGER

MAT1030 Forelesning 30

Løsningsforslag til obligatorisk oppgave i MAT 1100, H-04

Løsningsforslag til obligatorisk oppgave i ECON 2130

Lær å bruke CAS-verktøyet i GeoGebra 4.2

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Løsningsforslag, eksamen statistikk, juni 2015

ST0103 Brukerkurs i statistikk Høst 2014

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

NASJONALE PRØVER En presentasjon av resultatene til 5.trinn ved Jåtten skole, skoleåret

Modul nr Statistikk og Sannsynlighet i en digital verden

a) Ved avlesning på graf får man. Dermed er hastighet ved tid sekund lik.

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Forord, logg, informasjon og oppgaver

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Kap. 5 Egenverdier og egenvektorer

Sigbjørn Hals. Nedenfor har vi tegnet noen grafer til likningen y = C, der C varierer fra -2 til 3, med en økning på 1.

Oppsummering om hva som kreves ved bruk av digitale verktøy

Betinget sannsynlighet, total sannsynlighet og Bayes setning Kap. 4.5 STK1000 H11

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk Høst 2015

Betinget sannsynlighet, total sannsynlighet og Bayes' setning: En introduksjon med forslag til klasseaktivitet og prosjektoppgave

Løsningsforslag til F-oppgavene i kapittel 2

FORSLAG TIL ÅRSPLANER

Kapittel 4: Logikk (predikatlogikk)

Kapittel 5: Tilfeldige variable, forventning og varians.

Uendelige rekker. Konvergens og konvergenskriterier

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk Høst 2016

ORIENTERING OM RETTEN TIL

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Statistikk og dataanalyse

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

TMA4240 Statistikk Høst 2012

Matematikk og naturfag. To eksempler fra mellomtrinn/ungdomstrinn

Transkript:

Løsningsforslag til seminar 4 Undervisningsfri uke Iman Ghayoornia February 22, 2016 Oppgave 2.1 Se Excel-filen som er tilgjengelig på emnesiden. Hvis du lurer på hvordan jeg fikk verdiene i cellene så klikk på en vilkårlig celle. Du vil da se hvilke celler og operasjoner jeg har brukt i beregningene mine. Gjør det samme for oppgave 4.11. Før du fortsetter så legg merke til at jeg bruker kommandoen =STDEV.S for å regne ut standardavviket og ikke =STDEV.P. Du bruker førstnevnte kommando for å regne ut standardavviket når du kun har et utvalg av observasjoner som er tatt ut fra populasjonen. Du bruker sistnevnte for å regne ut standardavviket når du har observasjoner for hele populasjonen. I denne oppgaven har du et utvalg som tar for seg antall kundehenvendelser og må derfor bruke =STDEV.S for å regne ut standardavviket i Excel. Vi kommer tilbake til forskjellen(e) mellom å regne standardavviket for et utvalg og standardavviket for populasjonen. Hvis du har avdekket feil eller har spørsmål, så kan du nå meg på e-post. E-postadressen min er imang@student.sv.uio.no (uten anførselstegn). I utregningene mine bruker jeg. som komma istedenfor den mer tradisjonelle,. 1

Oppgave 3.13 La J definere at eleven er en jente og la J definere et eleven er en gutt. I tillegg la G definere at eleven kan spille gitar og la G definere at eleven ikke kan spille gitar. For å danne en oversikt lager jeg følgende tabell. Kjønn \ Egenskap G kan spille gitar G kan ikke spille gitar - J jente 6 7 13 J gutt 10 5 15-16 12 28 Siden du skal trekke ut en elev tilfeldig kan du regne ut sannsynligheten for forskjellige hendelser ved bruk av en uniform sannsynlighetsmodell (definisjon 3.3 s. 80 i Løvås). Sannsynligheten for at en elev kan spille gitar er P(G) = 16 28 siden det er 16 elever av totalt 28 elever som kan spille gitar. Sannsynligheten for at eleven er en jente og kan spille gitar er P(J G) = 6 28 siden det er kun 6 jenter som kan spille gitar av totalt 28 elever. Hvis du vet at eleven er en jente og lurer på hva sannsynligheten er for at hun kan spille gitar, så må du regne ut P(G J) = P(J G) P(J) der likheten kommer av definisjon 3.12 (s. 96) i Løvås. Du vet allerede hva P(J G) er. Men, hva er sannsynligheten for å trekke en jente? Denne sannsynligheten er P(J) = 13 28 2

siden det er 13 jenter av totalt 28 elever i klassen. Da kan du regne ut P(G J) = P(J G) P(J) = 6 28 13 28 = 6 13 Hvis du nå trekker ut to elever tilfeldig, så kan du fremdeles benytte deg av den uniforme sannsynlighetsmodellen. La P(ḠḠ) være sannsynligheten for at ingen av de to elevene som blir trukket ut kan spille gitar. Da kan vi regne ut denne sannsynligheten som P(ḠḠ) = (16 0 )(12 2 ) ( 28 2 ) 0.1746 Dette er fremdeles en uniform sannsynlighetsmodell, slik at telleren tar for seg alle de gunstige utfallene og nevneren tar for seg alle de mulige utfallene. Du kan tolke nevneren og telleren som følger. Nevneren tar for seg på hvor mange måter du kan trekke ut 2 elever av de totalt 28 elevene. Telleren tar for seg to gunstige utfallsmengder. Hvis du trekker ut 2 elever tilfeldig, men det er slik at ingen av dem kan spille gitar, så må du trekke ut 0 elever av de 16 elevene som kan spille gitar og dermed trekke ut 2 elever av de 12 elevene som ikke kan spille gitar. Denne tankegangen er lik den som blir brukt i anvendelse av den hypergeometriske sannsynlighetsmodellen (som brukes for å regne ut sannynligheten for diskrete variabler) som du kan lese om i kapittel 5 i Løvas. Alternativt, uten å bruke den hypergeometriske sannsynlighetsmodellen og binomialkoeffisienter, så kan du regne ut P(ḠḠ) som følger. Den første eleven du trekker ut tilfeldig må være blant de 12 elevene som ikke kan spille gitar av totalt 28 elever. Denne første eleven er da ute av trekningen. Det er da 11 elever igjen som ikke kan spille gitar og det er totalt 27 elever igjen for trekning. Den andre eleven som blir trukket ut må da være blant de 11 som ikke kan spille gitar. Dermed kan P(ḠḠ) regnes ut som P(ḠḠ) = 12 11 28 27 0.1746 Hva er sannsynligheten for at begge elevene kan spille gitar, men de er av forskjellige skjønn? La D definere hendelsen at begge elevene kan spille gitar, 3

men er av motsatt kjønn i forhold til hverandre. Da er P(D) = (6 1 )(10 1 ) ( 28 2 ) 0.1587 Nevneren tar igjen for seg antall mulige utfall, mens telleren tar for seg antall gunstige utfall. Fokuser nå på tolkningen av binomialkoeffisientene i telleren. Du trekker ut to tilfeldige elever. Den ene eleven skal være blant de 6 jentene som kan spille gitar, som du kan trekke ut på ( 6 1 ) forskjellige måter. Den andre eleven skal være blant de 10 guttene som kan spille gitar, som du kan trekke ut på ( 10 1 ) forskjellige måter. Da kan du trekke ut to elever som kan spille gitar, en fra hvert kjønn, på ( 6 1 )(10 1 ) forskjellige måter. Alternativt kan du regne ut P(D) som følger. Du kan trekke ut en elev fra hvert kjønn på to forskjellige måter. La den første eleven du trekker ut være en jente. Sannsynligheten for å trekke en jente som kan spille gitar er 28 6. Denne eleven er nå ute av telling og det er 27 elever igjen for trekning i klassen. Sannsynligheten for at den andre eleven er en gutt som kan spille gitar er da 27 10 siden det er 10 gutter som kan spille gitar og det er 27 elever igjen i klassen. Men, dette kan også forekomme i motsatt rekkefølge, da en gutt som kan spille gitar blir trukket først og deretter en jente som kan spille gitar. Altså kan dette forekomme på to forskjellige måter! Da kan vi endelig regne ut P(D) som P(D) = 6 10 28 27 + 10 6 28 27 = 2 10 6 28 27 0.1587 som er det samme som du fikk ovenfor ved bruk av binomialkoeffisienter. Oppgave 3.19 I denne oppgaven må du bruke definisjonen av uavhengighet. To mengder, A og B, er uavhengige hvis P(A B) = P(A) P(B) Se definisjon 3.19 og 3.20 (s. 106-107) i Løvås. Noter at hvis to mengder er uahvengige så betyr det ikke at mengdene er disjunkte! To mengder, A og B, er disjunkte hvis P(A B) = 0. 4

Ta for deg mengdene i eksempel 3.14 (s. 93-94) i Løvås. Er A og B uavhengige? Siden P(A B) = 0.765 og P(A) P(B) = 0.90 0.85 = 0.765, så er A og B uavhengige, siden P(A B) = P(A) P(B). Er A og C uavhengige? Siden P(A C) = 0.77 og P(A) P(C) = 0.90 0.81 = 0.729, så er ikke A og C uavhengige siden P(A C) = P(A) P(B). Er det da mulig å foreta noen konklusjoner om uavhengighet mellom mengdene B og C uten å foreta beregninger? Gjennom resultatene funnet så langt har du ikke relevant informasjon til å foreta noen konklusjoner om uavhengighet mellom mengdene B og C. For å danne en konklusjon må du foreta en beregning. Er B og C uavhengige? Siden P(B C) = 0.73 og P(B) P(C) = 0.85 0.81 = 0.6885, så er ikke B og C uavhengige siden P(B C) = P(B) P(C). Oppgave 3.27 Apekatten kan skrive et ord på fem bokstaver på 29 29 29 29 29 = 29 5 = 20 511 149 forskjellige måter. Sannsynligheten for at ordet starter med bokstaven H er P(ordet begynner med bokstaven H) = 1 29 siden av totalt 29 bokstaver du kan starte ordet med, så kan du kun velge bokstaven H på én måte. Sannsynligheten for at ordet på fem bokstaver inneholder bokstaven H kun en gang er derimot ikke like rett fram å regne. Man må ta i betraktning at denne bokstaven kan dukke opp som første bokstav eller andre bokstav eller tredje bokstav, osv., i ordet som består av totalt fem bokstaver. De andre bokstavene kan være hvilken som helst bokstav fra det norske alfabetet, bortsett fra H såklart. Derfor er sannsynligheten for at ordet inneholder bokstaven H en gang gitt ved P(ordet inneholder H en gang) = 1 28 28 28 28 29 29 29 29 29 + 28 1 28 28 28 29 29 29 29 29 +... + 28 28 28 28 1 29 29 29 29 29 5

= 5 1 28 28 28 28 29 29 29 29 29 = 5 284 29 5 0.149 Sannsynligheten for at apekatten skrivet ordet YASOV er P(YASOV) = 1 1 1 1 1 29 29 29 29 29 = 1 29 5 For å besvare disse spørsmålene har jeg antatt hele veien at det er helt tilfeldig hvilken bokstav apekatten velger å trykke på. Denne antakelsen trenger ikke nødvendigvis å være sann. For eksempel, hvis bokstavene ÆØÅ trekker oppmerksomheten til apekatten mer enn andre bokstaver, så holder ikke antakelsen gjort her og da kan ikke en uniform sannsynlighetsmodell brukes. I tillegg har jeg antatt uavhengighet mellom bokstavene. At apekatten velger å starte et ord med bokstaven Y endrer ikke sannsynligheten for at apekattten velger en annen bokstav etterpå, f.eks. at det skal plutselig bli mindre sannsynlig at den velger bokstav A etterpå. Oppgave 4.10 Med variabelen Z definert som Z = 5X + 8Y så er forventningsverdien til denne variabelen, E(Z), gitt ved E(Z) = E ( 5X + 8Y) = E ( 5X) + E (8Y) = 5E (X) + 8E (Y) der regel 4.7 (s. 142) og regel 4.12 (s. 154) i Løvås er benyttet. Det gjenstår dermed å finne E(X) og E(Y) før du kan regne ut E(Z). Ved bruk av tabellen oppgitt i oppgave 4.5 kan du regne ut E(X) som E(X) = 0 0.45 + 1 0.31 + 2 0.14 + 3 0.07 + 4 0.03 = 0.92 6

Ved bruk av tabellen oppgitt i oppgave 4.5 kan du regne ut E(Y) som E(Y) = ( 3) 0.01 + ( 2) 0.04 + ( 1) 0.06 + 0 0.12 +...... + 1 0.28 + 2 0.24 + 3 0.16 + 4 0.07 + 5 0.02 Dermed kan du regne ut E(Z) som = 1.45 E(Z) = 5E(X) + 8E(Y) = 5 0.92 + 8 1.45 = 7 Variansen til Z, Var(Z), er da gitt ved Var(Z) = Var( 5X + 8Y) = Var( 5X) + Var(8Y) + 2 ( 5) 8Cov(X, Y) = ( 5) 2 Var(X) + 8 2 Var(Y) 80Cov(X, Y) = 25Var(X) + 64Var(Y) 80Cov(X, Y) der regel 4.9 (s. 145) og regel 4.15 (s. 157) i Løvås er benyttet. Men, siden X og Y antas å være uavhengige, så følger det at Cov(X, Y) = 0. Derfor kan uttrykket for variansen til Z forenkles til Var(Z) = 25Var(X) + 64Var(Y) Det gjenstår dermed å finne Var(X) og Var(Y) før du kan regne ut Var(Z). Jeg kommer til å benytte meg av følgende måte å regne ut variansen til X og Y på. Det kan vises at variansen til X kan skrives om til [ Var(X) = E (X µ X ) 2] = E(X 2 ) µ 2 X Se likning 4.6 (s. 143) og prøv deg på oppgave 4.30 i Løvås for å overbevise deg selv at denne skrivemåten er tillatt. Ved å bruke tabellen oppgitt i oppgave 4.5 kan du regne ut E(X 2 ) som E(X 2 ) = 0 2 0.45 + 1 2 0.31 + 2 2 0.14 + 3 2 0.07 + 4 2 0.03 = 1.98 7

Dermed er Var(X) Var(X) = E(X 2 ) µ 2 X = 1.98 0.922 = 1.1336 Ved å bruke tabellen oppgitt i oppgave 4.5 kan du regne ut E(Y 2 ) som E(Y 2 ) = ( 3) 2 0.01 + ( 2) 2 0.04 + ( 1) 2 0.06 + 0 2 0.12 +... Dermed er Var(Y)... + 1 2 0.28 + 2 2 0.24 + 3 2 0.16 + 4 2 0.08 + 5 2 0.02 = 4.61 Var(Y) = E(Y 2 ) µ 2 Y = 4.61 1.452 = 2.5075 Da kan du endelig regne ut Var(Z) som Var(Z) = 25Var(X) + 64Var(Y) = 25 1.1336 + 64 2.5075 = 188.82 Oppgave 4.11 Se Excel-ark. Se siste sannsynlighetshistogram i regnearket for en direkte sammenlikning av eksempel 4.2 som baserer deg på en uniform sannsynlighetsmodell og sannsynlighetshistogrammet som resultat av at du i oppgave 4.11 baserer deg på en frekvensbasert sannsynlighetsmodell. Sannsynlighetene kan bli regnet ut som følger. La P(Y = y) være sannsynligheten for at y jenter blir født. Det kan vises at en binomisk sannsynlighetsmodell kan brukes til å regne ut denne sannsynligheten (se kap. 5 i Løvås) 1. I denne oppgaven, da det antas at totalt fire barn blir født, kan du regne ut sannsynligheten for at y jenter blir født ved å bruke følgende uttrykk (som er den bi- 1 Selv om jeg anvender en binomisk sannsynlighetsmodell her, så betyr det ikke at dette er nødvendig for å løse oppgaven. Det gir tross alt ikke mening at en modell som du lærer om i kapittel 5 skal brukes til å løse en oppgave i kapittel 4! Likevel, tankegangen som brukes for å regne ut sannsynligheten i eksempel 4.2, derav også for oppgave 4.11, er den samme, som skal brukes til å løse oppgaven. 8

nomiske sannsynlighetsmodellen) P(Y = y) = ( ) 4 p y (1 p) 4 y y som blir, ved å substituere inn den frekvensbaserte sannsynligheten for å føde en jente inn for p, P(Y = y) = ( ) 4 0.486 y 0.514 4 y y Den første faktoren i uttrykket, nemlig binomialkoeffisienten ( 4 y ), tar for seg på hvor mange måter y jenter kan bli født av totalt 4 barn. Se for eksempel kolonnen for y = 1 i eksempel 4.2. Den sier at av totalt fire barn kan en jente bli født på fire forskjellige måter! Dette MÅ tas hensyn til i sannsynlighetsberegningene dine. Selv om sannsynligheten for jentefødsel er noe annet her enn i eksempel 4.2, så gjelder den binomiske sannsynlighetsmodellen i begge tilfeller. Jeg vil poengtere at det er feil å regne ut P(Y = 1) = 0.486 1 0.514 3 der binomialkoeffisienten er fjernet. Feilen er at du ikke tar hensyn til på hvor mange måter en jente kan bli født av totalt fire barn. Jenta kan være det første barnet av de fire, det andre, osv.. Ikke glem dette! For å kommentere histogrammene er forskjellene mellom sannsynlighetshistogrammene svært små. Det er dermed ikke verdt bryet å regne ut histogrammet ved å basere seg på en frekvensbasert sannsynlighetsmodell. Likevel resulterer det i ny informasjon, f.eks. at sannsynligheten for å føde 3 jenter er lavere nå enn når du baserer deg på en uniform sannsynlighetsmodell. 9