Oppgavesett nr. 1. MAT110 Statistikk 1, Etterspørsel y=y i Figur 1: Sammenheng mellom pris x og etterspørsel y.

Like dokumenter
Oppgavesett nr. 5. MAT110 Statistikk 1, Et transportfirma har et varemottak for lastebiler med spesialgods, se figur 1.

MAT110. Statistikk 1. Samling av øvingsoppgaver Per Kristian Rekdal

MAT110. Statistikk 1. Løsning til øvingsoppgaver Per Kristian Rekdal

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

MAT110. Statistikk 1. Samling av øvingsoppgaver Per Kristian Rekdal

MAT110. Statistikk 1. Løsning til øvingsoppgaver Per Kristian Rekdal

Eksamen i. MAT110 Statistikk 1

Eksamen i. MAT110 Statistikk 1

Oppgavesett nr. 6. MAT110 Statistikk 1, 2018

MAT110. Statistikk 1. Kompendium 2018, del 2. Per Kristian Rekdal

Formelsamling V MAT110 Statistikk 1. Per Kristian Rekdal

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

LØSNING: Eksamen 22. mai 2018

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

statistikk, våren 2011

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Kapittel 4: Matematisk forventning

Formelsamling i medisinsk statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Fasit for tilleggsoppgaver

HØGSKOLEN I STAVANGER

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

ÅMA110 Sannsynlighetsregning med statistikk, våren

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

FORMELSAMLING TIL STK1100 OG STK1110

HØGSKOLEN I STAVANGER

MAT110 Statistikk 1 Løsningsforslag til eksamensoppgaver

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Betinget sannsynlighet

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

LØSNING: Oppgavesett nr. 1

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Høgskoleni østfold EKSAMEN

Kompendium V-2016 MAT110. Statistikk 1. Del 2 av 2. Per Kristian Rekdal

TMA4240 Statistikk Høst 2008

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

Høgskoleni Øs fold EKSAMEN. Om noe er uklart eller mangelfullt i oppgaven inngår det som en del av oppgaven å ta de nødvendige forutsetninger.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

TMA4240 Statistikk Høst 2009

Forventning og varians.

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

Forventning og varians.

Oppfriskning av blokk 1 i TMA4240

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

TMA4245 Statistikk Eksamen desember 2016

UNIVERSITETET I OSLO

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Statistikk 1 kapittel 5

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Kapittel 2: Hendelser

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Bernoulli forsøksrekke og binomisk fordeling

Løsningsforslag til obligatorisk oppgave i ECON 2130

TMA4240 Statistikk H2010 Kapittel 5: Diskrete sannsynlighetsfordelinger : Uniform, binomisk, hypergeometrisk fordeling

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Statistikk 1 kapittel 5

TMA4240 Statistikk Høst 2012

STK Oppsummering

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

DEL 1 GRUNNLEGGENDE STATISTIKK

Regneregler for forventning og varians

Kap. 7 - Sannsynlighetsfordelinger

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg.

HØGSKOLEN I SØR-TRØNDELAG Avdeling for lærer- og tolkeutdanning

Notasjon. Løsninger. Problem. Kapittel 7

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians.

Diskrete sannsynlighetsfordelinger.

Statistikk 1 kapittel 4

Kompendium V-2014 MAT110. Statistikk 1. Del 2 av 2. Per Kristian Rekdal

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

Forelesning 13. mars, 2017

TMA4240 Statistikk Eksamen desember 2015

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

UNIVERSITETET I OSLO Matematisk Institutt

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Løsningskisse seminaroppgaver uke 11 ( mars)

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Løsningsforslag, eksamen statistikk, juni 2015

Statistikk 1 kapittel 5

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Diskrete sannsynlighetsfordelinger.

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Kapittel 5: Tilfeldige variable, forventning og varians.

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Statistikk 1 kapittel 5

Transkript:

Innleveringsfrist: mandag 27. jan. kl. 14:00 Oppgavesett nr. 1 MAT110 Statistikk 1, 2014 Oppgave 1: ( kovarians ) Tabellen nedenfor viser sammenhengen mellom pris x og etterspørsel y av en vare. Pris x=x i 71 47 23 27 Etterspørsel y=y i 58 106 154 146 Figur 1: Sammenheng mellom pris x og etterspørsel y. a) Finn S x, S y, S xy og R xy. 1 b) Finn en eksplisitt sammenheng mellom pris x og etterspørsel y. 2 c) Hvilken av de to figurene i fig.(2), A eller B, kan potensielt beskrive sammenhengen mellom pris og etterspørsel for dataene i tabellen? Gi en kort begrunnelse for svaret. 1 Se også eksempel 7 i kapittel 1.3 i kompendiet. 2 Bruk f.eks. topunktformelen: y y 1 = y 2 y 1 x 2 x 1 (x x 1 ) (1) Velg to (vilkårlige) punkt x = x 1,y = y 1 og x = x 2,y = y 2 fra tabellen i fig.(1) og sett inn i topunktformelen. 1

Figur 2: Viser fig.a og fig.b, potensielle sammenhenger mellom pris og etterspørsel. 2

Oppgave 2: ( aksjeanalyse ) Tabellene nedenfor viser aksjekursene for selskapene ALFA og BETA. Kursen på aksjene har blitt registrert over en periode på 5 måneder: ALFA a 1 a 2 a 3 a 4 a 5 aksjekurs ( NOK ) 110 103 108 103 114 Figur 3: Aksjekurs for selskap ALFA over en periode på 5 måneder. BETA b 1 b 2 b 3 b 4 b 5 aksjekurs ( NOK ) 152 137 169 137 154 Figur 4: Aksjekurs for selskap BETA over en periode på 5 måneder. a) Finn gjennomsnittskursene a og b. 3 b) Plott aksjekursene a i og b i (i = 1,2,3,4,5) i en og samme figur. c) Hvilke av aksjekursene vil du anse for å være mest usikker? Begrunn svaret. d) i) Finn variansene S 2 a og S2 b. ii) Stemmer verdiene S 2 a og S 2 b med konklusjonen i oppgave c? Begrunn svaret. e) i) Finn kovariansen S ab. ii) Finn korrelasjonskoeffisienten R ab. iii) Hva slags benevning har R ab? iv) Tolk svaret for korrelasjonskoeffisienten. 4 3 Ta med benevning, NOK. 4 Ta en titt på figur (1.15) i kompendiet. 3

Oppgave 3: ( korrelasjonskoeffisient - et mål på lineær sammenheng ) Du jobber på Oslo Børs. Du har observert verdien av 4 ulike aksjer A, B, C og D. For å finne ut om aksje B samsvarer med aksje A så har du observert verdiene til disse aksjene over 100 dager, (A 1,B 1 ), (A 2,B 2 ),..., (A 100,B 100 ). Tilsvarende observasjoner har du gjort for de øvrige aksjene. For finne ut om det er noen sammenheng mellom aksjene så plottes tallparene. Resultatet er vist i figuren nederst på siden. De tilhørende korrelasjonskoeffisientene er regnet ut, f.eks. i Excel 5. Resultatene er: R = 0.95 (2) R = 0.02 (3) R = 0.70 (4) Hvilke korrelasjonskoeffisienter og plott hører sammen? 6 Figur 5: Sammenhenger mellom aksjene. 5 Excel har innebygd en del funksjonalitet for statistikk. Dette skal vi komme tilbake til senere i kurset. 6 Skriv svaret rett på figuren og legg arket ved i din besvarelse. 4

Oppgave 4: ( Venn-diagram ) Tegn et Venn-diagram som illustrerer følgende begivenheter: a) A B b) A B C Oppgave 5: ( disjunkte begivenheter ) a) Tegn et Venn-diagram som illustrerer at to begivenheter A og B er disjunkte. b) La A og B være to begivenheter hvor P(A) = 0.6 og P(B) = 0.5. Kan begivenhetene være disjunkte? Begrunn svaret ved en kort regning. Figur 6: At this point, I ll ask you to follow me to the conference room below. 5

Innleveringsfrist: mandag 10. feb. kl. 14:00 Oppgavesett nr. 2 MAT110 Statistikk 1, 2014 Oppgave 1: ( revisjon ) Statoil ønsker å avdekke feil i sine regnskap. For å avdekke mulige feil har Statoil leid inn et revisjonsfirma. Siden Statoil er et veldig stort selskap så kan ikke revisjonsfirmaet gå gjennom alle regnskapene i detalj. Derfor gjør de et tilstrekkelig stort utvalg av regnskapene, og finner på det grunnlaget sannsynligheten for antall feil i tilhørende bilag. Resultatet er: Figur 1: Sannsynlighet og antall feil i bilagene i et tilfeldig valgt regnskap. La oss se på begivenhetene: A = minst èn feil i bilagene i et tilfeldig valgt regnskap B = mindre enn 10 feil i bilagene i et tilfeldig valgt regnskap Figur 2: Revisjon. 1

a) Vis at sannsynlighetsfordelingen i tabellen er en mulig gyldig sannsynlighetsfordeling. b) i) Finn P(A). 1 ii) Tolk sannsynligheten P(A). 2 c) i) Finn P(A) direkte ut fra tabellen i figur (1). ii) Finn P(A) via komplementsetningen. iii) Tolk sannsynligheten P(A). d) i) Finn P(B). ii) Tolk sannsynligheten P(B). e) i) Finn P(B) direkte ut fra tabellen i figur (1). ii) Finn P(B) via komplementsetningen. iii) Tolk sannsynligheten P(B). f) i) Finn P(A eller B). 3 ii) Tolk sannsynligheten P(A eller B). g) i) Finn P(A og B). 4 ii) Hvordan vil du uttrykke sannsynligheten P(A og B) med ord? 1 Tips: sett ring rundt de cellene i tabellen som tilsvarer A. 2 Dvs. beskriv hva sannsynligheten P(A) betyr på godt norsk. eller 3 Finn P(A B) direkte ut fra tabellen i figur (1). 4 Hvilken setning tror du kan være hensiktsmessig å bruke her? 2

Oppgave 2: ( økonomi, fond ) Et finansforetak planlegger å markedsføre en portefølje på i alt 10 fond. I det aktuelle markedet finnes det 75 fond av den typen som foretaket ønsker å satse på. Dette kan formuleres slik: N = totalt antall valgobjekter (fond) = 75 (1) s = antall objekter (fond) som velges = 10 (2) La oss anta at alle fondene gir forskjellig avkastning, slik at vi har et fond som er best, et fond som er nest best, et fond som er 3. best osv. Helt ned det til 75. beste fondet, dvs. det dårligste. Det er ingen relasjon mellom fondene. Derfor velger finansforetaket fondene tilfeldig. a) Beskriver oppgaven situasjon 1, 2, 3 eller 4? Begrunn svaret. 5 b) Hvor mange ulike kombinasjoner av fond finnes det totalt? 6 Figur 3: Fond. 5 Hvilke to spørsmål må du stille deg for å avgjøre hvilken situasjon dette tilsvarer? 6 Svaret er veldig stort. Skriv ned både det eksakte svaret og, i tillegg, svaret på formen 2.3 10 15. (Dette er ikke svaret. Bare et eksempel på hvordan man kan skrive et stort tall på en kompakt måte.) 3

c) i) Hvor stor sannsynlighet er det for at det beste fondet er blant finansforetakets 10 tilfeldig valgte fond? 7 ii) Hvor stor sannsynlighet er det for at det 21. beste fondet er blant finansforetakets 10 tilfeldig valgte fond? d) i) Hvor stor sannsynlighet er det for at de to beste fondene er blant finansforetakets 10 tilfeldig valgte fond? ii) Hvor stor sannsynlighet er det for at det 7. beste og det 19. beste fondet er blant finansforetakets 10 tilfeldig valgte fond? 7 Tips: Se eksempel 6 på side 91 i kompendiet. Hvilken modell kan vi bruke her? Hva er sammenhengen mellom antall kombinasjoner og sannsynlighet? 4

Oppgave 3: ( korrelasjonskoeffisient ) Anta at vi har observasjonene/målingene x 1,x 2,x 3,...,x n og y 1,y 2,y 3,...,y n. Korrelasjonskoeffisienten R xy er da definert ved: R xy = S xy S x S y (3) hvor S xy er den empiriske kovariansen S xy = 1 n 1 n (x i x)(y i y) (4) i=1 og de empiriske standardavvikene S x og S y er definert ved S x = Sx 2 = 1 n 1 n (x i x) 2, S y = i=1 S 2 y = 1 n 1 n (y i y) 2 (5) i=1 og gjennomsnittene x og y er x = 1 n n i=1 x i, y = 1 n n y i (6) i=1 a) Hvilken verdimengde kan korrelasjonskoeffisienten R xy ha? 8 b) Hvilken verdimengde kan den empiriske kovariansen S xy ha, i prinsippet? c) Hva betyr det at R xy er enhetsuavhengig/dimensjonsløs? 8 Altså, hvilke mulige verdier kan R xy ha? 5

d) Hva R xy et mål på? e) Hva kan man si om sammenhengen mellom x og y dersom R xy har sin største verdi? f) Hva betyr det at R xy = 0? g) Hva kan man si om sammenhengen mellom x og y dersom R xy har sin minste verdi? Figur 4: Kan denne tegningen ha noe med oppgave 3a å gjøre? 6

Oppgave 4: ( korrelasjonskoeffisient - et mål på lineær sammenheng ) La oss se på to størrelsen x og y. Disse størrelsene kan være hva som helst, f.eks. aksje x og aksje y. Anta at disse størrelsene varierer med tiden. Anta videre at man måler x og y over en periode på 20 dager. For dag 1 er verdiene x 1 og y 1. For dag 2 har verdiene endret seg til x 2 og y 2 osv. Helt frem til dag 20 hvor størrelsene har verdiene x 20 og y 20. La oss se på 6 forskjellige situasjoner. For alle disse situasjonene ønsker man å finne ut om det er noen (lineær) sammenheng mellom x og y. Derfor plottes y som funksjon av x for alle 20 dagene i en og samme figur. Resultatet er vist nedenfor. For alle disse 6 plottene er korrelasjonskoeffisienten regnet ut. Resultatene er: R xy = 0.5 (7) R xy = 0.5 (8) R xy = 0.9 (9) R xy = 0.9 (10) R xy = 0 (11) R xy = 0 (12) Hvilken R xy hører til hvilket plott? 9 Figur 5: Sammenhenger mellom x og y. 9 Skriv svaret rett på figuren og legg arket ved i din besvarelse. 7

Oppgave 5: ( økonomi ) En investor eier tre bedrifter A, B, og C. Det er gjort vurderinger av sannsynlighetene for at en eller flere av bedriftene skal gå med underskudd inneværende år: Figur 6: Sannsynlighet for underskudd. a) i) Hvordan vil du tolke sannsynligheten P(A B)? ii) Finn P(A B). b) i) Hvordan vil du tolke sannsynligheten P(A C)? ii) Finn P(A C). c) i) Hvordan vil du tolke sannsynligheten P(A C)? ii) Finn P(A C). d) i) Hvordan vil du tolke sannsynligheten P(C B)? ii) Finn P(C B). 8

Oppgave 6: ( logistikk ) Du jobber for A/S Norge Shell sin avdeling i Kristiansund. Du jobber i et team som har ansvaret for å finne nye felt for utvinning av olje. I den sammenheng skal dere vurdere to reservoarer. Anta at dere har funnet ut at følgende gjelder for reservoarene: Sannsynligheten for å finne olje i reservoar 1, er 0.6. Sannsynligheten for å finne olje i reservoar 2, er 0.7. Sannsynligheten for å finne olje i begge reservoarene, er 0.45. Ut fra disse opplysningene kan det være hensiktsmessig å definere følgende begivenheter: O 1 = finne olje i reservoar 1 O 2 = finne olje i reservoar 2 a) Bruk informasjonen oppgitt i oppgaven til å formulere de tre opplysningene angående sannsynligheter matematisk. b) Hva er sannsynligheten for at man finner olje i minst ett av reservoarene? 10 Figur 7: Letebrønn nr. 1 og 2 i Norskehavet. 10 Dvs. finn P(O 1 O 2 ). 9

c) Hva er sannsynligheten for at man ikke finner olje i noen av reservoarene? Bruk komplementsetningen. 11 d) Finn samme sannsynlighet som i oppgave c. Men bruk den ene tvillingsetningen denne gangen. 12 e) Hva er sannsynligheten for at man finner olje kun i reservoar 1? 13 f) Hva er sannsynligheten for at man kun finner olje i reservoar 1 eller kun finner olje i reservoar 2? 14 11 Dvs. finn P(O 1 O 2 ). 12 Er du enig i at P(O 1 O 2 ) og P(O 1 O 2 ) er det samme? Dvs. Via P(O 1 O 2 ) kan man bruke ene tvillingsetningen. 13 Dvs. finn P(O 1 O 2 ). 14 Dvs. finn Tips: Bruk den generelle addisjonssetningen på lign.(14): P(O 1 O 2 ) = P(O 1 O 2 ) (13) P((O 1 O 2 ) (O 1 O 2 )) add.setn. = P(O 1 O 2 ) + P(O 1 O 2 ) P((O 1 O 2 ) (O 1 O 2 )) (14) = 0 P((O 1 O 2 ) (O 1 O 2 )) (15) Tegn et Venn-diagram slik at du innser at P((O 1 O 2 ) (O 1 O 2 )) = 0. Bruk deretter setningen om total sannsynlighet på P(O 1 O 2 ) og P(O 1 O 2 ) i lign.(15). Da får man: P((O 1 O 2 ) (O 1 O 2 )) = P(O 1 ) P(O 1 O 2 ) + P(O 2 ) P(O 1 O 2 ) (16) 10

Innleveringsfrist: mandag 24. feb. kl. 14:00 Oppgavesett nr. 3 MAT110 Statistikk 1, 2014 Oppgave 1: ( økonomi, inntekt ) For de fleste alpinanlegg er påsken forbundet med stor aktivitet og stor utfart. Dette gjelder også for Tusten Skiheiser i Molde. Gode snøforhold i påsken er derfor viktig, særlig i forhold til økonomi og antall solgte dagskort. Erfaring viser at nysnø i påsken har svært gunstig innvirkning på inntektene. Som økonomiansvarlig for Tusten skiheiser ønsker du derfor å se nærmere på mulighetene for at det snør 3 dager på rad i påsken. La oss definere følgende begivenheter: S 1 = det snør dag 1. påskedag S 2 = det snør dag 2. påskedag S 3 = det snør dag 3. påskedag Anta at sannsynligheten for at det snør en tilfeldig dag i påsken er 1. Det betyr blant annet: 6 P(S 1 ) = P(S 2 ) = P(S 3 ) = 1 6 (1) Figur 1: Tusten Skiheiser. 1

Anta at været på ulike dager i påsken statistisk uavhengige begivenheter. a) Hvordan er statistisk uavhengighet mellom to begivenheter definert? 1 b) Hva er sannsynligheten for at det snør 1. og 2. påskedag? 2 c) Hva er sannsynligheten for at det snør 1. eller 2. påskedag? d) Hva er sannsynligheten for at det snør 1. påskedag, men ikke 2. påskedag? 3 Antagelsen om at været de ulike dagene er uavhengig av hverandre er en sterk forenkling av virkeligheten. La oss derfor anta at været fra en dag til en annen er avhengig av hverandre på en slik måte at: P(S 1 S 2 ) = 1 15 (3) e) Finn sannsynligheten for at det snør dag nr. 2 gitt at det snødde dag nr. 1. 4 1 Se kap. 4.4. i kompendiet. 2 Dvs. finn P(S 1 S 2 ). I kapittel 4 lærer vi at dersom to begivenheter A og B er uavhengige, så gjelder: (se kap. 4.4 i kompendiet, den spesielle multiplikasjonssetningen) P(A B) uavh. = P(A) P(B) (2) Bruk denne lign. for å svare på oppgaven. 3 Dvs. finn P(S 1 S 2 ). 4 Dvs. finn P(S 2 S 1 ). 2

f) Beskriv med ord hva begivenheten S 1 S 2 S 3 betyr. g) Anta at P(S 3 S 2 S 1 ) = 0.6. Finn P(S 1 S 2 S 3 ). 5 5 Bruk gjerne multiplikasjonssetningen. Se kompendiet. Denne setningen kan brukes gjentatte ganger. Bruk også den oppgitte verdien for P(S 3 S 2 S 1 ). 3

Oppgave 2: ( økonomi, strategisk oppkjøp ) Du jobber i Sparebanken Møre sin finansavdeling i Kristiansund. Dere vurderer å gjøre noen strategiske oppkjøp av tekniske installasjonsselskap i fylket. I den sammenheng har du og dine kollegaer funnet ut følgende: Sannsynligheten at Sparebanken Møre skal = K kjøpe ELMO Teknikk AS er 10 % Dersom Sp.banken Møre kjøper ELMO, er sanns. for at verdien til ELMO }{{} øker 50 % = I Dersom Sp.banken Møre ikke kjøper ELMO, er sanns. for at verdien til ELMO øker 20 % a) Skriv opp sannsynlighetsopplysningene oppgitt ovenfor på matematisk form. 6 b) Hva er sannsynligheten for at verdien til ELMO øker? 7 c) Hva er sannsynligheten for at Sparebanken Møre har kjøpt ELMO dersom verdien på finansforetaket har økt? 8 Figur 2: Sparebaken Møre og ELMO Teknikk AS. 6 Bruk notasjonen K og I som foreslått i oppgaveteksten. ( I for increase ). 7 Dvs. finner P(I). Hvilken setning kan være hensiktsmessig å bruke her? 8 Dvs. finn P(K I). 4

Oppgave 3: ( økonomi, fond ) Finansforetaket fra øving 2 finner ut at det er ikke er hensiktsmessig å se på alle fond individuelt ut fra deres unike avkastning på slutten av året. Det er mer hensiktsmessig å dele fondene inn i forhold til referanseindeksen. Finansforetaket deler derfor de 75 fondene inn i kategorier som vist i tabellen i figur 3. Det viser seg at antall fond i disse kategoriene er stort sett det samme fra år til år for det aktuelle markedet: Figur 3: Historikk: antall fond i de forskjellige kategoriene er stort sett det samme fra år til år. Antall valgobjekter (fond) og antall objekter (fond) som velges er det samme som i forrige oppgave. Derfor kan vi bruke samme notasjon: N = totalt antall valgobjekter (fond) = 75 (4) s = antall objekter (fond) som velges = 10 (5) a) Hvor stor sannsynlighet er det for at alle 10 tilfeldige valgene er i kategoriene god eller svært god? 9 b) Hvor stor sannsynlighet er det for at det er 4 middels fond, 3 gode fond og 3 svært gode fond? 10 c) Hvor stor sannsynlighet er det for at alle de 10 tilfeldig valgte fondene skal oppnå resultater som er middels eller dårligere? 9 Hvor mange fond er gode eller svært gode? Dersom( dette tallet ) er N G+SG så er antall gunstige NG+SG måter å trekke et godt eller svært godt fond på lik. s Altså: ELLER er assosiert med pluss, +, i dette tilfellet sum av N G og N SG. 10 Et analogt eksempel finnes i eksempel 5 på side 92 i kompendiet. Legg i dette eksemplet merke til at OG er assosiert med multiplikasjon,, av binomialkoeffisientene. Vi har her 3 forskjellige kategorier. Da vet du også hvor mange binomialkoeffisienter som skal være i telleren i formelen: P(A) = 5 antall gunstige komb. antall mulige komb..

d) i) Hvor stor sannsynlighet er det for at minst 1 av de 10 tilfeldig valgte fondene skal være svært god? 11 ii) Hvorfor er denne sannsynligheten mye større enn sannsynligheten som vi fikk i oppgave 3a? 12 Figur 4: Fond. 11 Siden komplementet av minst 1 av de 10 valgte fondene er svært god er minst 1 av de 10 valgte fondene er svært god = ingen av de 10 valgte fondene er svært god så kan vi bruke komplementsetningen: ( den lange streken over utsagnet ovenfor betyr ikke ) P(minst 1 fond svært godt ) = 1 P(ingen fond svært god ) (6) Dette er hensiktmessig i vår sammenheng siden P(ingen fond svært god ) er mye lettere å finne enn P(minst 1 fond svært god ) direkte. 12 Denne oppgaven er ment å besvares med ord. Hvor mange fond er det som er gode eller svært gode? Og hvor mange fond er i kategorien ingen fond svært gode? 6

Oppgave 4: ( investering ) Brunvoll Holding i Molde ønsker å gjøre investeringer i fond. De bestemmer seg for følgende fordeling: 60% skal investeres i =F aks aksjefond av disse skal 30% investeres i norske fond av disse skal 70% investeres i utenlandske fond 40% skal investeres i =F obl obligasjonsfond av disse skal 80% investeres i norske fond av disse skal 20% investeres i utenlandske fond a) Tegn et sannsynlighetstre som beskriver situasjonen. b) Hvor stor brøkdel av midlene er plassert i =N norske fond, P(N)? i) Løs oppgaven grafisk ved hjelp av oppgave a). ii) Løs oppgaven ved regning. 13 c) Hvor stor andel av midlene som er investert i Norge, er =F aks aksjefond? 14 13 Tips: Bruk formelen for oppsplitting av Ω, (se formelsamling). 14 Dvs. finn P(F aks N). Tips: Finn først P(N F aks ) via sannsynlighetstreet fra oppgave a. Bruk deretter multiplikasjonssetningen, (se formelsamling). 7

Oppgave 5: ( økonomi, konkursobjekter ) KPMG sine avdelingskontor i Møre & Romsdal har sammen utviklet et dataverktøy for å forutsi hvilke bedrifter som vil gå konkurs i løpet av året. Dataverktøyet har blitt testet på gamle data. Resultatet fra KPMG-modellen er: Av bedriftene som faktisk gikk P(objekt K) = 0.80 K konkurs ble 80% klassifisert som objekt konkursobjekter, dvs. Av bedriftene som P(objekt K) = 0.95 K objekt ikke gikk konkurs ble 95% klassifisert som levedyktige, dvs. }{{} ikke objekt Figur 5: KPMG i Molde. 8

objekt a) Hva er sannsynligheten for at bedriften blir klassifisert som konkursobjekt gitt at den 15 faktisk ikke går konkurs, P(objekt K)? b) Anta at 10% av bedriftene i Møre & Romsdal går konkurs i løpet av et gitt år, dvs. P(K) = 0.10. Hvor stor sannsynlighet er det for at KPMG-modellen klassifiserer en bedrift som konkursobjekt, dvs. P(objekt)? 16 c) Ifølge årboken til Statistisk sentralbyrå var det 1490 bedrifter i Møre & Romsdal i 2009. objekt i) Hvor mange bedrifter forventes å klassifiseres som konkursobjekt ifølge modellen til KPMG? ii) Hvor mange bedrifter forventes å gå konkurs i løpet av et gitt år? objekt d) En bedrift blir klassifisert som konkursobjekt. Hva er sannsynligheten, ifølge KPMG-modellen, for at denne bedriften faktisk går konkurs i løpet av året? 17 15 Tips: Bruk komplementsetningen, (se formelsamling). 16 Tips: Bruk formelen for oppsplitting av Ω, (se formelsamling). 17 Dvs. finn P(K objekt). Tips: Bruk Bayes formel, (se formelsamling). 9

Oppgave 6: ( logistikk, nulltoleranse ) Transport- og logistikkfirmaet Schenker har nulltoleranse for sine sjåfører når det gjelder kjøring i påvirket tilstand. Dersom en sjåfør blir funnet skyldig så har ikke sjåføren lenger noen fremtid i Schenker. La oss se på situasjonen hvor en sjåfør under mistanke testes med løgndetektor. Dagens løgndetektorer har følgende pålitelighet: løgndetektorviser løgndetektorviser = L {}} S = S { skyldig med sannsynlighet 0.90 dersom den mistenkte faktisk er skyldig = L {}} U = U { uskyldig med sannsynlighet 0.99 dersom den mistenkte faktisk er uskyldig a) Skriv opp sannsynlighetsopplysningene til løgndetektoren på matematisk form. 18 b) Hva er sannsynligheten for justismord? 19 c) Hva er sannsynligheten for at en skyldig sjåfør greier å overvinne løgndetektoren? 20 Figur 6: Vogntoget fra Schenker på Atlanterhavsveien. 18 Bruk notasjonen som foreslått i oppgaveteksten. 19 Hvilken sannsynlighet beskriver et justismord? 20 Hvilken sannsynlighet beskriver det oppgaven spør etter? 10

Det blir valgt en tilfeldig person fra en gruppe mistenkte. I denne gruppen er det 10% skyldige, dvs. P(S) = 0.10. d) Hva er sannsynligheten for at en tilfeldig valgt person fra denne gruppen er uskyldig? e) Hva er sannsynligheten for at løgndetektoren skal vise skyldig dersom en tilfeldig person velges fra denne gruppen? 21 f) Hva er sannsynligheten for at løgndetektoren skal vise uskyldig dersom en tilfeldig person velges fra denne gruppen? g) Hva er sannsynligheten for at personen er uskyldig dersom løgndetektoren viser uskyldig? Figur 7: Moral: Don t drink and drive! 21 Dvs. hva er P(L S )? Hvilken setning tror du er hensiktsmessig å bruke her? Spør en hjelpelærer dersom du ikke får til denne oppgaven! 11

Innleveringsfrist: mandag 10. mars kl. 14:00 Oppgavesett nr. 4 MAT110 Statistikk 1, 2014 Oppgave 1: ( Sports Managment, økonomi, bonus ) Basert på historiske data har man etablert en sannsynlighetsfordeling for hvor mange mål fotballaget Tufte IL scorer i en kamp. La: X = antall mål som Tufte IL scorer i løpet av en tilfeldig valgt kamp Den tilhørende sannsynlighetsfordelingen P(X = x) er gitt ved følgende tabell: 1 Figur 1: Sannsynlighetsfordeling P(X = x). a) Er X en diskret eller kontinuerlig stokastisk variabel? Gi en kort begrunnelse. b) i) Hva betyr E[X] i vårt tilfelle? 2 ii) Finn E[X]. c) i) Hva betyr Var[X] i vårt tilfelle? ii) Finn Var[X]. 1 For enkelhetsskyld antar vi at Tufte IL aldri scorer mer enn 7 mål i løpet av en kamp. 2 Dvs. hva betyr E[X] på godt norsk? 1

d) Finn standardavviket til X. e) Hva er sannsynligheten for at Tufte IL scorer mindre enn 4 mål i en kamp? 3 Anta at antall mål som scores i ulike kamper er uavhengige. Tufte IL spiller 28 kamper i løpet av en sesong. f) i) Hva er sannsynligheten for at det scores mindre enn 4 mål i både kamp nr. 7 og kamp nr. 24? ii) Hva er sannsynligheten for at det scores mindre enn 4 mål i to kamper på rad? Figur 2: Tufte IL. 3 Dette er en kumulativ sannsynlighet. Se kapittel 5 i kompendiet. 2

g) i) Hva er sannsynligheten for at summen av antall mål som scores i kamp nr. 15 og kamp nr. 19 er nøyaktig lik 4? 4 ii) Hvorfor kan ikke denne oppgaven, altså oppgave g) i), løses via kombinatorikk og urnemodellen? DNB er hovedsponsor for Tufte IL. Sponsoravtalen er prestasjonsrettet på en slik måte at de får bonus B bestemt av antall mål scoret i løpet av en gitt kamp: hvor c = 500 NOK. 5 B = c X 3 (3) h) Forklar hvorfor B er en stokastisk variabel. 6 Pga. sammenhengen mellom X og B så har disse stokastiske variablene samme fordeling, se tabellen i figur (3). 4 Tips: Dersom vi definerer A m = begivenheten at det scores m antall mål en bestemt kamp, så kan 4 mål over to kamper fås på 5 forskjellige måter: Sannsynligheten av denne er: ( = eller ) 5 måter A 4 A 0, A 0 A 4, A 3 A 1, A 1 A 3, A 2 A 2 (1) P[ (A 4 A 0 ) (A 0 A 4 ) (A 3 A 1 ) (A 1 A 3 ) (A 2 A 2 ) ] (2) Hva impliserer det at ingen av de 5 begivenhetene i lign.(1) kan inntreffe samtidig? Bruk addisjonssetningen. Bruk deretter multiplikasjonssetningen. 5 c er en konstant, mens X er en stokastisk variabel. 6 Se eksemplel 4 på side 142 i kompendiet. 3

Figur 3: Sannsynlighetsfordelingene P(X = x) og P(B = b). i) i) Hva betyr E[B] i vårt tilfelle? 7 ii) Finn E[B]. 7 Dvs. hva betyr E[B] på godt norsk? 4

Oppgave 2: ( økonomi ) En student som bor på Molde Studenthotell i Storgata har fått akutt dårlig råd. Studenten har derfor problemer med å betale husleien og rissikerer å bli kastet ut av studenthotellet. I et desperat forsøk på skaffe penger så arrangerer studenten et lotteri. Dette lotteriet er slik at 7 av totalt 1000 lodd gir en pengepremie på 250 NOK hver. Hvert lodd koster 10 NOK. Vi antar at studenten får solgt alle 1000 loddene. Det er lik sannsynlighet for å trekke de forskjellige loddene, dvs. loddene har lik vekt. Vinnernumrene blir ikke offentliggjort før etter at alle loddene er solgt. a) Hvor mye tjener studenten på å arrangere lotteriet? 8 En person kjøper s = 2 lodd. Da kan situasjonen i oppgaven form formuleres slik: N = totalt antall valgobjekter (lodd) = 1000 (4) s = antall objekter (lodd) som velges (kjøpes) = 2 (5) b) Begrunn kort hvorfor urnemodellen kan brukes i dette tilfellet. 9 Figur 4: Molde studenthotell. 8 Denne oppgaven har ikke å mye med statistikk å gjøre. Oppgaven har som misjon å vise hvor mye lotteriarrangøren (studenten) tjenter. 9 Jfr. oppgave 1g ii). Se også den blå uthevede delen av den innledende oppgaveteksten øverst på denne siden. For situasjoner beskrevet av urnemodellen så gjelder for begivenheten A: ( kombinatorisk sannsynlighet ) P(A) = antall gunstige kombinasjoner for A antall mulige kombinasjoner totalt (6) 5

c) Beskriver oppgaven situasjon 1, 2, 3 eller 4? Begrunn svaret. 10 La oss definere den diskrete stokastiske variabelen: X = antall vinnerlodd som loddkjøperen trekker (7) 1 kategori d) i) Hva er sannsynligheten for at loddkjøperen ikke vinner? 11 2 kategorier ii) Hva er sannsynligheten for at loddkjøperen trekker 1 vinnerlodd? 12 1 kategori iii) Hva er sannsynligheten for at begge loddene til kjøperen vinner? e) Vis at P(X = x) er en gyldig sannsynlighetsfordeling. La oss definere en diskret stokastisk variabel som beskriver fortjenesten F til loddkjøperen: F = g X s c (8) hvor g = 250 NOK ( g for gevinst) (9) s = 2 (antall lodd som kjøpes) (10) c = 10 NOK ( c for kostnad, dvs. pris på lodd) (11) 10 Hvilke to spørsmål må du stille deg for å avgjøre hvilken situasjon dette tilsvarer? 11 Dvs. hva er P(X = 0)? 12 Dvs. hva er P(X = 1)? 6

f) i) Hva er forventet fortjeneste til loddkjøperen? 13 ii) Tolk svaret du fikk i oppgave f) i). Figur 5: Lotteri kan være lønnsomt. Er det lønnsomt for vår lottoarrangør? 13 Her får du bruk for regnereglene: ( a er en konstant ) E[a+X] = a+e[x] E[a X] = a E[X] 7

Oppgave 3: ( logistikk ) Transport- og logistikkfirmaet Schenker har funnet ut at det tar maksimalt 5 dager å levere kritiske komponenter til anleggsmaskiner i de nordligste delene av Nord-Norge. Leveringstiden er så viktig at de har funnet sannsynlighetsfordeling for antall leveringsdager: Figur 6: Sannsynlighet for antall leveringsdager. La X være antall leveringsdager. a) Vis at sannsynlighetsfordelingen i tabellen er en mulig gyldig sannsynlighetsfordeling. b) i) Hva betyr E[X] i vårt tilfelle? 14 ii) Finn E[X]. c) i) Hva betyr Var[X] i vårt tilfelle? ii) Bruk definisjonen av variansen til å regne ut Var[X]. 15 iii) Bruk varianssetningen til å regne ut Var[X]. 16 d) Hva er standardavviket av antall leveringsdager, σ[x]? 14 Dvs. hva betyr E[X] på godt norsk? 15 Tips: Se formelsamling for definisjonen av Var[X]. 16 Tips: Se formelsamling for formulering av varianssetningen. 8

Oppgave 4: ( økonomi ) Du jobber i DNB sitt avdelingskontor i Kristiansund. Du og dine kollegaer har funnet ut at følgende sannsynligheter gjelder for aksjer i et bestemt firma i shipping markedet: Dag 0: verdien på aksjen i dag er X 0 = 380 NOK Dag 1: sannsynlighet for at aksjen stiger til X 1 = 400 NOK i løpet av dag 1: 50 % sannsynlighet for at aksjen synker til X 1 = 360 NOK i løpet av dag 1: 50 % Dag 2: dersom X 1 = 400 NOK: sannsynlighet for at aksjen stiger til X 2 = 420 NOK i løpet av dag 2: 60 % sannsynlighet for at aksjen synker til X 2 = 400 NOK i løpet av dag 2: 40 % dersom X 1 = 360 NOK: sannsynlighet for at aksjen stiger til X 2 = 420 NOK i løpet av dag 2: 20 % sannsynlighet for at aksjen synker til X 2 = 350 NOK i løpet av dag 2: 80 % a) Tegn sannsynlighetstre som viser kursutviklingen til aksjen. b) Regn ut E[X 2 ] via sannsynlighetstreet. 9

En aksjonær eier a = 1000 aksjer i dag, dvs. dag 0. Hun har bestemt seg for følgende strategi: Dersom kursen stiger fra dag 0 til 1, så beholder hun alle aksjene til dag 2. Dersom kursen synker fra dag 0 til 1, så selger hun alle aksjene ved dag 1. La F 2 = total verdi av formuen til aksjonæren ved dag nr. 2 = verdiene av aksjene }{{} verdi dag 2 + eventuelle bankinnskudd }{{} evt. salg foretas dag 1 (12) Eventuelle bankinnskudd står inne kun èn dag, så vi ser bort fra renteinntekter. c) Finn E[F 2 ]. 17 d) Gi en tolkning av E[F 2 ]. Figur 7: DNB i Kristiansund. 17 Tips: Ut fra lign.(12) innser vi at: ( ) E[F 2 ] = a forventet verdi ved t = 2 stiger + forventet verdi ved t = 1 synker (13) 10

Oppgave 5: ( transport ) Et transportfirma har nylig bygd et varemottak for vogntog med spesialgods. Dette varemottaket kan kun ta imot 4 typer gods. Avhengig av hvilken type gods som er i vogntogene så tar det 10, 30, 40 eller 45 minutter å tømme et vogntog. Disse lange behandlingstidene resulterer i at når det kommer et nytt vogntog til varemottaket så er det i gjennomsnitt 3 vogntog foran i kø. La X være behandlingstiden i antall minutter som varemottaket behøver for å tømme et tilfeldig vogntog. Anta videre at X har følgende fordelingsfunksjon: Figur 8: Behandlingstid i antall minutter for å tømme et vogntog. Anta at behandlingstidene X i er uavhengige. Med 3 vogntog foran i køen, så tar det Y = X 1 +X 2 +X 3 (14) antall minutter før det nylig ankomne vogntoget starter å bli tømt. a) Vis at sannsynlighetsfordelingen i tabellen er en mulig gyldig sannsynlighetsfordeling. b) Hva er forventet ventetid for det nylig ankomne vogntoget, dvs. hva er E[Y]? 11

c) NHO transport 18 har funnet ut at ventetid for et vogntog koster transportselskapene i gjennomsnitt 915 kr/timen. Med denne timeraten, hva er forventet kostnad av ventetiden for vårt vogntog? d) Hva er variansen til ventetiden, dvs. hva er Var[Y]? e) Hva er standardavviket til ventetiden? Figur 9: Tømming av spesialgods fra vogntog. 18 NHO Transport er en forening for norske transportselskaper. 12

Oppgave 6: ( oversikt over formler, kap. 2, 3 og 4. ) Nedenfor ser du 12 sentrale formler som vi har lært om i kapittel 2, 3 og 4 i MAT110 Statistikk 1. I vedlegg A finner du en tabell med 12 ledige ruter under kolonnen Formler. Plassèr formlene nedenfor i riktig rute. 19 P(A B) = P(B A) P(A) P(B) (15) P(A og B) = P(A) P(B) (16) P(A) = antall gunstige kombinasjoner for A antall mulige kombinasjoner totalt (17) P(A) = P(A B) + P(A B) (18) og eller P(A B) = 1 P(A B) (19) P(A) = P(A B 1 ) + P(A B 2 ) = P(A B 1 ) P(B 1 ) + P(A B 2 ) P(B 2 ) (20) P(A og B) = P(A B) P(B) (21) = P(B A) P(A) (22) P(B A) = P(A B) P(B) P(A) (23) 19 Skriv inn formlene for hånd i riktig rute og levèr inn. 13

P(A) = 1 P(A) (24) P(A eller B) = P(A)+P(B) (25) og eller P(A B) = 1 P(A B) (26) eller P(A B) = P(A)+P(B) P(A og B) } {{ } ekstra ledd (27) 14

Nedenfor ser du 10 kommentarer. I vedlegg A finner du en tabell med 10 ledige ruter under kolonnen Kommentar. Plassèr kommentarene nedenfor i riktig rute. 20 og (28) 1) urnemodellen (29) 2) kominatorisk sannsynlighet 1) sammenhengen mellom og og betinget sannsynlighet (30) 2) gjelder alltid og og eller med NOT (31) mix (32) A = ikke A (33) 1) sammenhengen mellom og og eller (34) 2) gjelder alltid 1) A og B er uavhengige (35) 2) uavhengighetstest 3) og sannsynlighet 20 Skriv inn formlene for hånd i riktig rute og levèr inn. 15

1) A og B er disjunkte (36) 2) eller sannsynlighet 1) speil -brødre (37) 2) gjelder alltid 16

Vedlegg A ( tilhørende oppgave 6 )

Setn. Formel Kommentar Ark nr. 1: Øving 4, Oppgave 6 Den spesielle add. setn. Den generelle add. setn. Den spesielle mult. setn. Den generelle mult. setn.

Setn. Formel Kommentar Ark nr. 2: Øving 4, Oppgave 6 Komplement setn. Total sannsynlighet Tvilling setn.

Setn. Formel Kommentar Ark nr. 3: Øving 4, Oppgave 6 Kombinatorisk sannsynlighet Bayes lov Oppsplitting av Ω

Innleveringsfrist: mandag 24. mars kl. 14:00 Oppgavesett nr. 5 MAT110 Statistikk 1, 2014 Oppgave 1: ( sentrale sannsynlighetsfordelinger, oversikt ) Nedenfor ser du 28 formler/kommentarer fra kapittel 7 i kompendiet, om sentrale sannsynlighetsfordelinger. I vedlegg A finner du en tabell med 28 ledige ruter. Plassèr formlene/kommentarene nedenfor i riktig rute. 1 PS: Prøv å løse denne oppgaven UTEN å se i formelsamlingen eller kompendiet! x antall begivenheter, λ = rate (1) P(X = x) def. = ( ) ( ) M N M x n x ( ) (2) N n kontinuerlig (3) Var[X] = n p(1 p) (4) 2 param. (5) 1 Skriv ut vedlegg A og skriv inn for hånd formlene/kommentarene i riktig rute. 1

E[X] = n M N (6) tetthetsfunksjon f X (x), Gausskurve (7) Var[X] = σ 2 (8) 1 param. (9) V ar[x] = λ (10) 2 param. (11) E[X] = n p (12) 2 mulige utfall, samme p for suksess, uavhengige, n antall forsøk (13) Var[X] = N n N 1 n M ( N 1 M ) N (14) x antall suksesser/ spesielle, N antall i grunnmengden, M antall spesielle, n antall trukne elementer (15) diskret (16) P(X = x) def. = ( ) n p x (1 p) n x (17) x 2

kjenner ikke fordelingen i urnen, m / tilbakelegging, teller opp antall suksesser (18) diskret (19) E[X] = λ (20) 3 param. (21) kjenner fordelingen i urnen, u / tilbakelegging, teller opp antall suksesser (22) E[X] = µ (23) rate (konstant), antall begivenheter innenfor en gitt tid eller gitt rom telleforsøk, loven om skjeldne begivenheter (24) diskret (25) f X (x) = 1 2πσ 2 e (x µ)2 2σ 2 (26) under bestemte betingelser vil mange diskrete og kontinuerlige sannsynlighetsfordelinger med god tilnærming være normalfordelt (jfr. CLT) (27) P(X = x) def. = λx x! e λ (28) 3

Oppgave 2: ( økonomi, simultane sannsynligheter ) Du jobber som økonomisjef ved Elkjøp Møre og Romsdal. I forbindelse med lansering og salg av iphone 6 våren 2014 ønsker du å vite mer om hva slags salgstall og omsetning Elkjøp kan forvente seg når telefonen slippes på markedet. Derfor engasjerer du studentene ved Høgskolen i Molde som har hatt faget SCM300 Survey Design for å finne ut mer om potensiell pris og etterspørsel. Undersøkelsene til studentene er blant annet basert på: historiske tall, f.eks. salgstall fra iphone 4 og iphone 5 hvordan man tror markedet responderer på den nye telefonen mottagelsen iphone 6 har fått i tester om det er andre konkurrerende selskaper (f.eks. Samsung, Sony Ericsson, Nokia) som også har store lanseringer høsten 2014 Figur 1: iphone 6 lanseres høsten 2014. 4

Studentene bestemmer seg for definere følgende stokastiske variabler: X = prisen på iphone 6 (NOK) Y = antall enheter som omsettes av iphone 6 i løpet av første uken etter lansering. (antall telefoner som omsettes for Elkjøp i hele Møre og Romsdal) Figur 2: Simultanfordelingen til X og Y. a) i) Hva er marginalsannsynlighetene for prisen X? 2 ii) Hva er marginalsannsynlighetene for antall solgte enheter Y? 3 b) i) Hvilken pris kan markedet forvente seg på iphone 6? ii) Hvor mange telefoner forventer Elkjøp å selge i Møre og Romsdal første uken? 2 Marginalsannsynlighetene for prisen er P(X = 1000), P(X = 1500) og P(X = 2000), (se formelsamling). 3 Marginalsannsynlighetenefor antall solgtevarerer P(Y = 90), P(Y = 150) ogp(y = 210),(se formelsamling). 5

c) Hvilken omsetning forventer Elkjøp seg den første uken etter lansering? 4 d) Er pris X og etterspørsel Y uavhengige? 5 La oss si at du bestemmer deg for å fastsette prisen på en iphone 6 til X = 1000 NOK. Du ønsker derfor å finne de betingede sannsynlighetene P(Y X = 1000), for Y = 90, Y = 150 og Y = 210. e) i) Finn de betingede sannsynlighetene P(Y X = 1000), for Y = 90, Y = 150 og Y = 210. 6 ii) Med den fastsatte prisen X = 1000 NOK, hva blir forventet omsetningen? 7 La oss si at du isteden bestemmer deg for å fastsette prisen på en iphone 6 til X = 1500 NOK. f) i) Finn de betingede sannsynlighetene P(Y X = 1500), for Y = 90, Y = 150 og Y = 210. ii) Med den fastsatte prisen X = 1500 NOK, hva blir forventet omsetningen? g) Dersom du har gjort oppgave e og f riktig så ser du at økt pris gir økt omsetning. Behøver det å være slik alltid? (Gi en kort, enkel begrunnelse for svaret). 4 Omsetning = pris X antall solgte varer Y, dvs. omsetning = X Y. Forventet omsetning er dermed E[X Y]. 5 Se formelsamlingen for sammenheng mellom uavhengighet og forventing. 6 Hvilken setningen kan være hensiktsmessig å bruke her? Bruk gjerne resultatet fra oppgave a. 7 Omsetning = 1000 Y. Forventet omsetning er dermed E[1000 Y]. 6

Oppgave 3: ( finansanalyse, korrelasjon ) Denne oppgaven dreier seg om empiriske parametre og teoretiske parametre: empirisk parameter teoretisk parameter Et eksempel på en empirisk parameter er den empiriske korrelasjonskoeffisienten R AB mellom observasjoner A og B. Dette lærte vi om i kapittel 1 i kompendiet. Et eksempel på en teoretisk parameter er korrelasjonskoeffisienten ρ[x, Y] mellom to stokastiske variabler X og Y. Dette lærte vi om i kapittel 6 i kompendiet. I oppgave a nedenfor skal vi først ta for oss et eksempel på en empirisk parameter. I oppgave b nedenfor skal vi ta for oss et eksempel på en teoretisk parameter. En finansanalytiker observèrer kursen (prisen) på aksje A og aksje B. I alt gjør han 150 observasjoner på A og B. Basert på disse 150 observasjonene lages en modell for aksjekursenes utvikling. Utfra denne modellen kan korrelasjonskoeffisienten beregnes. Resultatet er: R AB = 0.95 (29) a) i) Er aksjene A og B korrelerte eller ukorrelerte ifølge modellen? Gi en kort begrunnelse. ii) Dersom de er korrelerte, tenderer aksjene til å variere sammen eller motsatt? 8 8 I takt eller mot-takt? 7

En kvinnelig kollega til denne finansanalytikeren jobber i et annet aksjemarked. Hun observerer aksje C og aksje D. Hun jobber på en annen måte enn sin mannlige kollega: Istedet for å modellere situasjonen basert på empiriske parametre så velger hun å modellere situasjonen ved hjelp av stokastiske variabler. Ut fra en stor mengde historiske data finner hun så den simultane sannsynlighetsfordelingen p(x C = x C,Y D = y D ). Her er X C og X D er stokastiske variabler: X C = kursen på aksje C, og X D = kursen på aksje D. Ut fra dette så regner hun ut at korrelasjonskoeffisienten ρ[x C,Y D ] for kursen på aksje C og aksje D. Resultatet er: ρ[x C,Y D ] = 0.41 (30) b) i) Er aksjene C og D korrelerte eller ukorrelerte ifølge modellen? Gi en kort begrunnelse. ii) Dersom de er korrelerte, tenderer aksjene til å variere sammen eller motsatt? 9 Figur 3: Illustrasjon av variasjon og samvariasjon. 9 I takt eller mot-takt? 8

Oppgave 4: ( økonomi, normalfordeling ) Aker Invest ASA skal bruke 20 millioner NOK på investeringer. De bestemmer seg for å investere i aksje A og aksje B. Prisen på aksje A og B er: p A = 80 NOK (31) p B = 100 NOK (32) Investeringssjefen i Aker bestemmer seg for å investere 10 millioner NOK i hver av akjsene. Med andre ord, Aker kjøper n A = 125000 (33) n B = 100000 (34) antall aksjer av A og B, henholdsvis 10. La oss definere de stokastiske variablene: X A = kursen for aksje A etter ett år (NOK) (35) X B = kursen for aksje B etter ett år (NOK) (36) Anta at X A og X B er normalfordelte, dvs.: X A N[µ A = 100,σ A = 16] (37) X B N[µ B = 125,σ B = 25] (38) Figur 4: Investering i aksjer. 10 En liten sjekk som vi bør ta: p A n A = 80 125000 = 10000000 NOK, dvs. det investeres for 10 mill. slik som teksten sier. Tilsvarende for aksje B. 9

a) i) Hva er sannsynligheten for at kursen stiger i løpet av året for aksje A? 11 ii) Hva er sannsynligheten for at kursen stiger i løpet av året for aksje B? 12 Verdien V for aksjeporteføljen om ett år er: hvor n A og n B er gitt ved lign.(33) og (34). V = n A X A + n B X B (39) b) i) Er X A og X B diskrète eller kontinuerlige stokastiske variabeler? Begrunn svaret. ii) Forklar hvorfor V er en stokastisk variabel. Anta i første omgang at aksje A og B er uavhengige. c) i) Hva betyr E[V] på godt norsk i vårt tilfelle? ii) Finn E[V]. d) i) Hva betyr Var[V] på godt norsk i vårt tilfelle? ii) Finn Var[V]. e) i) Hva er sannsynligheten for at verdien til aksjeporteføljen overstiger 22 mill. NOK? 13 ii) Hva er sannsynligheten for at verdien til aksjeporteføljen overstiger 30 mill. NOK? 14 11 Dvs. finn P(X A > 80). Bruk tabellen på side 52 i formelsamlingen. 12 Dvs. finn P(X B > 100). 13 Dvs. finn P(V > 22mill.). 14 Dvs. finn P(V > 30mill.). 10

Anta nå at det er en sammenheng mellom aksjekursen til A og B, og at korrelasjonskoeffisienten mellom dem er: ρ[x A,X B ] = 0.5 (40) f) Finn E[V]. 15 g) Finn Var[V]. 16 h) Er variansen til V større eller mindre når korrelasjonen er negativ mellom de stokastiske variablene, sammenlignet med når korrelasjonen er null? 17 i) i) Hva er sannsynligheten for at verdien til aksjeporteføljen overstiger 22 mill. NOK? ii) Hva er sannsynligheten for at verdien til aksjeporteføljen overstiger 30 mill. NOK? j) Fyll inn svarene fra oppgaven i tabell 5 og kommentèr resultatet. 18 15 Se lign.(5.12) i kompendiet. Gjelder denne ligningen alltid, uansett om X A og X B er korrelerte eller ikke? 16 Se lign.(6.15) i kompendiet. Bruk denne ligningen sammen med definisjonen av korrelasjonskoeffisienten til å regne ut Cov[X A,X B ]: Cov[X A,X B ] = ρ[x A,X B ] σ A σ B (41) 17 Sammenlign svarene i oppgave d ii) og g). 18 Blir størrelsene større eller mindre når det er negativ korrelasjon mellom de stokastiske variablene? Eller blir de uendret? 11

Figur 5: Fyll inn svarene fra oppgaven i tabellen. 12

Oppgave 5: ( korrelasjon ) Nedenfor er de stokastiske variablene X og Y plottet i 6 forskjellige sammenhenger. Hver av disse 6 grafene er assosiert med ett av følgende utsagn angående lineær korrelasjon: svak negativ sterk positiv ingen svak positiv moderat negativ sterk negativ Plassèr disse utsagnene i rett graf. 19 Figur 6: Lineær korrelasjon mellom X og Y. 19 Print ut denne siden og skriv inn for hånd riktig utsagn på rett graf. Eller tegn av figurene på eget ark. Husk å legg ved arket i innleveringen din. 13

Oppgave 6: ( oversikt over formler ) a) Nedenfor ser du 13 sentrale formler som vi har lært om så langt i MAT110 Statistikk 1. I vedlegg B finner du en tabell med 13 ledige ruter. Plassèr formlene nedenfor i riktig rute. 20 x = 1 n x i (42) n i=1 m E[X] = x i P(X = x i ) (43) i=1 S 2 x = Var[X] = 1 n 1 n (x i x) 2 (44) i=1 m (x i E[X]) 2 P(X = x i ) (45) i=1 Var[aX 1 +bx 2 ] = a 2 Var[X 1 ] + b 2 Var[X 2 ] (46) S xy = 1 n 1 n (x i x)(y i y), S xy = 0 (47) i=1 Cov[X,Y] = E[(X E[X])(Y E[Y])], Cov[X,Y] = 0 (48) R xy = S xy S x S y, R xy = 0 (49) ρ[x,y] = Cov[X,Y] Var[X] Var[Y], ρ[x,y] = 0 (50) 20 Skriv ut vedlegg B i skriv inn for hånd formlene i riktig rute. 14

b) Nedenfor ser du 13 sentrale formler som vi har lært om så langt i MAT110 Statistikk 1. I vedlegg B finner du en tabell med 13 ledige ruter. Plassèr formlene nedenfor i riktig rute. 21 P(A B) = P(A)+P(B) (51) P(A B) = P(A)+P(B) P(A B) (52) P(A B) = P(A B) P(B) (53) P(A B) = P(A) P(B) (54) p(x,y) = P(X = xogy = y) (55) p(x,y) = P(X = x) P(Y = y) (56) E[X Y] = m n i=1 j=1 x i y j p(x i,y j ) (57) E[X Y] = E[X] E[Y] (58) P(A) = P(A B)+P(A B) P(A) = 1 P(A) (59) P(A) = P(A B 1 ) P(B 1 ) + P(A B 2 ) P(B 2 ) +... + P(A B N ) P(B N ) (60) P(A B) = P(B A) P(A) P(B), P(B A) = P(A B) P(B) P(A) (61) 21 Formlene i lign.(61) skal i en og samme rute. 15

Vedlegg A

Bin[ n, p ] Hyp[ N, M, n ] Poi[ λ ] N[ μ, σ ] Antall parametre: Antall parametre: Antall parametre: Antall parametre: Diskret/kont.? Diskret/kont.? Diskret/kont.? Diskret/kont.? Sanns. fordeling: Sanns. fordeling: Sanns. fordeling: Sanns. fordeling: Forventning: Forventning: Forventning: Forventning: Varians: Varians: Varians: Varians:

Bin[ n, p ] Hyp[ N, M, n ] Poi[ λ ] N[ μ, σ ] Kommentar: Kommentar: Kommentar: Kommentar:

Vedlegg B

Oppgave 6 a) Beskrivende statistikk ( utvalg av observasjoner ) Stokastiske variabler ( sann.-fordeling av stok. var X ) Tyngdepunkt Variasjon generelt uavh. Samvariasjon (IKKE-normert) generelt uavh. Samvariasjon (normert) generelt uavh.

Oppgave 6 b) Sannsynlighetsregning ( begivenheter A og B ) Simultane sanns.-fordelinger ( sannsynlighetsfordeling for stok. var. X og Y ) og generelt uavh. eller generelt disjunkt total sannsynl. kompl. setn. oppspl. av Ω Bayes lov 2 setninger skal inn i denne ruten

Innleveringsfrist: mandag 7. april kl. 14:00 Oppgavesett nr. 6 MAT110 Statistikk 1, 2014 Oppgave 1: ( Sport Management ) La oss igjen betrakte fotballaget Tufte IL fra øving 4. Vi definerer samme diskrete stokastiske variabel som tidligere, nemlig: X = antall mål som Tufte IL scorer i løpet av en tilfeldig valgt kamp Basert på historiske data viser det seg at 20% av målsjansene resulterer i mål, dvs. p = 0.20 (1) For enkelhets skyld antar vi at Tufte IL produserer n = 10 målsjanser, dvs.: n = 10 (2) målsjanser i løpet av en kamp. Vi antar videre at alle målsjansene er uavhengige. Figur 1: Tufte IL. 1

a) Forklar hvorfor X er binomisk fordelt, dvs. forklar hvorfor X Bin[n,p]. 1 b) i) Hva betyr E[X] på godt norsk i vårt tilfelle? (Dvs. gi en tolkning av E[X].) ii) Finn E[X]. c) i) Hva betyr Var[X] på godt norsk i vårt tilfelle? (Dvs. gi en tolkning av Var[X].) ii) Finn Var[X]. d) i) Hva er sannsynligheten for at laget scorer minst 1 mål i en kamp? 2 ii) Hva er sannsynligheten for at laget scorer minst 2 mål i en kamp? 3 For å bedre lagets resultater vurderes to hovedstrategier. Den ene stategien går ut på å øke uttellingen på målsjansene, dvs. øke p. Den andre strategien går ut på å øke antall produserte målsjanser, dvs. øke n. Vi gjør en analyse av disse hovedstrategiene ved å se på følgende situasjoner: A) øke uttellingen på målsjansene, dvs. øke p til p = 0.30 ( antall målsjanser er uforandret n = 10 ) B) øke antall produserte målsjansene, dvs. øke n til n = 15 ( utellingsprosenten p = 0.20 er uforandret ) 1 Hvilke 4 kriterier må være oppfylt for et en forsøksserie skal være binomisk? Er disse oppfylt i vårt tilfelle? 2 Dvs. finn P(X 1). Tips: P(X 1) = 1 P(X = 0). ( Bruk 4 desimalers nøyaktighet. ) 3 Dvs. finn P(X 2). Tips: P(X 2) = 1 P(X 1) = 1 P(X = 0) P(X = 1). 2

Vi skal nå gjøre en statistisk analyse for å se om den ene strategien er bedre enn den andre. Eller om det ikke er noen markant forskjell. I den sammenheng finner vi det hensiktsmessig å definere følgende stokastiske (tilfeldige) variabler: X A = antall mål som Tufte IL scorer i løpet av en tilfeldig valgt kamp dersom de følger strategi A (3) X B = antall mål som Tufte IL scorer i løpet av en tilfeldig valgt kamp (4) dersom de følger strategi B (5) e) Regn ut forventet antall scorede mål for strategi A. 4 f) Regn ut forventet antall scorede mål for strategi B. 5 g) i) For strategi A: Hva er sannsynligheten for at laget scorer minst 1 mål i en kamp? 6 ii) Hva er sannsynligheten for at laget scorer minst 2 mål i en kamp? 7 h) i) For strategi B: Hva er sannsynligheten for at laget scorer minst 1 mål i en kamp? 8 ii) Hva er sannsynligheten for at laget scorer minst 2 mål i en kamp? 9 4 Dvs. finn E[X A ]. 5 Dvs. finn E[X B ] 6 Dvs. finn P(X A 1). 7 Dvs. finn P(X A 2). 8 Dvs. finn P(X B 1). 9 Dvs. finn P(X B 2). 3

For å bedre kunne smmenligne strategi A og B så kan det være hensiktsmessig å samle regneresultatene fra denne oppgaven i en tabell. Se tabellen nedenfor. Fyll inn svarene fra denne oppgaven i tabellen. 10 i) Sett ut fra et rent statistisk ståsted, er den ene strategien bedre enn den andre? 11 Figur 2: Fyll inn svarene fra denne oppgaven i tabellen og lever inn. 10 Lever inn tabellen som en del av din besvarelse. 11 Anta at laget har samme defensive styrke uansett valg av strategi. Den strategien som er best er den som gir størst forventet antall scorede mål og størst sannsynlighet for å score mål. 4

Oppgave 2: ( intervall ) Anta at X er en stokastisk variabel som er normalfordelt, dvs. X N[µ,σ]. a) Uten å gjøre noen regning, bruk kun formelsamlingen, hva er sannsynligheten for at X ligger i intervallet µ σ X µ+σ? 12 En bedrift som produserer rør som settes sammen til gassrørledninger. Bedriften har en maskin som produserer rør, som til en bestemt rørledning skal være omtrent 9 meter lang. Lengden til rør produsert av maskinen er med god tilnærmelse beskrevet av en normalfordeling. Anta at denne maskinen produserer rør som har en forventning og standardavvik µ = 9 meter (6) σ = 0.1 meter (7) b) Uten å gjøre noen regning, bruk kun formelsamlingen, hva er sannsynligheten for at et et tilfeldig valgt rør har lengde mellom 8.9 meter og 9.1 meter? 13 Figur 3: Gassrør på Nyhamna i Aukra. 12 I denne oppgaven er det meningen at du kun skal slå opp på rett sted i formelsamlingen og lese av svaret direkte. 13 I denne oppgaven behøver du heller ikke å gjøre noen regning. Bare så opp på rett sted i formelsamlingen og les av svaret. 5

c) Uten å gjøre noen regning, bruk kun formelsamlingen, hva er sannsynligheten for at et tilfeldig valgt rør har lengde mellom 8.8 meter og 9.2 meter? d) Man kan spørre: Hvordan finner man frem til tallene i figuren på side 53 i formelsamlingen? Jo, man må regne på det. En slik regning ble for eksempel gjort i kompendiet side 230. Stemmer regningen i kompendiet (se side 233) med ditt svar fra oppgave b? Kommentarer: Denne oppgaven er en lett introduksjon til tema som blir nærmere gjennomgått i MAT210 Statistikk 2, blant annet konfidensintervall. Et konfidensintervall i statistikken er et intervall som angir feilmarginen av en måling eller en beregning. Et konfidensintervall angir intervallet som med en spesifisert sannsynlighet inneholder den sanne (men vanligvis ukjente) verdien av variabelen man har målt. Således inneholder et 95%-konfidensintervall den sanne verdien med en sannsynlighet på 0, 95. Figur 4: Konfidensintervall. 6

Oppgave 3: ( økonomi ) Du jobber som økonomiansvarlig for Shell sin avdeling i Tromsø. Som økonomiansvarlig skal du være med i prosessen for å avgjøre om potensielle nye funn av olje i Norskehavet er økonomisk drivverdige eller ikke. Dersom olje påvises i en letebrønn så anses det som suksess. I løpet av 2015 skal Shell bore n = 15 letebrønner. Figur 5: Letebrønn i Norskehavet. a) Hvilke antagelser må legges til grunn for at de n = 15 letebrønnene skal anses som en binomisk forsøksrekke? Definer den stokastiske variabelen: X = antall letebrønner hvor man finner olje dvs. X er antall suksesser. Anta videre at det er p = 15% sannsynlighet for å finne olje i en tilfeldig valgt brønn. 14 14 p kalles ofte suksessannsynligheten. 7

b) i) Hva er sannsynligheten for at Shell finner olje i nøyaktig 3 letebrønner? 15 ii) Hva er sannsynligheten for at Shell finner olje i minst 2 letebrønner? 16 Dersommanfinner oljeiengittletebrønnsåermengdenoljeknyttet tilfunnetavhengig omfunnet er økonomisk drivverdig. Denne mengden varierer fra funn til funn. La oss anta at mengden for et gitt funn kan modelleres som en normalfordelt stokastisk variabel M med forventing µ = 1000 og standardavvik σ = 200, dvs. 17 hvor M = mengden olje i funnet, i antall millioner oljefat (8) M N[µ = 1000, σ = 200] (9) c) La oss se på en gitt brønn hvor det er funnet olje. Hva er sannsynligheten for at denne gitte brønnen inneholder mer enn 1100 millioner oljefat? 18 Anta at Shell finner olje i n = 10 letebrønner. Den totale mengden olje som er funnet er dermed: M tot = M 1 + M 2 +... +M 10 (kontinuerlig) (10) hvor M i er mengden olje som er funnet i letebrønn nr. i, hvor i = 1,2,...,10. Anta videre at alle disse M i ene kan modelleres med stokastiske variabler som er uavhengige og med identiske normalfordelinger ihht. lign.(9). 15 Dvs. hva er P(X = 3)? 16 Dvs. hva er P(X 2)? 17 Enheten her er millioner oljefat. At µ = 1000 betyr derfor 1000 millioner oljefat. 18 Dvs. hva er P(M > 1100)? ( Bruk 4 desimalers nøyaktighet. ) 8

d) i) Hva er E[M tot ] og Var[M tot ]? ii) Hva er sannsynligheten for at den totale mengden ligger innenfor intervallet [9 000, 11 000]? La oss videre definere den stokastiske variabelen: Y = antall letebrønner med mer enn 1100 millioner oljefat (diskret) hvor Y Bin[n = 10, p = P(M > 1100) ] (11) }{{} suksess sanns. Denne stokastiske variabelen er, i motsetning til M i ene, ikke normalfordelt. I likhet med X så er det rimelig å anta at Y er binomisk fordelt. e) Hva er sannsynligheten for at minst 2 brønner inneholder mer enn 1100 millioner oljefat? 19 19 Dvs. finn P(Y 2). Siden Y er binomisk fordelt så trenger vi parametrene n og p. Antall forsøk i vårt tilfelle er lik antall letebrønner som inneholder olje, dvs. n = 10. Sannsynligheten for suksess for variabelen Y er den sannsynligheten du fant i oppgave c), dvs. p = P(M > 1000). 9

Oppgave 4: ( normalfordeling, lagerstyring, logistikk ) I 2010 fikk belysningsprodusenten Glamox i Molde en stor kontrakt med det danske sygehusvæsen for leveranse av spesiallys til operasjonsstuer i alle de statlige sykehusene i Danmark. På grunn av strenge krav til god belysning i operasjonsstuene så må lampene skiftes ut med jevne mellomrom. Det viser seg at i gjennomsnitt så må µ = 10 lamper per dag skiftes ut ved de forskjellige sykehusene i Danmark. Standardavviket per dag er ganske stort, σ d = 6. Ut fra disse opplysningene ser vi at det er hensiktsmessig å definere den stokastiske variabelen X = antall lamper som etterspørres av sykehusene i Danmark per dag (12) En vanlig tilnærming er å anta at variabelen er tilnæremet normalfordelt, dvs. X N[µ = 10, σ d = 6] (13) a) Hvor stor er sannsynligheten for at etterspørselen av lamper fra de danske sykehusene er større enn 15 per dag? 20 Figur 6: Lys til operasjonsstuer i Danmark levert av Glamox. 20 Dvs. hva er P(X > 15)? 10

Det er et krav fra helsemyndighetene i Danmark at sykehusene skal ha 99% sikkerhetsnivå (= servicenivå) for å ha lamper på lager. For å oppnå dette sikkerhetsnivået så må de danske sykehusene ha et sikkerhetslager tilsvarende dette nivået. Formel for sikkerhetslager er oppgitt i faget SCM200 Innføring i Supply Chain Management : 21 hvor SS = Z 0 σ L (14) SS = safety stock, antall enheter på sikkerhetslager (15) Z 0 = sikkerhetsfaktor/antall standardavvik (16) σ L = standardavvik for etterspørsel i ledestiden (17) = σ d L (18) hvor L = ledetiden (leveringstiden). Ledetiden i vårt tilfelle er den tiden som Glamox bruker på å starte opp en ny produksjonsserie og helt til lampene er ferdig produserte og leverte til Danmark. Altså den tiden det tar for å få lampene inn på lager lokalt i Danmark. Denne tiden er L = 3 dager. 22 b) Hvor mange lamper må sykehusene i Danmark ha på sikkerhetslager for å oppnå 99% sikkerhetsnivå? 23 Figur 7: Sikkerhetslager. 21 Denne formelen er hentet fra side 40 (av 51) i Kap5SCM200.pdf, 2013. Du behøver ikke ha tilgang til dette dokumentet. All informasjon du behøver i denne oppgaven er oppgitt. 22 Merk at ledetid L = 3 dager og gjennomsnittlig etterspørsel µ = 10 per dag er oppgitt i samme tidsenhet, dager i dette tilfelle. 23 Dvs. finn størrelsen SS. I denne oppgaven antar vi at sykehusene i Danmark kan oppfattes som en enhet med ett lager, og at det enkelte sykehus kan få tak i nye lamper fra dette lageret så raskt at lamper kan byttes ut når det er behov for det uten at man trenger mer enn ett lager. 11

Bestillingspunktet R i lagerteori er det antallet varer man har på lager før man må bestille nye varer. På den måten unngår man å gå tom. I vårt tilfelle er bestillingspunktet det antall lamper som de danske sykehusene har på lager før de må bestille nye fra Glamox 24. Formelen for dette bestillingspunkt er: 25 R = d L + SS (19) hvor d = gjennomsnittlig etterspørsel per dag (20) L = ledetid i antall dager (21) c) Hvor mange lamper har de danske sykehusene på lager når de må bestille nye 26 27 fra Glamox? Figur 8: Antall lamper på lager sfa. tid. Sikkerhetslager SS. Bestillingspunkt R. 24 Merk at bestillingspunktet er et antall, ikke et tidspunkt. 25 Se side 32 (av 51) i Kap5SCM200.pdf, 2013. 26 Dvs. finn R. Tips: Hva er d i vårt tilfelle? 27 Figur 8 er en velkjent figur innen logistikk og lagerstyring, se f.eks. SCM200 Innføring i Supply Chain Management. For de av dere som ikke har dette faget så kan dere bare se på figuren som en enkel illustrasjon. 12

Oppgave 5: ( økonomi ) Du er ansatt som salgssjef og økonomiansvarlig for bilvarehuset Slatlem & Co A/S i Kristiansund. Som ansvarlig for bilsalget er du interessert i å vite mer om forventet bilsalg. Derfor definerer du den stokastiske variabelen: X = antall biler solgt per dag Basert på historiske data så vet du at X har følgende sannsynlighetsfordeling: Figur 9: Sannsynlighetsfordeling P(X = x). Figur 10: Bilvarehuset Slatlem & Co A/S i Kristiansund. 13

a) i) Finn forventet antall biler solgt per dag, dvs. E[X]. ii) Finn variansen til antall biler solgt per dag, dvs. Var[X]. 28 La X 1, X 2, X 3... X n (22) være antall biler solgt på dag nr. 1, 2, 3,..., n. Gjennomsnittet av antall solgte biler er X = X 1 +X 2 +X 3 +... +X n n (23) Anta videre at: 1. antall biler solgt på ulike dager er uavhengige: X i er uavhengige for alle i = 1,2,3...n 2. alle dager antas å ha samme sannsynlighetsfordeling (gitt ved tabell 9): X i samme sannsynlighetsfordeling for alle i = 1,2,3...n Slatlem har n = 303 åpningsdager i året. b) i) Finn forventet antall biler solgt per dag i gjennomsnitt over ett år, dvs. E[X]. 29 ii) Finn variansen til gjennomsnittet over ett år av antall biler solgt per dag, dvs. Var[X]. 28 Bruk 4 desimalers nøyaktighet både på Var[X] og σ[x]. 29 Husk at dersom to stokastiske variabler X og Y er uavhengige så er Cov[X,Y] = 0. }{{} sterk svak 14

c) Bruk svarene fra foregående oppgaver og fyll ut tabellen nedenfor. Kommenter resultatet. 30 Figur 11: Fyll ut tabellen. d) i) Med forutsetningene 1. og 2. som oppgitt på forrige side, hvilken setning (som vi har lært om i dette kurset) gjelder da? ii) Hvilken fordeling har gjennomsnittet X? iii) Hvor stor må n (n = antall forsøk ) være, omtrent, for at setningen fra oppgave i) skal gjelde? 31 e) På neste side ser du en figur med et koordinatsystem. På y-aksen finner du tetthetsfunksjonen f X (x) for den stok. gjennomsnittsvariabelen X. På x-aksen finner du verdier for gjennomsnittet, dvs. x. Tegn inn tetthetsfunksjonen f X (x). 32 30 Hvordan er E[X] sammenlignet med E[X]? Hvordan er σ[x] sammenlignet med σ[x]? 31 Kun en tommelfingerregel er godt nok her. 32 Bruk at f X (µ = E[X]) 0.45. Bruk også resultatene for E[X] og σ[x] fra Fig.11. 15

f X ( x ) 0.50 0.40 0.30 0.20 0.10 0.2 0.4 0.6 0.8 1.0 1.2 x Figur 12: Tegn inn for hånd tetthetsfunksjonen f X (x). f) Hva er sannsynligheten for at Slatlem selger mer enn 220 biler i året? Finn tilnærmet svar v.h.a. sentralgrensesetningen. 33 33 Tips: ( X1 +X 2 +... +X n P(X 1 +X 2 +... +X n > 220) = P n > 220 ) n (24) = P(X > 220 n ) (25) Så kan du argumentere for hva slags fordeling X har, og deretter standardisere lign.(25). Bruk 4 desimalers nøyaktighet. Heltallskorreksjon behøves ikke. 16

Innleveringsfrist: mandag 28. april kl. 14:00 Oppgavesett nr. 7 MAT110 Statistikk 1, 2013 Oppgave 1: ( logistikk, avisguttens problem ) 1 En gutt jobber som avisselger. Han selger aviser for løssalg på gata. Etterspørselen av aviser en gitt dag kan beskrives av en stokastisk variabel D ( demand ), hvor: D = antall aviser som etterspørres en gitt dag (1) Anta videre at sannsynlighetsfordelingen til denne stokastiske variabelen D er gitt ved fordelingen i figur (1): 2 d i 1 0 2 3 4 5 P(D=d i ) 0.10 0.05 0.15 0.30 0.25 0.15 Figur 1: Sannsynlighetsfordeling P(D = d i ), for i = 0,1,...4,5. Figur 2: Avisgutt. 1 Problemet i denne oppgaven er kjent som avisguttens dilemma eller avisguttens problem. Dette grunnleggende problemet beskriver tilbud og etterspørsel i ubalanse. 2 Ut fra denne sannsynlighetsfordelingen ser vi at etterspørselen er maksimalt 5 aviser per dag. Denne begrensningen er introdusert for å unngå for mye repeterende regning. 1

a) Hva er forventet etterspørsel av aviser for en gitt dag, E[D]? Hver morgen må avisgutten bestemme seg for hvor mange aviser han ønsker å prøve å selge. La oss si at avisgutten bestiller q antall ( order quantity ) aviser fra distributøren en gitt morgen. Dersom han bestiller for få aviser så taper han salg. Dersom han bestiller for mange aviser så blir han sittende igjen med aviser som han ikke får solgt. La oss derfor introdusere en variabel S, hvor Denne variabelen er gitt ved S = antall aviser som faktisk selges en gitt dag (2) hvor min(d,q) betyr den minste størrelsen av D og q. S = min(d,q), (3) b) Forklar kort hvorfor S = min(d,q) også er en stokastisk variabel. 3 En morgen bestemmer avisgutten seg for å bestille q = 3 aviser. Anta da at sannsynlighetsfordelingen til den stokastiske variabelen S da er gitt ved fordelingen i figur (3): s i 1 0 2 3 4 5 P(S=s i ) 0.10 0.05 0.15 0.70 0 0 Figur 3: Sannsynlighetsfordeling P(S = s i ), for i = 0,1,...4,5 når q = 3. c) Vis at sannsynlighetsfordelingen i figur (3) er en gyldig sannsynlighetsfordeling. 3 Variabelen D er stokastisk. Variabelen S er avhengig av D, se lign.(2). 2

d) i) Finn E[S]. ii) Gi en tolkning av E[S], dvs. forklar kort hva det betyr på godt norsk. e) Sammenlign E[D] fra oppgavene a og E[S] fra d. Er det rimelig at den ene verdien er større enn den andre? Begrunn svaret. Ved bestilling kjøpes avisene inn for prisen w ( wholesale ) per avis. Avisgutten selger dem videre på gata for utslagsprisen r ( revenue ) per avis. Fortjenesten blir da: π(q) = rs wq, (4) hvor, som tidligere angitt, S = min(d,q). Her er r, q og w konstanter. f) Anta at innkjøpspris er w = 5 NOK og utslagspris er r = 20 NOK. Hva er da forventet fortjeneste E[π(q)] dersom avisgutten bestiller q = 3 aviser? 4 Ovenfor har vi behandlet D som en diskret stokastisk variabel. Dersom vi nå istedet behandler D som en kontinuerlig variabel så kan man vise at maksimal fortjeneste oppnås når 5 P(D q ) = 1 w r, (5) hvor q er det antall aviser som avisgutten må kjøpe inn om morgenen for å maksimere sin fortjeneste. Sannsynligheten P(D q ) i lign.(5) er altså den kumulative fordelingen til D. Anta videre at D er normalfordelt med forventning µ = 3 og standardavvik σ = 1.5, dvs. D N [ µ = 3,σ = 1.5 ]. (6) 4 Tips: Bruk en av regnereglene på side 37 i formelsamlingen. Bruk gjerne resultatet fra oppgave d. 5 Du skal ikke vise lign.(5). Bare ta den for gitt. 3

g) Med verdiene w = 5 NOK og r = 20 NOK, finn det antall aviser q som avisgutten må bestille for å få størst fortjeneste. h) Med fordelingen som i lign.(6) er forventet etterspørsel av aviser en gitt dag like tre, µ = 3. Denne forventningsverdien µ = 3 og verdien på q fra oppgave g er ikke er sammenfallende. Gi en kort forklaring på hvorfor den ene verdien er større enn den andre. 4

Oppgave 2: ( logistikk ) Du jobber som logistikk-koordinator ved Kristiansund brannstasjon. For å dimensjonere kapasiteten på materiell (f.eks. biler) så vel som personell så ønsker du å få mer kjennskap til dynamikken (f.eks. utrykningsfrekvensen) til brannstasjonen. Du ønsker å modellere dynamikken ved hjelp av statistikk. Siden utrykninger skjer relativt sjelden og siden det er hensiktsmessig å se på antall utrykninger per tid så foreslår du å bruke loven om sjeldne begivenheter, dvs. Poissonfordelingen. Du definerer den stokastiske variabelen: X = antall utrykninger per uke og antar at denne er Poisson fordelt: X Poi[λ] (7) Basert på erfaring så vet du at det er ca. 1.5 utrykninger i uken, dvs. λ = 1.5 (8) Figur 4: Kristiansund Brannstasjon. 5

a) Hva er sannsynligheten for at det skjer 2 utrykninger i løpet av en uke? b) Hva er sannsynligheten for at det skjer mer enn 2 utrykninger i løpet av en uke? La X 1,X 2 og X 3 være antall utrykninger i uke nr. 1, 2 og 3. Definer den stokastiske variabelen Y = X 1 + X 2 + X 3 (9) dvs. Y = antall utrykninger over en periode på 3 uker. c) Hva er forventet antall utrykninger i løpet av en periode på 3 uker? 6 d) Man kan vise at summen av Poisson fordelinger også er Poisson fordelt. Det betyr at siden X 1, X 2 og X 3 er Poisson fordelt, så er også summen av dem, Y = X 1 +X 2 +X 3, Poisson fordelt med forventning E[Y]. 7 Y Poi [ E[Y] ] (10) Hva er sannsynligheten for at det skjer mer enn 2 utrykninger i løpet av en periode på 3 uker? 8 e) Sammenlign svaret i oppgave d med svaret i oppgave b. Kommenter resultatet. 9 6 Finn E[Y]. Bruk en av regnereglene på side 37 i formelsamlingen. 7 Dette gjelderkunforpoissonfordelinger.detgjelderikkegenerelt.det erikkeslikatf.eks. summenavbinomial fordelinger er en ny binomial fordeling. 8 Finn P(Y > 2). 9 Når du sammenligner svarene, ser de rimelig fornuftige ut? 6

La A = begivenheten at det skjer mer enn 2 utrykninger i løpet av en uke, dvs. X > 2 B = begivenheten at det skjer minst 1 utrykning i løpet av en uke, dvs. X 1 f) Tegn Venn-diagram for begivenhetene A og B i samme diagram. 10 g) Gi en kort begrunnelse (uten regning) ut fra Venn-diagrammet i oppgave f for at: P(A B) = P(A) (13) h) Hva er (den betingede) sannsynligheten for at det skjer flere enn 2 utrykninger en uke dersom }{{ vi vet } det har skjedd minst en utrykning tidligere i uken? 11 betinget sanns. i) Bruk svarene fra foregående oppgaver til å fylle ut tabellen på neste side. 12 10 Tips: Sannsynlighetene for begivenhetene A og B kan skrives: P(A) = P(X > 2) (11) P(B) = P(X 1) (12) Er hele begivenheten A en del av begivenheten B? Hvordan påvirker det Venn-diagrammet? 11 Dvs. finn P(A B). Bruk definisjonen av betinget sannsynlighet: P(A B) = P(A B) P(B) = = P(X>2) P(X > 2 X 1) P(X 1) }{{} =1 P(X=0) = P(X > 2) 1 P(X = 0) (14) 12 For å finne P(A) P(B) må du multiplisere sannsynlighetene. De tre andre cellene i tabellen er bare å fylle rett inn ut fra foregående oppgaver. Skriv ut tabellen og lever inn. Eller skriv av tabellen for hånd. 7

Figur 5: Fyll ut tabellen. j) I denne deloppgaven skal vi se på to måter å finne ut oma og B er uavhengige eller ikke. i) Bruk tabellen til venstre til å svare på spørsmålet: Er begivenhetene A og B uavhengige? 13 ii) Bruk tabellen til høyre til å svare på spørsmålet: Er begivenhetene A og B uavhengige? 14 (Denne oppgaven viser at det er flere måter å teste om begivenheter er uavhengige på). 13 Se definisjonen av uavhengighet mellom to begivenheter i formelsamlingen, lign.(4.14). 14 Jfr. den spesielle multiplikasjonssetningen, lign.(4.16) i formelsamlingen. 8

Oppgave 3: ( logistikk ) Du er nyansatt i Kristiansund kommune og har ansvaret for den logistikkmessige planleggingen i kommunen. Din første oppgave dreier seg om den store boligutbyggingen i Ørnvika i Kristiansund som er under planlegging. En av de spørsmålene som er på dagsorden er antall parkeringsplasser som bygges i dette området. For å bygge tilstrekkelig antall parkeringsplasser så må man blant annet ta hensyn til hvor mange biler familene har. Derfor definerer du den stokastiske variabelen: X = antall biler per familie For å finne sannsynlighetsfordelingen til X, dvs. P(X = x), så engasjerer du en gruppe studenter ved Høgskolesenteret i Kristiansund som har hatt faget SCM300 Survey Design. Disse studentene finner følgende fordeling for X: Figur 6: Sannsynlighetsfordeling P(X = x). Figur 7: Venstre: oppslag i TKTV 14. des. 2011. Høyre: Plankart for Ørnvika vest. 9

a) Hva er sannsynligheten for at en familie har minst èn bil? b) i) Hva er forventet antall biler for en familie E[X]? ii) Hva er variansen til antall biler per familie Var[X]? Det planlegges bygging for n = 129 boenheter på de 151 målene planen omfatter. Det totale antall biler i dette nye byggefeltet blir da: Y = n i=1 X i = X 1 +X 2 +... +X n (15) c) i) Hva betyr E[Y] på godt norsk i vårt tilfelle? 15 ii) Finn E[Y]. Anta at antall biler hver familie har som flytter inn i det nye bolgfeltet er uavhengige. d) i) Hva betyr Var[Y] på godt norsk i vårt tilfelle? (Dvs. gi en tolkning av Var[Y].) ii) Finn Var[Y]. 16 e) Hvilken fordeling er det rimelig å anta at Y har? Begrunn svaret. 17 15 Dvs. gi en tolkning av E[Y]. 16 Tips: Se side 44 i formelsamlingen. 17 Hint: Sentralgrenseteoremet. Det er særlig 3 ting du kan nevne for å begrunne svaret ditt. Selv om sentralgrenseteoremet slik vi har formulert det sier noe om gjennomsnittet X = 1 n n i=1 X i så gjelder det tilsvarende resultatet også uten prefaktoren 1 n. 10

f) Dersom det bygges 160 parkeringsplasser i Ørnvika, hvor stor sannsynlighet er det for at det er nok parkeringsplasser? 18. Det er retningslinjer for hvor mange parkeringsplasser som et nytt boligfelt skal ha. Disse retningslinjene sier at det skal være 90% sannsynlighet for at er nok plasser til alle bilene. g) Hvor mange parkeringsplasser må det bygges i Ørnvika for å oppfylle retningslinjene? 18 Finn P(Y 160). Bruk heltallskorreksjon. (Se f.eks. formel i lign.(7.36) i formelsamlingen.) 11

Oppgave 4: ( logistikk ) Du er jobber som frivillig i Tahiti-festivalen i Kristiansund. Oppgaven du blir satt til å håndtere er å arrangere en utflukt for artistene. Dere skal leie en båt for å vise artistene hvor vakkert Kristiansund ligger til ute ved Atlanterhavets rand. For å finne ut hvor stor båt dere må leie så tilnærmer du deg problemet ved hjelp av statistikk. Totalt er det invitert n = 250 artister og andre gjester på utflukten. Basert på historiske tall så er det p = 80% sannsynlighet for at en gitt invitert person faktisk kommer. Du ser på det som hensiktsmessig å definere den stokastiske variabelen: X = antall person som kommer på båtturen Personer som blir inviterte på slike arrangement har en tendens til å komme i flokk. Det betyr at det ikke er helt riktig å anta at de inviterte kommer uavhengig av hverandre. Men, som en tilnærmelse til virkeligheten, så antar vi i denne oppgaven at personene møter opp uavhengige av hverandre. a) Begrunn hvorfor det er rimelig å anta at X er binomisk fordelt, dvs. begrunn hvorfor 19 X Bin[n = 250,p = 0.8] (16) Figur 8: Tahiti-festivalen. 19 Hvilke 4 krav må være oppfylt for at X skal være binomisk fordelt? Er disse kravene oppfylt i vårt tilfelle? 12

b) Finn forventet antall personer som kommer på båtturen, dvs. finn E[X]. c) i) Finn variansen til antall person som kommer på båtturen, dvs. finn V ar[x]. ii) Hva er det tilhørende standardavviket σ[x]? d) i) Dersom en betingelse er oppfylt så kan en binomisk fordeling tilnærmes med en normalfordeling. Hvilken betingelse er det? 20 ii) Er denne betingelsen oppfylt i vårt tilfelle? Tahiti-festivalens sjef Frode Alnæs sier til deg at du må finne ut hvor stor kapasitet båten må ha for å få plass til passasjerene. Alnæs sier videre at det skal være 95% sikkert at alle som kommer skal få plass i båten. e) Hvor mange personer må båten minst ha plass til for å oppfylle Alnæs sitt krav? 21 Figur 9: Tahiti-festivalens sjef Frode Alnæs. 20 Se f.eks. side 60 i formelsamlingen. 21 Finn minimum passasjerkapasitet X 0 som båten må ha. Denne er bestemt av P(X X 0 ) = 0.95 (17) Siden X N[ µ, σ[x]], hvor µ = E[X] og σ[x] ble funnet i oppgave b og c, så han vi løse lign.(17) ved å standardisere og deretter bruke Gaussintegral G(z). Bruk heltallskorreksjon. 13

Oppgave 5: ( regresjon ) a) Hva er regresjonsanalyse? 22 b) Hva er formålet med regresjonsanalyse? 23 Figur 10: Regresjon. 22 Her trengs kun et kort svar. Se side 280 i kompendiet. 23 Se side 280 i kompendiet. 14

Oppgave 6: ( økonomi ) Et eiendomsmeglerfirma ønsker å se nærmere på sammenhengen mellom areal x og pris y på leiligheter. x = areal (18) y = pris (i 1000 NOK) (19) Eiendomsfirmaet solgte n = 6 leiligheter i mars. Areal og pris for disse leilighetene er oppsummert i tabellen i figur (11): x (areal i m 2 ) 43 60 75 80 95 105 y pris ( i 1000 NOK ) 2100 2850 3050 3800 4525 4500 Figur 11: Areal x og pris y. PS: Man kan fint løse denne oppgaven kun ved bruk av vanlig kalkulator. Uten bruk av Excel. Men denne oppgaven er et eksempel på at et dataprogram som f.eks. Excel kan brukes i statistikksammenheng. Derfor er det laget en Excel-fil: 007 Oppg. 6, øving 7, pris-areal, (4. april 2014).xlsx som ligger på himoldex.no. Last den gjerne ned. Selv om denne Excel-filen er frivillig å bruke kan det være en fin måte å sjekke dine svar på i denne oppgaven. I tillegg så illustrerer det, til en viss grad, nytten av dataprogrammer innen statistikk. Figur 12: Areal og pris. 15

a) Hva er gjennomsnittlig areal x av leilighetene? Og gjennomsnittspris y? b) Hva er den empiriske variansen for arealet x, dvs. hva er S 2 x? Og for prisen, S 2 y? c) Hva er den empiriske } kovariansen {{} mellom x og y, dvs. hva er S xy? samvariasjon d) Finn minste kvadraters regresjonslinje for x og y. 24 e) Den største leiligheten i tabell (11) er bare 105 m 2. Dersom eiendomsmeglerfirmaet ønsker å estimere hvor mye en leilighet på f.eks. 140 m 2 vil koste så kan de bruke den estimerte modellen fra oppgave d, altså regresjonslinjen. Hvor mye predikerer regresjonslinjen at en leilighet på 140 m 2 vil koste? For å finne forklaringskraften R 2 kan man f.eks. bruke Excel istedet for å regne ut R 2 for hånd via definisjonen. f) Finn forklaringsstyrken uten å gjøre noe regning for hånd. Bare les av fra Excel-utskriften i figur (13) på neste side. 25 g) Kommenter svaret i oppgave f. 26 24 Bruk formelsamlnigen! 25 Hint: Se side 301 i kompendiet. 26 For et gitt areal, vi du si at regresjonslinjen predikerer prisen i stor eller liten grad? Med stort eller lite presisjonsnivå? 16

Figur 13: Utskrift fra Excel. h) Bruk Excel til å plotte regresjonslinjen fra oppgave 6d. Skriv ut ditt Excel-plott og legg ved i din innlevering. Din Excel-utskrift skal se omtrent ut som figur (14), men med regresjonslinjen fra oppgave 6d. 27 PS: Usikker på hvordan man lager regresjonsplott i Excel? Se kortvideo på himoldex.no. Figur 14: Excel. 27 Tittel på x-aksen kan f.eks. være Areal (i m 2 ). Tittel på y-aksen kan f.eks. være Pris (i 1000 NOK). 17

LØSNING: Oppgavesett nr. 1 MAT110 Statistikk 1, 2014 Oppgave 1: ( kovarians ) a) For å regne ut standardavviket S x trenger vi gjennomsnittet x: x = 1 4 4 i=1 x i = 71+47+23+27 4 = 42 (1) Standardavviket S x er da: S x = S 2 x = 1 4 1 (2) 4 (x i x) 2 (3) i=1 = (71 42)2 +(47 42) 2 +(23 42) 2 +(27 42) 2 4 1 = 22 (4) For å regne ut standardavviket S y trenger vi gjennomsnittet ȳ: ȳ = 1 4 4 i=1 y i = 58+106+154+146 4 = 116 (5) 1

Standardavviket S y er da: S y = = S 2 y 1 4 1 (6) 4 (y i ȳ) 2 (7) i=1 = (58 116)2 +(106 116) 2 +(154 116) 2 +(146 116) 2 4 1 = 44 (8) Kovariansen er: S xy = = 1 4 1 1 4 1 4 (x i x)(y i ȳ) (9) i=1 [ (71 42)(58 116) +(47 42)(106 116) ] +(23 42)(154 116)+(27 42)(146 116) (10) = 968 (11) Vi kjenner nå S xy, S x og S y. Dermed kan vi regne ut korrelasjonskoeffisienten R xy : R xy = S xy S x S y (12) = 968 22 44 = 1 (13) 2

b) Siden R xy = 1 er det en linær sammenheng mellom pris og etterspørsel. (Se på figur 1.12 i forelesningsnotatene.). Dermed kan vi velge to (vilkårlige) punkt x = x 1,y = y 1 og x = x 2,y = y 2 fra tabellen i oppgavesettet, f.eks. x 1 = 71, y 1 = 58 og x 2 = 47, y 2 = 106. Dette innsatt i topunktformelen gir: y y 1 = y 2 y 1 x 2 x 1 (x x 1 ) (14) y 58 = 106 58 (x 71) (15) 47 71 y = 2x+200 (16) c) Fra oppgave b vet vi at det er en lineær sammenheng mellom pris og etterspørsel. Derfor er det figur A (17) som potensielt kan beskrive sammenhengen mellom pris og etterspørsel for dataene i tabellen. 3

Oppgave 2: ( aksjeanalyse ) a) Gjennomsnittet ā og b: ā = 1 5 b = 1 5 5 i=1 5 i=1 a i = 110+103+108+103+114 5 b i = 152+137+169+137+154 5 NOK = 107.6 NOK (18) NOK = 149.8 NOK (19) b) Plott av a i og b i : ( i = 1,2,3,4,5 ) a, b ( aksjekurser, NOK ) 170 150 b i 130 110 a i 90 70 ( måned nr. ) i 1 2 3 4 5 c) i) Av figuren ser vi at aksjekursene til selskapet BETA (blå kurve) varierer mest. Derfor er BETA mest usikker. 4

d) i) Varians: S 2 a = 1 5 1 5 (a i ā) 2 i=1 = (110 107.6)2 +(103 107.6) 2 +(108 107.6) 2 +(103 107.6) 2 +(114 107.6) 2 5 1 = 22.3 NOK 2 NOK 2 S 2 b = 1 5 1 5 (b i b) 2 i=1 = (152 149.8)2 +(137 149.8) 2 +(169 149.8) 2 +(137 149.8) 2 +(154 149.8) 2 5 1 = 179.7 NOK 2 NOK 2 ii) Siden Sb 2 > S2 a så ser vi at dette stemmer med den grafiske konklusjonen fra oppgave c i). e) i) Kovarians: S ab = = 1 5 (a i ā)(b i b) (20) 5 1 i=1 [ 1 (110 107.6)(152 149.8) +(103 107.6)(137 149.8) 5 1 +(108 107.6)(169 149.8) +(103 107.6)(137 149.8) ] + (114 107.6)(154 149.8) NOK 2 (21) = 39.4 NOK 2 (22) 5

ii) Dermed blir korrelasjonskoeffisienten R ab : R ab = S ab S a S b = 39.4 NOK 2 22.3 NOK 2 179.7 NOK 2 = 0.62 (23) iii) Korrelasjonskoeffisienten har ingen benevning. Den er benevningsløs. Lign.(23) er et eksempel som illustrerer dette. iv) Siden R ab er positiv, dvs. R ab > 0, så er det positiv korrelasjon. Dvs., til en viss grad, så hører store a sammen med store b. Dvs., til en viss grad, er det en positiv lineær sammenheng mellom a og b. 6

Oppgave 3: ( korrelasjonskoeffisient - et mål på lineær sammenheng ) Figur 1: Sammenhenger mellom aksjene. 7

Oppgave 4: ( Venn-diagram ) a) Figur 2: Venn-diagram for P(A B). b) Figur 3: Venn-diagram for P(A B C). 8

Oppgave 5: ( disjunkte begivenheter ) a) Venn-diagram for disjunkte begivenheter: A B A og B =. A og B inntreffer aldri samtidig. ingen felles elementer Figur 4: A og B er disjunkte. b) Den spesielle addisjonssetningen sier at dersom to begivenheter disjunkte, dvs. A }{{} B =, så gjelder P(A B) = P(A)+P(B). La oss derfor regne ut denne: og }{{} eller P(A B) = =0.6 P(A) + =0.5 P(B) = 1.1 (ulovlig verdi) (24) Dette er en ulovlig verdi. A og B kan derfor ikke være disjunkte. 9

LØSNING: Oppgavesett nr. 2 MAT110 Statistikk 1, 2014 Oppgave 1: ( regnskap ) Før man starter å løse oppgaven kan det lønne seg å visualisere A og B: Figur 1: Indikasjon av begivenhetene A og B. a) En gyldig sannsynlighetsfordeling må være riktig normert: 6 i=1 p i = 0.10+0.30+0.25+0.20+0.10+0.05 = 1 (1) b) i) Sannsynligheten P(A): 1 P(A) = 0.30+0.25+0.20+0.10+0.05 = 0.90 (2) ii) Tolking: P(A) = sannsynligheten for A = sannsynligheten for et vilkårlig trukket Statoil-regnskap skal ha (3) bilag som inneholder minst 1 feil, dvs. 1 feil eller mer. 1 Alle tall som er innenfor for den røde linjen i tabellen, se tabellen i figur (1). 1

c) i) Sannsynligheten P(A): 2 P(A) = 0.10 (4) siden A tilsvarer at det er 0 feil i bilaget for et tilfeldig valgt Statoil-regnskap. ii) Komplementsetningen gir: P(A) = 1 =0.90 P(A) = 1 0.90 = 0.10 (5) iii) Tolking: P(A) = sannsynligheten for ikke A = sannsynligheten for et vilkårlig trukket Statoil-regnskap skal ha bilag som inneholder 0 feil, altså kun feilfrie bilag i et tilfeldig valgt Statoil-regnskap (6) d) i) Sannsynligheten P(B): 3 P(B) = 0.10+0.30+0.25+0.20 = 0.85 (7) siden B tilsvarer mindre enn 10 feil i bilaget for et tilfeldig valgt Statoil-regnskap. ii) Tolking: P(B) = sannsynligheten for B = sannsynligheten for et vilkårlig trukket Statoil-regnskap skal ha bilag som inneholder mindre enn 10 feil (8) 2 Alle tall som er UTENFOR den røde linjen i tabellen, se tabellen i figur (1). 3 Alle tall som er innenfor for den blå linjen i tabellen, se tabellen i figur (1). 2

e) i) Sannsynligheten P(B): 4 P(B) = 0.10+0.05 = 0.15 (9) siden B tilsvarer at det er 10 eller flere feil i bilaget for et tilfeldig valgt Statoil-regnskap. ii) Komplementsetningen gir: P(B) = 1 =0.85 P(B) = 1 0.85 = 0.15 (10) iii) Tolking: P(B) = sannsynligheten for ikke B = sannsynligheten for et vilkårlig trukket Statoil-regnskap skal ha bilag som inneholder 10 feil eller mer f) i) Ut fra tabellen i figur (1) ser vi at A eller B inkluderer hele utfallsrommet: P(A eller B) = 0.10+0.30+0.25+0.20+0.10+0.05 = 1 (11) ii) Tolking: P(A eller B) = sannsynligheten for A eller B = sannsynligheten for et vilkårlig trukket Statoil-regnskap skal ha bilag som inneholder 0 feil eller mer, (altså det inkluderer alle mulige Statoil-regnskap) (12) 4 Alle tall som er UTENFOR den blå linjen i tabellen, se tabellen i figur (1). 3

g) i) Siden vi kjenner P(A), P(B) og P(A B) så kan vi bruke den generelle addisjonssetningen: eller P(A og B) = =0.90 P(A) + =0.85 P(B) =1 P(A B) (13) }{{} eller = 0.90 + 0.85 1 = 0.75 (14) Eventuelt kunnevi ogsåfinne P(A og B)vedåsepånårAogBifigur (1)OVERLAPPER: P(A og B) = 0.30+0.25+0.20 = 0.75 (15) ii) Uttrykke sannsynligheten P(A B) med ord: P(A og B) = sannsynligheten for A og B = sannsynligheten for et vilkårlig trukket Statoil-regnskap skal ha bilag som inneholder mellom 1 og 9 feil (16) Figur (1) kan være til hjelp for å innse dette (overlapp mellom A og B). 4

Oppgave 2: ( økonomi, fond ) a) Vi skal trekke 10 fond ut av 75. rekkefølgen spiller ingen rolle, dvs. det er ikke-ordnet utvalg når et fond er valgt så legges det ikke tilbake Alt i alt, ikke-ordnede kombinasjoner u/tilbakelegging: situasjon 3. b) Fra formelsamlingen og kompendiet vet vi at antall kombinasjoner for et ikke-ordnet utvalg u/tilbakelegging er gitt ved binomialkoeffisienten: ( N = 75, s = 10 ) antall mulige komb. = ( ) N s = ( ) 75 10 = 75! (75 10)! 10! (17) kalkis = 828931106355 8.29 10 11 (18) c) i) Sannsynligheten for at et bestemt fond, f.eks. det beste (eller det 21. beste fondet), er med blant finansforetakets s = 10 valg: P(beste fondet) = antall gunstige kombinasjoner for å få det beste fondet antall mulige kombinasjoner totalt ( ) ( ) 75 1 74 (19) = 10 1 ( ) = 75 10 9 ( 75 10 ) kalkis = 2 15 0.133 (20) 5

ii) Sannsynligheten for at et bestemt fond, uansett hvilket fond det skulle være, er med blant finansforetakets s = 10 valg finnes samme metode som i forrige deloppgave. Derfor: P(21. beste fond) = P(beste fond) = 2 15 0.133 (21) d) i) Sannsynligheten for at to bestemte fond, f.eks. de to beste, er med blant mine s = 10 valg: P(2 beste fond) = antall gunstige kombinasjoner for å få de 2 beste fondene antall mulige kombinasjoner totalt ( ) ( ) 75 2 73 (22) = 10 2 ( ) = 75 10 8 ( 75 10 ) kalkis = 3 185 1.62 10 2 = 0.0162 ii) Sannsynligheten for at to bestemte fond, uansett hvilke to fond det skulle være, er med blant mine s = 10 valg finnes samme metode som i forrige deloppgave. Derfor: P(7. beste og 19. beste fondet) = P(2 beste fondene) (23) kalkis = 3 185 1.62 10 2 = 0.0162 (24) 6

Oppgave 3: ( korrelasjonskoeffisient ) a) Korrelasjonskoeffisienten R xy er en normalisert 5 versjon av S xy. Verdimengde for korrelasjonskoeffisienten R xy er: 1 R xy 1 (25) b) Den empiriske kovariansen S xy kan, i prinsippet, ha alle mulige reelle verdier. 6 c) At R xy er enhetsuavhengig/dimensjonsløs betyr at man får samme numeriske verdi for R xy uansett hva slags enhet/benevning man bruker for å regne ut S xy, S x og S y. d) R xy er et mål på grad av lineær sammenheng. e) Når R xy har sin største verdi, dvs. R xy = 1, så er det en eksakt lineær sammenheng mellom x og y. Stigningstallet til denne rette linjen 7 er positivt. f) Dersom R xy = 0 så er det ingen korrelasjon mellom x og y. De er ukorrelerte. g) Når R xy har sin minste verdi, dvs. R xy = 1, så er det en eksakt lineær sammenheng mellom x og y. Stigningstallet til denne rette linjen er negativt. 5 Legg merke til begrepet normalisert. R xy har en endelig og begrenset verdimengde. Den kan ikke ha hva slags verdier som helst. For R xy sitt tilfelle er den begrenset til 1 R xy 1. 6 Matematisk kan man skrive S xy R. 7 En lineær funkjon er på formen: y = ax + b. 7

Oppgave 4: ( korrelasjonskoeffisient - et mål på lineær sammenheng ) Figur 2: Sammenhenger mellom x og y. 8

Oppgave 5: ( økonomi ) a) i) Tolking: P(A eller B) = sannsynligheten for A eller B (26) = sannsynligheten for at bedrift A eller B skal gå med underskudd ii) Siden vi kjenner P(A), P(B) og P(A og B) så kan vi bruke den generelle add.-setningen: P(A eller B) = =0.30 P(A) + =0.50 P(B) =0.20 P(A }{{} B) = 0.30 + 0.50 0.20 = 0.60 (27) og b) i) Tolking: P(A eller C) = sannsynligheten for A eller C (28) = sannsynligheten for at bedrift A eller C skal gå med underskudd ii) Siden vi kjenner P(A),P(C) ogp(a og C) så kan vi bruke den generelle add.-setningen: P(A eller C) = =0.30 P(A) + =0.10 P(C) =0.01 P(A }{{} C) = 0.30 + 0.10 0.01 = 0.39 (29) og c) i) Tolking: P(A C) = sannsynligheten for verken A eller C (30) = sannsynligheten for at verken bedrift A eller C skal gå med underskudd = sannsynligheten for at bedrift A og C skal gå med overskudd (31) 9

ii) Komplementsetningen gir: P(A C) = 1 =0.39 P(A C) = 1 0.39 = 0.61 (32) }{{} eller d) i) Tolking: P(C B) = sannsynligheten for C og ikke B (33) = sannsynligheten for at bedrift C går med underskudd og bedrift B IKKE går med underskudd = sannsynligheten for at bedrift C går med underskudd (34) og bedrift B går med overskudd ii) Total sannsynlighet: 8 P(C) }{{} =0.10 = =0.10 P(C B) }{{} =P(B C) + P(C B) (35) Løser med hensyn på P(C B) alene: P(C B) = =0.10 P(C) =0.10 P(C B) }{{} =P(B C) = 0.10 0.10 = 0 (36) 8 Se formelsamling eller kompendium. 10

Oppgave 6: ( logistikk ) a) Matematisk formulering: P(O 1 ) = 0.6 (37) P(O 2 ) = 0.7 (38) P(O 1 O 2 ) = 0.45 (39) b) Vi skal finne eller sannsynligheten P(O 1 O 2 ). Siden den generelle addisjonssetningen gir sammenhengen mellom og og eller sannsynlighetene så er det naturlig å bruke den: P(O 1}{{} O 2 ) = og =0.6 P(O 1 ) + =0.7 P(O 2 ) skal finne P(O 1 O 2 ) (40) }{{} eller som gir P(O 1 eller O 2 ) = =0.6 P(O 1 ) + =0.7 P(O 2 ) =0.45 P(O 1}{{} O 2 ) (41) og = 0.6+0.7 0.45 = 0.85 (42) c) Vi skal finne P(O 1 O 2 ). Fra oppgave b vet vi at P(O 1 O 2 ) = 0.85. Dermed kan vi bruke komplementsetningen: 9 P(O 1 O 2 ) = 1 =0.85 P(O 1 O 2 ) (43) = 1 0.85 = 0.15 (44) 9 Legg merke til at når man bruker komplementsetningen så må HELE uttrykket være ikke, dvs. strek over. 11

d) Siden P(O 1 O 2 ) = P(O 1 O 2 ), så kan vi bruke den ene tvillingsetningen: P(O 1 O 2 ) = P(O 1 O 2 ) tv. setn. = 1 =0.85 P(O 1 O 2 ) (45) = 1 0.85 = 0.15 (46) siden vi fra oppgave b vet at: P(O 1 O 2 ) = 0.85. Samme svar som i oppgave c, selvfølgelig. e) Vi skal finne P(O 1 O 2 ). Fra oppgave b vet vi at P(O 1 O 2 ) = 0.45. I tillegg er P(O 1 ) = 0.6 oppgitt i oppgaven. Dermed kan vi bruke setningen om total sannsynlighet: =0.6 P(O 1 ) total = skal finne P(O 1 O 2 ) + =0.45 P(O 1 O 2 ) (47) som gir P(O 1 O 2 ) = =0.6 P(O 1 ) =0.45 P(O 1 O 2 ) (48) = 0.6 0.45 = 0.15 (49) f) Vi skal finne: P((O 1 O 2 ) (O 1 O 2 )) (50) La oss bruke den generelle addisjonssetningen på lign.(50): P((O 1 O 2 ) (O 1 O 2 )) add. setn. = P(O 1 O 2 ) + P(O 1 O 2 ) (51) P((O 1 O 2 ) (O 1 O 2 )) }{{} = 0 12

Ut fra Venn-diagrammet i figur (3), se nederst på siden, ser vi at det ikke er noe overlapp. Derfor er og sannsynligheten lik null: ( ) P (O 1 O 2 ) (O 1 O 2 ) = 0 (52) Dersom vi bruker setningen om total sannsynlighet på P(O 1 O 2 ) og P(O 1 O 2 ) i lign.(51). Da får man: P((O 1 O 2 ) (O 1 O 2 )) Eq.(51) = total = P(O 1 ) P(O 1 O 2 ) P(O 1 O 2 ) + total = P(O 2 ) P(O 1 O 2 ) P(O 1 O 2 ) 0 (53) = P(O 1 ) P(O 1 O 2 ) + P(O 2 ) P(O 1 O 2 ) (54) = P(O 1 ) }{{} = 0.6 + P(O 2 ) }{{} = 0.7 2 P(O 1 O 2 ) }{{} = 0.45 (55) = 0.6 + 0.7 2 0.45 = 0.4 (56) Figur 3: Ingen overlapp, derfor er: P((O 1 O 2 ) (O 1 O 2 )) = 0. 13

LØSNING: Oppgavesett nr. 3 MAT110 Statistikk 1, 2014 Oppgave 1: ( økonomi ) a) To begivenheter A og B er uavhengige dersom P(A B) = P(A) (1) b) Siden S 1 og S 2 antas å være uavhengige begivenheter så gjelder ligningen som oppgitt i fotnoten i oppgaven, dvs. den spesielle multiplikasjonssetningen: P(S 1 S 2 ) uavh. = P(S 1 ) P(S 2 ) = 1 6 1 6 = 1 36 ( 0.028) (2) c) Den generelle addisjonssetningen gjelder alltid 1. Den gir sammenhengen mellom og og eller sannsynligheter. Siden vi kjenner og sannsynligheten fra oppgave a så har vi alle størrelsene vi trenger for å regne ut eller sannsynligheten: P(S 1 S 2 ) = P(S 1 )+P(S 2 ) = 1 36 P(S 1 S 2 ) (3) = 1 6 + 1 6 1 36 = 11 36 ( 0.306) (4) 1 Med dette så menes at det ikke er noen spesielle forutsetninger som må være oppfylt for at den skal gjelde. 1

d) Metode 1: 2 Siden S 1 og S 2 antas å være uavhengige begivenheter så gjelder ligningen som oppgitt i fotnoten i oppgaven, dvs. den spesielle multiplikasjonssetningen: P(S 1 S 2 ) uavh. = P(S 1 ) = 1 P(S 2 ) P(S 2 ) (5) = P(S 1 ) (1 P(S 2 )) (6) = ( 1 6 1 1 ) 6 = 5 36 ( 0.139) (7) Metode 2: Total sannsynlighet: P(S 1 ) }{{} = 1 6 = P(S 1 S 2 )+P(S 1 S 2 ) }{{} = 1 36 (8) Løser med hensyn på P(S 1 S 2 ) alene: P(S 1 S 2 ) = P(S 1 ) P(S 1 S 2 ) (9) = 1 6 1 36 = 5 36 ( 0.139) (10) som gir samme svar som i lign.(7), selvsagt. måte. 2 I dette løsningsforslaget løses oppgaven på to forskjellige måter. Men det er nok at man løser oppgaven kun en 2

e) Sannsynligheten for at det snør dag nr. 2 gitt at det snødde dag nr. 1 finnes ved å bruke den generelle multiplikasjonssetningen: 3 P(S 2 S 1 ) = P(S 1 S 2 ) P(S 1 ) = 1 15 1 6 = 2 5 = 0.4 (11) f) Begivenheten S 1 S 2 S 3 betyr at det snør både dag 1, dag 2 og dag 3. g) Multiplikasjonssetningen anvendt på P(S 1 S 2 S 3 ) gir: 4 P(S 1 S 2 S 3 ) = P(S 3 S 2 S 1 ) (13) = P(S 3 S 2 S 1 )P(S 2 S 1 ) (14) Multiplikasjonssetningen anvendt på P(S 2 S 1 ) gir: P(S 1 S 2 S 3 ) = P(S 3 S 2 S 1 )P(S 2 S 1 ) (15) = P(S 3 S 2 S 1 ) P(S }{{} 2 S 1 ) P(S }{{} 1 ) }{{} = 0.6 = 0.4 = 1 6 = 0.6 0.4 1 6 (16) = 0.04 (17) hvor P(S 3 S 2 S 1 ) = 0.6 var oppgitt i oppgaven, P(S 2 S 1 ) = 0.4 fant vi i oppgave e og P(S 1 ) = 1 var også oppgitt i oppgaven. 6 3 Siden S 1 og S 2 er avhengige så gjelder ikke den spesielle multiplikasjonssetningen. 4 I formelsamlingen/kompendiet er multiplikasjonssetningen formulert på følgende måte: I lign.(14) anvender vi denne ligningen med A = S 3 og B = S 2 S 1. P(A B) = P(A B)P(B) (12) 3

Oppgave 2: ( økonomi, strategisk oppkjøp ) a) Sannsynligheten at Sparebanken Møre skal = K kjøpe ELMO Teknikk AS er 10 %: P(K) = 0.10 (18) Dersom Sparebanken Møre kjøper ELMO, er sannsynligheten for at verdien til ELMO }{{} øker 50 % = I P(I K) = 0.50 (19) Dersom Sparebanken Møre ikke kjøper ELMO, er sannsynligheten for at verdien til ELMO }{{} øker 20 % = I P(I K) = 0.20 (20) b) Total sannsynlighet: P(I) total = P(I K) P(K) }{{} =0.50 =0.10 + P(I K) }{{} =0.20 P(K) }{{} =1 P(K) (21) = 0.10 0.50 + (1 0.10) 0.20 (22) = 0.23 (23) 4

c) Baye s lov: P(K I) Baye = =0.50 P(I K) =0.10 P(K) P(I) }{{} =0.23 (24) = 0.50 0.10 0.23 (25) = 0.2174 (26) 5

Oppgave 3: ( økonomi, fond ) a) Sannsynligheten for at alle s = 10 fondene er = 10+5 = 15 god eller svært god er: P( god eller svært god ) = antall gunstige kombinasjoner antall mulige kombinasjoner totalt ( ) 15 (27) = 10 ( ) 3.62 10 9 (28) 75 10 b) Sannsynligheten for å trekke 4 er: = 15 totalt = 10 totalt middels fond, 3 gode fond og 3 = 5 totalt svært gode fond, P(mix) = = antall gunstige kombinasjoner antall mulige kombinasjoner totalt (29) ( )( )( ) 15 10 5 4 3 3 ( ) 75 2.0 10 6 (30) 10 Kommentar: 1) Legg merke til at ELLER er assosiert med pluss, +. 2) Legg merke til at OG er assosiert med gange,. 6

c) Sannsynlighet for at alle de s = 10 tilfeldig valgte fondene skal oppnå resultater som er middels eller dårligere: }{{} 25+20+15 = 60 P(middels eller dårligere) = antall gunstige kombinasjoner antall mulige kombinasjoner totalt ( ) 60 (31) = 10 ( ) 0.091 75 (= 9.1%) (32) 10 7

d) i) Sannsynlighet for at minst 1 av de 10 tilfeldig valgte fondene skal være svært god : =70 totalt P(minst 1 fond svært godt ) = 1 P( ingen fond svært god ) (33) = 1 antall gunstige kombinasjoner antall mulige kombinasjoner totalt ( ) 70 (34) = 1 10 ( ) 0.52 75 (= 52%) (35) 10 i) Det er bare 15 fond som er gode eller svært gode. Men det er hele 70 fond som er i kategorien ingen fond svært gode. Det forklarer hvorfor = 70 totalt 1 P(ingen fond svært godt ) }{{} 0.52 = 15 totalt P( god eller svært god ) (36) }{{} 3.62 10 9 Figur 1: Det er bare 15 fond som er gode eller svært gode. Men det er hele 70 fond som er i kategorien ingen fond svært gode 8

Oppgave 4: ( investering ) a) Sannsynlighetstre som beskriver situasjonen for investering: Figur 2: Sannsynlighetstre som beskriver situasjonen for investering i fond. La oss definere: N = norske fond F aks = aksjefond F obl = obligasjonsfond b) i) Metode 1: ( grafisk ) Sannsynlighetstreet i figur (2) er en visuell fremstilling av opplysningene. Med en slik fremstilling er det lettere å se at: P(N) = 0.60 0.30 + 0.40 0.80 = 0.5 (37) 9

ii) Metode 2: ( ved regning ) Hele sannsynlighetsrommet er Ω = F aks F obl. Sannsynlighetsrommet er altså delt i to, aksjer og obligasjoner. Figur (3) illustrerer det faktum at det ikke er noen overlapp mellom F aks og F obl. Dermed er F aks F obl =, dvs. disjunkte. Figur 3: Oppsplitting av sannsynlighetsrom Ω. Da gjelder formel for total oppsplitting: ( se formelsamling/kompendiet ) P(N) = P(N F aks ) + P(N F obl ) (38) For høyre side av denne ligningen kan vi bruke multiplikasjonssetningen P(A B) = P(A B) P(B): P(N) = = =P(N F aks ) P(F aks ) P(A F aks ) + =0.30 =0.60 P(N F aks ) P(F aks ) + =P(B F obl ) P(F obl ) P(N F obl ) (39) =0.80 P(N F obl ) =0.40 P(F obl ) (40) = 0.30 0.60 + 0.80 0.40 = 0.50 (41) 10

c) Fra oppgave b) kjenner vi P(N) = 0.50. I tillegg ser vi f.eks. fra figur (2) at: P(N F aks ) = 0.60 0.30 = 0.18 (42) Dermed kan vi benytte multiplikasjonssetningen: 5 P(F aks N) = =0.18 P(F aks N) P(N) }{{} =0.50 = 0.18 0.50 = 0.36 (43) 5 Husk at: P(F aks N) = P(N F aks ) 11

Oppgave 5: ( økonomi, konkursobjekter ) a) Komplementsetningen for P(objekt K): P(objekt K) = 1 =0.95 P(objekt K) = 1 0.95 = 0.05 (44) b) Formelen for total oppsplitting: ( se formelsamling/kompendiet ) P(objekt) = =0.05 P(objekt K) = 1 P(K)=0.90 P( K) + =0.80 =0.10 P(objekt K) P(K) (45) = 0.05 0.90 + 0.80 0.10 = 0.125 (46) c) i) Antall bedrifter som klassifiseres som objekt konkursobjekt ifølge modellen til KPMG: # objekter i 2009 ifølge KPMG = P(objekt) (# bedrifter i M&R) }{{} = 0.125 = 1490 (47) = 0.125 1490 = 186 (48) ii) Antall bedrifter som forventes å gå konkurs ifølge modellen til KPMG: # konkurser i 2009 ifølge KPMG = P(K) (# bedrifter i M&R) }{{} = 0.10 = 1490 (49) = 0.10 1490 = 149 (50) 12

d) Bayes formel: P(K objekt) = =0.80 P(objekt K) =0.10 P(K) P(objekt) }{{} =0.125 = 0.80 0.10 0.125 = 0.64 (51) Konklusjon: Det er 64% sannsynlighet for at en bedrift som av KPMG-modellen klassifiseres som konkursobjekt, faktisk går konkurs. 13

Oppgave 6: ( logistikk, nulltoleranse ) a) Sannsynlighetsopplysningene til løgndetektoren på matematisk form : P(L S S) = 0.90 (52) P(L U U) = 0.99 (53) b) Sannsynligheten for justismord P(L S U): ( bruker komplementsetningen ) P(L S U) kompl. = 1 P(L S U) (54) = 1 P(L U U) }{{} =0.99 (55) = 1 0.99 = 0.01 (= 1%) (56) c) Sannsynligheten for at sjåføren overvinner løgndetektoren P(L U S): ( bruker komplementsetningen ) P(L U S) kompl. = 1 P(L U S) (57) = 1 P(L S S) }{{} =0.90 (58) = 1 0.90 = 0.10 (= 10%) (59) 14

d) Sannsynligheten for at en tilfeldig valgt person fra denne gruppen er uskyldig : ( bruker komplementsetningen ) P(U) kompl. = 1 P(U) (60) = 1 P(S) }{{} =0.10 = 1 0.10 = 0.90 (61) e) Sannsynligheten for at løgntetektoren skal vise skyldig dersom en tilfeldig person velges fra gruppen med 10% skyldige : ( bruker formelen for oppslitting av Ω ) P(L S ) oppspl. Ω = P(L S S) P(S) + P(L S U) P(U) (62) = P(L S S) P(S) }{{} =0.90 0.10 + P(L S U) }{{} =0.01 P(U) }{{} =0.90 (63) = 0.90 0.10 + 0.01 0.90 = 0.099 (= 9.9%) (64) f) Sannsynligheten for at løgndetektoren skal vise uskyldig dersom en tilfeldig person velges fra denne gruppen: ( bruker komplementsetningen ) P(L U ) = 1 P(L U ) (65) = 1 P(L S ) }{{} =0.099 = 1 0.099 = 0.901 (66) 15

g) Sannsynligheten for at personen er uskyldig dersom løgndetektoren viser uskyldig : ( bruker Bayles lov ) P(U L U ) Baye P(U) = P(L U U) P(L U ) (67) =0.90 P(U) = P(L U U) }{{} P(L U ) =0.99 }{{} =0.901 (68) = 0.99 0.90 0.901 0.9889 (69) 16

LØSNING: Oppgavesett nr. 4 MAT110 Statistikk 1, 2014 Oppgave 1: ( Sport Management, økonomi, bonus ) a) Siden X har et tellbart antall verdier så er den en diskret stokastisk variabel. b) i) Tolkning: E[X] = forventet antall mål som scores av Tufte IL i løpet av tilfeldig valgt kamp (1) ii) Forventning: E[X] def. = 7 x i P(X = x i ) i=0 = 0 0.10+1 0.25+2 0.20+3 0.20+4 0.15+5 0.05+6 0.05+7 0.05 = 2.6 (2) c) i) Tolkning: V ar[x] = forventet variasjon/spredning av antall mål som scores av Tufte IL i løpet av tilfeldig valgt kamp (3) 1

ii) Varianssetningen gir: 1 Var[X] var.setn. = E[X 2 ] E[X] 2 (4) Vi kjenner E[X] fra oppgave b, men mangler E[X 2 ]. Den må vi regne ut: E[X 2 ] def. = 7 i=0 x 2 i P(X = x i) = 0 2 0.10+1 2 0.25+2 2 0.20+3 2 0.15+4 2 0.15+5 2 0.05+6 2 0.05+7 2 0.05 = 10.3 (5) Dette innsatt i variasjonssetningen : Var[X] = E[X 2 ] E[X] 2 = 10.3 (2.6) 2 = 3.54 (6) Alternativt kunne vi også bruke definisjonen av varians direkte. Det gir selvfølgelig samme svar. d) Standardavviket er: σ[x] def. = Var[X] = 3.54 (7) 1 Se formelsamling! 2

e) Sannsynligheten for at Tufte IL scorer mindre enn 4 mål i en kamp = P(X < 4): P(X < 4) = P(X = 0)+P(X = 1)+P(X = 2)+P(X = 3) = 0.10+0.25+0.20+0.15 = 0.70 (8) P(X < 4) er en kumulative sannsynligheten. f) i) Siden antall mål som scores i ulike kamper er uavhengige så er: sannsynligheten for at det scores mindre enn 4 mål i både kamp nr. 7 og kamp nr. 24 = (9) sannsynligheten for at det scores mindre enn 4 mål i hvilke som helst to bestemte kamper La A <4 være begivenheten at det scores mindre enn 4 mål i en hvilken som helst bestemt kamp. La videre A 7 <4 være begivenheten at det scores mindre enn 4 mål i kamp nr. 7. Siden, per antagelse, antall mål som scores i ulike kamper er uavhengige så gjelder den spesielle multiplikajonssetningen 2. Alt i alt: ( = og ) P(A 7 <4 A24 <4 ) lign.(9) = P(A <4 A <4 ) spes. mult. = P(A <4 ) P(A <4 ) = 0.70 0.70 = 0.49 (10) ii) Pga. lign.(9) så gjelder lign.(10) for hvilken som helst to bestemte kamper. Spesielt så gjelder det for to kamper på rad: ( n = 1,2,3...,28 ) P(A n <4 An+1 <4 ) = 0.49 (11) 2 Se formelsamling! 3

g) i) Som nevnt i forrige oppgave, å se på kamp nr. 15 og 19 er det samme som å se på hvilken som helst to bestemte kamper. At summen av antall mål skal bli 4 kan fås på 5 forskjellige måter: 5 måter (4,0), (0,4), (3,1), (1,3), (2,2) (12) Dersom vi definerer A m = begivenheten at det scores m antall mål en bestemt kamp, så er lign.(12) det samme som: ( = og ) 5 måter A 4 A 0, A 0 A 4, A 3 A 1, A 1 A 3, A 2 A 2 (13) Sannsynligheten av denne er: ( = eller ) P[ (A 4 A 0 ) (A 0 A 4 ) (A 3 A 1 ) (A 1 A 3 ) (A 2 A 2 ) ] (14) Siden ingen av de 5 begivenhetene i Eq. (13) kan inntreffe samtidlig, så er de disjunkte. Dermed kan vi bruke den spesielle addisjonssetningen: P[(A 4 A 0 ) (A 0 A 4 ) (A 3 A 1 ) (A 1 A 3 ) (A 2 A 2 )] add. = P(A 4 A 0 ) + P(A 0 A 4 ) + P(A 3 A 1 ) + P(A 1 A 3 ) + P(A 2 A 2 ) (15) Siden, per antagelse, antall mål som scores i ulike kamper er uavhengige så gjelder den spesielle multiplikajonssetningen 3. Dermed: P[(A 4 A 0 ) (A 0 A 4 ) (A 3 A 1 ) (A 1 A 3 ) (A 2 A 2 )] mult. = P(A 4 ) P(A 0 ) + P(A 0 ) P(A 4 ) + P(A 3 ) P(A 1 ) + P(A 1 ) P(A 3 ) All disse sannsynlighetene på høyre side av lign.(16) er oppgitt i tabellen. + P(A 2 ) P(A 2 ) (16) 3 Akkurat slik som vi gjorde i oppgave e). 4

P[ (A 4 A 0 ) (A 0 A 4 ) (A 3 A 1 ) (A 1 A 3 ) (A 2 A 2 )] = 0.15 0.10 + 0.10 0.15 + 0.15 0.25 + 0.25 0.15 + 0.20 0.20 = 0.145 (17) ii) I urnemodellen er det samme sannsynlighet (uniform sannsynlighetsfordeling) for å trekke de forskjellige kulene (=begivenhetene) fra urnen. Her, i vår oppgave, så har våre 5 mulige måter å oppnå en 4-målsbegivenhet på Derfor kan vi ikke bruke formelen forskjellige sannsynligheter 4 P(A) = antall gunstige kombinasjoner for A antall mulige kombinasjoner totalt (18) 4 F.eks. P(A 4 A 0 ) = 0.15 0.10 = 0.015, mens P(A 2 A 2 ) = 0.20 0.20 = 0.040 5

h) B er en stokastisk variabel fordi den er en funksjon av X, hvor X er en stokastisk variabel. 5 i) i) Tolkning: E[B] = forventet utbetalt bonus for en tilfeldig valgt kamp ii) Forventet bonus per kamp: E[B] = = 7 b i P(B = b i ) i=0 7 c x 3 i P(X = x i ) ( P(X = x i ) = P(B = b i ) i=0 dvs. X og B har samme sanns. fordeling ) 7 = c x 3 i P(X = x i ) i=0 [ = c 0 0.10 3 +1 3 0.25+2 3 0.20+3 3 0.15 ] + 4 3 0.15+5 3 0.05+6 3 0.05+7 3 0.05 = c 49.7 = 24 850 NOK (19) siden c = 500 NOK. 5 En funksjon av en tilfeldig variabel er bare en ny tilfeldig variabel. 6

Oppgave 2: ( økonomi ) a) Fortjeneste for studenten: fortjeneste = (1000 10 7 250) NOK = 8250 NOK (20) b) I urnemodellen er det samme sannsynlighet (uniform sannsynlighetsfordeling) for å trekke de forskjellige kulene (=begivenhetene) fra urnen. Her, i vår oppgave, er det også samme sannsynlighet for å trekke de forskjellige loddene. Derfor kan vi i dette tilfellet bruke formelen: P(A) = antall gunstige kombinasjoner for A antall mulige kombinasjoner totalt (21) c) Loddkjøperen kjøper 2 lodd av totalt 1000 lodd. rekkefølgen spiller ingen rolle, dvs. det er ikke-ordnet utvalg når et lodd er trukket så legges det ikke tilbake Alt i alt, ikke-ordnede kombinasjoner u/tilbakelegging: situasjon 3. d) i) Sannsynligheten for at loddkjøperen 1 kategori =993 lodd ikke vinner: P( ikke vinner X = 0 ) = antall gunstige kombinasjoner antall mulige kombinasjoner totalt = 1 kategori {( }} ){ N(X = 0) s(x = 0) ( ) = N s 7 ( ) 993 2 ( ) 1000 0.986 (22) 2

2 kategorier =7 lodd =993 lodd ii) Sannsynligheten for at loddkjøperen trekker 1 vinnerlodd og 1 ikke vinnerlodd: P( 2 kategorier X = 1 ) = antall gunstige kombinasjoner antall mulige kombinasjoner totalt = 2 kategorier {( )}}( ){ N(X = 1) N(X = 0) s(x = 1) s(x = 0) ( ) = N s ( ) ( ) 7 993 1 1 ( ) 1.39 10 2 (23) 1000 2 iii) Sannsynligheten for at begge loddene til kjøperen 1 kategori =7 lodd vinner: 1 kategori vinner P( X = 2) = antall gunstige kombinasjoner antall mulige kombinasjoner totalt = 1 kategori vinner {( }} ){ N(X = 2) s(x = 2) ( ) = N s ( ) 7 2 ( ) 1000 4.20 10 5 (24) 2 e) Gyldig sannsynlighetsfordeling: 2 i=0 P(X = x i ) = P(X = 0) + P(X = 1) + P(X = 2) 0.986+1.39 10 2 + 4.20 10 5 1.0 (25) 8

Dette kan også vises eksakt: 2 i=0 P(X = x i ) = P(X = 0) + P(X = 1) + P(X = 1) = 164176 166500 + 2317 166500 + 7 166 500 = 164176 + 2317 + 7 166 500 = 166500 166 500 = 1 (26) f) i) Forventet fortjeneste til loddkjøperen: 6 E[F ] = E[g X s c] = g E[X] s c (27) Vi mangler bare E[X]. Denne må vi finne: E[X] def. = 2 x i P(X = x i ) i=0 = x 0 P(X = 0) + x 1 P(X = 1) + x 2 P(X = 2) 0 0.986+1 (1.39 10 2 )+2 (4.20 10 5 ) = 0.013984 (28) 6 Her bruker vi regnereglene: ( a er en konstant ) E[a+X] = a+e[x] E[a X] = a E[X] 9

Dette innsatt i lign.(27): E[F] = g E[X] s c ( 250 0.013984 2 10) NOK 16.5 NOK (29) ii) Tolkning: At forventet fortjeneste for loddkjøperen er negativ betyr at loddkjøperen taper på å kjøpe lodd i det lange løp. Kommentar: Loddkjøperens forventede tap er 16.5 NOK ved kjøp av 2 lodd, dvs. det forventede tapet per lodd er 8.25 NOK. Når alle loddene er solgt så er det forventede samlede tapet for lodd kjøperne: forventet samlet tap for loddkjøperne = antall lodd forventet tap per lodd = 1000 8.25 NOK = 8250 NOK (30) dvs. samme svar som i oppgave 1a, lign.(20). Konklusjon: Det forventede samlede tapet for loddkjøprene er lik loddarrangørens fortjeneste. 10

Oppgave 3: ( logistikk ) a) Siden p i = 0.10+0.10+0.60+0.10+0.10 = 1 (31) i dvs. sannsynlighetene summerer seg opp til 1, så er den oppgitte sannsynlighetsfordelingen en gyldig fordeling. b) i) Tolkning: E[X] = forventet antall leveringsdager, dvs. forventet leveringstid ii) Forventet leveringstid: 7 E[X] def. = 5 x i P(X = x i ) i=1 = 1 0.10+2 0.10+3 0.60+4 0.10+5 0.10 = 3 (32) c) i) Tolkning: V ar[x] = forventet spredning/varians av antall leveringsdager 7 Se definisjon av forventning E[X] i formelsamlingen. 11

ii) Variasjon i leveringstid: 8 Var[X] def. = 5 (x i E[X]) 2 P(X = x i ) i=1 = (1 3) 2 0.10+(2 3) 2 0.10+(3 3) 2 0.60+(4 3) 2 0.10+(5 3) 2 0.10 = 1 (33) iii) Istedet for definisjonen av variansen kan man bruke varianssetningen. 9 Da trenger vi E[X] og E[X 2 ]. Vi kjenner E[X] fra oppgave b, men mangler E[X 2 ]. Den må vi regne ut: E[X 2 ] = 5 x 2 i P(X = x i) i=1 (definisjon av forventning) = 1 2 0.10+2 2 0.10+3 2 0.60+4 2 0.10+5 2 0.10 = 10 (34) Dette innsatt i variasjonssetningen : Var[X] var. setn. = E[X 2 ] E[X] 2 = 10 3 2 = 1 (35) som selvfølgelig gir samme svar som ved bruk av definisjonen. d) Standardavviket er: σ[x] def. = Var[X] = 1 = 1 (36) 8 Se definisjon av varians Var[X] i formelsamlingen. 9 Se formelsamling. 12

Oppgave 4: ( økonomi ) a) Sannsynlighetstre som viser kursutviklingen til aksjen: Figur 1: Sannsynlighetstre. b) Forventet verdi av aksjen etter 2 dager: E[X 2 ] def. = 4 (x 2 ) i P(X = (x 2 ) i ) i=1 = 420 0.30 + 400 0.20 + 420 0.10 + 350 0.40 = 388 (37) 13

c) Forventet verdi av formuen E[F 2 ]: ( a = 1000 aksjer ) E[F 2 ] = a ( forventet verdi ved t = 2 stiger + forventet verdi ved t = 1 synker ) ( verdi ved t=2 Se fig.(2) = 1000 420 0.30 + 400 0.20 + verdi ved t=1 360 0.50 ) = 386 000 NOK (38) Figur 2: Sannsynlighetstre. 14

d) Tolkning: E[F 2 ] = forventet totalverdi av formuen ved dag nr. 2 når hun følger strategien som angitt (39) 15

Oppgave 5: ( transport ) a) Siden i p i = 0.5+0.3+0.15+0.05 = 1 (40) dvs. sannsynlighetene summerer seg opp til 1, så er den oppgitte sannsynlighetsfordelingen en gyldig fordeling. b) Med Y = X 1 +X 2 +X 3 og ut fra regnereglene for forventning 10 så er: E[Y] = E[X 1 +X 2 +X 3 ] allid = E[X 1 ]+E[X 2 ]+E[X 3 ] (41) Merk: Overgangen i lign.(41) gjelder alltid. Den forventede ventetiden for vogntog nr. 1, 2 og 3 er den samme siden alle X i er uavhengige, dvs. E[X 1 ] = E[X 2 ] = E[X 3 ] E[X]. Vi må derfor finne forventet ventetid for et gitt vogntog E[X]: E[X] = 4 i=1 x i P(X = x i ) = 10 0.5+30 0.30+40 0.15+45 0.05 = 22.25 (42) Dette innsatt i lign.(41): E[Y] = E[X 1 ]+E[X 2 ]+E[X 3 ] = 3 =22.25 E[X] = 3 22.25 = 66.75 (43) 10 Se f.eks. formelsamling. 16

c) En time er 60 minutter. Dermed: kostand pga. ventetid = =66.75 E[Y] 60 915 kr/time 1018 kr (44) d) Variansen til ventetiden: Var[Y] = Var[X 1 +X 2 +X 3 ] uavh. = Var[X 1 ] + Var[X 2 ] + Var[X 3 ] (45) Merk: Overgangen i lign.(45) gjelder kun når X i ene er uavhengige. Variansen til ventetiden for vogntog nr. 1, 2 og 3 er den samme siden alle X i ene er uavhengige, altså Var[X 1 ] = Var[X 2 ] = Var[X 3 ] Var[X]. Dermed: Var[Y] lign.(45) = 3 Var[X] (46) Vi må derfor finne Var[X]. Fra oppgave b) har E[X] = 22.25. Dermed er det kun E[X 2 ] som vi mangler for å finne variansen: E[X 2 ] = 4 x 2 i P(X = x i) i=1 = 10 2 0.50+30 2 0.30+40 2 0.15+45 2 0.05 = 661.25 (47) Dette innsatt i varianssetningen : Var[X] = E[X 2 ] E[X] 2 = 661.25 22.25 2 166.1875 (48) 17

Variansen til ventetiden Var[Y]: 11 Var[Y] = 3 Var[X] = 3 166.1875 = 498.5625 (51) e) Standardavviket er: σ[y] def. = Var[Y] 498.5625 22.33 (52) 11 NB: Legg merke til at følgende er FEIL: Var[Y] = Var[X 1 +X 2 +X 3 ] feil = Var[3X] = 3 2 Var[X] FEIL! (49) som, selvfølgelig, gir FEIL svar: Var[Y] feil = 3 2 Var[X] = 9 166.1875 = 1495.6875 FEIL! (50) 18

Oppgave 6

Setn. Formel Kommentar Ark nr. 1: Øving 4, Oppgave 6 Den spesielle add. setn. 1) A og B er disjunkte 2) eller sannsynlighet Den generelle add. setn. 1) sammenh. mellom og og eller 2) gjelder ALLTID Den spesielle mult. setn. 1) A og B er uavh. 2) uavh. TEST 3) og sannsynlighet Den generelle mult. setn. 1) sammenh. mellom og og betinget sanns. 2) gjelder ALLTID

Setn. Formel Kommentar Ark nr. 2: Øving 4, Oppgave 6 Komplement setn. A = ikke A Total sannsynlighet mix Tvilling setn. og og eller med NOT

Setn. Formel Kommentar Ark nr. 3: Øving 4, Oppgave 6 Kombinatorisk sannsynlighet 1) urnemodellen 2) kombinatorisk sannsynlighet Bayes lov 1) speil -brødre 2) gjelder ALLTID Oppsplitting av Ω og

LØSNING: Oppgavesett nr. 5 MAT110 Statistikk 1, 2014 Oppgave 1: ( sentrale sannsynlighetsfordelinger, oversikt ) Se vedlegg A. 1

Oppgave 2: ( økonomi, simultane sannsynligheter ) a) i) Marginalsannsynlighetene for prisen X: marginalfordeling P(X = 1000) = p(1000, y) y (1) = p(1000,90)+p(1000,150)+p(1000,210) = 0.05+0.10+0.15 = 0.30 (2) marginalfordeling P(X = 1500) = p(1500, y) y (3) = p(1500,90)+p(1500,150)+p(1500,210) = 0.10+0.20+0.10 = 0.40 (4) marginalfordeling P(X = 2000) = p(2000, y) y (5) = p(2000,90)+p(2000,150)+p(2000,210) = 0.15+0.10+0.05 = 0.30 (6) ii) Marginalsannsynlighetene for etterspørselen Y: marginalfordeling P(Y = 90) = p(x,90) x (7) = p(1000,90)+p(1500,90)+p(2000,90) = 0.05+0.15+0.20 = 0.30 (8) 2

marginalfordeling P(Y = 150) = p(x, 150) x (9) = p(1000,150)+p(1500,150)+p(200,150) = 0.10+0.20+0.10 = 0.40 (10) marginalfordeling P(Y = 210) = p(x, 210) x (11) = p(1000,210)+p(1500,210)+p(200,210) = 0.15+0.10+0.05 = 0.30 (12) b) i) Forventet pris på iphone 6: E[X] def. = 3 i=1 x i P(X = x i ) (13) = 1000 P(X = 10) }{{} =0.30 + 1500 P(X = 15) }{{} =0.40 + 2000 P(X = 20) }{{} =0.30 (14) = (1000 0.30 + 1500 0.40 + 2000 0.30) NOK = 1500 NOK (15) Forventet pris er altså 1500 NOK for iphone 6. ii) Forventning av etterspørselen Y: E[Y] def. = 3 i=1 y i P(Y = y i ) (16) = 90 P(Y = 90) }{{} =0.30 + 150 P(Y = 150) }{{} =0.40 + 210 P(Y = 210) }{{} =0.30 (17) = 90 0.30 + 150 0.40 + 210 0.30 = 150 (18) Det forventes å selge 150 enheter av iphone 6 den første uken etter lansering. 3

c) Siden omsetning = pris }{{} =X antall solgte varer }{{} =Y = X Y (19) så er forventet omsetning: E[X Y] = 3 3 i=1 j=1 x i y j p(x i,y j ) (20) = ( 1000 90 =0.05 p(1000,90) + 1000 150 =0.10 p(1000,150) + 1000 210 =0.15 p(1000, 210) + 1500 90 + 2000 90 p(2000,90) }{{} =0.15 =0.10 p(1500,90) + 1500 150 + 2000 150 p(2000,150) }{{} =0.10 =0.20 p(1500,150) + 1500 210 =0.10 p(1500, 210) (21) ) + 2000 210 p(2000,210) NOK }{{} =0.05 = 219 000 NOK (22) Forventet omsetning er 219 000 NOK den førske uken etter lansering. d) Vi kjenner både E[X] og E[Y] fra oppgave b. Produktet av disse er: E[X] E[Y] = 1500 150 NOK = 225000 NOK (23) Fra forrige oppgave vet vi at E[X Y] = 219000 NOK. Dermed innser vi at: E[X Y] E[X] E[Y] (24) Konklusjon: Nei, X og Y er ikke uavhengige. De er avhengige. 4

e) i) Den simultane sannsynlighetsfordelingen P(XogY) = P(X Y) er kjent. Se tabell. De ubetingede sannsynlighetene P(X = x), for X = 1000, X = 1500 og X = 2000, ble beregnet i oppgave a. Sammenhengen mellom betinget og utbetinget sannsynligheter er gitt via den generelle multiplikasjonssetningen. P(Y = 90 X = 1000) = tabell = 0.05 P(X = 1000 Y = 90) P(X = 1000) = 0.05 0.30 = 1 6 (25) P(Y = 150 X = 1000) = tabell = 0.10 P(X = 1000 Y = 150) P(X = 1000) = 0.10 0.30 = 1 3 (26) P(Y = 210 X = 1000) = tabell = 0.15 P(X = 1000 Y = 210) P(X = 1000) = 0.15 0.30 = 1 2 (27) ii) Forventet omsetning når prisen er fastsatt til X = 1000 NOK er dermed: E[1000 Y] = 1000 E[Y] (28) = 1000 [ = 1000 3 y i P(Y = y i X = 1000) (29) i=0 90 =1/6 =1/3 P(Y = 90 X = 1000) + 150 P(Y = 150 X = 1000) + 210 =1/2 P(Y = 210 X = 1000) ] (30) = 170 000 NOK (31) Forventet omsetning den første uken etter lansering når prisen er fastsatt til X = 1000 NOK er 170000 NOK 5

f) i) Denne oppgaven løses på akkurat samme måte som den foregående. Sammenhengen mellom betinget og utbetinget sannsynligheter er gitt via den generelle multiplikasjonssetningen. P(Y = 90 X = 1500) = tabell = 0.10 P(X = 1500 Y = 90) P(X = 1500) = 0.10 0.40 = 1 4 (32) P(Y = 150 X = 1500) = tabell = 0.20 P(X = 1500 Y = 150) P(X = 1500) = 0.20 0.40 = 1 2 (33) P(Y = 210 X = 1500) = tabell = 0.10 P(X = 1500 Y = 210) P(X = 1500) = 0.10 0.40 = 1 4 (34) ii) Forventet omsetning når prisen er fastsatt til X = 1500 NOK er dermed: E[1500 Y] = 1500 E[Y] (35) = 1500 [ = 1500 3 y i P(Y = y i X = 1500) (36) i=0 90 =1/4 =1/2 P(Y = 90 X = 1500) + 150 P(Y = 150 X = 1500) + 210 =1/4 P(Y = 210 X = 1500) ] (37) = 225 000 NOK (38) Forventet omsetning den første uken etter lansering når prisen er fastsatt til X = 1500 NOK er 225000 NOK 6

g) Nei, det behøver ikke være slik at høyeste pris gir høyest omsetning. Dersom prisen settes for høy så kan etterspørselen gå så mye ned at det går ut over omsetningen. (Se tegneserien nedenfor.) Figur 1: As price goes up, demand may go down in such a way that turnover goes down as well. 7

Oppgave 3: ( finansanalyse, korrelasjon ) a) i) Aksje A og aksje B er korrelerte: R AB 0 A og B er korrelerte (39) ii) Siden R AB er positiv så tenderer de til å variere sammen, dvs. de varierer i takt : R AB > 0 A og B er varierer sammen (40) Dette betyr at høy pris på aksje A hører sammen med høy pris på aksje B. 1 b) i) Aksje C og aksje D er korrelerte: ρ[x C,Y D ] 0 X C og Y D er korrelerte (41) ii) Siden ρ[x C,Y D ] er negativ så tenderer de til å variere motsatt, dvs. de varierer i utakt : ρ[x C,Y D ] < 0 X C og X D er varierer motsatt (42) Dette betyr at høy pris på aksje C hører sammen med lav pris på aksje D. 1 Siden R AB er nesten 1 så er det nesten en lineær sammenheng mellom kursen på A og B. 8

Oppgave 4: ( økonomi, normalfordeling ) a) i) Sannsynligheten for at kursen til aksje A stiger i løpet av året: P(X A > 80) = 1 P(X A 80) (43) ( standardisèr XA µ A = 1 P σ A ( XA µ A = 1 P σ }{{ A } =Z A 80 µ ) A σ A 80 100 ) } 16 {{} 1.25 ( = 1 P(Z A 1.25) = 1 ) 1 P(Z A 1.25) (44) (45) (46) = G(1.25) tabell = 0.8944 (47) ii) Sannsynligheten for at kursen til aksje B stiger i løpet av året: P(X B > 100) = 1 P(X B 100) (48) ( standardisèr XB µ B = 1 P σ B ( XB µ B = 1 P σ }{{ B } =Z B 100 µ ) B σ B 100 125 ) } 25 {{} 1 ( = 1 P(Z B 1) = 1 ) 1 P(Z B 1) (49) (50) (51) = G(1) tabell = 0.8413 (52) 9

b) i) En normalfordeling er en kontinuerlig fordeling. Siden både X A og X B er er normalfordelte, så er de kontinuerlige. ii) Siden X A og X B er stokastiske variabler, så er også summen av dem stokastisk. Derfor er V en stokastisk variabel. c) i) Tolking: E[V] = forventet verdi av aksjeporteføljen om ett år ii) Uansett om X A og X B er uavhengige eller ikke, så gjelder: E[V] = E[n A X A +n B X B ] (53) uansett = n A E[X A ] + n B E[X B ] = n A µ A + n B µ B (54) = (125000 100 + 100000 125) NOK = 25000000 NOK (55) dvs. forventet verdi på aksjeporteføljen er 25 mill. NOK etter ett år. d) i) Tolking: V ar[v] = forventet variasjon/spredning av verdien til aksjeporteføljen om ett år ii) Siden X A og X B er uavhengige så gjelder: Var[V] = Var[n A X A +n B X B ] (56) uavh. = n 2 A Var[X A] + n 2 B Var[X B] = n 2 A σ2 A + n2 B σ2 B (57) = [(125000) 2 16 2 + (100000) 2 25 2 ] NOK 2 (3.20 10 6 ) 2 NOK 2 (58) 10

e) i) Sannsynligheten for at verdien V overstiger 22 mill. NOK: P(V > 22 mill.) = 1 P(V 22 mill.) (59) ( standardisèr V E[V] = 1 P σ V ( V E[V] = 1 P σ }{{ V } =Z V 22000000 25000000 ) 3.2000000 22 25 ) } 3.2 {{} 0.94 ( = 1 P(Z V 0.94) = 1 ) 1 P(Z V 0.94) (60) (61) (62) = G(0.94) tabell = 0.8264 (63) ii) Sannsynligheten for at veriden V overstiger 30 mill. NOK: P(V > 30 mill.) = 1 P(V 30 mill.) (64) ( standardisèr V E[V] = 1 P 30000000 25000000 ) σ V 3.2000000 ( V E[V] = 1 P σ }{{ V } =Z V 30 25 ) } 3.2 {{} 1.56 (65) (66) = 1 P(Z V 1.56) (67) = 1 G(1.56) tabell = 1 0.9406 (68) = 0.0594 (69) 11

f) Regnereglen E[aX +by] = ae[x]+be[y] (70) gjelder alltid, uansett om X og Y er korrelerte eller ikke. Derfor er forventningen når ρ[x A,X b ] = 0.5 den samme som i oppgave c) hvor ρ[x A,X b ] = 0: E[V] = 25000000 NOK (71) dvs. forventet verdi på aksjeporteføljen er også i dette tilfellet 25 mill. NOK etter ett år. g) Først regner vi ut kovariansen: Cov[X A,X Y ] = ρ[x A,X B ] σ A σ B (72) = ( 0.5) 16 25 NOK 2 = 200 NOK 2 (73) Variansen blir dermed: Var[V] = Var[n A X A +n B X B ] (74) = n 2 AVar[X A ] + n 2 BVar[X B ] + 2 n A n B Cov[X A,X B ] (75) = n 2 A σ2 A + n2 B σ2 B + 2 n A n B Cov[X A,X B ] (76) = [ (125000) 2 16 2 + (100000) 2 25 ] 2 + 2 125000 100000 ( 200) NOK 2 (2.29 10 6 ) 2 NOK 2 (77) 12

h) Variansen (spredningen) er mindre når korrelasjonen er negativ. i) i) Sannsynligheten for at veriden V overstiger 22 mill. NOK: P(V > 22mill.) = 1 P(V 22mill.) (78) ( standardisèr V E[V] = 1 P 22000000 25000000 ) σ V 2.29000000 ( V E[V] = 1 P σ }{{ V } =Z V 22 25 ) } 3.2 {{} 1.31 ( = 1 P(Z V 1.31) = 1 ) 1 P(Z V 1.31) (79) (80) (81) = G(1.31) tabell = 0.9049 (82) ii) Sannsynligheten for at veriden V overstiger 30 mill. NOK: P(V > 30mill.) = 1 P(V 30mill.) (83) ( standardisèr V E[V] = 1 P σ V ( V E[V] = 1 P σ }{{ V } =Z V 30000000 25000000 ) 2.29000000 30 25 ) } 2.29 {{} 2.18 (84) (85) = 1 P(Z V 2.18) = 1 G(2.18) (86) tabell = 1 0.9854 = 0.0146 (87) 13

j) Fyller inn svarene fra oppgaven i tabellen: Figur 2: Svarene fra oppgaven samlet i tabellen. Når X A og X B er negativt korrelerte så ser vi at: 1. forventning E[V] er den samme 2. spredning σ[v] blir mindre 3. sannsynligheten P(V > 22 mill.) er større 4. sannsynligheten P(V > 30 mill.) er mindre 14

Oppgave 5: ( korrelasjon ) Figur 3: Lineær korrelasjon mellom X og Y. 15

Oppgave 6: ( oversikt over formler ) Se vedlegg B. 16

Vedlegg A

Bin[ n, p ] Hyp[ N, M, n ] Poi[ λ ] N[ μ, σ ] 2 param. 3 param. 1 param. 2 param. diskret diskret diskret kontinuerlig

Bin[ n, p ] Hyp[ N, M, n ] Poi[ λ ] N[ μ, σ ] 1) 2 mulig utfall 2) samme p for suksess 3) uavhengige 1) x antall suksesser / spesielle 2) N antall i grunnmengden 3) M antall spesielle 1) x antall begivenheter innenfor en gitt tid 2) λ = rate 1) Tetthetsfunksjon f X (x) 2) Gausskurve 4) n antall forsøk 4) n antall trukne elementer - kjenner ikke fordelingen i urnen - m / tilbakelegging - teller opp antall suksesser - kjenner fordelingen i urnen - u / tilbakelegging - teller opp antall suksesser - rate ( konstant ) - antall begivenheter innenfor en gitt tid eller gitt rom - telleforsøk - loven om skjeldne begivenh. - under bestemte betingelser vil mange diskrete og kontinuerige fordelinger med god tilnæring være normalfordelt (f.eks. CLT )