LØSNING: Eksame 28. mai 2015 MAT110 Statistikk 1, vår 2015 Oppgave 1: revisjo ) a) Situasjoe som beskrives i oppgave ka modelleres med e ure. I dee ure er fordelige kjet, M atall bilag med feil og N 100 000 bilag totalt. De stokastiske variabele X har derfor e hypergeometrisk fordelig. b) Side X er hypergeometrisk fordelt så er forvetige: E[X] M N 1) Løser med hesypå M alae og får: M E[X]N 10 100 000 1000 1000, q.e.d. 2) c) Side X er hypergeometrisk fordelt så er variase: V ar[x] N N 1 M N 1 M ) N 3) 100 000 1000 100 000 1 1000 1000 100 000 1 1000 ) 100 000 9.8 4) 1
og tilhørede stadardavvik: σ[x] V ar[x] 9.8 3.13, q.e.d. 5) d) i) E hypergeometrisk fordelig ka med god tilæremelse beskrives av e ormalfordelig dersom: N 20 6) M N 1 M ) N 5 7) ii) For vårt tilfelle er: 100 000 20 1000 8) 1000 1000 100 000 1 1000 ) 100 000 5 9) som gir 100 000 20 000 10) 9.9 5 11) dvs. kritereiee er oppfylte i vårt tilfelle. e) og g) Se vedlegg. 2
f) I oppgave er det oppgitt at de stokastiske variabele X er ormalfordelt med X N [ E[X] 10, σ[x] ]. Dermed løses dee oppgave med omvedt) tabelloppslag 1. Stadardiserer: P X g) 0.10 12) X E[X] P σ[x] Z g E[X] ) σ[x] Z 0 stadardiser 0.10 13) P Z Z 0 ) 0.10 14) Ulikhete skal være rett vei, altså midre e eller lik: P Z Z 0 ) 0.10 15) 1 P Z < Z 0 ) 0.10 16) P Z < Z 0 ) 0.90 17) Ved omvedt tabelloppslag ser vi at Z 0 må være 1.28: 2 Vi løser Z 0 1.28 19) Z 0 g E[X] σ[x] 20) med hesy på g: E[X] 10 og σ[x] 3.13 fra oppgave c ) g E[X] + Z 0 σ[x] 21) 10 + 1.28 3.13 14 22) 1 Husk at tabelle på side 65 i 2015-formelsamlige dreier seg KUN om ormalfordelig. 2 For e kotiuerlig sasylighetsfordelig er sasylighete i et pukt lik ull. Dermed ka vi skrive: P Z Z 0 ) P Z < Z 0 ) + P Z Z 0 ) P Z < Z 0 ) 18) 0 Dermed ka vi fie fortsatt bruke tabelle i formelsamlige selv om tabelle sier oe om GZ 0 ) P Z Z 0 ) mes vi skal fie P Z < Z 0 ). 3
Dette betyr at revisore uderkjeer regskapet dersom ha fier 14 feil eller mer blat de 1000 bilagee ha trekker. 4
Oppgave 2: økoomi / logistikk ) a) Side de stokastiske variabele D 1 er oppgitt i oppgave til å være ormalfordelt så fier vi sasylighete P D 1 > 21 000) ved stadardiserig og tilhørede tabelloppslag: P D 1 > 21 000) stadardiser D1 µ 1 P > 21 000 µ ) 1 σ }{{ 1 σ } 1 Z 23) P Z > 21 000 15 000 3000 ) 24) P Z > 2 ) 25) 1 P Z 2 ) 26) 1 G 2 ) 0.9772 27) tabell 1 0.9772 28) 0.0228 29) Sasylighete for at mer e 21 000 trofaste aviskjøpere kjøper Dagbladet e gitt dag er 2.28 %. 5
b) Det er oppgitt i oppgave at de totale etterspørsele D tot av aviser dersom det har skjedd e spesiell yhet er: D tot D 1 + D 2 30) Ved å bruke formel 5.13) i formelsamlige fra 2015 fier vi da: E[D tot ] E[D 1 + D 2 ] 31) alltid E[D 1 ] + E[D 2 ] µ 1 + µ 2 15 000 + 18 000 33 000 32) µ 1 µ 2 NB: Overgage i lig.31) til 32) gjelder alltid. Uasett om de stokastiske variablee X i er uavhegige eller ikke. c) Variase til de totale etterspørsele D tot av aviser dersom det har skjedd e spesiell yhet er: V ar[ D tot ] V ar [ D 1 + D 2 ] 33) uavh. V ar[d 1 ] + V ar[d 2 ] 34) σ 2 1 + σ 2 2 3000 2 + 4000 2 25 000 000 35) NB: Overgage fra lig.33) til lig.34) gjelder ku dersom de stokastiske variablee D 1 og D 2 er uavhegige. 6
d) Forvetede fortjeeste til Dagbladet E[F ] per dag dersom e spesiell yhet har skjedd: E[F ] E [ p k)d tot c ] 36) p k)e[d tot ] c 25 12) 33 000 400 000 ) NOK 37) 29 000 NOK 38) Her har vi brukt at E[D tot ] 33 000 fra oppgave 2b, se lig.32). e) Side D tot er oppgitt i oppgave til å være ormalfordelt så fier vi sasylighete P D tot > 21 000) ved stadardiserig og tilhørede tabelloppslag: bruker at σ[d tot ] V ar[d tot ] 25 000 000 5000 fra oppgave 2c ) P D tot > 21 000 S) ) stadardiser Dtot E[D tot ] P 21 000 33 000 σ[d tot ] S > 5000 Z tot 39) P Z tot > 21 000 33 000 5000 ) 40) P Z tot > 2.4 ) 41) 1 P Z tot 2.4 ) 42) 1 ) 1 P Z tot 2.4 ) 43) P Z tot 2.4 ) 44) tabell G2.4) 45) 0.9918 46) Sasylighete for at mer e 21 000 persoer kjøper Dagbladet e gitt dag, dersom vi vet at det har skjedd e spesielle yhet, er 99.18 %. 7
f) Oppgave spør etter sasylighete P D tot > 21 000). Oppsplittig av utfallsrom Ω: 3 P D tot > 21 000) 0.20 1 0.20 {}}{ P D tot > 21 000 S) P S) + P D tot > 21 000 S) P S) 47) 0.9918 P D 1 >21 000) 0.028 oppspl. 0.9918 0.20 + 0.0228 1 0.20) 0.2166 48) Sasylighete for at det e gitt dag etterspørres mer e 21 000 aviser dersom vi ikke vet om det skjer e spesiell yhet eller ikke de aktuelle dage, er 21.66 %. 3 Se side 32 i formelsamlige 2015. 8
Oppgave 3: petroleumslogistikk ) a) Side P X x i ) P X 0) + P X 1) + P X 2) + P X 3) + P X 4) 49) i0 0.09 + 0.28 + 0.41 + 0.17 + 0.05 1 50) b) Sasylighete for at det leveres i 3 rapporter eller mer per dag: P X 3) P X 3) + P X 4) 0.17 + 0.05 0.22 51) c) i) Forvetet atall ileverte rapporter per dag: E[X] def. 4 i0 x i P X x i ) 52) 0 P X 0) 0.09 + 1 P X 1) 0.28 + 2 P X 2) 0.41 + 3 P X 3) 0.17 + 4 P X 4) 0.05 0 0.09 + 1 0.28 + 2 0.41 + 3 0.17 + 4 0.05 1.81 53) ii) For å fie variase V ar[x] så reger vi først ut E[X 2 ]: E[X 2 ] def. 3 i0 x 2 i P X x i ) 54) 0 2 P X 0) 0.09 + 1 2 P X 1) 0.28 + 2 2 P X 2) 0.41 + 3 2 P X 3) 0.17 + 4 2 P X 4) 0.05 0 2 0.09 + 1 2 0.28 + 2 2 0.41 + 3 2 0.17 + 4 2 0.05 4.25 55) 9
Dette isatt i setige for variassetige : 4 V ar[x] E[X 2 ] E[X] 2 4.25 1.81 2 0.9739 56) d) i) Tolkig: E[ X ] forvetet atall ileverte rapporter per dag i gjeomsitt over et helt år ii) Forvetet atall ileverte rapporter i gjeomsitt per dag: 365 ) [ 1 E[ X ] E alltid X 1 + X 2 +... + X ) ] 1 E[X 1 ] + E[X 2 ] +... + E[X ] ) 1 E[X] + E[X] +... + E[X] E[X] ) 1 E[X] 1.81 57) 58) 1.81 59) NB: Overgage i lig.57) til 58) gjelder alltid. Uasett om de stokastiske variablee X i er uavhegige eller ikke. 4 Se side 39 i formelsamlige fra 2015. 10
e) i) Tolkig: V ar[ X ] forvetet variasjo/spredig i atall ileverte rapporter per dag i gjeomsitt over et helt år 60) ii) Variase til atall ileverte rapporter per dag i gjeomsitt over et år: 365 ) V ar[ X ] [ ) ] 1 V ar X 1 + X 2 +... + X uavh. ) 1 V ar[x 2 1 ] + V ar[x 2 ] +... + V ar[x ] V ar[x] 1 2 V ar[x] 0.9739 0.9739 365 61) 62) 0.002668 63) NB: Overgage i lig.61) til 62) gjelder fordi de stokastiske variablee X i er uavhegige. f) Side 1. atall ileverte rapporter per dag er uavhegige: oppgitt i oppgavetekste ) X i er uavhegige for alle i 1, 2, 3,..., 2. alle X i har samme sasylighetsfordelig: oppgitt i oppgavetekste ) X i samme sasylighetsfordelig for alle i 1, 2, 3,..., 3. atall forsøk, dvs. atall dager, 365 er tilstrekkelig stort 5 så gjelder setralgresesetige. Dermed er X ormalfordelt. 5 Husk: Atall forsøk for at setralgresesetige skal gjelde er avhegig av situasjoe. Me e tommelfigerregel er at vi bør ha 30. 11
g) Fra oppgavee 2c, 2d og 2e fora ser vi at: E[ X ] 1.81 E[X] 1.81 64) og at V ar[ X ] 0.002668 V ar[x] 0.9739 65) Det betyr at sasylighetfordelige til X, dvs. P X x) gitt ved tabell i V arx oppgavetekste, og sasylighetfordelige til X, dvs. X N[ E[X], ] har samme tygdepukt, me mye midre varias / usikkerhet. 12
h) Sasylighete for at atall ileverte rapporter i løpet av et år overstiger 700: 365 ) X1 + X 2 +... + X P X 1 + X 2 +... + X > 700 ) P P X > 700 ) 1 P X 700 ) > 700 ) 66) 67) 68) stadardiser X E[ X ] 1 P σ[ X ] Z 1 P Z 700 1.81 ) 365 0.002668 700 E[ X ] σ[ X ] ) 69) 70) 1 P Z 2.09) 71) 1 G2.09) 72) 1 0.9817 73) 0.0183 74) Kommetar: Legg merke til at det er X som skal stadardiseres. Ikke X. Det betyr at vi må bruke E[ X ] 1.81 og σ[ X ] 0.002668 ikke E[ X ] 1.81 og σ[ X ] 0.9739 ). 13
Oppgave 4: økoomi ) a) i) R xy er ormalisert og ligger mellom 1 og 1, dvs.: 1 R xy 1. ii) R xy er et mål på lieær korrelasjo mellom obervasjoee x og y. Det er et mål på i hvor stor grad det er e lieær sammmeheg mellom obervasjoee x og y. iii) R xy er ehetsuavhegig, dvs. ige ehet. 6 b) Uttrykket for korrelasjoskoeffisiete fier vi i formelsamlige. Det gir: R xy S xy S x S y 75) 110.83 116.67 109.54 0.98 76) c) At R xy 0.98 betyr at det er e sterk egativ korrelasjo mellom x og y, dvs. store x hører samme med små y og omvedt. Det er altså e sterk lieær sammeheg mellom x og y med egativt stigigstall. 6 Dette betyr at R xy har samme verdi uasett hva slags ehet ma bruker for å rege ut R xy S xy /S x S y ). 14
d) Vi skal fie regresjoslije. Formele for miste kvadraters lieære regresjoslije står i formelsamlige: ŷ ˆα + ˆβx 77) hvor parametree ˆβ og ˆα er: dropper beevige) ˆβ S xy S 2 x 110.83 116.67 0.95 78a) ˆα y βx 40.43 0.95) 15 54.68 78b) Miste kvadraters lieære regresjoslije ŷ ˆα + ˆβ x blir dermed: ŷ 54.68 0.95 x 79) e) Bruker regresjoslije ŷ ŷx) fra oppgave 4d, dvs. lig.79): ŷ17) 54.68 0.95 17 38.53 80) Regresjoslije predikerer at kvadratmeterprise for e leilighet som er 17 km utefor setrum er 38 530 NOK/m 2. 15
f) Gjeomsittlig kvadratmeterpris i Norge er 35 000 NOK/m 2. Ifølge regresjoslije, år ŷx) 35, er da: Løser med hesy på x: 35 54.68 0.95 x 81) x 54.68 35 0.95 20.72 82) Ifølge regresjoslije oppår ma ladsgjeomsittet i kvadratmeterpris 20.72 km utefor setrum. g) Forklarigskrafte R 2 ka leses direkte fra Excel-utskrifte: Se celle som heter R Square i Excel-utskrifte ): 7 R 2 0.9613 83) h) Kommetar til svaret i oppgave 4g: At R 2 0.9613 betyr at regresjoslije vil i i stor grad forutsi kvadrameterprise på e leilighet for e gitt avstad fra setrum. Modelle har stor forklarigskraft. 7 Ma ka også rege ut forklarigskrafte R 2 for håd via defiisjoe R 2 1 SSE/SST. Me det er mye mer arbeidskrevede. Fit at dataprogrammer som f.eks. Excel) ka hjelpe oss med slikt. 16
Vedlegg f X x) Studetummer: 0.15 f X xe[x]10) 0.13 0.10 0.05 σ 3.13 P X 14 ) x 2 4 6 8 10 12 14 16 18 20 μ E[X] 10