ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 1 (Det tas forbehold om feil i løsningsforslaget. Oppgave 1 Vi betrakter dataene x 1,..., x 1 somutfall av n = 1 u.i.f. tilfeldige variable X 1,..., X 1, og vi setter E(X i = µ og SD(X i = σ. a Forventningen estimeres med gjennomsnittet: x = 1 1 (x 1 + + x 1 = 1 (755 + 708 + + 748 = 8813/1 = 734.4 1 Standardavviket, σ, estimeres med: s = 1 5 1 (x i x 1 1 = 466.9 = 14.98 1 1 i=1 Standardavviket til µ = X, er SD(X = σ 1 b Vi vil teste: H 0 : µ = 750 mot H 1 : µ < 750 Her er σ ukjent og antall data, n = 1, ikke stort nok til å basere seg på tilnærmet standard normalfordeling. Derfor må vi bruke t-fordeling og t-test. Dette forutsetter at dataene med rimelighet kan sies å komme fra en normalfordeling, N(µ, σ. Et histogram over dataene, se gur til høyre, indikerer at dette ikke er urimelig. Frequency 0.0 0.5 1.0 1.5.0.5 3.0 Histogram of vekter 700 710 70 730 740 750 760 vekter Dersom H 0 er korrekt er t(11-tetthet. Nullfordeling til T T = X 750 s/ 1 = t(11 } {{ } teststørrelse 0.0 0.1 0. 0.3 0.4-3 - -1 0 1 3 Med signikansnivå 5%, dvs α = 0.05, forkaster vi H 0 dersom T t 0.05,11 = 1.796 (merket av i guren over med rød pil; forkastningsområdet er: (, 1.796]. 734.4 750 Utfall av teststørrelsen: 14.98/ 1 = 3.61 Siden 3.61 < 1.796, blir konklusjonen forkast H 0. Dataene gir grunnlag for å påstå at forventet brødvekt er lavere enn 750 gram.
ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. Oppgave a Populasjon: alle stemmeberettigede i Stavanger. Det gjøres et tilfeldig utvalg på n =, og hver spørres om de vil stemme FRP. Svaret for hver enkeltperson i utvalget ses på som et enkeltforsøk. Da har vi: 1. resultatene i enkeltforsøkene er (tilnærmet uavhengige av hverandre fordi utvalget er en liten del av hele populasjonen,. i hvert av de n = enkeltforsøkene registreres det om personen vil stemme FRP (suksess eller ikke. (ett av to mulige utfall, og 3. suksessannsynligheten, (P( en tilf. valgt person vil stemme FRP, er konstant i alle enkeltforsøkene. Derfor har vi en binomisk forsøksrekke, og er antall suksesser er da binomisk fordelt. Partiets virkeklige oppslutning er andelen av alle de stemmeberettigede som vil stemme FRP, dvs.: p = M/N, der N = antall stemmeberettigede i populasjonen, og M = antall blant de stemmeberettigede i populasjonen, som vil stemme FRP på det aktuelle tidspunktet. Dvs.: p = M/N er en populasjonsparameter, og vi kjenner ikke verdien denne har. Denne parameteren, p, er suksessannsynligheten i den binomiske fordelingen. b Resultatet 17.8% er et estimat av p. Dette estimatet har framkommet ved at 74 av de spurte, sa at de ville stemme FRP (det skulle kanskje heller vært oppgitt 17.7%. De spurte er et tilfeldig utvalg, og et annet tilfeldig utvalg ville kunne resultert i et annet antall FR-stemmere og dermed et annet resultat, selv om andelen p = M/N er nøyaktig den samme. Antall FRP-stemmere som kommer med i et tilfeldig utvalg på, er binomisk fordelt med n = og p = M/N som suksessannsynlighet. Spredningen i fordelingen til estimatoren er et mål på usikkerheten i anslaget. Vanligvis p(1 p 0.178(1 0.178 angitt med standardfeilen: SD( p = som utregnet blir: = 0.0187. n Med virkelig p antatt til å være p = 0.155, vil Y = antall FRP-stemmere i et tilfeldig utvalg på n =, være binomisk fordelt med n = og p = 0.155 som suksessannsynlighet. Da har vi: Meningsmåling viser minst 17.8% FRP ( p = Y/n 0.178 ( Y n 0.178 = 74, P ( p 0.178 = 1 P ( p < 0.178 = 1 P (Y 73 ( 1 P Z 73 0.5 0.155 = 1 P (Z 1.06 = 1 0.8554 = 0.1446 0.155(1 0.155
ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 3 c Et (tilnærmet 95% kondensintervall for virkelig FRP-oppslutning er gitt ved: ( p 1.96 Innsatt data: p(1 p, p + 1.96 n p(1 p n ( 0.178(1 0.178 0.178(1 0.178 0.178 1.96, 0.178 + 1.96 = (0.141, 0.15 Fortolkning: det er god grunn til å tro at virkelig FRP-oppslutning er i intervallet mellom 14.1% og 1.5%. Vi kan tenke oss at vi gjør meningsmålingen ere ganger under samme forhold. Vi vil få litt variasjon i resultatene mellom hver gang. Ved å beregne et 95% kondensintervall hver gang, vil disse intervallene ha den egenskap at tilnærmet 95% av de vil inneholde den virkelige andelen, p, FRP-stemmere. d H 0 : p = 0.155 H 1 : p > 0.155. Teststørrelse: Z = p 0.155 0.155(1 0.155 Nullfordeling: standardnormal; skisse i gur til høyre.. 0.0 0.1 0. 0.3 0.4 3 1 0 1 3 z Test: forkaster H 0 dersom utfallet av Z er større enn 1.645 (énsidig test. Eller, ekvivalent: forkaster H 0 dersom p-verdien til resultatet er mindre enn 0.05. Utfall av Z: ikke forkaste H 0. 0.178 0.155 0.155(1 0.155 = 1.98. Siden Z-utfallet ikke er større enn 1.645, kan vi Alternativt: p verdi = P (Z 1.98 = 1 P (Z < 1.98 = 1 0.903 = 0.0968 > 0.05, (skravert rødt i guren under. Konklusjon: vi kan ikke forkaste H 0. Det er ikke grunnlag for å påstå at FRP har høyere oppslutning i populasjonen ved tidspunktet for meningsmålingen enn ved forrige valg. 0.0 0.1 0. 0.3 0.4 3 1 0 1 3 z
ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 4 Oppgave 3 a La X være antall riktige prediksjoner av de n = 1000 forsøkene. Vi kan betrakte hvert av de n = 1000 forsøkene som en binomisk forsøksrekke. I hvert forsøk er det suksess- (prediksjonen er riktig eller asko (feil prediksjon utfall. Dersom en person ikke har overnaturlige evner, vil det være en sannsynlighet p = 1/4 for suksess hver gang, og det er ingen ting som vi kunne gi noen form for avhengighet mellom ulike ganger, siden det er tilfeldig og uavhengig fra forsøk til forsøk hvilket lys som lyser opp. Derfor vil X = antall riktig prediksjoner, være binomisk fordelt med n = 1000 og med p = 1/4 for en person uten paranormale evner. Histogrammet til denne fordelingen med tilhørende normalfordelingskurve (som tilnærming i rødt er vist i guren under. 0.000 0.010 0.00 158 178 198 18 38 58 78 98 318 Vi kan vurdere om en person har paranormale evner i denne situasjonen ved å teste: H 0 : p = 0.5 H 1 : p 0.5. Det kan være greit å ha tosidig alternativ her det vil jo også være bemerkelsesverdig om en person hadde spesielle evner til å unngå å predikere den pæren som kom til å lyse opp! Teststørrelse: Z = p 0.5 0.5(1 0.5 1000. Nullfordeling: standardnormal. (Her er p = X/1000. Test: Forkast H 0 og påstå paranormalitet! dersom utfallet av Z er større enn 1.96 eller mindre enn -1.96 I forhold til X som teststørrelse (relatert til fordelingen i guren, blir testen: forkast H 0 dersom antall riktige prediksjoner, X, er større enn 1000 0.5+1.96 1000 0.5 (1 0.5 76 eller dersom X er mindre enn 1000 0.5 1.96 1000 0.5 (1 0.5 3. Resultater i intervallet 3 76 kan med rimelighet hevdes å være utslag kun av tilfeldigheter.
ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 5 Oppgave 4 a Ett tilfeldig vagt kort fra en kortstokk; P (kortet er en konge = 4 5 = 1 13. To tilfeldig vagte kort fra en kortstokk; 1. Vi lar utfallsrommet bestå av alle ( 5 mulige tokortsutvalg fra en kortstokk. Alle disse har like stor sannsynlighet for å bli trukket ut; utfallsrommet har uniform sannsynlighetsmodell. Blant de ( 5 utvalgene er det som består av to konger. Derfor blir sannsynligheten P (to konger = ( 4 ( 5 = 4 3/ 5 51/ = 1 1 13 17 = 1 1.. P (to konger = P (K K 1 = P (K K 1 P (K 1 = 3 4 51 5 = 1 1 17 13 = 1 1. ( 4 ulike tokortsutvalg Her det brukt at P (K 1 = P (konge på første trekte kort opplagt er 4/5, og at sannsynligheten for konge på andre kort, når det betinges på at første trekte kort er konge, P (K K 1, opplagt er 3/51 (tre konger igjen blant de 51 resterende kortene. b Vi tenker oss en tifeldig valgt enhet fra produksjonen når begge maskinene er i drift. La D = enheten er defekt, A = enheten er produsert på maskin A, og B = enheten er produsert på maskin B. Vi er interessert i P (D. Begivenhetene A og B er komplementet til hverande, og loven om total sannsynlighet gir: P (D = P (D AP (A + P (D BP (B Den betingede sannsynligheten P (D A er sannsynligheten for at en tilfeldig valg enhet som er produsert med maskin A, er defekt, og den sannsynligheten er oppgitt til å være 0.04. Sannsynligheten P (A er sannsynligheten for at en tilfeldig valgt enhet er produsert på maskin A, som er oppgitt til å være 0.35. Tilsvarende har vi at P (D B = 0.07 og P (B = 0.65. Derfor får vi: P (D = P (D AP (A + P (D BP (B = 0.04 0.35 + 0.07 0.65 = 0.0595. Dvs.: 5.95% vil være den samlede defektprosenten dersom begge maskinene blir tatt i bruk.
ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 6 c Siden B og B er disjunkte (B B =, er det klart at de to begivenhetene A B og A B også er disjunkte. I tillegg, siden B og B dekker hele utfallsrommet (B B = Ω, må vi ha at A = (A B (A B; se gurene til høyre. Atså: P (A = P ((A B (A B, og disjunktheten medfører at: P ( (A B (A B = P (A B + P (A B. Dermed har vi: P (A = P ( (A B (A B = P (A B + P (A B = P (A BP (B + P (A BP (B Den siste overgangen er Multiplikasjonssetningen for sannsynligheter som det er hintet om i oppgaven.