a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x 1 + + x 12 ) = 1 (755 + 708 + + 748) = 8813/12 = 734.4

Like dokumenter
(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Løsningsforslag Til Statlab 5

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Motivasjon for kurset. ÅMA110 Sannsynlighetsregning med statistikk, våren Oppsummering. ÅMA110 Sannsynlighetsregning med statistikk våren 2008

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

TMA4240 Statistikk Høst 2012

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Statistikk og dataanalyse

TMA4240 Statistikk Høst 2009

Repeterbarhetskrav vs antall Trails

UNIVERSITETET I OSLO

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Repeterbarhetskrav vs antall Trails

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

6.2 Signifikanstester

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Regler i statistikk STAT 100

Løsningsforslag til seminar 4 Undervisningsfri uke

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Hypotesetesting, del 5

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2010 Løsninger til regneøving nr. 11 (s. 1) der

Betinget sannsynlighet

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

ST0202 Statistikk for samfunnsvitere

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

HØGSKOLEN I STAVANGER

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Hypotesetesting. mot. mot. mot. ˆ x

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

TMA4245 Statistikk Vår 2007

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Kp. 13. Enveis ANOVA

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Kp. 9.8 Forskjell mellom to forventninger

Kort overblikk over kurset sålangt

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Løsningsforslag AA6524/AA6526 Matematikk 3MX Elever/Privatister 6. desember eksamensoppgaver.org

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,

ST0202 Statistikk for samfunnsvitere

Løsningskisse seminaroppgaver uke 11 ( mars)

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Eksamen i emnet Stat111 - Statistiske metoder 28. mai 2014, kl

Løsningsforslag, eksamen statistikk, juni 2015

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Kapittel 9 og 10: Hypotesetesting

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Mer om hypotesetesting

HØGSKOLEN I STAVANGER

Statistikk 1 kapittel 5

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

Medisinsk statistikk Del I høsten 2008:

TMA4240 Statistikk Høst 2007

Høgskolen i Gjøviks notatserie, 2001 nr 5

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO

Kapittel 3: Studieopplegg

TMA4240 Statistikk 2014

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

i x i

Transkript:

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 1 (Det tas forbehold om feil i løsningsforslaget. Oppgave 1 Vi betrakter dataene x 1,..., x 1 somutfall av n = 1 u.i.f. tilfeldige variable X 1,..., X 1, og vi setter E(X i = µ og SD(X i = σ. a Forventningen estimeres med gjennomsnittet: x = 1 1 (x 1 + + x 1 = 1 (755 + 708 + + 748 = 8813/1 = 734.4 1 Standardavviket, σ, estimeres med: s = 1 5 1 (x i x 1 1 = 466.9 = 14.98 1 1 i=1 Standardavviket til µ = X, er SD(X = σ 1 b Vi vil teste: H 0 : µ = 750 mot H 1 : µ < 750 Her er σ ukjent og antall data, n = 1, ikke stort nok til å basere seg på tilnærmet standard normalfordeling. Derfor må vi bruke t-fordeling og t-test. Dette forutsetter at dataene med rimelighet kan sies å komme fra en normalfordeling, N(µ, σ. Et histogram over dataene, se gur til høyre, indikerer at dette ikke er urimelig. Frequency 0.0 0.5 1.0 1.5.0.5 3.0 Histogram of vekter 700 710 70 730 740 750 760 vekter Dersom H 0 er korrekt er t(11-tetthet. Nullfordeling til T T = X 750 s/ 1 = t(11 } {{ } teststørrelse 0.0 0.1 0. 0.3 0.4-3 - -1 0 1 3 Med signikansnivå 5%, dvs α = 0.05, forkaster vi H 0 dersom T t 0.05,11 = 1.796 (merket av i guren over med rød pil; forkastningsområdet er: (, 1.796]. 734.4 750 Utfall av teststørrelsen: 14.98/ 1 = 3.61 Siden 3.61 < 1.796, blir konklusjonen forkast H 0. Dataene gir grunnlag for å påstå at forventet brødvekt er lavere enn 750 gram.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. Oppgave a Populasjon: alle stemmeberettigede i Stavanger. Det gjøres et tilfeldig utvalg på n =, og hver spørres om de vil stemme FRP. Svaret for hver enkeltperson i utvalget ses på som et enkeltforsøk. Da har vi: 1. resultatene i enkeltforsøkene er (tilnærmet uavhengige av hverandre fordi utvalget er en liten del av hele populasjonen,. i hvert av de n = enkeltforsøkene registreres det om personen vil stemme FRP (suksess eller ikke. (ett av to mulige utfall, og 3. suksessannsynligheten, (P( en tilf. valgt person vil stemme FRP, er konstant i alle enkeltforsøkene. Derfor har vi en binomisk forsøksrekke, og er antall suksesser er da binomisk fordelt. Partiets virkeklige oppslutning er andelen av alle de stemmeberettigede som vil stemme FRP, dvs.: p = M/N, der N = antall stemmeberettigede i populasjonen, og M = antall blant de stemmeberettigede i populasjonen, som vil stemme FRP på det aktuelle tidspunktet. Dvs.: p = M/N er en populasjonsparameter, og vi kjenner ikke verdien denne har. Denne parameteren, p, er suksessannsynligheten i den binomiske fordelingen. b Resultatet 17.8% er et estimat av p. Dette estimatet har framkommet ved at 74 av de spurte, sa at de ville stemme FRP (det skulle kanskje heller vært oppgitt 17.7%. De spurte er et tilfeldig utvalg, og et annet tilfeldig utvalg ville kunne resultert i et annet antall FR-stemmere og dermed et annet resultat, selv om andelen p = M/N er nøyaktig den samme. Antall FRP-stemmere som kommer med i et tilfeldig utvalg på, er binomisk fordelt med n = og p = M/N som suksessannsynlighet. Spredningen i fordelingen til estimatoren er et mål på usikkerheten i anslaget. Vanligvis p(1 p 0.178(1 0.178 angitt med standardfeilen: SD( p = som utregnet blir: = 0.0187. n Med virkelig p antatt til å være p = 0.155, vil Y = antall FRP-stemmere i et tilfeldig utvalg på n =, være binomisk fordelt med n = og p = 0.155 som suksessannsynlighet. Da har vi: Meningsmåling viser minst 17.8% FRP ( p = Y/n 0.178 ( Y n 0.178 = 74, P ( p 0.178 = 1 P ( p < 0.178 = 1 P (Y 73 ( 1 P Z 73 0.5 0.155 = 1 P (Z 1.06 = 1 0.8554 = 0.1446 0.155(1 0.155

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 3 c Et (tilnærmet 95% kondensintervall for virkelig FRP-oppslutning er gitt ved: ( p 1.96 Innsatt data: p(1 p, p + 1.96 n p(1 p n ( 0.178(1 0.178 0.178(1 0.178 0.178 1.96, 0.178 + 1.96 = (0.141, 0.15 Fortolkning: det er god grunn til å tro at virkelig FRP-oppslutning er i intervallet mellom 14.1% og 1.5%. Vi kan tenke oss at vi gjør meningsmålingen ere ganger under samme forhold. Vi vil få litt variasjon i resultatene mellom hver gang. Ved å beregne et 95% kondensintervall hver gang, vil disse intervallene ha den egenskap at tilnærmet 95% av de vil inneholde den virkelige andelen, p, FRP-stemmere. d H 0 : p = 0.155 H 1 : p > 0.155. Teststørrelse: Z = p 0.155 0.155(1 0.155 Nullfordeling: standardnormal; skisse i gur til høyre.. 0.0 0.1 0. 0.3 0.4 3 1 0 1 3 z Test: forkaster H 0 dersom utfallet av Z er større enn 1.645 (énsidig test. Eller, ekvivalent: forkaster H 0 dersom p-verdien til resultatet er mindre enn 0.05. Utfall av Z: ikke forkaste H 0. 0.178 0.155 0.155(1 0.155 = 1.98. Siden Z-utfallet ikke er større enn 1.645, kan vi Alternativt: p verdi = P (Z 1.98 = 1 P (Z < 1.98 = 1 0.903 = 0.0968 > 0.05, (skravert rødt i guren under. Konklusjon: vi kan ikke forkaste H 0. Det er ikke grunnlag for å påstå at FRP har høyere oppslutning i populasjonen ved tidspunktet for meningsmålingen enn ved forrige valg. 0.0 0.1 0. 0.3 0.4 3 1 0 1 3 z

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 4 Oppgave 3 a La X være antall riktige prediksjoner av de n = 1000 forsøkene. Vi kan betrakte hvert av de n = 1000 forsøkene som en binomisk forsøksrekke. I hvert forsøk er det suksess- (prediksjonen er riktig eller asko (feil prediksjon utfall. Dersom en person ikke har overnaturlige evner, vil det være en sannsynlighet p = 1/4 for suksess hver gang, og det er ingen ting som vi kunne gi noen form for avhengighet mellom ulike ganger, siden det er tilfeldig og uavhengig fra forsøk til forsøk hvilket lys som lyser opp. Derfor vil X = antall riktig prediksjoner, være binomisk fordelt med n = 1000 og med p = 1/4 for en person uten paranormale evner. Histogrammet til denne fordelingen med tilhørende normalfordelingskurve (som tilnærming i rødt er vist i guren under. 0.000 0.010 0.00 158 178 198 18 38 58 78 98 318 Vi kan vurdere om en person har paranormale evner i denne situasjonen ved å teste: H 0 : p = 0.5 H 1 : p 0.5. Det kan være greit å ha tosidig alternativ her det vil jo også være bemerkelsesverdig om en person hadde spesielle evner til å unngå å predikere den pæren som kom til å lyse opp! Teststørrelse: Z = p 0.5 0.5(1 0.5 1000. Nullfordeling: standardnormal. (Her er p = X/1000. Test: Forkast H 0 og påstå paranormalitet! dersom utfallet av Z er større enn 1.96 eller mindre enn -1.96 I forhold til X som teststørrelse (relatert til fordelingen i guren, blir testen: forkast H 0 dersom antall riktige prediksjoner, X, er større enn 1000 0.5+1.96 1000 0.5 (1 0.5 76 eller dersom X er mindre enn 1000 0.5 1.96 1000 0.5 (1 0.5 3. Resultater i intervallet 3 76 kan med rimelighet hevdes å være utslag kun av tilfeldigheter.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 5 Oppgave 4 a Ett tilfeldig vagt kort fra en kortstokk; P (kortet er en konge = 4 5 = 1 13. To tilfeldig vagte kort fra en kortstokk; 1. Vi lar utfallsrommet bestå av alle ( 5 mulige tokortsutvalg fra en kortstokk. Alle disse har like stor sannsynlighet for å bli trukket ut; utfallsrommet har uniform sannsynlighetsmodell. Blant de ( 5 utvalgene er det som består av to konger. Derfor blir sannsynligheten P (to konger = ( 4 ( 5 = 4 3/ 5 51/ = 1 1 13 17 = 1 1.. P (to konger = P (K K 1 = P (K K 1 P (K 1 = 3 4 51 5 = 1 1 17 13 = 1 1. ( 4 ulike tokortsutvalg Her det brukt at P (K 1 = P (konge på første trekte kort opplagt er 4/5, og at sannsynligheten for konge på andre kort, når det betinges på at første trekte kort er konge, P (K K 1, opplagt er 3/51 (tre konger igjen blant de 51 resterende kortene. b Vi tenker oss en tifeldig valgt enhet fra produksjonen når begge maskinene er i drift. La D = enheten er defekt, A = enheten er produsert på maskin A, og B = enheten er produsert på maskin B. Vi er interessert i P (D. Begivenhetene A og B er komplementet til hverande, og loven om total sannsynlighet gir: P (D = P (D AP (A + P (D BP (B Den betingede sannsynligheten P (D A er sannsynligheten for at en tilfeldig valg enhet som er produsert med maskin A, er defekt, og den sannsynligheten er oppgitt til å være 0.04. Sannsynligheten P (A er sannsynligheten for at en tilfeldig valgt enhet er produsert på maskin A, som er oppgitt til å være 0.35. Tilsvarende har vi at P (D B = 0.07 og P (B = 0.65. Derfor får vi: P (D = P (D AP (A + P (D BP (B = 0.04 0.35 + 0.07 0.65 = 0.0595. Dvs.: 5.95% vil være den samlede defektprosenten dersom begge maskinene blir tatt i bruk.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 011, s. 6 c Siden B og B er disjunkte (B B =, er det klart at de to begivenhetene A B og A B også er disjunkte. I tillegg, siden B og B dekker hele utfallsrommet (B B = Ω, må vi ha at A = (A B (A B; se gurene til høyre. Atså: P (A = P ((A B (A B, og disjunktheten medfører at: P ( (A B (A B = P (A B + P (A B. Dermed har vi: P (A = P ( (A B (A B = P (A B + P (A B = P (A BP (B + P (A BP (B Den siste overgangen er Multiplikasjonssetningen for sannsynligheter som det er hintet om i oppgaven.