Løsningsforslag, eksamen statistikk, juni 2015

Like dokumenter
Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk Høst 2007

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Løsningsforslag statistikkeksamen desember 2014

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2015

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Fasit for tilleggsoppgaver

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

TMA4240 Statistikk Eksamen desember 2015

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

TMA4240 Statistikk Høst 2009

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

HØGSKOLEN I STAVANGER

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

TMA4240 Statistikk Høst 2008

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

TMA4240 Statistikk 2014

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

ÅMA110 Sannsynlighetsregning med statistikk, våren

Løsning eksamen desember 2017

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Kapittel 2: Hendelser

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

TMA4240 Statistikk Høst 2015

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

TMA4240 Statistikk Høst 2009

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Løsningsforslag eksamen 25. november 2003

TMA4240 Statistikk Eksamen desember 2015

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Løsning eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Løsningsforslag eksamen 27. februar 2004

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2009

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

UNIVERSITETET I OSLO

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Eksamensoppgåve i TMA4240 Statistikk

TMA4245 Statistikk Eksamen august 2014

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Løsningsforslag: STK2120-v15.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

FORMELSAMLING TIL STK1100 OG STK1110

HØGSKOLEN I STAVANGER

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Gammafordelingen og χ 2 -fordelingen

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

TMA4240 Statistikk Høst 2016

Løsningsforslag til oppgaver brukt i STA100

i x i

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

To-dimensjonale kontinuerlige fordelinger

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Regneøvelse 22/5, 2017

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Oppgave N(0, 1) under H 0. S t n 3

EKSAMEN I HSTAT1101, 22. NOVEMBER 2018: LØSNINGSFORSLAG. Knut R. Wangen, Innledning

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Kapittel 4: Matematisk forventning

TMA4240 Statistikk H2010 (20)

LØSNING: Eksamen 22. mai 2018

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Faktor - en eksamensavis utgitt av ECONnect

Kontinuerlige sannsynlighetsfordelinger.

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

Fasit og løsningsforslag STK 1110

ST1201 Statistiske metoder

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Transkript:

Løsningsforslag, eksamen statistikk, juni 0 Oppgave 1 Siden det spørres om tall fra et intervall, som oppgaven viser kan være et reelle, er det tydelig at tallene er tatt fra en kontinuerlig fordeling. Siden det ikke sies noe mer om denne fordelingen enn at tallene velges tilfeldig, kan vi anta at det er snakk om en uniform fordeling, eller rektangulærfordeling om man vil. Sannsynlighetstettheten har da formen: { a, hvis x [0, 1] f(x) = 0, ellers. der a er en konstant som vi finner ved å kreve at f(x)dx = 1 0 a dx = 1 Utfører vi integralet, finner vi at a = 1. Sannsynligheten for at et tilfeldig valgt tall ligger mellom 0.5 og 1, blir da P (0.5 X 1) = 1 0.5 f(x)dx = 1 0.5 dx = [x] 1 0.5 = 1 0.5 = 0.5 Altså 50%. Dette kunne vi lett argumentert for uten å sette opp et så formelt regnestykke som vi har gjort over. Siden intervallet [0.5, 1] står for halvparten av tallene fra rektangulærfordelingen, er det opplagt at sannsynligheten må være 50%. La Y være antall tall som ligger i dette intervallet blant de 7 tallene som blir generert. Siden sannsynligheten er det samme for hvert tall, har vi at Y bin(7, 0.5). Sannsynligheten for at nøyaktig tall er i det oppgitte intervallet, blir da: ( ) 7 P (Y = ) = 0.5 (1 0.5) 7 = 5 0. 0.065 0.7 1

Oppgave Siden alle lineærkombinasjoner av normalfordelte, stokastiske variable også er normalfordelte, vil Z være normalfordelt med forventning: E(Z) = E(X Y ) = E(X) E(Y ) = 10 = 1 Siden X og Y er uavhengige, blir variansen: Var(Z) = Var(X Y ) = Var(X) + ( ) Var(Y ) = + 9 0.1 = 4.09 ( ) 1 P (Z > ) = 1 P (Z ) = 1 G 1 G(0.49) 4.09 = 1 0.6874 = 0.16 0.1 Oppgave a) Siden utfallsrommet er V x = {0, 1,, } må vi ha at: ( ) 1 x a = 1. 0.5 0 a + 0.5 1 a + 0.5 a + 0.5 a = 1 a(0.5 0 + 0.5 1 + 0.5 + 0.5 ) = 1 som gir oss a = 1 0.5 0 + 0.5 1 + 0.5 + 0.5 = 1 1.875 = 8 b) Forventinga blir: µ = E(S) = = x P (S = x) x = 8 8 ( ) 1 x ( 0 0.5 0 + 1 0.5 1 + 0.5 + 0.5 5) = 11 0.7

Variansen blir: σ = Var(X) = c) Vi definerer to utfall: = x P (X = x) µ x 8 A: Studenten dupper av minst 1 gang. ( ) 1 x ( ) 11 = 8 ( 0 0.5 0 + 1 0.5 1 + 0.5 + 0.5 5) ( 11 = 7 ( ) 11 5 = 194 5 0.86 B: Studenten dupper av nøyaktig ganger. Oppgaven ber oss finne sannsynligheten for at studenten dupper av nøyaktig ganger, gitt at vi vet at han/ho har duppa av minst 1 gang. Med andre ord, vi skal finne. P (B A). Vi bruker loven om betinget sannsynlighet og får: ) P (B A) = P (B A) P (A) P (B A) er sannsynligheten for at en student både dupper av nøyaktig ganger og minst 1 gang. Dersom student dupper av nøyaktig ganger, har han/ho automatisk duppet av minst 1 gang. Vi får da at P (B A) = P (B) slik at: P (B A) = P (B) P (A) Sannsynligheten for at studenten dupper av nøyaktig ganger er: P (B) = P (S = ) = 8 ( ) 1 = 1. Sannsynligheten for at studenten dupper av minst 1 gang er: P (A) = P (S 1) = 8 ( 1 ) 1 + 8 ( 1 ) + 8 P (B A) = P (B) P (A) = 1/ 7/ = 1 7 ( ) 1 = 7

d) La antall avduppinger for student i være angitt ved en stokastisk variabel X i, der i = 1,,,... og der hver X i har fordelingen gitt i starten av oppgaven. La S angi det totale antall avduppinger iløpet av en time. Vi har da: 00 S = Siden hver X i har samme fordeling, og antallet av X i er vi legger sammen er stor (større enn 0), sier sentralgrensesetningen at: Vi skal regne ut: S tilnærm. N(nµ, nσ ) = N(00 11/, 00 194/5) N(0, 776 ) X i P (00 S 50) = P (S 50) P (S < 00) Dette er tilfelle uansett om S er tilnærmet normalfordelt eller ikke. Siden S egentlig er diskret, har vi P (S < 00) = P (S 199). Vi bruker så normaltilnærmelsen (med heltallskorreksjon): P (S 50) P (S 199) G 50 + 0.5 0 G 776 199 + 0.5 0 776 G(1.90) G( 1.1) = G(1.90) (1 G(1.7)) = G(1.90) + G(1.7) 1 = 0.971 + 0.8980 1 = 0.869 0.869 Kommentar 1: Det er også mulig å si at S er tilnærmet normalfordelt allerede før man setter opp regnestykket. Forskjellen i regnestykket blir da at vi får P (S < 00) = P (S 00) dersom vi behandler S som kontinuerlig. I dette tilfelle ville faktisk heltallskorreksjonen +0.5 gitt en mindre korrekt tilnærming siden det egentlig skal være P (S < 00) = P (S 199). Riktig bruk av heltallskorreksjon i dette tilfelle, ville vært å legge til -0.5 istedenfor +0.5. Vi hadde da endt opp med samme verdi som når vi regnet ut P (S 199) med +0.5 heltallskorreksjon. Kommentar : Det er også mulig å tolke oppgaven slik at mellom 00 og 50 betyr at 00 og 50 ikke skal være med, altså at man skal regne ut P (00 < S < 50). Dette ansees som en akseptabel måte å tolke oppgaveteksten og vil ikke gi trekk. 4

Oppgave 4 Vi definerer to utfall: A: Artikkel nr. 1 blir akseptert. B: Artikkel nr. blir akseptert. I oppgaveteksten får vi oppgitt at P (A) = 0.7 og P (B) = 0.4. Sannsynligheten for at minst 1 artikkel blir avvist, blir da unionen av A (artikkel 1 blir avvist) og B (artikkel blir avvist). Med andre ord: P (A B) = 0.75. Vi skal finne sannsynligheten for at minst 1 artikkel blir akseptert, altså P (A B). Vi buker den generelle addisjonssetningen og får: P (A B) = P (A) + P (B) P (A B) For å se sammenhengen mellom P (A B) og P (A B), er det en fordel å tegne et venndiagram: P (A B) er det området hvor minst 1 artikkel blir avvist. Dette blir alt som ligger enten utenfor A, utenfor B eller begge deler. Dette er alt utenom det området hvor begge blir akseptert, altså P (A B). Vi har med andre ord: P (A B) = 1 P (A B) = 1 0.75 = 0.5. P (A B) = P (A) + P (B) P (A B) = 0.7 + 0.4 0.5 = 0.85 5

Oppgave 5 Siden både forventinga og variansen er ukjent, må vi bruke t-fordelingen. Konfidenintervallet er da gitt ved: y ± t α/,n 1 S n Vi finner den estimerte variansen, S : Vi har y = 1 19 S = 1 n 1 19 Den estimerte variansen blir da: S = 1 19 1 ( 19 ( ) yi ny y i = 1 561 = 76.894768 19 ) yi ny = 1 18 (1469945 19 (76.894768) ) = 7.47485 Dette gir oss S = 7.47485 = 7.081965. Siden vi skal finne et 95% konfidensintervall, har vi α = 0.05. Fra tabellen finner vi t α/,n 1 = t 0.05,18 =.101. Konfidensintervallet blir dermed: 76.894768 ±.101 7.081965 19 76.894768 ± 1.055718 Dersom vi runder av, får vi dermed [64, 90] Oppgave 6 a) Vi skal finne Ŷ = ˆβ 0 + ˆβ 1 x. Fra formelheftet, har vi: ( ) ˆβ 1 = 1 x i Y i xy M 6

hvor M = x i nx Vi har: x = 1 n Y = 1 n x i = 1 4 = 6 9 Y i = 1 811. = 90.1444... 9 M = x i nx = 10144 9 (6) = 4060 ( ) ˆβ 1 = 1 x i Y i nxy M Videre har vi = 1 (468.6 9 6 90.1444...) = 0.870640941 0.87 4060 ˆβ 0 = Y ˆβ 1 x = 90.1444... 0.870640941 6 67.5 Den estimerte regresjonslinjen blir dermed: b) Vi setter opp følgende hypoteser: Ŷ = ˆβ 0 + ˆβ 1 x = 67.5 + 0.87x H 0 : β 1 = 0.85 mot H 1 : β 1 > 0.85 For å utføre testen, bruker vi testobservatoren: U 0 = ˆβ 1 β1 0 σ = M 0.870640941 0.85 0.01 4060 1. Vi sammenlikner denne med U 0.01 =.6 som vi finner i tabellen. Siden U 0 > U 0.01, kan vi forkaste nullhypotesen og vi har dermed grunnlag til å påste at tallet 0.85 var for lite. 7