Eksamensoppgåve i TMA4240 Statistikk

Like dokumenter
TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i SØK1004 Statistikk for økonomer

EKSAMEN I EMNE TMA4245 STATISTIKK

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Om eksamen. Never, never, never give up!

HØGSKOLEN I STAVANGER

Eksamensoppgave i TMA4245 Statistikk

EKSAMENSOPPGAVE STA-1001.

Eksamensoppgave i SØK Statistikk for økonomer

Eksamensoppgåve i TMA4250 Romleg Statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Om eksamen. Never, never, never give up!

EKSAMEN I TMA4240 Statistikk

TMA4240 Statistikk 2014

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen august 2014

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

Eksamensoppgåve i TMA4255 Anvendt statistikk

TMA4240 Statistikk Eksamen desember 2015

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

Eksamensoppgåve i TMA4295 Statistisk inferens

EKSAMEN I TMA4285 TIDSREKKJEMODELLAR Fredag 7. desember 2012 Tid: 09:00 13:00

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

TMA4240 Statistikk Høst 2015

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

TMA4240 Statistikk Høst 2007

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Oppfriskning av blokk 1 i TMA4240

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER

TMA4240 Statistikk Høst 2016

Eksamensoppgåve i LGU52003 MATEMATIKK 2 (5-10), EMNE 2

Eksamensoppgåve i TMA4255 Anvendt statistikk

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

i x i

TMA4240 Statistikk Høst 2015

EKSAMEN I FAG TMA4240 STATISTIKK

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgave i TMA4267 Lineære statistiske modeller

TMA4240 Statistikk Høst 2016

Eksamensoppgave i SØK1004 Statistikk for økonomer

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Kapittel 2: Hendelser

EKSAMEN I TMA4300 BEREGNINGSKREVENDE STATISTIKK Torsdag 16 Mai, 2013

Eksamensoppgave i TMA4295 Statistisk inferens

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen august 2014

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Eksamensoppgave i SØK Statistikk for økonomer

Eksamensoppgåve i TMA4255 Anvendt statistikk

LØSNINGSFORSLAG ) = Dvs

ST0202 Statistikk for samfunnsvitere

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

EKSAMEN I EMNE TMA4245 STATISTIKK

Løsningsforslag, eksamen statistikk, juni 2015

TMA4240 Statistikk H2010

TMA4265 Stokastiske prosessar

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

TMA4240 Statistikk Høst 2009

Transkript:

Institutt for matematiske fag Eksamensoppgåve i TMA4240 Statistikk Fagleg kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806 Eksamensdato: 21. desember 2016 Eksamenstid (frå til): 09:00 13:00 Hjelpemiddelkode/Tillatne hjelpemiddel: C: Tabeller og formler i statistikk (Tapir forlag, Fagbokforlaget), Matematisk formelsamling (K. Rottmann), eit stempla gult A5-ark med eigne handskrivne notat, bestemd enkel kalkulator. Annan informasjon: Alle svara skal grunngis og besvarelsen skal innehalde naturleg mellomrekning. Målform/språk: nynorsk Sidetal: 7 Sidetal vedlegg: 0 Informasjon om trykking av eksamensoppgave Originalen er: 1-sidig 2-sidig sort/hvit farger skal ha fleirvalskjema Dato Kontrollert av: Sign Merk! Studentane finn sensur i Studentweb. Har du spørsmål om sensuren må du kontakte instituttet ditt. Eksamenskontoret vil ikkje kunne svare på slike spørsmål.

TMA4240 Statistikk, 21. desember 2016 nynorsk Side 1 av 7 Oppgåve 1 Elektriske komponentar Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar feil. Vi vel tilfeldig ut ein komponent frå produksjonen og definerer to hendingar: A=komponenten har ein feil av type A, og B=komponenten har ein feil av type B. La A og B vere dei tilhøyrande komplementære hendingane. Det er kjend at P (B) = 0.09, P (A B) = 0.5 og P (A B ) = 0.01. a) Vi ser på ein tilfeldig valt komponent frå produksjonen. Kva er sannsynet for at komponenten både har ein feil av type A og ein feil av type B, dvs. P (A B)? Kva er sannsynet for at komponenten har ein feil av type A, dvs. P (A)? Gitt at komponenten har ein feil av type A, kva er sannsynet for at komponenten har ein feil av type B, dvs. P (B A)? Vi er no kun interessert i om ein komponent er feilfri eller ikkje. Leiinga i bedrifta har over mange år overvaka produksjonen, og er sikre på at sannsynet for at ein tilfeldig valt komponent er feilfri er 0.9. Vi vel tilfeldig ut 20 komponentar frå produksjonen, og undersøkjer om komponentane er feilfrie. La X vere ein stokastisk variabel som angjev talet på feilfrie komponentar. b) Kva for fordeling har X? Grunngi svaret. Kva er sannsynet for at akkurat 19 komponentar er feilfrie? Kva er sannsynet for at fleire enn 15 komponentar er feilfrie? Leiinga i bedrifta har innført nokre endringar i produksjonsprosessen og håper at det har ført til auka andel feilfrie komponentar. Kall den ukjende andelen av feilfrie komponentar for p. Vi trekkjer eit tilfeldig utval på n komponentar frå den nye produksjonsprosessen og lar X vere talet på feilfrie komponentar. Ein intuitiv estimator for p er andelen feilfrie komponentar i utvalet, dvs. ˆP = X. n Når vi har observert X = x feilfrie komponentar kan vi rekne ut eit estimat for p som ˆp = x. Det tilfeldige utvalet av storleik n er så stort at vi kan anta at X np n er tilnærma standard normalfordelt. c) Utlei eit 90% konfidensintervall for p. Rekn ut konfidensintervallet når n = 500 og x = 470. Gjev ei kort tolking av intervallet. nˆp(1 ˆp)

Side 2 av 7 TMA4240 Statistikk, 21. desember 2016 nynorsk Oppgåve 2 Varians og kovarians I denne oppgåva skal vi sjå på korleis vi kan rekne ut forventningsverdi og varians til eit gjennomsnitt når observasjonane som inngår i gjennomsnittet er avhengige. La X 1 og X 2 vere stokastiske variablar med E(X 1 ) = E(X 2 ) = 2, Var(X 1 ) = Var(X 2 ) = 1 og Cov(X 1, X 2 ) = 1 2. Finn E( 1 2 X 1 + 1 2 X 2) og Var( 1 2 X 1 + 1 2 X 2). La vidare X 1, X 2,..., X 10 vere stokastiske variablar med E(X i ) = 2 og Var(X i ) = 1 for i = 1, 2,..., 10 og Cov(X i, X j ) = 1 for alle i = 1, 2,..., 10 og j = 1, 2,..., 10 2 der i j. La X = 1 10 10 i=1 X i. Finn E( X) og Var( X). Hint: du kan bruke følgjande formel for variansen til ein sum (som du og finn i Tabeller og formler i statistikk) n n n n n Var( a i X i +b) = a i a j Cov(X i, X j ) = a 2 i 1 i Var(X i )+2 a i a j Cov(X i, X j ). i=1 i=1 j=1 i=1 i=2 j=1

TMA4240 Statistikk, 21. desember 2016 nynorsk Side 3 av 7 Oppgåve 3 Høgde til mannlege studentar Vi studerer ein populasjon av mannlege studentar, og antar at høgda til ein tilfeldig valt mann frå populasjonen er normalfordelt med forventningsverdi µ og varians σ 2. a) Anta (kun i dette punktet) at µ = 181 cm og σ = 6 cm. Vi trekkjer tilfeldig ut to mannlege studentar frå populasjonen og lar X 1 angi høgda til den første studenten og X 2 høgda til den andre. Vi antar at X 1 og X 2 er uavhengige stokastiske variablar. Rekn ut følgjende sannsyn: P(X 1 > 190) P(X 1 > 190 X 1 > 185) P(X 1 > 190 X 2 > 185) To forskingsgrupper har uavhengig av kvarandre estimert forventa høgde til mannlege studentar, µ. Forskingsgruppe 1 henta eit tilfeldig utval av storleik n og observerte høgdene x 1, x 2,..., x n, og forskingsgruppe 2 henta eit tilfeldig utval av storleik m og observerte høgdene y 1, y 2,..., y m. Dei to utvala blei trekte uavhengig av kvarandre frå den gitte populasjonen. Begge forskingsgruppene brukte empirisk middelverdi (gjennomsnitt) som estimator for µ, X = (X1 + X 2 +... + X n )/n og Ȳ = (Y 1 + Y 2 +... + Y m )/m, og forskingsgruppe 1 fann x = 180 cm og forskingsgruppe 2 fann ȳ = 183 cm. Du har studert statistikk og veit at du kan kombinere estimatar frå uavhengige studium til å lage eit estimat for µ som har lågare usikkerheit enn kvart av estimata separat. Du har bestemt deg for å bruke estimatoren der a og b er reelle tal. ˆµ = a X + bȳ, b) Forklar kva for to eigenskapar som kjenneteiknar ein god estimator. Finn uttrykk for a og b (som funksjonar av n og m) slik at ˆµ er ein estimator for µ som oppfyller eigenskapane over. Kva blir ditt estimat for µ dersom n = 64 og m = 192?

Side 4 av 7 TMA4240 Statistikk, 21. desember 2016 nynorsk Ved nærare ettertanke synes du at skilnaden mellom estimata til dei to forskingsgruppene er urimelig stor i forhold til deira utvalsstorleikar n = 64 og m = 192. Din påstand er at du trur at dei to forskingsgruppene ikkje har henta utvala sine frå den same populasjonen. Anta at forskingsgruppe 1 henta eit tilfeldige utval frå ein normalfordelt populasjon med forventningsverdi µ 1 og standardavvik σ 1, og at forskingsgruppe 2 henta et tilfeldige utval frå ein normalfordelt populasjon med forventningsverdi µ 2 og standardavvik σ 2. Du har tidlegare fått oppgitt at x = 180 cm og ȳ = 183 cm. Du kontaktar forskingsgruppene og dei sender deg dei empiriske standardavvika for sine observasjonar, s 1 = 6.0 for forskingsgruppe 1 og s 2 = 5.5 for forskingsgruppe 2. c) Bruk påstanden din (gitt tidlegare i teksten) til å formulere ein null- og ein alternativ hypotese. Det er oppgitt at formelen for talet på fridomsgrader i ein test av forskjell i forventningsverdier når σ 1 kan vere ulik σ 2, er ν = (s 2 1/n + s 2 2/m) 2 (s 2 1/n) 2 /(n 1) + (s 2 2/m) 2 /(m 1) = 100.6 innsett numeriske verdiar for s 1, s 2, n og m som oppgitt i oppgåva. Argumenter for kvifor denne testen kan brukast og finn forkastingsområde for testen når signifikansnivået er α = 0.05. Kva blir konklusjonen av hypotesetesten når du bruker data som er oppgitt?

TMA4240 Statistikk, 21. desember 2016 nynorsk Side 5 av 7 Oppgåve 4 Fødselsvekt og gestasjonsalder I figur 1 finn du eit kryssplott (scatter plot) av fødselsvekt (målt i kg) og gestasjonsalder (tid frå første dag i siste menstruasjonsperiode til mor, målt i veker) for n = 17 fødsler. Vi ønsker å tilpasse ein enkel lineær regresjonsmodell Y i = β 0 + β 1 x i + ɛ i, i = 1, 2,..., n, der kvar ɛ i er ein normalfordelt stokastisk variabel med forventningsverdi 0 og varians σ 2. Vidare er ɛ 1, ɛ 2,..., ɛ n uavhengige, og Y i er fødselsvekt og x i er gestasjonsalder. 5 Fødselsvekt (kg) 4 3 2 1 0 30 35 40 Gestasjonsalder (uker) Figur 1: Kryssplott av fødselsvekt, y i, og gestasjonsalder, x i for i = 1,..., 17 barn. a) Diskuter om det er rimelig å nytte ein lineær regresjonsmodell for observasjonane vist i figur 1. Forklar korleis minste kvadraters (least squares) metode kan brukast til å finne estimatorar B 0 for β 0 og B 1 for β 1, og illustrer med ein figur. Du skal ikkje utleie uttrykka for estimatorane. Det er gitt at estimatet for β 0 blir 4.02 og for β 1 blir 0.18. Finn predikert fødselsvekt for barn ved gestasjonsalder 40 veker.

Side 6 av 7 TMA4240 Statistikk, 21. desember 2016 nynorsk b) Finn eit uttrykk for variansen til Ŷ0 = B 0 + B 1 x 0, der B 0 og B 1 er minste kvadraters estimatorane (least squares estimators) for β 0 og β 1. Du kan bruke at Ȳ = 1 n ni=1 Y i og B 1 er uavhengige stokastiske variablar. Studer figur 2 og bruk uttrykket for variansen til Ŷ 0 til å forklare kvifor estimatet for forventningsverdien E(Ŷ0) er meir usikkert ved x 0 = 29 uker enn ved x 0 = 39 uker. Fødselsvekt (kg) 5 4 3 2 1 Estimert forventningsverdi 95% Konfidensintervall 0 30 35 40 Gestasjonsalder (uker) Figur 2: Kryssplott av fødselsvekt og gestasjonsalder for 17 barn med estimert forventningsverdi for fødselsvekt (regresjonslinje) og grenser for 95% konfidensintervall for forventet fødselsvekt som funksjon av gestasjonsalder.

TMA4240 Statistikk, 21. desember 2016 nynorsk Side 7 av 7 Oppgåve 5 Generere data Anta at Y er uniformt fordelt med sannsynstettleik Finn kumulativ fordeling F Y (y) til Y. 1, 0 < y < 1, f Y (y) = 0, elles. På ei datamaskin generer vi ofte observasjonar frå ei fordeling ved først å generere ein observasjon frå ei uniform fordeling og så transformere observasjonen. Vi skal sjå på transformasjonen X = ln(y )/λ, der λ > 0. Bruk F Y (y) til å finne kumulativ fordeling F X (x) for X. Kva blir sannsynstettleiken f X (x) til X, og kva for kjent statistisk fordeling er dette?