TMA4245 Statistikk Eksamen desember 2016

Like dokumenter
Eksamensoppgåve i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk 2014

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

TMA4240 Statistikk Eksamen desember 2015

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

HØGSKOLEN I STAVANGER

Om eksamen. Never, never, never give up!

TMA4240 Statistikk Høst 2009

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

TMA4240 Statistikk Høst 2007

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Om eksamen. Never, never, never give up!

EKSAMENSOPPGAVE STA-1001.

TMA4240 Statistikk Høst 2015

i x i

TMA4240 Statistikk Høst 2016

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk Høst 2016

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk Høst 2015

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgave i TMA4245 Statistikk

Fasit for tilleggsoppgaver

Eksamensoppgave i TMA4245 Statistikk

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

EKSAMEN I EMNE TMA4245 STATISTIKK

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4240 Statistikk Høst 2009

LØSNINGSFORSLAG ) = Dvs

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2018

Eksamensoppgave i TMA4240 Statistikk

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Kapittel 10: Hypotesetesting

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

EKSAMEN I TMA4240 Statistikk

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Kap. 6, Kontinuerlege Sannsynsfordelingar

Løsningsforslag, eksamen statistikk, juni 2015

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

TMA4240 Statistikk Høst 2015

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Løsning eksamen desember 2016

Kapittel 2: Hendelser

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Kap. 6, Kontinuerlege Sannsynsfordelingar

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i SØK Statistikk for økonomer

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4255 Anvendt statistikk

TMA4240 Statistikk Høst 2008

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

HØGSKOLEN I STAVANGER

EKSAMEN I TMA4255 ANVENDT STATISTIKK

ÅMA110 Sannsynlighetsregning med statistikk, våren

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

UNIVERSITETET I OSLO

TMA4240 Statistikk H2010 (22)

Løsningsforslag eksamen 25. november 2003

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

TMA4240 Statistikk H2010

Eksamensoppgave i SØK1004 Statistikk for økonomer

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Oppfriskning av blokk 1 i TMA4240

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Eksamensoppgave i TMA4255 Anvendt statistikk

Transkript:

Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar feil. Vi vel tilfeldig ut ein komponent frå produksjonen og definerer to hendingar: A=komponenten har ein feil av type A, og B=komponenten har ein feil av type B. La A og B vere dei tilhøyrande komplementære hendingane. Det er kjend at P (B) = 0.09, P (A B) = 0.5 og P (A B ) = 0.01. a) Vi ser på ein tilfeldig valt komponent frå produksjonen. Kva er sannsynet for at komponenten både har ein feil av type A og ein feil av type B, dvs. P (A B)? Kva er sannsynet for at komponenten har ein feil av type A, dvs. P (A)? Gitt at komponenten har ein feil av type A, kva er sannsynet for at komponenten har ein feil av type B, dvs. P (B A)? Vi er no kun interessert i om ein komponent er feilfri eller ikkje. Leiinga i bedrifta har over mange år overvaka produksjonen, og er sikre på at sannsynet for at ein tilfeldig valt komponent er feilfri er 0.9. Vi vel tilfeldig ut 20 komponentar frå produksjonen, og undersøkjer om komponentane er feilfrie. La X vere ein stokastisk variabel som angjev talet på feilfrie komponentar. b) Kva for fordeling har X? Grunngi svaret. Kva er sannsynet for at akkurat 19 komponentar er feilfrie? Kva er sannsynet for at fleire enn 15 komponentar er feilfrie? Leiinga i bedrifta har innført nokre endringar i produksjonsprosessen og håper at det har ført til auka andel feilfrie komponentar. Kall den ukjende andelen av feilfrie komponentar for p. Vi trekkjer eit tilfeldig utval på n komponentar frå den nye produksjonsprosessen og lar X vere talet på feilfrie komponentar. Ein intuitiv estimator for p er andelen feilfrie komponentar i utvalet, dvs. ˆP = X n. Når vi har observert X = x feilfrie komponentar kan vi rekne ut eit estimat for p som ˆp = x n. Det X np tilfeldige utvalet av storleik n er så stort at vi kan anta at er tilnærma standard nˆp(1 ˆp) normalfordelt. c) Utlei eit 90% konfidensintervall for p. Rekn ut konfidensintervallet når n = 500 og x = 470. eksdes16-oppg-n 23. juni 2017 Side 1

Gjev ei kort tolking av intervallet. Oppgave 2 I denne oppgåva skal vi sjå på korleis vi kan rekne ut forventningsverdi og varians til eit gjennomsnitt når observasjonane som inngår i gjennomsnittet er avhengige. La X 1 og X 2 vere stokastiske variablar med E(X 1 ) = E(X 2 ) = 2, Var(X 1 ) = Var(X 2 ) = 1 og Cov(X 1, X 2 ) = 1 2. Finn E( 1 2 X 1 + 1 2 X 2) og Var( 1 2 X 1 + 1 2 X 2). La vidare X 1, X 2,..., X 10 vere stokastiske variablar med E(X i ) = 2 og Var(X i ) = 1 for i = 1, 2,..., 10 og Cov(X i, X j ) = 1 2 for alle i = 1, 2,..., 10 og j = 1, 2,..., 10 der i j. La X = 1 10 10 i=1 X i. Finn E( X) og Var( X). Hint: du kan bruke følgjande formel for variansen til ein sum (som du og finn i Tabeller og formler i statistikk) n Var( a i X i + b) = i=1 n n a i a j Cov(X i, X j ) = i=1 j=1 n n i 1 a 2 i Var(X i ) + 2 a i a j Cov(X i, X j ). i=1 i=2 j=1 Oppgave 3 Vi studerer ein populasjon av mannlege studentar, og antar at høgda til ein tilfeldig valt mann frå populasjonen er normalfordelt med forventningsverdi µ og varians σ 2. a) Anta (kun i dette punktet) at µ = 181 cm og σ = 6 cm. Vi trekkjer tilfeldig ut to mannlege studentar frå populasjonen og lar X 1 angi høgda til den første studenten og X 2 høgda til den andre. Vi antar at X 1 og X 2 er uavhengige stokastiske variablar. Rekn ut følgjende sannsyn: P(X 1 > 190) P(X 1 > 190 X 1 > 185) P(X 1 > 190 X 2 > 185) To forskingsgrupper har uavhengig av kvarandre estimert forventa høgde til mannlege studentar, µ. Forskingsgruppe 1 henta eit tilfeldig utval av storleik n og observerte høgdene x 1, x 2,..., x n, og forskingsgruppe 2 henta eit tilfeldig utval av storleik m og observerte høgdene y 1, y 2,..., y m. Dei to utvala blei trekte uavhengig av kvarandre frå den gitte populasjonen. Begge forskingsgruppene brukte empirisk middelverdi (gjennomsnitt) som estimator for µ, X = (X 1 + X 2 +... + X n )/n og Ȳ = (Y 1 + Y 2 +... + Y m )/m, og forskingsgruppe 1 fann x = 180 cm og forskingsgruppe 2 fann ȳ = 183 cm. Du har studert statistikk og veit at du kan kombinere estimatar frå uavhengige studium til å lage eit estimat for µ som har lågare usikkerheit enn kvart av estimata separat. Du har

bestemt deg for å bruke estimatoren ˆµ = a X + bȳ, der a og b er reelle tal. b) Forklar kva for to eigenskapar som kjenneteiknar ein god estimator. Finn uttrykk for a og b (som funksjonar av n og m) slik at ˆµ er ein estimator for µ som oppfyller eigenskapane over. Kva blir ditt estimat for µ dersom n = 64 og m = 192? Ved nærare ettertanke synes du at skilnaden mellom estimata til dei to forskingsgruppene er urimelig stor i forhold til deira utvalsstorleikar n = 64 og m = 192. Din påstand er at du trur at dei to forskingsgruppene ikkje har henta utvala sine frå den same populasjonen. Anta at forskingsgruppe 1 henta eit tilfeldige utval frå ein normalfordelt populasjon med forventningsverdi µ 1 og standardavvik σ 1, og at forskingsgruppe 2 henta et tilfeldige utval frå ein normalfordelt populasjon med forventningsverdi µ 2 og standardavvik σ 2. Du har tidlegare fått oppgitt at x = 180 cm og ȳ = 183 cm. Du kontaktar forskingsgruppene og dei sender deg dei empiriske standardavvika for sine observasjonar, s 1 = 6.0 for forskingsgruppe 1 og s 2 = 5.5 for forskingsgruppe 2. c) Bruk påstanden din (gitt tidlegare i teksten) til å formulere ein null- og ein alternativ hypotese. Det er oppgitt at formelen for talet på fridomsgrader i ein test av forskjell i forventningsverdier når σ 1 kan vere ulik σ 2, er ν = (s 2 1 /n + s2 2 /m)2 (s 2 1 /n)2 /(n 1) + (s 2 2 /m)2 /(m 1) = 100.6 innsett numeriske verdiar for s 1, s 2, n og m som oppgitt i oppgåva. Argumenter for kvifor denne testen kan brukast og finn forkastingsområde for testen når signifikansnivået er α = 0.05. Kva blir konklusjonen av hypotesetesten når du bruker data som er oppgitt? Oppgave 4 I figur 1 finn du eit kryssplott (scatter plot) av fødselsvekt (målt i kg) og gestasjonsalder (tid frå første dag i siste menstruasjonsperiode til mor, målt i veker) for n = 17 fødsler. Vi ønsker å tilpasse ein enkel lineær regresjonsmodell Y i = β 0 + β 1 x i + ɛ i, i = 1, 2,..., n, der kvar ɛ i er ein normalfordelt stokastisk variabel med forventningsverdi 0 og varians σ 2. Vidare er ɛ 1, ɛ 2,..., ɛ n uavhengige, og Y i er fødselsvekt og x i er gestasjonsalder. a) Diskuter om det er rimelig å nytte ein lineær regresjonsmodell for observasjonane vist i figur 1. Forklar korleis minste kvadraters (least squares) metode kan brukast til å finne estimatorar B 0 for β 0 og B 1 for β 1, og illustrer med ein figur. Du skal ikkje utleie uttrykka for

Figur 1: Kryssplott av fødselsvekt, y i, og gestasjonsalder, x i for i = 1,..., 17 barn. estimatorane. Det er gitt at estimatet for β 0 blir 4.02 og for β 1 blir 0.18. Finn predikert fødselsvekt for barn ved gestasjonsalder 40 veker. b) Finn eit uttrykk for variansen til Ŷ0 = B 0 + B 1 x 0, der B 0 og B 1 er minste kvadraters estimatorane (least squares estimators) for β 0 og β 1. Du kan bruke at Ȳ = 1 n n i=1 Y i og B 1 er uavhengige stokastiske variablar. Studer figur 2 og bruk uttrykket for variansen til Ŷ0 til å forklare kvifor estimatet for forventningsverdien E(Ŷ0) er meir usikkert ved x 0 = 29 uker enn ved x 0 = 39 uker. Oppgave 5 Anta at Y er uniformt fordelt med sannsynstettleik { 1, 0 < y < 1, f Y (y) = 0, elles. Finn kumulativ fordeling F Y (y) til Y. På ei datamaskin generer vi ofte observasjonar frå ei fordeling ved først å generere ein observasjon frå ei uniform fordeling og så transformere observasjonen. Vi skal sjå på transformasjonen X = ln(y )/λ, der λ > 0. Bruk F Y (y) til å finne kumulativ fordeling F X (x) for X. Kva blir sannsynstettleiken f X (x) til X, og kva for kjent statistisk fordeling er dette? Fasit

Figur 2: Kryssplott av fødselsvekt og gestasjonsalder for 17 barn med estimert forventningsverdi for fødselsvekt (regresjonslinje) og grenser for 95% konfidensintervall for forventet fødselsvekt som funksjon av gestasjonsalder. 1. a) 0.045, 0.054, 0.83 b) binomisk fordelt, 0.270, 0.957 c) [0.923, 0.957] 2. 2, 0.75, 2, 0.55 3. a) 0.0668, 0.2657, 0.0668 b) a = n/(n + m), b = m/(n + m), 182.25 c) H 0 : µ 1 = µ 2 mot H 1 : µ 1 µ 2, forkast H 0 4. a) 3.18 5. Eksponensialfordeling med forventingsverdi 1/λ