TMA4245 Statistikk Eksamen desember 2016

Like dokumenter
Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i TMA4240 Statistikk

TMA4240 Statistikk Eksamen desember 2015

HØGSKOLEN I STAVANGER

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2009

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2007

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

TMA4240 Statistikk Høst 2015

i x i

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4240 Statistikk

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4240 Statistikk Høst 2015

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

TMA4240 Statistikk Eksamen desember 2015

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2018

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Fasit for tilleggsoppgaver

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

LØSNINGSFORSLAG ) = Dvs

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

EKSAMEN I TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

HØGSKOLEN I STAVANGER

Løsning eksamen desember 2016

Om eksamen. Never, never, never give up!

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4240 Statistikk H2010 (22)

Kapittel 2: Hendelser

Løsningsforslag, eksamen statistikk, juni 2015

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Oppfriskning av blokk 1 i TMA4240

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Om eksamen. Never, never, never give up!

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Løsningsforslag eksamen 25. november 2003

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

ST0202 Statistikk for samfunnsvitere

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010

Eksamensoppgave i TMA4240 Statistikk

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Norske hoppdommere og Janne Ahonen

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

UNIVERSITETET I OSLO

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

TMA4240 Statistikk Høst 2009

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

UNIVERSITETET I OSLO

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4245 Statistikk Eksamen august 2014

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Eksamensoppgave i TMA4255 Anvendt statistikk

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

UNIVERSITETET I OSLO

vekt. vol bruk

ECON240 VÅR / 2016 BOKMÅL

TMA4240 Statistikk Høst 2008

DEL 1 GRUNNLEGGENDE STATISTIKK

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Matematisk Institutt

Transkript:

Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer feil. Vi velger tilfeldig ut en komponent fra produksjonen og definerer to hendelser: A=komponenten har en feil av type A, og B=komponenten har en feil av type B. La A og B være de tilhørende komplementære hendelsene. Det er kjent at P (B) = 0.09, P (A B) = 0.5 og P (A B ) = 0.01. a) Vi ser på en tilfeldig valgt komponent fra produksjonen. Hva er sannsynligheten for at komponenten både har en type A og en type B feil, dvs. P (A B)? Hva er sannsynligheten for at komponenten har en feil av type A, dvs. P (A)? Gitt at komponenten har en feil av type A, hva er sannsynligheten for at komponenten har en feil av type B, dvs. P (B A)? Vi er nå kun interessert i om en komponent er feilfri eller ikke. Ledelsen i bedriften har over mange år overvåket produksjonen, og er sikre på at sannsynligheten for at en tilfeldig valgt komponent er feilfri er 0.9. Vi velger tilfeldig ut 20 komponenter fra produksjonen, og undersøker om komponentene er feilfrie. La X være en stokastisk variabel som angir antall feilfrie komponenter. b) Hvilken fordeling har X? Begrunn svaret. Hva er sannsynligheten for at akkurat 19 komponenter er feilfrie? Hva er sannsynligheten for at flere enn 15 komponenter er feilfrie? Ledelsen i bedriften har innført noen endringer i produksjonsprosessen og håper at det har ført til en økt andel feilfrie komponenter. Kall denne ukjente andelen av feilfrie komponenter for p. Vi trekker et tilfeldig utvalg på n komponenter fra den nye produksjonsprosessen og lar X være antall feilfrie komponenter. En intuitiv estimator for p er andelen feilfrie komponenter i utvalget, dvs. ˆP = X n. Når vi har observert X = x feilfrie komponenter kan vi regne ut et estimat for p som ˆp = x n. Det X np tilfeldige utvalget av størrelse n er så stort at vi kan anta at er tilnærmet standard nˆp(1 ˆp) normalfordelt. c) Utled et 90% konfidensintervall for p. Regn ut konfidensintervallet når n = 500 og x = 470. eksdes16-oppg-b 23. juni 2017 Side 1

Gi en kort tolkning av intervallet. Oppgave 2 I denne oppgaven skal vi se på hvordan vi kan regne ut forventningsverdi og varians til et gjennomsnitt når observasjonene som inngår i gjennomsnittet er avhengige. La X 1 og X 2 være stokastiske variabler med E(X 1 ) = E(X 2 ) = 2, Var(X 1 ) = Var(X 2 ) = 1 og Cov(X 1, X 2 ) = 1 2. Finn E( 1 2 X 1 + 1 2 X 2) og Var( 1 2 X 1 + 1 2 X 2). La videre X 1, X 2,..., X 10 være stokastiske variabler med E(X i ) = 2 og Var(X i ) = 1 for i = 1, 2,..., 10 og Cov(X i, X j ) = 1 2 for alle i = 1, 2,..., 10 og j = 1, 2,..., 10 der i j. La X = 1 10 10 i=1 X i. Finn E( X) og Var( X). Hint: du kan bruke følgende formel for variansen til en sum (som også finnes i Tabeller og formler i statistikk) Var( a i X i + b) = i=1 i=1 j=1 a i a j Cov(X i, X j ) = a 2 i Var(X i ) + 2 i=1 i 1 a i a j Cov(X i, X j ). i=2 j=1 Oppgave 3 Vi studerer en populasjon av mannlige studenter, og antar at høyden til en tilfeldig valgt mann fra populasjonen er normalfordelt med forventningsverdi µ og varians σ 2. a) Anta (kun i dette punktet) at µ = 181 cm og σ = 6 cm. Vi trekker tilfeldig ut to mannlige studenter fra populasjonen og lar X 1 angi høyden til den første studenten og X 2 høyden til den andre. Vi antar at X 1 og X 2 er uavhengige stokastiske variabler. Regn ut følgende sannsynligheter: P(X 1 > 190) P(X 1 > 190 X 1 > 185) P(X 1 > 190 X 2 > 185) To forskningsgrupper har uavhengig av hverandre estimert forventet høyde til mannlige studenter, µ. Forskningsgruppe 1 innhentet et tilfeldig utvalg av størrelse n og observerte høydene x 1, x 2,..., x n, og forskningsgruppe 2 innhentet et tilfeldig utvalg av størrelse m og observerte høydene y 1, y 2,..., y m. De to utvalgene ble trukket uavhengig av hverandre fra den gitte populasjonen. Begge forskningsgruppene brukte empirisk middelverdi (gjennomsnitt) som estimator for µ, X = (X 1 + X 2 +... + X n )/n og Ȳ = (Y 1 + Y 2 +... + Y m )/m, og forskningsgruppe 1 fant x = 180 cm og forskningsgruppe 2 fant ȳ = 183 cm. Du har studert statistikk og vet at du kan kombinere estimater fra uavhengige studier til å lage et estimat for µ som har lavere usikkerhet enn hvert av estimatene separat. Du har bestemt

deg for å bruke estimatoren der a og b er reelle tall. ˆµ = a X + bȳ, b) Forklar hvilke to egenskaper som kjennetegner en god estimator. Finn uttrykk for a og b (som funksjoner av n og m) slik at ˆµ er en estimator for µ som oppfyller egenskapene over. Hva blir ditt estimat for µ hvis n = 64 og m = 192? Etter nærmere ettertanke synes du at forskjellen mellom estimatene til de to forskningsgruppene er urimelig stor i forhold til deres utvalgsstørrelser n = 64 og m = 192. Din påstand er at du tror at de to forskningsgruppene ikke har tatt utvalgene sine fra den samme populasjonen. Anta at forskningsgruppe 1 tok et tilfeldige utvalg fra en normalfordelt populasjon med forventningsverdi µ 1 og standardavvik σ 1, og at forskningsgruppe 2 tok et tilfeldige utvalg fra en normalfordelt populasjon med forventningsverdi µ 2 og standardavvik σ 2. Du har tidligere fått oppgitt at x = 180 cm og ȳ = 183 cm. Du kontakter forskningsgruppene og de sender deg de empiriske standardavvikene for sine observasjoner, s 1 = 6.0 for forskningsgruppe 1 og s 2 = 5.5 for forskningsgruppe 2. c) Bruk påstanden din (gitt tidligere i teksten) til å formulere en null- og en alternativ hypotese. Det er oppgitt at formelen for antall frihetsgrader i en test av forskjell i forventningsverdier når σ 1 kan være ulik σ 2, er ν = (s 2 1 /n + s2 2 /m)2 (s 2 1 /n)2 /(n 1) + (s 2 2 /m)2 /(m 1) = 100.6 innsatt numeriske verdier for s 1, s 2, n og m som oppgitt i oppgaven. Argumenter for hvorfor denne testen kan brukes og finn forkastningsområdet til testen når signifikansnivået er α = 0.05. Hva blir konklusjonen av hypotesetesten når du bruker dataene som er oppgitt? Oppgave 4 I figur 1 finner du et kryssplott (scatter plot) av fødselsvekt (målt i kg) og gestasjonsalder (tid fra første dag i siste menstruasjonsperiode til mor, målt i uker) for n = 17 fødsler. Vi ønsker å tilpasse en enkel lineær regresjonsmodell Y i = β 0 + β 1 x i + ɛ i, i = 1, 2,..., n, der hver ɛ i er en normalfordelt stokastisk variabel med forventningsverdi 0 og varians σ 2. Videre er ɛ 1, ɛ 2,..., ɛ n uavhengige, og Y i er fødselsvekt og x i er gestasjonsalder. a) Diskuter om det er rimelig å bruke en lineær regresjonsmodell for observasjonene vist i figur 1. Forklar hvordan minste kvadraters (least squares) metode kan brukes til å finne estimatorer B 0 for β 0 og B 1 for β 1, og illustrer med en figur. Du skal ikke utlede uttrykkene

Figur 1: Kryssplott av fødselsvekt, y i, og gestasjonsalder, x i for i = 1,..., 17 barn. for estimatorene. Det er oppgitt at estimatet for β 0 blir 4.02 og for β 1 blir 0.18. Finn predikert fødselsvekt for barn ved gestasjonsalder 40 uker. b) Finn et uttrykk for variansen til Ŷ0 = B 0 + B 1 x 0, der B 0 og B 1 er minste kvadraters estimatorene (least squares estimators) for β 0 og β 1. Du kan bruke at Ȳ = 1 n n i=1 Y i og B 1 er uavhengige stokastiske variabler. Studer figur 2 og bruk uttrykket for variansen til Ŷ0 til å forklare hvorfor estimatet for forventningsverdien E(Ŷ0) er mer usikkert ved x 0 = 29 uker enn ved x 0 = 39 uker. Oppgave 5 Anta at Y er uniformt fordelt med sannsynlighetstetthet { 1, 0 < y < 1, f Y (y) = 0, ellers. Finn kumulativ fordeling F Y (y) til Y. På en datamaskin generer vi ofte observasjoner fra en fordeling ved først å generere en observasjon fra en uniform fordeling og så transformere observasjonen. Vi skal se på transformasjonen X = ln(y )/λ, der λ > 0. Bruk F Y (y) til å finne kumulativ fordeling F X (x) til X. Hva blir sannsynlighetsfordelingen f X (x) til X, og hvilken kjent statistisk fordeling er dette? Fasit

Figur 2: Kryssplott av fødselsvekt og gestasjonsalder for 17 barn med estimert forventningsverdi for fødselsvekt (regresjonslinje) og grenser for 95% konfidensintervall for forventet fødselsvekt som funksjon av gestasjonsalder. 1. a) 0.045, 0.054, 0.83 b) binomisk fordelt, 0.270, 0.957 c) [0.923, 0.957] 2. 2, 0.75, 2, 0.55 3. a) 0.0668, 0.2657, 0.0668 b) a = n/(n + m), b = m/(n + m), 182.25 c) H 0 : µ 1 = µ 2 mot H 1 : µ 1 µ 2, forkast H 0 4. a) 3.18 5. Eksponensialfordeling med forventningsverdi 1/λ