Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Like dokumenter
Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i TMA4295 Statistisk inferens

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

TMA4245 Statistikk Eksamen desember 2016

Om eksamen. Never, never, never give up!

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4295 Statistisk inferens

Eksamensoppgåve i TMA4250 Romleg Statistikk

Eksamensoppgave i SØK1004 Statistikk for økonomer

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Om eksamen. Never, never, never give up!

TMA4240 Statistikk Høst 2016

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Kapittel 2: Hendelser

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk H2010

Eksamensoppgave i SØK Statistikk for økonomer

Løsning eksamen desember 2017

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

HØGSKOLEN I STAVANGER

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2009

Eksamensoppgåve i TMA4255 Anvendt statistikk

EKSAMEN I EMNE TMA4245 STATISTIKK

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4245 Statistikk

UNIVERSITETET I OSLO

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Oppfriskning av blokk 1 i TMA4240

Løsningsforslag, eksamen statistikk, juni 2015

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

TMA4240 Statistikk Høst 2015

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Eksamensoppgave i TMA4240 Statistikk

i x i

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4320 Introduksjon til vitenskapelige beregninger

ECON240 VÅR / 2016 BOKMÅL

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgave i TMA4150 Algebra

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4250 Romlig Statistikk

TMA4240 Statistikk Høst 2016

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

EKSAMENSOPPGAVE STA-1001.

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2009

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk Høst 2015

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk 2014

UNIVERSITETET I OSLO

Fasit for tilleggsoppgaver

Eksamensoppgåve i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4135 Matematikk 4D

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2008

EKSAMEN I TMA4245 Statistikk

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk H2015

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

Eksamensoppgave i MA1101/MA6101 Grunnkurs i analyse I. LØSNINGSFORSLAG

ÅMA110 Sannsynlighetsregning med statistikk, våren

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Eksamensoppgåve i TMA4255 Anvendt statistikk

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Eksamensoppgave i MA1102/6102 Grunnkurs i analyse II

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER

TMA4240 Statistikk Høst 2018

STK Oppsummering

Transkript:

Institutt for matematiske fag Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk Fagleg kontakt under eksamen: Gunnar Taraldsen a, Torstein Fjeldstad b Tlf: a 464 32 506, b 962 09 710 Eksamensdato: 23 mai 2018 Eksamenstid (frå til): 09:00 13:00 Hjelpemiddelkode/Tillatne hjelpemiddel: B: Alle trykte og håndskrevne hjelpemidler tillatt Bestemt, enkel kalkulator tillatt Annan informasjon: Målform/språk: nynorsk Sidetal: 9 Sidetal vedlegg: 0 Informasjon om trykking av eksamensoppgåve Originalen er: 1-sidig 2-sidig svart/kvit fargar skal ha fleirvalskjema Dato Kontrollert av: Sign Merk! Studentane finn sensur i Studentweb Har du spørsmål om sensuren må du kontakte instituttet ditt Eksamenskontoret vil ikkje kunne svare på slike spørsmål

Løysingsskisse TMA4245 Statistikk 23 mai 2018 Side 1 av 9 Oppgåve 1 a) Me finn den kumulative fordelinga til X ved å integrere sannsynstettleiken til X: x F (x) f(x)dx x 0dx 0 x 0 0 0dx + x 1 0 2 dx x 0 < x < 1 x 0 0dx + 1 1 0 2 dx + x x 1 0dx 1 x 1 Den kumulative fordelinga er gjeve i Figur 1 Figur 1: Kumulativ fordeling F (x) Ved å nytte komplementærsetninga har me P (X 05) 1 P (X 05) 1 05 0293

Side 2 av 9 Løysingsskisse TMA4245 Statistikk 23 mai 2018 Frå definisjonen på betinga sannsyn har me b) Me har P (05 X 07) P (X 07 X 05) P (X 05) P (X 07) P (X 05) P (X 05) 07 05 1 05 0442 P (Y y) P ( ln X y) P (ln X y) P (X e y ) 1 P (X e y ) 1 e y 1 e y/2 for y > 0 Me kjenner att dette som den kumulative fordelinga til ein eksponentialfordelt variabel, det vil seie at Y er eksponentialfordelt med sannsynstettleik og forventningsverdi 2 g(y) 1 2 e y/2 y > 0 Alternativt kan ein nytte transformasjonsformelen med y u(x) ln(x) og x w(y) e y : g(y) 1 2 e e y y for y > 0 1 2 ey/2 e y 1 2 e y/2 Anta at me har trekt Y 1, Y 2,, Y n frå sannsynstettleiken til Y La Ȳn 1 n Y n i vere gjennomsnittsverdien til Y Når n vil Ȳn 1 n Y n i E(Y ) Me kan altså tenke på E(Y ) som gjennomsnittsverdien til Y når me gjentar forsøket uendeleg mange gonger

Løysingsskisse TMA4245 Statistikk 23 mai 2018 Side 3 av 9 Oppgåve 2 a) Me definerer følgande hendingar frå oppgåva: K : ein tilfeldig tilsett er ei kvinne; P (K) 067 M : ein tilfeldig tilsett er ein mann; P (M) 033 N : ein tilfeldig tilsett har lasta ned minst ein film Frå oppgåveteksten veit me at P (N K) 017 og P (N M) 020 Frå lova om totalt sannsyn får me: P (N) P (K)P (N K) + P (M)P (N M) 067 017 + 033 020 018 Me nyttar Bayes sitt teorem og får P (K)P (N K) P (K N) P (K)P (N K) + P (M)P (N M) 067 017 067 017 + 033 020 0633 b) Me nyttar tabell for kumulative sannsyn for poissonfordelinga (for µ 18) i formelsamlinga I Tabell 1 (utdrag frå formelsamlinga) ser me at det største heiltalet som oppfyller P (X c H 0 : µ 18) 010 er c 12 Det vil seie at den kritiske verdien er c 12 c 10 12 13 14 P (X c) 00304 00549 00917 01426 02018 Tabell 1: Kumulative sannsyn P (X c) for poissonfordelinga med forventning 18 Me forkastar nullhypotesen dersom X 12 Sidan me har observert x 13 vil me ikkje forkaste nullhypotesen c) Sannsynet for type-ii feil er definert som P (ikkje forkast H 0 når H 1 er sann) P (X > c H 1 : µ µ 1 ) 1 P (X c H 1 : µ µ 1 ) c µ x 1 1 x! exp ( µ 1) x0

Side 4 av 9 Løysingsskisse TMA4245 Statistikk 23 mai 2018 Innsatt µ 1 14 får me frå tabell P (X > 12 µ 1 14) 1 12 x0 14 x x! 1 03585 06415 exp ( 14) det vil seie at sannsynet for å gjere ein type-ii feil er høgt dersom den sanne verdien til µ er 14 Oppgåve 3 a) Eit kryssplott av h mot t er gjeve i Figur 2 Me ser at det er ein lineær samanheng mellom h og t; det vil seie at antakinga om E(H i t i ) a+b(t i 6) er rimeleg Det er heller ingen openbar trend i variansen, det vil seie at antakinga om konstant varians σ 2 verkar rimeleg Me kan ikkje seie noko direkte om antakinga om uavhengige H i -ar frå kryssplottet direkte Figur 2: Kryssplott h (cm) mot t (uke) samt den tilpassa lineære modellen funne i oppgåve b) b) Me vil minimere SSE (h i a b(t i 6)) 2

Løysingsskisse TMA4245 Statistikk 23 mai 2018 Side 5 av 9 med omsyn på a og b Me deriverer med omsyn på a og b, set likningssystema lik null og løyser med omsyn på dei ukjende parametra Me deriverer først med omsyn på a: SSE a 2 (h i a b(t i 6)) a 1 a 1 h i b n (h i b(t i 6)) (t i 6) Sidan me har fiksert t i slik at (t i 6) 0 får me etter å ha satt SSE a 0: a 1 Dersom me set uttrykket for a inn i uttrykket for SSE før me deriverer med omsyn på b får me SSE b b b 2 2 h i (h i a b(t i 6)) 2 h i 1 j1 (t i 6) h i 1 (t i 6) h i 1 2 h j b(t i 6) h j b(t i 6) j1 h j j1 + 2b Me set uttrykket lik null og løyser med omsyn på b (t i 6) ( h i 1 ) j1 h j b (t i 6) 2 (t i 6) h i (t i 6) 2 der den siste overgangen kjem frå (t i 6) 1 ( ) h j h j (t i 6) j1 j1 0 (t i 6) 2

Side 6 av 9 Løysingsskisse TMA4245 Statistikk 23 mai 2018 Me får difor at ˆb (t i 6) H i (t i 6) 2 â 1 H i Ved å setje inn dei oppgjevne tala får me 449 ˆb 0 â 251 4082 22818 Den tilpassa linja er skissert inn i Figur 2 Som diskutert i oppgåve a) ser me at ein lineær modell verker rimeleg då det er ein lineær samanheng mellom h og t Me ser og at observasjonane verker å vere tilfeldig spreidd rundt den tilpassa linja, noko som styrker antakinga om normalfordelte feilledd c) Rimeligheitsfunksjonen er gjeve som L ( a, b, σ 2) 1 2π ( ) 1 /2 2π ( 1 exp 1 σ 2 ( 1 σ 2 ) /2 exp ( ) 2σ (h 2 i (a + b(t i 6))) 2 1 2σ 2 (h i (a + b(t i 6))) 2 ) For å finne sannsynsmaksimeringsestimatorane for a, b og σ 2 må me derivere med omsyn på desse, setje uttrykka lik null og løyse likningssystemet Log-rimelighetsfunksjonen er gjeve som l ( a, b, σ 2) 2 ln(2π) 2 ln ( σ 2) 1 2σ 2 (h i (a + b(t i 6))) 2 Me maksimerer log-rimeligheitsfunksjonen ved å derivere med omsyn på a og b l(a, b, σ 2 ) 1 (h a σ 2 i (a + b(t i 6))) 0 l(a, b, σ 2 ) b 1 (t σ 2 i 6) (h i (a + b(t i 6))) 0 som svarar til uttrykka for minste kvadraters metode gjeve i oppgåve b)

Løysingsskisse TMA4245 Statistikk 23 mai 2018 Side 7 av 9 d) Me nyttar vanlege reknereglar for forventningsverdi E (ˆb) ( ) E (t i 6) H i (t i 6) 2 (t i 6) E (H i ) (t i 6) 2 (t i 6) (a + b(t i 6)) (t i 6) 2 a (t i 6) + b (t i 6) 2 (t i 6) 2 b Nyttar kjende reknereglar for varians (hugs at H 1, H 2,, H er uavhengige) Var (ˆb) ( ) Var (t i 6) H i (t i 6) 2 (t i 6) 2 Var (H i ) ( ) 2 (t i 6) 2 σ2 (t i 6) 2 ( ) 2 (t i 6) 2 σ 2 (t i 6) 2 Sidan ˆb er ein lineærkombinasjon av uavhengige, normalfordelte stokastiske variblar er ˆb normalfordelt Me tar utgongspunkt i Z ˆb E (ˆb) Var (ˆb) ˆb E (ˆb) σ 2 (t i 6) 2 n(z; 0, 1)

Side 8 av 9 Løysingsskisse TMA4245 Statistikk 23 mai 2018 Sidan σ 2 er ukjend nyttar me ein estimator for σ 2, S 2 Me får då T ˆb E (ˆb) S 2 (t i 6) 2 ˆb b σ 2 (t i 6)2 ( 2) S 2 σ 2 2 Z V 9 der Z er standard normalfordelt og V er kjikvadratfordelt med 9 fridomsgrader og Z og V er uavhengige Difor er T student-t fordelt med 9 fridomsgrader Me får då 095 P ( t 0025,9 T t 0025,9 ) ˆb E (ˆb) P t 0025,9 t 0025,9 S 2 (t i 6) 2 S P ˆb 2 t0025,9 (t i 6) b ˆb + t S 2 2 0025,9 (t i 6) 2 Det vil seie at eit 95 % konfidensintervall for veksthastigheten er Innsatt tal får me S ˆb 2 t0025,9 (t i 6), ˆb + t S 2 2 0025,9 (t i 6) 2 [3786, 4378] Anta at me gjer eit forsøk basert på dei stokastiske variablane X 1, X 2,, X n Me er interessert i sannsynet P ( θ L (X 1, X 2,, X n ) θ θ U (X 1, X 2,, X n ) ) 1 α For eit spesifikt utfall x 1, x 2,, x n vil hendinga at den sanne (ukjende) verdien til θ er innafor intervallet anten vere oppfyllt eller ikkje Dersom me gjentar dette forsøket uendeleg mange ganger vil me få ny verdiar for

Løysingsskisse TMA4245 Statistikk 23 mai 2018 Side 9 av 9 x 1, x 2,, x n i kvart forsøk (merk at verdien til θ er lik i alle forsøka) som resulterer i eit nytt konfidensintervall i kvart forsøk der den sanne verdien til θ anten er innanfor eller utanfor intervallet Dersom me gjentar forsøket uendeleg mange gonger vil ein andel 1 α dekke den sanne verdien til θ Oppgåve 4 tilbakeleggjing Sidan kvar person kan svare høgst ein gong har me eit forsøk utan Me trekk eit utval av n 20 personer utan tilbakeleggjing frå ein populasjon av storleik N 100 Kvar av dei N 100 personane har to alternativ: for eller imot der det er anteke at k personar er for og N k personar er imot Difor er X hypergeometrisk fordelt Hypotesen i oppgåva kan formulerast som alternativt H 0 : N k 100 k 50 mot H 1 : N k 100 k > 50 H 0 : k 50 mot H 1 : k < 50 Under H 0 har me at X er hypergeometrisk fordelt med punktsannsyn h(x; 100, 20, k 50) P-verdien til testen er gjeve som ( )( ) 50 50 x 20 x ( 100 20 ) for 0 x 20 ( )( ) 50 50 3 x 20 x P (X 3 k 50) ( ) 100 x0 20 00004 Det vil si at dersom H 0 er riktig er sannsynligheten for å få det vi fikk i prøveavstemningen, eller noe mer ekstremt, så liten som 00004 Det er dermed rimeleg å konkludere at H 0 er feil, og at fleirtalet imot streik