TMA4240 Statistikk 2014

Like dokumenter
TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2007

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

TMA4240 Statistikk Høst 2009

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

TMA4240 Statistikk Høst 2009

Løsningsforslag eksamen 27. februar 2004

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

TMA4240 Statistikk 2014

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk Høst 2015

Norske hoppdommere og Janne Ahonen

TMA4240 Statistikk H2010

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

TMA4245 Statistikk Eksamen desember 2016

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

LØSNINGSFORSLAG ) = Dvs

TMA4240 Statistikk Høst 2012

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Forslag til endringar

TMA4240 Statistikk Høst 2016

Kp. 9.8 Forskjell mellom to forventninger

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

i x i

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk Høst 2015

Løsningsforslag til oppgaver brukt i STA100

Gammafordelingen og χ 2 -fordelingen

TMA4240 Statistikk Høst 2018

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Oppgave 1 a) La X være massen til et tilfeldig valgt egg, målt i gram. Sannsynligheten for at et tilfeldig valgt egg veier mer enn 60 g er

Om eksamen. Never, never, never give up!

TMA4240 Statistikk H2010

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Oppgave 14.1 (14.4:1)

Om eksamen. Never, never, never give up!

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Oppgave 1. Kilde SS df M S F Legering Feil Total

TMA4240 Statistikk Høst 2015

Fasit for tilleggsoppgaver

Eksamensoppgave i TMA4240 Statistikk

Kap. 8: Utvalsfordelingar og databeskrivelse

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

TMA4240 Statistikk Høst 2009

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Forelesning 3. april, 2017

TMA4240 Statistikk Høst 2008

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

TMA4240 Statistikk Eksamen desember 2015

UNIVERSITETET I OSLO

Tabell 1: Beskrivende statistikker for dataene

Oppgave 1 Det er oppgitt i oppgaveteksten at estimatoren er forventningsrett, så vi vet allerede at E(ˆµ) = µ. Variansen til ˆµ er 2 2 ( )

ÅMA110 Sannsynlighetsregning med statistikk, våren

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Kontinuerlige sannsynlighetsfordelinger.

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

STK1100 våren 2019 Mere om konfidensintevaller

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Løsning eksamen desember 2016

Oppfriskning av blokk 1 i TMA4240

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

FORMELSAMLING TIL STK1100 OG STK1110

TMA4240 Statistikk Høst 2012

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Løsningsforslag statistikkeksamen desember 2014

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen august 2014

Foreleses onsdag 13.oktober, 2010

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1

Løsningsforslag oblig 1 STK1110 høsten 2014

Eksamensoppgave i TMA4240 Statistikk

Løsningsforslag til obligatorisk oppgave i ECON 2130

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4240 Statistikk H2010

Løsning eksamen desember 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Transkript:

Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave Scriptet run confds.m simulerer n data x,..., x n fra en normalfordeling med forventningsverdi µ og varians σ ved å trekke n ganger fra en standard normalfordeling y i N(0, ) og utføre lineærtransformasjonen x i µ + σ y i, i,..., n Fra uttrykket kan vi greit regne på at da vil x i N(µ, σ ). (I Matlab trekker man fra en standard normalfordeling med funksjonen randn ). Kjører vi scriptet får vi et histogram av n 0000 simulerte data x,..., x n, som f.eks. kan se slik ut Figur : Histogram av n 0000 simulerte data fra N(, ) Histogrammet til høyre er standardisert, altså transformert slik at areal under histogramsøylene blir. I plottet er det i grønt også tegnet inn kurven for normalfordelingen med forventning og standardavvik. Vi ser at de simulerte dataene overlapper normalfordelingen de kommer fra veldig bra. Dette siden vi simulerer såpass mange datapunkter. Det resulterende gjennomsnittet ˆµ n n i x i.0047 er veldig nærme den sanne forventningsverdien som også ligger innenfor det estimerte konfidensintervalet [0.969.0434]. ov9-lsf-b 6. oktober Side

Trekker vi stedet n 00000 data (setter altså parameteren n i scriptet til 00000) kan histogrammet f.eks. se ut som i Fig. med estimert forventningsverdi ˆµ 0.9983 og estimert 9% konfidensinterval [0.989,.007]. Igjen er estimatet tilnærmet likt sann forventnigsverdi, som ligger innenfor konfidensintervalet, og overlappen mellom dataene og normalkurven er enda bedre. Figur : Histogram av n 00000 simulerte data fra N(, ) Trekker vi n 000 data (setter altså parameteren n i scriptet til 000) kan histogrammet f.eks. se ut som i Fig.3. med estimert forventningsverdi ˆµ 0.994 og estimert 9% konfidensinterval [0.8374.08]. Estimatet er fortsatt bra, men ikke like nærme som i tilfellene med høyere n. Vi ser også at estimert konfidensinterval er litt bredere, og at overlappen mellom dataene og normalkurven er dårligere (dette er også fordi vi har så liten oppløsning på histogrammet). Figur 3: Histogram av n 000 simulerte data fra N(, ) Det estimerte konfidensintervalet er beregnet som [ ˆµ.96 ˆσ n, ˆµ +.96 ] ˆσ n ov9-lsf-b 6. oktober Side

Når datamengden vokser og estimatet på standardaviket ikke varierer mye ser vi at faktoren ˆσ n går mot 0, altså blir konfidensintervalet smalere jo større datamengden er. Vi merker oss også at vi her har brukt kvantilen z 0.0.96 fra en normalfordeling selv om vi her bruker estimert varians. Med ukjent varians burde vi egentlig brukt kvantiler fra t-fordeling, men siden datamangden er så stor (n 000) vil t-fordeling med n frihetsgrader være tilnærmet lik standard normalfordeling. Oppgave a) P (X < 6.74) P ( X 6.8 6.74 6.8 < ) 0.06 0.06 Φ( ) Φ() 0.84 0.9 P (6.74 < X < 6.86) P (X < 6.86) P (X < 6.74) P ( X 6.8 6.86 6.8 < ) 0.9 0.06 0.06 Φ() 0.9 0.84 0.9 0.68 Eventuelt P ( X µ ) > 0.06) P (X µ < 0.06) + P (X µ > 0.06) P ( X µ µ < ) + P (X 0.06 0.06 > ) Φ( ) + Φ() ( Φ()) 0.38 P ( X µ ) > 0.06) P (6.74 < X < 6.86) 0.68 0.38 b) Y N(µ, σ ) P ( Y µ ) > 0.06) P (Y µ > 0.06) ( P ( Y µ 0.06 ())) 0.06 Y i X i er lineærkombinasjon av uavhengige normalfordelte variable. Dermed er Y normalfordelt med E(Y ) µ og V ar(y ) σ Y µ σ N(0, ) ov9-lsf-b 6. oktober Side 3

P ( Z 0.0 < y µ σ < Z 0.0 ) 0.9 P (Y Z 0.0 σ < µ < Y + Z 0.0 σ ) 0.9 D.v.s 9% konf. int. blir: [Y Z 0.0. σ, Y + Z 0.0 σ ] Innsatt tall: y x 6.76, σ 0.06, z 0.0.96 [6.76 (.96) 0.06, 6.76 + (.96) 0.06 ] [6.707, 6.83] Oppgave 3 a) La V være målt vekt, slik at V N(µ, σ ) N(0, 0. ). Vi får ( ) V µ 0. 0 P (V > 0.) P > P (Z > ) σ 0. P (Z ) 0.843 0.87 P ( V µ > 0.) P (V µ > 0.) + P (V µ < 0.) ( V µ P > 0. ) ( V µ + P < 0. ) σ 0. σ 0. P (Z > ) + P (Z ) P (Z ) + P (Z ) P (Z ) 0.87 0.374 La V n n i V i, slik at V N(µ, σ /n). Vi får P ( V µ > 0.) P ( V µ > 0.) + P ( V µ < 0.) ( V µ P σ/ n > 0. ) ( V µ 0./ + P σ/ n < 0. ) 0./ P (Z > ) + P (Z ) P (Z ) + P (Z ) P (Z.4) 0.0793 0.86 b) Vi har X N(µ A, σ ) og X N(µ B, σ ) som er uavhengig av hverandre. Vi får ved fremgangsmåte : E[ˆµ A ] E[X ] µ A Var[ˆµ A ] Var[X ] σ E[ˆµ B ] E[X ] µ B Var[ˆµ B ] Var[X ] σ ov9-lsf-b 6. oktober Side 4

Vi har Y N(µ A + µ B, σ ) og Y N(µ A µ B, σ ) som er uavhengig av hverandre. Vi får ved fremgangsmåte : E[ µ A ] E[(Y + Y )/] (E[Y ] + E[Y ]) (µ A + µ B + µ A µ B ) µ A Var[ µ A ] Var[(Y + Y )/] 4 (Var[Y ] + Var[Y ]) 4 (σ + σ ) σ / E[ µ B ] E[(Y Y )/] (E[Y ] E[Y ]) (µ A + µ B µ A + µ B ) µ B Var[ µ B ] Var[(Y Y )/] 4 (Var[Y ] + Var[Y ]) 4 (σ + σ ) σ / Begge fremgangsmåtene gir forventningsrette estimatorer, så vi velger den med minst varians, dvs. fremgangsmåte : µ A og µ B. c) Vi har µ A u (Y, Y ) (Y + Y )/ og µ B u (Y, Y ) (Y Y )/, som gir oss at Y w ( µ A, µ B ) µ A + µ B og Y w ( µ A, µ B ) µ A µ B. Fra transformasjonsformelen for to variabler har vi da at g µa, µ B ( µ A, µ B ) f Y,Y (w ( µ A, µ B ), w ( µ A, µ B )) J hvor J δw /δ µ A δw /δ µ A δw /δ µ B δw /δ µ B. ov9-lsf-b 6. oktober Side

Siden Y og Y er uavhengige, har vi f Y,Y (y, y ) f Y (y )f Y (y ) og vi får følgende: g µa, µ B ( µ A, µ B ) f Y,Y (w ( µ A, µ B ), w ( µ A, µ B )) J f Y (w ( µ A, µ B ))f Y (w ( µ A, µ B )) σ exp ( σ exp σ σ ( µ A + µ B (µ A + µ B )) σ ( µ A µ B (µ A µ B )) ) exp [ ( µa σ + µ B ) (( µ A + µ B ) (µ A + µ B ) + (µ A + µ B ) + ( µ A µ B ) ( µ A µ B ) (µ A µ B ) + (µ A µ B ) ] ( ) exp [ µ σ σ A + µ A µ B + µ B µ A µ A µ A µ B µ B µ B + µ A + µ A µ B + µ B + µ A µ A µ B + µ B µ A µ A + µ A µ B + µ B µ A µ B µ B + µ A µ A µ B + µ ] B ( ) exp [ µ σ σ A + µ B 4 µ A µ A 4 µ B µ B ] + µ A + µ B ( σ σ exp σ exp ) exp g µa ( µ A )g µb ( µ B ) [ ( µa σ µ A ) + ( µ B µ B ) ] σ ( µ A µ A ) σ ( µ B µ B ) og dermed er µ A og µ B uavhengige ( µ A N(µ A, σ /) og µ B N(µ B, σ /)). Oppgave 4 a) La Z λt u(t ), som er en strengt monoton og deriverbar funksjon for alle T. Vi har T Z/(λ) w(z) og w (Z) /(λ). Dette gir g Z (z) f(w(z)) w (z) λe λ(z/(λ)) (/(λ)) e z/, z > 0 0, ellers b) Vi har λt χ. Dersom levetiden til kompononentene T i er uavhengig, kan vi bruke ov9-lsf-b 6. oktober Side 6

følgende resultat n n λt i χ n i λ T i χ n i Vi finner et α konfidensintervall fra ( ) n P χ α/,n < λ t i < χ α/,n α i i ( ) χ α/,n P n i t < λ < χ α/,n i n i t α i ( ) χ 0.9/,0 P 6430. < λ < χ 0.0,0 0.90 430. ( 0.8 P 860.4 < λ < 3.40 ) 0.90 860.4 P ( 8.438 0 4 < λ < 4.44 0 4) 0.90 Så et 90% konfidensintervall for λ er (8.438 0 4, 4.44 0 4 ). ov9-lsf-b 6. oktober Side 7