TMA4240 Statistikk Eksamen desember 2015

Like dokumenter
TMA4245 Statistikk Eksamen mai 2017

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

TMA4240 Statistikk Høst 2015

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2016

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

TMA4245 Statistikk Eksamen august 2015

TMA4240 Statistikk Høst 2009

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Estimering 1 -Punktestimering

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

Estimering 1 -Punktestimering

TMA4240 Statistikk Høst 2016

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

TMA4240 Statistikk Eksamen desember 2015

TMA4240/4245 Statistikk 11. august 2012

ST1201 Statistiske metoder

TMA4245 Statistikk Eksamen 9. desember 2013

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

TMA4240 Statistikk Høst 2016

MOT310 Statistiske metoder 1, høsten 2011

f(x)dx = F(x) = f(u)du. 1 (4u + 1) du = 3 0 for x < 0, 2 + for x [0,1], 1 for x > 1. = 1 F 4 = P ( X > 1 2 X > 1 ) 4 X > 1 ) =

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

TMA4240 Statistikk Eksamen desember 2015

TMA4245 Statistikk Vår 2015

Løsningsforslag til eksamen i STK desember 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Kap. 9: Inferens om én populasjon

Kapittel 8: Estimering

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

ST1201 Statistiske metoder

Kap. 9: Inferens om én populasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TMA4245 Statistikk. Øving nummer 12, blokk II Løsningsskisse. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Løsningsforslag Oppgave 1

Hypotesetesting, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

TMA4245 Statistikk Eksamen 20. desember 2012

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

STK1100 våren 2017 Estimering

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

TMA4240 Statistikk H2010

ECON240 Statistikk og økonometri

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

Kapittel 7: Noen viktige sannsynlighetsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Estimering 2. -Konfidensintervall

Løsning TALM1005 (statistikkdel) juni 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

Econ 2130 Forelesning uke 11 (HG)

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

Oppgaver fra boka: X 2 X n 1

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Statistikk og økonomi, våren 2017

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Løsningsforslag ST2301 øving 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

Kapittel 7: Noen viktige sannsynlighetsfordelinger

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Sammendrag i statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

LØSNING: Eksamen 28. mai 2015

Lineær regresjonsanalyse (13.4)

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

n 2 +1) hvis n er et partall.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

TMA4100 Matematikk 1 Høst 2014

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

Transkript:

Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag TMA20 Statistikk Eksame desember 205 Løsigsskisse Oppgave a) De kumulative fordeligsfuksjoe til X, F (x) P (X x): F (x) P (X x) x f(u)du x [ u θ] x x θ ( ) x θ for x >, ellers er F (x) 0. Setter θ.6, og reger ut P (X 2) F (2) 0.55 2.6 P (X > ) F () 0.20.6 P (X > X > 2) P (X > X > 2) P (X > 2) 0.20 0.55 0. θu (θ+) du P (X > ) P (X > 2) b) Sasylighetsmaksimerigsestimatore for θ. Vi starter med rimelighetsfuksjoe L, og tar logaritme til L for å lette regige. L(θ, x, x 2,..., x ) f(x i, θ) i i θx (θ+) i θ i x (θ+) i l(θ, x, x 2,..., x ) l L(θ, x, x 2,..., x ) l θ (θ + ) l x i Vi vil fie maksimum av l som fuksjo av θ og deriverer l med hesy på θ, og deretter setter lik 0 og løser ut. Vi sjekker at vi fier maksimum og ikke miimum ved i eksdes5-lsf-b 0. august 206 Side

å udersøke om de adrederiverte er egativ. dl dθ m θ l x i og dl dθ 0 i θ l x i 0 i θ l x i i θ i l x i Sjekk av maksimum: d2 l dθ 2 < 0 alltid egativ, dvs. maksimumspukt θ2 Dermed har vi maksimert rimelighetsfuksjoe med hesy på θ og fuet følgede sasylighetsmaksimerigsestimator: ˆθ i l X i Oppgave 2 a) Oppgitt at: X: ormalfordelt med E(X) og Var(X). Y : ormalfordelt med E(Y ) 2 og Var(Y ). X og Y er uavhegige. Dermed: P (X 0) P ( X 0 ) Φ( 0.5) 0.3085 Videre: X + Y er ormalfordelt (side e sum av to uavhegige ormalfordelte variabler er ormalfordelt) med E(X + Y ) E(X) + E(Y ) + 2 3 og Var(X + Y ) Var(X) + Var(Y ) + 5. ( X + Y 3 P (X + Y > ) P (X + Y ) P 3 ) 5 5 Φ(0.5) 0.6736 0.326 Til slutt, X Y er også ormalfordelt, og E(X Y ) E(X) E(Y ) 2 og Var(X Y ) Var(X) + Var(Y ) + 5. ( X Y + P (X Y 2) P 2 + ) 5 5 Φ( 0.5) 0.326 eksdes5-lsf-b 0. august 206 Side 2

b) Skriver estimatoree som fuksjoer av V X ( )S2 X og V Y (m )S2 Y : S 2 pooled ( )S2 X + (m )S2 Y S 2 mea 2 S2 X + 2 S2 Y σ2 V X + V Y σ2 V X 2( ) + σ2 V Y 2(m ) Vi bruker at år V X er kjikvadratfordelt med parameter ( ) så er E(V X ) ( ) og Var(V X ) 2( ), og tilsvarede at år V Y er kjikvadratfordelt med parameter (m ) så er E(V Y ) (m ) og Var(V Y ) 2(m ) (dette står blat aet i Tabeller og formeler i statistikk uder Kjikvadratfordelige). E(Spooled 2 ) E( V X + V Y ) E( V X + V Y ) [E( V X ) + E(V Y )] [( ) + (m )] σ2 σ2 Dermed er S 2 pooled e forvetigsrett estimator for σ2. E(Smea) 2 E ( V X 2( ) + σ2 V Y ) 2(m ) 2( ) E(V X) + 2(m ) E(V Y ) 2( ) ( ) + 2(m ) (m ) 2 σ2 + 2 σ2 Dermed er også S 2 mea e forvetigsrett estimator for. Variase fies tilsvarede, me husk at Var(V X ) 2( ) og Var(V Y ) 2(m ), og kostater kvadreres: Var(aV X ) a 2 Var(V X ). Var(S 2 pooled ) Var( V X + V Y ) () 2 Var( V X + V Y ) () 2 [Var( V X ) + Var(V Y )] () 2 [2()] 2 [2( ) + 2(m )] () 2 Var(Smea) 2 Var ( V X 2( ) + σ2 V Y ) 2(m ) ( ) 2 Var(V X) + (m ) 2 Var(V Y ) ( ) 2 2( ) + σ ( 2(m ) (m ) 2 2 + ) m Vi skal bare sammelige variasee for S 2 pooled og S2 mea år 0 og m 20. Var(Spooled 2 ) 2 0 + 20 2 2 0 + 20 2 2σ 28 0.07σ Var(S 2 mea) σ 2 ( 0 + 20 ) 2 ( 9 + ) 0.08σ 9 eksdes5-lsf-b 0. august 206 Side 3

Dermed er Var(S 2 pooled ) < Var(S2 mea) for disse verdiee av og m, og vi vil geerelt foretrekke så lite som mulig varias for e estimator. Dermed vil vi foretrekke S 2 pooled. Ikke spurt om: me, det vil være slik at variase til Spooled 2 alltid er midre eller lik variase til Smea. 2 Dette ka ma se eklest ved å se at Var(Spooled 2 ) Var(S2 mea) ( + ) m ( )(m ) (( ) + (m ))() ( )(m ) () 2 2 m + m 2 0 ( m) 2 0 Likhet får vi år m. Heller ikke spurt om: Videre så har Spooled 2 e fordel til over S2 mea fordi (+m 2)S2 pooled er e sum av to uavhegige kjikvadratfordelte størrelser og er dermed kjikvadratfordelt med parameter og ka lett brukes til å lage e t-fordelt observator (som gjort i este oppgave), mes dette ikke er tilfellet for Smea. 2 c) Vi øsker å udersøke om det er gru til å tro at µ X er større e µ Y, og dermed setter vi opp: H 0 : µ X µ Y mot H : µ X > µ Y som er det samme som å teste Testobservator er H 0 : µ X µ Y 0 mot H : µ X µ Y > 0 T 0 X Ȳ S pooled + m som er t-fordelt med frihetsgrader år ullhypotese er sa. Vi forkaster H 0 år T 0 er stor (fordi år H 0 er falsk er µ X µ Y > 0 og da vil vi forvete at X Ȳ er stor, og dermed også T 0 stor), og fier forkastigsgrese ved å løse P (forkaste H 0 år H 0 er sa) 0.05 P (T 0 > k) 0.05 dermed må k t 0.05,+m 2, fordi det er det tallet i t-fordelige som det er sasylighet 0.05 for å være større e. Forkastigsregele blir: Forkast H 0 år T 0 > t 0.05,+m 2. eksdes5-lsf-b 0. august 206 Side

Isatt verdier: 29, x 75.2, s 2 X 7.6, m, ȳ 6.0 og s2 Y 292.. t 0.05,29+ 2 t 0.05,268.65 ( )s 2 X s pooled + (m )s2 Y 28 7.6 + 0 292. 29 + 2 6322.8 236.0 5. 268 x ȳ 75.2 6.0 t 0.2 s pooled + m 5. 29 +.87 7.6 Dermed har vi at t 0 7.6 er mye større e forkastigsgrese.65 og vi forkaster klart H 0. P -verdie (ikke spurt om) for teste blir P (T 0 > 7.6) 2.5 0 3 (det ka ma ikke fie i tabell, me med software). Oversatt til spørreudersøkelses-situasjoe: det er gru til å tro at de som har svart «Eig» eller «Svært eig» på påstade «Akkurat å syes jeg at Statistikk er et artig kurs» har e høyere opplevd proset av forelesige de i gjeomsitt meer de forstår e de som svarte «Nøytral», «Ueig» eller «Svært ueig» på «artig»-spørsmålet. Oppgave 3 a) P (X 0) P (X ) 0.2 0.8 og P (Y X 0) P (Y 0 X 0) 0.. P (Y ) P (X 0 Y )) + P (X Y ) P (X Y ) P (X 0)P (Y X 0) + P (X )P (Y X ) 0.8 0. + 0.2 0.9 0.26 P (X Y ) P (Y ) P (X )P (Y X ) P (Y ) 0.2 0.9 0.26 0.69 b) Vi har e biomisk fordelig fordi vi ser på dette som ) 5 delforsøk, 2) i hvert delforsøk sjekker vi om sigalet har kommet frem korrekt (suksess) eller ikke, 3) suksessasylighete er 0.9, og ) de 5 delforsøkee er uavhegig av hveradre. Da er V atall suksesser biomisk fordelt med parametere 5 og 0.9. Biomisk fordelig gir P (V ) P (V ) + P (V 5) 5 0.9 0. + 0.9 5 0.33 + 0.59 0.92 Eller fra tabell: P (V ) P (X 3) 0.08 0.92. La X være kortotasjo for (X, X 2, X 3, X, X 5 ) og tilsvarede for Y. Bayes regel: P (X (0, 0, 0, 0, 0) Y (0, 0, 0, 0, 0)) P (X (0, 0, 0, 0, 0) Y (0, 0, 0, 0, 0)) P (Y (0, 0, 0, 0, 0)) P (X (0, 0, 0, 0, 0))P (Y (0, 0, 0, 0, 0) X (0, 0, 0, 0, 0)) P (X x)p (Y (0, 0, 0, 0, 0) X x) x eksdes5-lsf-b 0. august 206 Side 5

I evere må ma summere over alle de 32 mulige sedte sigaler. Fra biomisk fordelig ka mottatt sigal Y (0, 0, 0, 0, 0) skje ved at ulike atall posisjoer edres: ige elemeter edres (som i teller), ett elemet edres (i e av de 5 posisjoee), to elemeter edres (det er i alt 0 par av to blat de 5 posisjoee), etc. helt til alle posisjoer edres; X (,,,, ). Ved direkte bruk av biomisk fordelig og sasyligheter for X har vi: P (Y (0, 0, 0, 0, 0) X (0, 0, 0, 0, 0))P (X (0, 0, 0, 0, 0)) 0.9 5 0.35 0.207 P (Y (0, 0, 0, 0, 0) X (,,,, ))P (X (,,,, )) 0. 5 0.35 0.0000035 For de adre 30 adre utfallee samlet får vi følgede i ever: (5 0.9 0. + 0 0.9 3 0. 2 + 0 0.9 2 0. 3 + 5 0.9 0. ) 0.0 0.00 Da blir P (X (0, 0, 0, 0, 0) Y (0, 0, 0, 0, 0)) 0.207/(0.207 + 0.00 + 0.00000035) 0.98 Oppgave a) Fra tabell for Poisso fordelige med λ 8: P (Y 8) 0.56 P (0 < Y 8) P (Y 8) P (Y 0) P (Y > 0 Y 8) P (Y 8) 0.56 0.5622 0.030 0.96 0.5622 Ikke spurt om - me for å motivere at Poisso ka tilærmes med ormal. For ormalfordelige: P (Y 8) P (Z 8 8 8 ) P (Z 0) 0.5 P (Y > 0 Y 8) P (Z 0) P (Z < 8/ 8) P (Z 0) 0.5 0.0297 0.5 0.9 b) Det ser ut til å være e positiv tred med høyere salg for høyere føreforholdideks. Og økige ser ut til å være omtret kostat mellom føreforholdideksee (,2,3,). Me variabilitete øker tydelig med føreforholdsidekse. De er mye større for x e for x. Atakelse om kostat varias for støyleddee er dermed eppe gyldig. La e y observasjo (for «fatastiske forhold») være Y 0. Prediksjoe er Ŷ0 og føreforholdsidekse er x 0. Et 90 proset prediksjositervall starter med Ŷ0 Y 0, E(Ŷ0 Y 0 ) 0, og s 2 0 V ar(ŷ0 Y 0 ) ( + ( x)2 + ). 20 i (x i x) 2 ˆβ 237.5/2.95 9.5 ˆβ 0 25.65 9.5 2.5 2. Prediksjoe er Ŷ0 ˆβ 0 + ˆβ 2. + 9.5 0.. eksdes5-lsf-b 0. august 206 Side 6

Estimatet av variase er oppgitt til s 2 5.65 2, og vi får e t-fordelig: Da har vi P (t 8,0.05 < Ŷ0 Y 0 s 0 < t 8,0.95 ) 0.9, t 8,0.05.73 s 2 0 s2 ( + (x 0 x) 2 20 i (x i x) 2 + ) 5.652 (/20 + ( 2.5) 2 /2.95 + ) 6.05 2. P (Ŷ0 + s 0 t 8,0.05 < Y 0 < Ŷ0 + s 0 t 8,0.95 ) 0.9 Prediksjositervallet blir: (29.9, 50.9). c) E(mi{Y, 25}) Som gir E(mi{Y, 25}) 9.58 Fuksjoe som må optimeres er yf(y)dy + f(y)dy µφ(( µ)/σ) σφ(( µ)/σ) + ( Φ(( µ)/σ)) f() 20 E(mi{Y, }) 5 20( ( µ) Φ(( µ)/σ) σφ(( µ)/σ)) 5 Prøvig og feilig gir f(20) 260., f(25) 266.7, f(22) 266.9, f(2) 267.9, f(23) 268.. Dermed blir optimalt atall kopper forberedt 23. eksdes5-lsf-b 0. august 206 Side 7