TMA4240 Statistikk Høst 2015

Like dokumenter
X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

TMA4240 Statistikk Høst 2016

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

TMA4245 Statistikk Eksamen mai 2017

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

TMA4240 Statistikk Høst 2016

MOT310 Statistiske metoder 1, høsten 2011

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

TMA4240 Statistikk 2014

Kap. 9: Inferens om én populasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

TMA4245 Statistikk Vår 2015

Kap. 9: Inferens om én populasjon

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Statistikk og økonomi, våren 2017

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

Estimering 1 -Punktestimering

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Estimering 1 -Punktestimering

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

Kapittel 8: Estimering

Løsningsforslag Oppgave 1

Estimering 2. -Konfidensintervall

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

ECON240 Statistikk og økonometri

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

Løsning TALM1005 (statistikkdel) juni 2017

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

STK1100 våren 2017 Estimering

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

ST1201 Statistiske metoder

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Econ 2130 Forelesning uke 11 (HG)

TMA4245 Statistikk Eksamen 9. desember 2013

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

Løsningsforslag ST2301 øving 3

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Kapittel 7: Noen viktige sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk. Øving nummer 12, blokk II Løsningsskisse. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

TMA4240 Statistikk Høst 2009

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

TMA4245 Statistikk Eksamen august 2014

Hva er statistikk? TMA4240 Statistikk H2015. Denne forelesningen. Pensum

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

Transkript:

Høst 205 Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Øvig ummer, blokk II Løsigsskisse Oppgave a) X bi(, p) fordi: Udersøker uavhegige delar av DNA-strukture. Fi for kvar del ut om dee dele av DNA-stukture er samafallade eller ikkje. Sasyet for samafallade er det same for alle delae (P (samafell) = p = 0.5). b) P (X = 2) = ( ) 5 0.5 2 ( 0.5) 5 2 = 0.38 2 P (X 2) = P (X < 2) = P (X ) = 0.835 = 0.65 P (X = 2 X 2) P (X = 2 X 2) = P (X 2) = 0.38 0.65 = 0.836 = P (X = 2) P (X 2) P (Type-I-feil) = P (forkaste H 0 H 0 ) = P (X = 5 p = 0.5) = 0.5 5 = 0.000076 P (Type-II-feil) = P (ikkje forkaste H 0 H ) = P (X < 5 p = ) = 0 Ser så på det geerelle uttrykket for sasyet for type-i-feil år vi har forsøk. Fi derfrå kor stor må vere for å oppå øska sasy for type-i-feil. P (Type-I-feil) = P (X = p = 0.5) = 0.5 < 0.00000 l(0.5) < l(0.00000) > l(0.00000) = 7.28 l(0.5) ov-lsf-b 25. oktober 205 Side

Høst 205 Mist 8 delar frå DNA-strukture må udersøkast dersom sasyet for type-i-feil skal vere midre e 0.00000. Oppgave 2 a) Merk fra Ve diagram at I ikke overlapper F eller R. P (R F ) = P (R F ) P (F ) = 0.3 0.5 = 0.6 P (R I ) = P (R I ) P (I ) b) Geerelle forutsetiger for biomisk fordelig i) Forsøksrekke består av ekeltforsøk. ii) Det registreres ku suksess eller ikke suksess. iii) Sasylighete for suksess er lik i alle forsøk. iv) Ekeltforsøkee er uavhegige. = P (R) P (I) = 0.4 0.05 = 0.42 For X har vi i) Det er valgt ut kamper. ii) Vi registrerer ku om de som får første målet vier(suksess) eller ikke. iii) Sasylighete for suksess er p og er atatt å være kostat. iv) Vi atar at kampee er uavhegige. Dette er rimelige atakelser. Setralgreseteoremet sier: Dersom Z, Z 2,..., Z er uavhegig idetisk fordelte fra sasylighetsfordelige f Z (z), hvor E(Z) = µ og V ar(z) = σ 2, så vil Z µ σ kovergere mot e ormalfordelig med forvetig 0 og varias. Der Z = i= Z i. For e biomisk forsøksrekke, defier Z i slik at: Z i = hvis suksess, og Z i = 0 ellers. Med adre ord: { p hvis z = P (Z i = z) = p hvis z = 0 Slik at E(Z i ) = p og V ar(z i ) = p( p). Side ekeltforsøkee er uavhegige så er Z i ee også uavhegige. Av setralgreseteoremet følger at ˆp p kovergerer mot e ormalfordelig med forvetig 0 og p( p) varias. Der ˆp = i= Z i. c) H 0 : p 0.8 mot H : p < 0.8 Evetuelt: H 0 : p = 0.8 mot H : p < 0.8 Vi øsker å forkaste dersom ˆp < k, hvor k bestemmes slik at P (ˆp < k) = α = 0.05 ov-lsf-b 25. oktober 205 Side 2

Vi beytter at Z = ˆp p 0 p0 ( p 0 ) uder H 0. Da har vi fra ligige over: P (Z < TMA4240 Statistikk Høst 205 er tilærmet ormalfordelt med forvetig 0 og varias (k p0 ) p0 ( p 0 ) ) = 0.05 Dette gir k = p 0 Z 0.05 (k p0 ) p0 ( p 0 ) = Z 0.05 p 0 ( p 0 ). Vi forkaster H 0 dersom: ˆp < p 0 Z 0.05 p0 ( p 0 ) = 0.8 0.658 For = 24 og X = i= Z i = 7 får vi ˆp = 0.7, k = 0.67. Vi forkaster ikke H 0. Vi ka ikke pastå at ekspertkommetatore tar feil på 5 proset ivå. d) Vi øsker at styrke på teste i alterativet p = 0.7 skal være mist 0.9. Dvs P (ˆp < 0.8 0.658 p = 0.7) = 0.9 Vi beytter at Z = ˆp 0.7 0.7 0.3 er tilærmet ormalfordelt med forvetig 0 og varias uder alterativet med p = 0.7. Isatt i kravet fra ligige over gir dette: P (Z < 0.8 0.7 0.658 ) = 0.9 0.7 0.3 0.7 0.3 0. percetile i ormalfordelige er lik Z 0. =.28. Kravet som må oppfylle blir dermed: 0. 0.658 =.28 0.7 0.3 0.7 0.3 Løsige blir = 55. kamper. Dvs at vi må se mist 56 kamper for å oppå de øskede styrke på teste. Oppgave 3 Eksame mai 2003, oppgave 2 av 3 a) Det er mest rimelig med e vestresidig hypotesetest: H 0 : µ = 6, H : µ < 6. Begruelse: forhadlere sier at bile ka forvetes å kjøre mist 6 km pr liter. Vi vil avsløre ev. feil i markedsførige. NB: Hypoteteseteste skal være uavhegig av måligee. E bør altså ikke velge alterativ hypotese på grulag av x. ov-lsf-b 25. oktober 205 Side 3

Høst 205 X er ormalfordelt med forvetig µ og varias σ 2 /. Variase er ukjet, derfor kreves T-fordelig med ν = = 9 frihetsgrader. Gjeomfører teste med α = 0.05. Testobservator: T obs = X µ S/. Observert verdi: t obs = x µ s/ 5.56 6 = 0.94/ 20 = 2.093. Fra tabell over kvatiler i T-fordelige; t 0.05,9 =.729. Altså: t < t 0.05,9, dermed skal H 0 forkastes. Hvis vi hadde valgt å bruke e ormalfordeligshypotese, ville kvatile z 0.05 =.645 gitt samme koklusjo. Imidlertid bør vi da argumetere for at avstade til dee kvatile er så stor at høyere varias i T-fordelige ikke ville påvirket resultatet. Å sammelike med dee kvatile ka ikke reges som fullgodt svar. b) P-verdie fies ved å lete opp verdie på testobservatore fra a) i tabell. For T-fordelig med ν = 9, fier vi t 0.025,9 = 2.093. Ettersom T-fordelige er symmetrisk, har vi at P(T > t α,ν ) = P(T < t α,ν ). Dermed; p = α = 0.025 = 2.5%. Testobservatore er ormalfordelt hvis σ = s. Dette bør være tilærmet oppfylt for å bruke ormalfordelig. Hvis e ikke har ekstra iformasjo om σ, er det ikke abefalt å tilærme studet-fordelige med e ormalfordelig år < 30, da s ikke er et godt ok estimat. Uder ormalfordelige får vi p-verdi P(Z 2.09) = Φ( 2.09) = 0.083. c) Atar H : µ = µ = 5.5 og σ = s. Teststyrke er sasylighete for å forkaste H 0 uder H, dvs ( ) X µ0 P σ/ <.645 µ = µ = 5.5. For å få e ormalfordelt variabel, flytter vi alt uteom X, som er stokastisk, over på høyre side. Deretter trekker vi fra sa forvetigsverdi µ og dividerer med stadardavviket på begge sider. P(X <.645 σ/ + µ 0 ) = P( X µ σ/.645 σ/ + µ0 µ < σ/ ) = P(Z < 0.7338) 0.767. Hvis vi ikke kue bruke ormalfordeligsatakelse, ville teststyrke blitt svakere. Her er det forutsatt at vi er gaske sikre på variase, f.eks. på grulag av data fra produset. Geerelt må atall observasjoer økes for å oppå økt teststyrke. (Dette er fullgodt svar.) Mulig tillegg: Hvis e har mulighet til å gjeomføre forsøket på e måte slik at variase blir midre, f.eks. kjøre bilee uder mer kotrollerte former i et laboratorium, ville også teststyrke økes. Evetuelt ka e øke sigifikasivået α f.eks. til 0., og dermed øke teststyrke, me dette er sjelde aktuelt i praksis. ov-lsf-b 25. oktober 205 Side 4

Oppgave 4 Brosebolter Eksame desember 2004, oppgave av 3 TMA4240 Statistikk Høst 205 a) Vi jobber med X som er ormalfordelt med forvetig µ x = 85 gram og varias σ 2 = gram 2. Hva er sasylighete for at kobberiholdet i e tilfeldig valgt brosebolt er midre e 84 gram? P (X < 84) = P (X 84) = P ( X 85 = Φ( ) = 0.587 84 85 ) = P (Z ) Fi et tall, k, slik at sasylighete er 0.0 for at kobberiholdet i e tilfeldig valgt brosebolt er større e k. P ( X 85 P (X > k) = 0.0 > k 85 ) = 0.0 k 85 = z 0.0 = 2.326 k = 2.326 + 85 = 87.326 Vi ser på kobberiholdet i to tilfeldig valgte og uavhegige brosebolter, som vi kaller X og X 2, og skal se på differase X X 2. Side X og X 2 begge er ormalfordelte og uavhegige så er også X X 2 ormalfordelt, med forvetigsverdi og varias som følger: E(X X 2 ) = E(X ) E(X 2 ) = µ x µ x = 0 Var(X X 2 ) = Var[X + ( ) X 2 ] = Var(X ) + ( ) 2 Var(X 2 ) = σ 2 + σ 2 = 2σ 2 = 2 da σ 2 =. Hva er sasylighete for at kobberiholdet i de to broseboltee avviker med mer e.5 gram? P ( X X 2 >.5) = P (X X 2 <.5) + P (X X 2 >.5) = 2 P (X X 2 <.5) = 2 P ( X X 2 0 <.5 0 ) 2 2 = 2 Φ(.5 2 ) = 2 Φ(.06) = 2 0.446 = 0.2892 b) E god estimator ˆθ er e estimator som er forvetigsrett, dvs. E(ˆθ) = θ, og har lite varias, dvs. Var(ˆθ) er lite. Vi liker veldig godt hvis variase miker år atall observasjoer som estimatore er basert på øker, og at variase går mot 0 år atallet observasjoer går mot uedelig (kosistes). ov-lsf-b 25. oktober 205 Side 5

Høst 205 To aktuelle estimatorer for σ 2 er σ 2 og S 2. Begge estimatoree er fuksjoer av i= (X i X) 2 og for å berege forveigsverdi og varias til estimatoree så bruker vi at i= V = (X i X) 2 σ 2 er kji-kvadratfordelt med ( ) frihetsgrader (se formelsamlige side 27). Vi vet videre at E(V ) = ( ) og Var(V ) = 2 ( ). Vi ka å uttrykke S 2 og ˆσ 2 som fuksjoer av V ; σ 2 = S 2 = (X i X) 2 = V σ2 i= i= Dermed forvetig til de to estimatoree: og videre variase: (X i X) 2 = V σ2 E( σ 2 ) = E( V σ2 ) = σ2 E(V ) = E(S 2 ) = E( V σ2 ) = σ2 σ2 E(V ) = σ2 = σ 2 Var( σ 2 ) = Var( V σ2 ) = σ4 2 ( ) Var(V ) = 2 2 σ 4 Var(S 2 ) = Var( V σ2 ) = σ 4 2 ( ) Var(V ) = ( ) 2 ( ) 2 σ4 = 2 σ4 ( ) Vi ser at S 2 er forvetigsrett, mes σ 2 er skjev. Side < vil σ2 i det lage løp uderestimere σ 2. Variase til begge estimatoree avtar år atall observasjoer øker. Estimatore σ 2 har midre varias e S 2 for alle verdier av. Begge estimatoree er kosistete. Hvis vi legger mest vekt på at vi øsker e estimator som er forvetigsrett så ville vi velge S 2, mes er det viktigst med mist mulig varias så ville vi velge σ 2. c) Vi jobber med to uavhegige ormalfordelte utvalg med samme varias. Vi har Brosespesialiste: X, X 2,..., X u.i.f. ormal med E(X i ) = µ x og Var(X i ) = σ 2, og Metalleksperte: Y, Y 2,..., Y m u.i.f. ormal med E(Y j ) = µ y og Var(Y j ) = σ 2. Vi øsker å udersøke om forvetigsverdie til kobberiholdet i brosebolter fra Metalleksperte er lavere e kobberiholdet i brosebolter fra Broseeksperte. Null- og alterativ hypotese: H 0 : µ x = µ y H : µ x > µ y H 0 : µ x µ y = 0 H : µ x µ y > 0 ov-lsf-b 25. oktober 205 Side 6

Høst 205 Det er også mulig å sette µ x µ y som H 0, me alle beregigee blir uforadret. De ukjete parameteree er µ x, µ y og σ 2, og vi setter opp følgede estimatorer: ˆµ x = ˆµ y = m S 2 p = X i = X i= Y j = Y j= + m 2 [ (X i X) 2 + i= m (Y j Y ) 2 ] j= Vi vet at uder H 0 så er T 0 = (X Y ) 0 S p + m t-fordelt med ( + m 2) frihetsgrader. Vi vil forkaste H 0 år T 0 k, der kostate k fies slik at Type-I feile er kotrollert på ivå α. P (T 0 k H 0 sa) α k t α,(+m 2) der t α,(+m 2) er α-kvatile i e t-fordelig med + m 2 frihetsgrader. Forkastigsmråde: Forkast H 0 år T 0 t α,(+m 2). Når α = 0.05 og = 0, m = 0, er t 0.05,8 =.734. Isatt data fra tabell i oppgavetekste har vi: x = 850.75 = 85.075 0 y = 842.0 = 84.2 0 s 2 p = 0 8 [ (x i x) 2 + t 0 = i= x y 0 s p 0 + 0 0 j= (y j y) 2 ] = (8.9 + 9.70) = 0.994 8 85.075 84.2 0 = =.94 0.994 0 + 0 Side t 0 =.94 > t 0.05,8 =.734 så forkaster vi H 0 på ivå α = 0.05, og kokluderer med at kobberiholdet i broseboltee fra Metalleksperte er lavere e kobberiholdet i broseboltee fra Brosespesialiste. Når vi forkastet H 0 på ivå 0.05 så betyr det at p-verdie må være midre e 0.05. P -verdie er gitt som P (T 0 > t 0 H 0 sa) = P (T 0 >.94 µ x µ y = 0) = P (T 0.94 µ x µ y = 0) Fra tabell 2 i oppgave så slår vi opp på P (T t) med t =.94 og ν = 8, og fier 0.966, som gir p-verdi 0.966=0.034. ov-lsf-b 25. oktober 205 Side 7

Høst 205 d) Et 95 % prediksjoitervall er et itervall som med 95 % sasylighet ieholder e y observasjo. E y observasjo fra Brosespesialiste, kalt X 0, er ormalfordelt med forvetig µ x og varias σ 2. Vi beytter ˆµ x = X som estimator for µ x og S 2 p som estimator for σ 2. For å utlede prediksjositervallet starter vi med X X 0, som er ormalfordelt med E(X X 0 ) = E(X) E(X 0 ) = 0 Var(X X 0 ) = Var(X) + Var(X 0 ) = σ2 + σ2 = ( + )σ2 Hvis σ 2 var kjet ville dermed X X 0 0 + σ vært stadard ormalfordelt. Nå er σ 2 ukjet, og vi beytter estimatore S 2 p. Vi ser da på X X 0 0 + S p som er t-fordelt med + m 2 frihetsgrader. Et ( α)00% predisjositervall for X 0 blir da: P (X t α 2,(+m 2) der P (T > t α 2,(+m 2) ) = α 2 P ( t α 2,(+m 2) < X X 0 0 + S p + S p < X 0 < X + t α 2,(+m 2) < t α 2,(+m 2) ) = α + S p) = α i t-fordelige med + m 2 frihetsgrader. NB: vi hadde fått det samme itervallet hvis vi hadde startet med X 0 X på gru av symmetri. Med + m 2 = 8 og α = 0.05 blir t α 2,(+m 2) = 2.0 og umeriske verdier for itervallet blir [82.88, 87.27], da x t α 2,(+m 2) x + t α 2,(+m 2) + s p = 85.075 2.0 + 0.997 = 82.88 0 + s p = 85.075 + 2.0 Det tilsvarede itervallet for Metalleksperte blir [82.0, 86.4] y t α 2,(+m 2) y + t α 2,(+m 2) + 0.997 = 87.27 0 + m s p = 84.2 2.0 + 0.997 = 82.0 0 + m s p = 84.2 + 2.0 + 0.997 = 86.4 0 ov-lsf-b 25. oktober 205 Side 8

Høst 205 Brosebolte som ble brukt til å kuse viduet hos Metalleksperte ble målt til å ha et kobberihold på 86.30 gram. Ka du ut fra itervallee du har laget over si oe om hvilke produset som ka ha laget brosebolte? 95% prediksjositervallet for e y observasjo fra Metalleksperte og 95% prediksjositervallet for e y observasjo fra Brosespesialiste ieholder begge verdie 86.30. Det er dermed mulig at brosebolte ka komme fra begge produsetee. Det vil ikke bli trukket i poeg hvis itervallet for Brosespesialiste er laget med Sx 2 = i= (X i X) 2 som estimator for σ 2 og for Metalleksperte med Sy 2 = m m j= (Y j Ȳ )2 som estimator for σ 2. Me da vil ma jobbe med e t-fordelig med hhv. og m frihetsgrader, og itervallee ville blitt litt bredere. ov-lsf-b 25. oktober 205 Side 9