TMA4240 Statistikk Høst 2009

Like dokumenter
år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4240 Statistikk Høst 2009

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk 2014

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Vår 2015

TMA4240 Statistikk Høst 2018

Eksamensoppgave i ST0103 Brukerkurs i statistikk

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

TMA4240 Statistikk Eksamen desember 2015

HØGSKOLEN I STAVANGER

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2012

TMA4240 Statistikk Høst 2016

i x i

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgave i TMA4245 Statistikk

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

EKSAMEN I FAG TMA4240 STATISTIKK

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Fasit for tilleggsoppgaver

TMA4240 Statistikk Høst 2015

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i TMA4245 Statistikk

HØGSKOLEN I STAVANGER

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2009

HØGSKOLEN I STAVANGER

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Løsningsforslag eksamen 25. november 2003

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Høst 2007

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

TMA4240 Statistikk Høst 2015

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgåve i TMA4245 Statistikk

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

UNIVERSITETET I OSLO

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Eksamensoppgave i TMA4240 Statistikk

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

UNIVERSITETET I OSLO

LØSNINGSFORSLAG ) = Dvs

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Oppgave N(0, 1) under H 0. S t n 3

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

TMA4240 Statistikk H2010

Løsningsforslag, eksamen statistikk, juni 2015

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

EKSAMEN I TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Kapittel 2: Hendelser

HØGSKOLEN I STAVANGER

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

UNIVERSITETET I OSLO

Tilleggsoppgaver for STK1110 Høst 2015

Om eksamen. Never, never, never give up!

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

TMA4240 Statistikk H2010 (22)

Om eksamen. Never, never, never give up!

Transkript:

TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave 3 Eksamen mai 2001, oppgave 1 av 4 Vi ser på konsentrasjonen av et giftstoff i havbunnen like utenfor en fabrikk. Miljøforskriftene sier at konsentrasjonen ikke skal overstige 12 [g/cm 3 ]. For å kontrollere dette tas prøver av havbunnen. Anta at en prøveverdi Y er normalfordelt med forventning µ og standardavvik σ. Sett µ = 13 og σ = 1,5 i punkt a), og la de være ukjent i resten av oppgaven. a) Beregn P(Y < 12) og P(11 < Y < 14). b) De observerte måleverdiene er 11,7 12,4 12,8 12,9 13,3. Kan vi på grunnlag av dette konkludere med at giftkonsentrasjonen på havbunnen like ved fabrikken er over 12? Formuler problemstillingen som en hypotesetest og utfør testen på signifikansnivå 0,05. c) Det blir tatt 10 nye målinger, men denne gang i ulike avstander x fra fabrikken. Målingene er x 10 20 30 40 50 60 70 80 90 100 y 9,9 11,1 9,3 10,6 9,2 9,3 10,0 9,2 10,3 8,4 I tillegg kommer de fem målingene i b). Her er x = 0. Det oppgis at x i = 550, (xi x) 2 = 18333,33, y i = 160,4 og x i y i = 5245. Vi velger å utføre en lineær regresjonsanalyse med Y som avhengig variabel og x som uavhengig variabel. Modellen er E(Y x) = α + βx. Beregn estimatene for α og β. Forklar hva estimatet for α beskriver i dette eksemplet. ovingb6-oppg-b 4. november 2009 Side 1

Regresjonsanalysen gir oss ikke grunnlag for å konkludere med at α > 12. Hvorfor ikke? Sammenlign resultatet fra denne analysen med resultatet i b) og kommenter. Hvorfor kan det skje at to slike analyser gir forskjellig konklusjon? Bruk gjerne figur i forklaringen. Oppgave 4 Mosjonisten Eksamen mai 2000, oppgave 4 av 4 En 45-åring startet med løpetrening for 9 år siden, og har hvert år siden deltatt i samme mosjonsløp. Anvendt tid, i minutter, er gitt i tabellen nedenfor. år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 Det oppgis at 9 i=1 x i = 369, 9 i=1 y i = 360.37, 9 i=1 (x i x) 2 = 60, 9 i=1 (y i ȳ) 2 = 63.28 og 9 i=1 (x i x)(y i ȳ) = 9 i=1 (x i x)y i = 52.57. Vi skal anta at observasjonene kan ses på som realisasjoner av uavhengige normalfordelte variable Y 1,...,Y 9, hvor E(Y i ) = α + βx i og Var(Y i ) = σ 2. a) Skriv opp de vanlige forventningsrette estimatorene ˆα, ˆβ og ˆσ 2 for α, β og σ 2. Regn ut estimatene for α og β for de gitte dataene. Plott datasettet og den estimerte regresjonslinjen. Det oppgis at estimatet for σ 2 er 1.568 2. b) Regn ut et uttrykk for variansen til estimatoren ˆβ. Gjennomfør en test av H 0 : β = 0 mot H 1 : β 0, på signifikansnivå 1%. Hva blir den praktiske fortolkningen av testen over? Løperen ønsker å predikere anvendt tid på mosjonsløpet neste gang (alder x 0 = 46 år). c) Regn ut predikert tid. Det oppgis at Var(ˆα + ˆβx 0 ) = σ 2 ( 1 n + (x 0 x) 2 P n i=1 (x i x) 2 ). Utled et 95% prediksjonsintervall for Y ved x 0 = 46 år. Hva blir intervallet med de oppgitte data? Hvis løperen ber deg predikere anvendt tid om 15 år (alder 60 år), hva vil du svare da? Oppgave 5 Medisinkonsentrasjon Eksamen januar 1999, oppgave 1 av 4 Ved behandling av visse kreftformer får pasientene kurer der en bestemt type medisin blir injisert i blodet i løpet av 24 timer. Alle pasienter får tilført samme dose medisin. Ved avslutningen av kuren blir konsentrasjonen av medisin i blodet målt. Medisinkonsentrasjonen måles i milligram medisin per liter blod. For at behandlingen skal ha ønsket effekt bør medisinkonsentrasjonen ved avslutningen av kuren helst overstige 5 mg/l. På grunn av bivirkninger blir det ansett som uheldig om medisinkonsentrasjonen overstiger 12 mg/l. La Y betegne målt medisinkonsentrasjon ved avslutningen av en kur, og anta at Y er normalfordelt med forventning µ og varians σ 2. Målt medisinkonsentrasjon ved avslutningen av ulike kurer antas uavhengige. Anta i første omgang at µ = 8 og σ 2 = 2 2.

a) Beregn sannsynlighetene P(Y 12), P(Y > 5) og P(5 < Y 12). Dersom en pasient går gjennom 8 kurer, hva er sannsynligheten for at målt medisinkonsentrasjon ved slutten av samtlige 8 kurer er i intervallet (5,12]? Følgende hendelser er definert: A 1 : Målt medisinkonsentrasjon ved slutten av en kur overstiger 5 mg/l (dvs Y > 5). A 2 : Målt medisinkonsentrasjon ved slutten av en kur er mindre eller lik 12 mg/l (dvs Y 12). b) Er A 1 og A 2 disjunkte? (Begrunn svaret) Er A 1 og A 2 uavhengige? (Begrunn svaret) Følgende hendelse er definert: A 3 : Målt medisinkonsentrasjonen ved slutten av en kur er mellom 5 mg/l og 12 mg/l (dvs 5 < Y 12). Uttrykk A 3 ved A 1 og A 2. Anta nå at µ er ukjent, mens σ 2 = 2 2 fremdeles antas kjent. Fra åtte ulike kurer har man registrert dataene: kur i 1 2 3 4 5 6 7 8 y i 7.1 9.2 10.8 12.0 6.1 8.2 8.7 7.7 c) Skriv opp en rimelig estimator for µ, og regn ut estimatet. Utled et 95% konfidensintervall for µ. Hva blir intervallet med de oppgitte dataene? Legene har etterhvert funnet ut at i stedet for å gi alle pasienter samme dose medisin, vil det være gunstigere å justere dosene etter hvor syk pasienten er og hvor godt han/hun tåler bivirkningene. La x være dosen. Vi antar at x kan kontrolleres, dvs x er ikke stokastisk. Man antar at en god lineær regresjonsmodell for sammenhengen mellom x og Y vil være Y = βx + E, der β er en ukjent konstant og E er en normalfordelt stokastisk variabel med forventningsverdi 0 og kjent varians σ 2 E = 22. d) Hvorfor er det i dette tilfellet rimelig å ikke ha med noe konstantledd i den lineære regresjonsmodellen? Vis at sannsynlighetsmaksimeringsestimatoren (SME) for β basert på n uavhengige observasjoner blir ˆβ = n i=1 Y ix i n i=1 x2 i der x i og Y i er henholdsvis dose og målt medisinkonsentrasjon for observasjon nummer i. Regn ut forventningen og variansen til ˆβ. Det har i løpet av ti kurer på ulike pasienter blitt observert følgende sammenhørende verdier for x og Y : kur i 1 2 3 4 5 6 7 8 9 10 x i 4.5 4.0 5.5 7.0 8.0 8.5 9.0 6.5 6.0 5.0 y i 6.2 5.2 7.3 8.7 9.0 10.5 10.3 8.2 7.4 7.0

Det oppgis at 10 i=1 y ix i = 536.4 og 10 i=1 x2 i = 436. Før legene gir en pasient en viss dose x 0 ønsker de å vite noe om hvilken målt medisinkonsentrasjon Y 0 man kan regne med at dette vil gi. Du skal hjelpe legene ved å lage et 95% prediksjonsintervall. e) Hva er tolkningen av et 95% prediksjonsintervall? Utled et 95% prediksjonsintervall for Y 0 når x 0 = 8 ved å bruke de oppgitte dataene. Oppgave 6 Hubble Eksamen mai 2006, oppgave 4 av 4 En viktig vitenskapelig oppdagelse fant sted i 1929 da Edwin Hubble oppdaget at universet er ekspanderende. Hubble s tallmateriale bestod blant annet av; x i = avstanden til galakse i (målt i millioner lysr), og y i = hastigheten til galakse i (målt i 1000 km/s). Verdiene Hubble benyttet i en av sine analyser er som følger: Navn Avstand, x i Hastighet, y i Virgo 22 1.2 Pegasus 68 3.8 Perseus 108 5.1 Coma Berenices 137 7.5 Ursa Major 1 255 14.9 Leo 315 19.2 Corona Borealis 390 21.4 Gemini 405 23.0 Bootes 685 39.2 Ursa Major 2 700 41.6 Hydra 1100 60.8 Det oppgis her at 11 i=1 x i = 4185, 11 i=1 y i = 237.7, 11 i=1 x2 i = 2685141 og 11 i=1 x iy i = 152224. Hubble foreslo en modell for hastighet som funksjon av avstand på formen y = βx, der β senere har blitt kalt Hubble s konstant. En statistisk versjon av ligningen kan gis ved: Y i = βx i + ε i, i = 1,...,11, (6.1) der ε i, i = 1,...,11, er uavhengige og normalfordelte stokastiske variabler med forventning 0 og varians σ 2. a) Vi vil i første omgang finne en estimator for β. Bruk minste kvadraters metode (method of least squares) til å estimere β med utgangspunkt i ligning (6.1), og vis at estimatoren for β da blir gitt ved ˆβ = estimatet for β basert på dataene over. Finn også forventning og varians til ˆβ. P 11 Pi=1 x iy i 11 i=1 x2 i b) Anta at en annen galakse befinner seg en avstand x 0 = 900 millioner lysr borte.. Regn ut

Finn predikert hastighet, ŷ 0, til denne galaksen. Utled et 95% prediksjonsintervall for en måling av hastigheten til denne galaksen. Det oppgis at 11 i=1 (y i ŷ i ) 2 = 9.87, der ŷ i = ˆβx i. Fasit 3. a) 0.251, 0.657 b) Forkaster H 0 4. a) α = 75.96, β = 0.876 b) Var( β) = σ 2 / n i=1 (x i x) 2, Forkast H 0 c) 35.66,[31.09,40.23] 5. a) 0.977,0.933,0.910, 0.47 b) A 3 = A 1 A 2 c) µ = Y,8.725,[7.34,10.11] d) E( β) = β, Var( β) = σe 2 / n i=1 x2 i e) [5.64,14.04] 6. a) 0.0567 b) 51.03, (48.5,53.5)