TMA4240 Statistikk Høst 2009



Like dokumenter
TMA4240 Statistikk Høst 2009

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

TMA4240 Statistikk Høst 2012

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk. Øving nummer b5. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk 2014

HØGSKOLEN I STAVANGER

11,7 12,4 12,8 12,9 13,3.

HØGSKOLEN I STAVANGER

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Vår 2015

EKSAMEN I TMA4245 Statistikk

TMA4240 Statistikk Høst 2009

> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

TMA4240 Statistikk Eksamen desember 2015

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2015

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Oppgave 1: Feil på mobiltelefoner

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

TMA4240 Statistikk Høst 2018

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4240 Statistikk

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Eksamen desember 2015

EKSAMEN I EMNE TMA4245 STATISTIKK

Eksamensoppgave i TMA4245 Statistikk

HØGSKOLEN I STAVANGER

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk Høst 2016

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Eksamensoppgave i TMA4245 Statistikk

i x i

Eksamensoppgave i TMA4240 Statistikk

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

EKSAMEN I FAG TMA4240 STATISTIKK

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Eksamensoppgåve i TMA4240 Statistikk

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Kort overblikk over kurset sålangt

TMA4240 Statistikk Høst 2015

Fasit for tilleggsoppgaver

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i SØK Statistikk for økonomer

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i ST0103 Brukerkurs i statistikk

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

EKSAMEN I TMA4240 Statistikk

Eksamensoppgåve i TMA4245 Statistikk

Kapittel 2: Hendelser

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Løsningsforslag, eksamen statistikk, juni 2015

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA-1001.

EKSAMEN. EMNEANSVARLIG: Terje Bokalrud og Hans Petter Hornæs. TILLATTE HJELPEMIDLER: Kalkulator og alle trykte og skrevne hjelpemidler.

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Eksamensoppgave i TMA4240 Statistikk

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Repeterbarhetskrav vs antall Trails

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 Statistikk

Forelesning 9 mandag den 15. september

TMA4240 Statistikk Høst 2007

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Binomisk fordeling. Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

TMA4245 Statistikk Vår 2007

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Transkript:

TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b7 Oppgave 1 Automatisert laboratorium Eksamen november 2002, oppgave 3 av 3 I eit laboratorium ynskjer ein å evaluere samanhengen mellom to variablar Y og x. Apparaturen er sett opp slik at ein kan fastsetje x for deretter å måle Y. Ein vel å nytte følgjande modell for samanhengen mellom variablane Y = α + βx + ε der α og β er to ukjende koeffisientar og ε er ein tilfeldig variabel som er normalfordelt med forventing 0 og ukjend varians σ 2. La x 1,x 2,...,x n vere n verdiar av variabelen x og y 1,y 2,...,y n dei tilhøyrande verdiane som blir målt for Y. Desse skal sjåast på som realiseringar av n uavhengige variablar Y 1,Y 2,...,Y n. Minste kvadratsums (least squares) estimatorane, A og B, for koeffisientane α og β er då gitt ved A = 1 n n Y i B x og B = i=1 i=1 (x i x)y i i=1 (x i x) 2 der x = 1 n n x i. i=1 a) Vis at estimatorane A og B er forventingsrette estimatorar for α og β. Bruk at kovariansen mellom Ȳ = (1/n) i=1 Y i og B er 0 og utlei variansen til estimatorane A og B. Kva sannsynsfordelingar har estimatorane A og B? Grunngjev svaret. Laboratorieforsøka er svært arbeidskrevjande, men apparaturen er automatisert slik at forsøka kan utførast automatisk for ekvidistante verdiar av x. Sjå på to måleseriar med n = 10 Serie 1: x 1 = 1,x 2 = 2,...,x 10 = 10 Serie 2: x 1 = 2,x 2 = 4,...,x 20 = 20 Målet med forsøket er å prediktere Y 0 for x 0 = 5.5. Følgjande prediktor blir brukt: Ŷ0 = A + Bx 0. b) Utlei variansen til Y 0 Ŷ0. Kva måleserie bør nyttast for å prediktere Y 0 best mogeleg for x 0 = 5.5? Grunngjev og kommenter svaret du har funne. ovingb7-oppg-b 15. november 2009 Side 1

Oppgave 2 Mosjonisten Eksamen mai 2000, oppgave 4 av 4 En 45-åring startet med løpetrening for 9 år siden, og har hvert år siden deltatt i samme mosjonsløp. Anvendt tid, i minutter, er gitt i tabellen nedenfor. år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 Det oppgis at 9 i=1 x i = 369, 9 i=1 y i = 360.37, 9 i=1 (x i x) 2 = 60, 9 i=1 (y i ȳ) 2 = 63.28 og 9 i=1 (x i x)(y i ȳ) = 9 i=1 (x i x)y i = 52.57. Vi skal anta at observasjonene kan ses på som realisasjoner av uavhengige normalfordelte variable Y 1,...,Y 9, hvor E(Y i ) = α + βx i og Var(Y i ) = σ 2. a) Skriv opp de vanlige forventningsrette estimatorene ˆα, ˆβ og ˆσ 2 for α, β og σ 2. Regn ut estimatene for α og β for de gitte dataene. Plott datasettet og den estimerte regresjonslinjen. Det oppgis at estimatet for σ 2 er 1.568 2. b) Regn ut et uttrykk for variansen til estimatoren ˆβ. Gjennomfør en test av H 0 : β = 0 mot H 1 : β 0, på signifikansnivå 1%. Hva blir den praktiske fortolkningen av testen over? Løperen ønsker å predikere anvendt tid på mosjonsløpet neste gang (alder x 0 = 46 år). c) Regn ut predikert tid. Det oppgis at Var(ˆα + ˆβx 0 ) = σ 2 ( 1 n + (x 0 x) 2 P n i=1 (x i x) 2 ). Utled et 95% prediksjonsintervall for Y ved x 0 = 46 år. Hva blir intervallet med de oppgitte data? Hvis løperen ber deg predikere anvendt tid om 15 år (alder 60 år), hva vil du svare da? Oppgave 3 Hubble Eksamen mai 2006, oppgave 4 av 4 En viktig vitenskapelig oppdagelse fant sted i 1929 da Edwin Hubble oppdaget at universet er ekspanderende. Hubble s tallmateriale bestod blant annet av; x i = avstanden til galakse i (målt i millioner lysr), og y i = hastigheten til galakse i (målt i 1000 km/s). Verdiene Hubble benyttet i en av sine analyser er som følger: Det oppgis her at 11 i=1 x i = 4185, 11 i=1 y i = 237.7, 11 i=1 x2 i = 2685141 og 11 i=1 x iy i = 152224. Hubble foreslo en modell for hastighet som funksjon av avstand på formen y = βx, der β senere har blitt kalt Hubble s konstant. En statistisk versjon av ligningen kan gis ved: Y i = βx i + ε i, i = 1,...,11, (3.1) der ε i, i = 1,...,11, er uavhengige og normalfordelte stokastiske variabler med forventning 0 og varians σ 2.

Navn Avstand, x i Hastighet, y i Virgo 22 1.2 Pegasus 68 3.8 Perseus 108 5.1 Coma Berenices 137 7.5 Ursa Major 1 255 14.9 Leo 315 19.2 Corona Borealis 390 21.4 Gemini 405 23.0 Bootes 685 39.2 Ursa Major 2 700 41.6 Hydra 1100 60.8 a) Vi vil i første omgang finne en estimator for β. Bruk minste kvadraters metode (method of least squares) til å estimere β med utgangspunkt i ligning (3.1), og vis at estimatoren for β da blir gitt ved ˆβ = estimatet for β basert på dataene over. Finn også forventning og varians til ˆβ. P 11 i=1 x iy i P 11 i=1 x2 i b) Anta at en annen galakse befinner seg en avstand x 0 = 900 millioner lysr borte. Finn predikert hastighet, ŷ 0, til denne galaksen.. Regn ut Utled et 95% prediksjonsintervall for en måling av hastigheten til denne galaksen. Det oppgis at 11 i=1 (y i ŷ i ) 2 = 9.87, der ŷ i = ˆβx i. Oppgave 4 Medisinkonsentrasjon Eksamen januar 1999, oppgave 1 av 4 Ved behandling av visse kreftformer får pasientene kurer der en bestemt type medisin blir injisert i blodet i løpet av 24 timer. Alle pasienter får tilført samme dose medisin. Ved avslutningen av kuren blir konsentrasjonen av medisin i blodet målt. Medisinkonsentrasjonen måles i milligram medisin per liter blod. For at behandlingen skal ha ønsket effekt bør medisinkonsentrasjonen ved avslutningen av kuren helst overstige 5 mg/l. På grunn av bivirkninger blir det ansett som uheldig om medisinkonsentrasjonen overstiger 12 mg/l. La Y betegne målt medisinkonsentrasjon ved avslutningen av en kur, og anta at Y er normalfordelt med forventning µ og varians σ 2. Målt medisinkonsentrasjon ved avslutningen av ulike kurer antas uavhengige. Anta i første omgang at µ = 8 og σ 2 = 2 2. a) Beregn sannsynlighetene P(Y 12), P(Y > 5) og P(5 < Y 12). Dersom en pasient går gjennom 8 kurer, hva er sannsynligheten for at målt medisinkonsentrasjon ved slutten av samtlige 8 kurer er i intervallet (5,12]? Følgende hendelser er definert: A 1 : Målt medisinkonsentrasjon ved slutten av en kur overstiger 5 mg/l (dvs Y > 5). A 2 : Målt medisinkonsentrasjon ved slutten av en kur er mindre eller lik 12 mg/l (dvs Y 12). b) Er A 1 og A 2 disjunkte? (Begrunn svaret)

Er A 1 og A 2 uavhengige? (Begrunn svaret) Følgende hendelse er definert: A 3 : Målt medisinkonsentrasjonen ved slutten av en kur er mellom 5 mg/l og 12 mg/l (dvs 5 < Y 12). Uttrykk A 3 ved A 1 og A 2. Anta nå at µ er ukjent, mens σ 2 = 2 2 fremdeles antas kjent. Fra åtte ulike kurer har man registrert dataene: kur i 1 2 3 4 5 6 7 8 y i 7.1 9.2 10.8 12.0 6.1 8.2 8.7 7.7 c) Skriv opp en rimelig estimator for µ, og regn ut estimatet. Utled et 95% konfidensintervall for µ. Hva blir intervallet med de oppgitte dataene? Legene har etterhvert funnet ut at i stedet for å gi alle pasienter samme dose medisin, vil det være gunstigere å justere dosene etter hvor syk pasienten er og hvor godt han/hun tåler bivirkningene. La x være dosen. Vi antar at x kan kontrolleres, dvs x er ikke stokastisk. Man antar at en god lineær regresjonsmodell for sammenhengen mellom x og Y vil være Y = βx + E, der β er en ukjent konstant og E er en normalfordelt stokastisk variabel med forventningsverdi 0 og kjent varians σ 2 E = 22. d) Hvorfor er det i dette tilfellet rimelig å ikke ha med noe konstantledd i den lineære regresjonsmodellen? Vis at sannsynlighetsmaksimeringsestimatoren (SME) for β basert på n uavhengige observasjoner blir ˆβ = i=1 Y ix i i=1 x2 i der x i og Y i er henholdsvis dose og målt medisinkonsentrasjon for observasjon nummer i. Regn ut forventningen og variansen til ˆβ. Det har i løpet av ti kurer på ulike pasienter blitt observert følgende sammenhørende verdier for x og Y : kur i 1 2 3 4 5 6 7 8 9 10 x i 4.5 4.0 5.5 7.0 8.0 8.5 9.0 6.5 6.0 5.0 y i 6.2 5.2 7.3 8.7 9.0 10.5 10.3 8.2 7.4 7.0 Det oppgis at 10 i=1 y ix i = 536.4 og 10 i=1 x2 i = 436. Før legene gir en pasient en viss dose x 0 ønsker de å vite noe om hvilken målt medisinkonsentrasjon Y 0 man kan regne med at dette vil gi. Du skal hjelpe legene ved å lage et 95% prediksjonsintervall. e) Hva er tolkningen av et 95% prediksjonsintervall? Utled et 95% prediksjonsintervall for Y 0 når x 0 = 8 ved å bruke de oppgitte dataene.

Fasit 1. b) Bør benytte måleserie 2 2. a) α = 75.96, β = 0.876 b) Var( β) = σ 2 / i=1 (x i x) 2, Forkast H 0 c) 35.66,[31.09,40.23] 3. a) 0.0567 b) 51.03, (48.5,53.5) 4. a) 0.977,0.933,0.910, 0.47 b) A 3 = A 1 A 2 c) µ = Y,8.725,[7.34,10.11] d) E( β) = β, Var( β) = σe 2 / i=1 x2 i e) [5.64,14.04]