TMA4240 Statistikk Vår 2008 Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Øvig ummer b6 Oppgave 1 Eksame mai 2001, oppgave 1 av 4 Vi ser på kosetrasjoe av et giftstoff i havbue like utefor e fabrikk. Miljøforskriftee sier at kosetrasjoe ikke skal overstige 12 [g/cm 3 ]. For å kotrollere dette tas prøver av havbue. Ata at e prøveverdi Y er ormalfordelt med forvetig µ og stadardavvik σ. Sett µ = 13 og σ = 1,5 i pukt a), og la de være ukjet i reste av oppgave. a) Bereg P(Y < 12) og P(11 < Y < 14). b) De observerte måleverdiee er 11,7 12,4 12,8 12,9 13,3. Ka vi på grulag av dette kokludere med at giftkosetrasjoe på havbue like ved fabrikke er over 12? Formuler problemstillige som e hypotesetest og utfør teste på sigifikasivå 0,05. c) Det blir tatt 10 ye måliger, me dee gag i ulike avstader x fra fabrikke. Måligee er x 10 20 30 40 50 60 70 80 90 100 y 9,9 11,1 9,3 10,6 9,2 9,3 10,0 9,2 10,3 8,4 I tillegg kommer de fem måligee i b). Her er x = 0. Det oppgis at x i = 550, (xi x) 2 = 18333,33, y i = 160,4 og x i y i = 5245. Vi velger å utføre e lieær regresjosaalyse med Y som avhegig variabel og x som uavhegig variabel. Modelle er E(Y x) = α + βx. Bereg estimatee for α og β. Forklar hva estimatet for α beskriver i dette eksemplet. Regresjosaalyse gir oss ikke grulag for å kokludere med at α > 12. Hvorfor ikke? Sammelig resultatet fra dee aalyse med resultatet i b) og kommeter. Hvorfor ka det skje at to slike aalyser gir forskjellig koklusjo? Bruk gjere figur i forklarige. Oppgave 2 Automatisert laboratorium Eksame ovember 2002, oppgave 3 av 3 ovigb6-oppg-b 1. april 2008 Side 1
I eit laboratorium yskjer ei å evaluere samahege mellom to variablar Y og x. Apparature er sett opp slik at ei ka fastsetje x for deretter å måle Y. Ei vel å ytte følgjade modell for samahege mellom variablae Y = α + βx + ε der α og β er to ukjede koeffisietar og ε er ei tilfeldig variabel som er ormalfordelt med forvetig 0 og ukjed varias σ 2. La x 1,x 2,...,x vere verdiar av variabele x og y 1,y 2,...,y dei tilhøyrade verdiae som blir målt for Y. Desse skal sjåast på som realiserigar av uavhegige variablar Y 1,Y 2,...,Y. Miste kvadratsums (least squares) estimatorae, A og B, for koeffisietae α og β er då gitt ved A = 1 Y i B x og B = (x i x)y i (x i x) 2 der x = 1 x i. a) Vis at estimatorae A og B er forvetigsrette estimatorar for α og β. Bruk at kovariase mellom Ȳ = (1/) Y i og B er 0 og utlei variase til estimatorae A og B. Kva sasysfordeligar har estimatorae A og B? Grugjev svaret. Laboratorieforsøka er svært arbeidskrevjade, me apparature er automatisert slik at forsøka ka utførast automatisk for ekvidistate verdiar av x. Sjå på to måleseriar med = 10 Serie 1: x 1 = 1,x 2 = 2,...,x 10 = 10 Serie 2: x 1 = 2,x 2 = 4,...,x 20 = 20 Målet med forsøket er å prediktere Y 0 for x 0 = 5.5. Følgjade prediktor blir brukt: Ŷ0 = A + Bx 0. b) Utlei variase til Y 0 Ŷ0. Kva måleserie bør yttast for å prediktere Y 0 best mogeleg for x 0 = 5.5? Grugjev og kommeter svaret du har fue. Oppgave 3 Medisikosetrasjo Eksame jauar 1999, oppgave 1 av 4 Ved behadlig av visse kreftformer får pasietee kurer der e bestemt type medisi blir ijisert i blodet i løpet av 24 timer. Alle pasieter får tilført samme dose medisi. Ved avslutige av kure blir kosetrasjoe av medisi i blodet målt. Medisikosetrasjoe måles i milligram medisi per liter blod. For at behadlige skal ha øsket effekt bør medisikosetrasjoe ved avslutige av kure helst overstige 5 mg/l. På gru av bivirkiger blir det asett som uheldig om medisikosetrasjoe overstiger 12 mg/l. La Y betege målt medisikosetrasjo ved avslutige av e kur, og ata at Y er ormalfordelt med forvetig µ og varias σ 2. Målt medisikosetrasjo ved avslutige av ulike kurer atas uavhegige. Ata i første omgag at µ = 8 og σ 2 = 2 2. a) Bereg sasylighetee P(Y 12), P(Y > 5) og P(5 < Y 12). Dersom e pasiet går gjeom 8 kurer, hva er sasylighete for at målt medisikosetrasjo ved slutte av samtlige 8 kurer er i itervallet (5,12]?
Følgede hedelser er defiert: A 1 : Målt medisikosetrasjo ved slutte av e kur overstiger 5 mg/l (dvs Y > 5). A 2 : Målt medisikosetrasjo ved slutte av e kur er midre eller lik 12 mg/l (dvs Y 12). b) Er A 1 og A 2 disjukte? (Begru svaret) Er A 1 og A 2 uavhegige? (Begru svaret) Følgede hedelse er defiert: A 3 : Målt medisikosetrasjoe ved slutte av e kur er mellom 5 mg/l og 12 mg/l (dvs 5 < Y 12). Uttrykk A 3 ved A 1 og A 2. Ata å at µ er ukjet, mes σ 2 = 2 2 fremdeles atas kjet. Fra åtte ulike kurer har ma registrert dataee: kur i 1 2 3 4 5 6 7 8 y i 7.1 9.2 10.8 12.0 6.1 8.2 8.7 7.7 c) Skriv opp e rimelig estimator for µ, og reg ut estimatet. Utled et 95% kofidesitervall for µ. Hva blir itervallet med de oppgitte dataee? Legee har etterhvert fuet ut at i stedet for å gi alle pasieter samme dose medisi, vil det være gustigere å justere dosee etter hvor syk pasiete er og hvor godt ha/hu tåler bivirkigee. La x være dose. Vi atar at x ka kotrolleres, dvs x er ikke stokastisk. Ma atar at e god lieær regresjosmodell for sammehege mellom x og Y vil være Y = βx + E, der β er e ukjet kostat og E er e ormalfordelt stokastisk variabel med forvetigsverdi 0 og kjet varias σ 2 E = 22. d) Hvorfor er det i dette tilfellet rimelig å ikke ha med oe kostatledd i de lieære regresjosmodelle? Vis at sasylighetsmaksimerigsestimatore (SME) for β basert på uavhegige observasjoer blir ˆβ = Y ix i x2 i der x i og Y i er heholdsvis dose og målt medisikosetrasjo for observasjo ummer i. Reg ut forvetige og variase til ˆβ. Det har i løpet av ti kurer på ulike pasieter blitt observert følgede sammehørede verdier for x og Y : kur i 1 2 3 4 5 6 7 8 9 10 x i 4.5 4.0 5.5 7.0 8.0 8.5 9.0 6.5 6.0 5.0 y i 6.2 5.2 7.3 8.7 9.0 10.5 10.3 8.2 7.4 7.0 Det oppgis at 10 y ix i = 536.4 og 10 x2 i = 436.
Før legee gir e pasiet e viss dose x 0 øsker de å vite oe om hvilke målt medisikosetrasjo Y 0 ma ka rege med at dette vil gi. Du skal hjelpe legee ved å lage et 95% prediksjositervall. e) Hva er tolkige av et 95% prediksjositervall? Utled et 95% prediksjositervall for Y 0 år x 0 = 8 ved å bruke de oppgitte dataee. Oppgave 4 Kalibrerig ved regresjo Eksame jui 2005, oppgave 3 av 3 Et apparat for registrerig av strålig er tatt i for kalibrerig og kotroll. Vi skal i dee oppgave ata at følgede relasjo gjelder mellom apparatets registrerte måleverdi Y og stråligsitesitete x til e stråligskilde som plasseres i hehold til et gitt forsøksoppsett: Y = α + β x + ε Her er α og β kostater, og ε er e stokastisk (tilfeldig) variabel som, samme med α, represeterer effekte av bakgrusstrålige. Det atas at ε er ormalfordelt med forvetigsverdi E(ε) = 0 og varias Var(ε) = σ 2. a) Kalibrerige iledes ved å registrere m uavhegige måleverdier y 1,...,y m for Y ute oe stråligskilde, dvs. med bare bakgrusstrålig. Disse måleverdiee ka da betraktes som et tilfeldig utvalg fra e ormalfordelt populasjo. La Y = 1 m m Y i være middelet (gjeomsittet) basert på dette tilfeldig utvalget. Hvilke fordelig har Y? Forklar at e rimelig estimator for α i dette tilfellet er Y. Ata i reste av oppgave at α og σ er kjete parametere. Adre fase i kalibrerige foregår ved å foreta måliger med et utvalg stråligsitesiteter x 1,...,x, som gir måleverdiee y 1,...,y. Vi ka da betrakte y i α β x i, i = 1,...,, som et tilfeldig utvalg fra e ormalfordelt populasjo med forvetig 0 og varias σ 2. b) Bruk prisippet for sasylighetsmaksimerig (maximum likelihood) til å fie e estimator for koeffisiete β. Alle steg i utledige av uttrykket for estimatore skal vises. Utled også miste kvadratsums-estimatore for β. Sammelig de to estimatoree. Oppgave 5 Hubble Eksame mai 2006, oppgave 4 av 4 E viktig viteskapelig oppdagelse fat sted i 1929 da Edwi Hubble oppdaget at uiverset er ekspaderede. Hubble s tallmateriale bestod blat aet av; x i = avstade til galakse i (målt i millioer lysr), og y i = hastighete til galakse i (målt i 1000 km/s). Verdiee Hubble beyttet i e av sie aalyser er som følger: Det oppgis her at 11 x i = 4185, 11 y i = 237.7, 11 x2 i = 2685141 og 11 x iy i = 152224.
Nav Avstad, x i Hastighet, y i Virgo 22 1.2 Pegasus 68 3.8 Perseus 108 5.1 Coma Bereices 137 7.5 Ursa Major 1 255 14.9 Leo 315 19.2 Coroa Borealis 390 21.4 Gemii 405 23.0 Bootes 685 39.2 Ursa Major 2 700 41.6 Hydra 1100 60.8 Hubble foreslo e modell for hastighet som fuksjo av avstad på forme y = βx, der β seere har blitt kalt Hubble s kostat. E statistisk versjo av ligige ka gis ved: Y i = βx i + ε i, i = 1,...,11, (5.1) der ε i, i = 1,...,11, er uavhegige og ormalfordelte stokastiske variabler med forvetig 0 og varias σ 2. a) Vi vil i første omgag fie e estimator for β. Bruk miste kvadraters metode (method of least squares) til å estimere β med utgagspukt i ligig (5.1), og vis at estimatore for β da blir gitt ved ˆβ = estimatet for β basert på dataee over. Fi også forvetig og varias til ˆβ. P 11 P x iy i 11 x2 i b) Ata at e ae galakse befier seg e avstad x 0 = 900 millioer lysr borte. Fi predikert hastighet, ŷ 0, til dee galakse.. Reg ut Utled et 95% prediksjositervall for e målig av hastighete til dee galakse. Det oppgis at 11 (y i ŷ i ) 2 = 9.87, der ŷ i = ˆβx i. Fasit 1. a) 0.251, 0.657 b) Forkaster H 0 2. b) Bør beytte måleserie 2 3. a) 0.977,0.933,0.910, 0.47 b) A 3 = A 1 A 2 c) µ = Y,8.725,[7.34,10.11] d) E( β) = β, Var( β) = σe 2 / x2 i e) [5.64,14.04] 5. a) 0.0567 b) 51.03, (48.5,53.5)