HØGSKOLEN I STAVANGER

EKSAMEN I: MOT310 STATISTISKE METODER VARIGHET: 4 TIMER DATO: 27. FEBRUAR 2004 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 5 SIDER. HØGSKOLEN I STAVANGER Avdeling for TEKNISK NATURVITEN- SKAPELIGE FAG Oppgave 1 Kopperinnholdet i fire ulike bronselegeringer skal undersøkes. Resultatene av målinger av kopperinnhold i de fire ulike legeringene er gitt i tabellen under. Kopperinnhold ulike legeringer Legering 1 Legering 2 Legering 3 Legering 4 83.09 83.01 83.02 83.01 83.02 82.96 83.10 82.99 83.06 82.99 83.05 83.04 83.04 83.03 83.04 83.01 83.05 83.00 83.08 82.96 83.03 82.97 83.07 82.99 82.98 Det oppgis at dersom ij er observasjon nummer j fra legering i, og n i er antall observasjoner fra legering i, så er SSE = 4 ni i=1 j=1 ij ȳ i ) 2 = 0.018853 og SST = 4 ni i=1 j=1 ij ȳ ) 2 = 0.036576. Det oppgis også at s 2 1 = 1 8j=1 7 1j ȳ 1 ) 2 = 0.00114, s 2 2 = 1 7j=1 6 2j ȳ 2 ) 2 = 0.00056, s 2 3 = 1 5j=1 4 3j ȳ 3 ) 2 = 0.00102 og s 2 4 = 1 5j=1 4 4j ȳ 4 ) 2 = 0.00087, og at ȳ 1 = 1 8j=1 8 1j = 83.043, ȳ 2 = 1 7j=1 7 2j = 82.993, ȳ 3 = 1 5j=1 5 3j = 83.058 og ȳ 4 = 1 5j=1 5 4j = 83.002. 1

Et plott av selve dataene, og to plott av residualene til en enveis variansanalsemodell tilpasset til dataene, er gitt under. Målinger av kopperinnhold i ulike legeringer Residualene plottet mot legering Normalplott av residualene Kopperinnhold 82.96 82.98 83.00 83.02 83.04 83.06 83.08 83.10 Residual 0.05 0.00 0.05 Residual 0.06 0.04 0.02 0.00 0.02 0.04 1 2 3 4 Legering 1 2 3 4 Legering 2 1 0 1 2 Kvantil a) Sett opp modellen og antagelsene for enveis variansanalse. Hvordan defineres residualet til en observasjon i en enveis variansanalsemodell? Hvilke modellantagelser får vi en sjekk av ved de to plottene av residualer gitt over? Tder plottene på at disse modellantagelsene holder? b) Indikerer plottet av selve dataene noe om forskjeller i kopperinnhold for de fire legeringene? Isåfall hva? Bruk enveis variansanalse til å teste om forventet kopperinnhold er forskjellig i de ulike legeringene. Bruk 5% signifikansnivå. Spesielt er det av interesse å sammenligne kopperinnholdet i legering 1 og legering 2. c) Utled et 95% konfidensintervall for differansen i forventet kopperinnhold mellom legering 1 og legering 2. Spesifiser hvilke antagelser du må gjøre i utledningen. Tder konfidensintervallet på at det er forskjell i forventet kopperinnhold i de to legeringene? Kommenter kort. 2

Oppgave 2 En laborant skal undersøke egenskapene til et instrument som benttes til å bestemme konsentrasjonen av et stoff i en oppløsning. For å gjøre dette gjennomføres n målinger med instrumentet på en oppløsning med kjent konsentrasjon 2.0 mg/l. Måleresultatene X 1, X 2,..., X n kan antas å være uavhengige og normalfordelte med i utgangspunktet ukjent forventning µ og ukjent varians σ 2. Resultatet av n = 12 målinger ble som gitt i tabellen under. Måling i 1 2 3 4 5 6 7 8 9 10 11 12 Resultat x i 2.04 2.38 2.18 1.78 2.14 2.22 1.86 1.95 2.18 2.03 1.89 2.00 Det oppgis at 12 i=1 x i = 24.65, 12 i=1(x i x) 2 = 0.3271 og 12 i=1(x i 2.0) 2 = 0.3623. Laboranten ønsker først å sjekke om instrumentet er korrekt kalibrert slik at forventningsverdien µ er lik konsentrasjonen 2.0. a) Gir dataene grunnlag for å hevde at instrumentet er galt kalibrert (dvs grunnlag for å hevde at µ 2)? Formuler problemstillingen som en hpotesetest og utfør testen på 10% signifikansnivå. Anta i resten av oppgaven at instrumentet er korrekt kalibrert, dvs at µ = 2.0. Laboranten ønsker å estimere hvor stor måleusikkerhet apparatet har, dvs estimere variansen i målingene σ 2. To estimatorer er foreslått: ˆσ 2 = 1 n (X i µ) 2 (1) n i=1 S 2 1 n = (X i n 1 X) 2 (2) i=1 b) Hvilke to egenskaper bør en god estimator ha? Hvilken av de to estimatorene ˆσ 2 og S 2 vil du foretrekke? Begrunn svaret. (Hint: Gjør ntte av resultatene under χ 2 -fordeling på side 27 i Tabeller og formler i statistikk.) c) Ta utgangspunkt i estimatoren du valgte i b) og utled et 95% konfidensintervall for σ 2. 3

Oppgave 3 I en oppgave gitt på eksamen høsten 2003 ble sammenhengen mellom ph-verdien i forskjellige norske vann og innholdet av ulike stoffer i vannet som kunne tenkes å påvirke ph-verdien studert. Man kom i den oppgaven frem til en modell med de tre forklaringsvariablene: x 1 =innhold av SO 4 (mg/l), x 2 =innhold av NO 3 (mg/l) og x 3 =innhold av Ca (mg/l), dvs modellen Y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + ε i (3) der Y i er ph-verdi i vann i. Dataene for de aktuelle variablene fra målinger i 26 vann er gitt i tabellen under. i x1 x2 x3 1 5.38 4.9 39 1.54 2 5.68 4.1 75 1.55 3 5.04 3.5 80 0.83 4 4.81 3.8 75 0.53 5 4.92 3.8 90 0.82 6 5.34 2.6 49 0.62 7 5.74 2.7 79 1.08 8 5.17 2.6 90 0.67 9 5.02 2.4 64 0.41 10 5.88 2.8 27 1.15 11 5.36 3.4 13 0.89 12 5.26 2.7 14 0.74 13 5.69 3.2 13 1.03 14 5.51 2.5 79 0.67 15 5.25 1.5 77 0.33 16 6.06 3.7 15 1.94 17 6.08 1.9 16 1.05 18 6.08 1.3 2 0.81 19 6.2 2.2 32 1.4 20 5.64 2.2 21 0.75 21 5.76 1.6 7 0.79 22 5.43 2 27 0.47 23 5.82 1.8 17 0.74 24 5.5 2 6 0.49 25 5.62 1.5 3 0.36 26 5.41 1.7 7 0.54 4

Noe av informasjonen vi får ut når vi bruker et dataprogram til å estimere modellen er vist under. Variansanalsetabell (ANOVA): Koeffisienter: Kilde SS df M S F Regresjon 3.210 3 1.070 83.80 Feil 0.281 22 0.0127 Total 3.491 25 Variabel b i ŜD(B i) t p verdi Konstant 5.701 0.069 82.063 7.3 10 29 x 1-0.349 0.036-9.783 1.8 10 9 x 2-0.0018 0.00086-2.150 0.043 x 3 0.955 0.076 12.600 1.5 10 11 a) Still opp modellen på vektor/matriseform og vis spesielt hvordan du setter inn verdiene for forklaringsvariablene (x-ene). Skriv også ned den estimerte regresjonslinja. Regn til slutt ut predikert phverdi for et vann med 2.5 mg/l SO 4 (x 1 ), 50 mg/l NO 3 (x 2 ) og 1.0 mg/l Ca (x 3 ). b) Har de tre forklaringsvariablene x 1, x 2 og x 3 samlet sett innfltelse på phverdien? Formuler dette som en hpotesetest og utfør testen på 5% signifikansnivå. Tder informasjonen fra datautskriften på at alle de tre forklaringsvariablene i modellen har betdning eller kan noen av variablene utelates? Forklar kort c) Det har blitt hevdet at dersom man, f.eks. ved kalking, klarer å heve konsentrasjonen av Ca for et vann fra f.eks. 0.5 til 1.5 mg/l, dvs en heving på 1.0 mg/l, så vil dette gi en heving av ph-verdien på 1.0. Gir målingene grunnlag for å tvile på denne påstanden? Formuler problemstillingen som en hpotesetest om parameteren β 3 og utfør testen på 5% signifikansnivå. d) Utled et 95% prediksjonsintervall for ph-verdien i et vann med 2.5 mg/l SO 4 (x 1 ), 50 mg/l NO 3 (x 2 ) og 1.0 mg/l Ca (x 3 ). Det oppgis her at dersom x 0 = (1, 2.5, 50, 1) T så vil Var(Ŷ0) = σ 2 x T 0 (X T X) 1 x 0 = 0.07222σ 2 der Ŷ0 = B 0 + 2.5B 1 + 50B 2 + B 3. 5