Universitetet i Agder Institutt for matematiske fag MA-202 1 EKSAMEN Emnekode: MA-202 Emnenavn: Statistikk 2 Dato: 21. november 2011 Varighet: 0900 1400 Antall sider inkl. forside: 5 Tillatte hjelpemidler: Alle skrevne, trykte og kopierte. Kalkulator (også alfanumerisk) Minnet trenger ikke være tømt Merknader: OPPGAVE 1 Kristiansand kommune har hver høst i noen år gjennomført en undersøkelse av syklisters bruk av lys på syklene mens det fremdeles er mørkt om morgenen. Høsten 2009 ble det undersøkt ni=628 syklister, høsten 2010 ble det undersøkt n2-807 syklister og høsten 2011 ble det undersøkt n3=906 syklister. I tabellen nedenfor benyttes følgende forkortelser: FB = lys foran og bak F kun lys foran B = kun lys bak U uten lys FB F B U sum År 2009 241 136 25 226 628 År 2010 277 189 35 306 807 År 2011 382 248 12 264 906 Sett opp nullhypotese og alternativ hypotese for en homogenitetstest for å se om de tre årene har samme sannsynlighetsfordeling for bruk av lys. Sett opp testobservator. Hva er kritiske verdi til en test på 1% nivå? Lag en tabell tilsvarende den nedenfor, der du i parentesene setter inn estimert forventet verdi for antall i hver av de ulike kombinasjonene dersom Hogjelder. Gjennomfør testen fra a) med 1% nivå og kom med en konklusjon. FB F B U sum År 2009 241 136 25 226 628 År 2010 ) ) ) ) 277 189 35 306 807 ) ) ) ) År 2011 382 248 12 264 906 ) ) ) ) Sum 900 573 72 796 2341
MA-202 2 c) Beskriv utviklingen av lysbruk i løpet av disse tre årene. Bruk her tabellen fra b) og nevn spesielt positive trekk i utviklingen. Bruk data for 2009 og 2011 til å lage et 95% konfidensintervall for forskjellen i andel som ikke bruker lys i disse to årene. OPPGAVE 2 Et forsøk ble satt opp for å se på effekten av tre typer gjødsel (A, B, C) på mengde avling av mais på fire ulike steder (D, E, F, G). Tabellen nedenfor gir avling 17,./ sammen med gjennomsnitt for både rader og kolonner. A B C Gj.sn. D 74 92 86 84 E 79 91 88 86 F 82 81 77 80 G 78 93 84 85 Gj.sn. 78,25 89,25 83,75 83,75 Bruk en paret test (parplanen) for å gjennomføre en test på 5% nivå for å se om gjødsel B gir større forventet avling enn gjødsel C. Sett opp en teoretisk modell med blokkeffekt, der du også nevner de forutsetningene som ligger bak denne modellen. Hvilken fordel kan det være å benytte randomiserte blokkers design i et forsøk som dette? Estimer de tre behandlingseffektene knyttet til gjødseltypene. Lag Anova-tabellen for randomiserte blokker. Til hjelp i regningen kan du benytte SST = 436.25. Vis de ulike utregningene. Sett opp Hoog H1for en test for å se om det er noen effekt av gjødseltypene. Bruk Anovatabellen og gjennomfør testen på 5% nivå. Gi en konklusjon på testen. OPPGAVE 3 Båtprodusentfirmaet Minong i Wisconsin produserer blant annet små kvalitetsbåter til fisking. Etterspørselen etter slike båter har hatt en stor økning. Båtene kan produseres ved bruk av en eller flere stasjoner. Hver av disse stasjonene er bemannet med en eller flere arbeidere. I perioden 1976-1999 økte firmaet antall stasjoner fra 1-17 og antall ansatte fra 2-22. Selve datasettet består av n=24 observasjoner med følgende variable: Y = Antall solgte båter S = Antallstasjoner brukt i produksjonen. W = Antall arbeidere i firmaet. I denne oppgaven skal vi se på ulike sammenhenger mellom antall S, W og Y. Nedenfor er det gitt to plott over utviklingen over tid og en regresjonsanalyse (Model 1):
MA-202 3 400 o o 20 Stasjoner Workers Boats of 200 Number 100 15 10 5 1975 1980 1985 1990 19 2000 197$ 1980 1985 1990 1995 2000 Model Summa Model 1 R R S uare Ad'usted R S uare Std. Error of the Estimate 1 994a.989.988 16.755 a. Predictors: (Constant), W, S Model 1 Unstandardized Coefficients Standardized Coefficients B Std. Error Beta Si 1 (Constant) -5.082 6.820 -.745.464 W 13.700 2.048.658 6.691.000 S 8.789 2.528.342 3.477.002 a. Dependent Variable: Y a) Sett opp regresjonslinjen. Gi en tolkning av verdiene 13.7 og 8.789 i utskriften. Gi en presis tolkning av hva R2sier om denne estimerte modellen. Hvordan kunne vi allerede ut fra plottene få et signal om at vi her kunne få en regresjonsanalyse med høy forklaringskraft? I den neste analysen ønsker firmaet å estimere parameterne flo,13iog /62i en modell som bortsett fra usikkerhet har formen (*) y= P0Wfi1Sfi2 For å gjennomføre analysen ble data først transformert ved å ta logaritmer til hver av variablene. De transformerte variablene er kalt LnY, LnW og LnS. Fra SPSS har vi fått utskriften nedenfor fra regresjonsanalysen (Model 2) med disse variablene: Model Summary Model 2 R R S uare Adusted R S uare Std. Error of the Estimate 1.992a.984.982.11135 a. Predictors: (Constant), LnW, LnS
MA-202 4 Model 2 Unstandardized Coefficients Standardized Coefficients B Std. Error Beta Si. 1 (Constant) 3.095.098 31.666.000 LnW.781.119.773 6.539.000 LnS.193.102.223 1.889.073 a. Dependent Variable: LnY Sett opp regresjonslinjen for denne modellen. Transformer tilbake slik at du rar den estimerte sammenhengen på formen 1s7= Model 1 og Model 2? Finn1:1---1Y og J dersom W=22 og S=17. Hvorfor kan vi ikke sammenligne R2direkte i Bedriften ønsker nå en modell med restriksjoner der de krever at kan (*) uttrykkes på formen (**) Y = flow sis 1-$1 + )62= 1. Ved denne restriksjonen w Vis ved regning at (**) kan skrives som = flo, som videre kan transformeres til S S (***) L4--) = Ln(f30) +13L41 s. Hva kan være hensikten med denne restriksjonen? I regresjonsanalysen (Model 3) nedenfor er det brukt følgende variable: LnYprS = LnL,j og LnWprS = Li-tr/n Model Summaryb Model 3 R R S uare Adusted R Square Std. Error of the Estimate 1.893a.798.789.11054 Predictors: (Constant), LnWprS Dependent Variable: LnYprS Model 3 Unstandardized Coefficients Standardized Coefficients Std. Error Beta Si. 1 (Constant) 3.023.044 68.917.000 LnW rs.845.091.893 9.322.000 a. Dependent Variable: LnYprS
MA-202 5 Sett opp regresjonslinjen til regresjonslinjen i Model 3. Lag et 95% konfidensintervall for fii fra denne analysen. Bruk uttrykket i (**) sammen med regresjonslinjen i Model 3 til å estimere hvor mange prosent Y vil endre seg om vi øker W med 1% og hvor mange prosent Y vil endre seg om vi øker S med 1 %. Til den siste analysen har vi fått de to plottene nedenfor (der Obs står for obs. nr.). Karakteriser plottene og si litt om de tre årene der regresjonslinjen får store negative residual. Se på plottene i starten av oppgaven, og gi en kort beskrivelse av Y, W og S i disse årene. Residual Standardized o oo ooo() o o Obs 2.0000 1:1 1.0000 al N 7r; 0.00Q00 10 "CIVi c W -1.00000 tii.. re%cc -2.0000-3, 0 0,00 0.20 0.40 0.60 0.80 1.00 120 LnWprS