EKSAMEN I TMA4255 ANVENDT STATISTIKK

Like dokumenter
EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

EKSAMEN I TMA4255 ANVENDT STATISTIKK

HØGSKOLEN I STAVANGER

Eksamensoppgåve i TMA4255 Anvendt statistikk

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

Eksamensoppgave i TMA4255 Anvendt statistikk

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Eksamensoppgave i TMA4240 Statistikk

EKSAMENSOPPGAVER STAT100 Vår 2011

EKSAMEN I TMA4240 Statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4245 Statistikk Eksamen desember 2016

Kvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

UNIVERSITETET I OSLO

Eksamensoppgave i ST3001

EKSAMEN I FAG ST2202 ANVENDT STATISTIKK

UNIVERSITETET I OSLO

Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider.

EKSAMENSOPPGAVE STA-1001.

HØGSKOLEN I STAVANGER

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

vekt. vol bruk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

EKSAMENSOPPGAVE STA-2004.

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen august 2014

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk Høst 2015

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

TMA4245 Statistikk Eksamen august 2014

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Løsningsforslag eksamen STAT100 Høst 2010

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Eksamensoppgåve i TMA4255 Anvendt statistikk

Tilleggsoppgaver for STK1110 Høst 2015

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

TMA4240 Statistikk Høst 2016

Eksamensoppgåve i TMA4255 Anvendt statistikk

i x i

TMA4240 Statistikk Høst 2012

Eksamensoppgave i ST0103 Brukerkurs i statistikk

EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

Eksamensoppgave i TMA4267 Lineære statistiske modeller

TMA4240 Statistikk Høst 2016

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgåve i TMA4240 Statistikk

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

Tidspunkt for eksamen: 12. mai ,5 timer

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

Eksamensoppgave i TMA4245 Statistikk

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Onsdag 8. august 2012 Tid: 9:00 13:00 Antall studiepoeng: 7.5. Tillatte hjelpemidler: Alle trykte og håndskrevne hjelpemidler. Spesiell kalkulator. Sensurfrist: 30. august 2012. Eksamensresultatene annonseres fra http://studweb.ntnu.no/. Merk deg følgende: Signifikansnivå 5% skal brukes hvis ikke annet er spesifisert. Alle svar må begrunnes.

TMA4255 Anvendt statistikk Side 2 av 5 Oppgave 1 Cannabisbruk blant ungdom i Norge Statens institutt for rusmiddelforskning er ansvarlig for drift av statistikkdatabasen RusStat som har tilgjengelig statistikk om alkohol, narkotika og tobakk. Vi skal nå se på data for bruk av cannabis blant ungdom for årene 2004 2008. I raden som heter Totalt er antall ungdommer som er spurt om cannabisbruk hvert år angitt. 2004 2005 2006 2007 2008 Alle år Brukt 222 261 206 357 281 1327 Ikke brukt 1432 1482 1365 2891 2394 9564 Totalt 1654 1743 1571 3248 2675 10891 a) Vil vil undersøke om det er en endring i frekvensen av cannabisbruk over årene 2004 2008. Skriv ned nullhypotesen og den alternative hypotesen og utfør en hypotesetest på grunnlag av informasjonen i tabellen over. For å forenkle beregningsbyrden kan det oppgis at χ 2 -testobservatoren blir 27.7, og du trenger bare å vise hvordan du regner ut ett av de 10 leddene i summen. Hva er din konklusjon basert på denne testen? Oppgave 2 Prosessutvikling Vi vil se på et designet eksperiment for å utvikle en etseprosess. Det er tre designfaktorer (A, B and C). De tre designfaktorene ble kjørt med to nivå hver. A: Avstanden mellom elektrodene. Lav: 0.80 cm. Høy: 1.20 cm. B: Gassflyten. Lav: 125. Høy: 200. C: Energi tilført katoden. Lav: 275 W. Høy: 325 W. Reponsvariabelen er etseraten til prosessen (Å/m). Vi ønsker en høy verdi for etseraten. Det ble utført et 2 3 faktorielt design, og resultatene fra forsøket er presentert i tabell 1.

TMA4255 Anvendt statistikk Side 3 av 5 Run A B C Response 1 1 1 1 550 2 1 1 1 669 3 1 1 1 633 4 1 1 1 642 5 1 1 1 1037 6 1 1 1 749 7 1 1 1 1075 8 1 1 1 729 Tabell 1: Etse-eksperimentet med en replikat. Fra disse resultatene har vi følgende estimater for eksperimentelt design (DOE) faktor effekter. A B C AB AC BC ABC 126.5 * 274.0 42.0 190.5 9.5 13.0 a) Fyll inn det manglende effektestimatet for faktor B. Lag et hovedeffekt-plott (main effects plot) for faktor B, og forklar med ord hvordan du kan tolke hovedeffekten av faktor B. Dette eksperimentet ble gjentatt, slik at hver faktorkombinasjon ble kjørt totalt to ganger, dvs. n = 16. Resultatene fra en multippel linær regresjon der konstantledd, A, B, C, AB, AC, BC og ABC ble brukt som kovariater, finner du i tabellen under. Vi kaller denne den fulle regresjonsmodellen. Merk at estimatene ( Estimate ) er de estimerte regresjonskoeffisientene og ikke effektestimatene. Estimate Std. Error t value p-value Intercept 776.062 11.865 65.406 3.32e-12 A 50.812 11.865 4.282 0.002679 B 3.688 11.865 * 0.763911 C 153.062 11.865 12.900 1.23e-06 AB 12.437 11.865 1.048 0.325168 AC 76.812 11.865 6.474 0.000193 BC 1.062 11.865 0.090 0.930849 ABC 2.813 11.865 0.237 0.818586 Residual standard error: 47.46 on 8 degrees of freedom

TMA4255 Anvendt statistikk Side 4 av 5 b) Hva er angitt i kolonnnen Std. Error, og hvorfor er Std. Error den samme for alle kovariatene? Nå skal vi se på andre rad i tabellen, som omhandler faktor B. Hva er sammenhengen mellom en estimert koeffisient for B og en estimert effekt for B? Regn ut det manglende tallet for t-observatoren i tabellen. Hvilke hypoteser bygger p-verdien på, og hva blir konklusjonen for faktor B? Hvilke kovariater er signifikante i modellen? c) Anta nå at vi bruker en regresjonsmodell med konstantledd og kovariatene A, C og AC. Resultatene fra tilpassing av denne modellen finner du i tabellen under. Vi kaller dette den reduserte regresjonsmodellen. Estimate Std. Error t value p-value Intercept 776.06 10.42 74.458 <2e-16 A 50.81 10.42 4.875 0.000382 C 153.06 10.42 14.685 4.95e-09 AC 76.81 10.42 7.370 8.62e-06 Residual standard error: 41.69 on 12 degrees of freedom Hvorfor er de estimerte koeffisienten for A, C og AC de samme for den fulle og den reduserte modellen? Hvorfor har standardavvikene endret seg fra full til redusert modell? Hva vil du foreslå som optimale valg av nivå (lavt eller høyt) for hver av disse to faktorene når målet er å bruke den tilpassede regresjonsmodellen til å finne kombinasjonen med høyest estimert etserate? Regn ut et 95% prediksjonsintervall for etseraten for disse valgte nivåene for A og C. d) Anta nå at i en pilotstudie med tre faktorer så ble kjøringene 1, 4, 6 og 7 fra tabell 1 utført. Hvilken type eksperiment er dette? Hva er generatoren og den definerende relasjonen for eksperimentet? Skriv ned aliasstrukturen for eksperimentet. Hvilken resolusjon har eksperimentet? Oppgave 3 Genaktivitet Vi skal se på resultater fra en biologisk studie der målet var å sammenligne genaktivitet for tre gener (B 1, B 2, og B 3 ) i tre ulike cellepopulasjoner (A 1, A 2 og A 3 ). Genaktiviteten ble målt ved polymerase kjedereaksjonsmetoden. Målingene av genaktivitet er kontinuerlige og analyseres på logaritmisk skala (base 2). Totalt ble det gjort n = 45 målinger.

TMA4255 Anvendt statistikk Side 5 av 5 a) En toveis variansanalysemodell (ANOVA) med samspill be tilpasset til dataene, og gav følgende resultater. Source Df Sum Sq Mean Sq F value p-value A 2 3.240 * 5.935 * B 2 253.161 126.581 463.768 <2e-16 AB 4 * 30.645 112.277 <2e-16 Error 36 9.826 0.273 Total * 388.807 8.837 Fire av tallene i tabellen er blitt erstattet med en asterisk (stjerne). Forklar hva kolonneoverskriftene betyr og regn ut numeriske verdier for de fire manglende tallene. Er samspillsleddet AB signifikant? Hvordan vil du gå videre med å analysere disse dataene? I resten av oppgaven vil vi bare se på resultater for cellepopulasjon A 1. b) Biologen som har utført studien vil sammenligne genaktiviteten for gen B 1 og B 2 for cellepopulasjon A 1. Det ble gjort n 1 = 3 observasjoner av gen B 1 i cellepopulasjon A 1 og gjennomsnittet var x = 29.1 og det empiriske standardavviket s 1 = 0.34. Videre var det n 2 = 9 observasjoner for gen B 2 i cellepopulasjon A 1 og gjennomsnittet var ȳ = 33.7 og det empiriske standardavviket s 2 = 0.42. Utfør en test for å undersøke om genaktiviteten for de to genene er ulik i denne cellepopulasjonen. Skriv ned antagelsene du trenger å gjøre for å utføre denne testen. c) La µ 1 være forventet genaktivitet på logaritmisk skala (base 2) for gen B 1 i cellepopulasjon A 1, og la µ 2 være forventet genaktivitet på logaritmisk skala (base 2) for gen B 2 i cellepopulasjon A 1. Biologen er interessert i forventet fold change mellom aktiviteten til de to genene på originalskala, det vil si γ = 2µ 1 2 µ 2. Basert på to tilfeldige utvalg av størrelse n 1 og n 2 fra de to gruppene foreslå en estimator, ˆγ, for γ. Bruk tilnærmede metoder for å finne forventingsverdi og varians for denne estimatoren, det vil si, E(ˆγ) og Var(ˆγ). Bruk utvalgsstørrelsene, gjennomsnittene og de empiriske standardavvikene gitt i b) til å regne ut numerisk verdi for ˆγ og til å gi estimerte numeriske verdier for E(ˆγ) og Var(ˆγ). Hint: Du kan benytte at 2 x = exp(x ln 2), der ln er den naturlige logaritmen.