Eksamensoppgåve i TMA4255 Anvendt statistikk

Like dokumenter
Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

UNIVERSITETET I OSLO

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgåve i TMA4240 Statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i TMA4245 Statistikk

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Tid: Torsdag 11. desember Emneansvarleg: Trygve Almøy

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Eksamensoppgave i TMA4275 Levetidsanalyse

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

MOT310 Statistiske metoder 1, høsten 2011

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I EMNE TMA4245 STATISTIKK

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamenssettet består av to deler. Ved bedømmelsen teller del A 30 % og del B 70 %. Innenfor hver del teller alle deloppgaver likt.

Eksamensoppgave i TMA4245 Statistikk

HØGSKOLEN I STAVANGER

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Kapittel 10: Hypotesetesting

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen august 2014

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

TMA4240 Statistikk H2010 (20)

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i SØK1004 Statistikk for økonomer

TMA4240 Statistikk Høst 2016

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

i x i

Eksamensoppgåve i TMA4295 Statistisk inferens

Eksamensoppgave i TMA4240 Statistikk

EKSAMENSOPPGAVER STAT100 Vår 2011

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

10.1 Enkel lineær regresjon Multippel regresjon

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i SØK Statistikk for økonomer

UNIVERSITETET I OSLO

Om eksamen. Never, never, never give up!

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4275 Levetidsanalyse

Kapittel 3: Studieopplegg

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

EKSAMEN I FAG ST2202 ANVENDT STATISTIKK

UNIVERSITETET I OSLO

Om eksamen. Never, never, never give up!

UNIVERSITETET I OSLO

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLAR

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

Eksamensoppgave i TMA4275 Levetidsanalyse

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

UNIVERSITETET I OSLO

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

HØGSKOLEN I STAVANGER

EKSAMENSOPPGAVE STA-1001.

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Transkript:

Institutt for matematiske fag Eksamensoppgåve i TMA4255 Anvendt statistikk Fagleg kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 16. mai 2015 Eksamenstid (frå til): 09:00-13:00 Hjelpemiddelkode/Tillatne hjelpemiddel: Eit gult A4-ark og spesiell kalkulator Annan informasjon: I utskrifta frå MINITAB er komma brukt som desimalskilleteikn. Signifikansnivå 5% skal brukast om ikke anna er spesifisert. Alle svar må grunngjevast. Målform/språk: nynorsk Sidetal: 9 Sidetal vedlegg: 0 Kontrollert av: Dato Sign Merk! Studentane finn sensur i Studentweb. Har du spørsmål om sensuren må du kontakte instituttet ditt. Eksamenskontoret vil ikkje kunne svare på slike spørsmål.

TMA4255 Anvendt statistikk, 16. mai 2015 Side 1 av 9 Oppgåve 1 Produsent av gjødningsmiddel Ein produsent av gjødningsmiddel ville studera skilnaden mellom effekten av eit gammalt gjødningsmiddel (angjeve som X 1 ) og eit nyutvikla gjødningsmiddel (angjeve som X 2 ) på veksten av plantar. Eit eksperiment blei utført der plantane vart dyrka under indentiske tilhøve og ein tildelte tilfeldig gjødningsmiddel X 1 til n 1 = 6 plantar og gjødningsmiddel X 2 til n 2 = 7 plantar. Etter 3 veker blei høgda til plantane målt i cm. Dataane fra eksperimentet er presentert under. i 1 2 3 4 5 6 7 x 1i 54.0 56.1 52.1 56.4 54.0 52.9 x 2i 51.0 53.3 55.6 51.0 55.5 53.0 52.1 Deskriptive mål for dette datasettet er x 1 = 1 6i=1 x 6 1i = 54.25, s x1 = 1 6i=1 (x 5 1i x 1 ) 2 = 1.71, x 2 = 1 7i=1 x 7 2i = 53.07, s x2 = 1 7i=1 (x 6 2i x 2 ) 2 = 1.91. a) Vi antar at X 1i og X 2i er normalfordelte, X 1i N(µ 1, σ 2 ), i = 1,..., 6 og X 2i N(µ 2, σ 2 ), i = 1,.., 7. Basert på dette forsøket, kan produsenten konkludere med at gjennomsnittleg høgde til plantane som ble gjeve dei to forskjellige typane (X 1 og X 2 ) av gjødningsmiddel er forskjellige? Skriv ned nullhypotesen og den alternative hypotesen. Vel ein testobservator og gjennomfør ein hypotesetest. Bruk signifikansnivå α = 0.05. Spesifiser kva antakingar du gjer. b) Kva er forskjellen mellom ein ikkje-parametrisk hypotesetest, og testen brukt i a)? Utfør ein Wilcoxon rank-sum test basert på dataane gitt ovanfor. Du kan anta ei normaltilnærming til testobservatoren (U 1 eller U 2 ) med forventning og varians Kommenter resultata/funna dine. µ = n 1n 2 2 σ 2 = n 1n 2 (n 1 + n 2 + 1). 12

Side 2 av 9 TMA4255 Anvendt statistikk, 16. mai 2015 Oppgåve 2 Sementhydratisering Betong er produsert ved sement blanda med sand, grus og vatn. Ein prosess kalla sementhydratisering (ein reaksjon med vatn) spelar ei viktig rolle for mikrostrukturen under utviklinga av betongen. Hydratiseringsprosessen produserer ei rekkje av kjemiske reaksjonar som genererer varme. Varmen som blir generert avheng av sammensetjinga av sementen, og varmen er ein parameter som påvirkar eigenskapane til materialet og styrken av betongen. For å studere varmen som blir generert i sementhydratiseringsprosessen, blei n = 13 parti av betong utforska, og for kvar av desse partia blei generert varme og 4 moglege forklaringsvariablar målt. Følgjande beskrivelse er gitt. y: Varme utvikla i kaloriar under herdinga av sementen, målt per gram x 1, % av tricalcium aluminate x 2 : % av tricalcium silicate x 3 : % av tetracalcium alumino ferrite x 4 : % av dicalcium silicate Eit parvis spreiingsplott og ein korrelasjonsmatrise av variablane er gitt i henholdsvis figur 1 og figur 2. Ein multippel lineær regresjonsmodell blei tilpassa dataane med y som respons og x 1, x 2, x 3 og x 4 som forklaringsvariablar. La (y i, x 1i, x 2i, x 3i og x 4i ) vere ein observasjon frå parti i, der i = 1,..., 13. Definer den fulle modellen (modell A): Modell A y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + β 4 x 4i + ɛ i, (1) kor ɛ i er u.i.f. N(0, σ 2 ) for i = 1,..., n. MINITAB-utskrifta frå ein statistisk analyse av modell A er gitt i figur 3. Plott av standardiserte residual er gitt i figur 4. a) Skriv ned den estimerte regresjonslikninga. Det er gjeve ein p-verdi i raden for x3 i resultata i figur 3. Forklar med ord kva denne p-verdien betyr. Basert på plotta og regresjonsresultata, vil du sei at modell A er ein god modell for dataane? Du må spesifisere kva eigenskapar til plotta og regresjonsresultata du brukar for å kome fram til svaret ditt.

TMA4255 Anvendt statistikk, 16. mai 2015 Side 3 av 9 Vi vil no samanlikne den fulle regresjonsmodellen (modell A) med en redusert model (kalla modell B), som berre inneheld x 1 og x 2. Modell B y i = β 0 + β 1 x 1i + β 2 x 2i + ɛ i, (2) Resultata frå tilpassing av modell B finnest i figur 5. b) Gje ein kommentar om de viktigaste forskjellane mellom modell A og modell B. Modell A og modell B kan samanliknast ved å undersøkje følgjande hypoteser. H 0 : β 3 = β 4 = 0 vs. H 1 : β 3 and β 4 er ikke begge lik null Utfør hypotesetesten og konkluder. Vi er no interessert i å samanlikne ulike regresjonsmodellar, der vi har med ulike kombinasjonar av forklaringsvariablane x 1, x 2, x 3 og x 4. Anta at eit konstantledd, β 0, er med i regresjonsmodellen. MINITAB-utskrifta frå tilpasning av ulike modellar for dataane er presentert i figur 6. Kvar rad i figur 6 svarar til ein modell. Talet på forklaringsvariablar inkludert i kvar modell (i tillegg til konstantleddet, β 0 ) finn du i kolonna med navn V ars. Dei to beste modellane for kvart tal av forklaringsvariablar er rapportert. X ane indikerer kva variablar som er funne i modellen. c) Forklar korleis R 2, R 2 adj, Mallows C p og S er definert og korleis du kan bruke dei til å samanlikne dei ulike regresjonsmodellane. Kven av desse 7 regresjonsmodellane meiner du er den beste for dette datasettet?

Side 4 av 9 TMA4255 Anvendt statistikk, 16. mai 2015 Oppgåve 3 Smerte og hårfarge I ein studie utført ved University of Melbourne var målet å samanlikne forskjellen mellom smerteterskelen av personar med blondt hår og personar med brunt hår. I denne studien blei totalt n = 19 menn og kvinnar av forskjellige aldre delt inn i fire kategoriar etter hårfarge: lys blond, mørk blond, lys brunette, eller mørk brunette. Kvar person i forsøket blei gjeve poengskår på ein smerteterskel basert på hennar eller hans prestasjon på ein smertesensitivitetstest (jo høgare poengskår, jo høgare er personens smertetoleranse). Eit boksplott av dataane er presentert i figur 7. a) Ein en-vegs variansanalyse (ANOVA) blei utført på dataane, og MINITAButskrifta frå ANOVA og eit samandrag av dataane er gitt i figur 8. Seks av tala i figur 8 er blitt erstatta med eit spørsmålsteikn (?). Forklar kva desse tala betyr og rekn ut numeriske verdiar for dei seks manglande tala. Kva antagelsar ligg bak denne analysen? Er dei fire kategoriane hårfarge forskjellige med omsyn på smertetoleranse? Utfør ein hypotesetest for å svare på dette spørsmålet. Skriv ned nullhypotesen og den alternative hypotesen. Baser testen på kva du har funnet i figur 8. Bruk signifikansnivå α = 0.05. b) Tidligare studiar indikerer at personar med hårfarge lys blond er forskjellig fra personar med hårfargen mørk brunette med omsyn på smertetoleranse. Vi vil teste dette. Skriv ned nullhypotesen og den alternative hypotesen. Velg ein testobservator og gjennomfør ein hypotesetest. Bruk signifikansnivå α = 0.05. Bruk samandraget av dataane gitt i figur 8 når du utfører hypotesetesten. Kva blir konklusjonen din? Kan du utføre hypotesetesten ovanfor ved å bruke eit 95% konfidensintervall? Beregn 95% konfidensintervallet og forklar. Oppgåve 4 Tilfredse kundar Ein regional butikk-kjede utførar ein spørjeundersøking for å finne ut kor tilfredse kundane er med butikk-kjeda. Dei delte kundane i 4 geografiske regionar (Sør- Vest, Sør-Øst, Midtre og Nord). Det totale talet på personar som blei spurde i kvar av de 4 regionane blei bestemt før spørreundersøkinga blei gjennomført som ein prosentandel av populasjonsstorleiken i regionen. Kor tilfredse kundane var blei klassifisert i tre grupper og følgjande kryss-tabell blei observert.

TMA4255 Anvendt statistikk, 16. mai 2015 Side 5 av 9 Region/Grad av tilfreds: Tilfreds Veit ikkje Ikkje tilfreds Totalt Sør-Vest 235 74 89 398 Sør-Øst 654 203 309 1166 Midtre 366 79 244 689 Nord 179 54 54 287 Totalt 1434 410 696 2540 a) Basert på dataane, kan vi konkludere med at de 4 forskjellige regionane er forskjellige med omsyn på kor tilfredse kundane er? Skriv ned nullhypotesen og den alternative hypotesen og gjennomfør en hypotesetest basert på tabellen ovanfor. Bruk 5% signifikansnivå. For å forenkle utrekningsbyrda kan du bruke at χ 2 -testobservatoren blei 44.78, og du treng berre å vise korleis du reknar ut eit av de 12 ledda i summen. Kva er konklusjonen din basert på denne testen?

Side 6 av 9 TMA4255 Anvendt statistikk, 16. mai 2015 Figur 1: Parvis spreiingsplott av variablane i sementhydratiseringsdatasettet. Correlations: y; x1; x2; x3; x4 y x1 x2 x3 x1 0,731 x2 0,816 0,229 x3-0,535-0,824-0,139 x4-0,821-0,245-0,973 0,030 Figur 2: Pearson korrelasjon mellom variablane x 1, x 2, x 3 og x 4 i sementhydratiseringsdatasettet.

TMA4255 Anvendt statistikk, 16. mai 2015 Side 7 av 9 Predictor Coef SE Coef T P Constant 62,41 70,07 0,89 0,399 x1 1,5511 0,7448 2,08 0,071 x2 0,5102 0,7238 0,70 0,501 x3 0,1019 0,7547 0,14 0,896 x4-0,1441 0,7091-0,20 0,844 S = 2,44601 R-Sq = 98,2% R-Sq(adj) = 97,4% Analysis of Variance Source DF SS MS F P Regression 4 2667,90 666,97 111,48 0,000 Residual Error 8 47,86 5,98 Total 12 2715,76 Figur 3: Utskrift frå statistisk analyse av sementhydratiseringsdataene for modell A. Figur 4: Residualplott (standardiserte residual mot tilpassa verdiar i venstre panel og normalplott basert på standardiserte residual i høgre panel) for regresjonsmodell A for sementhydratiseringsdatasettet.

Side 8 av 9 TMA4255 Anvendt statistikk, 16. mai 2015 Predictor Coef SE Coef T P Constant 52,577 2,286 23,00 0,000 x1 1,4683 0,1213 12,10 0,000 x2 0,66225 0,04585 14,44 0,000 S = 2,40634 R-Sq = 97,9% R-Sq(adj) = 97,4% Analysis of Variance Source DF SS MS F P Regression 2 2657,9 1328,9 229,50 0,000 Residual Error 10 57,9 5,8 Total 12 2715,8 Figur 5: Utskrift frå statistisk analyse av sementhydratiseringsdataene for modell B. Mallows x x x x Vars R-Sq R-Sq(adj) Cp S 1 2 3 4 1 67,5 64,5 138,7 8,9639 X 1 66,6 63,6 142,5 9,0771 X 2 97,9 97,4 2,7 2,4063 X X 2 97,2 96,7 5,5 2,7343 X X 3 98,2 97,6 3,0 2,3087 X X X 3 98,2 97,6 3,0 2,3121 X X X 4 98,2 97,4 5,0 2,4460 X X X X Figur 6: Utskrift frå statistisk analyse av sementhydratiseringsdatasettet.

TMA4255 Anvendt statistikk, 16. mai 2015 Side 9 av 9 Figur 7: Boksplott av smerte og hårfargedataane. One-way ANOVA: Smerte versus Hårfarge Source DF SS MS F P Hårfarge 3? 453,6? 0,004 Error??? Total 18 2362,5 S =? R-Sq = 57,60% R-Sq(adj) = 49,12% Level N Mean StDev MørkBlond 5 51,200 9,284 MørkBrunette 5 37,400 8,325 LysBlond 5 59,200 8,526 LysBrunette 4 42,500 5,447 Figur 8: Utskrift frå statistisk analyse av smerte og hårfargedatasettet.