Eksamensoppgåve i TMA4255 Anvendt statistikk

Like dokumenter
Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgåve i TMA4240 Statistikk

UNIVERSITETET I OSLO

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgåve i TMA4245 Statistikk

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

Tid: Torsdag 11. desember Emneansvarleg: Trygve Almøy

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgåve i TMA4295 Statistisk inferens

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Kapittel 10: Hypotesetesting

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i TMA4275 Levetidsanalyse

TMA4245 Statistikk Eksamen desember 2016

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen august 2014

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Norges teknisk-naturvitenskapelige universitet Fakultet for samfunnsvitenskap og teknologiledelse Pedagogisk institutt

TMA4240 Statistikk Høst 2009

Eksamensoppgåve i TMA4267 Lineære statistiske modellar

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

MOT310 Statistiske metoder 1, høsten 2011

TMA4240 Statistikk Eksamen desember 2015

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4245 Statistikk

Eksamenssettet består av to deler. Ved bedømmelsen teller del A 30 % og del B 70 %. Innenfor hver del teller alle deloppgaver likt.

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

HØGSKOLEN I STAVANGER

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

10.1 Enkel lineær regresjon Multippel regresjon

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

EKSAMENSOPPGAVE STA-1001.

EKSAMEN I EMNE TMA4245 STATISTIKK

Eksamensoppgave i TMA4267 Lineære statistiske modeller

ECON240 VÅR / 2016 BOKMÅL

TMA4240 Statistikk H2010 (20)

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

TMA4240 Statistikk Høst 2016

i x i

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Eksamensoppgave i SØK1004 Statistikk for økonomer

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Eksamensoppgave i SØK Statistikk for økonomer

Skoleeksamen i SOS Kvantitativ metode

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Om eksamen. Never, never, never give up!

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Om eksamen. Never, never, never give up!

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Hypotesetest: generell fremgangsmåte

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk 2014

Eksamensoppgave i TMA4295 Statistisk inferens

TMA4245 Statistikk Eksamen august 2014

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Eksamensoppgave i TMA4275 Levetidsanalyse

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Transkript:

Institutt for matematiske fag Eksamensoppgåve i TMA4255 Anvendt statistikk Fagleg kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: August 2014 Eksamenstid (frå til): Hjelpemiddelkode/Tillatne hjelpemiddel: Alle trykte og handskrivne hjelpemiddel. Spesiell kalkulator. Annan informasjon: I utskrifta frå MINITAB er komma brukt som desimalskilleteikn. Signifikansnivå 5% skal brukast om ikke anna er spesifisert. Alle svar må grunngjevast. Målform/språk: nynorsk Sidetal: 9 Sidetal vedlegg: 0 Kontrollert av: Dato Sign Merk! Studentane finn sensur i Studentweb. Har du spørsmål om sensuren må du kontakte instituttet ditt. Eksamenskontoret vil ikkje kunne svare på slike spørsmål.

TMA4255 Anvendt statistikk, August 2014 Side 1 av 9 Oppgåve 1 Reikibehandling av Fibromyalgi Fibromyalgi er ein kronisk smertetilstand med ukjend årsak, som påvirkar 2 4% av befolkninga. Pasientar med fibromyalgi brukar ofte komplementerande og alternativ medisin, slik som Reiki. Reiki er en form for energimedisin, der healeren kanaliserer "universell livsenergi" gjennom lett berøring. Ein studie vart gjennomførd for å utforske nytten av Reiki som behandling mot smerte. Hundre pasientar med fibromyalgi vart rekrutterte. For å tene som placebo behandling inkluderte studien ein skodespelar som gav behandling, i tillegg til ein Reikimeister. Smerte vart målt ved å bruke ein visuell analog skala (VAS) (0 = inga smerte, 10 = vondaste smerte nokonsinne). (Kjelde: Nassim Assefi, M.D., Andy Bogart, M.S., Jack Goldberg, Ph.D., and Dedra Buchwald, M.D. (2008). Reiki for the Treatment of Fibromyalgia: A Randomized Controlled Trial. Journal of Alternative and Complementary Medicine, 14(9): 1115-1122.) a) Dei 100 pasientane vart randomiserte i 4 grupper, kvar på storleik n = 25, der dei fekk behandling anten med direkte berøring eller utan berøring (frå avstand) fra anten ein Reikimeister (referert til som Reiki behandling) eller ein skodespelar (referert til som placebo behandling). VAS poengskår før behandling vart målt for kvar av dei n = 25 pasientane i kvar av dei 4 gruppene. La gruppe A betegne pasientar som får behandling frå ein Reikimeister med direkte berøring, gruppe B betegne pasientar som får behandling frå ein Reikimeister uten berøring (frå avstand), gruppe C betegne pasientar som får behandling frå ein skodespelar med direkte berøring, gruppe D betegne pasientar som får behandling frå ein skodespelar uten berøring (frå avstand). Dei deskriptive måla for dei ulike gruppene i VAS poengskår før behandling er gjevne i Tabell 1.

Side 2 av 9 TMA4255 Anvendt statistikk, August 2014 Smertegruppe Utvalsstørrelse Gjennomsnitt Standardavvik Gruppe A 25 6.3 2.2 Gruppe B 25 6.4 2.6 Gruppe C 25 6.8 2.1 Gruppe D 25 6.1 2.4 Totalt 100 6.4 Tabell 1: Deskriptive mål for gruppene A, B, C og D i Reiki behandlings datasettet. For å kunne samanlikne VAS poengskår etter behandling på tvers av gruppene, bør VAS poengskårene vere lik på tvers av gruppene før behandling. Kan vi frå denne studien konkludere med at poengskårene før behandling er ulike mellom gruppene, A, B, C og D? Skriv ned nullhypotesen og den alternative hypotesen, utfør ein hypotesetest basert på dei deskriptive måla ovanfor. Bruk signifikansnivå α = 0.05. Spesifiser kva antakingar du gjer og konklusjonen av testen. b) Forskerane var interesserte i å samanlikne den direkte berørings behandlingen, gjeve anten av ein Reikimeister eller ein skodespelar. La X i betegne VAS poengskår etter behandling av Reikimeisteren med direkte berøring, i = 1,..., 25 og Y j betegne VAS poengskår etter behandling av skodespelaren med direkte berøring, j = 1,..., 25. Anta at X i og Y j er normalfordelt, høvevis X i N(µ X, σ 2 ), i = 1,..., 25 og Y j N(µ Y, σ 2 ), j = 1,..., 25. Deskriptive mål for dette datasettet er d = x ȳ = 0.4 og s 2 p = 1 48 ( 25 i=1(x i x) 2 + 25 i=1(y i ȳ) 2 ) = 1.23 2, kor x = 1 ȳ = 1 25 25 i=1 y i. 25 25 i=1 x i og Basert på desse dataene, har vi grunn til å tru at Reiki behandling har ein større effekt på smerte, målt som VAS poengskår, enn placebo behandling gjeve av ein skodespelar? Skriv ned nullhypotesen og den alternative hypotesen, vel ein testobservator og utfør ein hypotesetest. Bruk signifikansnivå α = 0.05. Spesifiser kva antakingar du gjer.

TMA4255 Anvendt statistikk, August 2014 Side 3 av 9 Oppgåve 2 Smaken av cheddarost Når cheddarosten mognast skjer det ulike kjemiske prosessar som avgjer smaken på sluttproduktet. Konsentrasjonen av fleire kjemikalier i denne kjemiske prosessen er knytt til smaken. I ein observasjonsstudie av smaken på cheddarostar, vart eit utval på n = 30 modna cheddarost analysert for kjemisk sammensetning og utsatt for smakstestar. Den samla poengenskåren for testen vart funnen ved å kombinere poenga frå fleire personar i eit smakspanel. Følgjande variablar vart målt for kvar cheddarost. y: Den subjektive smakstest poengskåret, gjennomsnittleg smakstest poengskår varierte frå 0.7 til 57.2. x 1 : Den naturlege logaritmen på konsentrasjon av eddiksyre i cheddarosten. x 2 : Den naturlege logaritmen på konsentrasjon av hydrogensulfid i cheddarosten. x 3 : Konsentrasjon av melkesyre i cheddarosten. Først vart tre separate enkle regresjonsmodeller brukt til å studere tilhøvet mellom smak og kvar av variablane, kor ɛ i er u.i.f. N(0, σ 2 ) for i = 1,..., n. y i =β 0 + β 1 x 1i + ɛ i, (1) y i =β 0 + β 2 x 2i + ɛ i, (2) y i =β 0 + β 3 x 3i + ɛ i, (3) En MINITAB utskrift frå statistiske analyse finst in Figur 1, 2 og 3. Predictor Coef SE Coef T P Constant -61,50 24,85-2,48 0,020 X1 15,648 4,496 3,48 0,002 S = 13,8212 R-Sq = 30,2% R-Sq(adj) = 27,7% Figur 1: Utskrift fra statistiske analysar av cheddarostdataene for modellen in ligning (1).

Side 4 av 9 TMA4255 Anvendt statistikk, August 2014 Predictor Coef SE Coef T P Constant -9,787 5,958-1,64 0,112 X2 5,7761 0,9458 6,11 0,000 S = 10,8334 R-Sq = 57,1% R-Sq(adj) = 55,6% Figur 2: Utskrift fra statistiske analysar av cheddarostdataene for modellen i ligning (2). Predictor Coef SE Coef T P Constant -29,86 10,58-2,82 0,009 X3 37,720 7,186 5,25 0,000 S = 11,7450 R-Sq = 49,6% R-Sq(adj) = 47,8% Figur 3: Utskrift fra statistiske analysar av cheddarostdataene for modellen i ligning (3). a) Frå Figur 1 ser vi at variabelen eddiksyre, X 1, er signifikant ved eit 5% signifikansnivå. Kva kan du konkludere med fra dei gjevne p-verdiane i Figur 1, 2 og 3 om dei tre kjemikalienes påvirkad på smaken? Kommenter verdiane av R 2 i Figur 1, 2 og 3. Grunngi svaret. Finn eit 90% konfidensintervall for β 1. Kva er den predikerte poengskåret for smak for ein eddiksyreverd på x 0 1 = 7? b) Finn eit passande estimat for σ, og beregn er 90% konfidensintervall for σ i regresjonsmodellen i ligning (1) (Hint: bruk at SSE/σ 2 er kjikvadrat-fordelt). Korleis kan vi bruke dette konfidensintervallet for å teste nullhypotesen H 0 : σ = 1? Skriv ned den alternative hypotesen som vert brukt, konklusjonen på denne testen og signifikansnivået.

TMA4255 Anvendt statistikk, August 2014 Side 5 av 9 Vidare vart regresjon av smak på alle tre kjemikalier utført. kor ɛ i is u.i.f. N(0, σ 2 ) for i = 1,..., n. y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + ɛ i (4) MINITAB utskriften frå statistiske analyse av denne tre-variabel modellen finst i Figur 4. Ein korrelasjonsmatrise og eit parvis spredningsplott finst i høvevis Figur 5 og Figur 6. Residualplott finst i Figur 7. The regression equation is y = - 28,9 + 0,33 X1 + 3,91 X2 + 19,7 X3 Predictor Coef SE Coef T P Constant -28,88 19,74-1,46 0,155 X1 0,328 4,460 0,07 0,942 X2 3,912 1,248 3,13 0,004 X3 19,671 8,629 2,28 0,031 S = 10,1307 R-Sq = 65,2% R-Sq(adj) = 61,2% Analysis of Variance Source DF SS MS F P Regression 3 4994,5 1664,8 16,22 0,000 Residual Error 26 2668,4 102,6 Total 29 7662,9 Figur 4: Utskrift fra statistiske analysar av cheddarostdataene for modellen i ligning (4).

Side 6 av 9 TMA4255 Anvendt statistikk, August 2014 Correlations: X1; X2; X3 X1 X2 0,618 X2 X3 0,604 0,645 Figur 5: Pearson korrelasjon mellom variablane X 1, X 2 og X 3 i cheddarostdatasettet. Figur 6: Parvis spredningsplott av variablane i cheddarostdatasettet.

TMA4255 Anvendt statistikk, August 2014 Side 7 av 9 Figur 7: Residualplott (normalplott basert på standardiserte residualer i øvre venstre panel, standardiserte residualer mot tilpassade verdiar i øvre høgre panel, histogram basert på standardiserte residualer i nedre venstre panel og standardiserte residualer mot rekkjefølgda på observasjonane i nedre høgre panel) for regresjonsmodellen i ligning (4) for cheddarostdatasettet.

Side 8 av 9 TMA4255 Anvendt statistikk, August 2014 c) Forklar begrepet multikollinearitet. Kan dette vere et problem i regresjonsmodellen i ligning (4)? Kommenter korrelasjonsmatrisen i Figur 5 og det parvise spredningsplottet i Figur 6. Frå tre-variabel regresjonmodellen i Figur 4 kan vi sjå at eddiksyre, X 1, ikkje er signifikant, men i Figur 1 (ligning 1) er X 1 signifikant. Hva kan være årsaka til dette? Grunngi svaret. Dette er ein observasjonsstudie. Vil det vere mogleg å designa eit eksperiment (design of experiment) for å utforske problemet vi studerer? Utdjup. Oppgåve 3 Leikeplastklossar Ein fabrikk produserer leikeplastklossar som kan vert saman sett. For å vere i stand til å setje saman klossane må dei ikkje ha defektar. Fabrikken tek prøver for å forsikre seg at klossane er av god kvalitet. Kvar dag vert det teke eit utval på n = 250 tilfeldige klossar og kvar kloss vert klassifisert som anten OK eller defekt. Resultatet etter to veker er gjevne under. Prosessen antas å vere i kontroll i løpet av desse to vekene utvala vart tekne. Dag i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mengd defekte 3 3 1 3 4 6 4 6 4 4 5 2 3 1 a) Lag eit passande kontrolldiagram for å kontrollere sannsynligheten av defektar, p. Bruk alle dataene i tabellen ovanfor for å berekne kontrollgrensane (bruk 3σ grensar). Kan vi anta at mengda defektar i kvart utval er tilnærma normalfordelt? b) Fabrikken er interessert i å oppdage om prosessen er ute av kontroll ved ein auke i sannsynligheten av defektar. Kor mange observasjonar, n, i kvar stikkprøve trengst for å oppdage ein endring fra p = 0.2 til p 1 = 0.21?

TMA4255 Anvendt statistikk, August 2014 Side 9 av 9 Oppgåve 4 Fedme og alkoholinntak I ein studie så på samanhengen mellom fedme og alkoholinntak i Australia, vart eit utval på n Lav = 165 personar med lav grad av fedme, n Gjennomsnittleg = 161 personar med gjennomsnittleg grad av fedme og n Høg = 165 personar med høg grad av fedme valt og deira alkoholinntak i mengd drikker per dag vart registrert. Alkoholinntaket vart klassifisert i fire grupper og følgjande krysstabell vart observert. Alkoholinntak Fedme 0 1-2 3-5 6+ Total Lav 45 45 41 34 165 Gjennomsnittleg 39 32 46 44 161 Høg 33 37 47 48 165 Total 117 114 134 126 491 a) Basert på desse dataene, kan vi konkludere med at Lav, Gjennomsnittleg og Høg fedme populasjonar er ulike med omsyn på alkoholinntak? Skriv ned nullhypotesen og den alternative hypotesen og utfør ein hypotesetest basert på tabellen ovanfor. Bruk eit 5% signifikansnivå. Det er oppgjeve at χ 2 - testobservatoren er lik 6.952. Du treng berre vise beregningen av eit av de 12 ledda i summen. Kva er konklusjonen frå testen?