Eksamensoppgave i TMA4255 Anvendt statistikk

Like dokumenter
Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

UNIVERSITETET I OSLO

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4245 Statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i TMA4240 Statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i TMA4275 Levetidsanalyse

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i TMA4240 Statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamenssettet består av to deler. Ved bedømmelsen teller del A 30 % og del B 70 %. Innenfor hver del teller alle deloppgaver likt.

Eksamensoppgave i TMA4267 Lineære statistiske modeller

UNIVERSITETET I OSLO

ECON240 VÅR / 2016 BOKMÅL

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

Eksamensoppgåve i TMA4245 Statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i TMA4245 Statistikk

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

MOT310 Statistiske metoder 1, høsten 2011

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

TMA4240 Statistikk H2010 (20)

Eksamensoppgave i TMA4275 Levetidsanalyse

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

10.1 Enkel lineær regresjon Multippel regresjon

Eksamensoppgave i TMA4295 Statistisk inferens

Eksamensoppgave i TMA4275 Levetidsanalyse

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2016

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Hypotesetest: generell fremgangsmåte

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Eksamen desember 2015

Skoleeksamen i SOS Kvantitativ metode

Eksamensoppgave i TMA4240 Statistikk

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Tid: Torsdag 11. desember Emneansvarleg: Trygve Almøy

EKSAMENSOPPGAVER STAT100 Vår 2011

TMA4240 Statistikk Høst 2016

HØGSKOLEN I STAVANGER

i x i

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

UNIVERSITETET I OSLO

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

UNIVERSITETET I OSLO

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

UNIVERSITETET I OSLO

Bokmål. Eksamen i: Stat100 Statistikk Tid: 18. mai Emneansvarlig: Trygve Almøy:

TMA4240 Statistikk Høst 2015

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

TMA4245 Statistikk Eksamen august 2014

Transkript:

Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler: Alle trykte og håndskrevne hjelpemidler. Spesiell kalkulator. Annen informasjon: I utskrift fra MINITAB er komma brukt som desimalseparator. Signifikansnivå 5% skal brukes hvis ikke annet er spesifisert. Alle svar må begrunnes. Målform/språk: bokmål Antall sider: 9 Antall sider vedlegg: 0 Kontrollert av: Dato Sign Merk! Studenter finner sensur i Studentweb. Har du spørsmål om din sensur må du kontakte instituttet ditt. Eksamenskontoret vil ikke kunne svare på slike spørsmål.

TMA4255 Anvendt statistikk, August 2014 Side 1 av 9 Oppgave 1 Reikibehandling av Fibromyalgi Fibromyalgi er en kronisk smertetilstand med ukjent årsak, som påvirker 2 4% av befolkningen. Pasienter med fibromyalgi bruker ofte komplementerende og alternativ medisin, slik som Reiki. Reiki er en form for energimedisin, der healeren kanaliserer "universell livsenergi" gjennom lett berøring. En studie ble gjennomført for å utforske nytten av Reiki som behandling mot smerte. Hundre pasienter med fibromyalgi ble rekruttert. For å tjene som placebo behandling inkluderte studien en skuespiller som ga behandling, i tillegg til en Reikimester. Smerte ble målt ved å bruke en visuell analog skala (VAS) (0 = ingen smerte, 10 = verste smerte noensinne). (Kilde: Nassim Assefi, M.D., Andy Bogart, M.S., Jack Goldberg, Ph.D., and Dedra Buchwald, M.D. (2008). Reiki for the Treatment of Fibromyalgia: A Randomized Controlled Trial. Journal of Alternative and Complementary Medicine, 14(9): 1115-1122.) a) De 100 pasientene ble randomisert i 4 grupper, hver på størrelse n = 25, hvor de fikk behandling enten med direkte berøring eller uten berøring (fra avstand) fra enten en Reikimester (referert til som Reiki behandling) eller en skuespiller (referert til som placebo behandling). VAS poengskår før behandling ble målt for hver av de n = 25 pasientene i hver av de 4 gruppene. La gruppe A betegne pasienter som får behandling fra en Reikimester med direkte berøring, gruppe B betegne pasienter som får behandling fra en Reikimester uten berøring (fra avstand), gruppe C betegne pasienter som får behandling fra en skuespiller med direkte berøring, gruppe D betegne pasienter som får behandling fra en skuespiller uten berøring (fra avstand). De deskriptive målene for de forskjellige gruppene i VAS poengskår før behandling er gitt i Tabell 1.

Side 2 av 9 TMA4255 Anvendt statistikk, August 2014 Smertegruppe Utvalgsstørrelse Gjennomsnitt Standardavvik Gruppe A 25 6.3 2.2 Gruppe B 25 6.4 2.6 Gruppe C 25 6.8 2.1 Gruppe D 25 6.1 2.4 Totalt 100 6.4 Tabell 1: Deskriptive mål for gruppene A, B, C og D i Reiki behandlings datasettet. For å kunne sammenligne VAS poengskår etter behandling på tvers av gruppene, bør VAS poengskårene være lik på tvers av gruppene før behandling. Kan vi fra denne studien konkludere med at poengskårene før behandling er forskjellige mellom gruppene, A, B, C og D? Skriv ned nullhypotesen og den alternative hypotesen, utfør en hypotesetest basert på de deskriptive målene ovenfor. Bruk signifikansnivå α = 0.05. Spesifiser hvilke antagelser du gjør og konklusjonen av testen. b) Forskerne var interessert i å sammenligne den direkte berørings behandlingen, gitt enten av en Reikimester eller en skuespiller. La X i betegne VAS poengskår etter behandling av Reikimesteren med direkte berøring, i = 1,..., 25 og Y j betegne VAS poengskår etter behandling av skuespilleren med direkte berøring, j = 1,..., 25. Anta at X i og Y j er normalfordelt, henholdsvis X i N(µ X, σ 2 ), i = 1,..., 25 og Y j N(µ Y, σ 2 ), j = 1,..., 25. Deskriptive mål for dette datasettet er d = x ȳ = 0.4 og s 2 p = 1 48 ( 25 i=1(x i x) 2 + 25 i=1(y i ȳ) 2 ) = 1.23 2, hvor x = 1 ȳ = 1 25 25 i=1 y i. 25 25 i=1 x i og Basert på disse dataene, har vi grunn til å tro at Reiki behandling har en større effekt på smerte, målt som VAS poengskår, enn placebo behandling gitt av en skuespiller? Skriv ned nullhypotesen og den alternative hypotesen, velg en testobservator og utfør en hypotesetest. Bruk signifikansnivå α = 0.05. Spesifiser hvilke antagelser du gjør.

TMA4255 Anvendt statistikk, August 2014 Side 3 av 9 Oppgave 2 Smaken av cheddarost Når cheddarosten modnes skjer det forskjellige kjemiske prosesser som bestemmer smaken på sluttproduktet. Konsentrasjonen av flere kjemikalier i denne kjemiske prosessen er knyttet til smaken. I en observasjonsstudie av smaken på cheddaroster, ble et utvalg på n = 30 modnede cheddarost analysert for kjemisk sammensetning og utsatt for smakstester. Den samlede poengenskåren for testen ble funnet ved å kombinere poengene fra flere personer i et smakspanel. Følgende variabler ble målt for hver cheddarost. y: Den subjektive smakstest poengskåren, gjennomsnittlig smakstest poengskår varierte fra 0.7 til 57.2. x 1 : Den naturalige logaritmen på konsentrasjon av eddiksyre i cheddarosten. x 2 : Den naturalige logaritmen på konsentrasjon av hydrogensulfid i cheddarosten. x 3 : Konsentrasjon av melkesyre i cheddarosten. Først ble tre separate enkle regresjonsmodeller brukt til å studere forholdet mellom smak og hver av variablene, hvor ɛ i er u.i.f. N(0, σ 2 ) for i = 1,..., n. y i =β 0 + β 1 x 1i + ɛ i, (1) y i =β 0 + β 2 x 2i + ɛ i, (2) y i =β 0 + β 3 x 3i + ɛ i, (3) En MINITAB utskrift fra statistiske analyse finnes in Figur 1, 2 og 3. Predictor Coef SE Coef T P Constant -61,50 24,85-2,48 0,020 X1 15,648 4,496 3,48 0,002 S = 13,8212 R-Sq = 30,2% R-Sq(adj) = 27,7% Figur 1: Utskrift fra statistiske analyser av cheddarostdataene for modellen in ligning (1).

Side 4 av 9 TMA4255 Anvendt statistikk, August 2014 Predictor Coef SE Coef T P Constant -9,787 5,958-1,64 0,112 X2 5,7761 0,9458 6,11 0,000 S = 10,8334 R-Sq = 57,1% R-Sq(adj) = 55,6% Figur 2: Utskrift fra statistiske analyser av cheddarostdataene for modellen i ligning (2). Predictor Coef SE Coef T P Constant -29,86 10,58-2,82 0,009 X3 37,720 7,186 5,25 0,000 S = 11,7450 R-Sq = 49,6% R-Sq(adj) = 47,8% Figur 3: Utskrift fra statistiske analyser av cheddarostdataene for modellen i ligning (3). a) Fra Figur 1 ser vi at variabelen eddiksyre, X 1, er signifikant ved et 5% signifikansnivå. Hva kan du konkludere med fra de gitte p-verdiene i Figur 1, 2 og 3 om de tre kjemikalienes påvirkning på smaken? Kommenter verdiene av R 2 i Figur 1, 2 og 3. Begrunn svaret. Finn et 90% konfidensintervall for β 1. Hva er den predikerte poengskåret for smak for en eddiksyreverdi på x 0 1 = 7? b) Finn et passende estimat for σ, og beregn er 90% konfidensintervall for σ i regresjonsmodellen i ligning (1) (Hint: bruk at SSE/σ 2 er kjikvadrat-fordelt). Hvordan kan vi bruke dette konfidensintervallet for å teste nullhypotesen H 0 : σ = 1? Skriv ned den alternative hypotesen som blir brukt, konklusjonen på denne testen og signifikansnivået.

TMA4255 Anvendt statistikk, August 2014 Side 5 av 9 Videre ble regresjon av smak på alle tre kjemikalier utført. hvor ɛ i is u.i.f. N(0, σ 2 ) for i = 1,..., n. y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + ɛ i (4) MINITAB utskriften fra statistiske analyse av denne tre-variabel modellen finnes i Figur 4. En korrelasjonsmatrise og et parvis spredningsplott finnes i henholdsvis Figur 5 og Figur 6. Residualplott finnes i Figur 7. The regression equation is y = - 28,9 + 0,33 X1 + 3,91 X2 + 19,7 X3 Predictor Coef SE Coef T P Constant -28,88 19,74-1,46 0,155 X1 0,328 4,460 0,07 0,942 X2 3,912 1,248 3,13 0,004 X3 19,671 8,629 2,28 0,031 S = 10,1307 R-Sq = 65,2% R-Sq(adj) = 61,2% Analysis of Variance Source DF SS MS F P Regression 3 4994,5 1664,8 16,22 0,000 Residual Error 26 2668,4 102,6 Total 29 7662,9 Figur 4: Utskrift fra statistiske analyser av cheddarostdataene for modellen i ligning (4).

Side 6 av 9 TMA4255 Anvendt statistikk, August 2014 Correlations: X1; X2; X3 X1 X2 0,618 X2 X3 0,604 0,645 Figur 5: Pearson korrelasjon mellom variablene X 1, X 2 og X 3 i cheddarostdatasettet. Figur 6: Parvis spredningsplott av variablene i cheddarostdatasettet.

TMA4255 Anvendt statistikk, August 2014 Side 7 av 9 Figur 7: Residualplott (normalplott basert på standardiserte residualer i øvre venstre panel, standardiserte residualer mot tilpassede verdier i øvre høyre panel, histogram basert på standardiserte residualer i nedre venstre panel og standardiserte residualer mot rekkefølgen på observasjonene i nedre høyre panel) for regresjonsmodellen i ligning (4) for cheddarostdatasettet.

Side 8 av 9 TMA4255 Anvendt statistikk, August 2014 c) Forklar begrepet multikollinearitet. Kan dette være et problem i regresjonsmodellen i ligning (4)? Kommenter korrelasjonsmatrisen i Figur 5 og det parvise spredningsplottet i Figur 6. Fra tre-variabel regresjonmodellen i Figur 4 kan vi se at eddiksyre, X 1, ikke er signifikant, men i Figur 1 (ligning 1) er X 1 signifikant. Hva kan være årsaken til dette? Begrunn svaret. Dette er en observasjonsstudie. Vil det være mulig å designe et eksperiment (design of experiment) for å utforske problemet vi studerer? Utdyp. Oppgave 3 Lekeplastklosser En fabrikk produserer lekeplastklosser som kan settes sammen. For å være i stand til å sette sammen klossene må de ikke ha defekter. Fabrikken tar prøver for å forsikre seg at klossene er av god kvalitet. Hver dag blir det tatt et utvalg på n = 250 tilfeldige klosser og hver kloss blir klassifisert som enten OK eller defekt. Resultatet etter to uker er gitt under. Prosessen antas å være i kontroll i løpet av disse to ukene utvalgene ble tatt. Dag i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Antall defekte 3 3 1 3 4 6 4 6 4 4 5 2 3 1 a) Lag et passende kontrolldiagram for å kontrollere sannsynligheten av defekter, p. Bruk alle dataene i tabellen ovenfor for å beregne kontrollgrensene (bruk 3σ grenser). Kan vi anta at antallet defekter i hvert utvalg er tilnærmet normalfordelt? b) Fabrikken er interessert i å oppdage om prosessen er ute av kontroll ved en økning i sannsynligheten av defekter. Hvor mange observasjoner, n, i hver stikkprøve trengs for å oppdage en endring fra p = 0.2 til p 1 = 0.21?

TMA4255 Anvendt statistikk, August 2014 Side 9 av 9 Oppgave 4 Fedme og alkoholinntak I en studie som så på sammenhengen mellom fedme og alkoholinntak i Australia, ble et utvalg på n Lav = 165 personer med lav grad av fedme, n Gjennomsnittlig = 161 personer med gjennomsnittlig grad av fedme og n Høy = 165 personer med høy grad av fedme valgt, og deres alkoholinntak i antall drikker per dag ble registrert. Alkoholinntaket ble klassifisert i fire grupper og følgende krysstabell ble observert. Alkoholinntak Fedme 0 1-2 3-5 6+ Total Lav 45 45 41 34 165 Gjennomsnittlig 39 32 46 44 161 Høy 33 37 47 48 165 Total 117 114 134 126 491 a) Basert på disse dataene, kan vi konkludere med at Lav, Gjennomsnittlig og Høy fedme populasjoner er forskjellige med hensyn på alkoholinntak? Skriv ned nullhypotesen og den alternative hypotesen og utfør en hypotesetest basert på tabellen ovenfor. Bruk et 5% signifikansnivå. Det er oppgitt at χ 2 -testobservatoren er lik 6.952. Du trenger bare vise beregningen av et av de 12 leddene i summen. Hva er konklusjonen fra testen?