EKSAMEN I TMA4255 ANVENDT STATISTIKK

Like dokumenter
EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgåve i TMA4255 Anvendt statistikk

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

Eksamensoppgåve i TMA4240 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgåve i TMA4255 Anvendt statistikk

TMA4245 Statistikk Eksamen desember 2016

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Tid: Torsdag 11. desember Emneansvarleg: Trygve Almøy

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

HØGSKOLEN I STAVANGER

vekt. vol bruk

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

EKSAMENSOPPGAVE STA-1001.

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Eksamen desember 2015

EKSAMEN I TMA4240 Statistikk

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk 2014

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

UNIVERSITETET I OSLO

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

ECON240 VÅR / 2016 BOKMÅL

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

TMA4245 Statistikk Eksamen august 2014

i x i

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.

Fasit for tilleggsoppgaver

TMA4240 Statistikk Høst 2016

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

Eksamensoppgåve i TMA4245 Statistikk

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august 2013

Fasit og løsningsforslag STK 1110

Eksamensoppgave i TMA4245 Statistikk

TMA4240 Statistikk Høst 2009

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Tilleggsoppgaver for STK1110 Høst 2015

HØGSKOLEN I STAVANGER

Om eksamen. Never, never, never give up!

UNIVERSITETET I OSLO

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Oppgave N(0, 1) under H 0. S t n 3

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

TMA4240 Statistikk Høst 2016

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

TMA4240 Statistikk H2010

Eksamensoppgave i TMA4240 Statistikk

10.1 Enkel lineær regresjon Multippel regresjon

Løsningsforslag eksamen 25. november 2003

Om eksamen. Never, never, never give up!

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2015

Løsningsforslag eksamen 27. februar 2004

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

EKSAMEN I EMNE TMA4245 STATISTIKK

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4240 Statistikk

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

EKSAMENSOPPGAVER STAT100 Vår 2011

Transkript:

Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 7 Fagleg kontakt under eksamen: Mette Langaas (988 47 649) NYNORSK EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25. mai 2012 Tid: 9:00 13:00 Tal på studiepoeng: 7.5. Tillatte hjelpemiddel: Alle trykte og handskrivne hjelpemiddel. Spesiell kalkulator. Sensurfrist: 18. juni 2012. Eksamensresultata blir annonserte frå http://studweb.ntnu.no/. Merk deg følgjande: Signifikansnivå 5% skal brukast om ikke anna er spesifisert. Alle svar må grunngjevast.

TMA4255 Anvendt statistikk Side 2 av 7 Oppgåve 1 Vitamin C I ein medisinsk studie på marsvin vart det nytta to ulike kjelder til vitamin C-inntak. Desse var appelsinjuice (tilskot 1) og syntetisk askorbinsyre (tilskot 2). Responsmålet som vart brukt var lengda til odontoblastceller i fortennene til marsvina. Forskarane hadde som mål å finne ut om det var ein forskjell i dette responsmålet for dei to tilskota. X 1, X 2,..., X n1 angir odontoblastlengdene til eit tilfeldig utval av n 1 marsvin som fekk tilskot 1 og Y 1, Y 2,..., Y n2 angir odontoblastlengdene til eit tilfeldig utval av n 2 marsvin som fekk tilskot 2. Vi går ut frå at E(X i ) = µ, Var(X i ) = σ 2, E(Y j ) = η og Var(Y j ) = τ 2 for i = 1, 2,..., n 1 og j = 1, 2,..., n 2, og at dei to tilfeldige utvalga er uavhengige. Totalt fekk n 1 = 10 marsvin tilskot 1 og n 2 = 10 marsvin tilskot 2. Datasettet finn du (sortert) i tabellen under. Lengdene er i mikrometer (10 6 meter). Tilskot Observasjonar Tilskot 1: Appelsinjuice 8.2 9.4 9.6 9.7 10.0 14.5 15.2 16.1 17.6 21.5 Tilskot 2: Askorbinsyre 4.2 5.2 5.8 6.4 7.0 7.3 10.1 11.2 11.3 11.5 Deskriptive mål for datasettet er x = 1 1 10 9 i=1(x i x) 2 = 4.44, og s y = 1 9 10 10 i=1 x i = 13.18, ȳ = 1 10 10 j=1 y j = 8.00, s x = 10 j=1(y j ȳ) 2 = 2.77. a) Skriv ned nullhypotesen og den alternative hypotesen som forskarane ønskjer å teste. Kva for føresetnader må gjelde for at du skal kunne bruke ein to-utvals t-test? Er det fornuftig å anta at variansane σ 2 og τ 2 er like? Her kan du bruke signifikansnivå α = 0.02 dersom du vel å utføre ein test for å undersøke om variansane er ulike. Utfør ein t-test. Vil du konkludere med at det er forskjell i lengda til odontoblastcellene i ein populasjon som bruker tilskot 1 og ein populasjon som bruker tilskot 2? b) Eit alternativ til ein to-utvals t-test er Wilcoxon rang-sum-test (også kalt Mann-Whitney test). Kva for føresetnader byggjer Wilcoxon rang-sum-testen på? Når bør du bruke Wilcoxon rang-sum-test i staden for to-utvals t-test? Utfør Wilcoxon rang-sum-testen for dataa i tabellen over. Vil du konkludere med at det er forskjell i lengda til odontoblastcellene i ein populasjon som bruker tilskot 1 og ein populasjon som bruker tilskot 2?

TMA4255 Anvendt statistikk Side 3 av 7 Oppgåve 2 Kjemisk produkt Vi skal studere ein kjemisk prosess og lage ein statistisk modell som relaterer mengda kjemisk produkt til temperatur og trykk for den kjemiske prosessen. Vi bruker følgjande notasjon. y, produkt. Mengda produkt frå den kjemiske prosessen. x 1, temperatur. Temperaturen som vart brukt under prosessen. x 2, trykk. Trykket som vart brukt under prosessen. Den kjemiske prosessen vart køyrd for n = 21 ulike kombinasjonar av temperatur og trykk, og mengda produkt vart målt. Ein multippel lineær regresjonsmodell kan brukast til å analysere dataa. La (y i, x 1i, x 2i ) vere målingane gjort ved ite køyring av prosessen. Modell A y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 1i x 2i + ε i Her er ε i u.i.f. N(0, σ 2 ) for i = 1,..., n. Spreiingsplott (scatter plots) finn du på side 4 (øvre og midtre radene). Modell A vart tilpassa til dataa, og resultatet finn du på side 5. Plott av studentiserte residual er på side 4 (nedre rada). a) Skriv ned den tilpassa regresjonsmodellen. Kva er estimatet for σ 2? Det er gitt ein p-verdi i rada for x2 i resultata. Forklar med ord kva denne p-verdien betyr. Basert på plotta og regresjonsresultata, vil du seie at modell A er ein god modell for dataa? Du må spesifisere kva for eigenskapar til plotta og regresjonsresultata du bruker for å komme fram til svaret ditt.

TMA4255 Anvendt statistikk Side 4 av 7 100 120 140 160 180 200 450 500 550 600 650 700 750 800 x1 y 1000 1200 1400 1600 1800 2000 450 500 550 600 650 700 750 800 x2 y 150000 200000 250000 300000 450 500 550 600 650 700 750 800 x1 * x2 y 100 120 140 160 180 200 1000 1200 1400 1600 1800 2000 x1 x2 450 500 550 600 650 700 750 1 0 1 2 3 Fitted values Studentized residuals 2 1 0 1 2 1 0 1 2 3 Normal Q Q Plot Theoretical Quantiles Sample Quantiles

TMA4255 Anvendt statistikk Side 5 av 7 Regression analysis Predictor Coef SE Coef T P Constant 181.8 156.6 1.16 0.262 x1 2.146 1.018 2.11 0.050 x2-0.0440 0.1043-0.42 0.678 x1*x2 0.0007774 0.0006942 1.12 0.278 S = 27.2502 R-Sq = 93.8% R-Sq(adj) = 92.7% Analysis of Variance Source DF SS MS F P Regression 3 190830 63610 85.66 1.825e-10 Residual Error 17 12624 743 Total 20 203454 Gå ut frå at konstantleddet, β 0, er med i regresjonsmodellen. Vi skal no sjå på ulike regresjonsmodellar, der vi har med ulike kombinasjonar av forklaringsvariablane x 1, x 2 og x 1 x 2. Resultat frå tilpasninga av modellane er presenterte i tabellen under. Kvar rad i tabellen svarer til ein modell. Talet på forklaringsvariablar inkludert i kvar modell finn du i kolonnen med namn par (ikkje medrekna konstantleddet). I kolonnen med namn MSE finn du gjennomsnittlig kvadratavvik (mean squared error) til regresjonen. ˆβ 0 ˆβ1 ˆβ2 ˆβ3 par MSE R2 R2.adj C p 1 151 3.067 1 1179 89.0 88.4 13.2 2 641-0.020 1 10667 0.4-4.9 255.9 3 315 0.001 1 5093 52.4 49.9 113.3 4 15 3.263 0.071 2 753 93.3 92.6 3.3 5 117 2.563 0.0005 2 709 93.7 93.0 2.2 6 505-0.258 0.002 2 885 92.2 91.3? 7 182 2.146-0.044 0.001 3 743 93.8 92.7 4.0 b) I kolonnen heilt til høgre i tabellen finn du Mallows C p. Eitt av tala i denne kolonnen er erstatta med eit spørjeteikn. Skriv ned definisjonen av C p og rekn ut den manglande C p -verdien. Forklar korleis du kan bruke C p til å samanlikne dei ulike regresjonsmodellane. Kva for ein av desse 7 regresjonsmodellane meiner du er den «beste» for dette datasettet?

TMA4255 Anvendt statistikk Side 6 av 7 Oppgåve 3 Behandling av tennisolboge Uttrykket tennisolboge blir brukt om ein betennelsestilstand i olbogen, som er årsak til smerter. Tilstanden er vanleg hos personar som driv med racketsport, men alle aktivitetar som involverer gjenteke vriding av handleddet (som ved å bruke eit skrujern) kan vere årsak til denne tilstanden. Tilstanden kan òg skuldast konstant bruk av tastatur eller mus. I ein randomisert klinisk studie ønskte ein å samanlikne tre ulike behandlingsmåtar for tennisolboge, A: fysioterapi, B: injeksjon med steroid og C: vent-og-sjå (pasientane i vent-og-sjå-gruppa fekk ikkje noka behandling, men vart bedne om å belaste olbogen så lite som mogleg). Vi skal sjå på korttidseffekt av behandling ved å sjå på målingar etter 6 veker. Alle deltakarane i studien hadde berre ein arm med tilstanden tennisolboge. Fleire responsmål vart registrerte i studien, og vi vil i det følgjande sjå på to ulike responsmål. a) Behandlinga vart rekna som ein suksess dersom pasienten vurderte at ho/han var vorte mykje betre eller heilt bra (ein standardisert betringsskala vart brukt). Talet på suksessar og fiaskoar etter 6 vekers behandling finn du i tabellen under. Behandling Fiasko Suksess Totalt A (fysioterapi) 22 41 63 B (injeksjon) 14 51 65 C (vent-og-sjå) 44 16 60 Totalt 80 108 188 Vil vil undersøke om suksessraten er ulik for behandlingane. Skriv ned nullhypotesen og den alternative hypotesen og utfør ein hypotesetest på grunnlag av informasjonen i tabellen over. For å forenkle utrekningsbyrda kan det opplysast at χ 2 -testobservatoren blir 36.6, og du treng berre å vise korleis du reknar ut eitt av dei 6 ledda i summen. Kva for føresetnader må gjelde for at du skal kunne bruke denne testen? Kva er konklusjonen din basert på denne testen? Vi skal no sjå på eit responsmål som blir kalla smertefri gripestyrke. Dette vart målt med eit digitalt dynamometer og normalisert til gripestyrken i den friske armen. Ein smertefri gripestyrke på 100 betyr at den affiserte armen og den ikkje-affiserte armen fungerer like godt. Deskriptive mål for kvar av behandlingsgruppene er presenterte i tabellen på toppen av side 7.

TMA4255 Anvendt statistikk Side 7 av 7 Behandling Utvalsstorleik Gjennomsnitt Standardavvik A (fysioterapi) 63 70.2 25.4 B (injeksjon) 65 83.6 22.9 C (vent-og-sjå) 60 51.8 23.0 Totalt 188 69.0 b) Vi ønskjer å undersøke om den forventa smertefrie gripestyrken varierer mellom behandlingsgruppene. Skriv ned nullhypotesen og den alternative hypotesen og utfør ein hypotesetest basert på dei deskriptive måla i tabellen over. Kva for føresetnader må gjelde for at du skal kunne bruke denne testen? Kva er konklusjonen din basert på denne testen? c) Vi ønskjer å parvist samanlikne den forventa smertefrie gripestyrken for alle behandlingsgruppene. Gå no ut frå at utvalsstorleikane for alle behandlingane er n A = n B = n C = 63 og at gjennomsnitt og empirisk standardavvik for kvar behandlingsgruppe er som gitt i tabellen over. Utfør samanlikningane ved å konstruere simultane konfidensintervall for den forventa differansen i smertefri gripestyrke mellom alle par av behandlingar ved å bruke Tukeys metode. Bruk eit overordna konfidensnivå på 95% for alle samanlikningane. Kva for føresetnader må gjelde? Finn det felles individuelle konfidensnivået som er brukt for kvar av samanlikningane. d) La µ A angi den forventa smertefrie gripestyrken i ein populasjon der fysioterapi blir brukt for behandling av tennisolboge, og la µ C angi den forventa smertefrie gripestyrken i ein populasjon der vent-og-sjå blir brukt. Definer den relative differansen mellom desse to forventningsverdiane som γ = µ A µ C µ C. Dette kan fortolkast som den forventa relative auken i smertefri gripestyrke når fysioterapi blir brukt i staden for vent-og-sjå-behandling. Foreslå ein estimator, ˆγ, for γ basert på to uavhengige utval av storleik n A og n C frå fysioterapi og vent-og-sjåbehandlingsgruppene. Bruk tilnærma metodar til å finne forventningsverdi og varians til denne estimatoren, E(ˆγ) og Var(ˆγ). Bruk utvalsstoleikane, gjennomsnitta og dei empiriske standardavvika for fysioterapi og vent-og-sjå-behandlingsgruppene som er presenterte i tabellen på toppen av denne sida til å rekne ut numerisk verdi for ˆγ og estimere numeriske verdiar for E(ˆγ) og Var(ˆγ). Dersom du fekk vete at dei to utvala ikkje var uavhengige, korleis ville det påverke approksimasjonen du har funne for E(ˆγ) og Var(ˆγ)?