EKSAMEN I FAG ST2202 ANVENDT STATISTIKK

Like dokumenter
EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

TMA4245 Statistikk Eksamen desember 2016

LØSNINGSFORSLAG ) = Dvs

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Oppgave 1. Kilde SS df M S F Legering Feil Total

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Eksamensoppgave i TMA4240 Statistikk

Kap. 12: Variansanalyse

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4255 Anvendt statistikk

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk

vekt. vol bruk

Oppgave 14.1 (14.4:1)

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

i=1 t i +80t 0 i=1 t i = 9816.

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Høst 2018

EKSAMEN I TMA4255 ANVENDT STATISTIKK

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2015

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

Eksamensoppgave i TMA4275 Levetidsanalyse

Løsningsforslag eksamen 27. februar 2004

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4255 Anvendt statistikk

Løsningsforslag: STK2120-v15.

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt

i x i

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2007

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

TMA4240 Statistikk Høst 2009

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

TMA4245 Statistikk Eksamen desember 2016

Eksamen i emnet Stat111 - Statistiske metoder 28. mai 2014, kl

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

STK Oppsummering

TMA4240 Statistikk Høst 2016

Eksamensoppgave i ST0103 Brukerkurs i statistikk

ST0202 Statistikk for samfunnsvitere

HØGSKOLEN I STAVANGER

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2015

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

EKSAMEN I TMA4255 ANVENDT STATISTIKK

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere

Testobservator for kjikvadrattester

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Eksamensoppgåve i TMA4255 Anvendt statistikk

TMA4240 Statistikk Høst 2016

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Mandag 27. mai 2013 Tid: 09:00 13:00

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO

ECON240 VÅR / 2016 BOKMÅL

Eksamensoppgave i TMA4275 Levetidsanalyse

STK Oppsummering

TMA4245 Statistikk Eksamen august 2014

TMA4240 Statistikk Høst 2016

Fasit for tilleggsoppgaver

UNIVERSITETET I OSLO

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

ST0202 Statistikk for samfunnsvitere

Eksamensoppgåve i TMA4240 Statistikk

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 8 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG ST2202 ANVENDT STATISTIKK Fredag 5. desember 2008 Tid: 09:0014:00 Tillatte hjelpemidler: Alle trykte og håndskrevne hjelpemidler. Spesiell kalkulator. Sensur: 5. januar 2009 Oppgave 1 En av de vanligste årsakene til betongskader er såkalt karbonatisering. Dette vil si at karbondioksyd i lufta inngår kjemisk reaksjon med betongens kalsiumhydroksyd, og det dannes kalsiumkarbonat. Karbonatiseringen gjør at betongens rustbeskyttende virkning forsvinner og at vann og luft som kommer i kontakt med armeringsjernet gjennom sprekker og porer i betongen, fører til at jernet ruster. La X være karbonatiseringsdybden for en betongvegg av en viss alder. Det antas at V ln X er normalfordelt, V N(µ, σ 2 ), dvs. at X er såkalt lognormalt fordelt med parametre µ og σ 2, kort skrevet X Logn(µ, σ 2 ). Du kan bruke uten å vise det at E(X) = e µ+ 1 2 σ2 E(X 2 ) = e 2µ+2σ2 V ar(x) = e 2µ+σ2 (e σ2 1) Cov(X, X 2 ) = e 3µ+ 5 2 σ2 (e 2σ2 1) V ar(x 2 ) = e 4µ+4σ2 (e 4σ2 1)

ST2202 ANVENDT STATISTIKK Side 2 av 8 La X 1,..., X n være n målinger av karbonatiseringsdybde for en bestemt betongvegg. Observasjonene antas uavhengige og identisk fordelte, X i Logn(µ, σ 2 ) for i = 1,..., n, der µ og σ 2 er ukjente parametre. La X n = 1 n n i=1 X i og Y n = 1 n n i=1 X2 i. Det kan vises at de såkalte momentestimatorene for µ og σ 2 er gitt ved ˆµ = 2 ln X n 1 2 ln Y n ˆσ 2 = ln Y n 2 ln X n der ln betyr den naturlige logaritme. a) Finn, ved hjelp av en Taylor-utvikling, en lineær funksjon av X n og Y n som er en tilnærming til ˆµ. Bruk denne til å nne et tilnærmet uttrykk for V ar(ˆµ). Regn ut ˆµ, ˆσ 2 og et estimat for V ar(ˆµ) når dataene er som i tabellen gitt til slutt i oppgaven. b) Finn Jackknife-estimatorene for henholdsvis µ og V ar(ˆµ) ved å bruke opplysninger gitt i tabellen. I tabellen er ˆµ (1),..., ˆµ (10) de 10 pseudo-verdiene knyttet til ˆµ. De 9 siste er oppgitt, mens du selv må beregne ˆµ (1). c) Forklar forholdsvis kort hvordan du ville gå fram for å estimere henholdsvis forventningsskjevhet (bias) og varians for ˆµ ved hjelp av bootstrapping. d) Man vil teste nullhypotesen at medianen m i fordelingen til X er lik 9.0 mot alternativet at m > 9.0 ved å bruke en ikke-parametrisk test basert på dataene i tabellen. Gjennomfør en tegntest med signikansnivå 5% og angi konklusjonen. Hvorfor bør Wilcoxons ett-utvalgs test ikke brukes i dette tilfellet?

ST2202 ANVENDT STATISTIKK Side 3 av 8 i X i ˆµ (i) 1 8.2 2 9.0 2.288 3 9.9 2.277 4 11.5 2.258 5 10.1 2.274 6 7.6 2.308 7 4.0 2.363 8 11.8 2.254 9 12.2 2.250 10 19.7 2.205 Sum 104.0 20.477 Kvadratsum 1230.44 46.604987 (Med kvadratsum menes sum av kvadratene av alle tallene i kolonnen. Summene som er merket med gjelder bare de 9 oppgitte tallene i kolonnen.) Oppgave 2 Utbyttet av en kjemisk prosess ble studert i et pilotforsøk. Følgende faktorer ble betraktet: Faktor Faktornivåer -1 1 A Mengde av aktiv komponent 4 mol 5 mol B Surhet, ph 6 7 C Reaksjonstid 2 timer 4 timer D Filtrering (første) ingen etter 1/2 time E Filtrering (andre) ingen etter 1 time Det ble utført et 2 5 2 fraksjonelt forsøk basert på et fullt 2 3 -forsøk med faktorer A, B, C og med generatorer D = AB og E = AC. Responsen Y ble denert som utbytte målt relativt til et teoretisk maksimum. Responsene Y 1,..., Y 8 i de 8 forsøkene antas uavhengige og normalfordelte med samme varians σ 2. MINITAB-utskriften på neste side angir designet og de 8 responsene, samt alias-struktur og estimerte eekter. Du kan bruke denne utskriften i løsningen av oppgaven.

ST2202 ANVENDT STATISTIKK Side 4 av 8 Data Display Row StdOrder A B C D E Y 1 1-1 -1-1 1 1 69,3 2 2 1-1 -1-1 -1 70,8 3 3-1 1-1 -1 1 71,3 4 4 1 1-1 1-1 73,2 5 5-1 -1 1 1-1 77,5 6 6 1-1 1-1 1 79,3 7 7-1 1 1-1 -1 88,9 8 8 1 1 1 1 1 91,2 Alias Structure I + ABD + ACE + BCDE A + BD + CE + ABCDE B + AD + CDE + ABCE C + AE + BDE + ABCD D + AB + BCE + ACDE E + AC + BCD + ABDE BC + DE + ABE + ACD BE + CD + ABC + ADE Estimated Effects and Coefficients for Y (coded units) Term Effect Coef Constant 77,6875 A 1,8750 0,9375 B 6,9250 3,4625 C 13,0750 6,5375 D 0,2250 0,1125 E 0,1750 0,0875 B*C 4,7250 2,3625 B*E 0,0250 0,0125 a) Man er først interessert i å estimere hovedeekten av faktor A. Forklar hvordan estimatet beregnes fra de gitte responsene. Gi en kommentar i lys av den oppgitte aliasstrukturen. Vis også hvordan tofaktorsamspillet BC kan beregnes fra de gitte responsene og gi en kommentar. Hvilken generell fortolkning har et tofaktorsamspill? Hva er de denerende relasjoner og hva er resolusjonen for designet i denne oppgaven? Hvilken praktisk fortolkning har resolusjonen?

ST2202 ANVENDT STATISTIKK Side 5 av 8 Det ble i analysen antatt at faktorene D og E ikke har interaksjon med hverandre eller med noen av de andre faktorene i forsøket, dvs. at alle samspill der D eller E deltar kan settes til 0. Denne antagelsen skal gjøres i resten av oppgaven. b) Hvilke hovedeekter kan nå estimeres ukonfundert, og hvilke hovedeekter er fremdeles konfundert med andre eekter? Finn variansen for en estimert eekt uttrykt ved σ 2. Fra tidligere erfaring ble σ 2 antatt kjent, σ 2 = 2. Bruk dette til å avgjøre hvilke hovedeekter og samspill som er signikante når signikansnivået velges til 5%. Hva er det minste signikansnivået som ville føre til at A har signikant eekt? c) I Pareto-diagrammet nedenfor brukes Lenth's PSE som estimat for standardavviket til de estimerte eektene. Vis ved hjelp de estimerte eektene i MINITAB-utskriften hvordan man kommer fram til resultatet PSE = 1.575.

ST2202 ANVENDT STATISTIKK Side 6 av 8 Oppgave 3 Et forskningslaboratorium skal undersøke vibrasjonen som oppstår når tynne plater av polyethylen utsettes for vind. Til forsøket brukes plater av samme tykkelse og bredde, men med tre forskjellige lengder. Platene utsettes for re forskjellige vindhastigheter, og antall svingninger i et bestemt tidsrom blir målt. For hver av de 12 kombinasjonene av lengde og vindhastighet foretas to forsøk. Responsen for enkeltforsøkene betegnes Y ijk og angir en hundredel av antall svingninger pr. sekund når plate nummer k med lengde A i blir utsatt for vind av hastighet B j ; for i = 1, 2, 3; j = 1, 2, 3, 4 og k = 1, 2. Resultatet av forsøket er gitt i tabellen nedenfor. Enheten for lengde er tommer, mens enheten for vindhastighet er fot/sekund. Lengde Vindhastighet B 1 = 62.5 B 2 = 54.6 B 3 = 44.3 B 4 = 31.3 A 1 = 1.50 50.5 46.0 36.5 23.0 50.0 45.1 37.0 24.5 A 2 = 1.75 47.0 41.5 33.1 22.0 48.0 42.0 34.1 24.2 A 3 = 2.00 45.5 39.4 30.8 20.3 45.1 38.8 31.0 21.6 Dataene analyseres ved hjelp av to-faktor variansanalyse, der faktorene A og B har henholdsvis 3 og 4 nivåer (og der det ikke tas hensyn til de numeriske verdier av lengde og vindhastighet). Du kan i punktene nedenfor bruke følgende utskrift fra MINITAB: Two-way ANOVA: Y versus A; B Source DF SS MS F A 2 100,54 50,268 93,52 B 3 2145,40 715,134 1330,48 Interaction 6 8,99 1,498 2,79 Error 12 6,45 0,537 Total 23 2261,38 a) Sett opp modellen for observasjonene {Y ijk } som tar hensyn til et eventuelt samspill mellom lengdeeekten (A) og vindhastighetseekten (B).

ST2202 ANVENDT STATISTIKK Side 7 av 8 Hvordan vil du teste om det er samspill mellom de to faktorene? Sett opp og begrunn en testobservator og nn kritisk verdi når signikansnivået settes til 5%. Hva blir konklusjonen? Er hovedeektene av lengde og vindhastighet signikante med 5% nivå? Begrunn svaret ved å vise til de beregnede testobservatorene i MINITAB-utskriften. b) Sett opp uttrykkene for SSE og SS(AB) i modellen fra punkt (a). Vis ved hjelp av resultater fra pensum at SSE/σ 2 er kjikvadrat-fordelt med 12 frihetsgrader. (Vink: Bruk at hvis V 1,..., V n er uavhengige observasjoner fra N(ν, τ 2 ), så er n k=1 (V k V ) 2 /σ 2 kjikvadratfordelt med n 1 frihetsgrader). Sett opp et uttrykk for estimatoren S 2 for σ 2 basert på SSE. Finn den numeriske verdi for S 2 i MINITAB-utskriften. Anta nå at det ikke er noe samspill mellom faktorene A og B, dvs. at alle parametrene (αβ) ij i modellen i punkt (a) er lik 0. Det kan da vises at SS(AB)/σ 2 er kjikvadratfordelt med 6 frihetsgrader, og at SS(AB) er uavhengig av SSE. (Du skal ikke gjøre dette.) Vis hvordan en ny estimator for σ 2 kan utledes ved å bruke både SSE og SS(AB). Finn estimatoren og regn ut det nye estimatet for σ 2 med de gitte dataene. Oppgave 4 La X være antall millioner omdreininger til tretthetsfeil ved utprøving av en type kulelager. Det er testet 65 slike kulelager og resultatet er oppsummert i tabellen nedenfor. Intervall Antall observasjoner < 0, 40] 7 < 40, 60] 14 < 60, 80] 18 < 80, 100] 15 < 100, 120] 8 < 120, ] 3 Man vil undersøke om sannsynlighetsfordelingen for X kan antas å være en Weibull-fordeling med kumulativ fordelingsfunksjon F (x) = P (X x) = 1 e ( x 80) 2 for x > 0. (1)

ST2202 ANVENDT STATISTIKK Side 8 av 8 a) Bruk tallmaterialet i tabellen til å utføre en test for nullhypotesen at X har fordelingen (1). La signikansnivået være 5%. Hva blir konklusjonen? Forklar kort hvordan du ville gått fram dersom nullhypotesen var at X er Weibull-fordelt, uten angivelse av verdier på parametre, og du hadde de samme dataene. Du skal ikke gjøre noen nye beregninger her. (Weibull-fordelingen er generelt gitt ved en kumulativ fordelingsfunksjon F (x; θ, α) = 1 e ( x θ )α for x > 0, der α, θ er positive parametre.)