Alle deloppgaver teller likt i vurderingen av besvarelsen.

Like dokumenter
De normalfordelte: x og sd for hver gruppe. De skjevfordelte og de ekstremt skjevfordelte: Median og kvartiler for hver gruppe.

STK1000 Innføring i anvendt statistikk Eksamensdag: Tirsdag 12. desember 2017

UNIVERSITETET I OSLO

Forelesning 4 og 5 MET3592 Økonometri ved David Kreiberg Vår 2011

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

ØVINGER 2017 Løsninger til oppgaver

MASTER I IDRETTSVITENSKAP 2012/2014. Individuell skriftlig eksamen. MAS 402- Statistikk. Tirsdag 9. oktober 2012 kl

STK desember 2007

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

X ijk = µ+α i +β j +γ ij +ǫ ijk ; k = 1,2; j = 1,2,3; i = 1,2,3; i=1 γ ij = 3. i=1 α i = 3. j=1 β j = 3. j=1 γ ij = 0.

TMA4240/4245 Statistikk Eksamen august 2016

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Oppgaver. Multiple regresjon. Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

Statistikk og økonomi, våren 2017

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

Litt om empirisk Markedsavgrensning i form av sjokkanalyse

Oppgaven består av 9 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Løsningskisse for oppgaver til uke 15 ( april)

Simpleksmetoden. Initiell basistabell Fase I for å skaffe initiell, brukbar løsning. Fase II: Iterativ prosess for å finne optimal løsning Pivotering

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

TMA4240 Statistikk H2010

Eksamen i emne SIB8005 TRAFIKKREGULERING GRUNNKURS

Appendiks 1: Organisering av Riksdagsdata i SPSS. Sannerstedt- og Sjölins data er klargjort for logitanalyse i SPSS filen på følgende måte:

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

Seleksjon og uttak av alderspensjon fra Folketrygden

Eksamen i: STAT100 Statistikk. Tid: Tirsdag (3.5 timer)

Oversikt 1. forelesning. ECON240 Statistikk og økonometri. Utdanning og lønn. Forskning. Datainnsamling; utdanning og inntekt

Anvendelser. Kapittel 12. Minste kvadraters metode

Notater. Marie Lillehammer. Usikkerhetsanalyse for utslipp av farlige stoffer 2009/30. Notater

EKSAMEN ny og utsatt løsningsforslag

Hvordan får man data og modell til å passe sammen?

MA1301 Tallteori Høsten 2014

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

TMA4300 Mod. stat. metoder

STK1100 våren 2015 P A B P B A. Betinget sannsynlighet. Vi trenger en definisjon av betinget sannsynlighet! Eksemplet motiverer definisjonen:

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

Notater. Anna-Karin Mevik. Estimering av månedlig omsetning innenfor bergverksdrift og industri 2008/57. Notater

Forelesning Enveis ANOVA

Det ble orientert i plenum under eksamensdagen om følgende endringer i forhold til oppgaven:

Investering under usikkerhet Risiko og avkastning Høy risiko. Risikokostnad prosjekt Snøskuffe. Presisering av risikobegrepet

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

Kapittel 9 og 10: Hypotesetesting

Kapittel 9 og 10: Hypotesetesting

Econ 2130 uke 15 (HG)

Eksamensoppgave i SØK Statistikk for økonomer

Randi Eggen, SVV Torunn Moltumyr, SVV Terje Giæver. Notat_fartspåvirkn_landeveg_SINTEFrapp.doc PROSJEKTNR. DATO SAKSBEARBEIDER/FORFATTER ANTALL SIDER

TMA4245 Statistikk Eksamen 21. mai 2013

UNIVERSITETET I OSLO

Auksjoner og miljø: Privat informasjon og kollektive goder. Eirik Romstad Handelshøyskolen Norges miljø- og biovitenskapelige universitet

Oppgaver. Hypotesetesting testing av enkelthypoteser. Forelesning 4 og 5 MET3592 Økonometri ved David Kreiberg Vår 2011

EKSAMEN Ny og utsatt Løsningsforslag

Alderseffekter i NVEs kostnadsnormer. - evaluering og analyser

Veiledning til obligatorisk oppgave i ECON 3610/4610 høsten N. Vi skal bestemme den fordeling av denne gitte arbeidsstyrken som

Regler om normalfordelingen

Sparing gir mulighet for å forskyve forbruk over tid; spesielt kan ujevne inntekter transformeres til jevnere forbruk.

i kjemiske forbindelser 5. Hydrogen har oksidasjonstall Oksygen har oksidsjonstall -2

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

Regler om normalfordelingen

Regler om normalfordelingen

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

IT1105 Algoritmer og datastrukturer

Fleksibelt arbeidsliv. Befolkningsundersøkelse utført for Manpower September 2015

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

TMA4265 Stokastiske prosesser

Hypotesetesting. mot. mot. mot. ˆ x

INF 2310 Digital bildebehandling

STUDIEÅRET 2016/2017. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 27. april 2017 kl

Obligatorisk oppgave 2

STK1000 Obligatorisk oppgave 2 av 2

2007/30. Notater. Nina Hagesæther. Notater. Bruk av applikasjonen Struktur. Stabsavdeling/Seksjon for statistiske metoder og standarder

Oppgave 1 Det er oppgitt i oppgaveteksten at estimatoren er forventningsrett, så vi vet allerede at E(ˆµ) = µ. Variansen til ˆµ er 2 2 ( )

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

TMA4245 Statistikk Eksamen mai 2016

Tidspunkt for 10eksamen: 15. mai ,5 timer

Notater. Bjørn Gabrielsen, Magnar Lillegård, Berit Otnes, Brith Sundby, Dag Abrahamsen, Pål Strand (Hdir)

NA Dok. 52 Angivelse av måleusikkerhet ved kalibreringer

Oversikt over tester i Econ 2130

Magnetisk nivåregulering. Prosjektoppgave i faget TTK 4150 Ulineære systemer. Gruppe 4: Rune Haugom Pål-Jørgen Kyllesø Jon Kåre Solås Frode Efteland

Hypotesetest: generell fremgangsmåte

Oversikt over tester i Econ 2130

Løsningsforslag ST2301 Øving 8

Medisinsk statistikk, del II, vår 2008 KLMED Lineær regresjon, Rosner Regresjon?

Medisinsk statistikk, del II, vår 2009 KLMED 8005

FOLKETELLINGEN 1. NOVEMBER Tellingsresultater Tilbakegående tall - Prognoser SARPSBORG 0102 STATISTISK SENTRALBYRÅ - OSLO

FAUSKE KOMMUNE. Budsjett Regnskap Periodisert AWík i kr Forbruk i % I r 173 % I

TMA4265 Stokastiske prosesser

Eksamensoppgave i SØK2900 Empirisk metode

Masteroppgave i statistikk. GAMLSS-modeller i bilforsikring. Hallvard Røyrane-Løtvedt Kandidatnr

Forelesning Z-, t-test, test for forventningsdifferanser

Løsningsforslag øving 10 TMA4110 høsten 2018

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER STATISTICS FOR ECONOMISTS

ST0202 Statistikk for samfunnsvitere

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Notasjoner, gjennomsnitt og kvadratsummer. Enveis ANOVA, modell. Flere enn to grupper. Enveis variansanalyse (One-way ANOVA, fixed effects model)

Transkript:

STK H-26 Løsnngsforslag Alle deloppgaver teller lkt vurderngen av besvarelsen. Oppgave a) De normalfordelte: x og sd for hver gruppe. De skjevfordelte og de ekstremt skjevfordelte: Medan og kvartler for hver gruppe. x og sd gr gode oppsummernger av data som er tlnærmet normalfordelte (rmelg symmetrske og med lette haler), jfr regelen for x 2 sd og x 3 sd Medan og kvartler er robuste tall og egner seg for å beskrve data som kke er symmetrske om mdten. b) Hypoteser og hypotesetester Gjelder alle: Alternatv formulerng for de normalfordelte: H: Gruppene er lke Eller H: Gruppene er kke lke Eller Alternatv formulerng for de skjevfordelte (ford n er stor og CLT trolg slår nn) Eller Eller Der er forventnngsverden den normalvektge gruppa (gruppe ) og er forventnngsverden den overvektge gruppa (gruppe ) To-utvalgs t-test Alternatv formulerng for de ekstremt skjevfordelte Rangsum = Rangsum Rangsum Rangsum Der Rangsummene er summen av rangerngene tl verdene de to gruppene. Wlcoxon rank sum test Ford n er stor, antas det at man kan bruke to-utvalgs t-test både for de normalfordelte dataene og de skjevfordelte dataene, unntatt de 4 ekstremt skjeve. Dsse er trolg for skjeve tl at CLT (Sentralgrenseteoremet) har slått nn nok ved denne utvalgsstørrelsen. Wlcoxon rank sum test er tryggest her. c) Sgnfkansnvået er den (subjektvt vurdert) maksmalt akseptable sannsynlgheten for Type I-fel. P(Type I-fel) = P(Forkaste H H ).5 Med 2 tester og P(Type I-fel) = P(Forkaste H H ) =.5 hver test: Forventer 2*.5= sgnfkante tester. Ved tre tester: P(Type I-fel) = P(Forkaste H H ) = P(Mnst én H forkastes Alle 3 H er sanne) = = P(Alle H beholdes H ) = -.95 3 =.426:

Oppgave 2 a) Regresjonsmodellen: y x, ~ N(, ), uavhengge. Korrelasjonsanalyse for om det er en sammenheng mellom prs og nøyaktghet: Korrelasjonen «populasjonen» (den sanne korrelasjonen) er ρ. H : Ingen sammenheng mellom prs og nøyaktghet, ρ = H : Det er en sammenheng mellom prs og nøyaktghet, ρ (Alternatvt ensdge hypoteser, der nøyaktgheten øker med prsen ) Regresjonsanalyse for prs og nøyaktghet: y x H : Ingen sammenheng mellom prs og nøyaktghet, β = H : Det er en sammenheng mellom prs og nøyaktghet, β (Alternatvt ensdge hypoteser, der nøyaktgheten øker med prsen) Jeg har valgt tosdge hypoteser ford det er mest konservatvt, og jeg kke vet noe om verken produksjon av meterstokker, deres nøyaktghet, eller prsmodeller som blr brukt. (Alternatvt Jeg har valgt ensdge hypoteser ford det er grunn tl å undersøke om nøyaktgheten øker med prs.) Både korrelasjonsanalysen basert på Pearson s r, og regresjonsanalysen gr en p-verd for (H : ˆ =) på.397, som vl g konklusjonen «Behold H» på alle sgnfkansnvåer under.397. V beholder derfor H, og konkluderer med at det er ngen sgnfkant sammenheng mellom nøyaktghet og prs. Pearson's product-moment correlaton p-value =.3969 Coeffcents: Estmate Std. Error t value Pr(> t ) prs.752.22.867.397 Oppgave 3 a) Effektmål: Et tall som oppsummerer effekten av (varasjon ) blodsukker på (varasjon ) fødselsvekt. I en regresjonsanalyse er det regresjonskoeffsenten som vser stgnngstallet tl regresjonslnja ( regresjonslgnngen y x ). er stgnngstallet tl regresjonslnja. Det vser hvor mange enheters forskjell fødselsvekt (y) som forventes når blodsukkeret (x) øker med en enhet. Estmat: ˆ 72

95% konfdensntervall: b) En konfunderende varabel er en varabel som både påvrker responsvarabelen og forklarngsvarabelen en regresjonsanalyse (common cause), og dermed også påvrker sammenhengen (estmatet for effektmålet) mellom de to varablene. V må ha ekspertkunnskap om problemet for å avgjøre om en varabel er en konfounder. Ja, mors body mass ndex (bm) kan ses å være en konfunderende varabel for sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt, ford: Her har v nok opplysnnger oppgaveteksten tl å kunne anta at bm kan påvrke (det målte) blodsukkeret, altså forklarngsvarabelen, og at bm også kan fødselsvekta (responsvarabelen) gjennom andre mekansmer enn blodsukkeret. I så fall vl estmatet for sammenhengen mellom blodsukker og fødselsvekt være based/felaktg, hvs v kke tar hensyn tl bm analysen. c) Nytt estmat for sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt: ˆ 94 Nytt 95% konfdensntervall : Ne, det er kke en sgnfkant sammenheng mellom mors blodsukkernvå og barnets fødselsvekt.

Begrunnelse : Dette tlsvarer en hypotesetest for H : Ingen sammenheng mellom mors blodsukkernvå og barnets fødselsvekt, β =, mot H : Det er en sammenheng mellom mors blodsukkernvå og barnets fødselsvekt, β en regresjonsmodell med tre parametere, y x 2x2, der x er blodsukker og x 2 er bm, som vst den sste utskrften oppgaven. Der ser v at p- verden er.28, hvlket betyr at H beholdes på nvå.5. Begrunnelse 2: 95% KI for fra c) nneholder H -verden =, og det forteller oss det samme som hypotesetesten, nemlg at v beholder H (på nvå.5). Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 2964.5 336.97 8.798 7.3e-6 *** blodsukker 93.763 87.426.72.2848 bm 9.883 8.397 2.368.89 * Den sgnfkante sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt som v så oppgave a) forsvnner altså når v korrgerer for den konfunderende varabelen bm, og det er derfor grunn tl å tro at sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt kke var reell, men skyldtes konfunderng. Oppgave 4 a) Fra utskrften ser v at estmatet for parameterne og er ˆ 3. 7, og ˆ. 92. Tolknng: ˆ vser hvor regresjonslgnnga skjærer y-aksen. Hvs øretermometer og sentraltemperaturen vste det samme (som de deelt sett burde gjøre), vlle denne vært. At ˆ >, vser at sentraltemperaturen er ltt høyere enn øretemperaturen. Tlsvarende vser ˆ stgnngstallet tl regresjonslnja. Igjen, hvs øretermometer og sentraltemperaturen vste det samme (som de deelt sett burde gjøre), vlle denne vært. Hypotesetestene som reflekteres de to første p-verdene utskrften: H : β =, mot H : β (p-verd.4) og

H : β =, mot H : β (p-verd <.) b) 95% predksjonsntervall for sentraltemperaturen når øretemperaturen vser 38 ºC: c) 95% konfdensntervall for forventet forskjell på de to målemetodene: Kommentar: Både regresjonsanalysen tdlgere oppgaven og konfdensntervallet vser at det er en statstsk sgnfkant forskjell på øretemperaturen og sentraltemperaturen, mer spesfkt at sentraltemperaturen (den rktge temperaturen) er høyere enn det øretemperaturen vser. Det er derfor grunn tl å være forsktg med å bruke øretemperatur, speselt hvs man har med krtsk syke pasenter å gjøre, eller pasenter som kke tåler å ha høy feber.