De normalfordelte: x og sd for hver gruppe. De skjevfordelte og de ekstremt skjevfordelte: Median og kvartiler for hver gruppe.

Like dokumenter
Alle deloppgaver teller likt i vurderingen av besvarelsen.

UNIVERSITETET I OSLO

STK1000 Innføring i anvendt statistikk Eksamensdag: Tirsdag 12. desember 2017

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

MASTER I IDRETTSVITENSKAP 2012/2014. Individuell skriftlig eksamen. MAS 402- Statistikk. Tirsdag 9. oktober 2012 kl

Forelesning 4 og 5 MET3592 Økonometri ved David Kreiberg Vår 2011

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

ØVINGER 2017 Løsninger til oppgaver

TMA4240/4245 Statistikk Eksamen august 2016

X ijk = µ+α i +β j +γ ij +ǫ ijk ; k = 1,2; j = 1,2,3; i = 1,2,3; i=1 γ ij = 3. i=1 α i = 3. j=1 β j = 3. j=1 γ ij = 0.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Oppgaven består av 9 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Statistikk og økonomi, våren 2017

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

TMA4240 Statistikk H2010

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

STK desember 2007

Oppgaver. Multiple regresjon. Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Oversikt 1. forelesning. ECON240 Statistikk og økonometri. Utdanning og lønn. Forskning. Datainnsamling; utdanning og inntekt

Eksamen i emne SIB8005 TRAFIKKREGULERING GRUNNKURS

Løsningskisse for oppgaver til uke 15 ( april)

Litt om empirisk Markedsavgrensning i form av sjokkanalyse

Simpleksmetoden. Initiell basistabell Fase I for å skaffe initiell, brukbar løsning. Fase II: Iterativ prosess for å finne optimal løsning Pivotering

Eksamen i: STAT100 Statistikk. Tid: Tirsdag (3.5 timer)

Appendiks 1: Organisering av Riksdagsdata i SPSS. Sannerstedt- og Sjölins data er klargjort for logitanalyse i SPSS filen på følgende måte:

Eksamensoppgave i SØK Statistikk for økonomer

Seleksjon og uttak av alderspensjon fra Folketrygden

Hvordan får man data og modell til å passe sammen?

STK1100 våren 2015 P A B P B A. Betinget sannsynlighet. Vi trenger en definisjon av betinget sannsynlighet! Eksemplet motiverer definisjonen:

Alderseffekter i NVEs kostnadsnormer. - evaluering og analyser

Notater. Marie Lillehammer. Usikkerhetsanalyse for utslipp av farlige stoffer 2009/30. Notater

Sparing gir mulighet for å forskyve forbruk over tid; spesielt kan ujevne inntekter transformeres til jevnere forbruk.

IT1105 Algoritmer og datastrukturer

EKSAMEN ny og utsatt løsningsforslag

TMA4300 Mod. stat. metoder

Anvendelser. Kapittel 12. Minste kvadraters metode

KVIKKSØLVEKSPONERING VED DENTALLABORATORIER. Nils Gundersen og Arve Lie HD 807/790814

NA Dok. 52 Angivelse av måleusikkerhet ved kalibreringer

TMA4245 Statistikk Eksamen mai 2016

Randi Eggen, SVV Torunn Moltumyr, SVV Terje Giæver. Notat_fartspåvirkn_landeveg_SINTEFrapp.doc PROSJEKTNR. DATO SAKSBEARBEIDER/FORFATTER ANTALL SIDER

Notater. Bjørn Gabrielsen, Magnar Lillegård, Berit Otnes, Brith Sundby, Dag Abrahamsen, Pål Strand (Hdir)

MA1301 Tallteori Høsten 2014

Fleksibelt arbeidsliv. Befolkningsundersøkelse utført for Manpower September 2015

Tidspunkt for 10eksamen: 15. mai ,5 timer

Forelesning Enveis ANOVA

i kjemiske forbindelser 5. Hydrogen har oksidasjonstall Oksygen har oksidsjonstall -2

INF 2310 Digital bildebehandling

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

2007/30. Notater. Nina Hagesæther. Notater. Bruk av applikasjonen Struktur. Stabsavdeling/Seksjon for statistiske metoder og standarder

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

Fleksibelt arbeidsliv. Befolkningsundersøkelse utført for Manpower September 2015

Econ 2130 uke 15 (HG)

Investering under usikkerhet Risiko og avkastning Høy risiko. Risikokostnad prosjekt Snøskuffe. Presisering av risikobegrepet

Studieprogramundersøkelsen 2013

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMENSOPPGAVE I SØK1004 STATISTIKK FOR ØKONOMER STATISTICS FOR ECONOMISTS

Det ble orientert i plenum under eksamensdagen om følgende endringer i forhold til oppgaven:

TMA4245 Statistikk Eksamen 21. mai 2013

NA Dok. 52 Angivelse av måleusikkerhet ved kalibreringer

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

Notater. Anna-Karin Mevik. Estimering av månedlig omsetning innenfor bergverksdrift og industri 2008/57. Notater

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO

Jobbskifteundersøkelsen Utarbeidet for Experis

Masteroppgave i statistikk. GAMLSS-modeller i bilforsikring. Hallvard Røyrane-Løtvedt Kandidatnr

Alderseffekter i NVEs kostnadsnormer. - evaluering og analyser

Auksjoner og miljø: Privat informasjon og kollektive goder. Eirik Romstad Handelshøyskolen Norges miljø- og biovitenskapelige universitet

EKSAMEN Ny og utsatt Løsningsforslag

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

Notater. Asif Hayat og Terje Tveeikrem Sæter. Prisindeks for rengjøringsvirksomhet 2008/49. Notater

må det justeres for i avkastningsberegningene. se nærmere nedenfor om valg av beregningsmetoder.

Løsningsforslag øving 10 TMA4110 høsten 2018

Notasjoner, gjennomsnitt og kvadratsummer. Enveis ANOVA, modell. Flere enn to grupper. Enveis variansanalyse (One-way ANOVA, fixed effects model)

Løsningsforslag ST2301 Øving 8

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Dynamisk programmering. Hvilke problemer? Overlappende delproblemer. Optimalitetsprinsippet

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

STK1000 Obligatorisk oppgave 2 av 2

UNIVERSITETET I OSLO

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Obligatorisk oppgave 2

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgave i SØK2900 Empirisk metode

STUDIEÅRET 2016/2017. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 27. april 2017 kl

Veiledning til obligatorisk oppgave i ECON 3610/4610 høsten N. Vi skal bestemme den fordeling av denne gitte arbeidsstyrken som

Forelesning 25 og 26 Introduksjon til Bayesiansk statistikk

Magnetisk nivåregulering. Prosjektoppgave i faget TTK 4150 Ulineære systemer. Gruppe 4: Rune Haugom Pål-Jørgen Kyllesø Jon Kåre Solås Frode Efteland

TMA4265 Stokastiske prosesser

Hypotesetest: generell fremgangsmåte

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 07. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Oppgaver. Hypotesetesting testing av enkelthypoteser. Forelesning 4 og 5 MET3592 Økonometri ved David Kreiberg Vår 2011

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

Lise Dalen, Pål Marius Bergh, Jenny-Anne Sigstad Lie og Anne Vedø. Energibruk î. næringsbygg / Notater

ECON240 VÅR / 2016 BOKMÅL

Oppvarming og innetemperaturer i norske barnefamilier

Kapittel 9 og 10: Hypotesetesting

Transkript:

STK H-26 Løsnngsforslag Alle deloppgaver teller lkt vurderngen av besvarelsen. Oppgave I et tlfeldg utvalg på normalvektge personer, og overvektge personer, måles konsentrasjonen av 2 ulke protener blodet. For omtrent halvparten av dsse protenene ser verdene ut tl å være relatvt normalfordelte ( begge gruppene). For resten av protenene ser verdene ut tl å være skjevfordelte ( begge gruppene), og for 4 av protenene er fordelngen ekstremt skjev. Verdene tl de 4 sstnevnte protenene er knapt målbare for majorteten av de 2 personene studen, mens et fåtall personer hver gruppe har ekstremt høye verder. a) Hvlke oppsummerngstall (deskrptv statstkk) vlle du brukt for å beskrve konsentrasjonen av dsse protenene blod? De normalfordelte: x og sd for hver gruppe. De skjevfordelte og de ekstremt skjevfordelte: Medan og kvartler for hver gruppe. Begrunn svaret. x og sd gr gode oppsummernger av data som er tlnærmet normalfordelte (rmelg symmetrske og med lette haler), jfr regelen for x 2 sd og x 3 sd Medan og kvartler er robuste tall og egner seg for å beskrve data som kke er symmetrske om mdten. b) Sett opp nullhypotese og alternatv hypotese for å undersøke om det er forskjell konsentrasjonen av protener blodet tl deltakerne de to gruppene. Hvlke(n) hypotesetest(er) vl du bruke for å sammenlgne gruppene? Begrunn svaret.

Gjelder alle: Alternatv formulerng for de normalfordelte: H: Gruppene er lke Eller H: Gruppene er kke lke Eller Alternatv formulerng for de skjevfordelte (ford n er stor og CLT trolg slår nn) Eller Eller Der er forventnngsverden den normalvektge gruppa (gruppe ) og er forventnngsverden den overvektge gruppa (gruppe ) To-utvalgs t-test Alternatv formulerng for de ekstremt skjevfordelte Rangsum = Rangsum Rangsum Rangsum Der Rangsummene er summen av rangerngene tl verdene de to gruppene. Wlcoxon rank sum test Ford n er stor, antas det at man kan bruke to-utvalgs t-test både for de normalfordelte dataene og de skjevfordelte dataene, unntatt de 4 ekstremt skjeve. Dsse er trolg for skjeve tl at CLT (Sentralgrenseteoremet) har slått nn nok ved denne utvalgsstørrelsen. Wlcoxon rank sum test er tryggest her. c) Forskerne som planla denne studen ønsket å bruke et sgnfkansnvå på 5%, altså α=.5. Hva betyr dette? Sgnfkansnvået er den (subjektvt vurdert) maksmalt akseptable sannsynlgheten for Type I-fel. P(Type I-fel) = P(Forkaste H H) =.5 Anta at H er sann for alle de 2 protenene. Hvor mange sgnfkante gruppeforskjeller kan man allkevel forvente å fnne? (Dersom man gjør 2 uavhengge hypotesetester, hver med sgnfkansnvå 5%?) Med 2 tester og P(Type I-fel) = P(Forkaste H H) =.5 hver test: Forventer 2*.5= sgnfkante tester. Anta så at man gjør en stude der man kke gjør tester for alle de 2 protenene, men velger tre av dem, som antas å være uavhengge. Hvs sgnfkansnvået er 5% hver test, hva er den totale sannsynlgheten for type -fel denne studen? Ved tre tester: P(Type I-fel) = P(Forkaste H H) = P(Mnst én H forkastes Alle 3 H er sanne) = = P(Alle H beholdes H) = -.95 3 =.426: Oppgave 2 I en test av meterstokker/tommestokker som Forbrukerrådet gjorde 26, ble 2 meterstokker vurdert etter hvor nøyaktge de var. Med hjelp fra Justervesenet ble meterstokkene festet en kalbrert rgg, og så ble

punktet der meterstokken vste 99 cm sammenlgnet med fast ved hjelp av lasernferometer. Forbrukerrådet ønsket å teste om nøyaktgheten på meterstokkene hadde en sammenheng med prsen. De to utskrftene under vser en korrelasjonsanalyse og en regresjonsanalyse for sammenhengen mellom prs ( kr), y, og nøyaktghet ( mm), x. OBS: Det ble oppdaget tdlg på eksamen (av en student) at x og y var ombyttet. Dette ble det gjort oppmerksom på alle eksamensrommene (ca halvves), og faglærer gkk rundt etterpå. Rktg oppgavetekst er De to utskrftene under vser en korrelasjonsanalyse og en regresjonsanalyse for sammenhengen mellom prs ( kr), x, og nøyaktghet ( mm), y. a) Formulér regresjonsmodellen som er utgangspunktet for regresjonsanalysen. y x, ~ N(, ) Ta så utgangspunkt de to analysene utskrftene over, og formulér de tlhørende to sett med hypoteser (altså nullhypotese og alternatv hypotese), for to ulke parametere, som begge kan brukes når man vl teste om det er en sammenheng mellom prs og nøyaktghet. Korrelasjonsanalyse for om det er en sammenheng mellom prs og nøyaktghet: Korrelasjonen «populasjonen» (den sanne korrelasjonen) er ρ. H: Ingen sammenheng mellom prs og nøyaktghet, ρ = H: Det er en sammenheng mellom prs og nøyaktghet, ρ (Alternatvt ensdge hypoteser, der nøyaktgheten øker med prsen ) Regresjonsanalyse for prs og nøyaktghet: y x H: Ingen sammenheng mellom prs og nøyaktghet, β = H: Det er en sammenheng mellom prs og nøyaktghet, β (Alternatvt ensdge hypoteser, der nøyaktgheten øker med prsen) Begrunn hvorfor du velger ensdg eller tosdge hypoteser. Jeg har valgt tosdge hypoteser ford det er mest konservatvt, og jeg kke vet noe om verken produksjon av meterstokker, deres nøyaktghet, eller prsmodeller som blr brukt. (Alternatvt Jeg har valgt ensdge hypoteser ford det er grunn tl å undersøke om nøyaktgheten øker med prs.) Hvlke(n) konklusjon(er) trekker du? Både korrelasjonsanalysen basert på Pearson s r, og regresjonsanalysen gr en p-verd for (H: ˆ =) på.397, som vl g konklusjonen «Behold H» på alle sgnfkansnvåer under.397. V beholder derfor H, og konkluderer med at det er ngen sgnfkant sammenheng mellom nøyaktghet og prs. Pearson's product-moment correlaton p-value =.3969 Coeffcents: Estmate Std. Error t value Pr(> t ) prs.752.22.867.397

Oppgave 3 I en stude av 2 frske gravde kvnner ble deltakerne rekruttert etter hvert som de søkte fødeplass på et gtt sykehus. Forskerne ønsket å fnne ut om det var en sammenheng mellom mors blodsukkernvå (målt mmol/l) og barnets fødselsvekt (målt gram). På nklusjonstdspunktet var kvnnene gravde tredje måned, og fastende blodsukker ble målt. Det måles om morgenen før frokost. Følgende regresjonsanalyse ble gjort: a) Hva er effektmålet her, Effektmål: Et tall som oppsummerer effekten av (varasjon ) blodsukker på (varasjon ) fødselsvekt. I en regresjonsanalyse er det regresjonskoeffsenten som vser stgnngstallet tl regresjonslnja ( regresjonslgnngen y x ). og hvordan tolkes det? er stgnngstallet tl regresjonslnja. Det vser hvor mange enheters forskjell fødselsvekt (y) som forventes når blodsukkeret (x) øker med en enhet. G et estmat for sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt, Fra utskrften: ˆ 72 og beregn et 95% konfdensntervall for det samme. Bakgrunnen for studen [ mye om de fysologske prosessene dette ] påvrker kroppens evne tl å regulere blodsukkeret. b) Hva menes med en konfunderende varabel (confounder eller lurkng varable)? En konfunderende varabel er en varabel som både påvrker responsvarabelen og forklarngsvarabelen en regresjonsanalyse (common cause), og dermed også påvrker sammenhengen (estmatet for effektmålet) mellom de to varablene. V må ha ekspertkunnskap om problemet for å avgjøre om en varabel er en konfounder.

Kan mors body mass ndex (bm), altså (vekt kg)/(høyde m) 2, ses å være en konfunderende varabel for sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt? Ja. Begrunn svaret. Her har v nok opplysnnger oppgaveteksten tl å kunne anta at bm kan påvrke (det målte) blodsukkeret, altså forklarngsvarabelen, og at bm også kan fødselsvekta (responsvarabelen) gjennom andre mekansmer enn blodsukkeret. I så fall vl estmatet for sammenhengen mellom blodsukker og fødselsvekt være based/felaktg, hvs v kke tar hensyn tl bm analysen. c) Bruk følgende utskrft tl å g et nytt estmat Fra utskrften: ˆ 94 og et nytt 95% konfdensntervall for sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt. Er det en sammenheng mellom mors blodsukkernvå og barnets fødselsvekt? Ne, det er kke en sgnfkant sammenheng mellom mors blodsukkernvå og barnets fødselsvekt. Begrunn svaret Begrunnelse : Dette tlsvarer en hypotesetest for H: Ingen sammenheng mellom mors blodsukkernvå og barnets fødselsvekt, β =, mot H: Det er en sammenheng mellom mors blodsukkernvå og barnets fødselsvekt, β en regresjonsmodell med tre parametere, y x 2x2, der x er blodsukker og x2 er bm, som vst den sste utskrften oppgaven. Der ser v at p-verden er.28, hvlket betyr at H beholdes på nvå.5. Begrunnelse 2: 95% KI for fra c) nneholder H-verden =, og det forteller oss det samme som hypotesetesten, nemlg at v beholder H (på nvå.5). Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 2964.5 336.97 8.798 7.3e-6 *** blodsukker 93.763 87.426.72.2848 bm 9.883 8.397 2.368.89 * Den sgnfkante sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt som v så oppgave a) forsvnner altså når v korrgerer for den konfunderende varabelen bm, og det er derfor grunn tl å tro at sammenhengen mellom mors blodsukkernvå og barnets fødselsvekt kke var reell, men skyldtes konfunderng.

Oppgave 4 I en stude av øretermometere fant man ut at sammenhengen mellom den sanne kroppstemperaturen (sentraltemperaturen) y, og målngene fra øretermometeret x (kalt ear utskrften), kunne uttrykkes ved regresjonslgnngen y x, ~ N(, ) Gjennomsntt og standardavvk ( ºC) var x 37.,. 83 sd, og y 37. 89, sd. 92. Utskrften vser en regresjonsanalyse som ble gjort på målnger av 237 ntensvpasenter, der det var mulg å gjøre en nøyaktg målng av sentraltemperaturen: Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 3.74544.5257 2.476.4 * ear.927.475 22.58 <2e-6 *** Resdual standard error:.572 on 235 degrees of freedom a) G estmater for parameterne og Fra utskrften ser v at estmatet for ˆ 3. 7, og ˆ. 92. og tolknng av estmatene for parameterne og, x y ˆ vser hvor regresjonslgnnga skjærer y-aksen. Hvs øretermometer og sentraltemperaturen vste det samme (som de deelt sett burde gjøre), vlle denne vært. At ˆ >, vser at sentraltemperaturen er ltt høyere enn øretemperaturen. Tlsvarende vser ˆ stgnngstallet tl regresjonslnja. Igjen, hvs øretermometer og sentraltemperaturen vste det samme (som de deelt sett burde gjøre), vlle denne vært. og sett opp hypotesene de hypotesetestene som reflekteres de to første p-verdene utskrften. H: β =, mot H: β (p-verd.4) og H: β =, mot H: β (p-verd <.)

b) Lag et 95% predksjonsntervall for sentraltemperaturen når øretemperaturen vser 38 ºC.

c) Dfferansene mellom målngene av sentraltemperaturen og øretemperaturen hadde et gjennomsntt på.78 ºC og et standardavvk på.52 ºC. Beregn et 95% konfdensntervall for forventet forskjell på de to målemetodene, og kommentér svaret. Både regresjonsanalysen tdlgere oppgaven og konfdensntervallet vser at det er en statstsk sgnfkant forskjell på øretemperaturen og sentraltemperaturen, mer spesfkt at sentraltemperaturen (den rktge temperaturen) er høyere enn det øretemperaturen vser. Det er derfor grunn tl å være forsktg med å bruke øretemperatur, speselt hvs man har med krtsk syke pasenter å gjøre, eller pasenter som kke tåler å ha høy feber.