Multippel lineær regresjon
|
|
|
- Margit Kristoffersen
- 9 år siden
- Visninger:
Transkript
1 Multippel lineær regreson Pål Romundstad Regreson Regression is the fitting of a function to a set of observations Det er minst to variabler involvert som kan deles i to hovedtyper: X-variablene (de uavhengige variablene, kovariater, prediktorer) en respons variabel Y (den avhengige variabelen) Y variablene er den observerte responsen til X-variablene slik at de danner parede data punkter Ett eksempel Gestasonsalder: Tid mellom starten av svangerskap ( eg. 1 dag siste mens ) og fødsel Normalt=280 dager eller 40 uker Hvor mye endrer fødselsvekt seg med økende gestasonsalder? Litt data Målinger av fødselsvekt og gestasonsalder ved fødsel Gestasonsalder Fødselsvekt Scatterplot m/ mer data Ideen: en rett line birth weight (gram) birth weight (gram) gestational age (days) gestational age (days) 1
2 Ideen: en rett line Modell- en rett line Kontinuerlig utkom y = konstant + regr.koeff*x + error birth weight (gram) modell: y = a0 + b1 x + e y = utkom - avhengig var. x = kovariat - uavhengig var. e = error, residual Enkel lineær regreson, en X-variable: y=a 0 + b 1 *x + e gestational age (days) Multippel lineær regreson - en teknikk for å estimere den linære sammenehengen mellom en avhengig variabel og to eller flere uavhengige variabler Synonym: Multivariabel univariat regreson Multivariabel vs multivariat Forklaringsvariabler (X-variabler, uavhengige variabler) Univariabel- en forklaringsvariabel Multivariabel- flere forklaringsvariabler Utkom-variabler (Y-variabler, avhengige variabler) Univariat en utkom variabel Multivariat-flere utkom variabler Variablene i lineær regreson Y-variabelen: normalfordelt ved gitt X X-variablene faste, ikke tilfeldige, gitt på forhånd deres fordeling har ingen betydning for vurdering av usikkerhet (unntak: random-effects models) Representason av X-er (eks X 1 =alder) kontinuerlig (X 1 = 20-80) polynomer: X 1 og X 1 2 etc. dikotom: X 1 = 1 for ung (<40) og X 1 = 0 for gammel (>=50) ordinale kategorier, 10 års-grupper, X 1 = 1,2,3,4,5,6 indikatorvariabler (dummy) for hver kategori Multivariabel lineær regreson ML-regreson kan ses på som en utvidelse av enkel lineær regreson til situasoner der en har to eller flere uavhengige variabler og en avhengig variabel To uavhengige variabler: y = α + ß 1 x 1 +ß 2 x 2 + e Generelt : k y = α + β x + e =1 Hvor e er normalfordelt med g.snitt = 0 og varians = σ 2 2
3 Multivariabel lineær regreson k y = α + β x + e =1 Parameterene Ι, ß 1, ß 2... ß k estimeres ved minste kavdrats metode Residual er avstanden fra en observason av Y til regresonsplanet Eksempel-spss 2-uavhengige variable-fødselsvekt ß, J= 1,2,3 k kalles regresonskoeffisienter= effektmål ß representerer den predikerte økningen i y per enhets økning i x, når alle andre variable holdes konstant (etter ustering for alle variablene i modellen) = effektmål Hvis det er en sterk sammenheng mellom de uavhengige variablene vil de partielle regresonskoefffisientene kunne bli svært forskellig fra koeffisientene en får ved enkel lineær regreson Regresonskoeffisientene gir et estimat av Y gitt x 1, x 2, x Hensikt med multippel lineær regreson Beskrive sammenhenger - estimering Estimere sammenheng mellom Y og spesifikk X ustert for andre X variable som mulige konfundere Predikson Predikson av Y basert på flere uavhengige variabler (X-er) Innebærer at en generer en modell som bør testes (valideres) i uavhengig datasett Predikson Bruke mest mulig bakgrunnsinformason Bruker x-variabler til å predikere ( gette ) Y-verdier Ingen grunn til å spare på antall X-er Det bør imidlertid være minst 10 ganger flere observasoner (målinger av Y-variabelen) enn antall forklaringsvariabler (X-er) Modellen evalueres etter prediksonsstyrke: Hvor god modellen er til å predikere Y, -forklart varians La gerne flere aktuelle modeller konkurrere Occam s razor: Av to modeller som passer like godt til dataene er den enkleste den beste Predikson Hensikt med multippel lineær regreson Ved predikson kan en vurdere å bruke stepwise-prosedyrer: Forskellige variables inkluderes (forward) eller fernes (backwards) på bakgrunn av hvor betydningsfylle de er i modellen I SPSS brukes p-verdi, men bedre å benytte seg av en likelihood ratio test for å vurdere betydning av en variabel i modellen Ha kontroll selv Prediksonsmodeller bør evalueres/valideres i uavhengige datasett Beskrive sammenhenger - estimering Estimere sammenheng mellom Y og spesifikk X ustert for andre X variable som mulige konfundere Predikson Predikson av Y basert på flere uavhengige variabler (X-er) Innebærer at en generer en modell som bør testes (valideres) i uavhengig datasett 3
4 Beskrive sammenheng-estimere Finne en modell som gir en tolkning av sammenhengen mellom X og Y med ustering for andre X-er (kovariater, confoundere) Justere for konfundere Justere for andre uavhengige variable når disse kan betraktes som konfundere Effekten av en utenforliggende variabel blander seg med effekten av X-variabelen man ønsker å studere En annen uavhengig variabel (en mulig konfounder) er assosiert med både den aktuelle uavhengige variabelen og den avhengige variabelen, men er ikke en del av årsakskeden mellom aktuelle uavhengige variabelen og den avhengige variabelen Er variabelen en del av årsakskeden (intermediær variabel) kan en risikere å ustere bort sammenhengen Justering-kontrollere for konfundere Multivariable modeller Mer enn 1 forklaringsvariabel i modellen Ved å ha med 2 forklaringsvariable vil effekten av de usteres for hverandre (gensidig ustering av effekt) Regresonen beregner effekten av den ene når den andre holdes konstant og vice versa Beskrive sammenheng Bruk Enter-prosedyren (bestem selv hvilke uavhengige variabler som skal inkluderes i modellen) Ikke p-verdi som bestemmer hvilke variable det er fornuftig å ha med i modellen, men biologisk kunnskap om sammenhengen som studeres. Modellen bør stemme overens med tidligere erfaring og kunnskap Husk! Intermediære variabler i årssaks-keden er ikke konfundere Bare ( etablerte ) risikofaktorer eller markører for risikofaktorer er reelle confoundere X-variable som ikke er signifikante i univariable analyser kan være av betydning i multivariable-analyser Forutsetninger multippel lineær regreson Sekking av forutsetninger multippel lineær regreson Uavhengige residualer (Observasonene av Y er uavhengige) Normalfordelte residualer Varians til Y er konstant og lik for alle verdier av X-ene Lineær sammenheng mellom X-er og Y Avvik fra modellantagelse kan medføre feilaktige konklusoner Scatterplot (X mot Y) for aktuelle variabler (lineæritetsantagelse, konstant varians) Residualplot (Y observert minus Y predikert verdi) Generelt skal residualet være ukorrelert med andre størrelse og plot skal vise tilfeldig spredning rundt regresonen. Spesielle mønstre indikerer avvik fra antagelser Normalitetsplott av residual 4
5 Violations of assumptions Scatterplot Non linear effects Transform the X variable Non-constant variance Use robust SE res gest p weight gest Birth weigth Influence Regression without outlier Regression with outlier Outlier Gestational age Prosedyrer ved avvik fra MLRforutsetninger Avvik fra normalfordeling for residualer transformason av Y variabel aktuelt (vanligst: ln transformason ved lange haler mot høyre) Andre transformasoner: 1/x, X,1/1-x, cos Robust SE Avvik fra linearitetsantagelse transformason av X/Y variabel aktuelt kategorisere X ( dummy variable som indikatorvariabel) Polynomisk regreson y = α + ß 1 x 1 + ß 2 x 12 + ß 3 x 1 3 Ved transformason endres tolkning av regresonskoeffisientene da skalaen endres Ikke alltid at transformason gir bedre tilnærming Transformasoner Additive vs. multiplikative modeller Y = a 0 + a 1 X 1 + a 2 X 2,Y kan gå fra - til + ln(y) = a 0 + a 1 X + a 2 Z (a 0 + a 1 X + A 2 z) som tilsvarer Y = e Additiv modell: Y = a 0 + a 1 X 1 + a 2 X 2 Ved ln transformason av Y får vi: Multiplikativ modell: ln(y) = a 0 + a 1 X + a 1 X 2 Her kan Y bare være et positivt tall (>0) Modellen går fra additiv til multiplikativ Y = e (a 0 + a 1 X 1 + a 2 X 2 ) = e a 0 e a 1 X 1 e a 2 X 2 Regresonskoeffisienten representerer prosentvis økning i Y 5
6 Sterkt korrelerte X-variablekolinearitet Ved sterkt korrelerte uavhengige variable er det problematisk å inkludere de i samme modell (regr.koeff. blir dårlig estimert, standardfeilen og p-verdien stiger) Før en putter uavhengige variable inn i modellen bør en derfor sekke korrelasonen mellom de uavhengige variablene (Korrelasonsmatrise) Ved sterk korrelason mellom X-variable, bør en bare inkludere en av disse i modellen (velge ut en) Forklart varians, R 2 R 2 indikerer andelen av variansen (variasonen) i y som kan forklares av regresonen R 2 =1 indikerer at all variasonen forklares av regresonen Hvis en har mange uavhengige variable i modellen og få observasoner, vil en kunne få en kunstig høy R 2 (såkalt mettet modell) Tommelfingerregel: antall observasoner bør være 10 ganger flere en antall uavhengige variable i modellen Justert R 2 tar hensyn til antall uavhengige variable Modellen kan være god selv om R 2 er lav Dummy variable Hvis x-variabel er diskret (nominal) kan en lage såkalt dummy variable eller kategoriserte indikatorvariable f.eks nasonalitet (norsk, spansk, fransk) kan inkluderes i en multivariat-modell ved å lage to nye binære (0,1) variable (den trede nasonaliteten er gitt av de to andre når begge disse er 0) Z norsk =1 når nasonalitet er norsk, ellers =0 Z spansk =1 når nasonalitet er spansk, ellers =0 fransk er automatisk gitt ved at både norsk og spansk =0, og fungerer som en referansekategori Stratifisering Stratifiserte analyser er separate analyser av undergrupper i materialet Stratifiserte analyser bør foretas ved mistanke om at sammenhengen som studeres mellom en uavhengig variabel og en avhengig variabel kan være forskellig for for ulike nivå av en trede variable ß-koeffisientene er forskellige for ulike nivå av en trede variabel F.eks for hvert kønn, i forskellige aldersgrupper osv... Interakson Interakson Et alternativ til stratifisering når sammenhengen som studeres kan være forskellig for ulike nivå av en trede variable, er å lage såkalte interaksonsledd (produktet av to uavhengige variabler) y = ß 0 + ß 1 x 1 + ß 2 x 2 + ß 3 x 1 *x 2 + e Interaksonsleddet beskriver endring av sammenhengen mellom en uavhengig variabel(y) og en avhengig variabel (x 1 ) over en trede variabel (x 2 ) Et alternativ til stratifisering når sammenhengen som studeres kan være forskellig for ulike nivå av en trede variable, er å lage såkalte interaksonsledd (produktet av to uavhengige variabler) y = ß 0 + ß 1 x 1 + ß 2 x 2 + ß 3 x 1 *x 2 + e Interaksonsleddet beskriver endring av sammenhengen mellom en uavhengig variabel(y) og en avhengig variabel (x 1 ) over en trede variabel (x 2 ) 6
7 Workflow Scatterplots Bivariate analysis (correlations, simple regression) Regression Model fitting Cofactors in/out Interactions Test of assumptions Independent errors Linear effects Constant error variance Advarsel Multippel regreson er ingen universell vidundermetode Vær på vakt ved tidserieanalyser (avhengige residualer/konfounding) repeterte målinger på samme individ (avhengighet) distinkte subgrupper-uteliggere Forutsetter kennskap til fenomenet som studeres Beskriver statistiske sammenhenger, ikke nødvendigvis årsakssammenhenger Alle modeller er gale, noen er brukbare Influence (robustness) 7
Multippel lineær regresjon
Regresjon Multippel lineær regresjon Inger Johanne Bakken Enhet for anvendt klinisk forskning, NTNU Og Avdeling for forebyggende helsearbeid, SINTEF Tilpasse en funksjon til ett sett observasjoner Minst
10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.
Multippel regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Det er fortsatt en responsvariabel y. Måten dette gjøre på er nokså
Lineær regresjon. Respons y Outcome Endepunkt Avhengig variabel Output-variabel Endogen variabel
Lineær regresjon Regresjonsanalyse: Analyse av smh mellom to eller flere variabler; der den ene er definert som respons og en eller flere andre er definert som forklaringsvariabler. Respons y Outcome Endepunkt
regresjonsmodeller multippel logistisk regresjon logistisk regresjon prediksjon vs assosiasjon den logistisk funksjonen (2)
Innføring i medisinsk statistikk del 2 regresjonsmodeller Hvorfor vil man bruke regresjonsmodeller? multippel logistisk regresjon. predikere et utfall (f.eks. sykdom, død, blodtrykk) basert på et sett
Lineær regresjon: introduksjon
Lineær regresjon: introduksjon Funksjon y f (x) Mengden mat (i gram) man lager til middag = Lineær funksjon (oppskrift) Scatter-plott 1 (oppskrift) y x 1 Page 1 of 15 Lineær funksjon (reell situasjon)
Prøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
Generelle lineære modeller i praksis
Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige
PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014
Psykologisk institutt PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014 Skriftlig skoleeksamen fredag 2. mai, 09:00 (4 timer). Kalkulator uten grafisk display og tekstlagringsfunksjon
Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.
Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav. Analyse av endringsskårer (change scores). Vi så forrige gang på analyser
TMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x
Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren
Kort overblikk over kurset sålangt
Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente
Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger
Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives
Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
Inferens i regresjon
Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons
Eksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)
Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Beskrive fordelinger (sentraltendens, variasjon og form): Observasjon y i Sentraltendens
Forelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
Fasit og løsningsforslag STK 1110
Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),
Eksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: August 2016 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte
Introduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y
Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall
HØGSKOLEN I STAVANGER
EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN
Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger
Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved
Oppgave N(0, 1) under H 0. S t n 3
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1
Eksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 30. mai 2014 Eksamenstid (fra til): 09:00-13:00
Eksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 3. juni 2016 Eksamenstid (fra til): 09:00-13:00
år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9
TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører
Høye skårer indikerer høye nivåer av selvkontroll.
Psykologisk institutt PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2015 Skriftlig skoleeksamen tirsdag 19. mai, 09:00 (4 timer) Resultater publiseres 10. juni Kalkulator
Lineære modeller i praksis
Lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y én eller flere uavhengige variabler:
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 9. oktober 2008. Tid for eksamen: 15:00 17:00. Oppgavesettet er på
Statistikk er begripelig
Statistikk er begripelig men man må begynne med ABC ANOVA ANOVA er brukt til å sammenligne gjennomsnittsverdier Slik er det, selv om det er Analysis of Variance man sier BIVARIAT Bivariat analyse er godt
Anvendt medisinsk statistikk, vår Repeterte målinger, del II
Anvendt medisinsk statistikk, vår 009 Repeterte målinger, del II Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald
Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"
Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt.
Gjør gjerne analysene under her selv, så blir dere mer fortrolige med utskriften fra Spss. Her har jeg sakset og klippet litt. Data fra likelonn.sav og vi ser på variablene Salnow, Edlevel og Sex (hvor
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK 1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 1. juni 2006. Tid for eksamen: 09.00 12.00. Oppgavesettet er på
Detaljerte forklaringer av begreper og metoder.
Appendiks til Ingar Holme, Serena Tonstad. Risikofaktorer og dødelighet oppfølging av Oslo-undersøkelsen fra 1972-73. Tidsskr Nor Legeforen 2011; 131: 456 60. Dette appendikset er et tillegg til artikkelen
Appendiks 5 Forutsetninger for lineær regresjonsanalyse
Appendiks 5 Forutsetninger for lineær regresjonsanalyse Det er flere krav til årsaksslutninger i regresjonsanalyse. En naturlig forutsetning er tidsrekkefølge og i andre rekke spiller variabeltype inn.
Medisinsk statistikk Del I høsten 2009:
Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X
Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Målform/språk: Bokmål Antall sider: 10. Psykologisk institutt
1 Psykologisk institutt Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder Faglig kontakt under eksamen: Christian Klöckner Tlf.: 73 59 19 60 Eksamensdato:11.12.014 Eksamenstid
Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal
EKSAMEN Emnekode: SFB12016 Dato: 06.06.2019 Hjelpemidler: Godkjent kalkulator Emnenavn: Metodekurs II: Samfunnsvitenskapelig metode og anvendt statistikk Eksamenstid: 09.00-13.00 Faglærer: Bjørnar Karlsen
Eksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 16. mai 2015 Eksamenstid (fra til): 09:00-13:00
Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal
EKSAMEN Emnekode: SFB12016 Dato: 18.12.2018 Hjelpemidler: Godkjent kalkulator Emnenavn: Metodekurs II: Samfunnsvitenskapelig metode og anvendt statistikk Eksamenstid: 09.00-13.00 Faglærer: Bjørnar Karlsen
Løsningsforslag eksamen 25. november 2003
MOT310 Statistiske metoder 1 Løsningsforslag eksamen 25. november 2003 Oppgave 1 a) Vi har µ D = µ X µ Y. Sangere bruker generelt trapesius-muskelen mindre etter biofeedback dersom forventet bruk av trapesius
TMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,
Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)
TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,
MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl
MASTER I IDRETTSVITENSKAP 2018/2020 Individuell skriftlig eksamen i STA 400- Statistikk Mandag 18. mars 2019 kl. 10.00-12.00 Eksamensoppgaven består av 5 sider inkludert forsiden Sensurfrist: 8.april 2019
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne
Logistisk regresjon 2
Logistisk regresjon 2 SPSS Utskrift: Trivariat regresjon a KJONN UTDAAR Constant Variables in the Equation B S.E. Wald df Sig. Exp(B) -,536,3 84,56,000,25,84,08 09,956,000,202 -,469,083 35,7,000,230 a.
Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.
Kapittel 2 Utforske og beskrive data Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.4 denne uken To kryssplott av samme datasett, men med forskjellig skala
SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005
SOS1120 Kvantitativ metode Regresjonsanalyse Forelesningsnotater 11. forelesning høsten 2005 Per Arne Tufte Lineær sammenheng I Lineær sammenheng II Ukelønn i kroner 4000 3500 3000 2500 2000 1500 1000
TMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar
Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir
UNIVERSITETET I OSLO
Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13. oktober 2010. Tid for eksamen: 15:00 17:00. Oppgavesettet
Tilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.
SOS112 Kvantitativ metode Krysstabellanalyse (forts.) Forelesningsnotater 9. forelesning høsten 25 4. Statistisk generalisering Per Arne Tufte Eksempel: Hypoteser Eksempel: observerte frekvenser (O) Hvordan
Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder
Psykologisk institutt Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder Faglig kontakt under eksamen: Martin Rasmussen Tlf.: 73 59 19 60 Eksamensdato: 12.12.13 Eksamenstid
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet. Eksamen i STK3100 Innføring i generaliserte lineære modeller Eksamensdag: Mandag 6. desember 2010 Tid for eksamen: 14.30 18.30 Oppgavesettet
EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 BOKMÅL EKSAMEN I FAG TMA4255 ANVENDT STATISTIKK Onsdag
Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse
Forelesning 4 Regresjonsanalyse To typer bivariat analyse: Bivariat tabellanalyse: Har enhetenes verdi på den uavhengige variabelen en tendens til å gå sammen med bestemte verdier på den avhengige variabelen?
Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk
Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Oppgave 1 a) Normalantakelse: Målingene x 1,..., x 21 og y 1,..., y 8 betraktes som utfall av tilfeldige variable X 1,..., X 21
Eksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 20. desember 2016 Eksamenstid (fra til): 09:00
Løsningsforslag eksamen STAT100 Høst 2010
Løsningsforslag eksamen STAT100 Høst 2010 Oppgave 1 a) To-utvalg, parvise data. La Y være tilfeldig variabel som angir antall drepte i periode 1 og tilsvarende X for periode 2. Vi antar parvise avhengigheter
EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 BOKMÅL EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE
Til bruk i metodeundervisningen ved Høyskolen i Oslo
MINIMANUAL FOR SPSS Til bruk i metodeundervisningen ved Høyskolen i Oslo Denne minimanualen viser hvordan analyser i metodeundervisningen på masternivå (master i sosialt arbeid, master i familiebehandling
LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 10 LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Oppgave 1 Oljeleting a) Siden P(A
Logistisk regresjon 1
Logistisk regresjon Hovedideen: Binær logistisk regresjon håndterer avhengige, dikotome variable Et hovedmål er å predikere sannsynligheter for å ha verdien på avhengig variabel for bestemte (sosiale)
Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ
Institutt for psykologi Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ Faglig kontakt under eksamen: Odin Hjemdal Tlf.: 73 59 19 60 Eksamensdato: 15. mai 2017 Eksamenstid: 09:00-13:00 Hjelpemiddelkode/Tillatte
Eksamensoppgave i ST3001
Det medisinske fakultet Institutt for kreftforskning og molekylær medisin Eksamensoppgave i ST3001 fredag 25. mai 2012, kl. 9.00 13:00 Antall studiepoeng: 7.5 Tillatte hjelpemidler: Kalkulator og alle
Repeated Measures Anova.
Repeated Measures Anova. Vi bruker oppgave-5 som eksempel. I en evalueringsstudie av en terapeutisk intervensjon valgte man et pre-post med kontrollgruppe design. Alle personer ble undersøkt tre ganger
Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:
Repeterte målinger Eirik Skogvoll 1.amanuensis dr.med. Enhet for anvendt klinisk forskning (AKF) Det medisinske fakultet, februar 2008 1 Repeterte målinger Mer eller mindre synonymt med... Repeated measurements
Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ
Psykologisk institutt Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ Faglig kontakt under eksamen: Odin Hjemdal Tlf.: Psykologisk institutt 73 59 19 60 Eksamensdato: 23.5.2013 Eksamenstid (fra-til):
SOS3003 Eksamensoppgåver
SOS3003 Eksamensoppgåver Gjennomgang våren 2004 Erling Berge Gjennomgang av Oppgåve 1 gitt hausten 2003 Haust 2003 Oppgåve 1 Den avhengige variabelen i regresjonsanalysen er en skala (indeks) for tillit
TMA4240 Statistikk 2014
TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten
Forelesning 17 Logistisk regresjonsanalyse
Forelesning 17 Logistisk regresjonsanalyse Logistiske regresjons er den mest brukte regresjonsanalysen når den avhengige variabelen er todelt Metoden kan brukes til å: teste hypoteser om variablers effekt
Kapittel 3: Studieopplegg
Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere
HØGSKOLEN I STAVANGER
EKSAMEN I: MOT310 STATISTISKE METODER VARIGHET: 4 TIMER DATO: 27. FEBRUAR 2004 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 5
Eksamensoppgåve i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgåve i TMA4240 Statistikk Fagleg kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.
EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir forlag) OPPGAVESETTET
Forelesning 9 STK3100/4100
p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med
Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse
Netto innfl. Befolkning og velferd ECON 1730, H2016 Regresjonsanalyse Problem: Gitt planer for 60 nye boliger i kommunen neste år, hvor mange innflyttere kan vi forvente? Tabell Vestby kommune Nye boliger
TMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
