Kp. 12 Multippel regresjon

Størrelse: px
Begynne med side:

Download "Kp. 12 Multippel regresjon"

Transkript

1 Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction 122 Estimating the Coefficients 123 Linear Regression Model Using Matrices 124 Properties of the Least Squares Estimators 125 Inferences in Multiple Linear Regression 126 Choice of a Fitted Model Through Hypothesis Testing 128 Categorial or Indicator Variables 129 Sequential Methods for Model Selection 1213 Potential Misconceptions (127, 1210, 1211 og 1212 er ikke med i pensum) Bjørn H Auestad Kp 11: Regresjonsanalyse 2 / 46

2 Kp 12 Multippel ; introduksjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Eksempel 121 (i boken): Nitrogenoksydutslipp (y i )fra dieselmotor Regner med at det avhenger av luftfuktighet (x 1i ), temperatur (x 2i ) og trykk (x 3i ) Har gjort målinger (n =20) under ulike (eksperiment)betingelser: Bjørn H Auestad Kp 11: Regresjonsanalyse 3 / 46 Kp 12 Multippel ; introduksjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Spredningsdiagram (én-om-gangen): Det kan synes som om alle x-variablene har sammenheng? Bjørn H Auestad Kp 11: Regresjonsanalyse 4 / 46

3 Kp 12 Multippel ; introduksjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Modell som kan være aktuell: Y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + ɛ i, i =1,,20 Forventning: E(Y i x 1i,x 2i,x 3i )=μ Y x1i,x 2i,x 3i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i β j : endring i E(Y i x 1i,x 2i,x 3i ) når x ji endres én enhet ɛ i : Forventing null, varians σ 2 Hvorfor ikke bruke tre analyser med enkel lineær? Bjørn H Auestad Kp 11: Regresjonsanalyse 5 / 46 Kp 12 Multippel ; introduksjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Generelt: Multippel lineær smodell: Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i, i =1,,n k uavhengige variable (forklaringsvariable) E(Y i x 1i,,x ki )=μ Y x1i,,x ki = β 0 + β 1 x 1i + + β k x ki E(ɛ i )=0, Var(ɛ i )=Var(Y i )=σ 2 (uavh av x j ene) Hvordan estimere β j ene? Hvordan estimere støyvariansen σ 2? Bjørn H Auestad Kp 11: Regresjonsanalyse 6 / 46

4 Estimering Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Data: (x 11,,x k1,y 1 ),,(x 1n,,x kn,y n ) Vi bruker dataene til å estimere de ukjente: β 0,β 1,,β k Estimert slinje: ŷ = b 0 + b 1 x b k x k Residual: e i = y i ŷ i = y i (b 0 + b 1 x 1i + + b k x ki ) SSE = n e 2 i = n (y i ŷ i ) 2 = n { yi (b 0 + b 1 x 1i + + b k x ki ) } 2 Metode: Velg b 0, b 1,,b k (konstantledd og stigningstallene) slik at SSE blir minimert! s i boken Bjørn H Auestad Kp 11: Regresjonsanalyse 7 / 46 Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Modell for n observasjoner: Matriseform: Y = Xβ + E, der Y = Y 1 Y n, X = Y 1 = β 0 + β 1 x β k x k1 + ɛ 1 Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i Y n = β 0 + β 1 x 1n + + β k x kn + ɛ n 1 x 11 x k1 1 x 1n x kn, β = β 0 β 1 β k og E = ɛ 1 ɛ n Bjørn H Auestad Kp 11: Regresjonsanalyse 8 / 46

5 Bruk av Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Matrisehjelp, produkt Feks har vi: Xβ = 1 x 11 x k1 1 x 1n x kn Matrisehjelp, transponering [ a b c d e f ] T a = b c β 0 β 1 β k d e f = β 0 + β 1 x β k x k1 β 0 + β 1 x 1i + + β k x ki β 0 + β 1 x 1n + + β k x kn og (AB) T = B T A T Bjørn H Auestad Kp 11: Regresjonsanalyse 9 / 46 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Minimering av SSE på matriseform: Da: SSE = datavektor: y = y 1 y n, og b = n { yi (b 0 + b 1 x 1i + + b k x ik ) }2 = = (y Xb) T (y Xb)= [e 1,,e n ] b 0 b 1 b k n (e i ) 2 = (y T b T X T )(y Xb) =y T y y T Xb b T X T y + b T X T Xb e 1 e n = y T y 2b T X T y + b T X T Xb Bjørn H Auestad Kp 11: Regresjonsanalyse 10 / 46

6 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt e 1 e 2 (y Xb) =, e n fordi: y 1 1 x 11 x k1 b 0 e 1 y 2 (y Xb) = 1 x 12 x k2 b 1 = e 2 y n 1 x 1n x kn b k e n Bjørn H Auestad Kp 11: Regresjonsanalyse 11 / 46 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Med matrisehåndtering får vi enkelt resultatet: SSE b = SSE b 0 SSE b 1 SSE b k = 2X T y +2X T Xb SSE b = 2XT y +2X T Xb = 0 b = ( X T X ) 1 X T y X T X er invertibel dersom X har rang k +1 Dette krever at n k +1og at ingen av x-variablene er en lineærkombinasjon av de andre Bjørn H Auestad Kp 11: Regresjonsanalyse 12 / 46

7 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Forklaring Vi ønsker å løse ligningssettet: SSE b j = b j = 2 n { yi (b 0 + b 1 x 1i + + b k x ki ) } 2 n { yi (b 0 + b 1 x 1i + + b k x ki ) } x ji = 2 ( n y i x ji = 2 { n y i x ji n b 0 x ji n (b 0 + n b 1 x 1i x ji k } b l x li )x ji l=1 n ) b k x ki x ji = 0, j =0, 1, 2,,k (x 1i =1) Bjørn H Auestad Kp 11: Regresjonsanalyse 13 / 46 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Dette kan skrives slik: 2X T y +2X T Xb = 0, fordi: y n 1 y i X T x 11 x 12 x 1n y 2 n y = = y ix 1i, x k1 x k2 x kn y n n y ix ki og b 0 + k j=1 X T x 11 x 12 x 1n b jx j1 b 0 + k j=1 Xb = b jx j2 x k1 x k2 x kn b 0 + k j=1 b jx jn n ( b0 + k j=1 b ) jx ji n ( b0 + k j=1 = b ) jx ji x1i n ( b0 + k j=1 b ) jx ji xki Bjørn H Auestad Kp 11: Regresjonsanalyse 14 / 46

8 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Eksempel, dieselmotordata: Regresjonslinje (?): ŷ i = x 1i +0001x 2i +0154x 3i Fortolkning: Bjørn H Auestad Kp 11: Regresjonsanalyse 15 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction 122 Estimating the Coefficients 123 Linear Regression Model Using Matrices 124 Properties of the Least Squares Estimators 125 Inferences in Multiple Linear Regression 126 Choice of a Fitted Model Through Hypothesis Testing 128 Categorial or Indicator Variables 129 Sequential Methods for Model Selection 1213 Potential Misconceptions (127, 1210, 1211 og 1212 er ikke med i pensum) Bjørn H Auestad Kp 11: Regresjonsanalyse 16 / 46

9 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Multippel lineær smodell: Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i, På matriseform: Y = Xβ + E, eller: Y 1 Y 2 Y n = 1 x 11 x k1 1 x 12 x k2 1 x 1n x kn β 0 β 1 β k + i =1,,n ɛ 1 ɛ 2 ɛ n Bjørn H Auestad Kp 11: Regresjonsanalyse 17 / 46 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Minstekvadraters estimatene av β 0,β 1,,β k : b = ( X T X ) 1 X T y Minstekvadraters estimatorene av β 0,β 1,,β k : β = ( X T X ) 1 X T Y Vi må undersøke de statistiske egenskapene til estimatorene Først litt generelt angående egning med forventning og varians Bjørn H Auestad Kp 11: Regresjonsanalyse 18 / 46

10 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Generelt i forbindelse med vektorer og : Dersom V er en vektor av tilfeldige variable, så definerer vi: E(V 1 ) E(V) = E(V n ), Var(V) = Dersom A (m n) er en konstantmatrise, så gjelder: E(AV)=AE(V) Var(AV)=AVar(V)A T V = V 1 V n Var(V 1 ) Cov(V 1,V 2 ) Cov(V 1,V n ) Cov(V n,v 1 ) Cov(V n,v 2 ) Var(V n ) A = a 11 a 12 a 1n a m1 a m2 a mn Bjørn H Auestad Kp 11: Regresjonsanalyse 19 / 46 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Egenskaper til estimatorene: β = ( X T X ) 1 X T Y E( β) = ( X T X ) 1 X T E ( Y ) (E(Y) =E(Xβ + E) =Xβ) = ( X T X ) 1 X T Xβ = β { (X Var( β) = Var T X ) } 1 X T Y = σ 2( X T X ) 1 = σ 2 C Dvs: β er forventingsrett for β Matrisen C = ( X T X ) 1 beregnes vanligvis av statistikkprogrammet Bjørn H Auestad Kp 11: Regresjonsanalyse 20 / 46

11 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Egenskaper til estimatorene: Var( β j )=σ 2 c jj, der C = c 00 c 01 c 0k c 10 c 11 c 1k c k0 c k1 c kk og matrisen C beregnes av statistikkprogrammet = ( X T X ) 1, Vanligvis blir verdi av S 2 c jj som estimat av variansen til β j vist, se eksempel Bjørn H Auestad Kp 11: Regresjonsanalyse 21 / 46 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Eksempel, dieselmotordata: Feks, estimert verdi av: Var( β 1 )=σ 2 c 11 er (Det er valigvis kun dette (verdiene i kollonnen Standard Error ) vi trenger Hele matrisen skrives vanligvis ikke ut) Bjørn H Auestad Kp 11: Regresjonsanalyse 22 / 46

12 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Forventningsrett estimator for Var(ɛ i )=σ 2 (Teorem 121): σ 2 = S 2 = = Estimat beregnes vha: Matriseuttrykk: S 2 = 1 n k 1 1 n k 1 n ( Yi Ŷi) 2 n { Yi ( β 0 + β 1 x 1i + + β k x ki ) } 2 SSE n k 1 SSE n k 1 = 1 n k 1 (når MK-estimatene er innsatt i SSE) n ( Yi Ŷi) 2 = (Y X β) T (Y X β) n k 1 (Kan vise at (n k 1)S2 σ 2 χ 2 n k 1 og uavhengig av β) Bjørn H Auestad Kp 11: Regresjonsanalyse 23 / 46 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Inferens om β j : Vikanviseat: βj N(β,σ 2 c jj ) og at β j β j S 2 c jj t(n k 1) Dette brukes til å lage hypotesetester og/eller konfidensintervall for β j Eks, dieselmotordata Coefficients Standard Error t Stat P-value Intercept -3,5078 3,0049 0,2602 x 1 (hum) -0,0026 0,0007 0,0010 x 2 (temp) 0,0008 0,0020 0,7012 x 3 (trykk) 0,1542 0,1014 0,1478 Oppgave: Beregn T obs og 95% konfint for β 0, β 1, β 2 og β 3 Bjørn H Auestad Kp 11: Regresjonsanalyse 24 / 46

13 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Eks, dieselmotordata Coefficients Standard Error t Stat P-value Intercept -3,5078 3,0049 0,2602 x 1 (hum) -0,0026 0,0007 0,0010 x 2 (temp) 0,0008 0,0020 0,7012 x 3 (trykk) 0,1542 0,1014 0,1478 Hvilke (om noen) x-variable har sammenheng med y en?? Vi vil gjennomføre testene H 0 : β i =0mot H 0 : β i 0, i =1, 2, 3 Hvordan? Bjørn H Auestad Kp 11: Regresjonsanalyse 25 / 46 Konfidensintervall Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Inferens om μ Y x 0 = E(Y x 0 ): (x T 0 =[1,x 10,,x k0 ]) μ Y x 0 = β 0 + β 1 x β k x k0 = x T 0 β Estimator: μ Y x 0 = β 0 + β 1 x β k x k0 = x T 0 β Vi finner at: E( μ Y x 0 )=β 0 +β 1 x β k x k0 og Var( μ Y x 0 )=Var(x T 0 β) = = σ 2 x T 0 Cx 0 Det kan vises at: μ Y x 0 μ Y x 0 S 2 x T 0 C x 0 t(n k 1) Brukes til å lage hypotesetester / konfidensintervall for μ Y x0 Oppgave: dieselmotordataene; Lag et 95% konfidensintervall for forventet nitrogenoksydmengde ved forholdene x 1 =50, x 2 =75og x 3 =293 Det oppgis at x T 0 C x 0 =00688 og at estimat av σ 2 er: Bjørn H Auestad Kp 11: Regresjonsanalyse 26 / 46

14 Prediksjonsintervall Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Prediksjonsintervall for Y 0, (Y -utfall for x = x 0 ): Y 0 = β 0 + β 1 x β k x k0 + ɛ 0 Estimator: Ŷ0 = β 0 + β 1 x β k x k0 = μ Y x 0 Vi betrakter Ŷ0 Y 0 = μ Y x 0 Y 0 Egenskaper: E( μ Y x 0 Y 0 )=0 og Var( μ Y x 0 Y 0 )=σ 2( 1+x T 0 C x 0 ) Det kan vises at: μ Y x 0 Y 0 S 2( 1+x T0 C x 0 ) t(n k 1) Brukes til å lage prediksjonsintervall for Y 0 Et(1 γ) 100% predint for Y 0 : ( μ Y x 0 t γ/2,n k 1 S 2( 1+x T0 C x 0 ), μy x 0 + t γ/2,n k 1 S 2( 1+x T0 C x 0 ) ) Oppgave: dieselmotordataene; Lag prediksjonsintervall for Y 0 når x T 0 =[1, 50, 75, 293] Bjørn H Auestad Kp 11: Regresjonsanalyse 27 / 46 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt ANOVA-tabell lages også i multippel Eksempel: ANOVA-tabell for dieselmotordataene: Struktur: ANOVA df SS MS F Significance F Regression 3 0, , , ,00001 Residual 16 0, ,00315 Total 19 0,25298 Kilde fg SK GK F p-verdi Source df SS MS F p-value Regresjon k SSR Residual n k 1 SSE Total n 1 SST SSR k SSE n k 1 MSR MSE P (F >f obs ) Bruk? Bjørn H Auestad Kp 11: Regresjonsanalyse 28 / 46

15 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Også for multippel gjelder: n (Y i Y ) 2 = der Ŷ i = β 0 + β 1 x 1i + + β k x ki n (Y i Ŷi) 2 + SST = SSE + SSR, SSE n k 1 estimerer σ2 (= Var(Y i )=Var(ɛ i )) SSR k n (Ŷi Y ) 2 Modell: Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i estimerer σ 2,dersomβ 1 = β 2 = β k =0 E( SSR k ) >σ2 dersom minst én β j 0 Bjørn H Auestad Kp 11: Regresjonsanalyse 29 / 46 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Derfor bruker vi stor verdi av som indikasjon på at minst én β j 0 Dieselmotordataene: SSR / k SSE / n k 1 = MSR MSE, k n k 1 n 1 k n k 1 P (F >f ) Bjørn H Auestad Kp 11: Regresjonsanalyse 30 / 46

16 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Vi har at: Under H 0 : β 1 = β 2 = β k =0er: SST χ 2 σ 2 n 1 }{{} jf teorem 84 Test: Forkast H 0 dersom: F = SSR / σ k 2 SSE / = σ n k 1 2 SSE χ 2 σ 2 n k 1 }{{} jf kp 124 Med ANOVA-innfallsvinkelen tester vi: SSR χ 2 σ 2 k }{{} n 1=(n k 1)+(k) SSR / k SSE / n k 1 = MSR MSE f α,k,n k 1 H 0 : β 1 = β 2 = β k =0mot H 1 : minst en β j 0 Dvs: Test for om modellen samlet er av betydning Bjørn H Auestad Kp 11: Regresjonsanalyse 31 / 46 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Dieselmotordataene: Modellen samlet er åpenbart av betydning! Men ikke alle variablene synes å være signifikante? Hvordan kan vi undersøke dette nærmere? Bjørn H Auestad Kp 11: Regresjonsanalyse 32 / 46

17 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction 122 Estimating the Coefficients 123 Linear Regression Model Using Matrices 124 Properties of the Least Squares Estimators 125 Inferences in Multiple Linear Regression 126 Choice of a Fitted Model Through Hypothesis Testing 128 Categorial or Indicator Variables 129 Sequential Methods for Model Selection 1213 Potential Misconceptions (127, 1210, 1211 og 1212 er ikke med i pensum) Bjørn H Auestad Kp 11: Regresjonsanalyse 33 / 46 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Hvilke forklaringsvariable skal være med i modellen? Vi kan ha signifikant F samtidig som alle (!) T j = β j / S 2 c jj er ikke-signifikante Dette indikerer at kun et underutvalg av variablene bør være med i modellen Vi bør i slike situasjoner finne fram til en modell som har et underutvalg av alle forklaringsvariablene inkludert Hvordan? Bjørn H Auestad Kp 11: Regresjonsanalyse 34 / 46

18 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Ta ut variablene med ikke-signifikant T j = β j / S 2 c jj? (Dvs: β 2 og β 3 skal vekk) Obs: Estimater og p-verdier endres og derfor kan en slik framgangsmåte gi uheldig resultat Bjørn H Auestad Kp 11: Regresjonsanalyse 35 / 46 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt (Lite endringer i dette eksempelet) Bjørn H Auestad Kp 11: Regresjonsanalyse 36 / 46

19 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt R 2 som mål på hvilken modell som er best? R 2 = SSR SST =1 SSE SST R 2 utrykker hvor stor del av total variasjon en forklarer (På samme måte som i enkel lineær ) MEN: SSE kan ikke øke når flere x-variable tas med i modellen Problem: S 2 = økende k ( R 2 kan ikke avta) SSE, kan øke selv om SSE avtar med n k 1 Medfører mer usikre estimat, analyser og prediksjoner! Dersom i tillegg x-variable med sterk sammenheng (korrelasjon) tas inn i modellen, blir C =(X T X) 1 slik at Var( β j )=σ 2 c jj blir stor! Jf s 466, 467 i boken Bjørn H Auestad Kp 11: Regresjonsanalyse 37 / 46 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Bedre kriterium: R 2 justert = R2 adj Mulig strategi for modellvalg: Dieselmotordata Vi skal i tillegg se på stegvise prosedyrer =1 SSE/(n k 1) SST/(n 1) Velg den modellen som har størst R 2 justert mål med 3 x-variable med 2 x-variable R Rjustert Forlengs og baklengs utvelgelse Stegvis utvelgelse (kombinasjon av forlengs og baklengs) Bjørn H Auestad Kp 11: Regresjonsanalyse 38 / 46

20 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt To alternative modeller (den ene har en delmengde av x-variablene i forhold til den andre) kan sammenlignes vha SSR Vi ser på differanse i SSR Dersom vi vil sammenligne stor : Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i med redusert : der 1 <m k av x-variablene er utelatt, SSR stor SSR justert m kanvisepåstørrelsen S 2 Denne er F (m, n k 1)-fordelt dersom stor modell ikke er bedre enn redusert (de mβ j ene er alle null) Benyttes i stegvise prosedyrer Bjørn H Auestad Kp 11: Regresjonsanalyse 39 / 46 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Forlengs utvelgesle: Steg 1: β 0 og β (1) x (1) Steg 2: β 0, β (1) x (1) og vi skal bestemme: β (2) x (2) Ser på differanser i SSR: SSR(β (2) β 0,β (1) )=SSR(β 0,β (1),β (2) ) SSR(β 0,β (1) ) Velg den x-variabelen som har størst SSR(β (2) β 0,β (1) ) Vi forkaster H 0 : β (2) =0(dvs inkluderer i modellen) dersom F = SSR(β (2) β 0,β (1) ) SSE/(n 3) >f α,1,n 3 SSE/(n 3) = S 2 fra modell i steg 2 Fortsetter å ta inn variable til ingen gir forkastning Bjørn H Auestad Kp 11: Regresjonsanalyse 40 / 46

21 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Ved valg av modell må også vi også undersøke om modellforutsetningene synes å være tilfredsstilt for aktuell modell Vi må (ihvertfall) studere residualene (egentlig i kp 1210 som ikke er pensum (!), men ) e i = y i ŷ i = y i (b 0 + b 1 x 1i + + b k x ki ), i =1,,n Plott residualene, e i, mot hver av variablene x 1i,,x ki, mot ŷ i og mot i Residualene skal vise gjennomsnitt null, konsant varians og ikke noe mønster (indikerer uavhengighet) Lag også normalplott av residualene Bjørn H Auestad Kp 11: Regresjonsanalyse 41 / 46 Polynomisk Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Multippel lineær smodell: Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i, Modell for på polynom i x: Y i = β 0 + β 1 x i + β 2 x 2 i + + β k x k i + ɛ i, I praksis lager vi bare de nye variablene i =1,,n i =1,,n x ji x j i Bjørn H Auestad Kp 11: Regresjonsanalyse 42 / 46

22 Polynomisk Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Designmatrisen for polynomisk : Modell på matriseform: Y = Xβ + E, eller: Y 1 Y 2 Y n = X = 1 x 1 x 2 1 x k 1 1 x 2 x 2 2 x k 2 1 x n x 2 n x k n 1 x 1 x 2 1 x k 1 1 x 2 x 2 2 x k 2 1 x n x 2 n x k n β 0 β 1 β k + ɛ 1 ɛ 2 ɛ n Modellen er lineær i parameterene β 0,β 1,,β k Analysene blir som før! Bjørn H Auestad Kp 11: Regresjonsanalyse 43 / 46 Polynomisk Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Andreordens polynom for dataene fra oppgave 1141? Bjørn H Auestad Kp 11: Regresjonsanalyse 44 / 46

23 Polynomisk Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Andreordens polynom for dataene fra oppgave 1141? Bjørn H Auestad Kp 11: Regresjonsanalyse 45 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction 122 Estimating the Coefficients 123 Linear Regression Model Using Matrices 124 Properties of the Least Squares Estimators 125 Inferences in Multiple Linear Regression 126 Choice of a Fitted Model Through Hypothesis Testing 128 Categorial or Indicator Variables 129 Sequential Methods for Model Selection 1213 Potential Misconceptions (127, 1210, 1211 og 1212 er ikke med i pensum) Bjørn H Auestad Kp 11: Regresjonsanalyse 46 / 46

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt Bjørn H. Auestad Kp. 11: Regresjonsanalyse 1 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka: MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,

Detaljer

Oppgave N(0, 1) under H 0. S t n 3

Oppgave N(0, 1) under H 0. S t n 3 MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2 MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall

Detaljer

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne

Detaljer

Løsningsforslag eksamen 25. november 2003

Løsningsforslag eksamen 25. november 2003 MOT310 Statistiske metoder 1 Løsningsforslag eksamen 25. november 2003 Oppgave 1 a) Vi har µ D = µ X µ Y. Sangere bruker generelt trapesius-muskelen mindre etter biofeedback dersom forventet bruk av trapesius

Detaljer

MOT310 Statistiske metoder 1, høsten 2011

MOT310 Statistiske metoder 1, høsten 2011 MOT310 Statistiske metoder 1, høsten 2011 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 30. oktober, 2011 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 15 -tabell

Detaljer

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1 MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Oppgave 1 a) Normalantakelse: Målingene x 1,..., x 21 og y 1,..., y 8 betraktes som utfall av tilfeldige variable X 1,..., X 21

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,

Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable, MOT30 Statistiske metoder Løsningsforslag til eksamen vår 0 s. Oppgave a Vi har x = 6. og x i x = 4.6. Herav s x = n Et 90% kondensintervall er gitt ved x i x = 4.6 = 0.89 6 SX X t 0.056 X + t S X 0.056

Detaljer

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert! MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Flott! Samlet sett leverer dere gode resultater. Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert! Totalt

Detaljer

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1 Løsningsforslag for: MOT10 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 6. november 007 TILLATTE HJELPEMIDLER: Kalkulator: HP0S, Casio FX8 eller TI-0 Tabeller og formler i statistikk (Tapir forlag) MERKNADER:

Detaljer

Kp. 13. Enveis ANOVA

Kp. 13. Enveis ANOVA -tabell Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 13 Kp. 13: Én-faktor -tabell 13.1 Analysis-of-Variance Technique 13.2 The Strategy of Experimental Design 13.3 One-Way Analysis of Variance: Completely

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

Løsningsforslag eksamen 27. februar 2004

Løsningsforslag eksamen 27. februar 2004 MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon)

Detaljer

Oppgave 1. Kilde SS df M S F Legering Feil Total

Oppgave 1. Kilde SS df M S F Legering Feil Total MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig

Detaljer

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall

Detaljer

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt uten med Kp 14 Flerfaktor-eksperiment Bjørn H Auestad Kp 14: To-faktor eksperiment 1 / 20 Kp 14: Flerfaktor-eksperiment; oversikt uten med 141 Introduction 142 Interaction in the Two-Factor Experiment

Detaljer

10.1 Enkel lineær regresjon Multippel regresjon

10.1 Enkel lineær regresjon Multippel regresjon Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel

Detaljer

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32). Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 16. november 2009 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

Kp. 9.8 Forskjell mellom to forventninger

Kp. 9.8 Forskjell mellom to forventninger andeler I analysene skal vi se på situasjonene der σx og σ Y er kjente; normalantakelse a σx og σ Y er ukjente men σ X = σ Y ; normalantakelse og b σx og σ Y er ukjente og σ X σ Y ; normalantakelse 3 og

Detaljer

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47) MOT310 tatistiske metoder 1 Løsningsforslag til eksamen vår 006, s. 1 Oppgave 1 a) En tilfeldig utvalgt besvarelse får F av sensor 1 med sannsynlighet p 1 ; resultatene for ulike besvarelser er uavhengige.

Detaljer

Oppgave 14.1 (14.4:1)

Oppgave 14.1 (14.4:1) MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) Modell: Oppgave 4. (4.4:) Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT310 STATISTISKE METODER VARIGHET: 4 TIMER DATO: 27. FEBRUAR 2004 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 5

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,

Detaljer

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i: MOT310 tatistiske metoder 1 Løsningsforslag til eksamen høst 010, s 1 Oppgave 1 a) Anlysetype: enveis variansanalyse (ANOVA) Modell for y ij ekspedisjonstid nr j for skrankeansatt nr i: Y ij µ i + ε ij,

Detaljer

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt. EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir forlag) OPPGAVESETTET

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 4. juni 2016 Eksamenstid (fra til): 09.00

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30

Detaljer

STK juni 2016

STK juni 2016 Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 12 Denne øvingen består av oppgaver om enkel lineær regresjon. De handler blant

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

Inferens i regresjon

Inferens i regresjon Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons

Detaljer

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler EKSAMENSOPPGAVER Institutt: Eksamen i: Tid: IKBM STAT100 Torsdag 13.des 2012 STATISTIKK 09.00-12.30 (3.5 timer) Emneansvarlig: Solve Sæbø ( 90065281) Tillatte hjelpemidler: C3: alle typer kalkulator, alle

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på

Detaljer

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren

Detaljer

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader. FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA440 Statistikk Høst 009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Løsningsskisse Oppgave a) n 8, i x i 675, x 37.5, i y i 488, i x i 375, i x iy i

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 0, blokk II Løsningsskisse Oppgave Surhetsgrad i ferskvann Eksamen august 00, oppgave av 3 a) En god estimator

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25.

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten

Detaljer

Modellvalg ved multippel regresjon notat til STK2120

Modellvalg ved multippel regresjon notat til STK2120 Modellvalg ved multippel regresjon notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på hvordan vi kan velge ut hvilke forklaringsvariabler vi skal ha med i en regresjonsmodell.

Detaljer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 11 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 7.

Detaljer

Ridge regresjon og lasso notat til STK2120

Ridge regresjon og lasso notat til STK2120 Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle

Detaljer

Forelesning 3 STK3100

Forelesning 3 STK3100 Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er

Detaljer

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Detaljer

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 3. juni 2016 Eksamenstid (fra til): 09:00-13:00

Detaljer

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at

Detaljer

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek-

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek- MOT310 Statitike metoder 1 Løningforlag til ekamen vår 010,. 1 Oppgave 1 a) Modell: Y i α + βx i + ε i der ε 1,..., ε n u.i.f. N 0, σ ). b) Vil tete: Tettørrele H 0 : β 0 mot H 1 : β 0 B β T t n under

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 24. april Bjørn H. Auestad Oppsummering våren

Detaljer

Fra krysstabell til regresjon

Fra krysstabell til regresjon Fra krysstabell til regresjon La oss si at vi er interessert i å undersøke i hvilken grad arbeidstid er avhengig av utdanning. Vi har ca. 3200 observasjoner (dvs. arbeidstakere som er spurt). For hver

Detaljer

Fasit og løsningsforslag STK 1110

Fasit og løsningsforslag STK 1110 Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Multippel regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Det er fortsatt en responsvariabel y. Måten dette gjøre på er nokså

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.

Detaljer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 7 Fagleg kontakt under eksamen: Mette Langaas (988 47 649) NYNORSK EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25. mai

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2 TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 12, blokk II Denne øvingen består av oppgaver om enkel lineær regresjon. De handler

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.

Detaljer

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 = 3.6080.

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 = 3.6080. EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 28. FEBRUAR 2005 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 4 OPPGAVER PÅ

Detaljer

vekt. vol bruk

vekt. vol bruk UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = 27000000 for produkt 2.

Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = 27000000 for produkt 2. Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = 27000000 for produkt 2. c) EMV max = 1000000 * 0.8 + 27000000 * 0.2 = 4600000 for produkt 2. d) 0.2 * 27000000 4600000

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 25. NOVEMBER 2003 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 3. april Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Løsningsforslag, eksamen statistikk, juni 2015

Løsningsforslag, eksamen statistikk, juni 2015 Løsningsforslag, eksamen statistikk, juni 0 Oppgave 1 Siden det spørres om tall fra et intervall, som oppgaven viser kan være et reelle, er det tydelig at tallene er tatt fra en kontinuerlig fordeling.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på

Detaljer

Oppgaver fra boka: Oppgave 12.1 (utg. 9) Y n 1 x 1n x 2n. og y =

Oppgaver fra boka: Oppgave 12.1 (utg. 9) Y n 1 x 1n x 2n. og y = MOT30 Statistisk mtodr, høstn 20 Løsningr til rgnøving nr. 8 (s. ) Oppgavr fra boka: Oppgav 2. (utg. 9) Modll: Y = µ Y x,x 2 + ε = β 0 + β x + β 2 x 2 + ε, dvs md n obsrvasjonr får vi n ligningr Y = β

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Statistisk analyse av data fra planlagte forsøk

Statistisk analyse av data fra planlagte forsøk Statistisk analyse av data fra planlagte forsøk 19. mars 2019 9.00 10.30 Skypemøte 2 i NLR s kurs i forsøksarbeid 2019 Torfinn Torp Temaer Noen sentrale begreper, framgangsmåte etc., via et eksempel. Noen

Detaljer

Løsningsforslag: STK2120-v15.

Løsningsforslag: STK2120-v15. Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene

Detaljer

Kapittel 2: Hendelser

Kapittel 2: Hendelser Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren

Detaljer

år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9

år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9 TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører

Detaljer

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor

Detaljer

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 16. mai 2015 Eksamenstid (fra til): 09:00-13:00

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:

Detaljer

EKSAMENSOPPGAVER STAT100 Vår 2011

EKSAMENSOPPGAVER STAT100 Vår 2011 EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test

Detaljer

Regresjon med GeoGebra

Regresjon med GeoGebra Praksis og Teori Askim videregående skole 14.08.14 1 Lærplanmål 2 Punkter og Lister 3 Regresjon 4 Teori 5 Nytt verktøy Læreplanmål i 2P Modellering gjere målingar i praktiske forsøk og formulere matematiske

Detaljer

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Løsningsforslag til oppgaver brukt i STA100

Løsningsforslag til oppgaver brukt i STA100 Universitetet i Stavanger Løsningsforslag til oppgaver brukt i STA100 Oppgave 1 a) Populasjonen er alle studenter ved Universitetet i Stavanger, og utvalget er de (ca 100) studentene hun velger ut i undersøkelsen

Detaljer

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Tlf: Eksamensdato: august 2015 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:

Detaljer