Kp. 12 Multippel regresjon
|
|
- Ragna Larsen
- 7 år siden
- Visninger:
Transkript
1 Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction 122 Estimating the Coefficients 123 Linear Regression Model Using Matrices 124 Properties of the Least Squares Estimators 125 Inferences in Multiple Linear Regression 126 Choice of a Fitted Model Through Hypothesis Testing 128 Categorial or Indicator Variables 129 Sequential Methods for Model Selection 1213 Potential Misconceptions (127, 1210, 1211 og 1212 er ikke med i pensum) Bjørn H Auestad Kp 11: Regresjonsanalyse 2 / 46
2 Kp 12 Multippel ; introduksjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Eksempel 121 (i boken): Nitrogenoksydutslipp (y i )fra dieselmotor Regner med at det avhenger av luftfuktighet (x 1i ), temperatur (x 2i ) og trykk (x 3i ) Har gjort målinger (n =20) under ulike (eksperiment)betingelser: Bjørn H Auestad Kp 11: Regresjonsanalyse 3 / 46 Kp 12 Multippel ; introduksjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Spredningsdiagram (én-om-gangen): Det kan synes som om alle x-variablene har sammenheng? Bjørn H Auestad Kp 11: Regresjonsanalyse 4 / 46
3 Kp 12 Multippel ; introduksjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Modell som kan være aktuell: Y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + ɛ i, i =1,,20 Forventning: E(Y i x 1i,x 2i,x 3i )=μ Y x1i,x 2i,x 3i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i β j : endring i E(Y i x 1i,x 2i,x 3i ) når x ji endres én enhet ɛ i : Forventing null, varians σ 2 Hvorfor ikke bruke tre analyser med enkel lineær? Bjørn H Auestad Kp 11: Regresjonsanalyse 5 / 46 Kp 12 Multippel ; introduksjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Generelt: Multippel lineær smodell: Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i, i =1,,n k uavhengige variable (forklaringsvariable) E(Y i x 1i,,x ki )=μ Y x1i,,x ki = β 0 + β 1 x 1i + + β k x ki E(ɛ i )=0, Var(ɛ i )=Var(Y i )=σ 2 (uavh av x j ene) Hvordan estimere β j ene? Hvordan estimere støyvariansen σ 2? Bjørn H Auestad Kp 11: Regresjonsanalyse 6 / 46
4 Estimering Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Data: (x 11,,x k1,y 1 ),,(x 1n,,x kn,y n ) Vi bruker dataene til å estimere de ukjente: β 0,β 1,,β k Estimert slinje: ŷ = b 0 + b 1 x b k x k Residual: e i = y i ŷ i = y i (b 0 + b 1 x 1i + + b k x ki ) SSE = n e 2 i = n (y i ŷ i ) 2 = n { yi (b 0 + b 1 x 1i + + b k x ki ) } 2 Metode: Velg b 0, b 1,,b k (konstantledd og stigningstallene) slik at SSE blir minimert! s i boken Bjørn H Auestad Kp 11: Regresjonsanalyse 7 / 46 Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Modell for n observasjoner: Matriseform: Y = Xβ + E, der Y = Y 1 Y n, X = Y 1 = β 0 + β 1 x β k x k1 + ɛ 1 Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i Y n = β 0 + β 1 x 1n + + β k x kn + ɛ n 1 x 11 x k1 1 x 1n x kn, β = β 0 β 1 β k og E = ɛ 1 ɛ n Bjørn H Auestad Kp 11: Regresjonsanalyse 8 / 46
5 Bruk av Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Matrisehjelp, produkt Feks har vi: Xβ = 1 x 11 x k1 1 x 1n x kn Matrisehjelp, transponering [ a b c d e f ] T a = b c β 0 β 1 β k d e f = β 0 + β 1 x β k x k1 β 0 + β 1 x 1i + + β k x ki β 0 + β 1 x 1n + + β k x kn og (AB) T = B T A T Bjørn H Auestad Kp 11: Regresjonsanalyse 9 / 46 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Minimering av SSE på matriseform: Da: SSE = datavektor: y = y 1 y n, og b = n { yi (b 0 + b 1 x 1i + + b k x ik ) }2 = = (y Xb) T (y Xb)= [e 1,,e n ] b 0 b 1 b k n (e i ) 2 = (y T b T X T )(y Xb) =y T y y T Xb b T X T y + b T X T Xb e 1 e n = y T y 2b T X T y + b T X T Xb Bjørn H Auestad Kp 11: Regresjonsanalyse 10 / 46
6 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt e 1 e 2 (y Xb) =, e n fordi: y 1 1 x 11 x k1 b 0 e 1 y 2 (y Xb) = 1 x 12 x k2 b 1 = e 2 y n 1 x 1n x kn b k e n Bjørn H Auestad Kp 11: Regresjonsanalyse 11 / 46 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Med matrisehåndtering får vi enkelt resultatet: SSE b = SSE b 0 SSE b 1 SSE b k = 2X T y +2X T Xb SSE b = 2XT y +2X T Xb = 0 b = ( X T X ) 1 X T y X T X er invertibel dersom X har rang k +1 Dette krever at n k +1og at ingen av x-variablene er en lineærkombinasjon av de andre Bjørn H Auestad Kp 11: Regresjonsanalyse 12 / 46
7 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Forklaring Vi ønsker å løse ligningssettet: SSE b j = b j = 2 n { yi (b 0 + b 1 x 1i + + b k x ki ) } 2 n { yi (b 0 + b 1 x 1i + + b k x ki ) } x ji = 2 ( n y i x ji = 2 { n y i x ji n b 0 x ji n (b 0 + n b 1 x 1i x ji k } b l x li )x ji l=1 n ) b k x ki x ji = 0, j =0, 1, 2,,k (x 1i =1) Bjørn H Auestad Kp 11: Regresjonsanalyse 13 / 46 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Dette kan skrives slik: 2X T y +2X T Xb = 0, fordi: y n 1 y i X T x 11 x 12 x 1n y 2 n y = = y ix 1i, x k1 x k2 x kn y n n y ix ki og b 0 + k j=1 X T x 11 x 12 x 1n b jx j1 b 0 + k j=1 Xb = b jx j2 x k1 x k2 x kn b 0 + k j=1 b jx jn n ( b0 + k j=1 b ) jx ji n ( b0 + k j=1 = b ) jx ji x1i n ( b0 + k j=1 b ) jx ji xki Bjørn H Auestad Kp 11: Regresjonsanalyse 14 / 46
8 Minmering av SSE Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Eksempel, dieselmotordata: Regresjonslinje (?): ŷ i = x 1i +0001x 2i +0154x 3i Fortolkning: Bjørn H Auestad Kp 11: Regresjonsanalyse 15 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction 122 Estimating the Coefficients 123 Linear Regression Model Using Matrices 124 Properties of the Least Squares Estimators 125 Inferences in Multiple Linear Regression 126 Choice of a Fitted Model Through Hypothesis Testing 128 Categorial or Indicator Variables 129 Sequential Methods for Model Selection 1213 Potential Misconceptions (127, 1210, 1211 og 1212 er ikke med i pensum) Bjørn H Auestad Kp 11: Regresjonsanalyse 16 / 46
9 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Multippel lineær smodell: Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i, På matriseform: Y = Xβ + E, eller: Y 1 Y 2 Y n = 1 x 11 x k1 1 x 12 x k2 1 x 1n x kn β 0 β 1 β k + i =1,,n ɛ 1 ɛ 2 ɛ n Bjørn H Auestad Kp 11: Regresjonsanalyse 17 / 46 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Minstekvadraters estimatene av β 0,β 1,,β k : b = ( X T X ) 1 X T y Minstekvadraters estimatorene av β 0,β 1,,β k : β = ( X T X ) 1 X T Y Vi må undersøke de statistiske egenskapene til estimatorene Først litt generelt angående egning med forventning og varians Bjørn H Auestad Kp 11: Regresjonsanalyse 18 / 46
10 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Generelt i forbindelse med vektorer og : Dersom V er en vektor av tilfeldige variable, så definerer vi: E(V 1 ) E(V) = E(V n ), Var(V) = Dersom A (m n) er en konstantmatrise, så gjelder: E(AV)=AE(V) Var(AV)=AVar(V)A T V = V 1 V n Var(V 1 ) Cov(V 1,V 2 ) Cov(V 1,V n ) Cov(V n,v 1 ) Cov(V n,v 2 ) Var(V n ) A = a 11 a 12 a 1n a m1 a m2 a mn Bjørn H Auestad Kp 11: Regresjonsanalyse 19 / 46 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Egenskaper til estimatorene: β = ( X T X ) 1 X T Y E( β) = ( X T X ) 1 X T E ( Y ) (E(Y) =E(Xβ + E) =Xβ) = ( X T X ) 1 X T Xβ = β { (X Var( β) = Var T X ) } 1 X T Y = σ 2( X T X ) 1 = σ 2 C Dvs: β er forventingsrett for β Matrisen C = ( X T X ) 1 beregnes vanligvis av statistikkprogrammet Bjørn H Auestad Kp 11: Regresjonsanalyse 20 / 46
11 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Egenskaper til estimatorene: Var( β j )=σ 2 c jj, der C = c 00 c 01 c 0k c 10 c 11 c 1k c k0 c k1 c kk og matrisen C beregnes av statistikkprogrammet = ( X T X ) 1, Vanligvis blir verdi av S 2 c jj som estimat av variansen til β j vist, se eksempel Bjørn H Auestad Kp 11: Regresjonsanalyse 21 / 46 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Eksempel, dieselmotordata: Feks, estimert verdi av: Var( β 1 )=σ 2 c 11 er (Det er valigvis kun dette (verdiene i kollonnen Standard Error ) vi trenger Hele matrisen skrives vanligvis ikke ut) Bjørn H Auestad Kp 11: Regresjonsanalyse 22 / 46
12 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Forventningsrett estimator for Var(ɛ i )=σ 2 (Teorem 121): σ 2 = S 2 = = Estimat beregnes vha: Matriseuttrykk: S 2 = 1 n k 1 1 n k 1 n ( Yi Ŷi) 2 n { Yi ( β 0 + β 1 x 1i + + β k x ki ) } 2 SSE n k 1 SSE n k 1 = 1 n k 1 (når MK-estimatene er innsatt i SSE) n ( Yi Ŷi) 2 = (Y X β) T (Y X β) n k 1 (Kan vise at (n k 1)S2 σ 2 χ 2 n k 1 og uavhengig av β) Bjørn H Auestad Kp 11: Regresjonsanalyse 23 / 46 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Inferens om β j : Vikanviseat: βj N(β,σ 2 c jj ) og at β j β j S 2 c jj t(n k 1) Dette brukes til å lage hypotesetester og/eller konfidensintervall for β j Eks, dieselmotordata Coefficients Standard Error t Stat P-value Intercept -3,5078 3,0049 0,2602 x 1 (hum) -0,0026 0,0007 0,0010 x 2 (temp) 0,0008 0,0020 0,7012 x 3 (trykk) 0,1542 0,1014 0,1478 Oppgave: Beregn T obs og 95% konfint for β 0, β 1, β 2 og β 3 Bjørn H Auestad Kp 11: Regresjonsanalyse 24 / 46
13 Inferens Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Eks, dieselmotordata Coefficients Standard Error t Stat P-value Intercept -3,5078 3,0049 0,2602 x 1 (hum) -0,0026 0,0007 0,0010 x 2 (temp) 0,0008 0,0020 0,7012 x 3 (trykk) 0,1542 0,1014 0,1478 Hvilke (om noen) x-variable har sammenheng med y en?? Vi vil gjennomføre testene H 0 : β i =0mot H 0 : β i 0, i =1, 2, 3 Hvordan? Bjørn H Auestad Kp 11: Regresjonsanalyse 25 / 46 Konfidensintervall Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Inferens om μ Y x 0 = E(Y x 0 ): (x T 0 =[1,x 10,,x k0 ]) μ Y x 0 = β 0 + β 1 x β k x k0 = x T 0 β Estimator: μ Y x 0 = β 0 + β 1 x β k x k0 = x T 0 β Vi finner at: E( μ Y x 0 )=β 0 +β 1 x β k x k0 og Var( μ Y x 0 )=Var(x T 0 β) = = σ 2 x T 0 Cx 0 Det kan vises at: μ Y x 0 μ Y x 0 S 2 x T 0 C x 0 t(n k 1) Brukes til å lage hypotesetester / konfidensintervall for μ Y x0 Oppgave: dieselmotordataene; Lag et 95% konfidensintervall for forventet nitrogenoksydmengde ved forholdene x 1 =50, x 2 =75og x 3 =293 Det oppgis at x T 0 C x 0 =00688 og at estimat av σ 2 er: Bjørn H Auestad Kp 11: Regresjonsanalyse 26 / 46
14 Prediksjonsintervall Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Prediksjonsintervall for Y 0, (Y -utfall for x = x 0 ): Y 0 = β 0 + β 1 x β k x k0 + ɛ 0 Estimator: Ŷ0 = β 0 + β 1 x β k x k0 = μ Y x 0 Vi betrakter Ŷ0 Y 0 = μ Y x 0 Y 0 Egenskaper: E( μ Y x 0 Y 0 )=0 og Var( μ Y x 0 Y 0 )=σ 2( 1+x T 0 C x 0 ) Det kan vises at: μ Y x 0 Y 0 S 2( 1+x T0 C x 0 ) t(n k 1) Brukes til å lage prediksjonsintervall for Y 0 Et(1 γ) 100% predint for Y 0 : ( μ Y x 0 t γ/2,n k 1 S 2( 1+x T0 C x 0 ), μy x 0 + t γ/2,n k 1 S 2( 1+x T0 C x 0 ) ) Oppgave: dieselmotordataene; Lag prediksjonsintervall for Y 0 når x T 0 =[1, 50, 75, 293] Bjørn H Auestad Kp 11: Regresjonsanalyse 27 / 46 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt ANOVA-tabell lages også i multippel Eksempel: ANOVA-tabell for dieselmotordataene: Struktur: ANOVA df SS MS F Significance F Regression 3 0, , , ,00001 Residual 16 0, ,00315 Total 19 0,25298 Kilde fg SK GK F p-verdi Source df SS MS F p-value Regresjon k SSR Residual n k 1 SSE Total n 1 SST SSR k SSE n k 1 MSR MSE P (F >f obs ) Bruk? Bjørn H Auestad Kp 11: Regresjonsanalyse 28 / 46
15 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Også for multippel gjelder: n (Y i Y ) 2 = der Ŷ i = β 0 + β 1 x 1i + + β k x ki n (Y i Ŷi) 2 + SST = SSE + SSR, SSE n k 1 estimerer σ2 (= Var(Y i )=Var(ɛ i )) SSR k n (Ŷi Y ) 2 Modell: Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i estimerer σ 2,dersomβ 1 = β 2 = β k =0 E( SSR k ) >σ2 dersom minst én β j 0 Bjørn H Auestad Kp 11: Regresjonsanalyse 29 / 46 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Derfor bruker vi stor verdi av som indikasjon på at minst én β j 0 Dieselmotordataene: SSR / k SSE / n k 1 = MSR MSE, k n k 1 n 1 k n k 1 P (F >f ) Bjørn H Auestad Kp 11: Regresjonsanalyse 30 / 46
16 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Vi har at: Under H 0 : β 1 = β 2 = β k =0er: SST χ 2 σ 2 n 1 }{{} jf teorem 84 Test: Forkast H 0 dersom: F = SSR / σ k 2 SSE / = σ n k 1 2 SSE χ 2 σ 2 n k 1 }{{} jf kp 124 Med ANOVA-innfallsvinkelen tester vi: SSR χ 2 σ 2 k }{{} n 1=(n k 1)+(k) SSR / k SSE / n k 1 = MSR MSE f α,k,n k 1 H 0 : β 1 = β 2 = β k =0mot H 1 : minst en β j 0 Dvs: Test for om modellen samlet er av betydning Bjørn H Auestad Kp 11: Regresjonsanalyse 31 / 46 ANOVA-tabell Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Dieselmotordataene: Modellen samlet er åpenbart av betydning! Men ikke alle variablene synes å være signifikante? Hvordan kan vi undersøke dette nærmere? Bjørn H Auestad Kp 11: Regresjonsanalyse 32 / 46
17 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction 122 Estimating the Coefficients 123 Linear Regression Model Using Matrices 124 Properties of the Least Squares Estimators 125 Inferences in Multiple Linear Regression 126 Choice of a Fitted Model Through Hypothesis Testing 128 Categorial or Indicator Variables 129 Sequential Methods for Model Selection 1213 Potential Misconceptions (127, 1210, 1211 og 1212 er ikke med i pensum) Bjørn H Auestad Kp 11: Regresjonsanalyse 33 / 46 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Hvilke forklaringsvariable skal være med i modellen? Vi kan ha signifikant F samtidig som alle (!) T j = β j / S 2 c jj er ikke-signifikante Dette indikerer at kun et underutvalg av variablene bør være med i modellen Vi bør i slike situasjoner finne fram til en modell som har et underutvalg av alle forklaringsvariablene inkludert Hvordan? Bjørn H Auestad Kp 11: Regresjonsanalyse 34 / 46
18 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Ta ut variablene med ikke-signifikant T j = β j / S 2 c jj? (Dvs: β 2 og β 3 skal vekk) Obs: Estimater og p-verdier endres og derfor kan en slik framgangsmåte gi uheldig resultat Bjørn H Auestad Kp 11: Regresjonsanalyse 35 / 46 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt (Lite endringer i dette eksempelet) Bjørn H Auestad Kp 11: Regresjonsanalyse 36 / 46
19 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt R 2 som mål på hvilken modell som er best? R 2 = SSR SST =1 SSE SST R 2 utrykker hvor stor del av total variasjon en forklarer (På samme måte som i enkel lineær ) MEN: SSE kan ikke øke når flere x-variable tas med i modellen Problem: S 2 = økende k ( R 2 kan ikke avta) SSE, kan øke selv om SSE avtar med n k 1 Medfører mer usikre estimat, analyser og prediksjoner! Dersom i tillegg x-variable med sterk sammenheng (korrelasjon) tas inn i modellen, blir C =(X T X) 1 slik at Var( β j )=σ 2 c jj blir stor! Jf s 466, 467 i boken Bjørn H Auestad Kp 11: Regresjonsanalyse 37 / 46 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Bedre kriterium: R 2 justert = R2 adj Mulig strategi for modellvalg: Dieselmotordata Vi skal i tillegg se på stegvise prosedyrer =1 SSE/(n k 1) SST/(n 1) Velg den modellen som har størst R 2 justert mål med 3 x-variable med 2 x-variable R Rjustert Forlengs og baklengs utvelgelse Stegvis utvelgelse (kombinasjon av forlengs og baklengs) Bjørn H Auestad Kp 11: Regresjonsanalyse 38 / 46
20 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt To alternative modeller (den ene har en delmengde av x-variablene i forhold til den andre) kan sammenlignes vha SSR Vi ser på differanse i SSR Dersom vi vil sammenligne stor : Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i med redusert : der 1 <m k av x-variablene er utelatt, SSR stor SSR justert m kanvisepåstørrelsen S 2 Denne er F (m, n k 1)-fordelt dersom stor modell ikke er bedre enn redusert (de mβ j ene er alle null) Benyttes i stegvise prosedyrer Bjørn H Auestad Kp 11: Regresjonsanalyse 39 / 46 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Forlengs utvelgesle: Steg 1: β 0 og β (1) x (1) Steg 2: β 0, β (1) x (1) og vi skal bestemme: β (2) x (2) Ser på differanser i SSR: SSR(β (2) β 0,β (1) )=SSR(β 0,β (1),β (2) ) SSR(β 0,β (1) ) Velg den x-variabelen som har størst SSR(β (2) β 0,β (1) ) Vi forkaster H 0 : β (2) =0(dvs inkluderer i modellen) dersom F = SSR(β (2) β 0,β (1) ) SSE/(n 3) >f α,1,n 3 SSE/(n 3) = S 2 fra modell i steg 2 Fortsetter å ta inn variable til ingen gir forkastning Bjørn H Auestad Kp 11: Regresjonsanalyse 40 / 46
21 Modellvalg Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Ved valg av modell må også vi også undersøke om modellforutsetningene synes å være tilfredsstilt for aktuell modell Vi må (ihvertfall) studere residualene (egentlig i kp 1210 som ikke er pensum (!), men ) e i = y i ŷ i = y i (b 0 + b 1 x 1i + + b k x ki ), i =1,,n Plott residualene, e i, mot hver av variablene x 1i,,x ki, mot ŷ i og mot i Residualene skal vise gjennomsnitt null, konsant varians og ikke noe mønster (indikerer uavhengighet) Lag også normalplott av residualene Bjørn H Auestad Kp 11: Regresjonsanalyse 41 / 46 Polynomisk Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Multippel lineær smodell: Y i = β 0 + β 1 x 1i + + β k x ki + ɛ i, Modell for på polynom i x: Y i = β 0 + β 1 x i + β 2 x 2 i + + β k x k i + ɛ i, I praksis lager vi bare de nye variablene i =1,,n i =1,,n x ji x j i Bjørn H Auestad Kp 11: Regresjonsanalyse 42 / 46
22 Polynomisk Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Designmatrisen for polynomisk : Modell på matriseform: Y = Xβ + E, eller: Y 1 Y 2 Y n = X = 1 x 1 x 2 1 x k 1 1 x 2 x 2 2 x k 2 1 x n x 2 n x k n 1 x 1 x 2 1 x k 1 1 x 2 x 2 2 x k 2 1 x n x 2 n x k n β 0 β 1 β k + ɛ 1 ɛ 2 ɛ n Modellen er lineær i parameterene β 0,β 1,,β k Analysene blir som før! Bjørn H Auestad Kp 11: Regresjonsanalyse 43 / 46 Polynomisk Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Andreordens polynom for dataene fra oppgave 1141? Bjørn H Auestad Kp 11: Regresjonsanalyse 44 / 46
23 Polynomisk Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Andreordens polynom for dataene fra oppgave 1141? Bjørn H Auestad Kp 11: Regresjonsanalyse 45 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction 122 Estimating the Coefficients 123 Linear Regression Model Using Matrices 124 Properties of the Least Squares Estimators 125 Inferences in Multiple Linear Regression 126 Choice of a Fitted Model Through Hypothesis Testing 128 Categorial or Indicator Variables 129 Sequential Methods for Model Selection 1213 Potential Misconceptions (127, 1210, 1211 og 1212 er ikke med i pensum) Bjørn H Auestad Kp 11: Regresjonsanalyse 46 / 46
Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt
Bjørn H. Auestad Kp. 11: Regresjonsanalyse 1 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
DetaljerOppgave N(0, 1) under H 0. S t n 3
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall
DetaljerMOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne
DetaljerLøsningsforslag eksamen 25. november 2003
MOT310 Statistiske metoder 1 Løsningsforslag eksamen 25. november 2003 Oppgave 1 a) Vi har µ D = µ X µ Y. Sangere bruker generelt trapesius-muskelen mindre etter biofeedback dersom forventet bruk av trapesius
DetaljerMOT310 Statistiske metoder 1, høsten 2011
MOT310 Statistiske metoder 1, høsten 2011 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 30. oktober, 2011 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 15 -tabell
DetaljerMOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Oppgave 1 a) Normalantakelse: Målingene x 1,..., x 21 og y 1,..., y 8 betraktes som utfall av tilfeldige variable X 1,..., X 21
DetaljerOppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
DetaljerOppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,
MOT30 Statistiske metoder Løsningsforslag til eksamen vår 0 s. Oppgave a Vi har x = 6. og x i x = 4.6. Herav s x = n Et 90% kondensintervall er gitt ved x i x = 4.6 = 0.89 6 SX X t 0.056 X + t S X 0.056
DetaljerKandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Flott! Samlet sett leverer dere gode resultater. Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert! Totalt
Detaljer+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1
Løsningsforslag for: MOT10 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 6. november 007 TILLATTE HJELPEMIDLER: Kalkulator: HP0S, Casio FX8 eller TI-0 Tabeller og formler i statistikk (Tapir forlag) MERKNADER:
DetaljerKp. 13. Enveis ANOVA
-tabell Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 13 Kp. 13: Én-faktor -tabell 13.1 Analysis-of-Variance Technique 13.2 The Strategy of Experimental Design 13.3 One-Way Analysis of Variance: Completely
DetaljerTilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
DetaljerLøsningsforslag eksamen 27. februar 2004
MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon)
DetaljerOppgave 1. Kilde SS df M S F Legering Feil Total
MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig
DetaljerLøsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y
Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall
DetaljerKp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt
uten med Kp 14 Flerfaktor-eksperiment Bjørn H Auestad Kp 14: To-faktor eksperiment 1 / 20 Kp 14: Flerfaktor-eksperiment; oversikt uten med 141 Introduction 142 Interaction in the Two-Factor Experiment
Detaljer10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
DetaljerOppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 16. november 2009 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerKp. 9.8 Forskjell mellom to forventninger
andeler I analysene skal vi se på situasjonene der σx og σ Y er kjente; normalantakelse a σx og σ Y er ukjente men σ X = σ Y ; normalantakelse og b σx og σ Y er ukjente og σ X σ Y ; normalantakelse 3 og
DetaljerOppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)
MOT310 tatistiske metoder 1 Løsningsforslag til eksamen vår 006, s. 1 Oppgave 1 a) En tilfeldig utvalgt besvarelse får F av sensor 1 med sannsynlighet p 1 ; resultatene for ulike besvarelser er uavhengige.
DetaljerOppgave 14.1 (14.4:1)
MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) Modell: Oppgave 4. (4.4:) Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i
DetaljerHØGSKOLEN I STAVANGER
EKSAMEN I: MOT310 STATISTISKE METODER VARIGHET: 4 TIMER DATO: 27. FEBRUAR 2004 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 5
DetaljerTMA4240 Statistikk Høst 2009
TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave
DetaljerHØGSKOLEN I STAVANGER
EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN
DetaljerST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon
ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,
DetaljerOppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:
MOT310 tatistiske metoder 1 Løsningsforslag til eksamen høst 010, s 1 Oppgave 1 a) Anlysetype: enveis variansanalyse (ANOVA) Modell for y ij ekspedisjonstid nr j for skrankeansatt nr i: Y ij µ i + ε ij,
DetaljerOPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.
EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir forlag) OPPGAVESETTET
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerSTK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 4. juni 2016 Eksamenstid (fra til): 09.00
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30
DetaljerSTK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
DetaljerTMA4240 Statistikk Høst 2016
TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 12 Denne øvingen består av oppgaver om enkel lineær regresjon. De handler blant
DetaljerOppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir
DetaljerInferens i regresjon
Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons
DetaljerTillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler
EKSAMENSOPPGAVER Institutt: Eksamen i: Tid: IKBM STAT100 Torsdag 13.des 2012 STATISTIKK 09.00-12.30 (3.5 timer) Emneansvarlig: Solve Sæbø ( 90065281) Tillatte hjelpemidler: C3: alle typer kalkulator, alle
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
DetaljerI enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x
Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren
Detaljerj=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.
FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da
DetaljerTMA4240 Statistikk Høst 2009
TMA440 Statistikk Høst 009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Løsningsskisse Oppgave a) n 8, i x i 675, x 37.5, i y i 488, i x i 375, i x iy i
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
DetaljerTMA4240 Statistikk Høst 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 0, blokk II Løsningsskisse Oppgave Surhetsgrad i ferskvann Eksamen august 00, oppgave av 3 a) En god estimator
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting
DetaljerEKSAMEN I TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25.
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting
DetaljerTMA4240 Statistikk 2014
TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten
DetaljerModellvalg ved multippel regresjon notat til STK2120
Modellvalg ved multippel regresjon notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på hvordan vi kan velge ut hvilke forklaringsvariabler vi skal ha med i en regresjonsmodell.
DetaljerEKSAMEN I TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 11 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 7.
DetaljerRidge regresjon og lasso notat til STK2120
Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle
DetaljerForelesning 3 STK3100
Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerUNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerEksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
DetaljerEksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 3. juni 2016 Eksamenstid (fra til): 09:00-13:00
DetaljerLøsningsforslag STK1110-h11: Andre obligatoriske oppgave.
Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at
DetaljerOppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek-
MOT310 Statitike metoder 1 Løningforlag til ekamen vår 010,. 1 Oppgave 1 a) Modell: Y i α + βx i + ε i der ε 1,..., ε n u.i.f. N 0, σ ). b) Vil tete: Tettørrele H 0 : β 0 mot H 1 : β 0 B β T t n under
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 24. april Bjørn H. Auestad Oppsummering våren
DetaljerFra krysstabell til regresjon
Fra krysstabell til regresjon La oss si at vi er interessert i å undersøke i hvilken grad arbeidstid er avhengig av utdanning. Vi har ca. 3200 observasjoner (dvs. arbeidstakere som er spurt). For hver
DetaljerFasit og løsningsforslag STK 1110
Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerMultippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.
Multippel regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Det er fortsatt en responsvariabel y. Måten dette gjøre på er nokså
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.
DetaljerEKSAMEN I TMA4255 ANVENDT STATISTIKK
Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 7 Fagleg kontakt under eksamen: Mette Langaas (988 47 649) NYNORSK EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25. mai
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting
Detaljern n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 12, blokk II Denne øvingen består av oppgaver om enkel lineær regresjon. De handler
DetaljerOm eksamen. Never, never, never give up!
I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.
DetaljerOppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 = 3.6080.
EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 28. FEBRUAR 2005 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 4 OPPGAVER PÅ
Detaljervekt. vol bruk
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerEKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag
DetaljerOm eksamen. Never, never, never give up!
Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
DetaljerOppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = 27000000 for produkt 2.
Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = 27000000 for produkt 2. c) EMV max = 1000000 * 0.8 + 27000000 * 0.2 = 4600000 for produkt 2. d) 0.2 * 27000000 4600000
DetaljerHØGSKOLEN I STAVANGER
EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 25. NOVEMBER 2003 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 3. april Bjørn H. Auestad Kp. 6: Hypotesetesting
DetaljerTMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
DetaljerUtfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
DetaljerLøsningsforslag, eksamen statistikk, juni 2015
Løsningsforslag, eksamen statistikk, juni 0 Oppgave 1 Siden det spørres om tall fra et intervall, som oppgaven viser kan være et reelle, er det tydelig at tallene er tatt fra en kontinuerlig fordeling.
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på
DetaljerOppgaver fra boka: Oppgave 12.1 (utg. 9) Y n 1 x 1n x 2n. og y =
MOT30 Statistisk mtodr, høstn 20 Løsningr til rgnøving nr. 8 (s. ) Oppgavr fra boka: Oppgav 2. (utg. 9) Modll: Y = µ Y x,x 2 + ε = β 0 + β x + β 2 x 2 + ε, dvs md n obsrvasjonr får vi n ligningr Y = β
DetaljerKort overblikk over kurset sålangt
Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente
DetaljerStatistisk analyse av data fra planlagte forsøk
Statistisk analyse av data fra planlagte forsøk 19. mars 2019 9.00 10.30 Skypemøte 2 i NLR s kurs i forsøksarbeid 2019 Torfinn Torp Temaer Noen sentrale begreper, framgangsmåte etc., via et eksempel. Noen
DetaljerLøsningsforslag: STK2120-v15.
Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene
DetaljerKapittel 2: Hendelser
Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en
DetaljerEksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering
ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren
Detaljerår i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9
TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører
DetaljerSnøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk
Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor
DetaljerEksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 16. mai 2015 Eksamenstid (fra til): 09:00-13:00
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
DetaljerEKSAMENSOPPGAVER STAT100 Vår 2011
EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test
DetaljerRegresjon med GeoGebra
Praksis og Teori Askim videregående skole 14.08.14 1 Lærplanmål 2 Punkter og Lister 3 Regresjon 4 Teori 5 Nytt verktøy Læreplanmål i 2P Modellering gjere målingar i praktiske forsøk og formulere matematiske
DetaljerHøgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen
Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerLøsningsforslag til oppgaver brukt i STA100
Universitetet i Stavanger Løsningsforslag til oppgaver brukt i STA100 Oppgave 1 a) Populasjonen er alle studenter ved Universitetet i Stavanger, og utvalget er de (ca 100) studentene hun velger ut i undersøkelsen
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Tlf: Eksamensdato: august 2015 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
Detaljer