Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Begynne med side:

Download "Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt"

Transkript

1 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 1 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties of the least Squares Estimators 11.5 Inferences Concerning the Regression Coefficients 11.6 Prediction 11.7 Choice of a Regression Model 11.8 Analysis-of Variance Approach Data Plots and Transformations Simple Linear Regression Case Study Correlation Potential Misconceptions , Test for linearity... er ikke med i pensum.) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 2 / 57

2 Kp. 11 Regresjonsanalyse, Introduksjon Vi vil undersøke ev. sammenhenger mellom størrelser. F.eks.: Alder og kolesterolnivå registrert for 250 skandinaviske personer: pers.nr. alder kolest.nivå 1 x 1 y 1 2 x 2 y 2 3 x 3 y 3... Spredningsdiagram y i x i scatter plot): Bjørn H. Auestad Kp. 11: Regresjonsanalyse 3 / 57 Kp. 11 Regresjonsanalyse, Introduksjon Vi ønsker å tilpasse en rett linje til dataene. Ser y i som funksjon av x i.) Hvordan finne beste linje? Hva er best"?) x i ene: faste tall; Alder og kolesterolnivå: y i ene: ev. sammenheng med x i ene + tilfeldig variasjon y i utfall av Y i, der EY i x i )=α + βx i α: skjæringspunkt intercept) β: stigningstall slope) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 4 / 57

3 Kp. 11 Regresjonsanalyse, Introduksjon Hvorfor gjøre regresjonsanalyse? Viktig å undersøke om det er sammenheng i det hele tatt i noen tilfeller. Viktig å ha informasjon om typen sammenheng. Prediksjoner Flere eksempler: Årsnedbør som funksjon av tid Avling som funksjon av gjødselmengde Utkomme av kjemisk prosess som funksjon av innsatsfaktorer) Kalibrering av måleutstyr Økonometri/finans... Bjørn H. Auestad Kp. 11: Regresjonsanalyse 5 / 57 Kp. 11 Regresjonsanalyse, Introduksjon Økonomieksempel: Prosentvis endring av Dow Jones-indeks registrert i 13 år. x i : gjennomsnitt for de fem første handelsdagene i året y i : gjennomsnitt for hele året Kan vi gjøre prognoser for hele året basert på de fem første dagene? Bjørn H. Auestad Kp. 11: Regresjonsanalyse 6 / 57

4 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties of the least Squares Estimators 11.5 Inferences Concerning the Regression Coefficients 11.6 Prediction 11.7 Choice of a Regression Model 11.8 Analysis-of Variance Approach Data Plots and Transformations Simple Linear Regression Case Study Potential Misconceptions og er ikke med i pensum.) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 7 / 57 Regresjonsanalyse; Minste kvadraters Data, n par av data: x 1,y 1 ), x 2,y 2 )...,x n,y n ) x i ene: faste tall; y i ene: ev. sammenheng med x i ene + tilfeldig variasjon Utfall av tilfeldige variable Y i er). modell: Y i = α + βx i + ɛ i y i ene: utfall av Y i ene ɛ i : representerer tilfeldig variasjon støy) Eɛ i )=0,Varɛ i )=σ 2 sammenheng: EY i x i )=α + βx i Dvs.: forventet verdi til Y i gitt x i ), modelleres som en lineær funksjon av x i. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 8 / 57

5 Regresjonsanalyse; Minste kvadraters Data: x 1,y 1 ), x 2,y 2 )...,x n,y n ) Virkelig modell sammenheng): α + βx i,ukjent Vi bruker dataene til å estimere sammenhengen. Estimat: a + bx i Estimert regresjonslinje: ŷ = a + bx Residual, e i : e i = y i ŷ i = y i a + bx i ) Se illustrasjon i EXCEL-fil! Bjørn H. Auestad Kp. 11: Regresjonsanalyse 9 / 57 Regresjonsanalyse; Minste kvadraters SSE: Sum of Squared Errors, e2 i SSE = e 2 i = y i ŷ i ) 2 = { yi a + bx i ) } 2 Metode: Velg a og b konsantledd og stigningstall) slik at SSE blir minimert! Betrakt SSE som en funksjon av to variable, a og b. Finn det verdiparet som gir minimum for funksjonen. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 10 / 57

6 Regresjonsanalyse; Minste kvadraters Vi deriverer funksjonen SSEa, b) mht. a og b, ogsetterdeto partiell)deriverte lik null. SSEa, b) = { yi a + bx i ) } 2 SSEa, b) = a SSEa, b) = b { yi a + bx i ) } 2 = a { yi a + bx i ) } 2 = b Bjørn H. Auestad Kp. 11: Regresjonsanalyse 11 / 57 Regresjonsanalyse; Minste kvadraters SSEa, b) = a SSEa, b) = b { yi a + bx i ) } 2 = a = 2 { yi a + bx i ) } =0 { yi a + bx i ) } 2 = b { = 2 yi a + bx i ) } x i =0 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 12 / 57

7 Regresjonsanalyse; Minste kvadraters To ligninger og to ukjente: 2 { yi a + bx i ) } =0 og 2 { yi a + bx i ) } x i =0 Systemet løses mht. a og b, som til slutt gir: b = xi x ) y i xi x ) 2 og a = y bx Bjørn H. Auestad Kp. 11: Regresjonsanalyse 13 / 57 Regresjonsanalyse; Minste kvadraters Eks. Dow Jones: For disse dataene er: n xi x ) y i = xi x ) 2 =76.07 x =0.554 og y = b = xi x ) y i xi x ) 2 og a = y bx Beregn MKE for skjæringspunkt og stigningstall! MKE = Minste Kvadraters Estimat Bjørn H. Auestad Kp. 11: Regresjonsanalyse 14 / 57

8 Regresjonsanalyse; Minste kvadraters Minstekvadraters estimatene av α og β: xi x ) y i b = xi x ) 2 og a = y bx Minstekvadraters estimatorene av α og β: β = xi x ) Y i xi x ) 2 og α = Y βx Vi skal studere de statistiske egenskapene til estimatorene for å kunne gjøre statistisk inferens i en regresjonsanalyse. Obs.: boken bruker notasjonen: A for α og B for β. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 15 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties of the least Squares Estimators 11.5 Inferences Concerning the Regression Coefficients 11.6 Prediction 11.7 Choice of a Regression Model 11.8 Analysis-of Variance Approach Data Plots and Transformations Simple Linear Regression Case Study Potential Misconceptions og er ikke med i pensum.) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 16 / 57

9 Regresjonsanalyse; Inferens Vi må finne Forventning og varians til estimatorene α A) og β B), ogen forventningsrett estimator for Varɛ i )=σ 2 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 17 / 57 Regresjonsanalyse; Inferens Forventning til β: { xi x ) Y i E β) = E xi x ) 2 = 1 xi x ) 2 } = 1 { xi x ) 2 E xi x ) } Y i xi x ) EY i ) }{{} α+βx i = = β Obs.: 1) x i x) =0 x i x)α =0 2) x i x)x i = x2 i xx i )= x2 i x x i = x2 i nx 2 = x i x) 2 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 18 / 57

10 Regresjonsanalyse; Inferens Varians til β: { xi x ) Y i Var β) = Var xi x ) 2 = = { n } 1 { n xi x ) } 2 2 Var xi x ) } Y i dersom Y i ene er uavhengige: { n 1 xi x ) } 2 2 xi x ) 2 VarY i ) = }{{} =Varɛ i )=σ 2 = σ 2 xi x ) 2 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 19 / 57 Regresjonsanalyse; Inferens Aktuell problemstilling: er virkelig β 0? Kan vi bruke β σ 2 x i x ) 2 som teststørrelse? Den har forventning null, under H 0 : β =0, og varians 1 Hva med fordeling? Vi kjenner ikke σ og kan dermed ikke beregne størrelsen). Bjørn H. Auestad Kp. 11: Regresjonsanalyse 20 / 57

11 Regresjonsanalyse; Inferens Fordeling til β: Antakelser: Y i = α + βx i + ɛ i ɛ i ene er u.i.f. N0,σ 2 ) Som betyr at Y i ene er normalfordelte.) Da: β = = xi x ) Y i xi x ) 2 x1 x ) xi x ) 2 Y xn x ) xi x ) 2 Y n Dvs. β er en lin.komb. av de uavhengige normalfordelte Y 1, Y 2,...,Y n,ogderfor er β normalfordelt. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 21 / 57 Regresjonsanalyse; Inferens Estimator for σ 2 = Varɛ i ): Forventningsrett estimator for Varɛ i )=σ 2 Teorem 11.1): σ 2 = S 2 = 1 n 2 Estimat beregnes vha.: SSE n 2 Yi Ŷi) 2 = 1 n 2 Y i = α + βx i + ɛ i { Yi α + βx i ) } 2 når MK-estimatene er innsatt i SSE) Har at: SSE = y i y) 2 b x i x)y i y). Bjørn H. Auestad Kp. 11: Regresjonsanalyse 22 / 57

12 Regresjonsanalyse; Inferens Eks. Dow Jones: For disse dataene er: n xi x ) y i = xi x )2 =76.07 yi y )2 = x =0.554 og y = Oppgave: Beregn estimat av σ 2! Har at: SSE = y i y) 2 b x i x)y i y) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 23 / 57 Regresjonsanalyse; Inferens Inferens om β. Teststørrelser. Med ukjent σ 2 : Derfor er under H 0 : β = 0, β S 2 x i x β β N0, 1) σ 2 n x i x) 2 β β tn 2) S 2 n x i x) 2 ) 2 fordelt som tn 2). Bjørn H. Auestad Kp. 11: Regresjonsanalyse 24 / 57

13 Regresjonsanalyse; Inferens Aktuell problemstilling: er virkelig β 0? Vil teste H 0 : β =0mot H 1 : β 0 Teststørrelse: β S 2 x i x ) 2 Oppgave: Gjennomfør en test for å teste om det virkelig er sammenheng mellom de fem første dagene og hele årsresultatet. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 25 / 57 Regresjonsanalyse; Inferens t-fordelingen til β: Under forutsetningene gjelder kan vises): n 2)S 2 σ 2 β = og S 2 er uavhengig av β og av α). χ 2 n 2, x1 x ) xn x ) xi x ) 2 Y xi x ) 2 Y n er normalfordelt. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 26 / 57

14 Regresjonsanalyse; Inferens Teorem 8.5, om t-fordeling: Dersom Z og V er to uavhengige tilfeldige variable der Z N0, 1) og V χ 2 ν,såer T = Obs.: Vi kan skrive: β β β β = S 2 S 2 n x i x) 2 Z V /ν t-fordelt med ν frihetsgrader. = β β σ 2 n 2)S 2 σ 2 /n 2) Tabellheftet, s. 27 og 36! Sxx /σ 2 Sxx /σ 2 Dvs.: = Z V /ν med ν = n 2 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 27 / 57 Regresjonsanalyse; Inferens Minstekvadraters estimatorene av α og β: Vi viste at: β normalfordelt osv. β = xi x ) Y i xi x ) 2 og α = Y βx E β) = β og Var β) = σ 2 xi x ) 2 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 28 / 57

15 Regresjonsanalyse; Inferens Vikanviseat: E α ) = α og Var α ) = σ 2 x2 i n xi x ) 2 E α) =EY βx) =EY ) E βx) = α = Y βx = 1 n = 1 n Y i xi x ) Y i xi x ) 2 x Y i xi x ) Y i x = 1 { x n i x ) } x Y i... lineærkombinasjon av uavhengige normalfordelte... 1 { n Var α) =Var x i x ) } x Y i = Bjørn H. Auestad Kp. 11: Regresjonsanalyse 29 / 57 Regresjonsanalyse; Inferens Oppsummert: Estimatoren for skjæringspunktet, α, er forventingsrett, har varians Var α ) = σ 2 er normalfordelt. x2 i n xi x ) 2 = σ2 x2 i,og n Bjørn H. Auestad Kp. 11: Regresjonsanalyse 30 / 57

16 EXCEL Modell: Y i = α + βx i + ɛ i Vi skal se nærmere på tester og konfidensintervalll for parametrene α og β. Litt om bruk av programpakker for å gjøre regresjonsanalyse.... EXCEL... Bjørn H. Auestad Kp. 11: Regresjonsanalyse 31 / 57 Intervall og tester Antakelser for å kunne gjøre standard inferens: Y i = α + βx i + ɛ i, i =1,...,n ɛ 1,...,ɛ n er u.i.f. N 0,σ 2 ) Det må alltid sjekkes om disse antakelsene er rimelige. Vi kommer tilbake til dette seinere.) Utgangspunkt for inferens: Under antakelsene gjelder: β β tn 2) og S 2 α α S 2 x2 i n tn 2) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 32 / 57

17 Intervall og tester F.eks., konfidensintervall: For β: For α: β t γ/2,n 2 S 2, β + tγ/2,n 2 S 2 S α t 2 n x2 i S γ/2,n 2, α + t 2 n ) x2 i ns γ/2,n 2 xx n ) Konfidensgrad: 1001 γ)% Bjørn H. Auestad Kp. 11: Regresjonsanalyse 33 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties of the least Squares Estimators 11.5 Inferences Concerning the Regression Coefficients 11.6 Prediction 11.7 Choice of a Regression Model 11.8 Analysis-of Variance Approach Data Plots and Transformations Simple Linear Regression Case Study Potential Misconceptions og er ikke med i pensum.) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 34 / 57

18 Prediksjon Formål med regresjonsanalyse: forstå og analysere sammenheng mellom x og y forklaringsvariabel / uavhengig variabel og respons / avhengig variabel ) predikere ny y-verdi for en gitt x-verdi med bilde av statistisk usikkerhet! Konfidensintervall for forventning gitt x 0 : μ Y x0 = EY x 0 ) Estimator: μ Y x0 = α + βx 0 Prediksjonsintervall for utfallet av Y 0 Y 0 : resultatet av en tenkt ny måling som skal gjøres for x-verdien x 0 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 35 / 57 Prediksjon Konfidensintervall for forventet verdi gitt x 0 : μ Y x0 = EY x 0 ) Estimator av forventet verdi: μ Y x0 = α + βx 0 kolesterol Prediksjonsintervall for utfallet av Y 0 Y 0 : resultatet av en tenkt ny måling som skal gjøres for x-verdien x 0 kolesterol alder alder Bjørn H. Auestad Kp. 11: Regresjonsanalyse 36 / 57

19 Prediksjon Konfidensintervall for μ Y x0 = EY x 0 ) μ Y x0 = EY x 0 )=α + βx 0 Estimator: μ Y x0 = α + βx 0 Egenskaper til estimator: { 1 E μ Y x0 )=α + βx 0 og Var μ Y x0 )=σ 2 n + x 0 x) 2 } Det kan vises at: μ Y x0 μ Y x0 { 1 S 2 n + x 0 x) 2 } tn 2) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 37 / 57 Prediksjon Dermed er et 1001 γ)% konfidensintervall for forventet verdi μ Y x0 = EY x 0 )=α + βx 0,gittved: α + βx 0 t γ/2,n 2 S 2 { 1 n + x 0 x) 2 }, α + βx 0 + t γ/2,n 2 { 1 S 2 n + x 0 x) 2 }) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 38 / 57

20 Prediksjon Prediksjonsintervall for utfall av) Y 0 Y 0 = α + βx 0 + ɛ 0 Utfallet av en ny måling for x = x 0 ) Estimator: Ŷ0 = α + βx 0 = μ Y x0 samme som for μ Y x0 ) Vi betrakter Ŷ0 Y 0 = μ Y x0 Y 0. Egenskaper: E μ Y x0 Y 0 )=0 og Var μ Y x0 Y 0 )=σ 2 { 1+ 1 n + x 0 x) 2 Det kan vises at: μ Y x0 Y 0 { S n + x 0 x) 2 } tn 2) } Bjørn H. Auestad Kp. 11: Regresjonsanalyse 39 / 57 Prediksjon Dermed er et 1001 γ)% prediksjonsintervall for Y 0,gittved: { α + βx 0 t γ/2,n 2 S n + x 0 x) 2 }, S xx { α + βx 0 + t γ/2,n 2 S n + x 0 x) 2 }) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 40 / 57

21 11.7 Valg av Antar lineær samenheng. Vil kunne gi i noen grad feil resultat dersom modellantakelsen ikke er oppfylt. Den lineære modellen kan ofte være fornuftig å bruke som en approksimasjon. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 41 / 57 Oppgaver Oppgavesett 6. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 42 / 57

22 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties of the least Squares Estimators 11.5 Inferences Concerning the Regression Coefficients 11.6 Prediction 11.7 Choice of a Regression Model 11.8 Analysis-of Variance Approach Data Plots and Transformations Simple Linear Regression Case Study Potential Misconceptions og er ikke med i pensum.) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 43 / ANOVA-tabell i Modell: Y i = α + βx i + ɛ i Når a og b er minstekvadraters estimatene av α og β gjelder følgende: y i y) 2 = = y i ŷ i + ŷ i y) 2 ŷ i = a + bx i ) y i ŷ i ) 2 + sst = sse + ssr ŷ i y) 2 +2 y i ŷ i )ŷ i y) } {{ } =0 Bjørn H. Auestad Kp. 11: Regresjonsanalyse 44 / 57

23 11.8 ANOVA-tabell i sst= y i y) 2 sse= y i ŷ i ) 2 ssr= ŷ i y) 2 Siden sst = sse + ssr, vil ssr stor i forhold til sse, indikere at det er en virkelig regresjonssammenheng. Forholdet ssr ev. noe justert) er viktig. sse Bjørn H. Auestad Kp. 11: Regresjonsanalyse 45 / ANOVA-tabell i sse stor relativt til sst: mye støy og lite mønster ssr er relativt liten) sse liten relativt til sst: mindre støy og mer mønster ssr er relativt stor) For statistisk inferens basert på kvadratsummene definer tilfeldige variable): SST = Y i Y ) 2, SSE = Under H 0 : β =0er: SST σ 2 Y i Ŷi) 2 og SSR = χ 2 n 1 SSE σ 2 χ 2 n 2 Ŷi Y ) 2 SSR σ 2 χ 2 1 De tre størrelsene er statistisk uavhengige.) Merk at SSE χ 2 σ 2 n 2 også når β 0. Og intuitivt har vi at SSR σ 2 blir relativt stor dersom β 0. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 46 / 57

24 11.8 ANOVA-tabell i Bakgrunn: Teorem 8.4: DersomX 1,X 2,...,X n er u.i.f. N μ, σ 2 ),såer n 1) S2 σ 2 = 1 σ 2 Under H 0 : β =0er Y i ene u.i.f. X i X) 2 χ 2 n 1. altså også identisk fordelte) Størrelsene SST, SSE og SSR er av samme type som σ 2 σ 2 σ 2 kvadratsummen i teorem 8.4,... Bjørn H. Auestad Kp. 11: Regresjonsanalyse 47 / ANOVA-tabell i Med Teorem 8.6, om F -fordeling: Dersom U χ 2 ν 1 og V χ 2 ν 2 og U og V er uavhengige tilfeldige variable, så er... får vi: F = U/ ν 1 V / ν 2 F -fordelt med ν 1, ν 2 frihetsgrader. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 48 / 57

25 11.8 ANOVA-tabell i Test m/nivå α) forh 0 : β =0mot H 1 : β 0: Forkast H 0 dersom F = SSR / σ 1 2 SSE / = σ n 2 2 F -testen er ekvivalent med t-test. ) SSR / 1 SSE / n 2 = MSR MSE f α,1,n 2 Husk at SSE n 2 estimerer σ2 uansett om H 0 : β =0eller ikke. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 49 / ANOVA-tabell i Programmer for regresjonsanalyse har vanligvis utskriften i form av en ANOVA-tabell. ANOVA-tabell Kilde df SS MS F p-value Regresjon 1 SSR SSR/1 MSR/MSE P F >f obs ) Residual n 2 SSE SSE/n 2) Total n 1 SST Bjørn H. Auestad Kp. 11: Regresjonsanalyse 50 / 57

26 11.8 ANOVA-tabell i Eks.; ANOVA-tabell for kolesterol-data; EXCEL-bok. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 51 / 57 Determinasjonskoeffisienten Determinasjonskoeffisienten i kp. 11.5): R 2 = SSR SST =1 SSE SST 0 SSE SST 0 SSE SST 1) R 2 utrykker hvor stor del av total variasjon regresjonen forklarer. 0 R 2 1; mål på godhet til modell. SST = SSE + SSR Bjørn H. Auestad Kp. 11: Regresjonsanalyse 52 / 57

27 11.12 Korrelasjon Regresjon og korrelasjon: Estimert korrelasjon mellom x i ene og y i ene: r = n xi x ) y i y ) xi x ) 2 yi y ) 2 r et mål på type og styrke av statistisk sammenheng mellom to tilfeldige variable. r 2 er utregnet verdi av R 2. Vi får at r = S xy Sxx S yy = b S yy siden b = S xy ) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 53 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties of the least Squares Estimators 11.5 Inferences Concerning the Regression Coefficients 11.6 Prediction 11.7 Choice of a Regression Model 11.8 Analysis-of Variance Approach Data Plots and Transformations Simple Linear Regression Case Study Potential Misconceptions og er ikke med i pensum.) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 54 / 57

28 11.10 Dataplott i Regresjonsanalysen med inferns forutsetter at: det er tilnærmet) lineær sammenheng mellom x i og EY i ), Eɛ i )=0, ɛ i har konstant varians, Varɛ i )=σ 2 og ɛ i ene er uavhengige og normalfordelte normalantakelsen kan slakkes på dersom n stor) For å sjekke om antakelsene er oppfylt, bør vi sjekke: Spredningsdiagram for x i,y i )-dataparene, plott av residualene, e i = y i ŷ i mot x i, i, ŷ i og normalplott for residualene. En god del former for ikkelineariteter kan håndteres med denne formen for regresjonsanalyse. F.eks. Y i = α + βx 2 i + ɛ i, osv, se s. 426, , 384) i boken. Bjørn H. Auestad Kp. 11: Regresjonsanalyse 55 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties of the least Squares Estimators 11.5 Inferences Concerning the Regression Coefficients 11.6 Prediction 11.7 Choice of a Regression Model 11.8 Analysis-of Variance Approach Data Plots and Transformations Simple Linear Regression Case Study Potential Misconceptions and hazards 11.9 og er ikke med i pensum.) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 56 / 57

29 Obs! Potential Misconceptions and Hazards) Lag alltid spredningsdiagram av x i,y i )-dataene! Sjekk forutsetning om lineær sammenheng Lag residualplott! Sjekk forutsetning konstant varians Lag normalplott av residualene! Sjekk forutsetning normalfordelte ɛ i er Dersom n er stor, er normalantakelsen ikke så kritisk. F -ogt-testene gjelder da tilnærmet.) Bjørn H. Auestad Kp. 11: Regresjonsanalyse 57 / 57

Kp. 12 Multippel regresjon

Kp. 12 Multippel regresjon Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2 MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall

Detaljer

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne

Detaljer

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka: MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,

Detaljer

MOT310 Statistiske metoder 1, høsten 2011

MOT310 Statistiske metoder 1, høsten 2011 MOT310 Statistiske metoder 1, høsten 2011 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 30. oktober, 2011 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 15 -tabell

Detaljer

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47) MOT310 tatistiske metoder 1 Løsningsforslag til eksamen vår 006, s. 1 Oppgave 1 a) En tilfeldig utvalgt besvarelse får F av sensor 1 med sannsynlighet p 1 ; resultatene for ulike besvarelser er uavhengige.

Detaljer

10.1 Enkel lineær regresjon Multippel regresjon

10.1 Enkel lineær regresjon Multippel regresjon Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel

Detaljer

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1 MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Oppgave 1 a) Normalantakelse: Målingene x 1,..., x 21 og y 1,..., y 8 betraktes som utfall av tilfeldige variable X 1,..., X 21

Detaljer

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i: MOT310 tatistiske metoder 1 Løsningsforslag til eksamen høst 010, s 1 Oppgave 1 a) Anlysetype: enveis variansanalyse (ANOVA) Modell for y ij ekspedisjonstid nr j for skrankeansatt nr i: Y ij µ i + ε ij,

Detaljer

Kp. 13. Enveis ANOVA

Kp. 13. Enveis ANOVA -tabell Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 13 Kp. 13: Én-faktor -tabell 13.1 Analysis-of-Variance Technique 13.2 The Strategy of Experimental Design 13.3 One-Way Analysis of Variance: Completely

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,

Detaljer

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert! MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Flott! Samlet sett leverer dere gode resultater. Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert! Totalt

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt

Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt uten med Kp 14 Flerfaktor-eksperiment Bjørn H Auestad Kp 14: To-faktor eksperiment 1 / 20 Kp 14: Flerfaktor-eksperiment; oversikt uten med 141 Introduction 142 Interaction in the Two-Factor Experiment

Detaljer

Løsningsforslag eksamen 25. november 2003

Løsningsforslag eksamen 25. november 2003 MOT310 Statistiske metoder 1 Løsningsforslag eksamen 25. november 2003 Oppgave 1 a) Vi har µ D = µ X µ Y. Sangere bruker generelt trapesius-muskelen mindre etter biofeedback dersom forventet bruk av trapesius

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-

Detaljer

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 12 Denne øvingen består av oppgaver om enkel lineær regresjon. De handler blant

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30

Detaljer

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1 Løsningsforslag for: MOT10 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 6. november 007 TILLATTE HJELPEMIDLER: Kalkulator: HP0S, Casio FX8 eller TI-0 Tabeller og formler i statistikk (Tapir forlag) MERKNADER:

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

Inferens i regresjon

Inferens i regresjon Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Oppgave 14.1 (14.4:1)

Oppgave 14.1 (14.4:1) MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) Modell: Oppgave 4. (4.4:) Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave

Detaljer

Fasit og løsningsforslag STK 1110

Fasit og løsningsforslag STK 1110 Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek-

Oppgave 1. (x i x)(y i Y ) (Y i A Bx i ) 2 er estimator for σ 2 (A er minstek- MOT310 Statitike metoder 1 Løningforlag til ekamen vår 010,. 1 Oppgave 1 a) Modell: Y i α + βx i + ε i der ε 1,..., ε n u.i.f. N 0, σ ). b) Vil tete: Tettørrele H 0 : β 0 mot H 1 : β 0 B β T t n under

Detaljer

år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9

år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9 TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

vekt. vol bruk

vekt. vol bruk UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2 TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 12, blokk II Denne øvingen består av oppgaver om enkel lineær regresjon. De handler

Detaljer

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32). Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 16. november 2009 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt. EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir forlag) OPPGAVESETTET

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.

Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at

Detaljer

EKSAMEN I TMA4255 ANVENDT STATISTIKK

EKSAMEN I TMA4255 ANVENDT STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25.

Detaljer

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor

Detaljer

Regresjon med GeoGebra

Regresjon med GeoGebra Praksis og Teori Askim videregående skole 14.08.14 1 Lærplanmål 2 Punkter og Lister 3 Regresjon 4 Teori 5 Nytt verktøy Læreplanmål i 2P Modellering gjere målingar i praktiske forsøk og formulere matematiske

Detaljer

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren

Detaljer

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 3. juni 2016 Eksamenstid (fra til): 09:00-13:00

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT310 STATISTISKE METODER VARIGHET: 4 TIMER DATO: 27. FEBRUAR 2004 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 5

Detaljer

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Multippel regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Det er fortsatt en responsvariabel y. Måten dette gjøre på er nokså

Detaljer

Kapittel 2: Hendelser

Kapittel 2: Hendelser Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en

Detaljer

STK juni 2016

STK juni 2016 Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6

Detaljer

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader. FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da

Detaljer

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Oppgave 1: Pengespill a) For hver deltaker har vi følgende situasjon: Deltakeren får en serie oppgaver. Hver runde har to mulige utfall: Deltakeren

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten

Detaljer

Ridge regresjon og lasso notat til STK2120

Ridge regresjon og lasso notat til STK2120 Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle

Detaljer

Forelesning 8 STK3100/4100

Forelesning 8 STK3100/4100 Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -

Detaljer

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser. ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 0, s. 1 (Det tas forbehold om feil i løsningsforslaget.) a) Gjennomsnitt: x = 1 Emp. standardavvik: Median: 1 (1.33 + 1.) = 1.35

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp. ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. 6 Hypotesetesting Hypotesetesting (kp. 6) Tre deler av faget/kurset:. Beskrivende statistikk. Sannsynlighetsteori, sannsynlighetsregning 3. Statistisk

Detaljer

Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = 27000000 for produkt 2.

Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = 27000000 for produkt 2. Oppgave 1 (25 %) Resultater fra QM: a) Maximin = 0 ved ikke å lansere. b) Maximax = 27000000 for produkt 2. c) EMV max = 1000000 * 0.8 + 27000000 * 0.2 = 4600000 for produkt 2. d) 0.2 * 27000000 4600000

Detaljer

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse Netto innfl. Befolkning og velferd ECON 1730, H2016 Regresjonsanalyse Problem: Gitt planer for 60 nye boliger i kommunen neste år, hvor mange innflyttere kan vi forvente? Tabell Vestby kommune Nye boliger

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ... ÅMA Sannsynlighetsregning med statistikk, våren 6 Kp. 6 (kp. 6)... Begrep: nullhypotese alternativhypotese ensidig, tosidig teststørrelse (testobservator) nullfordeling kritisk verdi, forkastningsområde

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 4. juni 2016 Eksamenstid (fra til): 09.00

Detaljer

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x

Detaljer

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk Gruvedrift Notat for TMA/TMA Statistikk Institutt for matematiske fag, NTNU I forbindelse med planlegging av gruvedrift i et område er det mange hensyn som må tas når en skal vurdere om prosjektet er lønnsomt.

Detaljer

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: August 2016 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte

Detaljer

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet

Detaljer

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.

EKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute. Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»

Detaljer

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4245 Statistikk Faglig kontakt under eksamen: Ingelin Steinsland a, Øyvind Bakke b Tlf: a 73 59 02 39, 926 63 096, b 73 59 81 26, 990 41 673 Eksamensdato:

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.

Detaljer

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 04. desember 2015 Eksamenstid (fra til): 09:00

Detaljer

Fra krysstabell til regresjon

Fra krysstabell til regresjon Fra krysstabell til regresjon La oss si at vi er interessert i å undersøke i hvilken grad arbeidstid er avhengig av utdanning. Vi har ca. 3200 observasjoner (dvs. arbeidstakere som er spurt). For hver

Detaljer

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Dette er det andre settet med obligatoriske oppgaver i STK1110 høsten 2010. Oppgavesettet består av fire oppgaver. Det er valgfritt om du vil

Detaljer

Eksamensoppgave i TMA4255 Anvendt statistikk

Eksamensoppgave i TMA4255 Anvendt statistikk Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 16. mai 2015 Eksamenstid (fra til): 09:00-13:00

Detaljer

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1 ÅMA 0 (TE 99) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 005, s. Oppgave a) P (X 0) 0.04 + 0.04 + 0.06 + 0.06 + 0. + 0. + 0. 0.6 P (0 X 40) 0.0 + 0.0 + 0.04 + 0.04 + 0.06 0.0 P

Detaljer

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgåve i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgåve i TMA4240 Statistikk Fagleg kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett

Detaljer

2.2 Korrelasjon. Våre øyne ikke gode til å bedømme hvor sterk en sammenheng er Trenger kvantitativt mål på sammenheng Korrelasjon et slikt mål

2.2 Korrelasjon. Våre øyne ikke gode til å bedømme hvor sterk en sammenheng er Trenger kvantitativt mål på sammenheng Korrelasjon et slikt mål 2.2 Korrelasjon Våre øyne ikke gode til å bedømme hvor sterk en sammenheng er Trenger kvantitativt mål på sammenheng Korrelasjon et slikt mål Korrelasjon Korrelasjon: Kvantitativt mål på lineær sammenheng

Detaljer

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N

Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N 1 Universitetet i Agder Fakultet for økonomi og samfunnsfag E K S A M E N Emnekode: Emnenavn: BE-34 Statistikk og finans Dato: 6. desember 21 Varighet: 9-13 Antall sider inkl. forside 6 Tillatte hjelpemidler:

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk ÅMA Sannsynlighetsregning med statistikk, våren 2 Kp. 6 Hypotesetesting Hypotesetesting (kp. 6) Tre deler av faget/kurset:. Beskrivende statistikk 2. Sannsynlighetsteori, sannsynlighetsregning 3. Statistisk

Detaljer

Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.

Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2. Kapittel 2 Utforske og beskrive data Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.4 denne uken To kryssplott av samme datasett, men med forskjellig skala

Detaljer

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 3. juni Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator Side 1 av 11 sider EKSAMENSOPPGAVE I STA-1002 Eksamen i : STA-1002 Statistikk og sannsynlighet 2 Eksamensdato : 3. juni 2011. Tid : 09-13. Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent

Detaljer

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1 ECON 0 EKSMEN 007 VÅR SENSORVEILEDNING Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom >. Oppgave. La begivenhetene BC,, være slik at og

Detaljer

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2007 TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,

Detaljer

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015

Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015 Løsningsforsalg til andre sett med obligatoriske oppgaver i STK1110 høsten 2015 R-kode for alle oppgaver er gitt bakerst. Oppgave 1 (a) Boksplottet antyder at verdiene er høyere for kvinner enn for menn.

Detaljer

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar.

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar. Statistisk behandling av kalibreringsresultatene Del 4. v/ Rune Øverland, Trainor Elsikkerhet AS Denne artikkelserien handler om statistisk behandling av kalibreringsresultatene. Dennne artikkelen tar

Detaljer

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Oppgavesett 5, s. 1. Oppgave 1. Oppgave 2. Oppgave 3

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Oppgavesett 5, s. 1. Oppgave 1. Oppgave 2. Oppgave 3 Matematisk statistikk og stokastiske prosesser B, høsten 2006 Oppgavesett 5, s. 1 Oppgave 1 For AR(2)-modellen: X t = 0.4X t 1 + 0.45X t 2 + Z t (der {Z t } er hvit søy med varians 1), finn γ(3), γ(4)

Detaljer

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x

i=1 x i = og 9 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x TMA4245 Statistikk Vår 2017 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 4 Dette er den andre av to innleveringer i blokk 2, og den siste innleveringen i øvingsopplegget.

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:

Detaljer