SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Like dokumenter
Ref.: Fall SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 05

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 06. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

The comparative change design. Literature. Erling Berge POL3507 IMPLEMENTERING OG EVALUERING AV OFFENTLEG POLITIKK. Regression and quasi-experiments

SOS3003 Eksamensoppgåver

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 02. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Eksamensoppgåver

FRAMLEGG TIL LØYSING AV EKSAMENOPPGÅVER I SOS301/ SOS311 8 DES 1997

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 08. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

FRAMLEGG TIL LØYSING AV EKSAMENSOPPGÅVER I SOS311 / SOS MAI 1998

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Oversikt over Forelesing Erling Berge Institutt for sosiologi og statsvitskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Eksamensoppgåver

PENSUM SOS Mål for kurset. SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Oversikt over Forelesingsnotat, vår 2003

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 12. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Kort overblikk over kurset sålangt

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Eksamensoppgåver

10.1 Enkel lineær regresjon Multippel regresjon

PENSUM SOS Forelesing I. SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår 2003

Appendiks 5 Forutsetninger for lineær regresjonsanalyse

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 09. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

EKSAMENSOPPGAVE STA-1001.

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Om eksamen. Never, never, never give up!

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Målform/språk: Bokmål Antall sider: 10. Psykologisk institutt

Om eksamen. Never, never, never give up!

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

Kapittel 3: Studieopplegg

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

SOS3003 Eksamensoppgåver

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

Løsningsforslag eksamen 27. februar 2004

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

SOS 31 MULTIVARIAT ANALYSE

Erling Berge Institutt for sosiologi og statsvitenskap Norges Teknisk Naturvitskapelege Universitet

Seminaroppgave 10. (a) Definisjon: En estimator θ. = θ, der n er et endelig antall. observasjoner. Forventningsretthet for β: Xi X ) Z i.

NORGES TEKNISK NATURVITSKAPELEGE UNIVERSITET Institutt for sosiologi og statsvitenskap FRAMLEGG TIL LØYSING AV EKSAMENOPPGÅVER I SOS31 9 DES 1996

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 01. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

TMA4245 Statistikk Eksamen desember 2016

Inferens i regresjon

EKSAMENSOPPGAVER STAT100 Vår 2011

ST0202 Statistikk for samfunnsvitere

EKSAMENSOPPGÅVER Vår 1997 FRAMLEGG TIL LØYSING Erling Berge

Kausalanalyse og seleksjonsproblem

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

SOS3003 Eksamensoppgåver

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

ST0202 Statistikk for samfunnsvitere

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

Fra krysstabell til regresjon

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

EKSAMEN I TMA4255 ANVENDT STATISTIKK

UNIVERSITETET I OSLO

Erling Berge Institutt for sosiologi og statsvitenskap Norges Teknisk Naturvitskapelege Universitet

Eksamensoppgåve i TMA4240 Statistikk

STK juni 2016

Spørsmål. 21 april Vår Krav til semesteroppgåva

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

EKSAMENSOPPGÅVER Sommar 1996 FRAMLEGG TIL LØYSING Erling Berge

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

Eksamensoppgave i ST3001

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

Spørsmål. 17 mars ) Kan du gi enforklaring på hva som menes med "nullhypotese" og at denne forkastes? Vil bare ha det oppklart.

EKSAMEN I TMA4245 STATISTIKK Tysdag 21. mai 2013 Tid: 09:00 13:00 (Korrigert )

EKSAMENSOPPGÅVER Haust 1995 FRAMLEGG TIL LØYSING Erling Berge

Statistikk og dataanalyse

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen august 2014

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 04. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

FRAMLEGG TIL LØYSING AV EKSAMENOPPGÅVER I SOS301/ SOS311 4 AUG 1997

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

ST0202 Statistikk for samfunnsvitere

vekt. vol bruk

Eksamensoppgåve i TMA4255 Anvendt statistikk

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Eksamensoppgåve i TMA4255 Anvendt statistikk

Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt

Kap. 8: Utvalsfordelingar og databeskrivelse

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

UNIVERSITETET I OSLO

1 + γ 2 X i + V i (2)

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

Transkript:

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår 2003 Erling Berge Institutt for sosiologi og statsvitenskap NTNU Vår 2004 Erling Berge 2004 1 Kritikk av regresjon I Forelesing V Hamilton Kap 4 s109-123 Vår 2004 Erling Berge 2004 2

Modellanalysar bygg på føresetnader OLS er ein enkel analyseteknikk med gode teoretiske eigenskapar, men Eigenskapane er basert på visse føresetnader Dersom føresetnadane ikkje held vil dei gode eigenskapane forvitre Å undersøkje i kva grad føresetnadane held er den viktigaste delen av analysen Vår 2004 Erling Berge 2004 3 OLS-REGRESJON: føresetnader I SPESIFIKASJONSKRAVET Føresetnaden er at modellen er rett II GAUSS-MARKOV KRAVA Sikrar at estimata er BLUE III NORMALFORDELTE RESTLEDD Sikrar at testane er valide Vår 2004 Erling Berge 2004 4

FØRESETNADER: I Spesifikasjonskravet Modellen er rett spesifisert dersom Forventa verdi av y, gitt verdien av dei uavhengige variablane, er ein lineær funksjon av parametrane til x-variablane Alle inkluderte x-variablar påverkar forventa y-verdi Ingen andre variablar påverkar forventa y- verdi samtidig som dei korrelerer med inkluderte x-variablar Vår 2004 Erling Berge 2004 5 FØRESETNADER: II Gauss-Markov krava (i) (1) x er gitt, dvs utanstokastisk variasjon (2) Feila har ein forventa verdi på 0 for alle i E(εi)=0 for alle i Gitt (1) og (2) vil ε i vere uavhengig av x k for alle k. Da gir OLS forventningsrette estimat av β (unbiased = forventningsrett) Vår 2004 Erling Berge 2004 6

FØRESETNADER: II Gauss-Markov krava (ii) (3) Feila har konstant varians for alle i Var(εi)=σ 2 for alle i (4) Feila er ukorrelerte med kvarandre Cov(εi, εj)=0 for alle i? j Vår 2004 Erling Berge 2004 7 FØRESETNADER: II Gauss-Markov krava (iii) Gitt (3) og (4) i tillegg til (1) og (2) får vi a. Estimat av standardfeilen til regresjonskoeffesientane er forventningsrette, og b. Gauss-Markov teoremet: OLS estimata har mindre varians enn alle andre lineære forventningsrette estimat. OLS gir BLUE (Best Linear Unbiased Estimate) Vår 2004 Erling Berge 2004 8

FØRESETNADER: II Gauss-Markov krava (iv) (1) - (4) kallast GAUSS-MARKOV krava Gitt (2) - (4) med tillegg av krav om at feila er ukorrelerte med variablane (jfr. Hardy s5), dvs.: cov (xik, εi)=0 for alle i,k er koeffesientar og standardfeil konsistente Vår 2004 Erling Berge 2004 9 Fotnote 1: Forventningsrette (unbiased) estimatorar Forventningsrett tyder at E[b k ] = β k I det lange løp vil vi treffe populasjonsverdien - β k - dersom vi trekkjer mange nok utval, reknar ut b k og tar gjennomsnittet av desse Vår 2004 Erling Berge 2004 10

Fotnote 2: Konsistente estimatorar Estimatoren er konsistent dersom vi har at når utvalsstorleiken (n) veks mot uendeleg går b mot β og sb mot σβ [b k er ein konsistent estimator for β k dersom vi for vilkårleg liten c har lim n?8 [Pr{ Ib k - β k I < c }] = 1 Vår 2004 Erling Berge 2004 11 Fotnote 3: Variansminimale estimatorar Variansminimale (effisente) estimatorar tyder at var(b k ) < var(a k ) for alle estimatorar a ulik b Ekvivalent: E[b k - β k ] 2 < E[a k - β k ] 2 for alle estimatorar a ulik b. Vår 2004 Erling Berge 2004 12

Fotnote 4: Skeive estimatorar Sjølv om krava til BLUE er oppfylt vil ein stundom kunne finne skeive estimatorar (dvs. dei er ikkje forventningsrette) som har mindre varians, t.d. i Ridge Regression Vår 2004 Erling Berge 2004 13 Fotnote 5: Ikkje-lineære estimatorar Det kan finnast ikkje-lineære estimatorar som er forventningsrette og har mindre varians enn BLUE estimatorane Vår 2004 Erling Berge 2004 14

FØRESETNADER: III Normalfordelte restledd (5) Dersom alle feila er normalfordelt med forventning 0 og standardavvik på 1, dvs. dersom εi ~ N(0, σ 2 ) for alle i vil ein kunne teste hypoteser om β og σ, og OLS estimata vil ha mindre varians enn estimat fra alle andre forventningsrette estimatorar OLS gir BUE (Best Unbiased Estimate) Vår 2004 Erling Berge 2004 15 Problem i regresjonsanalysar som ikkje kan testast Om alle relevante variablar er med Om det er målefeil i x ane Om forventa verdi til feilleddet er 0 (Dette er der samme som at vi ikkje kan sjekke om korrelasjonen mellom feilledd og x-variabel faktisk er 0. Dette er i prinsippet det samme som første punkt om at modellen er rett spesifisert) Vår 2004 Erling Berge 2004 16

Problem i regresjonsanalysar som kan oppdagast (1) Ikkje-lineære samband Inkludert irrelevant variabel Ikkje-konstant varians hos feilleddet Autokorrelasjon hos feilleddet Korrelasjonar mellom feilledd Ikkje-normale feilledd Multikollinearitet Vår 2004 Erling Berge 2004 17 Konsekvensar av problem (Hamilton, s113) Spesifikasjonskrav Normalfordeling Gauss- Markov krav Multikollinearitet Problem Ikkje-lie ært samband Utelatt relevant variabel Inkludert irrelevant variabel er m ålt med feil Heteroskedastisitet Autokorrelasjon er korrelert med e e er ikkje normalfordelt Uønska eigenskapar ved estimata Skeive estimat av b 0 0 0 0 0 Skeive estimat av SE b Vår 2004 Erling Berge 2004 18 0 0 0 Ugyldige t&ftestar 0 0 Høg var[b] - - - -

Problem i regresjonsanalysar som kan oppdagast (2) Utliggarar (ekstreme y-verdiar) Innflytelse (case med stor innverknad: uvanlege kombinasjonar av y og x- verdiar) Leverage (potensiale for innflytelse) Vår 2004 Erling Berge 2004 19 Studiar av Hjelpemiddel Ein-variabel fordelingar (frekvens fordeling og histogram) To-variabel samvariasjon (korrelasjon og scatterplott) Residualen (fordeling og i samvariasjon med predikert verdi) Vår 2004 Erling Berge 2004 20

Korrelasjon og scatterplott ENERGY CONSUM PTION PER PERSON MEAN ANNUAL POPULATIO N GROWTH FERTILIZER USE PER HECTARE CRUDE BIRTH RATE ENERGY CONSUMPTION PER PERSON Pearson Correlation 1 -,505,533 -,689 N 125 122 125 122 MEAN ANNUAL POPULATION GROWTH Pearson Correlation -,505 1 -,469,829 N 122 125 125 125 FERTILIZER USE PER HECTARE Pearson Correlation,533 -,469 1 -,589 N 125 125 128 125 CRUDE BIRTH RATE Pearson Correlation N Vår 2004 Erling Berge 2004 21 -,689 122,829 125 -,589 125 1 125 Korrelasjon og scatterplott CRUDE BIRTH... FERTILIZER USE... MEAN ANNUAL... ENERGY... ENERGY CONSUMPTION PER PERSON FERTILIZER USE PER HECTARE MEAN ANNUAL POPULATION GROWTH CRUDE BIRTH RATE Vår 2004 Erling Berge 2004 22

Heteroskedastisitet, (ikkje-konstant varians hos feilleddet) kan skuldast Målefeil (t.d. y meir nøyaktig ved større x) Utliggarar At ε i innheld eit viktig ledd som varierer saman med x og y (spesifikasjonsfeil) Spesifikasjonsfeil er det samme som feil modell og gir heteroskedastisitet Eit viktig diagnoseverktøy er plott av residual mot predikert verdi ( ŷ ) Vår 2004 Erling Berge 2004 23 Eksempel: Hamilton tabell 3.2 Dependent Variable: Summer 1981 Water Use (Constant) Income in Thousands Summer 1980 Water Use Education in Years head of house retired? # of People Resident, 1981 Increase in # of People Unstandardized Coefficients B 242,220 20,967,492-41,866 189,184 248,197 96,454 Std. Error 206,864 3,464,026 13,220 95,021 28,725 80,519 t 1,171 6,053 18,671-3,167 1,991 8,641 1,198 Sig.,242,000,000,002,047,000,232 Vår 2004 Erling Berge 2004 24

10000,00000 7500,00000 Unstandardized Residual 5000,00000 2500,00000 0,00000-2500,00000-5000,00000 0,00000 2000,00000 4000,00000 6000,00000 8000,00000 Unstandardized Predicted Value Basert på regresjonen i tabell 3.2 i Hamilton Vår 2004 Erling Berge 2004 25 Box-plott av residualen viser Tunge halar Mange utliggarar Svakt positiv skeiv fordeling 10000,00000 7500,00000 5000,00000 2500,00000 483 489 496 491 494 486 481 476 477 479 490 482 Vil nokon av utliggarane påverke regresjonen? 0,00000-2500,00000-5000,00000 384 54 358 152 236 112 435 Unstandardized Residual Vår 2004 Erling Berge 2004 26

Fordelinga sett frå ein annan vinkel Vår 2004 Erling Berge 2004 27 Band-regresjon Homoskedastisitet tyder at medianen (og gjennomsnittet) til absoluttverdien av residualen, dvs: median{iei}, skal vere om lag den same for alle verdiar av predikert y Dersom vi finn at medianen av Ie i I for gitt predikert verdi av y endrar seg systematisk med verdien av predikert y indikerer det heteroskedastisitet Slike analysar kan lett gjerast i SPSS Vår 2004 Erling Berge 2004 28

6000,00 5000,00 absoluttverdiresidual 4000,00 3000,00 2000,00 1000,00 0,00 0,00000 2000,00000 4000,00000 6000,00000 8000,00000 Unstandardized Predicted Value Absoluttverdien av e i (Basert på regresjonen i tabell 3.2 i Hamilton) Vår 2004 Erling Berge 2004 29 6000,00 Tilnærma bandregresjon (jfr figur 4.4 i Hamilton) 5000,00 483 489 absoluttverdiresidual 4000,00 3000,00 2000,00 1000,00 377 225 182 442 392 3 19 361 394 261 56 54 112 481 491 0,00 1 2 3 4 5 6 7 8 9 10 11 Unstandardized Predicted Value (Banded) Vår 2004 Erling Berge 2004 30

Autokorrelasjon (1) Korrelasjon mellom variabelverdiar på same variabel over ulike case (t.d. mellom ε i og ε i -1 ) Autokorrelasjon gir større varians og skeive estimat av standardfeil slik som heteroskedastisitet Når vi har enkelt tilfeldig utval frå ein populasjon, er autokorrelasjon usannsynleg Vår 2004 Erling Berge 2004 31 Autokorrelasjon (2) Autokorrelasjon kjem frå feilspesifikasjon av modellen Ein finn det typisk i tidsseriar og ved geografisk ordna case Testar (t.d. Durbin-Watson) er basert på sorteringsrekkefølgja av casa. Derfor: Ei hypotese om autokorrelasjon må spesifisere korleis casa skal sorterast Vår 2004 Erling Berge 2004 32

Durbin-Watson testen (1) d = n i= 2 ( e e ) 2 i= 1 i 1 Vår 2004 Erling Berge 2004 33 i n e 2 i Bør ikkje nyttast for autoregressive modellar, dvs. modellar der y-variabelen også finst som forklaringsvariabel (x-variabel) jfr tabell 3.2 Durbin-Watson testen (2) Samplingfordelinga til d-observatoren er kjent og tabellert som d L og d U (tabell A4.4 i Hamilton), talet av fridomsgrader baserer seg på n og K-1 Testregel: Forkast dersom d<d L Forkast ikkje dersom d>d U Dersom d L < d < d U kan det ikkje konkluderast d=2 tyder ukorrelerte residualar Positiv autokorrelasjon gir d<2 Negativ autokorrelasjon gir d>2 Vår 2004 Erling Berge 2004 34

Dagleg vassforbruk, gjennomsnitt pr månad Eksempel: 5,50 AVERAGE DAILY WATER USE 5,00 4,50 4,00 3,50 3,00 137,00 133,00 129,00 125,00 121,00 117,00 113,00 109,00 105,00 101,00 97,00 93,00 89,00 85,00 81,00 77,00 73,00 69,00 65,00 61,00 57,00 53,00 49,00 45,00 41,00 37,00 33,00 29,00 25,00 21,00 17,00 13,00 9,00 5,00 1,00 INDE NUMBER 1-137 Vår 2004 Erling Berge 2004 35 Vanleg OLS-regresjon der caset er månad Dependent Variable: AVERAGE DAILY WATER USE Unstandardized Coefficients t Sig. (Constant) B 3,828 Std. Error,101 38,035,000 AVERAGE MONTHLY TEMPERATURE,013,002 7,574,000 PRECIPITATION IN INCHES -,047,021-2,234,027 CONSERVATION CAMPAIGN DUMMY -,247,113-2,176,031 Predictors: (Constant), CONSERVATION CAMPAIGN DUMMY, AVERAGE MONTHLY TEMPERATURE, PRECIPITATION IN INCHES Vår 2004 Erling Berge 2004 36

Test for autokorrelasjon Dependent Variable: AVERAGE DAILY WATER 1 USE R,572(a) R Square,327 Adjusted R Square,312 Std. Error of the Estimate,36045 Durbin- Watson,535 Predictors: (Constant), CONSERVATION CAMPAIGN DUMMY, AVERAGE MONTHLY TEMPERATURE, PRECIPITATION IN INCHES N = 137, K-1 = 3 Finn grensene for å forkaste / akseptere nullhypotesa om ingen autorkorrelasjon med nivå 0,05 Vår 2004 Erling Berge 2004 37 Auto-korrelasjonskoeffesient m-te ordens autokorrelasjonskoeffesient r m = T m t= 1 ( e )( ) t e et+ m e T t= 1 ( e ) t e 2 Vår 2004 Erling Berge 2004 38

Residual Dagleg vassforbruk, månad 1,00000 Mean Unstandardized Residual 0,50000 0,00000-0,50000 136,00 131,00 126,00 121,00 116,00 111,00 106,00 101,00 96,00 91,00 86,00 81,00 76,00 71,00 66,00 61,00 56,00 51,00 46,00 41,00 36,00 31,00 26,00 21,00 16,00 11,00 6,00 1,00 INDE NUMBER 1-137 Vår 2004 Erling Berge 2004 39 Glidande gjennomsnitt Hanning Glidande median Glatting med 3 punkt e + e + e 3 et et et = + + 4 2 4 * t 1 t t+ 1 et = * 1 + 1 et {,, } e = median e e e * t t 1 t t+ 1 Vår 2004 Erling Berge 2004 40

Residual, glatta ein gong 0,75000 0,50000 Mean MA(RES_1,3,3) 0,25000 0,00000-0,25000-0,50000-0,75000 134,00 131,00 128,00 125,00 122,00 119,00 116,00 113,00 110,00 107,00 104,00 101,00 98,00 95,00 92,00 89,00 86,00 83,00 80,00 77,00 74,00 71,00 68,00 65,00 62,00 59,00 56,00 53,00 50,00 47,00 44,00 41,00 38,00 35,00 32,00 29,00 26,00 23,00 20,00 17,00 14,00 11,00 8,00 5,00 2,00 INDE NUMBER 1-137 Vår 2004 Erling Berge 2004 41 Residual, glatta to gonger 0,75000 0,50000 Mean MA(MA3RES_1,3,3) 0,25000 0,00000-0,25000-0,50000-0,75000 135,00 132,00 129,00 126,00 123,00 120,00 117,00 114,00 111,00 108,00 105,00 102,00 99,00 96,00 93,00 90,00 87,00 84,00 81,00 78,00 75,00 72,00 69,00 66,00 63,00 60,00 57,00 54,00 51,00 48,00 45,00 42,00 39,00 36,00 33,00 30,00 27,00 24,00 21,00 18,00 15,00 12,00 9,00 6,00 3,00 INDE NUMBER 1-137 Vår 2004 Erling Berge 2004 42

Residual, glatta fem gonger 0,60000 0,40000 Mean MA(MA3RES_5,3,3) 0,20000 0,00000-0,20000-0,40000-0,60000 132,00 129,00 126,00 123,00 120,00 117,00 114,00 111,00 108,00 105,00 102,00 99,00 96,00 93,00 90,00 87,00 84,00 81,00 78,00 75,00 72,00 69,00 66,00 63,00 60,00 57,00 54,00 51,00 48,00 45,00 42,00 39,00 36,00 33,00 30,00 27,00 24,00 21,00 18,00 15,00 12,00 9,00 6,00 INDE NUMBER 1-137 Vår 2004 Erling Berge 2004 43 Konsekvensar av autokorrelasjon Hypotesetestar og konfidensintervall er upålitelege. Regresjon kan likevel gi ein god beskrivelse av utvalet. Parametrane er forventningsrette Spesialprogram kan estimere standardfeil konsistent Ta inn i analysen variablar som påverkar hosliggjande case Ta i bruk teknikkar frå tidsserieanalyse (t.d.: analyser differansen mellom to tidspunkt) ( y) Vår 2004 Erling Berge 2004 44