SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 04. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Like dokumenter
SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 08. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Eksamensoppgåver

Ref.: Fall SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 05

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Spørsmål. 21 april Vår Krav til semesteroppgåva

Literature. Regression towards the mean. Erling Berge POL3507 IMPLEMENTERING OG EVALUERING AV OFFENTLEG POLITIKK.

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Eksamensoppgåver

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 02. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Kausalanalyse og seleksjonsproblem

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Forelesning 13 Regresjonsanalyse

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 12. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Eksamensoppgåver

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

Forelesning 17 Logistisk regresjonsanalyse

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

SOS 31 MULTIVARIAT ANALYSE

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Lineære modeller i praksis

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS3003 Eksamensoppgåver

SKOLEEKSAMEN 29. september 2006 (4 timer)

Generelle lineære modeller i praksis

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 13

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Fra krysstabell til regresjon

PENSUM SOS Forelesing I. SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår 2003

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 01. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 06. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Språk og skrift som er brukt i SOS3003

Litt enkel matematikk for SOS3003

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

Logistisk regresjon 1

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

TMA4245 Statistikk Eksamen desember 2016

EKSAMENSOPPGAVE STA-1001.

Eksamensoppgåve i TMA4255 Anvendt statistikk

PENSUM SOS Mål for kurset. SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Oversikt over Forelesingsnotat, vår 2003

Forelesning 18 SOS1002

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

STV1020 våren 2018 oppgave 31. Se nederst i dokumentet for nynorsk versjon.

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

EKSAMENSOPPGÅVER Sommar 1996 FRAMLEGG TIL LØYSING Erling Berge

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Høye skårer indikerer høye nivåer av selvkontroll.

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

FRAMLEGG TIL LØYSING AV EKSAMENSOPPGÅVER I SOS311 / SOS MAI 1998

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgave i ST3001

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Litt enkel matematikk for SOS3003

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Forelesning 7 STK3100

10.1 Enkel lineær regresjon Multippel regresjon

Befolkning og velferd ECON 1730, H2016. Regresjonsanalyse

Eksamensoppgåve i TMA4240 Statistikk

EKSAMEN I SOS4020 KVANTITATIV METODE 8. april (4 timer)

STK juni 2016

SOS 31 MULTIVARIAT ANALYSE

Regresjon med GeoGebra

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

PSYC 3101 KVANTITATIV METODE II Eksamen høst 2008

Eksamensoppgave i ST0103 Brukerkurs i statistikk

EKSAMEN I SOS4020 KVANTITATIV METODE (MASTER) 14. MAI 2004 (4 timer)

Tid: Torsdag 11. desember Emneansvarleg: Trygve Almøy

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 09. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SKOLEEKSAMEN 2. november 2007 (4 timer)

EKSAMENSOPPGAVE FOR SOS3003: ANVENDT STATISTISK DATAANALYSE

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

FRAMLEGG TIL LØYSING AV EKSAMENOPPGÅVER I SOS301/ SOS311 8 DES 1997

PSY Kvantitativ metode

vekt. vol bruk

UNIVERSITETET I OSLO

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Oversikt over Forelesing Erling Berge Institutt for sosiologi og statsvitskap NTNU

Logistisk regresjon 2

UTSATT SKOLEEKSAMEN I SOS KVANTITATIV METODE. 29. Mars 2017 (4 timer)

Kort overblikk over kurset sålangt

EKSAMENSOPPGAVER STAT100 Vår 2011

Transkript:

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 04 Erling Berge Institutt for sosiologi og statsvitenskap NTNU Erling Berge 2004 1 Forelesing IV Multivariat regresjon II Hamilton Kap 3 s84-101, Hardy, Melissa A. 1993 Regression with dummy variables Sage University Paper: QASS 93, London, Sage, Erling Berge 2004 2 Erling Berge 2004 1

Interaksjonseffektar i regresjon Ein interaksjonseffekt mellom x og w kan inkluderast i ein regresjonsmodell ved å ta inn ein hjelpevariabel lik produktet av dei to, dvs. Hjelpevariabel H=x*w y i = b 0 + b 1 *x i + b 2 *w i + b 3 *H i + e i y i = b 0 + b 1 *x i + b 2 *w i + b 3 *x i *w i + e i Erling Berge 2004 3 Eksempel frå Hamilton(s85-91) Sett y = naturleg logaritme av klorid konsentrasjon x = djupna av brønnen (1=djup, 0=grunn) w = naturleg logaritme av avstand frå vei xw = interaksjonsledd mellom avstand og djupn (produktet x*w). Da er ŷ i = b 0 + b 1 x i + b 2 w i + b 3 x i w i Vi ser først på dei enkle modellane utan interaksjon Erling Berge 2004 4 Erling Berge 2004 2

Figures 3.3 and 3.4 (Hamilton p85-86) Figure 3.3 is based on Dependent Variable: lnchlorideconcentra (Constant) B 3.775 Std. Error.429 Beta t 8.801 Sig..000 x= BEDROCK OR SHALLOW WELL? -.706.477 -.205-1.479.145 Figure 3.4 is based on Dependent Variable: lnchlorideconcentra B Std. Error Beta t Sig. (Constant) 4.210.961 4.381.000 w= lndistancefromroad -.091.180 -.071 -.506.615 x= BEDROCK OR SHALLOW WELL? -.697.481 -.202-1.449.154 Erling Berge 2004 5 Figure 3.3 7,00 6,00 lnchlorideconcentra 5,00 4,00 3,00 ỹ 0 = 3.78 ỹ 1 = 3.07 2,00 1,00 0,00 0,20 0,40 0,60 0,80 1,00 BEDROCK OR SHALLOW WELL? Erling Berge 2004 6 Erling Berge 2004 3

7,00 Figure 3.4 6,00 lnchlorideconcentra 5,00 4,00 3,00 2,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 lndistancefromroad Erling Berge 2004 7 Figures 3.5 and 3.6 (Hamilton p89-91) Figure 3.5 is based on Dependent Variable: lnchlorideconcentra B Std. Error Beta t Sig. (Constant) 3.666.905 4.050.000 w= lndistancefromroad -.029.202 -.022 -.144.886 x*w= lndroaddeep -.081.099 -.128 -.819.417 Figure 3.6 is based on Also see Table 3.4 in Hamilton p90 Dependent Variable: lnchlorideconcentra B Std. Error Beta t Sig. (Constant) w= lndistancefromroad 9.073-1.109 1.879.384 -.862 4.828-2.886.000.006 x= BEDROCK OR SHALLOW WELL? -6.717 2.095-1.948-3.207.002 x*w= lndroaddeep 1.256.427 1.979 2.942.005 Erling Berge 2004 8 Erling Berge 2004 4

Figure 3.5 7,00 6,00 lnchlorideconcentra 5,00 4,00 3,00 X=0 X=1 2,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 lndistancefromroad Erling Berge 2004 9 Figure 3.6 7,00 6,00 lnchlorideconcentra 5,00 4,00 3,00 X=1 2,00 1,00 X=0 2,00 3,00 4,00 5,00 6,00 7,00 8,00 lndistancefromroad Erling Berge 2004 10 Erling Berge 2004 5

Multikollinearitet Når vi tar med alle tre variablane, x, w og x*w vil vi også introdusere eit visst element av multikollinearitet. Vi kan ikkje stole på testane av einskildkoeffisientar Som førre eksempel viser kan vi imidlertid ikkje droppe ein av dei utan fare for å droppe ein relevant variabel F-test av t.d. w og z*w under eitt unngår testproblemet, og litt eksperimentering med ulike modellar vil vise om utelating av w eller x*w endrar samanhengane substansielt Erling Berge 2004 11 Nominalskalavariable Kan inkluderast i regresjonsmodellar ved å lage nye hjelpevariablar: ein for kvar kategori i nominalskalavariabelen. Med J kategoriar får vi H(j), j=1,,j hjelpevariablar Dersom vi har ein intervallskala avhengig variabel og ein nominalskala uavhengig variabel vil ein ofte analysere den ved hjelp av variansanalyse (ANOVA) Ved introduksjon av hjelpevariable kan vi utføre same analysane i regresjonsmodellen Erling Berge 2004 12 Erling Berge 2004 6

Variansanalyse -ANOVA Analyse av ein intervallskala avhengig variabel og ein eller fleire nominalskalavariable, ofte kalla faktorar Einvegs ANOVA nyttar ein nominalskalavariabel Tovegs ANOVA nyttar to nominalskalavariable OSV Testar av skilnader mellom grupper baserer seg på vurderingar av om variasjonen innan ei gruppe (definert av faktorane ) er stor eller liten relativt til variasjonen mellom gruppene Erling Berge 2004 13 Nominalskalavariable i regresjon (1) Dersom den kategoriske variabelen har J kategoriar kan vi maksimalt ta med J-1 hjelpevariablar i regresjonen ( H(j), j=1,..., J-1 vert inkludert; H(J) må utelatast) Den utelatne hjelpevariabelen kallar vi referansekategorien og er den viktigaste for tolkinga av analyseresultatet Erling Berge 2004 14 Erling Berge 2004 7

Nominalskalavariable i regresjon (2) Dummy-koding av nominalskalavariable Hjelpevariabelen H(j) vert koda 1 for person nr i dersom person nr i er å finne i kategori j på nominalskalavariabelen, den vert koda 0 dersom person i ikkje er i kategori j. Gjennomsnittet for ein dummykoda variabel er proporsjonen med verdi 1. Erling Berge 2004 15 Nominalskalavariable i regresjon (3) Referansekategori (den utelatne hjelpevariabelen) Det bør velgast ein stor og eintydig definert kategori som referansekategori Den estimerte effekten av inkluderte hjelpevariablar måler effekten av å vere i den inkluderte kategorien relativt til å vere i referansekategorien Erling Berge 2004 16 Erling Berge 2004 8

Nominalskalavariable i regresjon (4) Dette tyder at Regresjonsparameteren for ein inkludert dummykoda hjelpevariabel fortel om tillegg eller frådrag i forventa Y-verdi som personen i får ved å vere i denne kategorien heller enn i referansekategorien Erling Berge 2004 17 Nominalskalavariable i regresjon (5) Testing I Test av om regresjonskoeffisienten for ein inkludert hjelpevariabel er ulik 0 gir svar på om dei personane som er i denne gruppa har ein gjennomsnittleg Y verdi som er ulik gjennomsnittet til personane som er i referansekategorien Erling Berge 2004 18 Erling Berge 2004 9

Nominalskalavariable i regresjon (6) Testing II Test av om Nominalskalavariabelen yter signifikant til regresjonsmodellen samla sett må skje ved å teste om alle hjelpevariablane under eitt yter til regresjonen Vi kan da bruke F-testen, anten etter formelen 3.28 hos Hamilton (s.80) eller 3.3 hos Hardy (s.24). Desse er formelt identiske Erling Berge 2004 19 Nominalskalavariable i regresjon (7) Interaksjon Når dummy-koda nominalskalavariablar inngår i interaksjonar må alle inkluderte hjelpevariablar multipliserast med den variabelen ein trur den har interaksjon med Erling Berge 2004 20 Erling Berge 2004 10

Litt terminologi (1) Dummykoding av nominalskalavariable vert gitt litt ulike namn i ulike lærebøker. Det vert kalla 1. Dummykoding av Hamilton, Hardy og Weisberg 2. Indikatorkoding av Menard (og Weisberg) 3. Referansekoding eller partialmetoden hos Hosmer&Lemeshow Erling Berge 2004 21 Litt terminologi (2) For å reprodusere resultat frå variansanalyse ved hjelp av regresjon introduserer Hamilton ei koding av hjelpevariablane han kallar effektkoding. Hardy (kap5) kallar det også effektkoding. Hos andre vert det kalla 1. Avvikskoding av Menard, eller 2. Marginalmetoden eller avviksmetoden av Hosmer&Lemeshow For å få fram særlege gruppesamanlikningar introduserer Hardy (kap5) ein kodemåte ho kallar kontrastkoding Erling Berge 2004 22 Erling Berge 2004 11

Ordinalskala variable kan inkluderast som intervallskala dersom den underliggjande teoretiske dimensjonen er kontinuerleg og avstandsmål er fornuftige elles kan dei nyttast direkte som y-variabel dersom estimeringsprogrammet er konstruert for det parametrar vert da estimert for kvart nivå over det lågaste som kumulative effektar i høve til lågaste nivå Erling Berge 2004 23 Nominalskalavariabel POPULATION TYPE Frequency Percent Valid Percent Cumulative Percent POL 48 12.6 12.6 12.6 FARMER 132 34.7 34.7 47.4 POP 200 52.6 52.6 100.0 Total 380 100.0 100.0 Erling Berge 2004 24 Erling Berge 2004 12

Eksempel på dummykoding Nominalskala Hjelpevariable Befolkningsgruppe Kode N H(1)= Pol H(2)= Farmer H(3)= People Politikarar 1 48 1 0 0 Bønder 2 132 0 1 0 Vanleg folk 3 200 0 0 1 Referansekategori Ein variabel med 3 kategoriar gir opphav til 2 dummykoda variablar i regresjonen med den tredje som referanse Erling Berge 2004 25 Eksempel på effektkoding Nominalskala Hjelpevariable Befolkningsgruppe Kode N H(1)= Pol H(2)= Farmer Politikarar 1 48 1 0 Bønder 2 132 0 1 Vanleg folk 3 200-1 -1 Referansekategori I effektkodinga får referansekategorien koden -1. Effektkodinga gjer det mogeleg å duplisere alle F-testar i vanleg ANOVA analysar Erling Berge 2004 26 Erling Berge 2004 13

Kontrastkoding Blir nytta til å få fram nett dei samanlikningane som har størst teoretisk interesse. Kontrastkoding krev Med J kategoriar må det lagast J-1 kontrastar Kodeverdiane på kvar hjelpevariabel må summere seg til 0 Kodeverdiane på to vilkårlege hjelpevariablar må vere ortogonale (vektorproduktet er lik 0) Erling Berge 2004 27 Bruk av dummykoda variablar (1) Dependent Variable: I. of political contr. of sales of agric. est. (Constant) B 4.106 Std. Error.152 Beta t 26.991 Sig..000 Pol.914.337.147 2.711.007 Farmer.421.240.096 1.758.080 Konstanten viser her gjennomsnitt på avhengig variabel for referansekategorien Gjennomsnittet for politikarar er 0.91 meiningsskårepoeng over gjennomsnittet for referansekategorien Gjennomsnittet for bønder er 0.42 meiningsskårepoeng over gjennomsnittet for referansekategorien Erling Berge 2004 28 Erling Berge 2004 14

Bruk av dummykoda variablar (2) Dependent Variable: I. of political control of sales of agricultural estates (Constant) B 4.264 Std. Error.186 t 22.954 Sig..000 Number of dekar land Owned.000.000 2.176.030 Pol.566.382 1.482.139 Farmer -.309.338 -.913.362 Samanlikn denne tabellen med den førre. Kva har endra seg? Korleis tolkar vi koeffisientane for Pol og Farmer? Erling Berge 2004 29 Konklusjon fra kapittel 3 (1) Lineær regresjon kan lett utvidast til å nytte 2 eller fleire forklaringsvariablar. Dersom føresetnadene for regresjonen (at feilledda er uavhengige og identisk normalfordelte normal i.i.d. errors) er oppfylt, er regresjon eit allsidig og kraftig analyseverktøy for å studere samanhengen mellom fleire uavhengige variablar og ein avhengig Erling Berge 2004 30 Erling Berge 2004 15

Konklusjon fra kapittel 3 (2) Den vanlegaste metoden for å estimere koeffisientar kallast OLS (minste kvadratsum metoden) Koeffisientar rekna ut i utvalet er estimat av tilsvarande populasjonsverdiar. Vi kan gjennom t-testen vurdere kor sikker eit koeffisient estimat er. Gjennom F-testen kan vi vurdere fleire koeffisientestimat under eitt Erling Berge 2004 31 Konklusjon fra kapittel 3 (3) Dummyvariablar er nyttige på fleire måtar Ein einsleg dummykoda x variabel vil gi oss ein test på skilnad i gjennomsnitt for to grupper (0 og 1 gruppene) Nominalskalavariable med fleire enn 2 kategoriar kan omkodast ved hjelp av dummykoding og inkluderast i regresjonsanalysar Ved effektkoding vil vi kunne gjere variansanalyse av ANOVA-typen Erling Berge 2004 32 Erling Berge 2004 16

Hamilton vs Hardy 1993 (1) 1. Merk at symbolbruken hos Hardy er litt annleis enn hos Hamilton, t.d. vert feilledda kalla u og ikkje e, det vert nytta store latinske bokstavar for utvalsparametrane og k står for talet av variablar. Hos Hamilton er K talet av parametrar 2. I lista over føresetnader for regresjonen (s5) har Hardy sitt krav nr 4 formelt same funksjon som Hamilton sitt krav nr 1. Det må formulerast slik når x-variablane ikkje er faste ( fixed X ) men kan vere stokastiske variablar. Det sikrar at feilleddet og inkluderte x-variablar er ukorrelerte (dvs at modellen teknisk sett er korrekt) Erling Berge 2004 33 Hamilton vs Hardy 1993 (2) Formel 3.1 på side 23 viser ein t-test for skilnaden mellom to regresjonskoeffisientar. Vi finn der uttrykket ( Bj Bk) t = [var( B) + var( B) 2cov( BB)] j k j k 1/2 Erling Berge 2004 34 Erling Berge 2004 17

Hamilton vs Hardy 1993 (3) [var(b j )+var(b k )+ cov(b j B k )] 1/2 dvs kvadratrota av det som står i parentesen [ ] var(b j )= [SE(b j )] 2 dvs kvadratet av standardfeilen til b j i Hamilton cov(b j B k ) = er lik kovariansen mellom to parametrar. Vi får fram denne i SPSS ved å be om Covariance matrix i Statistics - opsjonen i regresjonsprosedyren Formel 4.5 på side 40 viser ein analog test for samla effekt av to variablar Erling Berge 2004 35 Hamilton vs Hardy 1993 (4) Formel 3.3 side 24 viser ein F-test for skilnaden mellom to modellar basert på determinasjonskoeffisienten og talet på variablar i modellane. Formelt er testen identisk med den Hamilton har på side 80. I valet mellom dei to formlane kan effekten av avrundingsfeil i Determinasjonskoeffisientane vere eit viktig moment F = ( R R )/( k k ) (1 ) /( 1) 2 2 3 1 3 1 2 R3 N k3 Erling Berge 2004 36 Erling Berge 2004 18

Nye moment hos Hardy 1993 (1) På sidene 53-56 og 60-61 vert det presentert testar for heteroskedastisitet Goldfeld-Quandt testen Levene s test Gleijser s test består i regresjon av residualen sin absoluttverdi Ie i I på kvar einskild forklaringsvariabel (kvar einskild x) NB: For nominalskalavariable måtte då alle hjelpevariablane inkluderst samtidig Den er nært beslekta med Levene s test Erling Berge 2004 37 Nye moment hos Hardy 1993 (2) På siden 56-59 drøftast tolkinga av regresjonskoeffisientane til dummyvariablar når den avhengige variabelen er transformert med naturleg logaritme dvs y* = ln [opphaveleg y] Den prosentvise endringa i opphaveleg y som kan seiast å komme av at ein er i kategori 1 heller enn i kategori 0 er gitt ved formel 4.10 100[exp{b j } 1] Lineær regresjon med y* = ln [opphaveleg y] som avhengig variabel vert kalla ein semilogaritmisk modell Erling Berge 2004 38 Erling Berge 2004 19

Nye moment hos Hardy 1993 (3) På s61 drøftast problemet med val av signifikansnivå i multiple samanlikningar. Om Bonferroni ulikskapen sjå også note 16 til kapittel 4 i Hamilton. På s78 drøftast testing av kurvelinearitet Ein metode er å bruke dummyvariable (td definert over utdanningsgrupper i staden for å tru på linearitet over år utdanning) På s80 visest korleis dummyvariable kan nyttast til å lage bitvis regresjon. Dette er nyttig når vi har visse terskelverdiar for x der vinkelkoeffisienten for regresjonslinja endrar seg drastisk (td i studiet av viktige historiske hendingar i tidsseriedata) Erling Berge 2004 39 Erling Berge 2004 20