SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår 2003. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Like dokumenter

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 04. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

Litt enkel matematikk for SOS3003

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Språk og skrift som er brukt i SOS3003

Ref.: Fall SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 05

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 08. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Forelesning 13 Regresjonsanalyse

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 02. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

EKSAMENSOPPGÅVER Sommar 1996 FRAMLEGG TIL LØYSING Erling Berge

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Spørsmål. 21 april Vår Krav til semesteroppgåva

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

EKSAMENSOPPGAVE I IDRSA1004 Samfunnsvitenskapelig forskningsmetode og analyse

Lineære modeller i praksis

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Er det enklere å anslå timelønna hvis vi vet utdanningslengden? Forelesning 14 Regresjonsanalyse

SOS3003 Eksamensoppgåver

SOS 31 MULTIVARIAT ANALYSE

Kausalanalyse og seleksjonsproblem

Litt enkel matematikk for SOS3003

Forelesning 17 Logistisk regresjonsanalyse

SOS 31 MULTIVARIAT ANALYSE

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Forelesning 18 SOS1002

Fra krysstabell til regresjon

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

PENSUM SOS Mål for kurset. SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Oversikt over Forelesingsnotat, vår 2003

Generelle lineære modeller i praksis

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 12. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Kort innføring i SPSS

Eksamensoppgave i ST3001

PENSUM SOS Forelesing I. SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår 2003

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

SKOLEEKSAMEN 29. september 2006 (4 timer)

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Du kan skrive inn data på same måte som i figuren under :

Literature. Regression towards the mean. Erling Berge POL3507 IMPLEMENTERING OG EVALUERING AV OFFENTLEG POLITIKK.

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 01. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Vi har ikkje behandla bustøttesøknaden fordi det manglar samtykke frå ein eller fleire i husstanden

Høye skårer indikerer høye nivåer av selvkontroll.

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

Årsrapport frå opplæringskontor i Hordaland om opplæring av lærlingar og lærekandidatar (Lærebedriftene skal bruka eit eige skjema.

EKSAMENSOPPGAVE FOR SOS3003: ANVENDT STATISTISK DATAANALYSE

Matematikk 1, 4MX15-10E1 A

Dersom summen vert over 400 g må ein trekkje dette frå.

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Lammedødelegheit - genetiske parametre

Erling Berge Institutt for sosiologi og statsvitenskap Norges Teknisk Naturvitskapelege Universitet

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Institutt for økonomi og administrasjon

Klassisk ANOVA/ lineær modell

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

Hvorfor har forskjellen. i t-testen på nå blitt redusert til ?

EKSAMEN I SOS1120 KVANTITATIV METODE 5. DESEMBER 2005 (4 timer)

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Emnenavn: Eksamenstid: Faglærer: Bjørnar Karlsen Kivedal

Matpakkematematikk. Data frå Miljølære til undervisning. Samarbeid mellom Pollen skule og Miljølære. Statistikk i 7.klasse

UNDERSØKING OM MÅLBRUKEN I NYNORSKKOMMUNAR RAPPORT

Matematisk samtale og undersøkingslandskap

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

STV1020 våren 2018 oppgave 31. Se nederst i dokumentet for nynorsk versjon.

Sensorveiledning til eksamensoppgave i SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap

Forelesning 16 Regresjonsanalyse 3. Regresjonsanalyse av timelønn. Modeller med samspill

FRAMLEGG TIL LØYSING AV EKSAMENSOPPGÅVER I SOS311 / SOS MAI 1998

Saksnr Utval Møtedato Utdanningsutvalet I sak Ud-6/12 om anonym retting av prøver gjorde utdanningsutvalet slikt vedtak;

Om avskriving av tap på krav: Sjå økonomihandboka pkt og

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Logistisk regresjon 1

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

FRAMLEGG TIL LØYSING AV EKSAMENOPPGÅVER I SOS301/ SOS311 8 DES 1997

Logistisk regresjon 2

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Eksamensoppgåve i TMA4255 Anvendt statistikk

NORGES TEKNISK NATURVITSKAPELEGE UNIVERSITET Institutt for sosiologi og statsvitenskap FRAMLEGG TIL LØYSING AV EKSAMENOPPGÅVER I SOS31 9 DES 1996

HØGSKOLEN I STAVANGER

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Transkript:

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår 2003 Erling Berge Institutt for sosiologi og statsvitenskap NTNU Vår 2004 Erling Berge 2004 1 Forelesing IV Multivariat regresjon II Hamilton Kap 3 s84-101, Hardy 1993 Regression with dummy variables Semesteroppgåve Val/ tildeling av avhengig variabel Eigne data, data frå tidlegare oppgåver Data frå European Social Survey (ESS) Vår 2004 Erling Berge 2004 2

Interaksjonseffektar i regresjon Ein interaksjonseffekt mellom x og w kan inkluderast i ein regresjonsmodell ved å ta inn ein hjelpevariabel lik produktet av dei to, dvs. Hjelpevariabel H=x*w y i = b 0 + b 1 *x i + b 2 *w i + b 3 *H i + e i y i = b 0 + b 1 *x i + b 2 *w i + b 3 *x i *w i + e i Vår 2004 Erling Berge 2004 3 Eksempel frå Hamilton(s85-91) Sett y = naturleg logaritme av klorid konsentrasjon x = djupna av brønnen (1=djup, 0=grunn) w = naturleg logaritme av avstand frå vei xw = interaksjonsledd mellom avstand og djupn (produktet x*w). Da er ŷ i = b 0 + b 1 x i + b 2 w i + b 3 x i w i Vi ser først på dei enkle modellane utan interaksjon Vår 2004 Erling Berge 2004 4

Figures 3.3 and 3.4 (Hamilton p85-86) Tabell 3.3 Dependent Variable: lnchlorideconcentra (Constant) B 3.775 Std. Error.429 Beta t 8.801 Sig..000 x= BEDROCK OR SHALLOW WELL? -.706.477 -.205-1.479.145 Tabell 3.4 Dependent Variable: lnchlorideconcentra B Std. Error Beta t Sig. (Constant) 4.210.961 4.381.000 w= lndistancefromroad -.091.180 -.071 -.506.615 x= BEDROCK OR SHALLOW WELL? -.697.481 -.202-1.449.154 Vår 2004 Erling Berge 2004 5 Figure 3.3 7,00 6,00 lnchlorideconcentra 5,00 4,00 3,00 ỹ 0 = 3.78 ỹ 1 = 3.07 2,00 1,00 0,00 0,20 0,40 0,60 0,80 1,00 BEDROCK OR SHALLOW WELL? Vår 2004 Erling Berge 2004 6

7,00 Figure 3.4 6,00 lnchlorideconcentra 5,00 4,00 3,00 2,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 lndistancefromroad Vår 2004 Erling Berge 2004 7 Figures 3.5 and 3.6 (Hamilton p89-91) Tabell 3.5 Dependent Variable: lnchlorideconcentra B Std. Error Beta t Sig. (Constant) 3.666.905 4.050.000 w= lndistancefromroad -.029.202 -.022 -.144.886 x*w= lndroaddeep -.081.099 -.128 -.819.417 Tabell 3.6 Also see Table 3.4 in Hamilton p90 Dependent Variable: lnchlorideconcentra B Std. Error Beta t Sig. (Constant) w= lndistancefromroad 9.073-1.109 1.879.384 -.862 4.828-2.886.000.006 x= BEDROCK OR SHALLOW WELL? -6.717 2.095-1.948-3.207.002 x*w= lndroaddeep 1.256.427 1.979 2.942.005 Vår 2004 Erling Berge 2004 8

Figure 3.5 7,00 6,00 lnchlorideconcentra 5,00 4,00 3,00 X=0 X=1 2,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 lndistancefromroad Vår 2004 Erling Berge 2004 9 Figure 3.6 7,00 6,00 lnchlorideconcentra 5,00 4,00 3,00 X=1 2,00 1,00 X=0 2,00 3,00 4,00 5,00 6,00 7,00 8,00 lndistancefromroad Vår 2004 Erling Berge 2004 10

Multikollinearitet Når vi tar med alle tre variablane, x, w og x*w vil vi også introdusere eit visst element av multikollinaritet. Vi kan ikkje stole på testane av einskildkoeffesientar Som førre eksempel viser kan vi imidlertid ikkje droppe ein av dei utan fare for å droppe ein relevant variabel F-test av t.d. w og z*w under eitt unngår testproblemet, og litt eksprimentering med ulike modellar vi vise om utelating av w eller x*w endrar samanhengane substansielt Vår 2004 Erling Berge 2004 11 Nominalskalavariable Kan inkluderast i regresjonsmodellar ved å lage nye hjelpevariablar: ein for kvar kategori i nominalskalavariabelen Dersom vi har ein intervallskala avhengig variabel og ein nominalskala uavhengig variabel vil ein ofte analysere den ved hjelp av variansanalyse (ANOVA) Ved introduksjon av hjelpevariable kan vi utføre samme analysane i regresjonsmodellen Vår 2004 Erling Berge 2004 12

Variansanalyse -ANOVA Analyse av ein intervallskala avhengig variabel og ein eller fleire nominalskalavariable, ofte kalla faktorar Einvegs ANOVA nyttar ein nominalskalavariabel Tovegs ANOVA nyttar to nominalskalavariable OSV Testar av skilnader mellom grupper baserer seg på vurderingar av om variasjonen innan ei gruppe (definert av faktorane ) er stor eller liten relativt til variasjonen mellom gruppene Vår 2004 Erling Berge 2004 13 Nominalskalavariable i regresjon (1) Dersom den kategoriske variabelen har J kategoriar kan vi maksimalt ta med J-1 hjelpevariablar i regresjonen ( H(j), j=1,..., J-1) Den utelatne hjelpevariabelen kallar vi referansekategorien Missing bør som regel kodast som eigen variabel og inkluderast i analysen Vår 2004 Erling Berge 2004 14

Nominalskalavariable i regresjon (2) Dummy-koding av nominalskalavariable Hjelpevariabel H(j) vert koda 1 for person nr i dersom person nr i er å finne i kategori j på nominalskalavariabelen, den vert koda 0 dersom person i ikkje er i kategori j. Gjennomsnittet for ein dummy-koda variabel er proporsjonen med verdi 1. Vår 2004 Erling Berge 2004 15 Nominalskalavariable i regresjon (3) Referansekategori (den utelatne hjelpevariabelen) Ein bør velge ein stor og eintydig definert kategori som referansekategori Den estimerte effekten av inkluderte hjelpevariablar måler effekten av å vere i den inkluderte kategorien relativt til å vere i referansekategorien Vår 2004 Erling Berge 2004 16

Nominalskalavariable i regresjon (4) Dette tyder at Regresjonsparameteren for ein inkludert dummy-koda hjelpevariabel fortel om tillegg eller fradrag i forventa Y-verdi som personen i får ved å vere i denne kategorien heller enn i referansekategorien Vår 2004 Erling Berge 2004 17 Nominalskalavariable i regresjon (5) Testing I Test av om regresjonskoeffesienten for ein inkludert hjelpevariabel er ulik 0 gir svar på om dei personane som er i denne gruppa har ein gjennomsnittleg Y verdi som er ulik gjennomsnittet til personane som er i referansekategorien Vår 2004 Erling Berge 2004 18

Nominalskalavariable i regresjon (6) Testing II Test av om Nominalskalavariabelen bidrar signifikant til regresjonsmodellen samla sett må skje ved å teste om alle hjelpevariablane under eitt bidrar til regresjonen Vi kan da bruke F-testen, anten etter formelen 3.28 hos Hamilton (s.80) eller 3.3 hos Hardy (s.24). Desse er formelt identiske Vår 2004 Erling Berge 2004 19 Nominalskalavariable i regresjon (7) Interaksjon Når dummy-koda nominalskalavariablar inngår i interaksjonar må alle inkluderte hjelpevariablar multipliserast Vår 2004 Erling Berge 2004 20

Litt terminologi (1) Dummy-koding av nominalskalavariable vert gitt litt ulike namn i ulike lærebøker. Det vert kalla 1. Dummykoding av Hamilton, Hardy og Weisberg 2. Indikatorkoding av Menard (og Weisberg) 3. Referansekoding eller partialmetoden hos Hosmer&Lemeshow Vår 2004 Erling Berge 2004 21 Litt terminologi (2) For å reprodusere resultat frå variansanalyse ved hjelp av regresjon introduserer Hamilton ei koding av hjelpevariablane han kallar effektkoding. Hardy (kap5) kallar det også effektkoding. Hos andre vert det kalla 1. Avvikskoding av Menard, eller 2. Marginalmetoden eller avviksmetoden av Hosmer&Lemeshow For å få fram særlege gruppesamanlikningar introduserer Hardy (kap5) ein kodemåte ho kallar kontrastkoding Vår 2004 Erling Berge 2004 22

Ordinalskala variable kan inkluderast som intervallskala dersom den underliggjande teoretiske dimensjonen er kontinuerleg og avstandsmål er fornuftige elles kan dei nyttast direkte som y-variabel dersom estimeringsprogrammet er konstruert for det parametrar vert da estimert for kvart nivå over det lågaste som kumulative effektar i høve til lågaste nivå Vår 2004 Erling Berge 2004 23 Nominalskalavariabel POPULATION TYPE Frequency Percent Valid Percent Cumulative Percent POL 48 12.6 12.6 12.6 FARMER 132 34.7 34.7 47.4 POP 200 52.6 52.6 100.0 Total 380 100.0 100.0 Vår 2004 Erling Berge 2004 24

Eksempel på dummykoding Nominalskala Hjelpevariable Befolkningsgruppe Kode N H(1)= Pol H(2)= Farmer H(3)= People Politikarar 1 48 1 0 0 Bønder 2 132 0 1 0 Vanleg folk 3 200 0 0 1 Referansekategori Ein variabel med 3 kategoriar gir opphav til 2 dummykoda variablar i regresjonen med den tredje som referanse Vår 2004 Erling Berge 2004 25 Eksempel på effektkoding Nominalskala Hjelpevariable Befolkningsgruppe Kode N H(1)= Pol H(2)= Farmer Politikarar 1 48 1 0 Bønder 2 132 0 1 Vanleg folk 3 200-1 -1 Referansekategori I effektkodinga får referansekategorien koden -1. Effektkodinga gjer det mogeleg å duplisere alle F-testar i vanleg ANOVA analysar Vår 2004 Erling Berge 2004 26

Kontrastkoding Blir nytta til å få fram nett dei samanlikningane som har størst teoretisk interesse. Kontrastkoding krev Med J kategoriar må det lagast J-1 kontrastar Kodeverdiane på kvar hjelpevariabel må summere seg til 0 Kodeverdiane på to vilkårlege hjelpevariablar må vere ortogonale (vektorproduktet er lik 0) Vår 2004 Erling Berge 2004 27 Bruk av dummykoda variablar (1) Dependent Variable: I. of political contr. of sales of agric. est. (Constant) B 4.106 Std. Error.152 Beta t 26.991 Sig..000 Pol.914.337.147 2.711.007 Farmer.421.240.096 1.758.080 Konstanten viser her gjennomsnitt på avh var for referansekategorien Gjennomsnittet for politikarar er 0.91 meiningsskårepoeng over gjennomsnittet for referansekategorien Gjennomsnittet for bønder er 0.42 meiningsskårepoeng over gjennomsnittet for referansekategorien Vår 2004 Erling Berge 2004 28

Bruk av dummykoda variablar (2) Dependent Variable: I. of political control of sales of agricultural estates (Constant) B 4.264 Std. Error.186 t 22.954 Sig..000 Number of dekar land Owned.000.000 2.176.030 Pol.566.382 1.482.139 Farmer -.309.338 -.913.362 Samanlikn denne tabellen med den førre. Kva har endra seg? Korleis tolkar vi koeffesientane for Pol og Farmer? Vår 2004 Erling Berge 2004 29 Konklusjon fra kapittel 3 (1) Lineær regresjon kan lett utvidast til å nytte 2 eller fleire forklaringsvariablar. Dersom føresetnadene for regresjonen (at feilledda er uavhengige og identisk normalfordelte normal i.i.d. errors) er oppfylt, er regresjon eit allsidig og kraftig analyseverktøy for å studere samanhengen mellom fleire uavhengige variablar og ein avhengig Vår 2004 Erling Berge 2004 30

Konklusjon fra kapittel 3 (2) Den vanlegaste metoden for å estimere koeffesientar kallast OLS (minste kvadratsum metoden) Koeffesientar rekna ut i utvalet er estimat av tilsvarande populasjonsverdiar. Vi kan gjennom t-testen vurdere kor sikker eit koeffesient estimat er. Gjennom F-testen kan vi vurdere fleire koeffesientestimat under eitt Vår 2004 Erling Berge 2004 31 Konklusjon fra kapittel 3 (3) Dummyvariablar er nyttige på fleire måtar Ein einsleg dummykoda x variabel vil gi oss ein test på skilnad i gjennomsnitt for to grupper (0 og 1 gruppene) Nominalskalavariable med fleire enn 2 kategoriar kan omkodast ved hjelp av dummykoding og inkluderast i regresjonsanalysar Ved effektkoding vil vi kunne gjere variansanalyse av ANOVA-typen Vår 2004 Erling Berge 2004 32

Hamilton vs Hardy 1993 (1) 1. Merk at symbolbruken hos Hardy er litt annleis enn hos Hamilton, t.d. vert feilledda kalla u og ikkje e, det vert nytta store latinske bokstavar for utvalsparametrane og k står for talet av variablar. Hos Hamilton er K talet av parametrar 2. I lista over føresetnader for regresjonen har Hardy sitt krav nr 4 formelt samme funksjon som Hamilton sitt krav nr 1. Det må formulerast slik når x-variablane ikkje er faste ( fixed X ) men kan vere stokastiske variablar. Det sikrar at feilleddet og inkluderte x-variablar er ukorrelerte (dvs at modellen teknisk sett er korrekt) Vår 2004 Erling Berge 2004 33 Hamilton vs Hardy 1993 (2) Formel 3.1 på side 23 viser ein t-test for skilnaden mellom to regresjonskoeffesientar. Vi finn der uttrykket [var(b j )+var(b k )+ cov(b j B k )] 1/2 var(b j )= [SE(b j )] 2 dvs kvadratet av standardfeilen til b j i Hamilton cov(b j B k ) = er lik kovariansen mellom to parametrar. Vi får fram denne i SPSS ved å be om Covariance matrix i Statistics -opsjonen i regresjonsprosedyren Formel 4.5 på side 40 viser ein analog test for samla effekt av to variablar Vår 2004 Erling Berge 2004 34

Hamilton vs Hardy 1993 (3) Formel 3.3 side 24 viser ein F-test for skilnaden mellom to modellar basert på determinasjonskoeffesienten og talet på variablar i modellane. Formelt er testen identisk med den Hamiton har på side 80. I valet mellom dei to formlane kan effekten av avrundingsfeil i determinasjonskoeffesientane vere eit viktig moment Vår 2004 Erling Berge 2004 35 Nye moment hos Hardy 1993 (1) På sidene 53-56 og 60-61 vert det presentert testar for heteroskedastisitet Goldfeld-Quandt testen Levene s test Gleijser s test Den består i regresjon av residualen sin absoluttverdi Ie i I på kvar einskild forklaringsvariabel For nominalskalavariable måtte då alle hjelpevariablane inkluderst samtidig Den er nært beslekta med Levene s test Vår 2004 Erling Berge 2004 36

Nye moment hos Hardy 1993 (2) På siden 56-59 drøftast tolkninga av regresjonskoeffesientane til dummyvariablar når den avhengige variabelen er transformert med naturleg logaritme dvs y* = ln [opphaveleg y] Den prosentvise endringa i opphaveleg y som kan seiast å komme av at ein er i kategori 1 heller enn i kategori 0 er gitt ved formel 4.10 100[exp{b j } 1] Lineær regresjon med y* som avhengig variabel vert kalla ein semi-logaritmisk modell Vår 2004 Erling Berge 2004 37 Nye moment hos Hardy 1993 (3) På s61 drøftast problemet med val av signifikansnivå i multiple samanlikningar På s78 drøftast testing av kurvelinearitet På s80 visest korleis dummyvariablar kan nyttast til å lage bitvis regresjon, dvs når vi har visse terskelverdiar for x der vinkelkoeffesienten for regresjonslinja endrar seg drastisk Vår 2004 Erling Berge 2004 38