Emneplan for anvendt regresjonsanalyse Emnekode og emnenavn SPVARA/ Anvendt regresjonsanalyse Engelsk emnenavn Studieprogrammet emnet inngår i Applied regression analysis Valgfritt emne i ph.d.-studiet i profesjonsstudier (PHDPROF) Studiepoeng 10 studiepoeng Nivå Ph.d. Heltid/deltid Heltid Semester Høst Undervisningsspråk Norsk Godkjent av studieutvalget ved Høgskolen i Oslo og Akershus 10.august 2012 Gjeldende fra høstsemestret 2012 Senter for profesjonsstudier
Innledning Regresjonsanalyse er en statistisk metode som anvendes for å analysere hvordan ulike variabler er relatert til hverandre. Ved hjelp av regresjonsmodeller kan forbindelser mellom variabler beskrives og forklares, men også predikeres. I emnet behandles begreper fra sannsynlighets- og statistisk inferensteori, hvordan modellkontroller skal utføres og deres betydning for prosessen med å lage regresjonsmodeller. Kandidaten vil i løpet av kuset tilegne seg teoretiske og praktiske kunnskaper for å kunne anvende regresjonsanalyse som samfunns- og sosialvitenskapelig forskningsmetode på et avansert faglig nivå. Kurset gir kunnskaper om og forståelse av hvordan ulike regresjonsanalytiske modeller kan knyttes til forskningsmessige problemstillinger. Målgruppe Emnet er primært for studenter som er tatt opp i ph.d.-program. Ved ledige plasser er emnet åpent for andre interesserte med relevant mastergrad eller tilsvarende utdanning. HiOAtilsatte prioriteres ved opptak. Forkunnskapskrav Bestått mastergrad (120 studiepoeng) eller tilsvarende utdanning. Søkere må sende inn et sammendrag på om lag én A4-side med informasjon om eget ph.d.- prosjekt. Sammendraget sendes inn innen søknadsfristens utløp. For nærmere informasjon, se www.hioa.no/sps. Læringsutbytte Etter fullført emne har kandidaten følgende læringsutbytte definert i kunnskap og ferdigheter: Kunnskap Kandidaten har bred og oppdatert oversikt over utvalget av regresjonsanalytiske modeller og teknikker samt det sannsynlighetsteoretiske grunnlaget for disse teknikkene kan vurdere hensiktsmessigheten og anvendelsen av ulike regresjonsanalytiske modeller i konkrete forskningsmessige problemstillinger, herunder om forutsetninger for ulike regresjonsanalytiske modeller er tilfredsstilte kan bidra til utvikling av ny kunnskap basert på regresjonsanalyser, herunder avgjøre regresjonsanalytiske modellers egnethet i analyser av årsakssammenhenger og sosiale mekanismer Ferdigheter Studenten kan formulere forskningsspørsmål for, planlegge, og gjennomføre forskning basert på regresjonsanalytisk tilnærming kan drive forskning basert på regresjonsanalytiske tilnærminger på høyt faglig nivå gjennom å utvikle regresjonsbaserte modeller for avanserte forskningsspørsmål 2
kan vurdere regresjonsanalytiske modeller kritisk gjennom å diagnostisere om forutsetninger for analyser er tilfredsstilte og iverksette tiltak for å håndtere brudd på forutsetningene Innhold Emnet vil omhandle følgende temaer, av tidshensyn gis det kun en introduksjon til enkelte temaer: Statistisk teori: sannsynligheter og sannsynlighetsfordelinger, hypotesetesting, estimering ved minste kvadraters metode og ved sannsynlighetsmaksimering Analyse av kontinuerlig avhengige variabler Ikke-linearitet og samspill i regresjonsmodeller Brudd på kolinearitetsforutsetningen og homoskedastisitetsforutsetningen, robuste standardfeil Bygging av årsaksmodeller: kontrollvariabler, instrumentelle variabler, fixed effects, difference-in-differences, strukturelle likningsmodeller (introduksjon) Analyse av kategorisk avhengige variabler Begrensede avhengige variabler: trunkerte variabler, sensurerte variabler, utvalgsseleksjon (introduksjon) Analyse av paneldata (introduksjon) Flernivåanalyse (introduksjon) Arbeids- og undervisningsformer Emnet vil omhandle følgende temaer, av tidshensyn gis det kun en introduksjon til enkelte temaer: Statistisk teori: sannsynligheter og sannsynlighetsfordelinger, hypotesetesting, estimering ved minste kvadraters metode og ved sannsynlighetsmaksimering Analyse av kontinuerlig avhengige variabler Ikke-linearitet og samspill i regresjonsmodeller Brudd på kolinearitetsforutsetningen og homoskedastisitetsforutsetningen, robuste standardfeil Bygging av årsaksmodeller: kontrollvariabler, instrumentelle variabler, fixed effects, difference-in-differences, strukturelle likningsmodeller (introduksjon) Analyse av kategorisk avhengige variabler Begrensede avhengige variabler: trunkerte variabler, sensurerte variabler, utvalgsseleksjon (introduksjon) Analyse av paneldata (introduksjon) Flernivåanalyse (introduksjon) Arbeidskrav Aktiv deltakelse i undervisningen er en forutsetning for å utvikle fagforståelse. Det er derfor krav om obligatorisk tilstedeværelse. Emneansvarlig kan i enkelte og særlige tilfeller (etter søknad) akseptere unntak fra tilstedeværelseskravet. I slike tilfeller kan manglende 3
deltakelse i undervisningen kompenseres ved aktiv lesning av den aktuelle pensumlitteraturen. Aktiv deltakelse i undervisningen er en forutsetning for å utvikle fagforståelse. Det er derfor krav om obligatorisk tilstedeværelse på 80 prosent. Emneansvarlig kan i enkelte og særlige tilfeller (etter søknad) akseptere unntak fra tilstedeværelseskravet. I slike tilfeller kan manglende deltakelse i undervisningen kompenseres ved aktiv lesning av den aktuelle pensumlitteraturen. Arbeidskrav vurderes til godkjent eller ikke godkjent. Vurderings-/eksamensform og sensorordning. Vurderingsuttrykk Deltakerne skal levere et cirka 15 siders øvelsesarbeide i regresjonsanalyse. Dette arbeidet skal presenteres både skriftlig og muntlig. Den siste versjonen av øvelsesarbeidet skal leveres senest to måneder etter avsluttet undervisning i emnet. Arbeidet vurderes av emneansvarlig til bestått eller ikke bestått. Dersom øvelsesarbeidet vurderes til ikke bestått, kan det leveres inn i bearbeidet form én gang innen en nærmere angitt frist. Vurderingen av øvelsesarbeidet gjøres på grunnlag av læringsutbyttebeskrivelser for emnet. Bestått øvelsesarbeid er en forutsetning for å oppnå 10 studiepoeng. Det gis ikke anledning til forlengelse av innleveringsfristen. Unntak er sykdom som dokumenteres med sykemelding. Etter søknad kan det gis utsettelse tilsvarende den dokumenterte sykdomsperioden. Vurderingsuttrykk: bestått/ikke bestått Hjelpemidler til vurdering/eksamen Alle Klageadgang Bestemmelser om eksamen og fusk i forskrift om studier og eksamen ved Høgskolen i Oslo og Akershus gjelder for arbeider som inngår i ph.d.-programmets opplæringsdel. Pensum Totalt: ca. 1100 sider Bøker: Gujarati, Damodar & Dawn Porter. 2009. Basic Econometrics. New York: McGraw-Hill. Kapittel 1-16, 18-20. (ca. 600 sider) Menard, Scott. 2010. Logistic Regression: From Introductory to Advanced Concepts and Applications. Thousand Oaks: SAGE. (ca. 300 sider) Aktikler I kompendiet: Hair, Joseph F, William C. Black, Barry J. Babin & Rolph E. Anderson. 2010. Multivariate Data Analysis. A Global Perspective. Upper Saddle River (New Jersey): Pearson Education. Side 629-686. Hill, Carter R, Williams E Griffiths & Guay C. Lim. 2012. Principles of Econometrics. Hobroken: John Wiley & Sons. Side 275-287, 400-423. 4
Hox, Joop J. 2010. Multilevel analysis: techniques and applications. New York: Routledge. Side 11-39. Long, Scott. 1997. Regression Models for Categorical and Limited Dependent Variables. Thousand Oaks, [Calif.] London: SAGE. Side 187-216. Mood, C. (2009). "Logistic Regression: Why We Cannot Do What We Think We Can Do, and What We Can Do About It." European Sociological Review 26(1): 67-82. Winship, Christopher & Robert D. Mare. 1992. Models for Sample Selection Bias. Annual Review of Sociology. 18: 327-50. Vedrørende pensum og forberedelse til emnet Emnet forutsetter grunnleggende innsikt å regresjonsanalyse. Deltakerne anbefales en av følgende bøker som forberedelse til emnet: Skog, Ole-Jørgen. 2004. Å forklare sosiale fenomener. En regresjonsbasert tilnærming. Oslo: Gyldendal Akademisk forlag (kapittel 1-12) eller Allison, Paul David. 1999. Multiple Regression: A Primer. Thousand Oaks: Pine Forge Press. Emnet legger til grunn to hovedbøker: Den første (Gujarati & Porter) er en innføringsbok i økonometri. Boken dekker de fleste relevante temaer, men stiller samtidig ikke for store krav til matematikkunnskaper (spesielt matriseregning). Deltakerne kan imidlertid velge mellom flere alternativer til denne boken. De som ønsker seg det autoritative verket på området og samtidig ikke lar seg skremme av matematikk, er det klare valget: Greene, William H. 2012. Econometric analysis. Boston: Pearson. For de som ønsker en enda mykere innføring enn Gujarati og Porter, er følgende et alternativ: Stock, James H. & Mark W. Watson. 2007. Introduction to econometrics. Boston: Pearson Addison Wesley. Den andre hovedboken er Menards bok om logistisk regresjon. Også her kan deltakerne velge mellom alternativer. Det klassiske verket på området er: Long, Scott J. 1997. Regression Models for Categorical and Limited Dependent Variables. Thousand Oaks: SAGE. En alternativ bok er en «selv-læringsbok» som gir en kortfattet og konsis og rimelig dekkende introduksjon til de temaer som behandles på kurset: Kleinbaum, David G & Mitchel Klein. 2010. Logistic Regression. A Self-Learning Text. New York: Springer. I tillegg til disse hovedbøkene, består pensum av bokutdrag og artikler som omhandler spesielle temaer knyttet til kurset. Pensum til ulike deler av emnet Kurset vil omhandle følgende temaer, av tidshensyn gis det kun en introduksjon til enkelte temaer: 5
- Statistisk teori: sannsynligheter og sannsynlighetsfordelinger, hypotesetesting, estimering ved minste kvadraters metode og ved sannsynlighetsmaksimering. Litt.: Gujarati & Porter, kap 1-4. - Analyse av kontinuerlig avhengige variabler. Litt.: Gujarati & Porter, kap 2-8. - Ikke-linearitet og samspill i regresjonsmodeller. Litt.: Gujarati & Porter, kap 6, 7 og 9. - Brudd på kolinearitetsforutsetningen og homoskedastisitetsforutsetningen, robuste standardfeil. Litt.: Gujarati & Porter, kap 10, 11. - Bygging av årsaksmodeller: kontrollvariabler, instrumentelle variabler, fixed effects, difference-in-differences, strukturelle likningsmodeller (introduksjon). Litt.: Gujarati & Porter, kap 13; Morgan & Winship; Hill m.fl.; Hair m.fl. - Analyse av kategorisk avhengige variabler. Litt.: Gujarati & Porter, kap 14-15, Menard, Mood. - Begrensede avhengige variabler: trunkerte variabler, sensurerte variabler, utvalgsseleksjon. Litt.: Gujarati & Porter, kap 15; Long; Winship & Mare. - Analyse av paneldata (introduksjon). Litt.: Gujarati & Porter, kap 16. - Flernivåanalyse (introduksjon). Litt.: Hox. 6