Spørsmål. 17 mars 2004. 1) Kan du gi enforklaring på hva som menes med "nullhypotese" og at denne forkastes? Vil bare ha det oppklart.



Like dokumenter
SOS3003 Eksamensoppgåver

NTNU, TRONDHEIM Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

SOS3003 Eksamensoppgåver

SOS3003 Eksamensoppgåver

Std. Error. ANOVA b. Sum of Squares df Square F Sig , , ,600, , , ,

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 06. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Ref.: Fall SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 05

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

SOS3003 Eksamensoppgåver

Korrelasjon og lineær regresjon, litt om resultatpresentasjon

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 13

SOS 31 MULTIVARIAT ANALYSE

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Psykologisk institutt

Logistisk regresjon 2

EKSAMENSOPPGÅVER Haust 1995 FRAMLEGG TIL LØYSING Erling Berge

Eksamensoppgave i ST3001

TMA4240 Statistikk Høst 2012

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 02. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Repeterbarhetskrav vs antall Trails

Lineære modeller i praksis

SOS3003 Eksamensoppgåver

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

Univariate tabeller. Bivariat tabellanalyse. Forelesning 8 Tabellanalyse. Formålet med bivariat analyse:

Fra krysstabell til regresjon

SOS 31 MULTIVARIAT ANALYSE

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Eksamensoppgave i PSY2017/PSYPRO4317. Statistikk og kvantitative forskningsmetoder. Målform/språk: Bokmål Antall sider: 10. Psykologisk institutt

EKSAMENSOPPGAVE STA-1001.

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Hypotesetesting. Notat til STK1110. Ørnulf Borgan Matematisk institutt Universitetet i Oslo. September 2007

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Forslag til endringar

TMA4240 Statistikk Høst 2009

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Kap. 8: Utvalsfordelingar og databeskrivelse

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

PSYC 3101 KVANTITATIV METODE II Eksamen høst 2008

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

Kausalanalyse og seleksjonsproblem

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 03. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

SOS3003 Eksamensoppgåver

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat, vår Erling Berge Institutt for sosiologi og statsvitenskap NTNU

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Forelesning 13 Regresjonsanalyse

PSY2012 Forskningsmetodologi III: Statistisk analyse, design og måling Eksamen vår 2014

SOS3003 Anvendt statistisk dataanalyse i samfunnsvitenskap Forelesingsnotat 08. Erling Berge Institutt for sosiologi og statsvitenskap NTNU

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Kort innføring i SPSS

TMA4245 Statistikk Eksamen desember 2016

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Prøveutviklere omfatter både de som utvikler og administrerer prøver, og de som tar politiske beslutninger for bestemte prøver.

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Logistisk regresjon 1

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Multippel lineær regresjon

1 + γ 2 X i + V i (2)

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

UNIVERSITETET I OSLO

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

Generelle lineære modeller i praksis

Statistisk generalisering

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

UNIVERSITETET I OSLO

Tidspunkt: Fredag 18. mai (3.5 timer) Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.

a ) Forventningen estimeres med gjennomsnittet: x = 1 12 (x x 12 ) = 1 ( ) = 8813/12 = 734.4

3.A IKKE-STASJONARITET

NORGES TEKNISK NATURVITSKAPELEGE UNIVERSITET Institutt for sosiologi og statsvitenskap FRAMLEGG TIL LØYSING AV EKSAMENOPPGÅVER I SOS31 9 DES 1996

Informasjon om eksamen SOS Kvantitativ metode

UNIVERSITETET I OSLO

Eksamensoppgave i PSY3100 Forskningsmetode - kvantitativ

Analyse med uavhengige variabler på nominal- /ordinalnivå

TMA4240 Statistikk Eksamen desember 2015

NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Skule og barnehage i det postmoderne samfunnet Nødvendig kompetanse for arbeid i dagens barnehage og skule

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Kapittel 3: Studieopplegg

Multisample Inference del 2 (Rosner ) Øyvind Salvesen

Litt enkel matematikk for SOS3003

Institutt for økonomi og administrasjon

use "C:\Users\eirik\OneDrive\Master\stata\kostra oppdelt\forsøk på merge\ferdig datasett alle kommuner - med tonivå.dta"

ORDINÆR/UTSATT EKSAMEN Sensur faller innen

1 10-2: Korrelasjon : Regresjon

EKSAMENSOPPGAVER STAT100 Vår 2011

Transkript:

Spørsmål 17 mars 2004 1) Kan du gi enforklaring på hva som menes med "nullhypotese" og at denne forkastes? Vil bare ha det oppklart. Nullhypotese er ein påstand vi gjer om ein parameter for å kunne teste om det er ein rimeleg korrekt påstand Hvis nullhypotesa leier til ein urimeleg konklusjon (t.d. stor t-verdi) forkastar vi den som urimeleg Uttrykket kan kanskje ha samanheng med at vi vanlegvis tar utgangspunkt i at parameteren er 0, men generelt vil det i dag bli brukt om Et utsagn hvis feilaktige benektelse vi fortrinnsvis ønsker å unngå (Sverdrup 1964:175 Lov og tilfeldighet I ) Synspunktet er at det er best å gjere feil på rett side, t.d. i kvalitetskontroll av fly, bilar, klatretau,

2) Når man skal definere relasjonen mellom variablene i en modell, skal "e" være inkludert også for at det skal være korrekt? Svaret er ja! Men legg merke til: Observert Y i = Predikert Y i + e i (Predikert Y i = Forventa verdi av Y i = E[Y i ] ) Modellen kan omtalast på to måtar E[Y i ] = f(x i ) da er residualen underforstått eller Y i = f(x i ) + e i = E[Y i ] + e i da er residualen inkludert eksplisitt Og hugs skiljet mellom populasjon og utval 3) Litt forvirring ang multikollinaritet og autokorrelasjon, og hvordan vi kan finne ut om det er det. Substansielt: Autokorrelasjon dreiar seg om tilhøvet mellom verdiar på ulike case på same variabel (t.d. prosent yrkesaktive fiskarar i kvar kommune). Geografisk nærliggjande case har ofte verdiar som ligg nærmare kvarandre enn to tilfeldig valde kommunar Multikollinearitet dreiar seg om korrelasjon mellom variable (t.d. tilltit til Stortinget og tillit til politikarar ). Variablar som måler om lag same fenomenet skal korrelere med kvarandre og er til ein viss grad gjensidig overflødige Teknisk?

4) Er Gauss Markov kravene oppfylt selv om det ikke er normalfordelte restledd? Kan f- og t-test brukes selv om restleddene ikke er normalfordelte? Gauss-Markov krava kan godt vere oppfylt sjølv om vi ikkje har normalfordelte restledd, men dei treng ikkje vere det F-test og t-test kan nyttast berre dersom restleddet er normalfordelt 5) Oppgave 1, Høst 2003, Hypotese 2 - "female" er IKKE signifikant. Betyr det at H2 forkastes, eller at man ikke kan si noe om hypotesen? I modell 2 og 3 er female ikkje signifikant. Vi kan da ikkje forkaste da hypotesen om at female ikkje har effekt. Det er med andre ord ikkje grunnlag for å påstå skilnad mellom menn og kvinner. Når føresetnadene er oppfylt veit vi at sjansen for at dette er feil konklusjon er mindre enn 5% (signifikansnivået er 0.05) Er det verre å påstå forskjell dersom det ikkje er det enn å påstå at det ikkje er forskjell når det faktisk er det? (jfrførste spørsmålet)

6) Skal man KUN se på signifikansen når man vurderer riktighetenav hypoteser? Ved sida av signifikansnivå må ein alltid vurdere tolkinga substansielt. Dersom det vi finn strir mot sunn fornuft, eller det andre forskarar har funne bør vi sjekke etter kva vi har gjort ein gong til Det gjeld sjølvsagt både for signifikante og usignifikante variablar 7) Ihht forelesningsnotater og Hamilton er forutsetning 1 for at engitt modell er korrekt at modellen må være "lineær i parameter". Hva betyr det? Er det et problem med feks Age square? Legg merke til at kravet ikkje går på om modellen er korrekt eller ikkje. Kravet går på om vi skal kunne nytte OLS metoden for å estimere parametrane Parametrane i lineære modellar er β k eller b k -ar som vi estimerer Lineær i parametrane tyder at vi finn ein og berre ein b k mellom kvart + i modellen Sidan det står berre ein b k framfor AgeSquare er modellen lineær i parameteren

8) Hva sier tabellen som heter "casewise diagnostics"? Hvordanog når skal man bruke den? 8) "casewise diagnostics tabellen Bestiller vi casewise diagnostics får vi ein tabell med variabelverdiar for dei case som møter kriteriet som er gitt ( outliers outside n standard deviations ). Default-verdien av n er 3. Variablane som er skrive ut er y (avhengig variabel), predikert y, residual, og standardisert residual (seleksjonsvariabel) Tabellen vil seie oss om utliggjarar er eit stort eller lite problem

9) Hva er en P-P Plot? Finner ikke i Hamilton (om den ikke har annet navn). I regresjonsprosedyren er det noko som heiter Normal P-P Plot og i følgje hjelpemenyen vil dette Displays a normal probability plot of the standardized residuals. Used to check for normality. If the variable is normally distributed, the plotted points form a straight diagonal line. Dette er ikkje det same som det Hamilton kallar Quantil-Normal Plots (sjå side 15 i Hamilton) men har same formål: å teste om ei observert fordeling er lik normalfordelinga Normal P-P Plot i regresjon: normal probability plots comparing the distribution of standardized residuals to a normal distribution Forventa ved Normalfordeling

P-P og Q-Q plott i Graphs menyen P-P Plot Plots a variable's cumulative proportions against the cumulative proportions of any of a number of test distributions. Probability plots are generally used to determine whether the distribution of a variable matches a given distribution. If the selected variable matches the test distribution, the points cluster around a straight line. Q-Q Plot Plots the quantiles of a variable's distribution against the quantiles ofany ofa number of test distributions. Probability plots are generally used to determine whether the distribution of a variable matches a given distribution. If the selected variable matches the test distribution, the points cluster around a straight line. 10) Scatterplotten på side 8 i Høst 2003 eksamen - hva sier denne? Den har jo så merkelig form.

Merkjeleg spreiingsdiagram? Det finst i datamaterialet grupper som vi ventar skal ha systematisk lågare predikert verdi av Trust in system (tre land: Polen, Norge, Storbritannia) Avhengig variabel har avgrensingar i variasjonsområdet sitt. Den kan t.d. ikkje bli mindre enn 0 eller større enn 10. Dette fører til systematikk i korleis residualane varierer, særleg der observert verdi ligg nær yttergrensene. Vi får rette linjer i utkanten av variasjonsområdet 11) Hva vil det si at regresjonskoeffisienten skal være signifikant forskjellig fra null? Hvor kontrollerer man det? I SPSS utskrifta i tabellen Coefficients finn vi ei kolonne merka t (Students s t-observator) og ei merka Sig. (sannsynet for så stor eller større t ) På neste slide står det Sig. =0.268 for variablen Female. Dette les vi slik: Dersom nullhypotesa (ingen effekt av Female ) er rett er det eit sannsyn på 0.268 for å finne ein ein t-verdi som er større eller lik 1.107 eller mindre eller lik -1.107 Sidan verdien av observatoren synest rimeleg under gitte føresetnader trur vi at føresetnadene er rimelege

Haust 2003 1 e) Mo del 3 Dependent Variable: SYSTRUST Trust in system, mean of b7-b10 a. Unstandardized Coefficients Standar dized Coeffici ent Collinearity Statistics B St.Err Beta t Sig. Toler ance VIF (Constant) 4.246.199 21.313 FEMALE -.049.045 -.013-1.107.268.992 1.008 AGE -.042.007 -.389-5.932.029 33.909 AGE2 Age squared.408 6.274.030 33.264 MARRIED Married (1), not married (0).118.051.030 2.334.020.767 1.304 EDUYRS Years of full-time education completed.020.012.037 1.743.081.287 3.487 GB Dummy for Great Britain.751.202.180 3.725.054 18.391 NO Dummy for Norway.856.201.205 4.269.055 18.199 EDUK ED*GB interaction.034.016.110 2.136.033.048 20.814 EDNO ED*no interaction.102.016.340 6.496.046 21.584 12) Hva betyr "Stokastisk variasjon"? Stokastisk refererer til sannsyn I uttrykket stokastisk variasjon tenkjer ein seg variasjon t.d. i form av avvik frå eit gjennomsnitt som det kan knytast visse sannsyn til: t.d. til større avvik til mindre sannsyn I uttrykket stokastisk variabel vil det kunne knytast sannsyn til ulike variabelverdiar.