Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal

Like dokumenter
Eksperimentelle design

Oppsummering & spørsmål 20. april Frode Svartdal

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT mars 2015

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT april 2016

Forskningsmetoder i menneske-maskin interaksjon

Innhold. Del 1 Grunnleggende begreper og prinsipper... 39

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

6.2 Signifikanstester

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

Kapittel 1 Vitenskap: grunnleggende antakelser

Forskningsmetoder. Måling, målefeil. Frode Svartdal. UiTø V Frode Svartdal FRODE SVARTDAL 1

Verdens statistikk-dag.

Introduksjon til inferens

TMA4240 Statistikk H2010 (20)

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Forskningsmetoder. Data: Måling og målefeil. Frode Svartdal. UiTø FRODE SVARTDAL 1 V Frode Svartdal

Hypotesetesting. mot. mot. mot. ˆ x

TMA4240 Statistikk H2010 (19)

EKSAMEN I PSY1001/PSY1011/PSYPRO4111/ PSYKOLOGIENS METODOLOGI HØSTEN 2012 BOKMÅL

FORSKNINGSMETODE NOEN GRUNNLEGGENDE KONSEPTER

STUDIEÅRET 2013/2014. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Fredag 25. april 2014 kl

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Mandag 13. april 2015 kl

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Kapittel 9 og 10: Hypotesetesting

Effektstørrelse. Tabell 1. Kritiske verdier for Pearson s produkt-moment-korrelasjon med 5% og 1% signifikansnivå. N 5% 1% N 5% 1%

Kan vi stole på resultater fra «liten N»?

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Definisjoner av begreper Eks.: interesse for politikk

Slutninger fra data FRODE SVARTDAL UIT 2015

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 25. august 2015 kl

KVANTITATIV METODE. Marit Schmid Psykologspesialist, PhD HVL

Fra idé til publikasjon

1 10-2: Korrelasjon : Regresjon

Repeated Measures Anova.

Kapittel 10: Hypotesetesting

Noen momenter ved vurdering av eksamen PSY1010 PSYC1100 høsten 2018.

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Kapittel 3: Studieopplegg

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Kapittel 9 og 10: Hypotesetesting

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Statistikk og dataanalyse

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Forelesning 10 Kjikvadrattesten

Statistikk En måte å beskrive og analysere fenomener kvantitativt Eva Denison

I dag. Problemstilling. 2. Design og begreper. MEVIT januar Tanja Storsul

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i PSY1011/4111 Psykologiens metodologi

3. Multidimensjonale tabeller. SOS1120 Kvantitativ metode. Årsaksmodeller. Forelesningsnotater 8. forelesning høsten 2005

Hva er evidens? Eva Denison

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Komplekse intervensjoner Metodiske utfordringer. Liv Wensaas PhD, RN, Leder for FOU enheten Helse og omsorg Asker kommune

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

Prosjektbeskrivelsen består av

Prosjektbeskrivelsen består av

STUDIEÅRET 2012/2013. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 27. august 2013 kl

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Introduction to the Practice of Statistics

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Sensorveiledning SOS1120 vår

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

2. Forskningsdesign og sentrale begreper. I dag. Forskningsdesign: Valg i forskningsprosessen. MEVIT januar 2011.

Oppgåver Oppgåvetype Vurdering Status. 1 DEL 1 Vitenskapsteori Skriveoppgave Manuell poengsum Levert

Econ 2130 uke 16 (HG)

β(µ) = P(akseptere H 1 µ)

Tema Kvalitativ og kvantitativ forskningsmetode. Forskningsmetode. Kausalitet. Reliabilitet og validitet. Usikkerhet. IA mandag 5/9-2014

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Grunnleggende statistikk. Eva Denison 25. Mai 2016

Regional forskingskonferanse for Psykiatri og rusfeltet Vår Olav M. Linaker PH, St. Olavs Hospital/INM, NTNU

Utvalgsstørrelse, styrke

EKSAMEN 4016/4016N VITENSKAPSTEORI OG NATURSYN. Tid : 1 time (9-10)

Mer om hypotesetesting

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Hypotesetesting av λ og p. p verdi.

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Kurs i kunnskapshåndtering å finne, vurdere, bruke og formidle forskningsbasert kunnskap i praksis. Hege Kornør og Ida-Kristin Ørjasæter Elvsaas

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Fasit for tilleggsoppgaver

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Oppgåver Oppgåvetype Vurdering Status. 1 DEL 1 Vitenskapsteori Skriveoppgave Manuell poengsum Levert

i x i

Inferens i fordelinger

Transkript:

Hypotesetesting: Prinsipper Frode Svartdal UiTø Januar 2014 Frode Svartdal

Alt dette er mat for hypotesetesting! Utgangspunkt En antakelse begrunnet i teori Dissonansteori: Hvis, så. En vanlig oppfatning Belønning øker prestasjon Noe vi tror er feil Læring kan bare skje hvis vi forstår læringsbetingelsene Motstridende funn a) Forventning om belønning øker motivasjon vs. b) Forventning om belønning reduserer motivasjon

Utgangspunkt II Ikke veldig interessant. Alle vet dette! Hypotesen må ha interesse! Belønning øker motivasjon Noen ganger vil belønning redusere motivasjon Interessant!

Hypotesetesting: Generelt Hvordan testes hypoteser? Formulere en testbar påstand (f.eks. en implikasjon fra en teori) Gjennomføre en relevant undersøkelse (eksperiment, observasjon, ) Avgjøre om resultatet støtter hypotesen Statistisk Innholdsmessig

Eksempel: Dissonansteori (Festinger) Dissonans = ubehagelig aktivering som følge av konflikt Eksempel: Jeg røyker Jeg vet at det er farlig å røyke Dissonans

Dissonansteori: Festinger A Lesson In Cognitive Dissonance

Eksempel: Dissonansteori Festinger & Carlsmith, 1959 Utfører kjedelig oppgave i en time Får betalt lite vs. mye Sier til nestemann at oppgaven var artig (dvs. lyve) Mening om oppgaven måles

Eksempel: Dissonansteori Festinger & Carlsmith, 1958 Dissonans-betingelse: (a) Du utfører kjedelig oppgave i en time (b) Du får lite betalt Dissonans (c) Din mening om jobben måles Hypotese?

Eksempel: Dissonansteori Festinger & Carlsmith, 1958 Dissonans-betingelse: (a) Du utfører kjedelig oppgave i en time (b) Du får bra betalt (c) Din mening om jobben måles Hypotese? Ikke dissonans

Festinger & Carlsmith, 1958 Oppfatning av oppgaven Ikke dissonans Dissonans Oppfatning av oppgaven korrigert for effekten av dissonans

Hypotesetesting Design og prosedyre OK: Fp-er er tilfeldig fordelt i gruppene (dvs. variasjon mellom fp-er er ikke systematisk relatert til manipulasjonen) eksperimentsituasjonen er den samme for alle prosedyren er den samme for alle

Hypotesetesting: Statistisk R HØY-gruppe LAV-gruppe Uavhengig variabel Høy betaling: FP mottar 100 kr Lav betaling: FP mottar 10 kr Avhengig variabel Vurdering av oppgaven (-5 - +5): -0,1 Vurdering av oppgaven (-5 - +5): 1,4

Hypotesetesting: Statistisk Uavhengig variabel Avhengig variabel Eksperimentgruppe Høy betaling Snittskåre: -0,1 R Kontrollgruppe Lav betaling Snittskåre: 1,4 Ingen forskjell Tid Ingen forskjell?

Hypotesetesting: Statistisk Eksempel: Eksperiment med to grupper Nullhypotesen: Utvalgene kommer fra samme populasjon. Vi sjekker: Hvor sannsynlig er det at den observerte forskjellen mellom utvalgene kan oppstå, gitt at utvalgene kommer fra samme populasjon? Forskningshypotesen: Utvalgene kommer ikke fra samme populasjon.

Hypotesetesting: Statistisk Hvis den observerte forskjellen er svært usannsynlig, forkaster vi 0-hypotesen Grense: 5 av 100 tilfeller (0,05) Avvisning av 0-hypotesen innebærer en indirekte aksept av forskningshypotesen Forskningshypotesen bevises IKKE

Hypotesetesting: Statistisk Statistisk konklusjons-validitet: Er konklusjonen vi trekker fra utvalget holdbar? Trusler: Lav power: Vi oppdager ikke en mulig effekt. Typisk årsak: for få deltakere Brudd på statistiske forutsetninger Fisking i data: Vi leter etter effekter Lite reliable mål Lite reliable prosedyrer

Hypotesetesting: Statistisk Eksperimentgr. mean = -0,1 Kontrollgr. mean = 1,4 Hvordan kan man avgjøre om den observerte forskjellen, er så stor at vi må forkaste 0-hypotesen? Statistisk test som sammenligner to gruppegjennomsnitt t-test: Hvor stor er variasjonen mellom gruppene (gruppeforskjell)? Hvor stor er variasjonen innen gruppene? Hvor mange deltakere har vi i hver gruppe?

Hypotesetesting: Statistisk Populasjon Randomisert utvelgelse Generalisering YTRE VALIDITET Utvalg Randomisert fordeling Eksp.gr. Kontr.gr. Resultat INDRE VALIDITET Funn

Hypotesetesting: Innholdsmessig Er hypotesen rimelig? Er operasjonaliseringene av variablene rimelige? Høy = 100 kr Lav = 10 kr Er oppgaven som blir utført faktisk kjedelig? Er undersøkelsen gjennomført på en betryggende måte (design)? Er det nok med bare 2 nivåer av UV (100 vs. 10)? Hva med en kontrollgruppe som ikke får betalt? Foreligger det trusler mot vår slutning om effekt (confounding variabler)? Viktig!! Har vi kontroll over relevante variabler? Er deltakere tilfeldig fordelt til grupper (randomisering)? Kritisk for eksperimenter!!! Finnes det alternative fortolkninger av funnet????

Hypotesetesting Mao: Selv om vi får støtte for vår hypotese statistisk, betyr ikke dette automatisk at hypotesen støttes teoretisk Statistisk hypotesetesting: Mekanisk prosess Teoretisk hypotesetesting: Kompleks slutning

Dataanalyse Beskrive en variabel (et sett av skårer) Eksempel: Gjennomsnitt Beskrive relasjoner mellom to variabler Eksempel: Korrelasjon (r) Beskrive relasjoner mellom flere sett av skårer (konsistens) Cronbachs alfa Bestemme om to gruppegjennomsnitt er signifikant forskjellige Eksempel: T-test Bestemme om flere gruppegjennomsnitt er signifikant forskjellige Eksempel: Variansanalyse

Hypotesetesting: p og effektstørrelse To viktige aspekter ved et funn: Signifikans: Hvor reliabelt er funnet? Hvis vi gjentar undersøkelsen, vil vi få samme utfall? Effektstørrelse: Hvor stor effekt snakker vi om? Er (et signifikant) utfall praktisk/teoretisk interessant?

Hypotesetesting: p og effektstørrelse Signifikans Hvor reliabelt er funnet? Jo svakere et funn er, desto flere deltakere trengs for å påvise det som signifikant Ikke nødvendigvis noen styrke ved en undersøkelse at man har mange deltakere Aspirin redusert risiko for hjerteinfarkt 10000 deltakere trengs for å påvise effekten Mørketid vinterdepresjon 2-4000 deltakere

Hypotesetesting: p og effektstørrelse Effektstørrelse Cohen: The degree to which a phenomenon exists. Hvor sterkt slår effekten ut? Hvor sterk er sammenhengen? Signifikans (p) sier ikke nødvendigvis så mye om styrke Samme effektstørrelse kan bety ulike ting i ulike kontekster: Redusert fart: Nesten null betydning for den enkelte; 15 menneskeliv spart i løpet av et år i Norge

Hypotesetesting: Falsifikasjon To utfall mulig: Vi aksepterer 0-hypotesen ( gruppene kommer fra samme populasjon ) forskningshypotesen forkastes Vi forkaster 0-hypotesen ( gruppene kommer ikke fra samme populasjon ) forskningshypotesen støttes

Hypotesetesting Wason (1977): Falsifiserende vs. bekreftende strategi i hypotesetesting Bekreftende evidens er forenlig med et stort antall hypoteser eller teorier Falsifiserende evidens vil utelukke i alle fall noen hypoteser Dvs.: Falsifiserende evidens er ofte mer informativ om verden enn bekreftende evidens

Hypotesetesting Faktisk Vår beslutning Aktivering fører til bedre læring Aktivering fører ikke til bedre læring Aktivering fører faktisk ikke til bedre læring Type 1-feil Vi forkaster 0-hypotesen når vi egentlig skulle beholdt den OK Aktivering fører faktisk til bedre læring OK Type 2-feil Vi aksepterer 0-hypotesen når vi egentlig skulle forkastet den

Hypotesetesting Type 1-feil Vi har vært for snille akseptert noe vi egentlig skulle forkastet Løsning: Skjerp kravet til hva som aksepteres (p = 0.05 0.01). Alfanivå Problem: Vi kan bli for strenge, slik at vi øker sjansen for Type 2-feil

Hypotesetesting Type 2-feil Vi har vært for strenge forkastet noe vi egentlig skulle akseptert Løsning: Øk power i undersøkelsen gjør det mer sannsynlig at vi vil oppdage en effekt hvis den er der (i praksis: øk antall deltakere)

Hypotesetesting i praksis Faktisk Dommeren: Uskyldig Skyldig Tiltalte er skyldig Type 1-feil Forkaster 0-hypotesen når hun egentlig skulle beholdt den JUSTISMORD Tiltalte er ikke skyldig OK Type 2-feil Aksepterer 0-hypotesen når hun egentlig skulle forkastet den OK

Hypotesetesting i praksis Faktisk Frisk Kreft Legen: Du har kreft Du er frisk Type 1-feil Forkaster 0-hypotesen når hun egentlig skulle beholdt den IKKE SÅ FARLIG OK OK Type 2-feil Aksepterer 0-hypotesen når hun egentlig skulle forkastet den KATASTROFE