Frivillig respons utvalg

Like dokumenter
Kapittel 3. Datainnsamling Dataproduksjon

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Utvalgsfordelinger (Kapittel 5)

Statistikk og dataanalyse

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

ST0202 Statistikk for samfunnsvitere Introduksjon til ST0202 høsten 2012 Kapittel 1: Statistikk

6.2 Signifikanstester

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Introduction to the Practice of Statistics

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Forelesning 4 Populasjon og utvalg. Hvorfor er utvalgsteori viktig? Kjent tabbe før det amerikanske presidentvalget i 1936

TMA4240 Statistikk H2010

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Kort overblikk over kurset sålangt

Utvalgsfordelinger (Kapittel 5)

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Kap. 6.1: Fordelingen til en observator og stok. simulering

MET 3431: Statistikk (våren 2011) Introduksjon. Genaro Sucarrat. Institutt for samfunnsøkonomi, BI.

Introduksjon til inferens

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Bootstrapping og simulering Tilleggslitteratur for STK1100

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån.

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Litt mer om den hypergeometriske fordelingen og dens tilnærming av binomisk fordeling.

Kapittel 4.4: Forventning og varians til stokastiske variable

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

I dag. Problemstilling. 2. Design og begreper. MEVIT januar Tanja Storsul

STK Oppsummering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Inferens i fordelinger

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:

Kapittel 3: Studieopplegg

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

Bootstrapping og simulering

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

TMA4240 Statistikk H2010

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

UNIVERSITETET I OSLO

Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100

7.2 Sammenligning av to forventinger

Falske nyheter. En webundersøkelse utført av Sentio Research for Medietilsynet

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

MET 3431 Statistikk Forelesning 1: Introduksjon til Statistikk

UNIVERSITETET I OSLO

Kap. 8: Utvalsfordelingar og databeskrivelse

TMA4240 Statistikk H2010

1 10-2: Korrelasjon : Regresjon

Innhold. Forord... 11

Innhold. Innledning. Del I

STK Oppsummering

UNIVERSITETET I OSLO

Kvantitative metoder datainnsamling

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Kapittel 4.3: Tilfeldige/stokastiske variable

UNIVERSITETET I OSLO

Kapittel 1 Spørsmål og svar teori og empiri

Kapittel 7: Inferens for forventningerukjent standardavvik

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Deskriptiv statistikk., Introduksjon til dataanalyse

TMA4240 Statistikk H2017 [15]

Deskriptiv statistikk., Introduksjon til dataanalyse

Sjekkliste for vurdering av en kasuskontrollstudie

Tabell 1: Beskrivende statistikker for dataene

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Repeterbarhetskrav vs antall Trails

Eksamensoppgave i TMA4295 Statistisk inferens

UNIVERSITETET I OSLO Matematisk Institutt

MEVIT2800 Metoder i medievitenskap. Tema: Forskningsdesign. Kvantitativ eller kvalitativ? Pensum: Grønmo (2004): Kap 5, 6, 7, 11 og 12

Transkript:

Design av utvalg Andel college-studenter som er konservative? Andel ungdom som ser tv-reklame om ny sportssykkel? Gjennomsnittelig inntekt i en populasjon? Ønsker informasjon om stor populasjon Tid, kostnad: Undersøker kun et utvalg Design av utvalg: Hvordan velge ut utvalg

Dårlige utvalg Fabrikk produserer ruller av tynt stål Ønsker å sjekke kvalitet Ber teknikker kutte små biter til undersøkelse Teknikker velger «gode» biter Debattprogram og sms-målinger Ønsker meningsmåling av populasjon Teller opp andel for/mot fra sms-innsendinger Ikke representativt for populasjonen

Frivillig respons utvalg Et frivillig respons utvalg består av personer som velger å svare på en generell forespørsel Slike utvalg er forventningsskjeve fordi personer med sterke meninger, spesielt negative meninger, svarer oftere

Enkelt tilfeldig utvalg n individer trukket ut av total populasjon slik at alle individer har like stor sjanse for å komme med. Et enkelt tilfeldig utvalg (SRS:simple random sample) av størrelse n

Sannsynlighetsutvalg Et utvalg valgt ved tilfeldighet Må vite Hvilke utvalg som er mulige Sannsynlighet for de ulike utvalg Enkelt tilfeldig utvalg: Alle utvalg mulige, sannsynlighet lik for alle utvalg

Stratifisert tilfeldig utvalg Del populasjon inn i grupper av lignende individer, kalt strata Velg et enkelt tilfeldig utvalg innen hver strata Kan gi mer eksakt informasjon enn enkelt tilfeldig utvalg Alle helt like innen hvert strata: Nok med et individ fra hvert strata

Eksempel stratifisering Meningsmålinger Strata: Fylker Reduserer variabilitet som skyldes forskjeller mellom fylker

Underdekning og mangel på respons Tilfeldige utvalg fjerner skjevheter Design av utvalg for store populasjoner krever gode design Underdekning: Noen grupper glemt Krever komplett og presis liste over populasjon Mangel på respons: Større manglende respons i utkantstrøk

Andel ikke svarende Current population survey 4% nekter å svare, 3-4% kan ikke nås General Social Survey 30% som ikke svarer Problem: De som ikke svarer kan ha andre meninger/egenskaper enn de som svarer

Biologiske egenskaper Av interesse: Vekt av lemmen Utvalg: Lemmen tatt i feller Har lemmen som ikke gått i feller samme vekt som de som har gått i feller?

Statistisk inferens Hvordan overføre informasjon fra utvalg til informasjon om populasjon Intervju av 2500: 1650 (66%) finner kjøp av klær frustrerende og tidkrevende Hva er sannheten om hele populasjonen (220 millioner)? Statistisk inferens: Trekke konklusjoner om videre populasjon fra utvalgte individer

Parametre og observatorer Parameter Et tall som beskriver populasjonen Fast tall, men ukjent Observator Tall beskrevet av utvalg Kjent, men endres fra utvalg til utvalg Bruker observator for å estimere (anslå) parameter Shopping: p andel av populasjon p = 1650/2500=0.66 er estimatet

Utvalgsvariabilitet Nytt utvalg vil gi nytt estimat p Utvalggsvariabilitet Tilfeldig utvalg Fjerner skjevhet Vil alltid ha variabilitet Variasjonen følger et predikerbart mønster Statistisk inferens: Hvor pålitelig en prosedyre er, spør hva som skjer hvis den blir repetert mange ganger

Hvordan måle variabilitet? Ta mange utvalg fra samme polulasjon Beregn p for hvert utvalg Lag et histogram av p Se etter mønstre i histogram I praksis For dyrt/tidkrevende å se på mange utvalg Alternativ: Simuler med datamaskin

Utvalgsfordeling Utvalgsfordeling for en observator er fordelingen av verdier tatt over alle mulig utvalg av samme størrelse fra populasjonen Simulering: Tilnærming av sann fordeling Sannsynlighetsteori: Kan noen ganger gi eksakt fordeling Mønstre: Form, senter, spredning

Forventningsskjevhet og variabilitet Forventningsskjevet: Om senter av utvalgsfordeling. Forventningsrett hvis forventning i fordeling er lik sann verdi av parameter Variabilitet: Spredning i fordeling. Avhenger av Utvalgsdesign Utvalgsstørrelse

God design Redusere skjevhet: Tilfeldig utvalg Redusere variabilitet: Bruk stort utvalg Usikkerhetsmarginer: Setter grenser for størrelse på feil Liten variabiabilitet, små usikkerhetsmarginer Populasjonsstørrelse betyr ingenting! Utvalg på 2500 like bra for populasjon med 90.000 individer som for 9.000.000

Hvorfor randomisere Fjerne skjevheter, senter i fordeling lik sann parameterverdi Kan bruke sannsynlighetsteori for å analysere data Form kjent, ofte (nesten) normal fordelt Spredning kan minskes ved å øke utvalgsstørrelse Statistisk teori: Hva skjer hvis eksperimentet repeteres mange ganger