ST0202 Statistikk for samfunnsvitere Introduksjon til ST0202 høsten 2012 Kapittel 1: Statistikk Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start
2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 11. utgave
3 Kan også bruke... Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave
4 Pensumoversikt Kap. 1 Statistikk og datainnsamling (utvalgte deler) Kap. 2 Beskrivende statistikk, én variabel Kap. 3 Beskrivende statistikk, to variabler Kap. 4 Sannsynlighetsregning Kap. 5 Diskrete sannsynlighetsfordelinger Kap. 6 Normalfordelingen Kap. 7 Fordelingen til gjennomsnittet Kap. 8 Innføring i statistisk inferens Kap. 9 Statistisk inferens, én populasjon Kap. 10 Statistisk inferens, to populasjoner Kap. 11 Kjikvadrattesten Kap. 12 Variansanalyse Kap. 13.3 6 Regresjonsanalyse
5 Forelesninger og øvinger Forelesninger: Mandag 12:15 14:00 S7 Gløshaugen Onsdag 10:15 12:00 DL31 Dragvoll (Låven) Øvinger: Onsdag 13:15-15:00 D136 Dragvoll Onsdag 15:15-17:00 D104 Dragvoll Øvingslærer: Endre Oppen NB: Tre av øvingssettene, nr. 3, 7 og 10, er obligatoriske. Besvarelsene på disse må godkjennes for at du skal få anledning til å ta eksamen. De andre øvingene er frivillige og skal ikke leveres inn.
6 Fagets hjemmeside http://wiki.math.ntnu.no/st0202/2012h/start Her finner du forelesningsplan, slides fra forelesningene, øvingene, og all annen informasjon du måtte ha bruk for. Vi vil ikke bruke It s learning aktivt i faget.
7 Hva er statistikk? Vitenskapen å samle inn, beskrive og tolke data
9 Johnson & Kuby (læreboka!) Kap. 1-3: Beskrivende statistikk Kap. 4-7: Sannsynlighetsregning Kap. 8-13: Statistisk inferens
10 Viktige definisjoner (1.1) Populasjon Den mengden av individer/objekter som vi ønsker å analysere egenskaper for. Utvalg En delmengde av populasjonen (eng.: sample ) Parameter En tallverdi som oppsummerer populasjonen Observator En tallverdi som oppsummerer utvalget (eng.: statistic ) Utvalget skal fortelle noe om populasjonen Observatoren skal fortelle noe om parameteren
11 Populasjon og utvalg parameter og observator
12 Populasjon og utvalg parameter og observator
Ulike typer variabler: kvalitativ (ikke-numerisk) nominell (kategorisk), f.eks. {mann,kvinne} ordinal (kategorisk med rangering), f.eks. {svak, middels, sterk} kvantitativ (numerisk) diskrete, f.eks. {0,1,2,3,..} kontinuerlig, f.eks. et tall i intervallet (0,100), ofte med desimaler (97.3)
14 Datainnsamling (1.3) Krav til utvalg: Utvalget må være representativt for populasjonen, og ikke skjevt: Skjev ( biased ) utvalgsmetode: En utvalgsmetode som systematisk gir verdier som ikke er representative for populasjonen som det trekkes fra. (Motsatt: unbiased ) Årsaker til skjevhet: bekvemmelighet frivillighet
15 TV-debatt og representativ undersøkelse TV2-programmet Holmgang er et debattprogram som utfører undersøkelser basert på telefonavstemming blant TV-seere. Det blir stilt et spørsmål med to svaralternativ, og seere inviteres til å ringe inn sin mening. Representative undersøkelser utføres av mange seriøse firma, bla. Opinion A/S. Eksempel tatt fra Dimakos et al. (2004), Norsk Regnesentral
16 TV-debatt og representativ undersøkelse Spørsmål: Bør Norge stenge grensene for flyktninger? Ja Nei Holmgang 89.4% 10.6 % Opinion A/S 17% 83 %
17 Representativt utvalg?
18 Eksperimenter og observasjonsstudier Det er to hovedmetoder for innsamling av data: Eksperiment (kontrollert studie, randomiserte forsøk): En effekt studeres under ulike kontrollerte betingelser. Eksempel: Sammenligning av to medikamenter, der gruppen av forsøkspersoner deles i to etter loddtrekning, og hver delgruppe får ett av medikamentene. Observasjonsstudie: Når det ikke er mulig å kontrollere bakgrunnsvariablene. Eksempel: Studie av sammenheng mellom forurensning og sykdommer. Her kan det trekkes et utvalg av personer, men bakgrunnsvariablene kan normalt ikke modifiseres av den som utfører undersøkelsen.
Observasjonsstudie:
Eksperiment:
21 Datainnsamlingsprosessen Utvalgsramme ( sampling frame ): En liste over de elementene i populasjonen som utvalget skal trekkes fra. Ideelt: hele populasjonen. Utvalgsrammen må i alle tilfeller være representativ for populasjonen. Utvalgsdesign: Subjektivt utvalg: Et utvalg valgt utfra hvilke elementer som bedømmes som representative for populasjonen. (Blir skjevt!) Sannsynlighetsvektet utvalg: Et utvalg valgt slik at hvert element i populasjonen har en bestemt (kjent) sannsynlighet for å blir trukket ut. Av denne sorten er: Enkelt tilfeldig utvalg: Et utvalg valgt slik at alle elementer i populasjonen har samme mulighet for å bli trukket.