MET 3431: Statistikk (våren 2011) Introduksjon. Genaro Sucarrat. Institutt for samfunnsøkonomi, BI. http://www.sucarrat.net/teaching/met3431/v2011/



Like dokumenter
MET 3431 Statistikk Forelesning 1: Introduksjon til Statistikk

Oppgaver til Studentveiledning I MET 3431 Statistikk

Kvantitative metoder datainnsamling

ST0202 Statistikk for samfunnsvitere Introduksjon til ST0202 høsten 2012 Kapittel 1: Statistikk

MEVIT2800. Forelesning, 14/09/07 Audun Beyer

Oppgaver til Studentveiledning II MET 3431 Statistikk

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

STUDIEÅRET 2014/2015. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Mandag 13. april 2015 kl

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Velkommen til TMA4240. Velkommen til TMA / 18

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

Definisjoner av begreper Eks.: interesse for politikk

1. Hvordan operasjonalisere studenttilfredshet? Vis tre eksempler.

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

Statistikk og dataanalyse

Forskningsmetoder. Måling, målefeil. Frode Svartdal. UiTø V Frode Svartdal FRODE SVARTDAL 1

Frivillig respons utvalg

Statistikk er begripelig

Kapittel 3: Studieopplegg

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 25. august 2015 kl

STUDIEÅRET 2013/2014. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Fredag 25. april 2014 kl

Last ned Elementær algebra og funksjonslære - Knut Sydsæter. Last ned

I dag. Problemstilling. 2. Design og begreper. MEVIT januar Tanja Storsul

3. Innsamling av kvantitative data. I dag. Kvalitative og kvantitative opplegg 1/27/11. MEVIT februar 2011 Tanja Storsul

Innhold. Forord... 11

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

MEVIT2800 Metoder i medievitenskap. Tema: Forskningsdesign. Kvantitativ eller kvalitativ? Pensum: Grønmo (2004): Kap 5, 6, 7, 11 og 12

Studier, region og tilfredshet

Forskningsmetoder. Data: Måling og målefeil. Frode Svartdal. UiTø FRODE SVARTDAL 1 V Frode Svartdal

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4245 Statistikk: MTBYGG, MTING

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

UNIVERSITETET I OSLO

Forelesning 4 Populasjon og utvalg. Hvorfor er utvalgsteori viktig? Kjent tabbe før det amerikanske presidentvalget i 1936

Statistikk i klinikken. Arild Vaktskjold 2015

ST0202 Statistikk for samfunnsvitere

Deskriptiv statistikk., Introduksjon til dataanalyse

STUDIEÅRET 2012/2013. Utsatt individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Tirsdag 27. august 2013 kl

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Målenivå: Kjønn: Alle bør kunne se at denne variabelen må plasseres på nominalnivå

Deskriptiv statistikk., Introduksjon til dataanalyse

Eksamen PSY1011/PSYPRO4111: Sensorveiledning

Krysstabellanalyse. SOS1120 Kvantitativ metode. Disposisjon. 1. Beskrivelse av analyseteknikk. Forelesningsnotater 7. forelesning høsten 2005

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

Oppsummering & spørsmål 20. april Frode Svartdal

KVANTITATIV METODE. Marit Schmid Psykologspesialist, PhD HVL

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2001

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Oversikt. ST0202 Statistikk for samfunnsvitere

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Sannsynlighetsregning og Statistikk.

SMF3081F Videregående metodekurs

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

SMF3081 Videregående metodekurs

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2002

SPED4010/eksamen i statistikk: Fredag 30.september 2011 kl

SMF3081F Videregående metodekurs

Kapittel 1: Data og fordelinger

2. Forskningsdesign og sentrale begreper. I dag. Forskningsdesign: Valg i forskningsprosessen. MEVIT januar 2011.

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

UTDRAG FRA SENSORVEILEDNINGEN FOR EKSAMENSOPPGAVEN I SVSOS107 HØSTEN 2001

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

84 % er fornøyde med det tilbudet de får

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Forelesning 10 Statistiske mål for bivariat tabellanalyse. Korrelasjonsmål etter målenivå. Cramers V

STUDIEÅRET 2012/2013. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Onsdag 24. april 2013 kl

Introduction to the Practice of Statistics

Brukerundersøkelse for konkurransetilsynet.no 2011

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 HØSTEN 2006

ST0202 Statistikk for samfunnsvitere

SPSS Statistics-kurs 2014

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

6.2 Signifikanstester

Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?

EKSAMEN I SOS1120 KVANTITATIV METODE 5. MAI 2004 (6 timer)

Kapittel 4.4: Forventning og varians til stokastiske variable

Utvalgsfordelinger (Kapittel 5)

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

ST0202 Statistikk for samfunnsvitere

Holdninger til NATO. Landrepresentativ telefonundersøkelse gjennomført for Folk og Forsvar. Oslo, 13. desember 2011

Hvis kurset du trenger ikke finnes i oversikten under, ta kontakt med oss. Vi tilrettelegger gjerne kurs etter behov.

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Oppgaver Oppgavetype Vurdering Status 1 ME-417, forside Flervalg Automatisk poengsum Levert. 2 ME-417, oppgave 1 Skriveoppgave Manuell poengsum Levert

2.3: Kombinatorikk 2.4: Sannsynlighet, og Monte Carlo simulering. Foreleses onsdag 25. august 2010

TMA4240 Statistikk H2010

Kursoversikt Kurskalender halvår. Kurskalender halvår

3. Multidimensjonale tabeller. SOS1120 Kvantitativ metode. Årsaksmodeller. Forelesningsnotater 8. forelesning høsten 2005

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

STUDIEÅRET 2016/2017. Individuell skriftlig eksamen i STA 200- Statistikk. Torsdag 27. april 2017 kl

Transkript:

MET 3431: Statistikk (våren 2011) Introduksjon Genaro Sucarrat Institutt for samfunnsøkonomi, BI http://www.sucarrat.net/teaching/met3431/v2011/ Sist endret: 11. januar 2011

1 Praktisk info 2 Typer data 3 Kritisk tenkning 4 Innsamling av data

Bøker Mario Triola Essentials of statistics, 4 utg. Pensumbok Sommervoll Mattespettboka. Kan være nyttig hvis du har mattefobi Sydsæter Elementær algebra og funksjonslære. Boka er tenkt brukt til forkursene i matematikk... står det i beskrivelsen. Rett-på-sak mattebok

Eksamen Dato: 1. juni (kl. 09.00) Skriftlig 5 timer Før eksamen Være godt forberedt i pensum. Ha jobbet seriøst med statistikkprogrammet SAS JMP Ha fått godkjent minst 5 av 8 arbeidskrav

Programvare SAS JMP Lastes ned ifra BI sine hjemmesider Brukes for flervalgsprøver og i forelesninger Utskrift fra SAS JMP vil bli gitt på eksamen

Mål med kurset Lære enkel statistisk analyse Hente informasjon ut ifra data Lære kritisk tenkning

Viktige begreper idag Populasjon Utvalg/stikkprøve Målenivå Kvantitative og kvalitative data Diskrete og kontinuerlige data Noen metoder for utvelging: Tilfeldig Stratifisert Klynge Bekvemmelighet

Hva er statistikk? Statistikk handler om hvordan vi best Skaffer oss et godt utvalg Analyserer utvalget for å finne sammenhenger Fornuftig generalisering fra et begrenset antall observasjoner Skille det generelle fra det tilfeldige

Transylvania-effekten: Blir flere innlagt på mentalsykehus når det er fullmåne? Figura: Gj.snittlig antall innleggelser pr dag Måned Før fullmåne Under fullm. Etter fullm. Aug 6.4 5.0 5.8 Sept 7.1 13.0 9.2 Okt 6.5 14.0 7.9 Nov 8.6 12.0 7.7 Des 8.1 6.0 11.0 Jan 10.4 9.0 12.9 Feb 11.5 13.0 13.5 Mars 13.8 16.0 13.1 Apr 15.4 25.0 15.8 Mai 15.7 13.0 13.3 Juni 11.7 14.0 12.8 Juli 15.8 20.0 14.5 Gj.snitt 10.9 13.3 11.4 Tallene viser at i gjennomsnitt ble flere innlagt under fullmåne Er det tilfeldig?

Stikkprøver og statistisk analyse Fase 1 Det begynner med at man lurer på noe: Kjenner mer enn 80 % av norske forbrukere til merkevaren Norwegian? Er det en sammenheng mellom kjønn og type mobiltelefon? Er sannsynligheten for at aksjekursen går opp i morgen avhengig av om den gikk opp i dag? Appelerer Skandiabanken til ungdom, mens Postbanken appelerer til eldre?

Fase 2 For å finne svar skaffer man først data. Den delen av virkeligheten man er interessert i kalles populasjonen. Populasjonen kan være: Alle norske bankkunder Alle kvinner og menn med mobiltelefon Alle velgerne i Hå kommune Ofte er populasjonen for stor. Det motiverer studiet av et utvalg i stedet for hele populasjonen: 670 norske bankkunder 43 kvinner og menn med mobiltelefon 300 velgerne i Hå kommune

Fase 3 Statistisk analyse av stikkprøven. Hvilken metode vi bruker avhenger av kjennetegnene til data

Chapter 1: Introduction to statistics I spørreundersøkelser og markedsanalyser samler vi inn data for å studere sammenhenger: Hva er den mest hensiktsmessige måten å samle inn data? Hvordan beskriver vi data på en hensiktsmessig og enkel måte?

Data Som regel er dette observasjonene (svar på spørreskjema, kjønn, målinger av lønn, høyde) som vi har samlet inn Statistikk er metodene for å samle inn og beskrive data, og metodene som benyttes til å generalisere fra utvalg til populasjon (inferens). Deskriptiv statistikk - Kap. 1, 2 og 3 Statistisk inferens - Kap. 4 til 11

Populasjon hele samlingen av folk, enheter eller objekter som du er interessert i å studere Utvalg eller stikkprøve en subpopulasjon eller undergruppe av populasjonen Som regel så ønsker vi å sette sammen utvalget slik at det gir et godt bilde av populasjonens sammensetning. For at dette skal være tilfelle, så bør utvalgets enheter (helst) velges tilfeldig fra populasjonen Søppel inn, søppel ut Dersom stikkprøven ikke er samlet inn på en ordentlig måte, så er all verdens statistiske triks nytteløse

Viktige begreper Parameter et kjennetegn (et tall) ved populasjonen (f.eks. gjennomsnittet) Som regel ønsker vi å estimere parametrene til populasjonen, og statistiske metoder brukes til å best mulig estimere parametrene Observator ("statistic"på engelsk) et tall som beskriver et kjennetegn ved utvalget/stikkprøven (f.eks. utvalgsgjennomsnittet)

Viktige begreper En måte å klassifisere data er ved å skille mellom kvalitative og kvantitative data Kvalitative (eller kategoriske) data data som kun kan deles inn i forskjellige kategorier Eksempler: Studieretningene på BI, kjønn, nasjonalitet, osv. Mao. det gir ikke mening å rangere kategoriene til kvalitative data, eller å si noe om differansen til kategoriene Kvantitative (eller numeriske) data tall som representerer tellinger eller målinger Eksempel: Lønn til ansatte i kommunen, alderen til BI studenter, osv.

Kvantitative data Kvantitative data kan videre deles opp i diskrete og kontinuerlige Diskrete data når de tillatte verdiene er endelig mange, eller tellbart mange. Eksempel: Antall treff på en nettside. Kontinuerlige data når de tillatte verdiene er uendelig mange og uten gap Eksempel: Tid, Strømforbruket til en bedrift, temperatur, osv.

De 4 Målenivåer En annen måte å klassifisere data på er ved å skille mellom fire målenivåer: Nominalnivå: Det gir kun mening å skille mellom verdiene til data. Eksempel: Studieretninger på BI, kjønn, nasjonalitet, osv. Ordinalnivå: I tillegg til å skille mellom verdiene til data, så gir det også mening å rangere verdiene. Eksempler: Ønskene på en ønskeliste, preferanser, svar på holdningsspørsmål (enig, delvis enig, uenig), osv. Intervallnivå: I tillegg til å skille og rangordne verdiene til data, så gir det også mening å sammenligne distanser mellom verdiene. Eksempler: Årstall, temperatur, osv. NB: Data på intervallnivå har ikke et naturlig nullpunkt Forholdstallnivå: I tillegg til å skille, rangordne og sammenligne distansen mellom verdier, så gir det også mening å si noe om forhold mellom verdier. Eksempler: Priser, alder, osv.

De 4 Målenivåer - oppsummering 1 Nominal - Bare kategorier 2 Ordinal - Kategorier som kan rangeres eller ordnes i rekkefølge 3 Interval - Differanser er OK, men ikke naturlig nullpunkt 4 Forholdstall (ratio"på engelsk) - Differanser og et naturlig nullpunkt

Oppsummering Vi har til nå sett på Definisjoner og begreper knyttet til data Parameter vs. observator Typer av data (kvantitative og kvalitative) Målenivå til data

Sunn fornuft Tenkning Det er viktig at du hele tiden tenker fornuftig i statistikk. Matematikk er viktig, men du må også tenke i tillegg! Vanlige svakheter ved utvalg: Selvseleksjon ("voluntary response"på engelsk). Respondentene bestemmer selv om de vil være med i spørreundersøkelsen. Da vil konklusjonene dine bare gjelde den gruppen som ønsker å svare på spørreskjema For små utvalg. Jo større, jo bedre Statistisk signifikant vs. praktisk relevans

Dårlige grafer Se på tallene i grafen slik at du ikke blir lurt av formen. Hvilken graf kan du bli lurt av?

Typer studier. Observasjonell studie Her måler og observerer du folk eller objekter uten å gripe inn. Du bare måler det som er der. Eksempel: Meningsmålinger, antall klikk på internettreklame, osv. Eksperimentell studie Her manipulerer du folk eller objekter. Du sammenligner hva som skjer med en gruppe som har fått "behandling"med en gruppe som ikke har fått behandling. Så sammenligner du gruppene. Eksempel: Blindtest av Cola vs. Pepsi

Noen metoder for utvelging Tilfeldig Systematisk Bekvemmelighet Stratifisert Klynge

Tilfeldige utvalg Tilfeldig utvelging: Man velger fra populasjonen slik at hvert individ velges med samme sjanse Enkel tilfeldig utvelging: Man velger slik at alle utvalg av størrelse n velges med samme sjanse

Tilfeldige utvalg. Hvert individ har lik sjanse til å bli valgt ut. Datamaskiner blir ofte brukt til å generere tilfeldige telefonnumre.

Systematiske utvalg. Man velger ut f.eks. hvert tredje element i populasjonen.

Bekvemmelighetsutvalg. Man velger ut de personene som er lettest å få tak i.

Stratifiserte utvalg Del populasjonen inn i minst to undergrupper (stratum), og trekk et utvalg for hvert strata.

Klynge utvalg. Del populasjonen inn i seksjoner/klynger. Velg tilfeldig noen av klyngene og velg alle medlemmene i hver klynge.