Kapittel 1 ser på. Statistikk i hverdagen



Like dokumenter
Kapittel 1: Introduksjon til statistikk og dataanalyse

Kapittel 1: Introduksjon til statistikk og dataanalyse Foreleses tirsdag 22. august 2006.

Kapittel 1: Introduksjon til statistikk og dataanalyse Foreleses tirsdag 9. januar 2007.

Kapittel 1: Introduksjon til statistikk og dataanalyse

ST0202 Statistikk for samfunnsvitere [1]

Sannsynlighetsregning og Statistikk.

ST0202 Statistikk for samfunnsvitere Introduksjon til ST0202 høsten 2012 Kapittel 1: Statistikk

TMA4240 Statistikk H2010

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

ST0202 Statistikk for samfunnsvitere

ST0103 Brukerkurs i statistikk Høst 2014

TMA4240 Statistikk H2010

ØVINGER 2017 Løsninger til oppgaver. Øving 1

2P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen

Deskriptiv statistikk., Introduksjon til dataanalyse

Deskriptiv statistikk., Introduksjon til dataanalyse

Øving 1 TMA Grunnleggende dataanalyse i Matlab

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Sted Gj.snitt Median St.avvik Varians Trondheim Værnes Oppdal

Nasjonale prøver i lesing, regning og engelsk på 5. trinn 2015

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Forkurs i kvantitative metoder ILP 2019

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Kapittel 1: Data og fordelinger

Øving 1 TMA Grunnleggende dataanalyse i Matlab

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Tema. Beskrivelse. Husk!

Et lite notat om og rundt normalfordelingen.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Sentralmål og spredningsmål

Statistikk. Forkurs 2018

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

2P kapittel 3 Statistikk Løsninger til innlæringsoppgavene

Spørreundersøkelse om holdninger til organdonasjon 2015

Et lite notat om og rundt normalfordelingen.

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Det er frivillig å delta i spørreundersøkelsen, ingen skal vite hvem som svarer hva, og derfor skal du ikke skrive navnet ditt på skjemaet.

Statistikk. Forkurs 2017

Binomisk sannsynlighetsfunksjon

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Tabell 1: Beskrivende statistikker for dataene

Christensen Etikk, lykke og arkitektur

ST0202 Statistikk for samfunnsvitere

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

ECON Statistikk 1 Forelesning 2: Innledning

Oppfriskning av blokk 1 i TMA4240

Eksamen MAT 1011 Matematikk 1P Høsten 2014

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

MATEMATIKK (MAT1005) Sentralmål / Spredningsmål

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

Landbrukets brannvernkomité. Årsaker til branntilløp på norske gårdsbruk

Eksamen MAT1005 Matematikk 2P-Y Va ren 2014

«Operasjoner i et utfordrende miljø, hvordan opprettholde et høyt sikkerhetsnivå over tid?».

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Oversikt. ST0202 Statistikk for samfunnsvitere

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

GeoGebra-opplæring i Matematikk 2P

Tall og mengder. Per G. Østerlie. 30. september 2013

Eksempelsett 2P, Høsten 2010

Hvorfor skal vi kildesortere? Hva vil KING bety for din butikk? Fordeler med KING. Hvordan skal vi sortere?

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i SØK Statistikk for økonomer

1 Grafisk framstilling av datamateriale

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

STK1000 Innføring i anvendt statistikk

Samfunnsøkonomisk utdanning på NTNU og yrkeslivet 2002

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

STUDIEÅRET 2011/2012. Utsatt individuell skriftlig eksamen. STA 200- Statistikk. Mandag 27. august 2012 kl

Høye skårer indikerer høye nivåer av selvkontroll.

DEL 1 Uten hjelpemidler

Matematisk julekalender for trinn, 2008

Høgskolen i Gjøviks notatserie, 2001 nr 5

MENON - NOTAT. Hvordan vil eiendomsskatt i Oslo ramme husholdninger med lav inntekt?

GeoGebra 4.2 for Sinus 2P. av Sigbjørn Hals

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Statistikk Løsninger. Innhold. Statistikk Vg2P

LO118D Forelesning 3 (DM)

ST0202 Statistikk for samfunnsvitere

3 Statistikk KATEGORI Søylediagrammer. Oppgave Tabellen viser karakterstatistikken for en prøve i en matematikkgruppe 2P.

UNIVERSITETET I OSLO

TMA Statistikk Øving 1

Risikoanalyser i petroleumsvirksomheten. Behov for å endre/justere kursen? Vidar Kristensen

Eksamen MAT1005 Matematikk 2P-Y Va ren 2014

EKSAMENSOPPGAVE NFUT0006 NORSK FOR UTLENDINGER KORTKURS. Kandidatnummer:

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Årets oppgaver (2015)

Transkript:

3 Kapittel 1 ser på atainnsamling. atatyper: diskrete og kontinuerlige. Grafiske metoder og tabeller. Mål for beliggenhet (lokasjon). Mål for variabilitet. Kapittel 1: Introduksjon til statistikk og dataanalyse oreleses tirsdag 9. januar 2007. irik Mo Institutt for matematiske fag, NTNU 4 Statistikk i hverdagen aglig rapporteres interessante funn i pressen. Tenk på: har observatøren påvirket målingene? er utvalget stort nok? er utvalget representativt for den gruppen konklusjoner trekkes? har målingene pågått lenge nok? trekkes konklusjoner for langt?

5 Spørsmålet 7 TV-debatt og representativ undersøkelse r du enig i at hvalfangst, drapet på verdens største, utryddingstruede pattedyr, må forbys snarest mulig? r du enig i at hvalfangst må tillates i begrenset omfang, for å sikre bærekraftig ressursforvaltning og kystbefolkningens livsgrunnlag? Spørsmål: ør Norge stenge grensene for flyktninger? Ja Nei Holmgang 89.4 % 10.6 % Opinion /S 17 % 83 % 6 TV-debatt og representativ undersøkelse 8 Representativt utvalg TV2-programmet Holmgang er et debattprogram som utfører undersøkelser basert på telefonavstemming blant TV-seere. et blir stilt et spørsmål med to svaralternativ, og seere inviteres til å ringe inn sin mening. Representative undersøkelser utføres av mange seriøse firma, bla. Opinion /S. ksempel tatt fra imkos et al. (2004), Norsk Regnesentral

9 11 iskrete og kontinuerlige data Relativ frekvens Karakter til eksamen i TM4240 Statistikk H2004 iskrete data: endelig (tellbart) antall mulige utfall. ks: karakter, kjønn, skonummer Kontinuerlige data: uendelig antall mulige utfall. Målinger (mengde, volum, andel) er ofte kontinuerlig. Sannynlighetsteori ulik for diskrete og kontinuerlige data spesielt kapittel 3, 5, 6. Intervall Midtpunkt rekvens Relativ frekvens 86-100 47 0.13 76-85 55 0.15 66-75 65 0.18 56-65 73 0.20 36-55 84 0.23 0-35 36 0.10 0-100 - 360 1.00 10 12 Vise frem data: valg av akser Relativ frekvens: karakter (høst 2004) Relative frekvens histogram Histogrammer fra Nettavisen, 2002 og 2006. 0.00 0.05 0.10 0.15 0.20 Karakter i TM4240 H2004

13 Relativ frekvens: høyde (vår 2005) 15 Gjennomsnittet igur fra G. Løvås: Statistikk 14 16 Mål for beliggenhet Gjennomsnittet Gjennomsnitt (mean): x = 1 n n i=1 x i Median n odde x = x (n+1)/2 n like x = 1 2 (x n/2 + x n/2+1 ) Lokasjon Lokasjon 0.00 0.05 0.10 0.15 0.20 0.00 0.05 0.10 0.15 0.20 0.25 0.30 igur fra G. Løvås: Statistikk Karakter i TM4240 H2004 Karakter i TM4245 V2005

17 Median vs gjennomsnitt or du i Stavanger, og har postnummer 4009 eller 4044? I så fall tilhører du de rikeste strøkene i byen. Vi har sortert samtlige skatteytere i Stavanger på postnummer, og plukket ut to kriterier for å måle rikdom: Medianinntekt og antall millionærer per 1000 skattytere. ermed har vi ett mål på formue og ett på inntekt. Til slutt i saken har vi redegjort for hvorfor nettopp disse målene er valgt. Målekriteriene: Vi har valgt å unngå gjennomsnittstall for inntekt og formue fordi gjennomsnitt er et upresist mål når det finnes ekstreme utslag i tallmaterialet. Kilde: Stavanger ftenblad, 16. oktober 2003 19 Mål for variabilitet mpirisk varians ( 1.1): s 2 = 1 n n 1 i=1 (x i x) 2 Gjennomsnittlig kvadratavvik til gjennomsnittet. mpirisk standardavvik ( 1.1): s = s 2 Samme måleenhet som originalobservasjonene. Inter-kvartil rekkevidde(iqr): Q3-Q1 Q1=verdien som 25% av data er mindre enn Q3=verdien som 25% av data er større enn 18 Median vs gjennomsnitt: ksempel Ni personer tjener 200.000 kroner hver, mens den siste tjener 10 millioner kroner. Hva er den mest representative inntekten i utvalget? e fleste vil si 200.000 kroner fordi ni av ti tjener så mye. Men dersom man regner gjennomsnittsinntekten for de ti, blir denne nesten 1,2 millioner kroner fordi den ene rike drar snittet så kraftig opp. Medianinntekten, som forteller hva den midterste i utvalget tjener når alle er sortert fra rikest til fattigst, blir derimot 200.000 kroner. Skattelistene er kanskje det beste eksempelet på utvalg hvor det finnes ekstreme utslag. Noen få skattytere tjener svært mye i forhold til «røkla», eller har en skyhøy formue. ette fører til urealistisk høye gjennomsnittstall for noen tilfeldig utvalgte postnummer. Kilde: Stavanger ftenblad, 16.10.2003