Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie,

Like dokumenter
Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Et lite notat om og rundt normalfordelingen.

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Analyseoversikt, Uke 35

Deskriptiv statistikk., Introduksjon til dataanalyse

Deskriptiv statistikk., Introduksjon til dataanalyse

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Øving 1 TMA Grunnleggende dataanalyse i Matlab

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

STK1000 Obligatorisk oppgave 1 av 2

Kapittel 1: Data og fordelinger

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Tabell 1: Beskrivende statistikker for dataene

UNIVERSITETET I OSLO

Sannsynlighetsregning og Statistikk.

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Basisoppgaver til 2P kap. 3 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

Sted Gj.snitt Median St.avvik Varians Trondheim Værnes Oppdal

Estimat og konfidensintervall for andel pasientopphold med minst én pasientskade

Statistikk. Forkurs 2018

Velkommen til TMA4240. Velkommen til TMA / 18

Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE

Statistikk og dataanalyse

UNIVERSITETET I OSLO

Statistikk. Forkurs 2017

2P kapittel 3 Statistikk Løsninger til innlæringsoppgavene

Seksjon 1.3 Tetthetskurver og normalfordelingen

Seksjon 1.3 Tetthetskurver og normalfordelingen

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Forkurs i kvantitative metoder ILP 2019

TMA4240 Statistikk Høst 2012

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Introduksjon til statistikk og dataanalyse

ECON Statistikk 1 Forelesning 2: Innledning

UNIVERSITETET I OSLO

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

2P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

2P, Statistikk Quiz. Test, 2 Statistikk

ØVINGER 2017 Løsninger til oppgaver. Øving 1

SPED4010/eksamen i statistikk: Fredag 30.september 2011 kl

Eksempel på data: Karakterer i «Stat class» Introduksjon

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

MATEMATIKK (MAT1005) Sentralmål / Spredningsmål

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Statistikk for språk- og musikkvitere 1

Kapittel 3: Studieopplegg

STK1000 Uke 37, Studentene forventes å lese Ch i læreboka (MMC). Beskrive enkle (bivariate) sammenhenger mellom variabler

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Utsatt individuell skriftlig eksamen. STA 400- Statistikk

1 Grafisk framstilling av datamateriale

ST0202 Statistikk for samfunnsvitere

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

TMA4245 Statistikk Høst 2016

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

GeoGebra-opplæring i Matematikk 2P

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS

Oppgaver til Studentveiledning II MET 3431 Statistikk

Sentralmål og spredningsmål

Introduksjon. Viktige begreper for å beskrive data: Enheter som er objektene i datasettet. «label» som av og til brukes for å skille enhetene

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Forelesning 3. april, 2017

UNIVERSITETET I OSLO

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

OM EXTRANET OG KAMPANJENS MÅLINGER (innsatsområdene UVI og SVK) Side 2

MATEMATIKK (MAT1005) Sentralmål / Spredningsmål

UNIVERSITETET I OSLO

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

TMA Statistikk Øving 1

Konfidensintervall for µ med ukjent σ (t intervall)

ST0202 Statistikk for samfunnsvitere

Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?

Hvordan analysere måledata vha statistisk prosesskontroll? Side 2

Fagdag Klima en klimakonferanse for realfagslærere

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. "Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen.

EKSAMENSOPPGAVER STAT100 Vår 2011

ST0202 Statistikk for samfunnsvitere

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

STK1000 Innføring i anvendt statistikk

GeoGebra-opplæring i 2P-Y

Statistikk 2. Tabellen nedenfor viser oljeproduksjonen i et OPEC-land i perioden 1990 til Produksjonen er i 1000 tonn.

Statistikk 2P, Prøve 2 løsning

Sannsynlighet og statistikk

ST0103 Brukerkurs i statistikk Høst 2014

2P kapittel 4 Statistikk Løsninger til oppgavene i læreboka

Transkript:

Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie, www.statistrikk.no Kontinuerlige data er målinger som gjøres langs en skala, for eksempel tid, lengde og vekt. Noen ganger kan telledata (diskrete data) også oppsummeres som om de var kontinuerlige. Det gjelder hvis det er stor variasjon i det som telles, for eksempel antall elever på en skole eller antall melkekyr i et fjøs (i motsetning til f.eks. antall trampoliner i en hage.) Beskrivelse av data gjøres ved hjelp av figurer (diagrammer) og oppsummeringstall. Før man kan velge riktig oppsummeringstall, må man se på (tegne, plotte) fordelingen til dataene og vurdere hvordan den ser ut, fordi symmetriske data og skjeve data (evt data med ekstremverdier) krever ulike oppsummeringstall. De viktigste oppsummeringstallene for kontinuerlige data beskriver to egenskaper ved dataene: Det som er typisk for observasjonene, og variasjonen i observasjonene. I dette dokumentet finner du to eksempler med figurer og repetisjonsoppgaver som er laget for å bygge opp den statistiske magefølelsen for disse begrepene: Histogram og Boksplott Oppsummeringstall for det typiske Oppsummeringstall for variasjon Eksemplene og oppgavene er knyttet til blogginnlegget Variasjon og standardavvik som ble publisert på bloggen Statistrikk 28. august 2017. http://www.statistrikk.no/2017/08/28/variasjon-del-2/ Tallene i eksemplene er oppdiktet, men basert på faktakunnskap om tenåringer og gravide damer, så de kunne vært reelle. Du kan gjerne hente inn dine egne data og bruke appen www.tallforteller.no til å lage figurer og oppsummeringstall i stedet.

Eksempel 1: Svangerskapslengder for 31 kvinner A) Tegn en tallinje under de fargerike prikkene og skisser både et histogram og et boksplott. B) Sjekk om det du får ligner på histogrammet og boksplottet under. C) Kommenter fordelingens form.

Gjennomsnitt og median er to oppsummeringstall som kan beskrive det typiske, det vanlige, senteret eller midten i kontinuerlige data. A) Tell prikker på hver side av medianen og se at det er like mange på hver side av medianen B) Sjekk at gjennomsnittsstreken er ved tyngdepunktet/balansepunktet for fordelingen C) Hvor stor forskjell er det på median og gjennomsnitt? Hva ville du valgt som oppsummeringstall for det typiske i denne fordelingen? Median = 40,0

Gjennomsnittsverdien = 40,0

Variasjon kan oppsummeres på mange måter. A) Hva menes med minimumsverdi, maksimumsverdi, range, nedre og øvre kvartil, og interkvartilbredde? Minimumsverdi = 37,1 Maksimumsverdi = 41,8

B) Er alle disse tallene meningsfulle oppsummeringstall for variasjon i dette datasettet? c) Gi en praktisk tolkning av dem (lett hvis du leser innlegget om variasjon og standardavvik på www.statistrikk.no) Nedre kvartil = 39,5 Øvre kvartil = 40,7

A) Hva kan du oppsummere med standardavviket? B) Gi en muntlig beskrivelse eller tolkning av standardavvik C) Hva er formelen for standardavvik? D) Er standardavviket knyttet til gjennomsnittet eller medianen? SD = 1,0

A) Hvor mange standardavvik er det mellom de rosa strekene? B) Hvor stor del av observasjonene havner mellom de røde strekene?

A) Hvor mange standardavvik er det mellom de røde strekene? B) Hvor stor del av observasjonene havner mellom de røde strekene? C) Er gjennomsnittet og standardavviket meningsfulle oppsummeringstall i dette datasettet? Hvis ja: På hvilken måte? Hvis nei: Hvorfor ikke?

Eksempel 2: Dobesøk i minutter for 23 tenåringer A) Tegn en tallinje under de fargerike prikkene og skisser både et histogram og et boksplott. B) Sjekk om det du får ligner på histogrammet og boksplottet under. C) Kommenter fordelingens form.

Gjennomsnitt og median er to oppsummeringstall som kan beskrive det typiske, det vanlige, senteret eller midten i kontinuerlige data. A) Tell prikker på hver side av medianen og se at det er like mange på hver side av medianen B) Sjekk at gjennomsnittsstreken er ved tyngdepunktet/balansepunktet for fordelingen C) Hvor stor forskjell er det på median og gjennomsnitt? Hva ville du valgt som oppsummeringstall for det typiske i denne fordelingen? Median = 4,0

Gjennomsnittsverdien = 7,9

Variasjon kan oppsummeres på mange måter. A) Hva menes med minimumsverdi, maksimumsverdi, range, nedre og øvre kvartil, og interkvartilbredde? Minimumsverdi = 1,3 Maksimumsverdi = 34,5

B) Er alle disse tallene meningsfulle oppsummeringstall for variasjon i dette datasettet? c) Gi en praktisk tolkning av dem (lett hvis du leser innlegget om variasjon og standardavvik på www.statistrikk.no) Nedre kvartil = 3,4 Øvre kvartil = 8,5

A) Hva kan du oppsummere med standardavviket? B) Gi en muntlig beskrivelse eller tolkning av standardavvik C) Hva er formelen for standardavvik? D) Er standardavviket knyttet til gjennomsnittet eller medianen? SD = 8,1

A) Hvor mange standardavvik er det mellom de rosa strekene? B) Hvor stor del av observasjonene havner mellom de røde strekene?

A) Hvor mange standardavvik er det mellom de røde strekene? B) Hvor stor del av observasjonene havner mellom de røde strekene? C) Er gjennomsnittet og standardavviket meningsfulle oppsummeringstall i dette datasettet? Hvis ja: På hvilken måte? Hvis nei: Hvorfor ikke?