1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene



Like dokumenter
ØVINGER 2017 Løsninger til oppgaver. Øving 1

Deskriptiv statistikk., Introduksjon til dataanalyse

Sannsynlighetsregning og Statistikk.

Deskriptiv statistikk., Introduksjon til dataanalyse

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Statistikk. Forkurs 2017

Statistikk. Forkurs 2018

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Et lite notat om og rundt normalfordelingen.

Seksjon 1.3 Tetthetskurver og normalfordelingen

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

ST0202 Statistikk for samfunnsvitere

Introduksjon til statistikk og dataanalyse

Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie,

Kapittel 1: Data og fordelinger

1 10-2: Korrelasjon : Regresjon

ST0202 Statistikk for samfunnsvitere

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Oppgaver til Studentveiledning I MET 3431 Statistikk

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Oversikt. ST0202 Statistikk for samfunnsvitere

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

ECON Statistikk 1 Forelesning 2: Innledning

2P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

ST0202 Statistikk for samfunnsvitere

Oppgaver til Studentveiledning II MET 3431 Statistikk

ST0202 Statistikk for samfunnsvitere

Statistikk og dataanalyse

Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?

Beskrivende statistikk.

Seksjon 1.3 Tetthetskurver og normalfordelingen

Eksamen i. MAT110 Statistikk 1

Utvalgsfordelinger (Kapittel 5)

TMA4245 Statistikk Eksamen desember 2016

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

ST0103 Brukerkurs i statistikk Høst 2014

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Inferens i fordelinger

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Kap. 8: Utvalsfordelingar og databeskrivelse

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ST0202 Statistikk for samfunnsvitere [1]

Forkurs i kvantitative metoder ILP 2019

TMA4240 Statistikk H2017 [15]

Kapittel 3: Studieopplegg

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere

Oppgaver fra 8.3, 8.4, , 8.51, 8.52, 8.231, 8.232, 8.250, 8.252

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Mål på beliggenhet (2.6) Beregning av kvartilene Q 1, Q 2, Q 3. 5-tallssammendrag. ST0202 Statistikk for samfunnsvitere

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS

Kapittel 4.4: Forventning og varians til stokastiske variable

Tema. Beskrivelse. Husk!

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Statistikk Løsninger. Innhold. Statistikk Vg2P

Sentralmål og spredningsmål

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Statistikk for språk- og musikkvitere 1

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Eksamensoppgave i TMA4240 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

ST0202 Statistikk for samfunnsvitere

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Analyseoversikt, Uke 35

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Når du har arbeidet deg gjennom dette kapittelet, er målet at du skal kunne

LØSNING: Oppgavesett nr. 1

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

Eksamen 2P MAT1015 Vår 2012 Løsning

Kort overblikk over kurset sålangt

2P kapittel 3 Statistikk Løsninger til innlæringsoppgavene

Velkommen til TMA4240. Velkommen til TMA / 18

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

ST0202 Statistikk for samfunnsvitere

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Eksempel på data: Karakterer i «Stat class» Introduksjon

Transkript:

1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene

Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk inferens Handler om hvordan vi bruker stikkprøven til å si noe om hele populasjonen.

Mål for senter i dataene Gjennomsnitt Median Modus

Notasjon Example Σ står for å addere opp x er variabelen som representerer dataverdiene. Ofte brukes en indeks i for å angi dataverdi nummer i: x i x er gjennomsnittet. n Stikkprøvens størrelse N Populasjonens størrelse Notasjon gjør det enklere å oppgi formler. For eksempel så er gjennomsnittet definert ved formelen x = xi n

Notasjon brukes i formler Example I en statistikk bok ser du formelen (xi x) 2 n 1 som skal regnes ut for en stikkprøve med tre tall: 3, 7, 4. Du regner ut at gjennomsnittet er x = 2 og setter n = 3 og får:

Notasjon brukes i formler Example I en statistikk bok ser du formelen (xi x) 2 n 1 som skal regnes ut for en stikkprøve med tre tall: 3, 7, 4. Du regner ut at gjennomsnittet er x = 2 og setter n = 3 og får: (xi x) 2 = (x 1 x) 2 + (x 2 x) 2 + (x 3 x) 2 n 1 n 1 = (3 2)2 + (7 2) 2 + ( 4 2) 2 3 1 1 2 + 5 2 + ( 6) 2 1 + 25 + 36 = = 31 2 2

Notasjon for gjennomsnitt Gjennomsnitt i stikkprøven Vi skriver x for gjennomsnittet i stikkprøven: x = x n Gjennomsnitt i populasjonen Vi skriver µ for gjennomsnittet i populasjonen: µ = Merk at µ er som oftest ukjent. x N Hvor mange desimaler? Når man oppgir gjennomsnittet, så bruk 1 mer desimal enn det er i dataene.

Median Medianen Medianen er den midterste verdien i dataene når vi har sortert dem. Symbolet for medianen er x Medianen blir ikke så påvirket av uteliggere som gjennomsnittet Example Alder på ledere i en bedrift: 35 32 55 48 41 47

Median Medianen Medianen er den midterste verdien i dataene når vi har sortert dem. Symbolet for medianen er x Medianen blir ikke så påvirket av uteliggere som gjennomsnittet Example Alder på ledere i en bedrift: 35 32 55 48 41 47 Sortert: 32, 35, 41, 47, 48, 55 De to midterste verdiene er 41 og 47 Median x = (41 + 47)/2 = 44 år

Medianen er robust mot ekstreme observasjoner Uteligger: En ekstrem verdi, dvs. et tall som ligger langt ifra hopen av tall i stikkprøven. Påvirker gjennomsnittet mer enn medianen. Example Årsinntekt (i 1000 kr) i en bygd med 10 voksne 567 320 432 410 340 276 389 220 693 360 Gjennomsnitt x = 400.7 om median x = (360 + 389)/2 = 374.5. En ekstremt rik person flytter hjem til bygda. Han har årsinntekt på 3500 (3.5 millioner). Gjennomsnittet 400.7 682.5. Stor forandring Median 374.5 389. Liten forandring Her gir medianen en bedre pekepinn enn gjennomsnittet på hva en typisk inntekt er

Modus Modus Er den verdien som opptrer oftest. Brukes helst på kvalitative data. Examples Det partiet som fikk mest stemmer... To stikkprøver og deres moduser. A. 5.40 1.10 0.42 0.73 0.48 1.10 Modus =1.1 B. 27 27 27 55 55 55 88 88 99 Bimodal. 27 og 55

Gjennomsnitt fra en frekvenstabell Beregne x fra en frekvenstabell I hver klasse, anta at alle verdiene har midtverdien. x = f xmidten f her er f frekvensen/antallet i hver klasse.

Oppsummering

Skjev eller symmetrisk? Symmetrisk fordeling av data Dersom venstre halvdel av histogrammet er omtrent et speilbilde av høyre halvdel. Eksempel: normalfordelte data. Skjev fordeling av data Dersom ikke symmetrisk og en side av dataene er lenger enn den andre. Reisetid i minutter er skjevt fordelt mot høyre.

Symmetrisk eller skjev fordeling?

Hvor mye varierer dataene? Variasjon Variasjon er grunntemaet i statistikk Seksjon 3-3 i boka er dermed en av de aller viktigste Legg stor vekt på tolkning av standardavviket

Et enkelt forslag... Variasjonsbredde Example Variasjonsbredde= Maksverdi - Minimumsverdi Stikkprøve med tre tall: 3, 7, 4. Her er variasjonsbredden x max x min = 7 ( 4) = 11. Primitivt Variasjonsbredde er et veldig enkelt mål for variasjon i dataene. For enkelt.

Standardavviket Standardavvik Det desidert mest brukte målet for variasjon i dataene er standardavviket Engelsk: standard deviation, std.dev Symbolet er s Formelen Standardavviket måler hvor mye verdiene ligger ifra gjennomsnittet: (x x) 2 s = n 1

Utregning av s for hånd Example Stikkprøve med tre tall: 3, 7, 4. (3 2) s = 2 + (7 2) 2 + ( 4 2) 2 3 1 1 + 25 + 36 = 3 1 = 31 = 5.6 Selv om JMP eller Excel regner ut s, så skal dere kunne gjøre dette for hånd for enkle eksempler.

Shortcut formelen for s Example s = n x 2 ( x) 2 n(n 1) Stikkprøve med tre tall: 3, 7, 4. x 2 = 3 2 + 7 2 + ( 4) 2 = 9 + 49 + 16 = 74 x = 3 + 7 + ( 4) = 6 n x s = 2 ( x) 2 n(n 1) 3 74 6 = 2 186 = 3(3 1) 6 = 31 = 5.6

Egenskaper til standardavviket s måler typisk avstand ifra gjennomsnittet s er som regel positiv s kan øke veldig mye dersom en uteligger tas med s er målt i samme enheter som verdiene i stikkprøven

Standardavviket i populasjonen I populasjonen s er en observator Standardavviket i populasjonen har det greske symbolet σ σ er en parameter som har formelen σ = (x µ) 2 N

Varians Variansen er s 2 Eng: Variance Example Stikkprøve med tre tall: 3, 7, 4 har variansen 5.6 2 = 31.0.

Tommelfingerregel for s En omtrentlig regel Hvis du deler variasjonsbredden på 4, så har du et anslag på s. Examples 1 Stikkprøve med tre tall: 3, 7, 4 har variasjonsbredde 11. Så da kan vi anslå standardavviket til å være 11/4 = 2.75. Men det bommer endel på det faktiske standardavviket s = 5.6 2 I en stikkprøve av 56 studenter varierte antall ukentlige studietimer fra 40 til 0 timer. Med tommelfingerregelen anslår vi s til å være 40/4 = 10 timer. Det faktiske standardavviket er s = 8.1 timer.

Øvingsoppgave Example Alderen på lederne i en bedrift er: 35 32 55 48 41 47. Beregn standardavviket.

Øvingsoppgave Example Alderen på lederne i en bedrift er: 35 32 55 48 41 47. Beregn standardavviket.

Tolkning av s Hvordan tolke s? Hvis du kjenner standardavviket s så kan du anslå typiske maksimums- og minimumsverdier: En typisk minimumsverdi er 2 standardavvik under gjennomsnittet En typisk maksimumsverdi er 2 standardavvik over gjennomsnittet Denne regelen er brukbar så lenge dataene er tilnærmet normalfordelt.

Empirisk regel for s 68% Er dataene tilnærmet normalfordelt så vil ca 68% av dataene ligge 1 standardavvik ifra gjennomsnittet.

68% - 95 % - 99.7 % For normalfordelte data vil 95% av verdiene ligge innenfor 2 standardavvik.