Kapittel 1: Data og fordelinger
|
|
|
- Tomas Klausen
- 9 år siden
- Visninger:
Transkript
1 STK Innføring i anvendt statistikk Mandag 8. august 8 Ingrid K. lad I løpet av dette kurset skal dere bli fortrolig med statistisk tenkemåte forstå teori og metoder som ligger bak knappene/menyene i vanlige statistikkpakker få trening i enkel analyse av data vha. dataverktøy lære å tolke statistiske opplysninger (spesielt i faglitteratur) Hvordan beskrive og forstå data Kapittel : Data og fordelinger Beskrive, forstå og utforske data Kap.. og. rafisk beskrivelse av data Sentralmål Spredningsmål Kap.. om fordelinger neste uke 4 Hva er data? Eksempel på data: Data kommer fra et sett individer. Kjennetegn som kan knyttes til hvert individ organiseres i variable. Eksempler: Individer: personer, batterier, bananfluer, målestasjoner, tabletter, Variable: kjønn, blodtrykk, levetid, ekspresjon av bestemt gen, lufttemperatur, vekt,... 6
2 Innsamling av data Forsøksstudier el. observasjonsstudier Må planlegges (Hvilke spørsmål ønsker man å belyse, hva skal man måle/observere på hvem?) Statistisk forsøksplanlegging Her: litt i kap. Eksplorativ dataanalyse Starter med å studere hver variabel for seg (Kap. ) Deretter sammenhenger mellom variable (Kap. ) Start med grafiske metoder (Kap..) Deretter numeriske oppsummeringer (Kap..) 7 Start alltid statistiske analyser med eksplorativ analyse! 8 To typer variable Kategoriske (ikke-numeriske) data god, middels eller dårlig testresultat (ordnet) 6MP, Imurel, Prednisolon, eller Budensonide (ikke ordnet) røyker eller ikke-røyker (ikke ordnet) kvinne eller mann (ikke ordnet) Kvantitative (numeriske) data antall fødte barn antall pulsslag per minutt Årsinntekt født i 97 høyde, vekt genekspresjon temperatur 9 Fordelingen til en variabel beskriver Hvilke verdier variabelen kan ta Hvor ofte den tar disse verdiene Et datasett er et sett med observerte verdier for en eller flere variable på et antall individer. Fordelingen til en variabel kan utforskes ved hjelp av grafikk og enkle beregninger. Så dette er et datasett:. Fordelinger beskrevet med grafikk Skiller mellom kategoriske og numeriske variable Kategoriske variable? Numeriske variable?
3 Diagrammer for kategoriske data 4 4 blodtype 4 % A 44% Antall (av ) SOVEVANE På magen Antall (av ) Sovevane Vet ikke AB B A AB % B % På ryggen På siden På siden På ryggen Diagrammer for kategoriske data fremstiller antall eller andel i hver kategori Kvinne<4 Mann<4 Kvinne>4 Mann>4 Kjønn/alder Vet ikke Kvinne<4 Mann<4 Kvinne>4 Mann>4 Kjønn/alder På magen Stolpe- og smultringsdiagram over blodtypefordeling Søylediagram og stablet søylediagram for sovevaner. 4 Data kan også være subjektive (i motsetning til objektive målinger): Her er variabelen som er målt på hvert individ subjektiv vurdering av egen helse rafiske metoder for numeriske variable Eksempel.4 Registrering av telefonsamtaler, kundeservice bank 49 samtaler i løpet av en måned Individer: hver samtale Variabel: lengden av samtalen (i sekunder) Andel som betrakter sin helse som god eller svært god 6 De 8 første registreringene: Hva slags figur er dette? Hva ser vi? 7 8
4 Enkleste metode: Histogrammer. Del verdiområdet til variabelen opp i intervaller. Tell opp antall individer i hvert intervall. Tegn søyler som tilsvarer antall i intervallet Default intervallbredde i programvare ofte OK Problem: antall intervaller 9 Histogram med relative andeler (normert) Historisk datasett Antall fødte barn Totalt Antall kvinner med så mange fødte barn Relativ frekvens,6,,7,84,49,9,,,. Frekvenstabell for kvinners fruktbarhet. Relativ andel,4,,,, Antall barn Arealet av hver søyle tilsvarer relativ andel obs. i intervallet søylen dekker jentatte målinger av samme størrelse Papir-og-blyant-alternativ til histogram: Stilk-og-blad-plott: første siffer stilk, siste siffer blad (Newcombs målinger) 4 4
5 Hva ser vi etter? Når vi vurderer fordelingen til datasettet ser vi spesielt etter -Form, senter og spredning (en eller flere topper, symmetrisk eller skjev, midtpunkt, minste og største verdi...) -Uteliggere (outliers) (typisk målinger der noe gikk galt, men kan også være reelle, dvs. tegn på skjeve fordelinger el. tunge haler. Forsøk alltid å finne en forklaring!) Definisjon høyreskjev: Hale mot høyre, som her Definisjon venstreskjev: Hale mot venstre 6 Høyreskjev! Samtaler på 8 timer og - timer OUTLIERS eller reelle ekstreme tilfeller? 7 8 Andre typer plott for eksplorativ dataanalyse unit Tidsrekkeplott Rekkefølgen forsøkene ble foretatt i Ta hensyn til læring! 8 sec Observasjoner gjort over tid 9
6 . Fordelinger beskrevet med tall rafisk fremstilling suppleres med numeriske mål (tall!) som beskriver fordelingen ytterligere Sentralmål (beliggenhet) Spredningsmål Kjønn Høyde (cm) 78, 77, 64, 8, 6, 76,, 86, 9, 8, 4, 68, 74, 78, 7, 84, 8,, 67, 69, jennomsnittlig høyde for alle studentene: L+ 69 x = = 7,9 jennomsnittlig høyde for guttene: x g x j jennomsnitt - sentralmål L + 8 = 9 jennomsnittlig høyde for jentene: L + 69 = Oversikt over kjønn og høyde for studenter, 9 gutter og jenter = 79, = 66, Def. gjennomsnitt (mean) Kjønn Høyde (cm) 4 ordne data! Median M - sentralmål: halvparten av observasjonene er mindre enn M, halvparten er større Median høyde for alle studentene blir ~ x() + x() x = = Median høyde for (9) guttene: ~ x g = x g ( ) = Median høyde for () jentene: ~ x j = x j (6) = Tabell: Oversikt over kjønn og høyde for studenter (sortert etter høyde) 4 Def. median M Medianen M i et datasett med n observasjoner er et tall slik at halvparten av observasjonene er mindre enn tallet og den andre halvparten er større n oddetall: n partall: M = midterste observasjon M = gjennomsnitt av de to midterste observasjonene jennomsnitt vs. Median Forskjellen mellom gjennomsnitt og median, eksempler : (a),, 9... median.... gjennomsnitt 4. (b), 8, 9... median gjennomsnitt 6. (c),, 8, 9... median.... gjennomsnitt. (d),,, 9... median.... gjennomsnitt.7 I (c) er de to sentralmålene like. Dette er kun tilfelle når fordelingen er symmetrisk. I skjeve fordelinger ligger gjennomsnittet lenger ut i halen (d). Beregning av begge er nyttig for å vurdere skjevhet. jennomsnittet er svært følsomt for ekstreme observasjoner. Medianen er mer robust i forhold til disse. (e),,... median... mean.7 (f),,... median... mean
7 Range: (minimum, maksimum) - spredningsmål evt. maksimum - minimum IQR, interkvartil avstand: - spredningsmål Q og Q beregner vi lettest som medianen i de obs. som er hhv. mindre og større enn medianen M n partall: Q Q p% persentil (fraktil): p % av obs. er mindre enn dette tallet. M = median = % persentil Q =. kvartil = % persentil Q =. kvartil = 7% persentil n oddetall: IQR = Q-Q = Inter Quartile Range = det intervallet de midterste % av observasjonene ligger i 7 8 Fem-talls-oppsummering Et datasett oppsummeres ofte med fem størrelser: Min Q M Q Max Et boxplott er en grafisk fremstilling av disse! Min Q M Q Max 9 4 Et boksplott er mindre informativt enn et histogram, men egner seg godt til å sammenligne to eller flere datasett! OUTLIERS:.xIQR-kriteriet Hvis en observasjon er større enn Q+.xIQR eller mindre enn Q-.xIQR, så er observasjonen en potensiell uteligger
8 Boksplott detaljer 4 44 Boxplott Newcombs data, fra Minitab Spredning: Varians og standardavvik max Q M Q nest minste Outlier! 4 46 Standardavvik eksempel Standardavvik eksempel Kvinne nr. Varighet i dager av menstruasjonsperioder x = ( L+ ) =, 6 s = [(,) + (,) + (6,) + L+ (,) ],9 = x =,88 s =, x =,4 s =, 48 8
9 Kommentarer 49 Egenskaper standardavvik Oppsummering hva skal vi velge? Endring av skala 4 9
10 Lineær transformasjon Regler for effekten av lineær transformasjon 6
Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010
STK1000 Innføring i anvendt statistikk Tirsdag 24. august 2010 Geir Storvik (modifisert etter I. Glad s tidligere presentasjon) 1 Data, data, data Genetiske data World Wide Web Overvåkning Medisinske bilder
STK1000 Innføring i anvendt statistikk
STK1000 Innføring i anvendt statistikk Tirsdag 23. august 2011 Ingrid K. Glad 1 Data, data, data Genetiske data World Wide Web Overvåkning Medisinske bilder Finansielle data Valgmålinger 2 Hvorfor samler
ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.
Kapittel : Beskrivende statistikk Etter at vi har samlet inn data er en naturlig første ting å gjøre å prøve å oppsummere informasjonen i dataene på en hensiktsmessig måte. Hva som er hensiktsmessig måter
Eksempel på data: Karakterer i «Stat class» Introduksjon
Eksempel på data: Karakterer i «Stat class» Introduksjon Viktige begreper for å beskrive data: Enheter som er objektene i datasettet «label» som av og til brukes for å skille enhetene En variabel er en
Deskriptiv statistikk., Introduksjon til dataanalyse
Introduksjon til dataanalyse Deskriptiv statistikk 2 Kapittel 1 Denne timen og delvis forrige time er inspirert av Kapittel 1, men vi kommer ikke til å gå igjennom alt fra dette kapittelet i forelesning.
Deskriptiv statistikk., Introduksjon til dataanalyse
Introduksjon til dataanalyse Deskriptiv statistikk 2 Kapittel 1 Denne timen og delvis forrige time er inspirert av Kapittel 1, men vi kommer ikke til å gå igjennom alt fra dette kapittelet i forelesning.
ØVINGER 2017 Løsninger til oppgaver. Øving 1
ØVINGER 017 Løsninger til oppgaver Øving 1.1. Frekvenstabell For å lage en frekvenstabell må vi telle antall observasjoner av hvert antall henvendelser. Siden antall henvendelser på en gitt dag alltid
Seksjon 1.3 Tetthetskurver og normalfordelingen
Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data ved tall Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver
Statistikk 1. Nico Keilman. ECON 2130 Vår 2014
Statistikk 1 Nico Keilman ECON 2130 Vår 2014 Pensum Kap 1-7.3.6 fra Løvås «Statistikk for universiteter og høgskoler» 3. utgave 2013 (eventuelt 2. utgave) Se overspringelsesliste på emnesiden Supplerende
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 9. oktober 2008. Tid for eksamen: 15:00 17:00. Oppgavesettet er på
ST0103 Brukerkurs i statistikk Høst 2014
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST0103 Brukerkurs i statistikk Høst 2014 Løsningsforslag Øving 1 2.1 Frekvenstabell For å lage en frekvenstabell må vi telle
Introduksjon. Viktige begreper for å beskrive data: Enheter som er objektene i datasettet. «label» som av og til brukes for å skille enhetene
Introduksjon Viktige begreper for å beskrive data: Enheter som er objektene i datasettet «label» som av og til brukes for å skille enhetene En variabel er en karakteristikk av hver enhet Variablene angis
Statistikk. Forkurs 2017
Statistikk Forkurs 2017 Hva er statistikk? Undersøke Registrere Lage oversikt Presentasjon av informasjon Formidle Arbeidet med statistikk kan vi dele inn i to hovedområder: Samle inn og ordne opplysninger
1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene
1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk
Statistikk. Forkurs 2018
Statistikk Forkurs 2018 Hva er statistikk? Undersøke Registrere Lage oversikt Presentasjon av informasjon Formidle Arbeidet med statistikk kan vi dele inn i to hovedområder: Samle inn og ordne opplysninger
ECON Statistikk 1 Forelesning 2: Innledning
ECON2130 - Statistikk 1 Forelesning 2: Innledning Data, beskrivende statistikk, visualisering Jo Thori Lind [email protected] 1. Beskrivende statistikk Typer variable Nominelle: Gjensidig utelukkende
STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler
STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige
Et lite notat om og rundt normalfordelingen.
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Boka (Ch 1.4) motiverer dette ved å gå fra histogrammer til tetthetskurver.
Et lite notat om og rundt normalfordelingen.
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte
Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie,
Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie, www.statistrikk.no Kontinuerlige data er målinger som gjøres langs en skala, for eksempel tid, lengde og vekt. Noen ganger
Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab
Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab For grunnleggende introduksjon til Matlab, se kursets hjemmeside https://wiki.math.ntnu.no/tma4240/2015h/matlab. I denne øvingen skal vi analysere to
Sannsynlighetsregning og Statistikk.
Sannsynlighetsregning og Statistikk. Leksjon Velkommen til dette kurset i sannsynlighetsregning og statistikk! Vi vil som lærebok benytte Gunnar G. Løvås:Statistikk for universiteter og høyskoler. I den
Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab
Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab For grunnleggende bruk av Matlab vises til slides fra basisintroduksjon til Matlab som finnes på kursets hjemmeside. I denne øvingen skal vi analysere
Basisoppgaver til 2P kap. 3 Statistikk
Basisoppgaver til 2P kap. 3 Statistikk 3.1 Frekvenstabell og histogram 3.2 Kumulativ frekvens 3.3 Median 3.4 Gjennomsnitt 3.5 Spredningsmål 3.6 Diagrammer (Det er ikke basisoppgaver til 3.7 Statistiske
ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,
Analyseoversikt, Uke 35
Analyseoversikt, Uke 35 STK1000 Uke 35, 2016. Studentene forventes å lese Ch 1.1-1.3 i læreboka (MMC). Avsnittet om Stem-and-leaf-plot er ikke pensum. Ulike typer data Kategoriske data MMC: «Kvalitative
Introduksjon til statistikk og dataanalyse
Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166 500 000 Samla billettsalg: $ 20 199 000 000 2 Datasettet vårt Filmene er delt i 8 sjangere: Action
Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013
Introduksjon til statistikk og dataanalyse Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013 Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166
2P, Statistikk Quiz. Test, 2 Statistikk
Test, 2 Statistikk Innhold 1.1 Statistisk undersøkelse... 2 2.2 Presentasjon av tallmateriale... 2 2.3 Sentralmål... 8 2.4 Spredningsmål... 11 2.5 Gruppert datamateriale... 14 Grete Larsen 1 1.1 Statistisk
Statistikk for språk- og musikkvitere 1
Statistikk for språk- og musikkvitere 1 Mitt navn: Åsne Haaland, Vitenskapelig databehandling USIT Ikke nøl, avbryt med spørsmål! Hva oppnår en med statistikk? Få oversikt over data: typisk verdi, spredning,
Seksjon 1.3 Tetthetskurver og normalfordelingen
Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver
Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable
Kapittel 2 Utforske og beskrive data Sammenhenger mellom variable Relasjoner - eksempler Medisinsk studie: Lave kvinner har oftere hjerteattakk enn høye kvinner Forsikring: Tyngre biler har færre dødsulykker
Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005
SOS110 Kvantitativ metode Forelesningsnotater 6 forelesning høsten 005 Statistisk beskrivelse av enkeltvariabler (Univariat analyse) Per Arne Tufte Disposisjon Datamatrisen Variabler Datamatrisen Frekvensfordelinger
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 28/3, 2007. Tid for eksamen: Kl. 09.00 11.00. Tillatte hjelpemidler:
Statistikk og dataanalyse
Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel
ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,
Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger
2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 3 4 Pensumoversikt Forelesninger og øvinger
Forkurs i kvantitative metoder ILP 2019
Forkurs i kvantitative metoder ILP 2019 Dag 2. Forkurs som arbeidskrav for kvantitativ deler av PED-3055 Gregor Maxwell og Bent-Cato Hustad Førsteamanuensis i spesialpedagogikk Hva lærte vi i går? Hva
ÅMA110 Sannsynlighetsregning med statistikk, våren 2010
ÅMA0 Sannsynlighetsregning med statistikk, våren 00 ÅMA0 Sannsynlighetsregning med statistikk våren 00 Praktisk om kurset Foreleser og faglig ansvarlig: Bjørn H. Auestad (kontor: E-536). Undervisningstider:
Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere
2 Loven om total sannsynlighet La A og Ā være komplementære hendelser, mens B er en annen hendelse. Da er: P(B) P(B oga)+p(b ogā) P(B A)P(A)+P(B Ā)P(Ā) ST0202 Statistikk for samfunnsvitere Bo Lindqvist
Beskrivende statistikk Litt om SPSS
Beskrivende statistikk Litt om SPSS HSTAT1101: 20. aug. 2004 Odd Aalen 1 Introduksjon Kunnskap om verden rundt oss kommer ofte via tall og data, dvs statistikk. Hvaersuntogusunt. Epidemiologi. Hvilke behandlinger
MATEMATIKK (MAT1005) Sentralmål / Spredningsmål
??.??.???? MATEMATIKK (MAT1005) Sentralmål / Spredningsmål DEL 1 (UTEN HJELPEMIDLER) 30 minutter DEL 2 (MED HJELPEMIDLER) 60 minutter (Del 1 må leveres inn før hjelpemidlene kan benyttes) Total poengsum:
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 22/3, 2006. Tid for eksamen: Kl. 09.00 11.00. Tillatte hjelpemidler:
MATEMATIKK (MAT1005) Sentralmål / Spredningsmål
??.??.???? MATEMATIKK (MAT1005) Sentralmål / Spredningsmål DEL 1 (UTEN HJELPEMIDLER) 30 minutter DEL 2 (MED HJELPEMIDLER) 60 minutter (Del 1 leveres inn etter nøyaktig 30 minutter og før hjelpemidlene
Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger
Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 7. oktober 2009. Tid for eksamen: 15:00 17:00. Oppgavesettet er på
Innhold. Innledning. Del I
Del I Innledning 1 Hva er statistikk?... 19 1.1 Bokas innhold 20 1.1.1 Noen eksempler 20 1.1.2 Historie 23 1.1.3 Bokas oppbygning 25 1.2 Noen viktige begreper 26 1.2.1 Populasjon og utvalg 26 1.2.2 Variasjon
BEGYNNERKURS I SPSS. Anne Schad Bergsaker 24. november 2017
BEGYNNERKURS I SPSS Anne Schad Bergsaker 24. november 2017 FORRIGE UKE Blitt kjent med de ulike vinduene i SPSS Skrive inn data Import av datafiler Sette samme og dele opp filer og datasett Velge/velge
Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?
Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse? Skrevet av: Kjetil Sander Utgitt av: estudie.no Revisjon: 1.0 (Sept.
Kapittel 3: Studieopplegg
Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere
Statistikk Løsninger. Innhold. Statistikk Vg2P
Statistikk Løsninger Innhold Modul 2: Presentasjon av tallmateriale... 2 Tabeller - Frekvens - Relativ frekvens - Kumulativ frekvens... 2 Søylediagram/stolpediagram... 4 Sektordiagram... 5 Linjediagram/kurvediagram...
UNIVERSITETET I OSLO
Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 12. oktober 2011. Tid for eksamen: 15:00 17:00. Oppgavesettet
Når du har arbeidet deg gjennom dette kapittelet, er målet at du skal kunne
2 Statistikk Innhold Kompetansemål Statistikk, Vg2P... 1 Modul 1: Statistisk undersøkelse... 2 Modul 2: Presentasjon av tallmateriale... 4 Modul 3: Sentralmål... 12 Modul 4: Spredningsmål... 15 Modul 5:
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Fredag 13.10.2006. Tid for eksamen: Kl. 09.00 11.00. Tillatte hjelpemidler:
Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable
Kapittel 2 Utforske og beskrive data Sammenhenger mellom variable Relasjoner - eksempler Medisinsk studie: Lave kvinner har oftere hjerteattakk enn høye kvinner Forsikring: Tyngre biler har færre dødsulykker
UNIVERSITETET I OSLO
Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13. oktober 2010. Tid for eksamen: 15:00 17:00. Oppgavesettet
ÅMA110 Sannsynlighetsregning med statistikk, våren 2007
ÅMA0 Sannsynlighetsregning med statistikk, våren 007 ÅMA0 Sannsynlighetsregning med statistikk våren 007 Praktisk om kurset Foreleser og faglig ansvarlig: Bjørn H. Auestad (kontor: E-536). Undervisningstider:
Øving 7: Statistikk for trafikkingeniører
NTNU Veg og samferdsel EVU kurs Trafikkteknikk Oslo / høsten 2007 Øving 7: Statistikk for trafikkingeniører Det anbefales generelt å arbeide i grupper med 2-3 studenter i hver gruppe. Bruk gjerne Excel
Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling
Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).
Oppgaver til Studentveiledning 4 MET 3431 Statistikk
Oppgaver til Studentveiledning 4 MET 3431 Statistikk 8. mai 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 22/11/2011: Oppgave 1-7. Eksamensoppgaven fra 11/2011 er
INNHOLD. Matematikk for ungdomstrinnet
INNHOLD STATISTIKK... 2 FREKVENS... 2 RELATIV FREKVENS... 2 FREKVENSTABELL... 2 KLASSEDELING... 3 SØYLEDIAGRAM (STOLPEDIAGRAM)... 3 LINJEDIAGRAM... 4 SEKTORDIAGRAM... 4 HISTOGRAM... 4 FRAMSTILLING AV DATA...
Sentralmål og spredningsmål
Sentralmål og spredningsmål 3.1 Læreplanmål 1 3.1 Gjennomsnitt og typetall 2 3.2 Median 6 3.3 Variasjonsbredde og kvartilbredde 10 3.4 Varians og standardavvik 15 3.5 Digitale sentralmål og spredningsmål
Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger
Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives
Sentralmål og spredningsmål
Sentralmål og spredningsmål av Peer Andersen Peer Andersen 2014 Sentralmål og spredningsmål i statistikk I dette notatet skal vi se på de viktigste momentene om sentralmål og spredningsmål slik de blir
1 Grafisk framstilling av datamateriale
1 Grafisk framstilling av datamateriale Dette notatet er laget med tanke på åfå til en rask gjennomgang av denne delen av pensum. Determentforå ha nedskrevet det som forholdsvis rakt blir sagt i forelesning,
Oppgaver til Studentveiledning 3 MET 3431 Statistikk
Oppgaver til Studentveiledning 3 MET 3431 Statistikk 24. april 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 01/06/2011: Oppgave 1-7. Eksamensoppgaven fra 06/2011
Gruppeoppgave 5.-7.trinn:
Måling og statistikk Høyde på elever og voksne ved Gaupen skole 214-15 Oppgave utført av 5.-7.trinn under Matematikk-uka. Kompetansemål fra K6: * Planleggje og samle inn data i samband med observasjonar,
STK1000 Obligatorisk oppgave 1 av 2
6. september 2017 STK1000 Obligatorisk oppgave 1 av 2 Innleveringsfrist Torsdag 21. september 2017, klokken 14:30 i Devilry (https://devilry.ifi.uio.no). Instruksjoner Du velger selv om du skriver besvarelsen
Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1
ECON 130 EKSAMEN 005 VÅR SENSORVEILEDNING Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom , Oppgave 1 I denne oppgaven kan du anta at
Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.
Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Mål på beliggenhet (2.6) Kvartiler: Deler de ordnede dataene inn i fire like store deler: 1. kvartil Q 1 : 25% av dataene
2P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen
P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen 303 a For eksempel finner vi at den relative frekvensen for jenter med høyde 155 159 cm er 0,067 6,7 % 30 = =. Høyde i cm Antall Relativ (frekvens)
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK 1000 Innføring i anvendt statistikk. Eksamensdag: Mandag 4. desember 2006. Tid for eksamen: 14.30 17.30. Oppgavesettet er
MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl. 10.00-12.
MASTR I IDRTTSVITNSKAP 2014/2016 Utsatt individuell skriftlig eksamen i STA 400- Statistikk Mandag 24. august 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator ksamensoppgaven består av 10 sider inkludert
Oppfriskning av blokk 1 i TMA4240
Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for
Utvalgsfordelinger (Kapittel 5)
Utvalgsfordelinger (Kapittel 5) Oversikt pensum, fortid og fremtid Eksplorativ data-analyse (Kap 1, 2) Hvordan produsere data (Kap 3) Sannsynlighetsteori (Kap 4) Utvalgsfordelinger til observatorer (Kap
Mål på beliggenhet (2.6) Beregning av kvartilene Q 1, Q 2, Q 3. 5-tallssammendrag. ST0202 Statistikk for samfunnsvitere
2 Mål på beliggenhet (2.6) Kvartiler: Deler de ordnede dataene inn i fire like store deler: ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 1. kvartil Q 1 : 25% av dataene
2P kapittel 3 Statistikk Løsninger til innlæringsoppgavene
2P kapittel 3 Statistikk Løsninger til innlæringsoppgavene 3.1 a 25 5 8 12 Det var 12 elever som rukte 40 59 minutter til skolen. For eksempel finner vi at den relative frekvensen for elever med reisetid
Medisinsk statistikk Del I høsten 2009:
Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X
Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.
Kapittel 2 Utforske og beskrive data Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.4 denne uken To kryssplott av samme datasett, men med forskjellig skala
Tabell 1: Beskrivende statistikker for dataene
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7, blokk II Løsningsskisse Oppgave 1 a) Utfør en beskrivende analyse av datasettet % Data for Trondheim: TRD_mean=mean(TRD);
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Fredag 28. oktober 2016 Tid for eksamen: 14.00 16.00 Oppgavesettet er på
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Kapittel 2: Beskrivende analyse og presentasjon av data for én variabel Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Grafisk
MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl. 10.00-12.00
MASTER I IDRETTSVITENSKAP 2014/2016 Individuell skriftlig eksamen i STA 400- Statistikk Fredag 13. mars 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator Eksamensoppgaven består av 10 sider inkludert forsiden
LØSNING: Oppgavesett nr. 1
LØSNING: Oppgavesett nr. MAT0 Statistikk, 208 (Versjon 0) Oppgave : ( fordeling, gjennomsnitt, varians og standardavvik ) a) Plotter fordelingen til x i : antall personer 5 4 5 3 2 2 2 2 40 50 60 70 80
Statistikk er begripelig
Statistikk er begripelig men man må begynne med ABC ANOVA ANOVA er brukt til å sammenligne gjennomsnittsverdier Slik er det, selv om det er Analysis of Variance man sier BIVARIAT Bivariat analyse er godt
UNIVERSITETET I OSLO
Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 10. oktober 2012. Tid for eksamen: 15:00 17:00. Oppgavesettet
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Onsdag 12. oktober 2016 Tid for eksamen: 10.00 12.00 Oppgavesettet er på
2P kapittel 3 Statistikk Løsninger til innlæringsoppgavene
P kapittel 3 Statistikk Løsninger til innlæringsoppgavene 3. Frekvensen av hybelboere er 15 % av 10 elever, altså 10 0,15 = 18 elever. 3.3 Sier vi at det er N elever i Arams klasse, har vi fra opplysningene
BEGYNNERKURS I SPSS. Anne Schad Bergsaker 3. mai 2018
BEGYNNERKURS I SPSS Anne Schad Bergsaker 3. mai 2018 FORRIGE UKE Blitt kjent med de ulike vinduene i SPSS Skrive inn data Import av datafiler Sette samme og dele opp filer og datasett Velge/velge bort
Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling
Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Wilcoxon Signed-Rank Test I uke, bruker vi Z test eller t-test for hypotesen H:, og begge tester er basert på forutsetningen om normalfordeling
Kort overblikk over kurset sålangt
Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente
