Mål: SPSS. Litteratur. Noen statistikk-programpakker. Dokumentasjon fra SPSS Inc. Introduksjon til IBM SPSS Statistics 20



Like dokumenter
Introduksjon til SPSS. Johan Håkon Bjørngaard Institutt for samfunnsmedisin, NTNU

Introduksjon til SPSS

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 12. februar 2019

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 26. april 2018

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 17. november 2017

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 24. november 2017

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 3. mai 2018

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Kom i gang med Stata for Windows på UiO - hurtigstart for begynnere

Data og beskrivende statistikk Introduksjon til SPSS. 7. april 2005 Tron Anders Moger

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Oppgåve: Åpne filen eksempel.prn som ligg på den utdelte disketten. Figur 1 Eit EXCEL rekneark.

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Innføring i Excel. Et lite selv-instruksjons kurs ( tutorial ) Oppgave 1

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. "Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen.

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

SPSS Statistics-kurs 2014

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT mars 2015

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

Begynnerkurs i Stata. UiO vår 2019, Knut Waagan 1 / 95

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Bakgrunn. KLMED 8006 Anvendt medisinsk statistikk - Vår 2008 Repeterte målinger. Overvekt: løp for livet

Dataøvelse 3 Histogram og normalplott

Logistisk regresjon 2

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT april 2016

Bærekraftig utvikling - forskerspiren. Maria Sviland, Skolelaboratoriet NTNU

Repeterte målinger. Repeterte målinger. Eirik Skogvoll

Last ned En kort innføring i SPSS - Randi Hammervold. Last ned

DATAØVING 1 INTRODUKSJON TIL STATA I

STUDIEÅRET 2011/2012. Utsatt individuell skriftlig eksamen. STA 200- Statistikk. Mandag 27. august 2012 kl

Statistikk og dataanalyse

Kapittel 3: Studieopplegg

Det lille kvantitative metodeheftet

Lineære modeller i praksis

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

Nyheter i Office 2016 NYHETER, FUNKSJONER, FORKLARING

Innføring i Excel. Et lite selv-instruksjons kurs ( tutorial )

UNIVERSITETET I OSLO

Enkel plotting i LibreOffice/OpenOffice og Excel

Del 1: Overgang fra gammel hjemmeside til ny hjemmeside

TDT4105 Informasjonsteknologi, grunnkurs. Introduksjon til programmering i Matlab. Rune Sætre / Anders Christensen {satre, anders}@idi.ntnu.

EKSAMENSOPPGAVE KLH3004 Medisinsk statistikk (Medical statistics) KLMED8004 Medisinsk statistikk, del I (Medical Statistics, Part I)

Begynnerkurs i Stata. UiO , Knut Waagan 1 / 121

Ulempen er selvsagt at man må ha adgang til programmet, og lisenser er ganske kostbare.

Uoffisiell brukermanual Epidata OUS Manager og Entry Client

Hvordan analysere måledata vha statistisk prosesskontroll? Side 2

Eksamensoppgave i ST3001

Statistikk for språk- og musikkvitere 2

Kort innføring i SPSS

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

Forelesning 13 Regresjonsanalyse

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Eksamensoppgave i ST3001

Statistikk er begripelig

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

MATLAB for STK1100. Matematisk institutt Univeristetet i Oslo Januar Enkel generering av stokastiske variabler

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

UNIVERSITETET I OSLO

Starthjelp i MINITAB R

Løsningsforslag Til Statlab 5

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Institutt for økonomi og administrasjon

Beskrivende statistikk Litt om SPSS

Innhold. Innledning. Del I

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Kapittel 1: Data og fordelinger

OM EXTRANET OG KAMPANJENS MÅLINGER (innsatsområdene UVI og SVK) Side 2

2009 Thomas Haugland Rudfoss. PowerPoint 2007 En rask introduksjon

Fra boka: 10.32, 10.33, 10.34, 10.35, 10.3 og (alle er basert på samme datasett).

Statistikk for språk- og musikkvitere 1

DATAUTFORSKNING I EG, EG 7.1 OG EGENDEFINERTE FUNKSJONER SAS FANS I STAVANGER 4. MARS 2014, MARIT FISKAAEN

STATISTISK ANALYSE I SPSS. Anne Schad Bergsaker 26. februar 2019

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Forelesning 10 Kjikvadrattesten

Sigbjørn Hals, Cappelen Damm Undervisning. Sinus 2P. Digitale løsninger av oppgaver og eksempler med noen utvalgte matematikkverktøy

Lær å bruke Autograph av Sigbjørn Hals

OPPGAVEHEFTE FOR STK1000 KAPITTEL Oppgaver fra Kapittel 1

SPSS Statistics-kurs 2013

KLMED 8006 Anvendt medisinsk statistikk - Vår 2009 Repeterte målinger

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Den norske mor og barn undersøkelsen Versjon 2

HowToUse TTIME. Thierry Matthey 9.

Sentralmål og spredningsmål

Grafisk løsning av ligninger i GeoGebra

Introduksjon til EndNote

Kompleksitetsanalyse Helge Hafting Opphavsrett: Forfatter og Stiftelsen TISIP Lærestoffet er utviklet for faget LO117D Algoritmiske metoder

MASTER I IDRETTSVITENSKAP 2018/2020. Individuell skriftlig eksamen. STA 400- Statistikk. Mandag 18. mars 2019 kl

Hvordan lage kontrolldiagrammer legge inn tall i Epidata. Eksempel I-diagram

Transkript:

Introduksjon til IBM SPSS Statistics 20 av Stian Lydersen NTNU Revidert 13 aug 2012 http://folk.ntnu.no/slyderse/medstat/spss/introduksjon_spss.pdf Mål: Deltakerne skal få innblikk i Oppretting av datafil. Innlesing eller inntasting av data. Redigering. Presentasjon av data deskriptiv statistikk. Tabeller og grafer. Enkle analyser av data http://folk.ntnu.no/slyderse/medstat/spss/introduction_spss.pdf 1 2 Noen statistikk-programpakker Generelle: R 0), SAS, Stata 2), SPSS 1), MINITAB 1), Statistica Spesielle: SamplePower 1), Amos 1), LISREL, M-plus, StatXact, LogXact Grafikk: SigmaPlot 1) Regneark: Excel 1) 0) Gratis fra nettet, 1) NTNU-lisens, 2) lisens ved DMF 3 SPSS Generell statistikk-programpakke Enkel å bruke Enkel innlegging, g, strukturering og redigering g av datafil Mye output Vanskelig syntax struktur Begrenset metodedokumentasjon Begrenset på avanserte / spesielle metoder dominerende innen medisin i Norge. 4 Litteratur Dokumentasjon fra SPSS Inc. Kinnear & Gray: IBM SPSS Statistics 19 Made Simple, 2011 Bowers, David: Medical Statistics from Scratch. An Introduction for Health Professionals 2nd ed, Wiley, 2008. ISBN 978-0-470-51301-9. Statistics Base / Regression / Advanced Models / Categories / Conjoint / Exact Tests / Missing Values / Bootstrapping / samt mange flere http://download.spss.no/spss_statistics_19_doc_en.zip no/spss Statistics Noen finnes også i bokform Help -> Topics Help -> Algorithms: Teknisk beskrivelse / definisjoner av metoder 5 6 1

Filtyper Datafil (*.sav) Viewer-fil (*.spv) Syntax-fil (*.sps) og noen andre mindre brukte Flytting av filer mellom SPSS-versjoner Datafil: Små format-endringer. Går vanligvis bra Viewer fil: Kan være vanskelig eller umulig Viktige resultater bør lagres som syntax og/eller pdf fil Syntax-fil: Går vanligvis bra 7 8 Struktur for datafil: Cases, variable og verdier Case: Eks: Person Variable: Eks: identifikasjonsnr, alder, høyde, kjønn Verdier: Eks: 205, 45, 178,2, kvinne Repeterte målinger - 2 alternative format: 1. Hver pasient som case ( wide format ) 2. Hvert måletidspunkt for hver pasient som case ( long format ) Svitsje mellom format 1 og 2 vha Data editor -> data -> Restructure 9 10 Vinduer Data Editor: Data View Variable View Viewer Syntax Editor og noen andre mindre brukte 11 Variable view - 1 Name: Inntil 64 tegn (bokstaver, tall, @, #, _,$, ) start med bokstav ingen mellomrom, ingen *,?,!, Bokstavene æ, ø, å frarådes. Ikke and, or, not,... Type: Numeric, date, string, etc Width (på datafil), særlig aktuelt ved string 12 2

Variable view - 2 Decimals (på skjerm/utskrift) Label: Inntil 120 tegn, alle tegn tillatt Values: F.eks 1 = mann, 2 = kvinne Missing: F.eks 98 = ble ikke spurt, 99=ikke besvart Column (på skjerm/utskrift) Align Measure: Scale, Ordinal, Nominal Role: Input, Target, Both, None, Partition, Split 13 Missing: System missing - ingen innlest verdi. Enklest og nesten alltid OK! (Ikke for variabel type string ) Brukerdefinert missing: Kan skille mellom årsaker til missing Kan skille mellom missing og glemt å legge inn tall Kan få problemer ved lagring i andre format enn SPSS 14 Measure, eksempler: Scale: høyde i cm Ordinal: Hvordan er helsa di? 1 = Dårlig, 2 = Ikke helt god, 3 = God, 4 = Svært god Nominal: Sivilstand: 1 = ugift, 2 = gift, 3 = samboer, 4 = skilt, 5 = enke(mann) 15 Tid mellom to datoer Transform -> Date and Time Wizard -> Calculate with dates and times Default: Gir tid rundet av ned (trunkert) til f.eks antall hele år Anbefalt: Du kan velge å beholde desimaltall 16 Beregning av nye variable Eksempel: Kroppsmasseindeks BMI=(vekt i kg)/(høyde i meter) 2 Transform -> Compute variable 17 Innlesing av data Inntasting i data editor Hente SPSS fil Innlesing fra annen fil, f.eks EXCEL vha File -> Open -> Data -> Files of Type (Anbefales vanligvis) vha Copy - Paste i Windows (Nyttig ved enkle/små filer eller data-områder. Kan miste noe informasjon) 18 3

Deskriptiv statistikk - tabeller En skalavariabel (eller kategorisk variabel): Descriptive statistics -> Descriptives En kategorisk variabel: Descriptive statistics -> Frequencies To kategoriske variable: Descriptive statistics -> Crosstabs Deskriptiv statistikk tabeller (forts) En skalavariabel og en kategorisk variabel: Compare means -> Means To skalavariable: Kategoriser den ene variabelen alternativt: enkel lineær regresjon 19 20 Feilsøking og feilretting Descriptive statistics Frequencies, Descriptives, Crosstabs Oppretting av funne feil: Finn feilen(e): Edit - Find (I Data Editor - Data View), eller Data -> Sort cases Rett opp eller slett feil verdier Kopiering av tabeller / grafer til Word, Excel eller Power Point: I SPSS: Rediger ferdig objektet (tabellen/ grafen) Edit -> Copy IW Word: Sett markøren på rett sted Edit -> Paste special -> (velg et passende format) I Excel (tabell) Sett markøren på rett sted Edit -> Paste 21 22 Hypotesetesting Sett opp nullhypotese og alternativ hypotese. Eksempel: H 0 : Forventet respons er lik i gruppene H 1 : Forventet respons er forskjellig P-verdien (signifikanssannsynlighet, sig.) er sannsynligheten for å få de observerte verdier eller noe mer ekstremt, gitt at H 0 er sann. Forkast H 0 hvis p-verdi er mindre enn signifikansnivå (f.eks 0.05 eller 0.01) 23 Valg av statistisk testmetode. Enkelte tester forutsetter en bestemt modell. Eksempel: T-test forutsetter at data er (tilnærmet) normalfordelt Ikke-parametriske tester er mer fleksible Eksempel: Sammenlikning av to medianer: Nonparamteric tests > 2 indenpendent groups (Mann-Whitney) 24 4

Eksakt versus asymptotisk Eksakt: 0.215 * 0.529 = 0.113735 Tilnærmet: 0.215* 0.529 0.2 * 0.5 = 0.1 Asymptotisk betyr tilnærmet, med bedre tilnærming jo større n 25 Beregning av p-verdier i SPSS: Asymptotiske og eksakte metoder finnes i Crosstabs Nonparametrics (Wilcoxon-Mann-Whitney, Whitney, Kruskall-Wallis m.fl.) Asymptotisk er default Bør velge eksakt ved små datasett Eksakt er for tidkrevende eller umulig ved store datasett 26 Noen nyttige grafer Én kategorisk variabel: Bar chart (stolpediagram) Pie chart (kakediagram?) To kategoriske variable: Clustered bar chart (klynget stolpediagram) Noen nyttige grafer (forts.) Én skalavariabel: Histogram Sammenlikne data med normalfordeling: Q-QQ plot lettere å lese og tolke enn normal curve overlay i histogram To skalavariable: Scatterplot 27 28 Noen nyttige grafer (forts.) Box-plott 5000 Én skalavariabel og én kategorisk variabel (sammenlikne skalavariabelen i to eller flere grupper): Dot plot eller scatter plot (ved få observasjoner) Box plot (ved mange observasjoner) 4000 3000 2000 Median 1000 N = 20 F_VEKT 29 30 5