Introduksjon til SPSS



Like dokumenter
Mål: SPSS. Litteratur. Noen statistikk-programpakker. Dokumentasjon fra SPSS Inc. Introduksjon til IBM SPSS Statistics 20

Introduksjon til SPSS. Johan Håkon Bjørngaard Institutt for samfunnsmedisin, NTNU

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 26. april 2018

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 12. februar 2019

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 17. november 2017

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 24. november 2017

Kom i gang med Stata for Windows på UiO - hurtigstart for begynnere

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 3. mai 2018

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Oppgåve: Åpne filen eksempel.prn som ligg på den utdelte disketten. Figur 1 Eit EXCEL rekneark.

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Begynnerkurs i Stata. UiO vår 2019, Knut Waagan 1 / 95

DATAUTFORSKNING I EG, EG 7.1 OG EGENDEFINERTE FUNKSJONER SAS FANS I STAVANGER 4. MARS 2014, MARIT FISKAAEN

Kapittel 21: Minne og variabler

Innføring i Excel. Et lite selv-instruksjons kurs ( tutorial ) Oppgave 1

DATAØVING 1 INTRODUKSJON TIL STATA I

Nyheter i Office 2016 NYHETER, FUNKSJONER, FORKLARING

Data og beskrivende statistikk Introduksjon til SPSS. 7. april 2005 Tron Anders Moger

Innføring i Excel. Et lite selv-instruksjons kurs ( tutorial )

Kategoriske data, del I: Kategoriske data - del 2 (Rosner, ) Kategoriske data, del II: 2x2 tabell, parede data (Mc Nemar s test)

Logistisk regresjon 2

Last ned En kort innføring i SPSS - Randi Hammervold. Last ned

Kort innføring i SPSS

Starthjelp i MINITAB R

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

SPSS Statistics-kurs 2014

Hvordan lage kontrolldiagrammer legge inn tall i Epidata. Eksempel I-diagram

Enkel plotting i LibreOffice/OpenOffice og Excel

Statistikk for språk- og musikkvitere 2

Bruk av oppgaver og grupper i

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Tabellen viser en serie med verdier for den uavhengige variabelen, og viser den tilhørende verdien til den avhengige variabelen.

8 - Rapporter i M-STAS

Bakgrunn. KLMED 8006 Anvendt medisinsk statistikk - Vår 2008 Repeterte målinger. Overvekt: løp for livet

Hvis kurset du trenger ikke finnes i oversikten under, ta kontakt med oss. Vi tilrettelegger gjerne kurs etter behov.

Begynnerkurs i Stata. UiO , Knut Waagan 1 / 121

SENSORVEILEDNING FOR DEN KVANTITATIVE DELEN AV EKSAMENSOPPGAVEN I SOS1002 VÅREN 2007

Dataøvelse 3 Histogram og normalplott

Manual MicroBuild.no Engineering

2009 Thomas Haugland Rudfoss. PowerPoint 2007 En rask introduksjon

Del 1: Overgang fra gammel hjemmeside til ny hjemmeside

Utvidet brukerveiledning

Introduksjon til EndNote

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Uoffisiell brukermanual Epidata OUS Manager og Entry Client

Ulempen er selvsagt at man må ha adgang til programmet, og lisenser er ganske kostbare.

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

TDT4105 Informasjonsteknologi, grunnkurs. Introduksjon til programmering i Matlab. Rune Sætre / Anders Christensen {satre, anders}@idi.ntnu.

NYHETER I ENTERPRISE GUIDE 7.12

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

PC-AXIS Brukerveiledning for tabelluttak og bearbeiding av data

I denne Knarrhultguiden skal vi se nærmere på hvordan man lager en varslingsfil for sortering av søyer før lamming. Det er laget fire forskjellige

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

Eksamensoppgave i ST3001

Kursoversikt Kurskalender halvår. Kurskalender halvår

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

Rapporteket. Brukermanual. Are Edvardsen

Forelesning 10 Kjikvadrattesten

Lavvannskart Brukerveiledning

Brukerveiledning for student skoleeksamen HIST Oppdatert 27. oktober 2014

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Rapporteket. Brukermanual. Are Edvardsen

Eksamensoppgave i ST3001

Competence / Requirement modulen

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT mars 2015

Paul Hinsch. MICADO AS Utviklet MapBasic applikasjoner i 10 år. Registreringsknapper og Objektdialog

SPSS Statistics-kurs 2013

Retningslinjer for innlegging av foto i NTNU Vitenskapsmuseets fotobase (MusIt)

INTRODUKSJON TIL MAPLE

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. "Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen.

Øving 0 - Xcode TDT4102

Bestille flerbindsverk planlagt i flere bind som utgis over tid:

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT april 2016

Brukerkurs 16.februar 2012

Obligatorisk oppgave nr. 3 (av 4) i INF1000, våren 2006

Det lille kvantitative metodeheftet

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Den norske mor og barn undersøkelsen Versjon 2

Publisere på nvfnorden.org

Redigere bibliografisk post

MATLAB for STK1100. Matematisk institutt Univeristetet i Oslo Januar Enkel generering av stokastiske variabler

HowToUse TTIME. Thierry Matthey 9.

GEOGEBRA (Versjon september 2015)

STUDIEÅRET 2014/2015. Utsatt individuell skriftlig eksamen i. STA 200- Statistikk. Mandag 24. august 2015 kl

Algoritmer - definisjon

Bruk av terninger i statistikkundervisning for å øke forståelsen for enkelte terskelbegrep

Datastrukturer. Kevin Thon. 25 april 2017

Kapittel 3: Studieopplegg

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Sigbjørn Hals, Cappelen Damm Undervisning. Sinus 2P. Digitale løsninger av oppgaver og eksempler med noen utvalgte matematikkverktøy

Straffespark Introduksjon Scratch Lærerveiledning

Uoffisiell brukermanual Epidata OUS Manager og Entry Client

Hvis kurset du trenger ikke finnes i oversikten under må du ta kontakt med oss. Vi setter gjerne opp kurs etter behov.

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Sensorveiledning SYKVIT 4225/GERSYK4304. DEL 1 Kvantitativ metode og design

Aktiviteter registrert i Activities & Events kan presenteres grafisk i Activities Graphical modulen.

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

Din bruksanvisning TEXAS INSTRUMENTS TI-84 PLUS

Sensorveiledning kvantitativ del SYKVIT 4225 VÅR2019 Konteeksamen DEL 1 Kvantitativ metode og design

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Transkript:

Mål Introduksjon til SPSS Inger Johanne Bakken Enhet for anvendt klinisk forskning, NTNU og Avdeling for forebyggende helsearbeid, SINTEF Deltakerne skal få innblikk i: Hvordan komme i gang med SPSS, ulike datavindu. Kompabilitet med andre dataformatet. Oppretting av datafil. Innlesing eller inntasting av data. Redigering. Presentasjon av data deskriptiv statistikk. Tabeller og grafer. Enkle analyser av data 1 2 Noen programpakker statistikk Generelle: S-plus 1), R 0), SAS, Stata 2), Statistica, MINITAB 1), SPSS 1) Spesielle: LISREL, StatXact 2), LogXact 2), SamplePower 1), nquery Grafikk: SigmaPlot 1) Regneark: Excel 1) 0) Gratis fra nettet, 1) NTNU-lisens, 2) lisens ved DMF SPSS (Statistical Package for the Social Sciences) Første versjon allerede i 1968 Lav kom-i-gang terskel Enkel innlegging, strukturering og redigering av datafil Enkelt å hente inn data fra andre dataformat (Excel, tekst, SAS) Enkelt å restrukturere hele datasettet Begrenset metodedokumentasjon (?) Kan benyttes til de aller fleste vanlige og mindre vanlige analysemetoder, men er begrenset på avanserte/svært spesielle metoder Dominerer innen medisinsk forskning i Norge 3 4 Litteratur SPSS Arthur Griffith: SPSS for Dummies Andy Field: Discovering statistics using SPSS Sarah Boslaugh: An Intermediate Guide to SPSS Programming: Using Syntax for Data Management Dokumentasjon fra SPSS Inc. Help -> Topics Help -> Algorithms: Teknisk beskrivelse / definisjoner av metoder Kinear & Gray: SPSS 16 made simple, 2008, ISBN 978-1841697291 Peat, Jennifer & Barton, Belinda: Medical Statistics: A Guide to Data Analysis and Critical Appraisal. Blackwell publishing / BMJ books, 2005, ISBN 978-0727918123 Mange gode hjelpemidler på nettet, eksempler: http://www.ats.ucla.edu/stat/ http://www.spsstools.net/ SPSS User s Guide / Regression Models / Advanced Models / Tables / Trends / Categories / Conjoint / Exact Tests / Missing Value Analysis /Interactive Graphics Bøker eller elektronisk ved NTNU. DMF: P:\programvare\SPSS15\Manualer 5 6 1

Medisinsk statistikk: litteratur Bowers, David: Medical Statistics from Scratch. An Introduction for Health Professionals 2nd ed, Wiley, 2008. ISBN 978-0-470-51301-9. Aalen, Odd. m.fl.: Statistiske metoder i medisin og helsefag. Gyldendal, 2006. ISBN: 82-05-34685-2 Bernhard Rosner: Fundamentals of Biostatistics 6th ed. 2005. ISBN:0-534-41820-1. Andy Field: Discovering statistics using SPSS Åpner SPSS Hva ser du? Datavindu For innlegging/visning av data Variabelvindu For definisjon/visning av variabelformat Outputvindu For presentasjon av analyser og feilmeldinger Syntaxvindu (ikke påkrevd hvis du bare bruker rullegardinmenyene) For alle slags kommandoer: endring av dataformat rekoding lagring av fil kjøring av analyser 7 8 SPSS filtyper Hva er syntax? Datafil (*.sav) Data + variabelinformasjon ( dictionary ) Når du bruker vindusmenyene, genererer du syntax men ser det ikke med mindre du ber om det! (svarer til datavindu og variabelvindu) Output (*.spo) Resultater fra kjøringer Syntax (*.sps) Må brukes aktivt program som svarer til økta Når vi nå åpner SPSS igjen skal vi se 1) Paste (lim inn syntax via rullegardin) Eks. frekvensanalyse: Analyze Descriptive statistics - Frequencies PASTE 2) Slå på syntax loggen i options Edit Options Viewer Display commands in the log 9 10 Hvorfor Syntax? Mange versjoner SPSS SPSS gir mye output - > kan være vanskelig å holde orden (bokholderi) basert på output alene Men: Lav terskel for å komme i gang med programmering ( syntax ) Syntax er en effektiv måte å holde orden på hvordan man har ryddet dataene og hvilke analyser som er benyttet Syntax gjør det også enkelt å kjøre de samme analysene om igjen med små modifikasjoner på samme datasett, eller på et nytt datasett Eksempel: 1) Kjørt alle analysene, oppdager at én variabel er kodet feil 2) Gjennomført en spørreundersøkelse 2008, skal gjennomføre tilsvarende undersøkelse 2009 Nå: 16.0 Innhenting fra eldre versjoner: Datafil går (nesten?) alltid bra SYNTAX går alltid bra, er i prinsippet bare en tekstfil. Men må kanskje redigeres noe. Output Blir ofte krøll. Store endringer fra versjon 11 til 12 og også problemer mellom 13 og 14.0 11 12 2

Struktur i datafilen Case: - Oftest Person innen medisinsk forskning Variable: - Eks: identifikasjonsnummer, dato for registrering, kjønn, fødselsår, høyde, vekt Verdier - Eks: 1, 2008-05-26, kvinne, 1975, 170, 65 Vi tok for oss: Klargjøring av datafil Åpne eksisterende fil Open finn frem fila, åpnes som i andre applikasjoner Ved manuell innlegging av data: Starter med å definere variablene Korte variabelnavn (enkelte regler for valg av navn, feil gir feilmelding) Definisjon av variabeltypen er viktig. Streng er hva som helst. Width angir antall tegn som faktisk lagres, column det som vises på skjermen og i utskrifter. Lett å trekke ut. To desimaltegn er standard for nye numeriske variable (kan endres) Kan kopiere informasjon fra en variabel til en annen Label: Her kan du legge inn et hensiktsmessig variabelnavn (informativt men ikke for langt). Hvis du har lagt inn label er det dette som kommer frem i output Kan slå sammen to eksisterende filer ved å bruke Data - Merge data Til SPSS! 13 14 Missing Measure, eksempler System missing - ingen innlest verdi. (Ikke for variabel type string ) Brukerdefinert missing: - Kan skille mellom årsaker til missing - Bruk verdier som ligger langt unna de reelle verdiene eks. nektet å oppgi f_aar: -100 uleselig f_aar: -1000 Scale: høyde i cm Ordinal: Røyker du? 1 = Daglig, 2 = Av og til, 3 = Sluttet siste halvår, 4 = Sluttet tidligere, 5 = Har aldri røkt Nominal: Sivilstand: 1 = ugift, 2 = gift, 3 = samboer, 4 = skilt, 5 = enke(mann) Til SPSS! 15 16 Vi tok for oss: Sortering og endring av strengvariable Sortering av data ved høyreklikk variabelnavn eller via Data Sort Oppdage duplikater ved Data Identify duplicate cases Slette data, enten marker og delete, eller via Data Select cases Enkelt å gjøre om en dato i streng format til en dato som SPSS gjenkjenner som dato Strengvariable er generelt tungvinte å arbeide med, vi så hvordan Transform Automatic recode kan brukes til å gjøre om til numerisk format, og at all informasjon i strengen blir ivaretatt gjennom Labels Kontrollerte dette i vår aller første analyse: En krysstabell mellom gammel og ny variabel for kjønn. Vi tok for oss: Beregning av nye variable og litt om SYNTAX Hvordan beregne en ny variabel basert på eksisterende variable: I vindusmenyen: Transform Compute variable Legg inn riktige beregninger (eks høyde i meter og BMI) Vi så også hvordan man ved å trykke på Paste ikke kjører kommandoen (i dette tilfellet beregning av ny variabel) men limte kommandoen inn i syntax: COMPUTE BMI = vekt/(hoyde_m*hoyde_m). EXECUTE. SYNTAX kjøres ved å markere og trykke på play. SYNTAX kan enkelt redigeres hvis vi oppdager feil kan lagres til ei senere økt 17 18 3

Vi tok for oss: Fordel med datoformat fremfor streng Datoer kan man gjøre beregninger med (mer komplisert med dato som streng) Eks: Ny variabel for år registrert? - Transform Trykk på function group og velg date extraction så kommer bare aktuelle opp. Velg XDATE.YEAR og legg inn dato for registrering. Resultat: ny variabel som angir året for registreringen Vi brukte denne til å beregne alder i år. Andre aktuelle: Tid mellom to datoer, ukedag for datoen, antall dager/uker siden datoen Nå har vi en datafil som vi kan bruke til noen enkle analyser. Deskriptiv statistikk - tabeller En skalavariabel Descriptive statistics -> Descriptives Eksempel: alder og BMI En kategorisk variabel: Descriptive statistics -> Frequencies Eksempel: Kjønn To kategoriske variable: Descriptive statistics -> Crosstabs Eksempel: kjonn og røyking (la på valget at vi ville ha prosentvis fordeling ved å trykke på cells) 19 20 Deskriptiv statistikk tabeller (forts) Deskriptiv statistikk tabeller (forts) En skalavariabel og en kategorisk variabel: Compare means -> Means Eksempel: alder for kvinner og menn To skalavariable: Kategoriser den ene variabelen alternativt: enkel lineær regresjon (kommer tilbake til dette i øvingen) Kopiering av tabeller / grafer til Word, Excel eller Power Point (1) I SPSS: Rediger ferdig objektet (tabellen/ grafen) Tabell eller graf fra SPSS Viewer. Merk objektet. Edit -> Copy Object (eller Copy) Graf fra SPSS Chart Editor: Edit -> Copy Chart Forlater nå den lille testfilen og åpner en større fil. 21 22 Kopiering av tabeller / grafer til Word, Excel eller Power Point (2) I Word: Sett markøren på rett sted Edit -> Paste special -> Picture -> IKKE float over text I Excel (tabell) Sett markøren på rett sted Edit -> Paste Hypotesetesting Sett opp nullhypotese og alternativ hypotese. Eksempel: H 0 : Forventet respons er lik i gruppene H 0 : Forventet respons er forskjellig P-verdien (signifikanssannsynlighet, sig.) er sannsynligheten for å få de observerte verdier eller noe mer ekstremt, gitt at H 0 er sann. Forkast H 0 hvis p-verdi er mindre enn signifikansnivå (f.eks 0,05 eller 0,01) 23 24 4

Valg av statistisk metode Beregning av p-verdier i SPSS Enkelte tester forutsetter en bestemt modell. Eksempel: T-test forutsetter at data er (tilnærmet) normalfordelt Ikke-parametriske tester er mer fleksible Eksempel: Sammenlikning av to medianer: Nonparametric tests > 2 independent groups (Mann-Whitney) Asymptotisk og eksakt finnes i Nonparametrics (Wilcoxon-Mann-Whitney, Kruskall-Wallis m.fl.) Asymptotisk er default når denne opsjonen er gitt Bør velge eksakt ved små datasett Eksakt er for tidkrevende ved store datasett 25 26 Grafer i SPSS Noen nyttige grafer De fleste grafer finnes som standard og interaktivt Standard holder for de fleste formål Chart Builder, mange muligheter Interactive Legacy Dialogs, standard grafer (som i SPSS 14) Scatterplot (to skalavariable) Histogram Stolpediagram (bar chart) Box plot Analyse: Kan ofte velge grafer her også, eksempler: Descriptive statistics: Q-Q plot Descriptive statistics: Frequencies Charts - Options 27 28 Box plot Oppsummering SPSS er lett å komme i gang med For etablering av filer: Legg inn data manuelt, hent inn fra andre program, kombiner filer, restrukturer filer Transformer og kombiner variable Kategorisere, beregne, kombinere ulike variable Svært mange analysemuligheter Lett å klikke og dra i vindusmenyene Lim inn ( paste ) fra vindusmenyer til syntax og du er i gang med programmering! Lykke til! 29 30 5