DATAØVING 1 INTRODUKSJON TIL STATA I

Like dokumenter
VMware Horizon View Client. Brukerveiledning for nedlasting, installasjon og pålogging for fjerntilgang

Kom i gang med Stata for Windows på UiO - hurtigstart for begynnere

SPSS Høgskolen i Innlandet

Digital hjemmeeksamen PPU

SPSS Høgskolen i Innlandet

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 12. februar 2019

Sørum i Kunnskapsskyen

Lagring i Linux. 1. Hvordan lagre tekst. Når du er ferdig med heftet skal du:

Brukerveiledning for programmet HHR Animalia

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 26. april 2018

Brukerveiledning. Pålogging og bruk av Bra DESKTOP. Braathe Gruppen AS

Til bruk i metodeundervisningen ved Høyskolen i Oslo

La oss begynne med de aller mest elementære hurtigtastene som fungerer i nesten alle programmer og som det er svært hendig å kunne.

Endringer etter omlegging til ny AD

Før du starter, del 2

Komme i gang med Skoleportalen

Hvis du gjenkjenner ett av disse to bildene over så er dere på vår ASP-server.

1. Hent NotaPlan Online Backup på 2. Trykk på Download i menyen og på Download i linjen med Notaplan Backup

Brukerveiledning Privatisering av datamaskinen For avgangselever våren 2017

Velkommen til Brother's Keeper 6 for Windows!

Hvordan slette midlertidige filer i Java kontrollpanel

Generell brukerveiledning for Elevportalen

Innhold RDP... 2 Oppkobling Kirkedata... 2 Flere brukerpålogginger til Kirkedata... 8

Installere JBuilder Foundation i Windows XP

Hvordan koble seg opp mot prosjekt i SAFE fra Windows?

Brukerveiledning for nedlastning og installasjon av Office Av Roar Nubdal, fagprøve IKT-servicefag, juni 2014

Avinstallere Java: Windows 7 og eldre versjoner

Remote Desktop Services

Brukerveiledning digital eksamen via FLOWlock

Ny på nett. Operativsystemer

Brukerveiledning til «Medarbeider-appen»

Logica AS Tlf: Brukerdokumentasjon Fjernaksess InnsIKT 2.0 Versjon 1.3. Godkjennelse. Date. Forfatter: Logica. Leder: <Manager> Date

Lage nettside med squrespace

Skriv ordbøker og litteratur på Tegnspråk med en nett-tjener i lommeformat! For ivrige Tegnskrift (SignWriting )- brukere!

BRUKERMANUAL. Telsys Online Backup

Memoz brukerveiledning

Brukerveiledning Custodis Backup Basic Epost:

Brukerdokumentasjon Citrix og Multiframe InnsIKT 2.0. Versjon 1.5. Innholdsfortegnelse

Hvordan installere Java og easyio på Windows

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 17. november 2017

En liten oppskrift på hvordan jeg installert og fikk Xastir til å virke sånn at jeg ble synlig i APRS verden.

Emit as etiming. Speaker support. Emit as 2007

Velkommen til Pressis.

NY PÅ NETT. Operativsystemer

Innføring i enkel Macbruk

Introduksjon til Min Sky -

Innhold RDP... 2 Oppkobling Kirkedata... 2 Flere brukerpålogginger til Kirkedata... 6

Hvordan å lage og publisere ditt personlige visittkort

Installasjon av Windows 7 og Office 2016

Del 1: Overgang fra gammel hjemmeside til ny hjemmeside

Brukerdokumentasjon. Versjon Beskrivelse Dato Forfatter 1.0 Initial versjon Simone Wiezer

Windows XP. Skrivebord

Installasjonsveiledning

Innhold RDP... 2 Oppkobling Kirkedata... 2 Flere brukerpålogginger til Kirkedata... 6

Hvordan koble seg opp mot prosjekt i SAFE fra Windows?

Bruksanvisning for Blekkspruten koblingsboks

Brukerveiledning WordPress. Innlogging:

Introduksjon i bruk av Microsoft Outlook 2003 med Exchange for NHH

Hvordan oppdatere Java.

Installasjon enbruker

Veiledning for Infoserver Citrix

Kort brukerveiledning om fjerntilgangsløsningen

Gjennomføre et møte. MeetAt Datamøte

Brukerdokumentasjon Prosjektrom

ebudbok Elektronisk budbok på PDA Registrering av gangrekkefølge på web

NorskInternett Brukermanual. Sist oppdatert Side 1/30

Hvordan koble seg opp mot prosjekt i SAFE fra Mac OS X?

installasjonsveiledning 2012

Installasjonsveiledning. DDS-CAD ByggMester

Bruk av kildeavskrifter som er merket med grønn kule

Oppgaver del 2 Dokumenthåndtering

Timeregistrering I Agresso. Brukerveiledning (Verson 1.0 PML)

Hvordan koble seg opp mot prosjekt i SAFE fra Mac OS X?

For nesten alle tjenestene bruker du hjelpesenteret øverst på høyre side i skjermbildet.

Brukermanual - Joomla. Kopiering av materiale fra denne Bonefish manualen for bruk annet sted er ikke tillatt uten avtale 2010 Bonefish.

KONTOR påloggingsguide / Oppsett av Outlook 2010

Brukerveiledning for konfigurasjon av Kistock trådløse dataloggere

BRUK AV TiSferaDesign I RINGETABLÅER MED ELEKTRONISK NAVNELISTE:

Hvordan installere Adobe Digital Editions?

For å sjekke at Python virker som det skal begynner vi med å lage et kjempeenkelt program. Vi vil bare skrive en enkel hilsen på skjermen.

Brukerveiledning - secure.nhh.no og secure.privnett.nhh.no

Bruk av ez PDF Reader

Innhold RDP... 2 Oppkobling Kirkedata... 2 Flere brukerpålogginger til Kirkedata... 8

Viktig informasjon ang. lagringsområder

Hei verden Introduksjon Swift PDF

Installasjonsveiledning Visma Avendo, versjon 5.2

Velkomment til å installere BAS21

Løsninger på påloggingsproblemer

4. Installasjonsveiledning. Experior - rich test editor for FitNesse -

Hvor og hvordan lagrer du mediafilene dine?

1 INNLEDNING Om Altinn Skjemaer som støttes INSTALLASJON OG OPPSTART Nedlasting Registrering...

Konfigurasjon av Eduroam i Windows Vista

Brukerveiledning. Searchdaimon AS phone: Østensjøveien 34 fax:

Tilgang til nytt skrivebord «KONTOR»

Brukerhåndbok ipad. for politikere i Melhus kommune

Her skal du lære å programmere micro:biten slik at du kan spille stein, saks, papir med den eller mot den.

Du har sikkert allerede startet noen programmer ved å trykke på kontrollknappen. VINDUER = WINDOWS

Mamut Open Services. Mamut Kunnskapsserie. Kom i gang med Mamut Online Survey

Installere JBuilder Foundation i Mandrake Linux 10.0

Transkript:

DATAØVING 1 INTRODUKSJON TIL STATA I Oversikt - Hvordan starte Stata - Åpne datafil - STATA vinduet - Loggfiler - Deskriptiv statistikk I SOS3003 kommer vi dette semesteret til å bruke statistikkprogrammet Stata. Da de færreste av dere har jobbet med dette programmet før nå, vil dataøvingene i alle hovedsak fokusere på å lære dere hvordan dere bruker programmet. I denne øvingen er målet å bli kjent med Stata, hvordan man åpner datafiler og noen grunnleggende kommandoer for deskriptiv statistikk. Den største forskjellen fra SPSS til Stata vil nok være at man i Stata hovedsakelig jobber gjennom å skrive inn kommandoer, i motsetning til SPSS, der man vanligvis bruker menyene. Om noen av dere har brukt Syntax i SPSS, vil dette føles mye mer kjent. Prinsippet er det samme, men kommandoene ser noe annerledes ut. For å bli godt kjent med Stata vil jeg anbefale dere å prøve dere frem med programmet og teste ut ulike kommandoer. Så lenge dere ikke gjør endringer i datasettet og lagrer disse er det ingen fare. Hvordan starte STATA? Stata finnes ikke gratis tilgjengelig til egen datamaskin for studenter ved fakultetet. Det er kun installert på datamaskinene på datasal 10349. Det er likevel mulig å jobbe fra egen datamaskin, eller fra maskin i annen lesesal, gjennom Windows Remote Desktop (eksternt skrivebord). Dette er et program som tillater deg å koble opp og bruke en annen datamaskin over internett, som om du skulle ha sittet ved denne maskinen. Bruk av Remote Desktop krever naturlig nok nettilgang, og du må være logget inn på NTNUs nettverk (eduroam fungerer også, i alle fall på campus): 1

1. Logg deg på NTNUs nettverk gjennom en VPN-klient (se link nedenfor for mer info om dette. Sitter du på NTNUs trådløse nettverk, trenger du ikke gjøre dette) 2. Start opp remote desktop-programmet (kan gjøres ved å kjøre mstsc.exe eller Remote Desktop Connection, om du sitter i Windows. Du kan finne begge ved å søke etter dem i Start-menyen. Om du bruker Linux eller Mac, må du installere en Remote Desktop-klient først. Orakeltjenesten kan hjelpe deg med dette.) 3. I vinduet du får opp skriver du inn følgende: stata-ic.ad.svt.ntnu.no 4. I neste vindu må du skrive inn brukernavn og passord. Sitter du på en lesesal, er brukernavn allerede fylt inn. Hvis ikke må du fylle inn følgende»: «WIN-NTNU- NO\brukernavn», der du bytter ut «brukernavn» med ditt NTNU-brukernavn. 5. Nå har du tilgang til den eksterne datamaskinen. Du vil få opp et vanlig skrivebord, men med mulighet til å minimere og lukke øverst i midten. Merk at det nå fungerer som om du er på denne PCen. Du har også tilgang til dine hjemmeområder hos NTNU. 6. For å starte Stata, trykk på Startknappen nederst i venstre hjørne, og skriv in «stata» i feltet nederst. Da vil «stataic13» dukke opp over, og du klikker på denne. Dersom du har problemer med å sette opp Stata til bruk på egen pc/mac kan du ta kontakt med IT seksjonen på fakultetet. 2

Åpningsvinduet i Stata Stata er inndelt i 5 mindre vinduer: 1. Kommandovinduet (Command) Kommandovinduet er stedet hvor Stata får beskjed om å lage nye data eller gjennomføre analyser. En kommando etterfulgt av Enter setter Stata i sving. En begrensning ved kommandovinduet er at du må vite hva kommandoene heter for å bruke dem. I SPSS bruker de fleste menyvinduet for å gjøre analyser, men i Stata bør analysene skrives inn. Dette gir bedre kontroll, og menysystemet i Stata er mindre ryddig og mer kronglete å bruke enn i SPSS. 2. Resultatvinduet Det store resultatvinduet (i midten av skjermen) presenterer resultatene av analysen. Når kommandoen er riktig blir skriften svart og når den er feil blir den rød. Resultatvinduet inneholder ofte mer informasjon enn det er plass til på et enkelt skjermbilde. Stata stopper da automatisk og gir beskjed om more nederst i skjermbildet. Får å få opp neste side kan du enten trykke more eller en tilfeldig tast. 3

3. Oversiktsvinduet (Review) Oversiktsbildet finnes i venstre bildekant og viser alle kommandoene med utspring i kommandovinduet eller menyene. Vinduet fungerer som en kronologisk fremstilling av analysen. Ved å klikke på en kommando i oversiktsvinduet en gang blir den videresendt til kommandovinduet for eventuell redigering. 4. Variabelvinduet (Variable) Øverst til høyre på skjermen og inneholder variablene som er tilgjengelig for analyse. 5. Egenskapsvinduet (Properties) Nederst til høyre, gir opplysninger om variabelen som til en hver tid er uthevet i variabelvinduet. Den mest interessante opplysningen her er kanskje variabelbeskrivelsen (Label). Knappen med bilde av en lukket lås styrer tilgangen til hurtigredigering av variabelnavn og variabelbeskrivelser. Menylinjen Slik ser menylinjen i Stata ut: Vi hopper over de 3 første ikonene (åpning av filer, lagring og printing). De neste ikonene er spesifikke Stata-ikoner. Det første ikonet er for å starte og avslutte loggføring. Loggføring vil si at Stata lager en ny fil der det som gjøres, og resultatene som kommer ut, lagres. Det neste ikonet er Stata Viewer. I dette kan du vise loggfiler i Statas egen filtype.smcl, samt få tilgang til Statas hjelpemanualer. Det tredje ikonet brukes om du har oppe grafer, og får vinduet med grafen til å komme frem. Den neste knappen, en blyant som skriver på et tekstark, er knappen for å åpne en ny.do-fil..do- filer er som SPSS sine syntaxfiler en tekstfil der du kan skrive inn en rekke kommandoer, og så kjøre disse samlet (samt lagre dem slik at du kan kjøre kommandoene på ny senere). De to neste ikonene er for å henholdsvis redigere og se på dataene i datasettet. Om dere bare vil gå inn og se på dataene, bruk ikonet med forstørrelsesglasset. Da slipper dere å ende opp med å redigere noe med en feiltakelse. 4

Variables manager neste knapp får opp et nytt vindu med variablene i datasettet. Herifra kan man redigere noen av egenskapene til en variabel. Dette er ikke noe dere kommer til å ha veldig mye bruk for i dette faget, dog. De to siste knappene brukes når Stata kjører. Break-knappen X-en er den som er verdt å legge merke til. Om Stata skulle henge seg opp i en litt for stor og vanskelig regresjon kan man trykke på denne for å stoppe prosessen. Åpne en datafil Gå inn på It's Learning og og klikk deg videre til SOS3003. Herfra går du inn på mappen Stata à ESS-data 2002, 2004, 2006, 2008, 2010 og 2012 fra alle landene à Datafil: ESS6 2012 datasett. Trykk på last ned. Gå inn på Stata og trykk File à Open. Nå bør Stata vinduet se omtrent ut som dette: Her kan vi med første øyekast legge merke til to endringer fra Stata-vinduet uten datafil: 1) i oversiktsvinduet (review) er det nå kommet opp en kommando. 2) variabelvinduet (variable) er nå fylt av variablene i ESS2012 datasettet. 5

Loggfiler De av dere som har brukt SPSS før ved at dere kan lagre alt dere har gjort gjennom å lagre output-filen. Dette er ikke direkte mulig i Stata. Derimot er det mulig å be Stata om å lage en loggfil. Loggfilen lagrer alt som kommer i output/resultat vinduet, inkludert kommandoene du kjører. Stata kan lagre loggfiler i to formater:.log og.smcl. Sistnevnte er Statas egen loggfiltype, mens.log egentlig bare er en tekstfil..smcl-filen vil se ut akkurat som det som kommer ut i output/resultat vinduet, mens.log vil være ren tekst. Loggfiler åpnes ved å: Trykke på logg-knappen i verktøylinjen à velg.smcl à gi loggfilen et navn (øving1) og lagre den. Om dere nå trykker på logg-knappen, vil dere få alternativene: 1. "View snapshot": åpner loggfilen for visning i Stata viewer. 2. "Close log file": Stopper og lagrer loggingen. 3. "Suspend log file": pauser loggingen. Du kan starte opp loggingen igjen ved å trykke på knappen igjen eller å skrive "log on" i kommandolinjen. Deskriptiv statistikk To kommandoer som kan gi litt informasjon om en gitt variabel er describe og codebook. Sistnevnte gir mest informasjon. Hvis du kun skriver inn kommandoen describe (eller codebook) kommer informasjon om hele datasettet. Vi prøver: Command: set more off à enter Command: describe à enter 6

Scroll øverst i resultat/output vinduet. Her har vi fått en oversikt med litt informasjon om datasettet. Her kan vi se antall variabler (vars = 627), antall enheter (obs = 54, 673) og størrelsen på datasettet (size). Tabellen viser også variabelnavnene (variable name), variabelbeskrivelsene (variable label) og verdibeskrivelse (value label). Dette gjelder alle variablene i datasettet. For å begrense informasjonen til å gjelde bare en variabel må vi angi variabelnavnet. Vi skal nå prøve med tvtot, en variabel som gir informasjon om hvor mye man ser på tv i hverdagen: Command: describe tvtot à enter 7

Codebook gir mer detaljert informasjon en describe og inkluderer frekvensfordeling (kategoriske variabler: nominal- og ordinalnivå) og deskriptiv statistikk som gjennomsnitt og standardavvik (kontinuerlige variabler: intervall- og forholdstallsnivå). Nå skal vi prøve codebook kommandoen for gndr (kjønn): Command: codebook gndr à enter Her kan vi se enkel frekvensstatistikk av variabelen gndr som vier at 24929 har oppgitt at de er mann, mens 29727 har oppgitt at de er kvinne. 17 har ikke svart på spørsmålet. Frekvensstatistikk, search og help Search og help er hjelpekommandoer som kan hjelpe oss å finne kommandoer vi er på jakt etter og gi oss informasjon om hvordan vi bruker disse kommandoene. Nå skal vi lete etter en kommando som kan gi oss en frekvenstabell. Da kan vi skrive inn: Command: search frequency table à enter Vi får nå opp et vindu med søkeresultatene. Det er ganske mange resultater, men de mest relevante resultatene er som regel først. table, tabulate oneway og tabstat ser lovende ut, vi prøver: Command: table gndr à enter 8

Resultatet er en ren frekvenstabell kun med antallet personer som har svart mann eller kvinne. Vi vil gjerne har prosentfordelingen også, så vi prøver neste kommando: Command: tabstat gndr à enter Her får vi bare opp "gjennomsnittet" for kjønn, som ikke gir mye mening. Command: tabulate oneway gndr à enter Her får vi opp en feilmelding. Feilmeldingen sier at oneway ikke er en variabel i datasettet og dette forteller oss at kommandoen med navnet tabulate oneway må skrives inn i kommandolinjen på en annen måte. Vi kan bruke help får å finne ut mer: Command: help tabulate oneway à enter Her ser vi at måten kommandoen virker på er bare å skrive inn tabulate etterfulgt av variabelnavnet: 9

Command: tabulate gndr à enter Nå har vi fått tabellen vi var på jakt etter! Denne kommandoen har gitt oss både frekvensen, prosentfordeling og kumulativ prosentfordeling. Kumulativ prosentfordeling er ikke så viktig for denne variabelen, kjønn, men kan være nyttig med rangordnede variabler. Vi har nå funnet en kommando for å få ut frekvenstabeller. Kommandoen tabstat ga ut gjennomsnittet, la oss se om vi kan få ut standardavvik, min. og max. i tillegg: Command: search tabstat à enter Dokumentasjonen til denne kommandoen forteller oss at vi kan skrive inn statistics for å få ut de verdiene vi er på jakt etter. Klikker dere på statname her kommer en liste over navnene som skal skrives for de spesifikke veridene: Command: tabstat eduyrs, statistics (mean sd min max n) à enter Dere får nå deskriptiv statistikk på respondentenes utdanning: gjennomsnitt, standardavvik, variasjonsbredde, minimum, maximum og antall. 10

En annen kommando som kan brukes for å få opp deskriptiv statistikk er summarize. Med summarize alene får du ut antall observasjoner, gjennomsnitt, standardavvik, min og max direkte: Command: summarize eduyrs à enter Ved å bruke kommandoen summarize detail vi dere få ut deskriptiv statistikk som går mer i dybden: Command: summarize eduyrs, detail à enter Vi får det meste vi trenger gjennom summarize, men det er noen verdier som vi kun får med summarize detail. Nå som vi har gjort et par kommandoer kan dere ta en titt på loggfilen deres. Lagre loggfilen med å trykke på "Loggikonet" i menylinje og velg "Close log file". 11

Kommandoer vi har brukt i Øving 1 Kommando Forkortelse Anvendelse log on Starter loggføring/loggfil set more off Opphever "more" funksjon set more off, permanently Opphever "More" funksjon permanent set more on, permanently Slår på "more" funksjon permanent describe des Beskriver dataene describe variabelnavn des variabelnavn Beskriver data for en gitt variabel codebook variabelnavn Beskriver data for en gitt variabel (des. Statistikk) search søkeord Søker etter kommandoer table Frekvenstabell (kun antall) tabstat tabulate tab Frekvens og krysstabell help h Søke etter hjelp statistics mean Gjennomsnitt n Antall max Maximum min Minimum range Range = max- min sd Standardavvik summarize sum Deskriptiv statistikk Summarize variabel, detail Detaljert/dypere deskriptiv statistikk 12