Den norske mor og barn undersøkelsen Versjon 2 Oslo 17. mars 2006 Elin Alsaker
Datainnsamling Uke Uke Uke 17 22 30 Fødsel Ultralyd MFR 6 mnd 18 mnd 36 mnd 7 år Barn Navle snor Mor QI QII QIII QIV QV QVI QVII Far
MorBarn-skjema i versjon 1 Farsskjema Skjema 1 (ca 17 uker) Skjema 2 (ca 22 uker) Skjema 3 (ca 30 uker) Skjema 4 (ca 6 mnd) Skjema 5 (ca 18 mnd) Skjema 6 (ca 3 år) I svangerskapet Etter fødsel
Antall i versjon 2 Far 25 491 Skjema 1 51 107 Skjema 3 48 511 Skjema 2 (C/D) 40 932 Skjema 2A 732 Skjema 2B 8 593 Kostberegning 49 875 Skjema 4 40 805 Skjema 5 24 810 Skjema 6 7 054 Før fødsel Etter fødsel
MoBa-metadatabasen Metadata er data om data Kobling mellom versjoner av skjema Spørsmålsformulering Gruppering innen tema f.eks. menstruasjon, psykisk helse Filer med scannete bilder og koordinater Kontroll av gyldige verdier (min/max) Kvalitetssikringsregler
Dokumentasjon Oppdatering på Web link
Ulike versjoner Hvert av de ulike skjemaene har to eller flere versjoner. De fleste spørsmål er like og finnes i begge/alle versjoner Andre spørsmål finnes bare i en versjon I hvilke versjoner spørsmålet finnes, kan leses fra labelen til tilhørende variabel
Variabel - labels - Spørsmålsnummer i de ulike versjonene - Spørsmålsteksten Eks: Variabel AA1123 har label: S_49:SKJEMA1C; (S_49:SKJEMA1B); (S_57:SKJEMA1A); Sivilstand; 49. Hvilken sivilstand har du nå?
Skjema Variabelnavn Kort-label 1 AAxxx Sxxxyyzz 2 BBxxx Txxxyyzz 3 CCxxx Uxxxyyzz 4 DDxxx Vxxxyyzz 5 EExxx Zxxxyyzz 6 GGxxx Rxxxyyzz Far FFxxx Sxxxyyzz
Spesielle verdier Avkrysningsvariable med flere alternativ: Hvis det er satt mer enn ett kryss kodes dette med 0.
Eksempel: Skjema 1 spm130: 46 kvinner har satt kryss for mer enn ett av fem alternativ. 458 som ikke har satt kryss for noe alternativ og har missingverdi. AA1547 S130:SKJEMA1C; (S130:SKJEMA1B); (S135:SKJEMA1A); ; 130. Føler du deg ofte ensom? Valid Missing Total 0 1 Nesten aldri 2 Sjelden 3 Av og til 4 Som regel 5 Nesten alltid Total System Cumulative Frequency Percent Valid Percent Percent 46,1,1,1 24487 47,9 48,3 48,4 14266 27,9 28,2 76,6 10918 21,4 21,6 98,2 614 1,2 1,2 99,4 318,6,6 100,0 50649 99,1 100,0 458,9 51107 100,0
Spesielle verdier Noen få av disse variablene har fått egne koder slik at man kan vite hva som har vært avkrysset.
Eksempel: Spesielle verdier Disse kodene er lagt inn i metadataene og vil derfor komme opp i SPSS-filen
Spesielle verdier AA1356 S_95_1:SKJEMA1C; (S_95_1:SKJEMA1B); (S110_1:SKJEMA1A); Røyking; 95. Røyker du nå (etter at du ble gravid)? Valid Missing Total 1 Nei 2 Av og til 3 Daglig 4 Nei + Av og til 5 Nei + Daglig 6 Av og til + Daglig Total System Cumulative Frequency Percent Valid Percent Percent 35330 69,1 86,5 86,5 1769 3,5 4,3 90,8 3705 7,2 9,1 99,9 13,0,0 99,9 1,0,0 99,9 24,0,1 100,0 40842 79,9 100,0 10265 20,1 51107 100,0
Missingverdier Vær spesielt oppmerksom på at mange kan ha missingverdier for en variabel fordi de ikke er spurt spørsmålet!! Hvert skjema har en variabel: VERSJON_SKJEMAx_TBL1 som angir versjon og kan brukes for å selektere ut de som har svart på ønskede versjon
Har du noen gang røykt?
Har du noen gang røykt? Skjema 1 A: Skjema 1 B/C:
AA1979 S107:SKJEMA1A; ; 107. Røyker du eller har du noen gang røykt? Valid Missing Total 0 1 Aldri 2 Av og til / festrøyking 3 Daglig 4 Sluttet å røyke Total System Cumulative Frequency Percent Valid Percent Percent 55,1 2,2 2,2 1139 2,2 44,7 46,9 415,8 16,3 63,2 348,7 13,7 76,8 590 1,2 23,2 100,0 2547 5,0 100,0 48560 95,0 51107 100,0 AA1355 S_94:SKJEMA1C; (S_94:SKJEMA1B); Røyking; 94. Har du noen gang røykt? Valid Missing Total 0 1 Nei 2 Ja Total System Cumulative Frequency Percent Valid Percent Percent 2,0,0,0 24306 47,6 50,4 50,4 23886 46,7 49,6 100,0 48194 94,3 100,0 2913 5,7 51107 100,0
Kombinerer informasjonen i de to variablene og lager en ny felles variabel: Skjema 1 A: = Nei = Ja Skjema 1 B:
SPSSsyntax: RECODE AA1355 (1=1) (2=2) (ELSE=SYSMIS) INTO EVERROYK. IF (AA1979=1) EVERROYK=1. IF (AA1979=2 OR AA1979=3 OR AA1979=4) EVERROYK=2. VARIABLE LABEL EVERROYK 'Har du noen gang røykt? (1A+1B)'. VALUE LABELS EVERROYK '1' 'Nei' '2' 'Ja'. FREQ EVERROYK. EVERROYK Har du noen gang røykt? (1A+1B) Valid Missing Total 1,00 Nei 2,00 Ja Total System Cumulative Frequency Percent Valid Percent Percent 25445 49,8 50,2 50,2 25239 49,4 49,8 100,0 50684 99,2 100,0 423,8 51107 100,0
Missingverdier Tenk over hvordan kvinnen kan tenke når hun fyller ut skjemaet. Har kvinnen svart Nei på et spørsmål vil hun neppe svare på oppfølgingsspørsmålene til spørsmålet.
Røyker du nå? Skjema 1 A: Skjema 1 B/C:
AA1356 S_95_1:SKJEMA1C; (S_95_1:SKJEMA1B); (S110_1:SKJEMA1A); Røyking; 95. Røyker du nå (etter at du ble gravid)? Valid Missing Total 1 Nei 2 Av og til 3 Daglig 4 Nei + Av og til 5 Nei + Daglig 6 Av og til + Daglig Total System Cumulative Frequency Percent Valid Percent Percent 35330 69,1 86,5 86,5 1769 3,5 4,3 90,8 3705 7,2 9,1 99,9 13,0,0 99,9 1,0,0 99,9 24,0,1 100,0 40842 79,9 100,0 10265 20,1 51107 100,0
97 % av de som har missing på spørsmålet om de røyker nå (spm 95), har svart Nei på om de noen gang har røykt (spm 94). Spm 95 Spm 94
RECODE AA1356 (1=1) (2=2) (3=3) (ELSE=SYSMIS) INTO ROYKNAA. IF (EVERROYK=1 AND SYSMIS(ROYKNAA)=1) ROYKNAA=1. VALUE LABELS ROYKNAA '1' 'Nei' '2' 'Av og til' '3' 'Daglig'. ROYKNAA Valid Missing Total 1 Nei 2 Av og til 3 Daglig Total System Cumulative Frequency Percent Valid Percent Percent 45249 88,5 89,2 89,2 1769 3,5 3,5 92,7 3705 7,2 7,3 100,0 50723 99,2 100,0 384,8 51107 100,0
EVERROYK2 * ROYKNAA2 Crosstabulation Motstridende opplysninger EVERROYK2 Total 1 Nei 2 Ja 9 Missing Count % within EVERROYK2 % within ROYKNAA2 Count % within EVERROYK2 % within ROYKNAA2 Count % within EVERROYK2 % within ROYKNAA2 Count % within EVERROYK2 % within ROYKNAA2 ROYKNAA2 1 Nei 2 Av og til 3 Daglig 9 Missing Total 25433 6 6 0 25445 100,0%,0%,0%,0% 100,0% 56,2%,3%,2%,0% 49,8% 19656 1749 3686 148 25239 77,9% 6,9% 14,6%,6% 100,0% 43,4% 98,9% 99,5% 38,5% 49,4% 160 14 13 236 423 37,8% 3,3% 3,1% 55,8% 100,0%,4%,8%,4% 61,5%,8% 45249 1769 3705 384 51107 88,5% 3,5% 7,2%,8% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% Kan bruke Røyker nå -opplysninger til å sette EVERROYK til JA
Antall i husholdningen
Eksempel på utfylt skjema: Naturlig å tolke de tre nederste feltene som 0 og ikke som missing. F.eks. hvis 1 eller flere felt av de fire feltene er fylt ut antas de ikke utfylte feltene å vere 0
Kvalitetssikring Strekkoder og løpenummer For å unngå duplikater og feilkoblinger Ulovlige verdier Grenseverdier (min/max) Avhengighetsregler
Kvalitetssikring Kvalitetssikringen innebærer at registrerte verdier utenfor de gitte grenseverdier blir kontrollert Hvis registrert verdi stemmer med det mor/far har skrevet blir verdien beholdt selv om den er urimelig eller biologisk implausibel
Kvalitetssikring Det er derfor opp til hver enkelt forsker å vurdere hvor grensen for det som regnes som gyldig skal settes og hvordan han/hun vil tolke eventuelle motstridende opplysninger som er gitt.
Registrert årstall er 2000, korrigeres til 2003 pga observasjon i skjema
Eksempel på avhengighetsregler: Nei og samtidig oppgitt antall ganger
Hodeomkrets større enn lengde:
Utfyllingsdato utenfor gitte grenser:
Eksempel på urimelige verdier fra skjema:
Kobling av filer Koblingsnøkler er: STUD_ID (unik for svangerskapet) BARN_NR (rekkefølge innad i svangerskapet)
Husk å tenke over: Hva er relevant studie-enhet? Svangerskap? Barn? Mor? Hva ønsker du å eventuelt å gjøre med tvillinger/trillinger, søsken? Ønsker du å koble slik at du får med bare de som har data fra alle de aktuelle kilder eller vil du ha med alt.
Skjema 1 Skjema 4 Noen kvinner vil bare ha data for skjema 1 (STUD_ID = 3) og noen vil bare ha for skjema 4 (STUD_ID=11046)
Identifisere søsken som begge/alle er deltakere i Mor og Barn I fila MOR er det en variabel MOR_LNR som er unik for hver kvinne.
Kommentarer Data fra Mor Barn undersøkelsen holder svært høy kvalitet. Forskeren må imidlertid selv foreta enkle evalueringer av data han skal nytte Data er validert mhp ubiologiske eller ulogiske verdier relativt skjema.
Nye MFR-data Bruker samlet database Variable som er gjennomgående fra 1967 til d.d. Mor&barn startet i 1999 og bare 1998- skjemaet er relevant