Notater. Nina Hagesæther og Li-Chun Zhang. Om estimeringsusikkerhet og utvalgsplan i AKU 2007/22. Notater

Like dokumenter
2007/30. Notater. Nina Hagesæther. Notater. Bruk av applikasjonen Struktur. Stabsavdeling/Seksjon for statistiske metoder og standarder

Notater. Anna-Karin Mevik. Estimering av månedlig omsetning innenfor bergverksdrift og industri 2008/57. Notater

(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Løsningskisse for oppgaver til uke 15 ( april)

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).

Oppgaver. Multiple regresjon. Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

ØVINGER 2017 Løsninger til oppgaver

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oppgaven består av 9 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

X ijk = µ+α i +β j +γ ij +ǫ ijk ; k = 1,2; j = 1,2,3; i = 1,2,3; i=1 γ ij = 3. i=1 α i = 3. j=1 β j = 3. j=1 γ ij = 0.

TMA4240/4245 Statistikk Eksamen august 2016

STK desember 2007

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

De normalfordelte: x og sd for hver gruppe. De skjevfordelte og de ekstremt skjevfordelte: Median og kvartiler for hver gruppe.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Appendiks 1: Organisering av Riksdagsdata i SPSS. Sannerstedt- og Sjölins data er klargjort for logitanalyse i SPSS filen på følgende måte:

MASTER I IDRETTSVITENSKAP 2012/2014. Individuell skriftlig eksamen. MAS 402- Statistikk. Tirsdag 9. oktober 2012 kl

Anvendelser. Kapittel 12. Minste kvadraters metode

Notater. Jan Henrik Wang. Frafall i konjunkturbarometeret. 2003/81 Notater 2003

Alle deloppgaver teller likt i vurderingen av besvarelsen.

Bente Halvorsen, Bodil M. Larsen og Runa Nesbakken

Notater. Bjørn Gabrielsen, Magnar Lillegård, Berit Otnes, Brith Sundby, Dag Abrahamsen, Pål Strand (Hdir)

Forelesning nr.3 INF 1411 Elektroniske systemer

Notater. Marie Lillehammer. Usikkerhetsanalyse for utslipp av farlige stoffer 2009/30. Notater

Oversikt 1. forelesning. ECON240 Statistikk og økonometri. Utdanning og lønn. Forskning. Datainnsamling; utdanning og inntekt

SNF-rapport nr. 23/05

Investering under usikkerhet Risiko og avkastning Høy risiko. Risikokostnad prosjekt Snøskuffe. Presisering av risikobegrepet

NA Dok. 52 Angivelse av måleusikkerhet ved kalibreringer

2006/27 Notater 2006 Om samordning av utvalg ved bruk av PRN-tall

Alderseffekter i NVEs kostnadsnormer. - evaluering og analyser

C(s) + 2 H 2 (g) CH 4 (g) f H m = -74,85 kj/mol ( angir standardtilstand, m angir molar størrelse)

En introduksjon i statistiske metoder for offisiell statistikk

MA1301 Tallteori Høsten 2014

STK1000 Innføring i anvendt statistikk Eksamensdag: Tirsdag 12. desember 2017

Statistikk og økonomi, våren 2017

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Bente Halvorsen, Bodil M. Larsen og Runa Nesbakken

Studieprogramundersøkelsen 2013

Forelesning nr.3 INF 1411 Elektroniske systemer. Parallelle og parallell-serielle kretser Kirchhoffs strømlov

Eksamen i emne SIB8005 TRAFIKKREGULERING GRUNNKURS

Fleksibelt arbeidsliv. Befolkningsundersøkelse utført for Manpower September 2015

UNIVERSITETET I OSLO

Magnetisk nivåregulering. Prosjektoppgave i faget TTK 4150 Ulineære systemer. Gruppe 4: Rune Haugom Pål-Jørgen Kyllesø Jon Kåre Solås Frode Efteland

Tema for forelesningen var Carnot-sykel (Carnot-maskin) og entropibegrepet.

TMA4300 Mod. stat. metoder

i kjemiske forbindelser 5. Hydrogen har oksidasjonstall Oksygen har oksidsjonstall -2

Innholdsfortegnelse. Innledning. I. Teorigrunnlag, s. 5

Dårligere enn svenskene?

Alderseffekter i NVEs kostnadsnormer. - evaluering og analyser

Om tabellene. Januar - februar 2019

Personer med nedsatt arbeidsevne. Fylke og alder. Tidsserie måned

Om tabellene. Januar - mars 2019

Personer med nedsatt arbeidsevne. Fylke og alder. Tidsserie måned

Personer med nedsatt arbeidsevne. Fylke og alder. Tidsserie måned

Personer med nedsatt arbeidsevne. Fylke og alder. Tidsserie måned

Om tabellene. Januar - mars 2018

Om tabellene. Januar - desember 2018

Seleksjon og uttak av alderspensjon fra Folketrygden

Randi Eggen, SVV Torunn Moltumyr, SVV Terje Giæver. Notat_fartspåvirkn_landeveg_SINTEFrapp.doc PROSJEKTNR. DATO SAKSBEARBEIDER/FORFATTER ANTALL SIDER

Fleksibelt arbeidsliv. Befolkningsundersøkelse utført for Manpower September 2015

Simpleksmetoden. Initiell basistabell Fase I for å skaffe initiell, brukbar løsning. Fase II: Iterativ prosess for å finne optimal løsning Pivotering

NA Dok. 52 Angivelse av måleusikkerhet ved kalibreringer

Sparing gir mulighet for å forskyve forbruk over tid; spesielt kan ujevne inntekter transformeres til jevnere forbruk.

Notasjoner, gjennomsnitt og kvadratsummer. Enveis ANOVA, modell. Flere enn to grupper. Enveis variansanalyse (One-way ANOVA, fixed effects model)

2005/11 Notater Anna-Karin Mevik. Notater. Usikkerhet i ordrestatistikken. Seksjon for statistiske metoder og standarder

Makroøkonomi - B1. Innledning. Begrep. Mundells trilemma 1 går ut på følgende:

må det justeres for i avkastningsberegningene. se nærmere nedenfor om valg av beregningsmetoder.

Jobbskifteundersøkelsen Utarbeidet for Experis

TMA4240 Statistikk H2010

Utvalgsseleksjon og manglende data: Noen metodemessige utfordringer

Eksamensoppgave i SØK Statistikk for økonomer

Hvordan får man data og modell til å passe sammen?

Thor Herman Christensen, Einar Eide og Arild Thomassen

KVIKKSØLVEKSPONERING VED DENTALLABORATORIER. Nils Gundersen og Arve Lie HD 807/790814

Om tabellene. Periode:

Mottakere av arbeidsavklaringspenger. Fylke og alder. Tidsserie måned

Om tabellene. Periode:

Mottakere av arbeidsavklaringspenger. Fylke og alder. Tidsserie måned

Sluttrapport. utprøvingen av

Kapitalbeskatning og investeringer i norsk næringsliv

Tillegg 7 7. Innledning til FY2045/TFY4250

Norske CO 2 -avgifter - differensiert eller uniform skatt?

Håkon Skullerud, Barbara K. Frøyen, Olav Skogesal og Anne Vedø Estimering av materialfordelingen til husholdningsavfall i 2004

Løsningsforslag øving 10 TMA4110 høsten 2018

Oppvarming og innetemperaturer i norske barnefamilier

Nina Hagesæther og Li-Chun Zhang

Veiledning til obligatorisk oppgave i ECON 3610/4610 høsten N. Vi skal bestemme den fordeling av denne gitte arbeidsstyrken som

Alternerende rekker og absolutt konvergens

Dynamisk programmering. Hvilke problemer? Overlappende delproblemer. Optimalitetsprinsippet

Litt om empirisk Markedsavgrensning i form av sjokkanalyse

SNF-rapport nr. 37/08

Notater. Asif Hayat og Terje Tveeikrem Sæter. Prisindeks for rengjøringsvirksomhet 2008/49. Notater

TMA4265 Stokastiske prosesser

SIF4012 og MNFFY103 høst 2002: Sammendrag uke 44 (Alonso&Finn )

DEN NORSKE AKTUARFORENING

EKSAMEN Løsningsforslag

Rapport Benchmarkingmodeller. incentiver

DET KONGELIGE FISKERI- OG KYSTDEPARTEMENT. prisbestemmelsen

Eksamensoppgave i SØK2900 Empirisk metode

Transkript:

007/ Notater Nna Hagesæter og L-Cun Zang Notater Om estmerngsuskkeret og utvalgsplan AKU Stabsavdelng/Seksjon for metoder og standarder

Innold 1. Innlednng...3. Om utvalgs- og estmerngsenet...3.1 Problemstllng...3. Varansestmerng for GREG...4..1 Personutvalg og person som estmerngsenet...5.. Famleutvalg og person som estmerngsenet...6..3 Famleutvalg og famle som estmerngsenet...6.3 Emprske resultater...6.4 Dekomponerng av varans...7.4.1 Modell...7.4. Utvalgsvarans P-P ved enetskalbrerng...8.4.3 Utvalgsvarans C-P ved enetskalbrerng...8.4.4 Utvalgsvarans C-C...9.5 Andre effekter...10 3. Varans AKU estmerng...11 3.1 Lnearserng...11 3. Bootstrap...1 Appendks: Om data...15 Referanser...16 1

1. Innlednng Utvalgsplanen for Arbedskraftsundersøkelsen (AKU) 005 kan karakterseres som følger (Zang og Vedø, 004): Stratfserng etter alle 19 fylker. Prmære trekkeneter er famler enold tl Det sentrale folkeregsteret (DSF). DSF-famlene nnen vert fylke trekkes systematsk med antatt tlfeldg sorterng. Alle personer ver famle mellom 16 og 74 år nkluderes utvalget. Et spørsmål som lenge ar bltt dskutert er valget av utvalgsenet. Det er kjent at utvalgsvaransen for estmerng av sysselsettng kan reduseres ved å trekke personer drekte stedenfor famler som nå er tlfellet, samtdg som kostnaden ved AKU vl øke ved en slk omleggng. For arbedsledget ar valget av enet lten betydnng for utvalgsvaransen, vst ved smulerng av Vedø og Rafat (003). For sysselsettng er mdlertd størrelsen på varansøknng ved et famleutvalg uklar, da beregnngene deres er lagt på en annen skala enn det AKU realteten er. Zang og Vedø (004) vste at et stratfsert famleutvalg ar omtrent samme utvalgsvarans som et enkelt tlfeldg personutvalg, samtdg som et stratfsert personutvalg ar enda mndre utvalgsvarans. I den første delen av dette notatet studerer v problemet nærmere ved å se på vordan varansen tl en kalbrerngsestmator endres med ensyn tl utvalgs- og estmerngsenet, samspll med tlleggsvarabler og trekksannsynlgeter. Den mest nteressante konklusjonen er som følger: Varansøknng ved å bruke famler som utvalgseneten kan tas bort ved å la person være estmerngsenet stedet for famle. Et klyngeutvalg av famler, der person er estmerngseneten, ar omtrent lke stor utvalgsvarans som et drekte personutvalg. For både sysselsettng og arbedsledget er det derfor unødvendg å legge om AKU tl et personutvalg. Konklusjonen er utelukkende basert på betraktnnger av utvalgsvarans. Så vdt v kjenner tl er det første gang konklusjonen er fremsatt på denne måten. Det faktske estmerngsopplegget AKU er mer komplsert enn enkel kalbrerng. Vektene justeres tre ganger med blant annet fylkesvs kalbrerng etter en etterstratfserng for ele landet (Heldal, 000). Det er vanlg at man varansberegnng enten forenkler stuasjonen tl etterstratfserng eller kalbrerng. I den andre delen av notatet beregner v varansen AKU under det faktske opplegget med multple justernger av vektene. To metoder, lnearserng (Zang, 006) og bootstrap (Sao, 1996), blr brukt og sammenlgnet. Varansestmerng med lnearserngsmetoden er enkel å mplementere, og gr nesten samme resultater som bootstrap. Metoden bør kunne tas bruk for kvaltetsrapporterng.. Om utvalgs- og estmerngsenet.1 Problemstllng V ser bort fra frafall dette avsnttet. Betrakt tre ulke scenaroer for utvalgs- og estmerngseneter: Personutvalg og person som estmerngsenet Famleutvalg og person som estmerngsenet Famleutvalg og famle som estmerngsenet 3

V ser bort fra personutvalg og famle som estmerngsenet. Effekten av enetsvalg kan tenkes å være påvrket av estmerngsmetode, speselt vlke tlleggsvarabler som brukes. V ser på to stuasjoner: Kun nformasjon om populasjonsstørrelse benyttes, enten antall famler eller antall personer Tlleggsopplysnger om kjønn, alder (1 grupper) og regster sysselsettngsstatus (4-delng) benyttes Også trekksannsynlget kan påvrke utvalgsvaransen. Følgende valg er aktuelle: Trekkng med lk sannsynlget eller, for famleutvalg, en sannsynlget proporsjonal med famlestørrelsen. Det sste er omtrent tlfellet når person er trekkenet, men ele famlen tl de uttrukne personene nkluderes utvalget. Stratfserng Enver estmator v skal se på dette avsnttet kan formuleres som en generalsert regresjonsestmator (GREG, Särndal et al., 199), som er den vanlgste kalbrerngsesmatoren.. Varansestmerng for GREG Først skal v kort oppsummere GREG estmatoren og oveddeen varansestmerng. La U = {1,..., N } betegne en populasjon med eneter = 1,..., N, og s= {1,..., n } betegne utvalget med eneter = 1,..., n. La a betegne utvalgsvekten gtt ved nvers av trekksannsynlgeten. GREG estmatoren er et speselt tlfelle av kalbrerngsestmerng. La w betegne den kalbrerte vekten, som er gtt ved wnx1 = anx1 gnx1 der betyr at vektorene multplseres element for element, og n er antallet eneter utvalget, og g 1 [(X X ˆ ) Aˆ Xdesgn ] T 1 T T nx1 = nx1 + Kx1 Kx1 KxK nxk Her er matrsemultplkasjon angtt med. X er en vektor som nneolder K antall kalbrerngstotaler. Xdesgn er en desgnmatrse med en lnje for ver enet utvalget og en kolonne for ver komponent T X. A er defnert ved XpopN K XpopN K, der Xpop er desgnmatrsen for ele populasjon, satt opp på samme måten som Xdesgn. ˆX T er estmatet for X basert på a, dvs. ˆX = Xdesgn a. Â er estmatet T for A basert på a, dvs. Â = (Xdesgn a) Xdesgn, der betyr at vektoren a multplseres 1 elementvs med ver kolonne Xdesgn. Â er nvers tl Â. Hoveddeen lnearserngsmetoden for varansestmerng lgger følgende betraktnng. For enver gtt T T konstant vektor B Kx1, kan nteressevarabelen y transformeres tl ε = y x B, der x er raden Xpop som svarer tl eneten. V ar dermed at estmatet for totalen Y = y er gtt ved T T T s s s s s Ŷ = w y = w (x B +ε ) = ( w x ) B+ a gε = X B+ a gε U sden vektene w nx1 er kalbrert med ensyn tl X. Desgnforventnngen tl g er lk 1, slk at en lnear tlnærmng tl Ŷ og dens varans er ganske enkelt gtt ved ˆ T Y X B + a ε V(Y) ˆ V( a ε ) s s 4

En tlnærmet varans tl Ŷ følger nå den generelle varansformel for en Horvtz-Tompson estmator, det vl s aε. I prakss ar v som regel kke B på forånd, og dermed eller kke ε n1. ˆB beregnes s under en lneær regresjonsmodell som svarer tl transformasjonen fra y n1 tl ε n1, og settes nn for B. En varansestmator fås derfor ved å erstatte ε n1 med et estmat: ˆ 1 T e = y yˆ = y Xdesgn A (Xdesgn a y) nx1 nx1 nx1 Imdlertd anbefaler Särndal et al. (199) å bruke ge stedenfor bare e. En grunn er at det gr en varansestmator som både er konsstent med ensyn utvalgtrekkng og tlnærmet forventnngsrett med ensyn tl regresjonsmodellen. En annen grunn er at uten g vl man overse uskkereten estmerngen av ε...1 Personutvalg og person som estmerngsenet Anta at nngangsvekten a = N/n er lk for ver person utvalget, det vl s enkel tlfeldg trekkng. N er totalt antall personer populasjonen U. I tlfellet kalbrerng mot populasjonstotalet ar v X= N og x = 1. I tlfellet kalbrerng for kjønn, alder og sysselsettngsstatus er X en vektor med margnale tall for kjønn (to klasser), alder (11 klasser) og sysselsettngsstatus (tre klasser) entet fra regster. En aldersklasse og en klasse for sysselsettngsstatus er slettet for å unngå sngulartet. ˆX er nå de margnale T tallene estmert ved utvalget basert på a, det vl s Xdesgn a. De to første komponentene x svarer tl kjønn, de 11 neste alder og de tre sste sysselsettngsstatus. For eksempel, for en kvnne på 40 år sysselsatt nnen prmærnærngen, vl den tlsvarende raden desgnmatrsen få verdene {0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0}, mens en 65 år gammel mann sysselsatt sekundærnærngen vl få verdene {1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0}. En estmator for Y, der Y kan være totalt antall sysselsatte eller arbedsledge den endelge populasjonen U, er Ŷ= wy. Varansestmatoren tl Ŷ er gtt ved s ( ge) n ˆ ˆ 1 1 V(Y) =,j s (aa j a,j)(ge )(g je j) = N n N = 1 n 1 n n N (ge) = (we) n = 1 = 1 N(N 1) der a,j = er nvers av andreordens trekksannsynlget. Den første tlnærmng følger av 1 0 n(n 1) N 1 1 N og. Det sste følger av w = ag = g. n 1 n n V kan komme frem tl en varansestmator tlsvarende det sste uttrykket med en modellbasert tankegang. Modellen er y = Xdesgn β +ε, der ε ar forventnng 0 og varans σ, og ε ˆ = e =σ ˆ. V betnger da Ŷ på desgnmatrsen Xdesgn og utvalget s, slk at den eneste varasjonen Ŷ er varasjonen y. Samtdg antar v at y er uavengge av verandre. Under dsse forutsetnngene er varansen tl Ŷ gtt ved ˆ V(Y) = w σ, og en varansestmator blr da V(Y) ˆ ˆ = w e. s s 5

.. Famleutvalg og person som estmerngsenet Anta nå et enkelt tlfeldg ettrnns klyngeutvalg. Først trekkes famler som prmære utvalgseneter, deretter ntervjues alle personer som tlører famlen. Inngangsvekten er a = M/m, der M og m er enoldsvs antall famler populasjonen og utvalget. En tlnærmet varans for Ŷ tlfellet totrnns klyngeutvalg med element som estmerngsenet (Särndal et al., 199) er AV(Y) ˆ = AV + AV der PSU er prmær og SSU sekundær utvalgsenet, det vl s varansen ved enoldsvs første og andre trnnet. Sden alle personer en trukket famle nkluderes utvalget, ar v kke varansen det andre trnnet. La zk = ge være justerte resdualer beregnet på personer aggregert tl famlenvå. La a k,l ( ) ( ) M M 1 = m m 1 k. Varansestmatoren for AV PSU kan forenkles tl følgene uttrykk: PSU SSU m m 1 1 zk M k,l S k l k,l k l k m M k= 1m 1 m k= 1 V(Y) ˆ ˆ = (a a a )z z = M z..3 Famleutvalg og famle som estmerngsenet Anta famleutvalg og famle som estmerngsenet. Både Ŷ og dens varans fås på samme måten som avsntt..1, men v må først aggregere y tl famlenvå, dvs. yk = y k. Inngangsvekten er ak = M/m. I tlfellet kalbrerng mot populasjonstotalet ar v nå X = M og x k = 1. I tlfellet kalbrerng for kjønn, alder og sysselsettngsstatus er X som defnert ovenfor, og xk = x. k.3 Emprske resultater La P-P betegne personutvalg og person som estmerngsenet, C-P famleutvalg med person som estmerngsenet, og C-C famleutvalg med famle som estmerngsenet. Betegn med AKU kalbrerng for kalbrerng mot kjønn, alder og sysselsettngsstatus regster, og enetskalbrerng for kalbrerng kun mot populasjonsstørrelse (N eller M). Data er entet fra første kvartal 005, der N = 3 31 011 og n = 1 55 personer. I beregnngen antar v for enkeletsskyld M / m = N / n. Tabell 1 gr en overskt over standardfelene både for arbedsledget og sysselsettng. Forskjeller en bestemt kolonne tabellen vser effekten av eneter, mens forskjeller en rad vser effekten av tlleggsvarabler. Tabell 1: Overskt over standardavvk for sysselsettng og arbedsledget. P-P = personutvalg og person som estmerngsenet, C-P = famleutvalg og person som estmerngsenet, C-C = famleutvalg og famle som estmerngsenet. Enetskalbrerng = kalbrerng mot populasjonsstørrelse, AKU kalbrerng = kalbrerng mot kjønn, alder og regster sysselsettngsstatus. Enetskalbrerng AKU kalbrerng Sysselsatt Arbedsledg Sysselsatt Arbedsledg C-C 15 791 3 958 7 094 4 19 C-P 10 859 3 931 7 071 4 15 P-P 10 341 3 856 6 948 4 077 6

For sysselsettng ser v at: En reduksjon standardavvket fra 15 791 (C-C og enetskalbrerng) tl 6 948 (P-P og AKU kalbrerng) kan dekomponeres tre steg. Først reduseres standardavvket tl 10 859 ved å bruke personer som estmerngsenet tl tross for at famler er utvalgsenet (det vl s C-P og enetskalbrerng); deretter reduseres standardavvket ytterlgere tl 7 071 ved jelp av tlleggsvarablene (det vl s C-P og AKU kalbrerng); tl slutt får v en meget lten reduserng ved å trekke personer drekte utgangspunktet (det vl s P-P og AKU kalbrerng). Alternatvt kan man gå først fra 15 791 (C-C og enetskalbrerng) tl 10 859 (C-P og enetskalbrerng), deretter tl 10 341 (P-P og enetskalbrerng), og tl slutt 6948 (P-P og AKU kalbrerng). Igjen reduseres varansen først og fremst på grunn av endrngen estmerngsenet og bruken av tlleggsvarabler. Valget av utvalgsenet ar nesten ngen effekt tllegg. Et tredje alternatv er å gå først fra 15 791 (C-C og enetskalbrerng) tl 7 094 (C-C og AKU kalbrerng). Ved å endre utvalget fra et famleutvalg tl et personutvalg (fra C-P tl P-P, begge med AKU kalbrerng) får v kun en lten endrng varansen (tl 6 948). For arbedsledget påvrkes kke standardavvket særlg stor grad, uansett utvalgs- og estmerngsenet og tlleggsvarabler..4 Dekomponerng av varans Det kanskje mest nteressante resultatet Tabell 1 dreer seg om standardavvk for estmatoren ved enetskalbrerng tlfellene C-C, C-P og P-P. Egentlg er alle parvse forold velkjente. Forskjellen mellom C-C og P-P er kjent som desgneffekten av klyngeutvalg. Forskjellen mellom C-C og C-P er bltt dskutert forbndelse med valget mellom Horvtz- Tompson og rato-to-sze estmator (Cocran, 1977, Kapttel 9A). Forskjellen mellom C-P og P-P ar sammeneng med desgneffektformelen (Ks, 1987; Gabler, et al., 1999) tlfellet flertrnnsutvalg og vekteklasser. Også Vedø og Rafat (003) nneolder sammenlgnng av lgnende scenaroer. Følgende konklusjon oppstår det de tre scenaroene settes under ett, nemlg at man kke taper effsens ved å trekke et klyngeutvalg så lenge man older seg tl element som estmerngsenet. Tl tross for at eksakt eller tlnærmet varansformel fnnes alle tre stuasjonene, er det kke uten vdere lett å se resultatet generelt. I det følgende skal v benytte en annen fremgangsmåte. Først setter v opp en populasjonsmodell med parametere som ar klare tolknnger. Deretter fnner v en varans under modellen som er tlnærmet lk utvalgsvarans under vert av de 3 scenaroene. Dette gjør det mulg å tolke forskjellen utvalgvaranser ved jelp av parametere modellen. Resultatet blr en dekomponerng av varansen tlfellet C-C, som klart vser vordan den reduseres først tl tlfellet C-P og deretter P-P..4.1 Modell La (k) betegne element fra klynge k. Anta følgende modell på elementnvå: y = μ +ε k k der E M( ε k) = 0, M k V ( ε ) =σ, cov M( k, kj) ε ε =ρσ for to elementer samme klynge og M k lj cov (, ) 0 ε ε = for to elementer forskjellg klynge. Alle forventngene er er tatt med ensyn tl modellen. Dette er den såkalte ntracluster correlaton model som er vanlg studer av klyngeeffekt (se for eksempel Gabler et al., 1999), der korrelasjonen nteressevarabelen mellom to elementer nnen samme klynge angs med ρ. På klyngenvået ar v da 7

der y = y = ( μ +ε ) = N μ + ε = N μ +ε k k k k k k k N k er antallet elementer klynge. V antar at.4. Utvalgsvarans P-P ved enetskalbrerng I tlfellet P-P med enkel tlfeldg trekkng ar v V M(N k)=τ og M k k N Ŷ = ( k) sa y = ( k) s y n. P P k k k cov (N, ε ) = 0. V ser bort fra den endelge populasjonsfaktoren (epf), slk at utvalgsvaransen er gtt ved (y (k) U k Y) σ N V(Y ˆ D P P) N n N 1 n der v antar at Y= ( k) U y k /N μ og 1/(N 1) 1/ N, og V D betegner utvalgsvaransen. Det sste uttrykket er lk modellvaransen tl ŶP P, betnget på at det kke fnnes flere elementer fra samme klynge utvalget, betegnet med λ P P= 1, dvs. ˆ σ ˆ N D P P = M P P λ P P= = σ n n (k) s V(Y ) N V(Y 1).4.3 Utvalgsvarans C-P ved enetskalbrerng I tlfellet C-P med enkel tlfeldg trekkng av klynger ar v som ser lkt ut som ŶP P N N Ŷ = ( k) s y = k sy n n C P k k, og er kjent som rato-to-sze estmatoren. Forskjellen fra P-P er at n er stokastsk. Legg merke tl at vekten er kalbrert, og kke gtt ved nvers av trekkesannsynlgeten. La Y være element-gjennomsntt som før. Anta Y μ. Uten epf er utvalgsvaransen gtt ved ( N N ( N 1) ) M (y k U k NkY) ˆ V(Y D C P) m M 1 M M M μ = ε = m m m ε + ε ε sden 8 ( ) (yk N k ) k U k U k k U k j k kj ( N σ + N ( N 1) ρσ ) M M N k s k k k k U kσ + k k ρσ m m n M N M n N = ε + ε ε = ε m n m N n k s ( VM ( k ) jcovm ( k, kj )) k sv M ( k Nk ) ˆ M n ˆ M N N = V M(Y C P N k,k s) = V M(Y P P λ P P = 1) + knk( Nk 1) ρσ m N m n n ( ) ( ) { N + N N 1 ρ }/{ N + N N 1 ρ} N/n k U k k U k k k s k k s k k

for stort utvalg tlfellet enkel tlfeldg trekkng av klynger. Hvs v antar at M / m N / n kan varansen tlfellet C-P skrves som varansen tlfellet P-P, pluss et ekstra ledd som skyldes korrelasjon nnen klynge og klyngestørrelse: ˆ ˆ N V(Y D C P) V M(Y P P λ P P = 1) + kn(n k k 1) ρσ n Det ekstra leddet er lte vs ρ er lten, og det forsvnner vs ρ = 0. Også for klynger bestående av et element vl leddet være eksakt 0. Gabler et al. (1999) brukte den samme modellen for å studere Kss desgneffektformel tlfellet klyngeutvalg og vekteklasser. I vårt tlfelle fnnes det kun en vekteklasse. Deres resultat blr da V M(Y ˆ C P k k sn k(nk 1) N k k n N,k s) ρσ = 1 + 1 ˆ = +ρ V n M(Y P P λ P P = 1) nσ * = 1 +ρ(n 1) der * k s k N = N /n er en slags gjennomsnttlg klyngestørrelse utvalget. Resultatet er noe lettere å bruke enn varansdekomponerng ovenfor. I tlfellet AKU ar v N 1.6 og ρ 0. for sysselsettng (Rafat, 00). V ar tlnærmet Mens Tabell 1 fnner v 1 +ρ(n 1) 1 + 0. 0.6 = 1.1 V ˆ D(Y ˆ C P) 10859 = ( ) = 1.05 = 1.10 V ˆ (Y ˆ ) 10341 D P P Imdlertd er det formelt kke rktg å betrakte V D(Y ˆ ˆ C P)/V D(Y P P) som desgneffekt tlfellet AKU, sden ŶC Per kalbrert, og dermed nneolder også en estmerngseffekt. En bedre defnsjon på desgneffekt er varansforold mellom to Horvtz-Tompson estmatorer, som alene avenger av desgn..4.4 Utvalgsvarans C-C I tlfellet C-C med enkel tlfeldg trekkng av klynger ar v Uten epf er utvalgsvaransen gtt ved Anta k U k M k =μ M k M M Ŷ = ( k) s y = k sy m m C C k k k U k k U M (y y k / M) V D(Y ˆ C C) m M 1 y / M E (y ) E (N ) og M / m N / n. V ar da 9

ˆ ˆ N N V (Y ) V (Y ) V (y ) = { V E (y N ) + E V ( ε N )} D C C M C C M k M M k k M M k k n k s n k s k s N N ˆ M k M M k k M k M C P k n k s k s n k s = { μ V (N ) + E ( V ( ε N ))} μ V (N ) + V (Y N,k s) Varansen tl C-C er omtrent lk varansen tl C-P pluss et ekstra ledd, som skyldes varasjon klyngestørrelsen og gjennomsntt per element. Tabell 1 vser at leddet er betydelg for sysselsettng, og nær 0 for arbedsledget. Sden varasjonen klyngestørrelse er dentsk uansett nteressevarabel, må forskjellen lgge μ. For arbedsledget er μ svært lav (ca. 0.03), og dermed bdrar leddet nesten ngentng tllegg. Når det gjelder sysselsettng er μ mye øyere (ca. 0.7), og leddet er faktsk større enn varansen tlfellet C-P, og utgjør mer enn alvparten av varansen tlfellet C-C. Varansforoldet mellom C-C og P-P er desgneffekt tlfellet AKU. V ar vst at varansøknngen ar to komponenter: den ene skyldes korrelasjon nteressevarabelen nnen samme klynge og klyngestørrelser, og den andre skyldes varasjon klyngestørrelsen og gjennomsnttet nteressevarabel per element. Den første komponenten fnnes under scenaro C-P, men kke den andre. I tlfellet AKU er den andre komponenten betydelg for sysselsettng, men kke den første. Slk forolder varansestmatene seg mellom Tabell 1 under enetskalbrerng..5 Andre effekter For det første ser v på effekten av tlleggsvarabler. Modellen er nå yk = xkβ +ε k, med samme kovaransstruktur for ε k som før (kapttel.4.1). I formelen for utvalgsvarans erstattes y k med ε k, og y k med ε k. Modellbasert tlnærmng av utvalgsvarans er den samme som før under P-P og C-P. I tlfellet C-C ar v E M( ε k N k) = 0= E M( εk) k Uεk /M, slk at det ekstra leddet forold tl C-P forsvnner. Når det gjelder varansforskjellen mellom C-P og P-P, er det rmelg å tro at den er lten sden ρ må være veldg lten betnget på tlleggsvarabler AKU. Med andre ord, varansøknngen, som skyldes at famle er utvalgsenet, kan lke godt tas bort ved bruken av gode tlleggsopplysnger om personer. Igjen er egentlg person eneten estmerng sden modellen er satt opp på personnvå. For de andre ser v på effekten av stratfserng. Dagens AKU-utvalgsplan bruker fylker som strata. Zang og Vedø (004) forslo et stratfsert famle utvalg speselt mt. famlestørrelsen tllegg. Desgneffekten er omtrent lk 1 for både sysselsettng og arbedsledget. Men et personutvalg stratfsert etter for eksempel alder og kjønn tllegg tl fylke ar enda mndre utvalgsvarans for sysselsettng. Effsensen kan lkevel gjenvnnes estmerngen, sden alder og kjønn brukes som tlleggsvarabler der. Heller kke er stratfserngen av famler avgjørende for de endelge AKU estmatene. Det vktgste tltaket denne sammenengen er å gå over tl enkel tlfeldg trekkng enn å fortsette med systematsk trekkng, slk Zang og Vedø (004) ar argumentert for. Betrakt tl slutt famleutvalg trukket va personer: først trekkes personer tlfeldg, deretter nkluderes alle personer fra samme famle/usoldnng utvalget. Dette svarer omtrent tl å trekke famler med en sannsynlget som er proporsjonell med (famle-) størrelsen (pps). Uten epf kan v tlnærme utvalgsvaransen tl Horvtz-Tompson estmatoren ved å anta at utvalget er trukket med tlbakeleggng. Foroldet tl en varans under modellen avsntt.4.1 følger deretter (Cocran, 1977, avsntt 9A.7). Speselt er pps-trekkng av klynger omtrent lke effsent som enkel tlfeldg trekkng dersom ρ 0, som er tlfellet AKU når tlleggsvarabler brukes estmerng. Det synes derfor lte å velge mellom pps og enkelt tlfeldg trekkng va effsensen angår. T 10

3. Varans AKU estmerng 3.1 Lnearserng I AKU estmerngen er personer estmerngseneten, og vektene justeres tre ganger som følger: Inngangsvektene a = M /m er lke for alle personer nnen et fylke, der M er antallet famler fylke, og m er antallet famler nettoutvalget samme fylke. W1 er en vekt som nnen vert fylke summerer seg tl populasjonsantallet, og er defnert ved W1 = a b = N / n, der b = N /N% r, N % r = ( ) s ar, N er antall personer fylket, n er antall personer nettoutvalget, og r = 1 for svar og 0 for frafall. Med tlde menes en størrelse beregnet på grunnlag av nngangsvekter. W er en vekt som nnen vert etterstratum summerer seg tl populasjonsantallet, og er defnert N ved W = W1 cp. Her er cp = N p /( N % pr ), der N N% p er antall personer etterstratum p, r N % pr = ( ) s ar, og s p er alle personer fra stratum p og fylke utvalget. p W3 tar øyde for kalbrerng nnen vert fylke, med ensyn tl kjønn, alder og en todelt regster sysselsettngsstatus, og er defnert ved W3 = W g. Her er g en justerng basert på kalbrerng, beregnet på samme måte som kapttel, men nnen vert fylke med en todelng av regster sysselsettngsstatus. Det vl s at det konstrueres en desgnmatrse Xdesgn basert på nettoutvalget og kalbrerngsvarablene, og for ver person vert fylke beregnes ˆ T ˆ 1 g = 1 + (X X ) A x. X er en vektor med margnale tall, ˆX = ( ) s W x = p b c p X % pr, der X % pr = ( ) s ar (margnale tall estmert ved p T nettoutvalget og nngangsvektene) og  = ( ) s W (xx ) = p bcpa% pr, der T A % T pr = (Xdesgn a) Xdesgn, og x er raden Xdesgn som svarer tl person. For et gtt fylke er Ŷ = s W3y en estmator for Y, og Y ˆ = ˆ Y. Anta enkelt tlfeldg trekkng av famleutvalget nnen vert fylke, stedet for systematsk trekkng. For enkelets skyld ser v nå bort fra klynger og antar at v ar et P-P scenaro, sden det er lten forskjell mellom P-P og C-P, som v ar sett. Følgende emprske varansestmator gr oppav tl et varansestmat: (3) n W3 e ˆV = ( ) s W3e ( ) s (W3 e ) n 1 n der e er resdualet ved fylkesvs kalbrerng. Det sste uttrykket følger av at summen av vektede resdualer er lk 0. Det totale varansestmatet fnner v ved å summere over fylker; V ˆ = ˆ V. Bak N (3) lgger det en del asymptotske antagelser (Zang, 006), der φ = N /Nr, κ p = N p /( N pr ) Nr T 1 og δ = 1 + (X pφκ px pr ) ( pφκ pa pr ) x tlnærmes med enoldsvs b, c p og g. Tabell og 3 vser en overskt over varansestmater, både for totalen og for vert enkelt fylke. Varansen (3) kan dekomponeres to ved å betrakte frafall som en tlleggsfase trekkngen, gtt bruttoutvalget. Estmerngsopplegget AKU mplserer formelt en frafallsmodell der frafallet er tlfeldg 11

nnen fylker. La ω betegne p s a φ κδ p ε. Varansen tl ω vl være lk den pr asymptotske varansen tl Ŷ (Zang, 006), og kan dekomponeres som V( ω ) = V s(e r( ω s)) + E s(v r( ω s)) Den første delen består av varans forårsaket av utvalgstrekkngen. Den andre delen som skyldes frafall tlnærmes ved V( r ω s), som kan estmeres ved b 1 = (4) ˆV, Frafall (W3e ) b V ser at foroldet mellom (4) og (3) blr en konstant, (b 1)/ b, som er tlnærmet lk den fylkesvse frafallsandelen populasjonen, som gjen er tlnærmet lk den fylkesvse frafallsandelen utvalget. Det følger at varansen som forårsakes av frafall er lke stor for arbedsledget som for sysselsettng. Resultatene (Tabell og 3) er noe urealstske og skyldes den forenklede frafallsmodellen. Det er grunn tl å tro at frafallsjusterng ved estmerngsopplegget AKU er mer nformatvt enn som så, sden estmatene for ele landet endres mer fra W1 tl W enn fra nngangsvektene tl W1. Problemet er at det formelt kke lar seg formulere annerledes enn den fylkesvse omogene frafallsmodellen, så lenge W1 er bldet. 3. Bootstrap Bootstrap varansestmater er et alternatv tl varansestmatene regnet ut ved (3). Under et P-P scenaro trakk v med tlbakeleggng B nye datasett ved å for vert datasett b trekke lke mange observasjoner fra AKU datasettet som det opprnnelg er. AKU kalbrerngen beskrevet avsntt 3.1 ble gjentatt for vert datasett, og Ŷ ble beregnet. Slk fkk v lke mange estmater for totalt antall arbedsledge og *1 * *B sysselsatte som nye datasett v trakk, det vl s Y ˆ, Y ˆ,..., Y ˆ *b, der Ŷ betegner bootstrap-estmat b av Ŷ og b = 1,..., B. Den emprske varansen tl * Ŷ er et bootstrap estmat for varansen av Ŷ, vs * kvadratrot betegnes med σ. V benyttet to ulke metoder: Metode 1: Størrelsen tl nettoutvalget og frafallsandelen antas fast for vert fylke. Det vl s at for ver replkasjon nneolder både nettoutvalget og frafallsandelen lke mange personer som AKUs første kvartal 005, for vert enkelt fylke. Dermed vl a og b være lk som avsntt 3.1 for ver replkasjon, mens ˆX og Xdesgn vl endre seg for vert bootstrap datasett. Metode : Nettoutvalget og frafallsandelen for fylkene varerer for ver replkasjon, mens bruttoutvalget for vert fylke er fast. Det vl s at bruttoutvalget nneolder lke mange personer som AKUs første kvartal 005, men kke nettoutvalget. Dermed vl både b, ˆX og Xdesgn varere mellom bootstrap datasettene. * Tabell og 3 vser bootstrap estmater σ basert på B = 5 000 replkasjoner. Tallet parentes er * standardavvket tl σ, som er beregnet på følgende måte: Trekk tlfeldg og med tlbakeleggng 5000 *1 * *5000 ganger blant Y ˆ, Y ˆ,..., Y ˆ *1 * *5000, betegnet med Y ˆ (1), Y ˆ ˆ (1),..., Y (1). Den emprske varansen blant *1 * *5000 Y ˆ (1), Y ˆ ˆ (1),..., Y (1) gr oss et nytt bootstrap estmat for varansen tl Ŷ, og dermed dens * *1 * *5000 standardavvk, betegnet med σ. Gjenta dette 5000 ganger, dvs. opptl Y ˆ, Y ˆ,..., Y ˆ, * * (1) (5000) (1) * * (1) (5000) (5000) (5000) (5000) slk at v nå ar σ,..., σ. Den emprske varansen blant σ,..., σ er et estmat for varansen tl * σ, og dens kvadratrot er et estmat for standardavvket tl Fra Tabell og 3 kan v trekke følgende konklusjoner: * σ. 1

Ved å la nettoutvalget og frafallsandelen varere mellom replkasjoner, forventes det at varansen for estmatet av antall arbedsledge eller sysselsatte skal øke. Dermed skulle v forvente at varansen basert på Metode 1 vlle lgge under Metode. Imdlertd er det lten forskjell å se, speselt for sysselsettng, men også for arbedsledget. Varasjon nettoutvalgsstørrelsen ar nesten ngen effekt på varansen. Det er uklart vorvdt konklusjonen skyldes at frafallsmodellen er forenklet og urealstsk, som nevnt før. Det er lten forskjell mellom metoden basert på lnearserng og bootstrap metodene, både for sysselsettng og arbedsledget. Bootstrap metoden er mer krevende, sden v trenger mange replkasjoner for å få gode estmat. Det største problemet med bootstrap lgger lkevel tlretteleggng av data. Hvs v ønsker å kjøre bootstrap med famler som enet for å gjenskape klyngeutvalgsplanen, må v dentfsere famlemedlem blant frafallet tllegg tl nettoutvalget. I prakss krever dette mye arbed, sden nettoutvalget, frafallet og DSF med famlenummer lgger på forskjellge fler og steder. I mange andre land er koblngen som skal tl rett og slett umulg. Derfor er det godt å vte at lnearserngsmetoden Kapttel 3.1. nesten gr det samme resultatet. Å kjøre sstnevnte krever kke mer enn aggregerng over personer nnen samme famle nettoutvalget, som Kapttel.. Metoden er klart lettere å mplementere, og bør kunne brukes blant annet for kvaltetsrapporterng av AKU. Tabell : Resultater for sysselsettng ved enkelt tlfeldg utvalg der personer er trekkenet. 1 = Standardavvk (Std) og relatvt standardavvk (RSE) ved lnearserngsmetoden. = standardavvk og relatvt standardavvk for bootstrap metode 1 (fast nettoutvalg og frafallsandel). 3 = standardavvk og relatvt standardavvk for bootstrap metode (varerende nettoutvalg og frafallsandel). 4 = andel av total varans som skyldes frafall. 1. Std 1. RSE. Std. RSE 3. Std 3. RSE 4. Frafallsandel Østfold 1 69 1,35 1 704 (17) 1,36 1 683 (17) 1,34 10,98 Akersus 87 0,9 313 () 0,93 95 (3) 0,9 11,9 Oslo 933 1,03 98 (31) 1,03 938 (9) 1,03 0,41 Hedmark 1 36 1,56 1 300 (13) 1,53 1 333 (13) 1,57 9,17 Oppland 1 371 1,54 1 368 (14) 1,54 1 380 (14) 1,55 11,18 Buskerud 1 551 1,6 1 539 (16) 1,5 1 550 (15) 1,6 10,88 Vestfold 1 557 1,48 1 561 (16) 1,49 1 546 (16) 1,47 1,85 Telemark 1 304 1,67 1 310 (13) 1,67 1 33 (14) 1,69 11,18 Aust-Agder 865 1,8 87 (9) 1,83 880 (9) 1,85 11,4 Vest-Agder 1 341 1,77 1 371 (14) 1,81 1 351 (14) 1,78 9,69 Rogaland 1 95 0,98 1 97 (19) 0,99 1 948 (0) 1,00 7,04 Hordaland 364 1,05 344 (3) 1,04 377 (3) 1,05 10,75 Møre og Romsdal 875 1,75 884 (9) 1,77 891 (9) 1,78 8,4 Sogn og Fjordane 1 748 1,47 1 775 (17) 1,49 1 768 (18) 1,48 1,10 Sør-Trøndelag 1 653 1,0 1 69 (16) 1,18 1 645 (16) 1,19 9,55 Nord-Trøndelag 983 1,76 1 016 (10) 1,8 980 (10) 1,76 7,1 Nordland 1 473 1,34 1 483 (14) 1,34 1 459 (14) 1,3 11,91 Troms 1 397 1,86 1 406 (14) 1,87 1 416 (14) 1,88 14,37 Fnmark 703,06 711 (7),08 70 (7),11 13,59 Totalt 7 18 0,31 7 040 (69) 0,31 7 036 (70) 0,31 10,98 13

Tabell 3: Resultater for arbedsledget ved enkelt tlfeldg utvalg der personer er trekkenet. 1 = Standardavvk (std) og relatvt standardavvk (RSE) ved lnearserngsmetoden. = standardavvk og relatvt standardavvk for bootstrap metode 1 (fast nettoutvalg og frafallsandel). 3 = standardavvk og relatvt standardavvk for bootstrap metode (varerende nettoutvalg og frafallsandel). 4 = andel som skyldes frafall. 1. Std 1. RSE. Std. RSE 3. Std 3. RSE 4. Frafallsandel Østfold 989 15,85 998 (10) 16,00 989 (10) 15,85 10,98 Akersus 131 1,89 1 308 (13) 1,88 1 99 (13) 1,80 11,9 Oslo 041 10,00 01 (1) 9,89 038 (0) 9,96 0,41 Hedmark 667 1,11 676 (7) 1,34 674 (7) 1, 9,17 Oppland 794 0,06 794 (8) 0,04 803 (8) 0,33 11,18 Buskerud 85 19,5 83 (9) 19,69 817 (8) 19,36 10,88 Vestfold 875 18,9 880 (8) 18,40 878 (9) 18,50 1,85 Telemark 858 16,54 869 (9) 16,80 858 (9) 16,56 11,18 Aust-Agder 58 19,70 540 (6) 0,11 530 (5) 19,9 11,4 Vest-Agder 819 18,6 839 (8) 19,10 810 (8) 18,40 9,69 Rogaland 1149 1,35 1 16 (1) 1,47 1 134 (11) 1,1 7,04 Hordaland 1413 1,76 1 407 (14) 1,71 1 415 (14) 1,80 10,75 Møre og Romsdal 469 1,0 464 (5) 0,93 483 (5) 1,76 8,4 Sogn og Fjordane 98 17,47 938 (9) 17,68 936 (9) 17,6 1,10 Sør-Trøndelag 717 0,73 707 (7) 0,34 73 (7) 0,94 9,55 Nord-Trøndelag 473 5,04 476 (5) 5,3 470 (5) 5,00 7,1 Nordland 1046 13,67 1 034 (11) 13,50 1 061 (11) 13,88 11,91 Troms 651 6,91 660 (7) 7,8 647 (6) 6,87 14,37 Fnmark 484 16,83 495 (5) 17,09 494 (5) 17,10 13,59 Totalt 4 36 3,80 4 73 (4) 3,83 4 179 (41) 3,75 10,98 14

Appendks: Om data Datagrunnlaget for analysene bygger på netto og brutto AKU-tall for første kvartal år 005, noe som utgjør 4 377 personer. AKU nneolder en varabel som beskrver ntervjuobjektets sysselsettngsstatus A/A-regsteret. Dersom stmnace = 1,, eller 3 er personen sysselsatt følge regsteret, ellers er personen kke sysselsatt. I nettoutvalget er det 1 565 personer, men 40 av dsse mangler opplysnng om stmnace, og nngår dermed frafallsgruppen. Stmnace deles AKU produksjonen to gruppernger: 4-delng: Sysselsatt prmær-, sekundær-, eller tertærnærngen, og kke-sysselsatt -delng: Sysselsatt og kke-sysselsatt Det fnnes 36 personer AKU 1. kvartal 005 som er defnert som både arbedsledg enold tl Arena og sysselsatt enold tl A/A-regsteret. Dsse defneres som kke-sysselsatte. Det er 38 personer som mangler famlenummer, og som får tldelt et unkt famlenummer ver. Det er verdt å merke seg at 90% av dsse faller kategoren kke-sysselsatt enold tl regsteret. En person mangler nformasjon om fylke, og tre tlører fylke 1, som tlsvarer Svalbard. For å unngå å fjerne noen ntervjuobjekter slk at summen av vektene kke lenger stemmer med AKU produksjonen, allokeres dsse tl fylke 03 (Oslo) som er det fylket med flest tlørende personer. Alder deles 1 klasser; 16-19, 0-4, 5-9, 30-34, 35-39, 40-44, 45-49, 50-54, 55-59, 60-64, 65-69 og 70-74 år. Kjønn, alder og en 4-delng av regstersysselsettng gr grunnlag for x 1 x 4 = 96 etterstrata. For å unngå tomme celler, brukes det AKU produksjonen en -delng av regstersysselsettng for den eldste aldersgruppen (Heldal, 000). Hver person ar en oppblåsngsvekt (mndnetto) som er beregnet for AKU månedstall. For AKU kvartalstall skal vekten deles med 3. Et datasett ble konstruert: Kjønn (kjonn) Alder (basert på varabelen alder) Regsterstatus for sysselsettng (basert på varabelen stmnace) - gruppernger AKU sysselsettngsstatus (basert på varabelen sstat) Vekt (mndnetto delt med 3) Fylke (fylke) Famlenummer (IOs_fam) Populasjonstotaler for grupper defneres tl summen av vekt for gruppen. Datasettet danner grunnlaget for påfølgende analyser. 15

Referanser Cocran, W.G. (1977): Samplng Tecnques (3 rd ed.). Wley. Gabler, S., Haeder, S. og Lar, P. (1999): A model based justfcaton of Ks s formula for desgn effects for wegtng and clusterng. Survey Metodology, 5, 105-106. Heldal, J. (000): Kalbrerng av AKU. Dokumentasjon av metode og program. Notat 000/7. Ks, L. (1987): Wegtng n Deft. Te Survey Statstcan, June 1987. Rafat, D. (00): Analyse av sammeneng mellom ektefellers sysselsettng en famle. Notat 00/35. Särndal, C-E., Swensson, B. og Wretman, J. (199): Model Asssted Survey Samplng. Sprnger Verlag. Sao, J. (1996): Resamplng metods n sample surveys (wt dscusson). Statstcs, 7, 03-54. Vedø, A. og Rafat, D. (003): Sammenlgnng av utvalgsplaner AKU. Notat 003/56. Zang, L-C. og Vedø, A. (004): Omleggng av utvalgsplan for AKU. Notat 004/86. Zang, L-C. (006): A smplstc approac to varance estmaton for calbrated estmators subjected to wegtng adjustments. Upublsert notat. 16