til en simultan modell for alle kohortene hvor bestandene av ugifte og I denne behandlingen vil vi se bort fra avgang som skjer for forste



Like dokumenter
A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

La U og V være uavhengige standard normalfordelte variable og definer

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen desember 2016

Kapittel 4.4: Forventning og varians til stokastiske variable

Kapittel 2: Hendelser

Løsningsforslag til obligatorisk oppgave i ECON 2130

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

Eksamensoppgave i TMA4240 Statistikk

FORMELSAMLING TIL STK1100 OG STK1110

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

EKSAMEN I TMA4245 Statistikk

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

Regneøvelse 22/5, 2017

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Differensiallikninger definisjoner, eksempler og litt om løsning

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

SOS1120 Kvantitativ metode. Regresjonsanalyse. Lineær sammenheng II. Lineær sammenheng I. Forelesningsnotater 11. forelesning høsten 2005

Forelesning 4 STK3100

FORMELSAMLING TIL STK1100 OG STK1110

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Ridge regresjon og lasso notat til STK2120

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

STK Oppsummering

Fasit for tilleggsoppgaver

Transformasjoner av stokastiske variabler

Løsningsforslag: STK2120-v15.

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

UNIVERSITETET I OSLO

Løsningsforslag til utvalgte oppgaver i kapittel 10

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Prøveeksamen STK vår 2017

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

i=1 t i +80t 0 i=1 t i = 9816.

UNIVERSITETET I OSLO

Konfidensintervall for µ med ukjent σ (t intervall)

Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians.

Kapittel 3: Studieopplegg

UNIVERSITETET I OSLO

Inferens i regresjon

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Eksempel: kast med to terninger

1 + γ 2 X i + V i (2)

UNIVERSITETET I OSLO Matematisk Institutt

3.A IKKE-STASJONARITET

6.2 Signifikanstester

1 C z I G + + = + + 2) Multiplikasjon av et tall med en parentes foregår ved å multiplisere tallet med alle leddene i parentesen, slik at

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2015

QED Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Kort overblikk over kurset sålangt

MA1201 Lineær algebra og geometri Høst 2017

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

To-dimensjonale kontinuerlige fordelinger

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Enkel matematikk for økonomer 1. Innhold. Parenteser, brøk og potenser. Ekstranotat, februar 2015

Ekstraoppgaver for STK2120

Seminaroppgave 10. (a) Definisjon: En estimator θ. = θ, der n er et endelig antall. observasjoner. Forventningsretthet for β: Xi X ) Z i.

Formelsamling i medisinsk statistikk

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Definisjon: I en BEFOLKNINGSPROGNOSE forsøker en å basere seg på realistiske og plausible forutsetninger når det gjelder vekstfaktorene "FORECAST"

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

UNIVERSITETET I OSLO

TMA4240 Statistikk Eksamen desember 2015

Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering

SOS3003 Eksamensoppgåver

Eksamensoppgave i TMA4295 Statistisk inferens

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Eksponensielle klasser og GLM

Tilleggsoppgaver for STK1110 Høst 2015

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Forelesning 27. mars, 2017

Løsningsforslag Eksamen S2, høsten 2016 Laget av Tommy Odland Dato: 27. januar 2017

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

UNIVERSITETET I OSLO

ELE Matematikk valgfag

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

Differensjalligninger av førsteorden

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag

STK Oppsummering

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I TMA4240 Statistikk

Normal- og eksponentialfordeling.

Transkript:

1. Innledning En vesentlig svakhet ved formell demografisk teori er mangelen på operasjonaliserbare teknikker som tar hensyn til avhengigheten mellom kjønnene. De klassiske modellene behandler hvert kjonn separat og en kan dermed risikere a få inkonsistente resultater når modellene skal benyttes i prediksjonsoyemed. Det sentrale problemet synes a være spesifikasjonen av giftemålsfunksjonen - dvs. antallet som gifter seg i hver alder som funksjon av bestanden avugifte i de ulike aldre. I litteraturen er det foreslått flere matematiske modeller men ingen av dem synes å være helt tilfredsstillende. Det arbeides også med å utvikle numeriske prosedyrer men resultatene er forelopig sparsomme. I Byrået er det nylig etablert en historisk datafil med tidsrekkedata over alderspesifikke giftemålsrater (forstegangsgiftemål, kohortfordelinger og periodefordelinger). Dette datamaterialet gjør det Onskelig ta i bruk analyseteknikker som kan ta hensyn til kompliserte avhengighetstrukturer i materialet. Det er nskelig å studere betydningen av endringer i "bestandsvektorene" av ugifte for giftemålsstrukturen, samtidig som en realistisk modell i tillegg bor kunne beskrive eventuelle ikke-forklarte stokastiske variasjoner. Vi skal her beskrive en modell som har egenskapene ovenfor. Vi tar utgangspunkt i at begivenheten "førstegangsgiftemal" bare inntreffer en gang for hver person dersom den inntreffer. Vi betrakter settet av alderspesifikke giftemålssannsynligheter for hver kohort som realisasjoner av multinomiske sannsynligheter. Disse sannsynlighetene tenkes generert av en fordelingsklasse kalt den multivariate beta-fordeling. Ved hvert tidspunkt knytter vi kohortene av menn og kvinner sammen ved å la parametrene i fordelingsklassen avhenge av bestandene av ugifte i de ulike kohortene ved det aktuelle tidspunkt. Denne angrepsmåten leder til en simultan modell for alle kohortene hvor bestandene av ugifte og antallet som gifter seg ved hvert tidspunkt inngår. Videre antas det at den ikke-forklarte variasjonen i giftemålsratene utvikler seg i folge en autoregressiv prosess slik at modellen tar hensyn til eventuell uforklart (autokorrelert) variasjon. I denne behandlingen vil vi se bort fra avgang som skjer for forste giftemål (dodsfall, utvandring, m.v.)

2. En dobbeltstokastisk modell Vi forutsetter at vi har et datasett som består av alderspesifikke giftemålsrater for et visst antall kohorter. La p t (x) være sannsynligheten for at en person som tilhorer kohort t skal gifte seg forste gang i alder X. P (x)' x = 0,16,... er altså sannsynligheten i en multinomisk modell hvor t begivenheten "g gifte seg forste gang" skjer i alder x eller ikke skjer i det hele tatt. La p t (0) være sannsynlighetene for at personen ikke gifter seg. La Y tj (x) være lik 1 dersom j-te person i t-te kohort gifter seg i alder x og null ellers. Y(x) = E Y. (x) er da antallet i kohorten som 4 t gifter seg i alder x. Bestanden 'i kohort t betegnes me d N t og N - E Y (x) x>16 betegnes med Y(0). Under forutsetning om stokastisk uavhengighet - mellom individene blir Y = (Y t (x), x=0,...) multinomisk fordelt. Dette -t gjelder innen hver kohort t, t=1,2,... Dersom en studerer tidsrekken av estimater for p t (x) for fast x og løpende t finner en at det er en betydelig variasjon fra kohort til kohort samtidig som det tydeligvis er sterk korrelasjon mellom ratene for ulike t. Vi betrakter folgelig settet av sannsynligheter p = (p (x), x=0,16,..) som stokastiske. Disse varierer tilfeldig -t -t fra kohort til kohort omkring en eller annen trend. Kohortfordelingen p t antar vi har sannsynlighetstetthet f (p). I denne modellen har vi altså t - to typer usikkerhet. For gitte sannsynligheter har vi usikkerhet som avhenger av storrelsen på observasjonsmaterialet. Her gjelder sammenhengene (1) E (x) - (2) p t (x) -t F, I Var Lpt (x) p_(x) = p t( x)(1-p t (x))/n t og (3) kov ilt (x), IS t (y) P t (x), pt (y) ( ) pt,x, Pt\ ( y / int hvor 1/3 (x) = Y(x)/N Når N er stor ser vi at denne usikkerheten er. t liten. I tillegg har vi altså usikkerhet som skyldes variasjoner i de underliggende sannsynlighetene fra kohort til kohort. I neste avsnitt beskrives en mulig fordelingsklasse for p som har ønskelige matematiske egenskaper.

. Multivariat betafordelte giftemålssannsynligheter. Den multivariate betafordelingen (også kalt matrise-betafordelingen og Dirichletfordelingen) har tetthet (4) r(a1+321-.--fak)_ a2-1.pk a k _ 1 ei f (Pl' P2" Pk ) = r(a ) 1 r(a ) -..r(ak ) P 1 n2 hvor Ep. = 1 ogia. er parametre. Fordelingen har - 3 J som er analoge til den multinomiske fordeling folgende egenskaper (5) EP. _.: J j a= Ea. (6) Var p. ='Ep. (1-Ep.)/(a+1) J J J og (7) Kov(p. Ep./ (a+1) J Fordelingen er altså sentrert om et punkt som er bestemt ved de relative a-verdiene mens graden av konsentrasjon omkring dette punktet bestemmes av a. Mosiman (1962) studerer denne fordelingsklassen og viser at p er multivariat k-1 betafordelt hvis og bare hvis p. er "uavhengige på bibetingelsen < 1 nær" j=1 PJ Hva dette betyr mer presist gar vi ikke inn på her, intereserte henvises til Mosiman,side 76. det folgende antar vi at f (p) er en multivariat beta-tetthet Ç - med parametre a(x), x=0,16,... Betegner vi den multinomiske fordeling med parameter p for g (y,p ) (p gitt) får vi den ubetingede fordeling -t t -t for y t ved h (y ) =pt(ztip)ft(p)dft (multippel integrasjon) hvor C = p(x) I p(x) 1,Ep (x) <1. x>16 Dette gir den multivariate negative hypergeometriske fordelingen (Jfr. Mosiman) gitt ved (8) h (y ) Ntir(at)11 t(x)-4-37t(x)) t -t r(a +N )x y t t t (x)tt(a (x)). t

4 Ved forst å betinge med hensyn på p kan vi beregne kovariansmatrisen til -t f3- (x). Fra (1) får vi -t (9) E ipt (x) = E pt (x) = at (x)/at Bruker vi sammenhengen Var P (x) = E Var (P t (x) 12(x)) + Var E6(x) pt(x)) får vi (10) Var f)t (x) = Nt+at) Varp(x) Tilsvarende blir N t (11) cov (x), c t =(N +a t t k.ov p (x) p t (y) N Vi merker oss at når N Oker vil disse uttrykkene nærme seg (6) og (7). Det kan vises at Y(x) gitt Y (j), -y<x t j er negativt hypergeometrisk fordelt med parametre a (x) og A (y)_a(x) hvor t < A t (y) =E a t (j).3>y Dette medforer at (12) E {Y t (x) Yt (i) = yt (i), j<z<x} a (x) (N t t (i)) A (z) t Det kan vises mer presist at når observasjonsmaterialet er stort er fordelingen (8) tilnærmet lik fordelingen (4). Mosiman (1962) gir en metode til å estimere parametrene a (x) ved t a bruke relasjonene (10) og (11) sammen med (6) og (7). En kan naturligvis også estimere parametrene ved a benytte sannsynlighetsmaksimeringsprinsippet med (8) som basis for "Likelihooden".

4. Teori for parametrene Hittil har vi bare betraktet en kohort og ikke tatt hensyn til at det er en vesentlig sammenheng mellom kohortene. La M (x) være antall ugifte menn ved tidspunkt T i alder x og la F T (x) være antall ugifte kvinner ved tidspunkt T i alder x. De M T (r), r=1,2,... ugifte mennene vil konkurrere med hverandre om å bli gift med de F (r) r=1,2,.. kvinnene. Altså bor sannsynligheten for at en kvinne skal gifte seg i år T gitt de tidligere giftemål i alle kohortene være en stigende funksjon i M (r) og en avtagende funksjon i F (r) for alle r. Denne endringen br imidlertid være svakere jo storre forskjellen er mellom x og den "ideelle" alder på partneren. La p (X) = E {Y TX (x) /F T (X) 1M F - -T-1,-T-1 hvor M T og F er vektorer der komponentene er antatt ugifte i årene for - -T T i alle kohorter. Vi tenker oss nå at parametrene i sannsynlighetsfordelingen til p for kohort t er funksjoner av typen a+x (x) = a (x). t Det betyr ifolge (12) at (13) p (x) = a (x)/a (x) fordi Nt - E Yt (i) = F+(x) j<x hvor A (x) = E a.(x+j) = a - E a (x -j).>0t3 j>0 T-J og a er en parameter, a = E a+x (x). t Herav finner vi a(l6) = a p (16) og a (x) P (x) a -1) x-16 T-1 Lt (1+11 (x)) (x-1) = all 1-Fp (x-r) T T- 1 r=0 T -r Det er altså en entydig sammenheng mellom { 1,1 (x)} og {a (x)}. Neste T T skritt er nå A spesifisere p (x) som funksjon avbestandsvektorene T NT - og F -T. La f, T - (x,y) være sannsynligheten for at en kvinne i alder x skal gifte seg med en mann i alder y i år T. Problemet med a spesifisere f T er behandlet

i litteraturen av flere forfattere. McFarland (1972) foreslår et sett aksiomer som f bor tilfredsstille hvorav de viktigste er Aksiom 5. f(i,j) skal være en ikke-avtagende funksjon avm(i)når alle andre argumenter holdes faste. Videre skal det finnes et intervall hvor f(i,j) er strengt voksende IM(i)for et hvert fast sett av de andre argumentene. Det samme skal gjelde når kjønnene byttes om. Aksiom 6. f(i,j) skal være en ikke-voksende (og på et eller annet intervall strengt avtagende) funksjon avm(k)for kii når alle andre argumenter holdes faste. Det samme skal gjelde når kjønnene byttes om. (Konkurranseaksiomet). Aksiom 7. Den negative effekt på f(i,j) av en Okning im(r)skal være storre enn den negative effekt av en ekvivalent Økning IM(s)hvis r er nærmere i enn s er. Det samme skal gjelde når kjonnene byttes om. (Substitusjonsaksiomet). Disse aksiomene betrakter McFarland som "minimumskrav" en bor stille til kandidater for giftemålsfunksjonen. Imidlertid er disse aksiomene restriktive nok til a ekskludere de fleste giftemålsfunksjoner som foreslås i litteraturen. Eksempler på slike funksjoner er gitt i McFarland (1972) og Pollard (1977). Pollard (1975) foreslår en funksjon av typen (14) k M y) / E (j) F (i)) xy xj. T..137 T -j hvor a.. og (3.. er tiltrekningsparametre dvs. a.. er et mål for till.)j I1J trekningen en kvinne i alder i har på en mann i alder j og 13jy er tiltrekningen en mann i alder y har på en kvinne i alder j. Denne funksjonsformen tilfredsstiller alle aksiomene så nær som aksiom 7. Pollard tror imidlertid at aksiom 7 er mindre vesentlig. Den overveiende delen av befolkningen sker en partner i nærheten av sin egen statusgruppe (aldersgruppe) og de velger en partner fra andre grupper bare dersom det er underskudd på kandidater i den nskede gruppe. Denne observasjonen tyder på at de viktige her er "avstanden" mellom statusgruppene til henholdsvis menn og kvinner og at giftemålsfunksjonen br være en avtagende funksjon i Schoen (1977) foreslår en giftemålsfunksjon av typen ovenfor hvor a = og k = a (a 4- a ) = E(a a. ) a. xy xy xy xy. xj jx xy Hans modell begrunnes ved a innfore en rektangulær befolkning, dvs. en befolkning med likt antall personer (ugifte personer) i hver aldersgruppe og deretter innføre en korreksjonsfaktor som reflekterer endringer i

7 kjønns og aldersammensetningen i den ugifte befolkningen. Vi skal i det folgende basere oss på denne funksjonen; f a (a + a ) M (y) xy x. sy T (15) WT (x,y) = a M Exj T (j) + E a. F (j). 1 JY T J J hvor W (x,y) er sannsynligheten for at en kvinne i alder x skal gifte seg med en mann i alder y ved tidspunkt T. Herav vår vi p (x) = E W (x,y) og X (y) = E Wm (x,y) Y x hvor X (y) er de alderspesifikke giftemålssannsynlighetene for menn. Schoen har estimert parametrene a på svenske data fra 1973. I vår xy situasjon hvor vi ikke har observasjoner av (x,y) - giftemål før 1970 må vi innskrenke parameter-rommet for å få effisient estimering. La oss se nå hvilke egenskaper en slik glattinsfunksjon bør h a. a xy bør være symmetrisk i x og y-y (y) hvor v(y) er en størrelse som tar hensyn til at menn ofte gifter seg med kvinner som er yngre enn a dem selv. For y fast br for a ha toppunkt for x = y-v (y). Funksjonen xy br videre vokse raskt mot sin største verdi og deretter avta langsomt. Betrakt funksjonen h(x,y) = exp f-0 1-02 1 x7y+v(y)1-0 3 (x-v(y)+y) 04 log (x-(y Partiell derivering m.h.p. x gir +y)} ah. 0 = h (0_--0 4 2 3 x+y-y (y) for x<ý-\)(y), e = -.) Dh 4 z x+y Vy) for x>y-y (y)., Dersom 0 2 >e 3-0 4 /(32-v(16)) vil ah -57( > 0 for x<y V (y) og

3h < 0 for x>y-v (y) 3x hvilket betyr at h har sin største verdi for x=y -v (y). og x 2 >y-v(y) være slik at h(x 1,y) = h(x 9,y). Vi har at La x 1 <y-v(y) 0 0 4 13h(x - 911(x,y) h(x, y ) 1 Tc 2 1 x 4-37-v(Y) x 2 4-37-v(Y) - 20 3 ). Dersom nå 0 4 > 0 3 (2M-y(M)) hvor 1\1 er høyeste giftemålsalder vil differansen ovenfor være positiv. Dette betyr at endringen i h skjer raskere når x<y-v (y) enn når x>y-v(y). Vi kan videre generalisere h ved å innfore 'høyere ordens ledd i nevneren. Funksjonen v(y) kan f.eks, velges lineær; V(y) = ry+s hvilket gir y-v (y) = (1-r)y-s = r 1 y-s, der r 1 =1-r. Her kan vi ikke la r og s være parametre som estimeres simultant med de andre parametre. Grunnen til dette er at de partiellderiverte m.h.p. r og s ikke eksisterer i punktet x=y-v (y) fordi funksjonen h inneholder et tallverdiledd i eksponenten. De vanlige programmer for iterasjon forutsetter nemlig eksistensen av de partiellderiverte M.h.p. parametrene. En mate g teste funksjonsformen på er a estimere parametrene c på grunnlag av (i,j)- ij datamatrisene etter 1970 og deretter glatte disse estimatene. Disse estimatene har jo dessuten interesse i seg selv. Vi kan nå estimere W (x,y) for hvert tidspunkt med utgangspunkt i de observerte ratene. Vi vil da sannsynligvis finne at parametrene Varierer med tiden. Det kan derfor være aktuelt a anta at periodefordelingen folger en lineær stokastisk modell f.eks. en førsteordens autoregressiv modell (16) q (x) T-1-1 1 (x) = Y cit (x) P T (x)) (/) 2 (q T (x-1) PT (x-4)4. E T+1 (x) hvor q (x) er sannsynligheten for at en ugifte kvinne i alder x gifter seg vedtidspunktt,eweruavhengigeforalletogxoget+1(x) er uavhengig av q T = fq T (x),x = 16,17,-1. 1 og (P er ukjente parametre som har tallverdi mindre enn 1. Aktuelle 2 hypoteser er her at enten (1) eller (1) er lik null, eventuelt at begge to 2 er lik null. Dersom begge parametrene er lik null er vi tilbake til situasjonen som ble beskrevet i begynnelsen av avsnittet. Da er nemlig den vesentlige variasjonen i giftemålssannsynlighetene forklart ved (15). Dersom (1) og cl) er forskjellig fra null betyr det at q i lengre eller 2 kortere perioder aviker fra P T. Siden (17) E {q(x)1m_; a (x) + Y (x) T T---X

9 får vi at 1 A (x-j)+y (x-j) (18) a (x) /A -II (x) E (I). r T T-X+ j T+1 T+1 T+1 j+1 1 II (x-j)/ j=0 A (x-j) + F (x-j) T T T Herav kan vi beregne a = {a (x),x=16,17,..} rekursivt. T T La nå G f (y t (x) ) = Pr fy (x) y (x) I M T- 1 F ) T-x T -' -1 Det folger fra avsnitt (3) at Y (x) er negativt hypergeometrisk fordelt med parametre A (x) - a t (x) og a (x) dvs. u-i(a (x))r(a (x) + y (x))f(a (x) F (x)-a (x)-y (x)) (19) G f T T (y (x) ) T T TT T T r(at(x) + F 4L(X)) y :(FT(x)-yT(x))Ir(AT(x)-aT(x))F(aT(x)) Hittil har vi bare sett på giftemålssannsynligheter for kvinner. Med de samme forutsetninger for giftemillsannsynligheten for menn som for kvinner får vi helt analoge resultater for menn som ovenfor. Estimering Vi skal se på estimering ved bruk av minste kvadraters metode og ved sannsynlighetsmaksimeringsprinsippet. Et problem her er at antall kvinner som gifter seg er lik antall menn som gifter seg ved hvert tidspunkt slik at en dermed får stokastisk avhengighet som skyldes denne typen kjønnsavhengighet. Hoem (1969) viser hvilke matematiske problemer som oppstår dersom en skal ta hensyn til denne avhengigheten under estimeringen. Dersom vi imidlertid estimerer modellene for hvert kjonn separat trenger vi ikke a spesifisere den stokastiske avhengigheten mellom hannkjonns- og hunkjonnsratene. I vår situasjon hvor antall observasjoner for hvert kjonn er stort (minst 2 600) er dette en aktuell mulighet. Vi antar at (16) gjelder også, når sannsynligheten erstattes med de observerte ratene E(x). Siden restleddene (x) er antatt å være stokastisk uavhengige for alle T og alle x får vi at (x) =(x) E (I) (x-j)) T+1 T+1. 1+J T j=0 for alle T og x er uavhengige. Minste kvadraters estimator finnes derfor ved å minimere 1

10 (20) U (x) 2 T,X med hensyn 0. parametrene (j f). og parametrene O. i glattingsfunksjonen J for fa Tilsvarende kan vi benytte giftemålsratene for menn til a xy estimere 11). og O. hvor i PJ. er de parametrene som tilsvarer gb i i (16). J J Vi skal dernest betrakte estimering ved hjelp av sannsynlighetsmaksimeringsprinsippet. Dette gir oss mulighet til å ta hensyn til forutsetningene i avsnitt 2 under estimeringen. Benytter vi bare giftemålsratene for kvinner, får vi at likelihooden for observasjonene blir lik L = 1111 G f (y (x)). Tr x T T Dersom observasjonsmaterialet er stort er fordelingen til {EI (x)} - T tilnærmet lik fordelingen til {q (x)}. Følgelig har vi da (22) G f (yt (x)) T T F(a T (x))f(a T (x)-a T r(a (x)) rx\at(x)-1 (1-4i (x)) AT(x)-aT(x) x)) -1 og tilsvarende uttrykk for G m. Antar vi videre at a (x) + Y (x) T - X A (x) F (x Y (x)jf (x) = x) får vi ved a benytte resonementet på side 5 at x-16 (23) a (x) --- all =0 rp. (x-j)-eq) T- 1-1- -1-j )-- -1- T-1-j For parametrene knyttet til giftemålssannsynlighetene for menn får vi analoge uttrykk.

11 REFERANSER Hoem, J.M., 1969: Concepts of a Bisexual Theory of Marriage Formation. Statistisk Tidskrift 4, 295-300 McFarland, D.D., 1972: Comparison of alternative marriage models. Populations Dynamics Greville, T., Ed), 89-106. Academic Press, New York. Mosiman, J.E., 1962: On the compound multinomial distribution, the Biometrica, multivariate.-distribution, and correlations among proportions. 49, 65-82. Pollard, J.H., 1975: Modelling human populations for projection purposes - som2of the problems and challenges. Aust. J. Statist. 17, 63-76. Pollard, J.H., 1977: The continuing attempt to incorporate both sexes into marriage analysis. International population conference 1, 291-308. Mexico 1977. Schoen, R., 1977: A two-sex nuptiality-mortality life table. Demography 14, 333-347.