UNIVERSITETET I OSLO Det matematisk-aturviteskapelige fakultet Eksame i: STK11 Sasylighetsregig og statistisk modellerig. LØSNINGSFORSLAG Eksamesdag: Fredag 9. jui 217. Tid for eksame: 9. 13.. Oppgavesettet er på 8 sider. Vedlegg: Tillatte hjelpemidler: Ige. Godkjet kalkulator. Formelsamlig for STK11 og STK111. Oppgave 1 Kotroller at oppgavesettet er komplett før du begyer å besvare spørsmålee. Vi mier om at hvis e stokastisk variabel V er gamma-fordelt med formparameter α og skalaparameter β, som vi skriver V gamma(α, β), så er sasylighetstetthete til V gitt ved f V (v) { 1 β α Γ(α) vα 1 e v/β hvis v >, ellers. a) Ata at V gamma(α, β). Vis at E (V r r Γ(α + r) ) β Γ(α) hvis r > α. (1) Du får bruk for dette resultatet seere i oppgave. Løsig: For r > α har vi at E (V r ) v r f V (v)dv v r 1 β α Γ(α) vα 1 e v/β dv 1 β α Γ(α) βα+r r Γ(α + r) Γ(α + r) β Γ(α) 1 β α Γ(α) v α+r 1 e v/β dv La å X være itekte til e tilfeldig valgt løsmottaker i e bestemt befolkigsgruppe. Det er valig å ata at X er Pareto-fordelt, det vil si at X har sasylighetstetthete { θk f X (x) θ ( 1 θ+1 x) hvis x > k, (2) ellers. Her er k misteitekte i de aktuelle befolkigsgruppe, mes θ > 1 er e parameter som avheger av løsforskjellee i gruppe. Vi vil i hele oppgave rege med at misteitekte k er kjet. (Fortsettes på side 2.)
Eksame i STK11, Fredag 9. jui 217. Side 2 b) Vis at de kumulative sasylighetsfordelige til X er gitt ved { F X (x) 1 ( k θ x) hvis x > k, ellers. Løsig: For x > k blir de kumulative sasylighetsfordelige til X: x x F X (x) f X (u)du θk θ u θ 1 du θk θ [ θ 1 u θ ] x k 1 kθ x θ 1 k For x k blir F X (x) x F X (x) { du. Dermed har vi at: 1 ( k x) θ for x > k ellers. ( ) k θ x c) Vis at media itekt er µ k2 1/θ og forklar hva mediae gir uttrykk for. Løsig: Media årsitekt µ er gitt ved F X ( µ) 1/2. Av det er vi at: ( ) k θ 1 1 µ 2 ( ) k θ 1 µ 2 µ θ k θ 2 µ k2 1/θ Mediae µ er gitt slik at halvparte i de aktuelle befolkigsgruppe har e årsitekt som er midre e µ og halvparte har e årsitekt som er større e µ. d) Vis at 2θ l(x/k) gamma(1, 2). Løsig: Vi setter Y 2θ l(x/k). For y > har da Y kumulativ fordelig: F Y (y) P (Y y) P (2θ l(x/k) y) P (X k e y/(2θ)) F X (k e y/(2θ)) ( ) k θ ( ) 1 1 k e y/(2θ) 1 e y/2 1 e y/2 Av dette er vi at for y > er tetthete til Y gitt ved: f Y (y) F Y (y) 1 2 e y/2 1 2 1 Γ(1) y1 1 e y/2 Vi kjeer igje dette som gamma-tetthete med α 1 og β 2, så Y gamma(1, 2). For å estimere θ, gjør vi 3 observasjoer av itektee i de aktuelle befolkigsgruppe. Du ka ata at de observerte itektee x 1, x 2,..., x er observerte verdier av stokastiske variabler X 1, X 2,..., X som er uavhegige og idetisk fordelte med sasylighetstetthete (2). E mulig estimator for θ er da i1 l(x i/k). (3) (Fortsettes på side 3.)
Eksame i STK11, Fredag 9. jui 217. Side 3 e) Vis at 2θ/ gamma(, 2). (Du ka rege som kjet at e sum av uavhegige gammafordelte variabler som alle har samme skalaparameter, selv er gamma-fordelt.) Bruk dette resultatet og (1) til å vise at E() [/( 1)]θ. Løsig: Vi har at: 2θ 2θ l(x i /k) i1 2θ l(x i /k) i1 Y i, i1 der Y i 2θ l(x i /k). Nå er Y i -ee uavhegige og gamma(1, 2)-fordelte. Vi har videre at summe av uavhegige gamma-fordelte variabler som alle har samme skalaparameter, selv er gamma-fordelt med formparameter lik summe av formparameteree og med samme skalaparameter som hver av variablee i summe. Av dette og resultatet i pukt d følger det at 2θ/ i1 Y i gamma(, 2). For å e forvetige til bruker vi resultatet i pukt a med r 1, α og β 2. Vi får da at: { ( ) } { 2θ 1 (2θ ) } 1 E() E 2θ 2θE 1 Γ( 1) Γ( 1) 2θ 2 θ Γ() ( 1)Γ( 1) 1 θ f) Estimatore (3) er ikke forvetigsrett. Foreslå e estimator som er forvetigsrett og bestem variase til estimatore. Løsig: E forvetigsrett estimator for θ er: θ 1 1 i1 l(x i/k) Ved å bruke resultatet i pukt a med r 2, α og β 2 får å at: E { (θ ) 2} { ( ) } 1 2 ( ) { E 1 2 ( ) } 2θ 2 E (2θ) 2 ( ) { 1 2 (2θ ) } 2 (2θ) 2 E 4( 1) 2 θ 2 2 Γ( 2) 2 Γ() Av dette følger det at ( 1) 2 θ 2 Γ( 2) ( 1)( 2)Γ( 2) 1 2 θ2 V (θ ) E { (θ ) 2} {E(θ )} 2 1 2 θ2 θ 2 θ2 2 (Fortsettes på side 4.)
Eksame i STK11, Fredag 9. jui 217. Side 4 g) Utled et 95% kodesitervall for θ. Itervallet skal uttrykkes ved hjelp av,, a og b. Her er a og b heholdsvis 2.5% og 97.5% persetilee for gamma-fordelige med formparameter α og skalaparameter β 2. Bestem også et 95% kodesitervall for media itekte µ. Løsig: Fra pukt e har vi at 2θ/ gamma(, 2). Av dette følger det at P ( a 2θ ) b.95 Ved å omforme ulikhetee gir dette at ( a P 2 θ b ) 2.95 Av dette ser vi at [ ] a 2 b, 2 ( ) er er 95% kodesitervall for θ. Vi har at mediae µ k2 1/θ er e stregt avtagede fuksjo av θ. Begivehete at θ ligger i itervallet ( ), er derfor det samme som begivehete at µ ligger i itervallet [ k2 1/U, k2 1/L ] ( ) der L (a/2) og U (b/2). Det følger at ( ) er et 95% kodesitervall for mediae µ. Oppgave 2 Sigdcelleaemi er e farlig blodsykdom som særlig rammer meesker av afrikask opprielse. Et bar får sykdomme dersom det får et bestemt recessivt ge (a) fra både mor og far. Baret får ikke sykdomme hvis det får det domiate geet (A) fra mist é av foreldree. Vi ser først på et par der både kvie og mae har geotype Aa. Ige av dem lider av sigdcelleaemi, me de er bærere av sykdomme og ka føre de videre til sie bar. Et bar de får samme, arver fra mor det recessive geet a med sasylighet 1/2 og det domiate geet A med sasylighet 1/2. Det samme gjelder for arve fra far. Videre er arve fra de to foreldree uavhegig. a) Forklar at sasylighete er 1/4 for at baret får geotype aa og dermed vil lide av sigdcelleaemi. Forklar også at sasylighete er 1/2 for at baret får geotype Aa og dermed vil være e frisk bærer av sykdomsgeet. Løsig: Sasylighete er 1/2 for at baret vil arve a fra mor. Vi skriver kort P (a fra mor) 1/2. Tilsvarede har vi at P (A fra mor) 1/2, P (a fra far) 1/2 og P (A fra far) 1/2 (Fortsettes på side 5.)
Eksame i STK11, Fredag 9. jui 217. Side 5 Side arve fra de to foreldree er uavhegig, har vi at P (baret får geotype aa) P (a fra mor og a fra far) P (a fra mor) P (a fra far) 1 2 1 2 1 4 På tilsvarede måte får vi at P (baret får geotype Aa) P (A fra mor og a fra far) + P (a fra mor og A fra far) P (A fra mor) P (a fra far) + P (a fra mor) P (A fra far) 1 2 1 2 + 1 2 1 2 1 2 Vi ser så på et par der mae er bærer av sigdcelleaemi (dvs. har geotype Aa). Kvie lider ikke av sigdcelleaemi, me vi vet ikke om hu er bærer av sykdomme eller ikke. Sasylighete for at hu er bærer er 8% (svarede til adele bærere i de afroamerikaske befolkige), mes sasylighete er 92% for at hu ikke er bærer. b) Hva er sasylighete for at et bar paret får, vil lide av sigdcelleaemi? Løsig: Sasylighete er 8% for at kvie har geotype Aa og 92% for at hu har geotype AA. Vi skriver kort P (kvie er Aa).8 og P (kvie er AA).92. Setige om total sasylighet gir at P (bar får sigdcelleaemi) P (bar får geotype aa) P (kvie er Aa) P (bar får geotype aa kvie er Aa) + P (kvie er AA) P (bar får geotype aa kvie er AA).8 1 +.92.2 4 Sasylighete er 2% for at baret vil lide av sigdcelleaemi. c) Paret får tre bar og ige av dem lider av sigdcelleaemi. Hva er sasylighete for at kvie er bærer av sykdomme? Løsig: Setige om total sasylighet gir at P (tre friske bar) P (ige av bara har geotype aa) P (kvie er Aa) P (ige av bara har geotype aa kvie er Aa) + P (kvie er AA) P (ige av bara har geotype aa kvie er AA) (.8 1 1 3 +.92 1.954 4) (Fortsettes på side 6.)
Eksame i STK11, Fredag 9. jui 217. Side 6 Av deisjoe av betiget sasylighet og produktsetige (eller direkte av Bayes' setig) er vi dermed at P (kvie er bærer tre friske bar) P (kvie er Aa ige av bara har geotype aa) P (kvie er Aa) P (ige av bara har geotype aa kvie er Aa) P (ige av bara har geotype aa).8 (1 1 ) 3 4.8 (1 1 ) 3.35, 4 +.92 1 Gitt at paret har fått tre friske bar, er sasylighete 3.5% for at kvie er bærer av geet for sigdcelleaemi. Oppgave 3 Vi betrakter i dee oppgave stokastiske variabler X og Y som har simultatetthet av forme: { K hvis x, y, x + y θ, f X,Y (x, y) ellers. Her er θ > e parameter, mes K er e kostat som bestemmes slik at f X,Y sasylighetstetthet. er e a) Vis at K 2θ 2. Løsig: For at f X,Y skal være e sasylighetstetthet, må K være slik at: f X,Y (x, y)dx dy 1. Setter vi i uttrykket for f X,Y, får vi at itegralet blir: f X,Y (x, y)dx dy K K K θ [ θ y θ (θ y)dy ] dx dy [ θy 1 ] θ 2 y2 K 1 2 θ2 1 Vi løser så de siste ligige med hesy på K og er at K 2θ 2. b) Vis at margialtetthete til X er: { 2θ f X (x) 2 (θ x) hvis x θ, ellers. Fi også margialtetthete til Y. Er X og Y uavhegige? Begru svaret. (Fortsettes på side 7.)
Eksame i STK11, Fredag 9. jui 217. Side 7 Løsig: Vi starter med å e margialtetthete til X ved å itegrere simultatetthete f X,Y (x, y) med hesy på y. For x θ får vi: f X (x) f X,Y (x, y)dy θ x 2θ 2 dy 2θ 2 (θ x). For x < eller x > θ er f X,Y (x, y), så: f X (x) f X,Y (x, y)dy Herav totalt: { 2θ f X (x) 2 (θ x) hvis x θ, ellers. Margialtetthete til Y es helt tilsvarede, og vi får: { 2θ f Y (y) 2 (θ y) hvis y θ, ellers. Vi ser å at: Dette betyr at X og Y ikke f X,Y (x, y) f X (x) f Y (y). er uavhegige. c) Vis at: Løsig: E(X r ) 2θ r (r + 1)(r + 2). Bruk dette resultatet til å e forvetige E(X) og variase V (X). E(X r ) θ θ x r 2θ 2 (θ x)dx 2θ 2 (θx r x r+1 )dx 2θ [θ 2 1 r + 1 xr+1 1 r + 2 xr+2 2θ r ( 1 r + 1 1 r + 2 ) Herav får vi ved å sette i r 1 og r 2: Dette gir: E(X) 2θ 2 3 2θ 6 θ 3, E(X 2 ) 2θ2 3 4 2θ2 12 θ2 6. ] θ 2θ r (r + 1)(r + 2). V (X) E(X 2 ) [E(X)] 2 θ2 6 θ2 9 θ2 18. ( 1 2θ 2 r + 1 θr+2 1 ) r + 2 θr+2 (Fortsettes på side 8.)
Eksame i STK11, Fredag 9. jui 217. Side 8 d) Fi de betigede fordelige for Y gitt X x uttrykt ved tetthete f Y Xx (y). Hvilke kjet fordelig er dette? Bestem også E(Y X x). Løsig: Dersom x < eller x > θ, så er f X (x). I dette tilfellet er f Y Xx (y) udeert. Vi forutsetter derfor at x θ, og får da for y θ x: f Y Xx (y) f X,Y (x, y) f X (x) 2θ 2 2θ 2 (θ x) 1 θ x. Dersom y < eller y > θ x, er f X,Y (x, y), så i dette tilfellet blir f Y Xx (y). Totalt får vi dermed: { 1 θ x hvis y θ x, f Y Xx (y) ellers. Dette er tetthete til uiformfordelige på itervallet [, θ x]. Vi har med adre ord vist at: Y X x Uiform(, θ x). Vi er til slutt E(Y X x): E(Y X x) θ x y θ x dy 1 θ x [ ] 1 θ x 2 y2 θ x. 2 e) Fi sasylighete P (X 2 + Y 2 θ 2 /2). Løsig: For å få oversikt over begivehete vi skal berege sasylighete til, ifører megdee: A {(x, y) : x, y, x 2 + y 2 θ 2 /2}, B {(x, y) : x, y, x + y θ}. Megde A er e kvart sirkel med radius θ/ 2. Arealet av A blir dermed πθ2 /2 4 πθ2 8. Vi har også at P (X 2 + Y 2 θ 2 /2) P ((X, Y ) A). Megde B er e likebeet rettviklet trekat der katetee har legde θ. Av deisjoe på simultatetthete til X og Y ser vi at f X,Y (x, y) 2θ 2 for alle (x, y) B. Utefor B er f X,Y (x, y). Vi har også at A B. De ekleste måte å vise dette på, er å tege e gur som viser hvorda de to megdee ligger i forhold til hveradre. Ma er da at sirkelbue i kvartsirkele A tagerer hypoteuse i trekate B i puktet (θ/2, θ/2). Dette skyldes at θ/2 + θ/2 θ og (θ/2) 2 + (θ/2) 2 θ 2 /2. Reste av sirkelbue i kvartsirkele A ligger på iside av B. Vi er sasylighete P (X 2 + Y 2 θ 2 /2) ved å itegrere simultatetthete f X,Y (x, y) over megde A. Side A B, er f X,Y (x, y) 2θ 2 for alle (x, y) A, og vi får: P (X 2 + Y 2 θ 2 /2) f X,Y (x, y)dxdy 2θ 2 dxdy 2θ 2 πθ2 A A 8 π 4. SLUTT