LØSNING, EKSAMEN I STATISTIKK, TMA440, DESEMBER 006 OPPGAVE 1 Ata at sa porøsitet er r. Målig med utstyret gir da X (x; r, 0,03). a) ( ) X r P(X > r) P 0,03 > 0 P(Z > 0) 0,5. ( X r P(X r > 0,05) P 0,03 > 0,05 ) P(Z > 1,67) 0,0475. 0,03 For de som tolket feile som absoluttverdi (som også er rimelig) ( X r P( X r > 0,05) P > 0,05 ) P( Z > 1,67) 0,0950. 0,03 0,03 Ata at X 1 og X er uavhegig idetisk fordelt (uif). Da er X 1 (X 1+X ) ( x; r, 0,03/ ). P( X r > 0,05) P ( X r 0,03/ > 0,05 ) 0,03/ P(Z >,357) 0,009. For de som tolket avviket som absoluttverdi (som også er rimelig) ( P( X X r r > 0,05) P 0,03/ > 0,05 ) 0,03/ P( Z >,357) 0,0184. b) X 1, X,...,X 5 er uif (x; 0,15, σ). De beste (mest effektive) forvetigsrette estimatore er σ 1 5 5 (X i 0,15). Dette er sasylighetsmaksimerigsestimatore. (NB: µ 0,15 er kjet!) Vi har at σ σ 5 ( ) 5 σ σ Xi 0,15 σ 5 Zi V 5 χ 5. Uttrykket er kji-kvadratfordelt ( chi-square ) med 5 frihetsgrader. ( ) 5 σ E E(V σ 5 ) 5 dvs ( ) 5 σ Var Var(V 5 ) 5 10 dvs σ 5 σ E( σ ) 5, og dermed E( σ ) σ. 5 σ 4 Var( σ ) 10, og dermed Var( σ ) 0,4σ 4. 1
95%-kofidesitervall for σ : P(χ 5,0,975 < V 5 < χ 5,0,05) 0,95. ) P (χ 5,0,975 < 5 σ σ < χ 5,0,05 0,95, ( ) 5 σ P < σ < 5 σ 0,95. χ 5,0,75 χ 5,0,975 Med σ 0,0177, χ 5,0,05 1,833 og χ 5,0,975 0,831 blir kofidesitervallet for σ [0,0001, 0,00188]. Det tilsvarer kofidesitervall for σ: [0,0110, 0,0434]. OPPGAVE a) A M B K Figur 1: Ve-diagram for hedelsee M, K, A og B. Merk at M og K deler utfallsrommet i to disjukte deler, mes A og B delvis overlapper M, K og hveradre. A B er vertikalt skravert. Vi beytter at vi summerer sasylighet for disjukte hedelser, og at sittee ka skrives ut med betiget sasylighet. P(A K) P(A K)P(K) 0,440 418 63 0,910, 30% av respoetee var kvier som hadde utøvd psykologisk aggresjo mot partere. P(A) P(A M)+P(A K) P(A M)P(M)+P(A K)P(K) 0,7 14 63 0,091 + 0,910 0,3831, +0,440 418 63 38% av respodetee hadde utøvd psykologisk aggresjo mot partere, dvs år vi også ikluderer meee. b) For P(K A) bruker vi egetlig Bayes formel, me beregige over gir oss tallee vi
treger direkte. P(K A) P(K A) P(A) ( ) P(A K)P(K) 0,910 P(A M)P(M) + P(A K)P(K) 0,3831 0,7596. Sasylighete for at skjemaet er fylt ut av e kvie er hele 76%. Dette skyldes dels at flere kvier e me svarte på udersøkelse, dels at større adel kvier e me rapporterte A. For P(A B) bruker vi igje Bayes formel, og bruker at B (A B) (A B). P(A B) P(A B K) + P(A B M) P(A B) P(B) P(B K)P(K) + P(B M)P(M) P(A B K)P(K) + P(A B M)P(M) [P(A B K) + P(A B K)]P(K) + [P(A B M) + P(A B M)]P(M) 0,9 0,6614 + 0,16 0,3386 [0,9 + 0,148] 0,6614 + [0,16 + 0,056] 0,3386 0,6950. Evetuelt ka e selvfølgelig rege ut P(B K) P(A B K) + P(A B K) osv. først, eller til og med rege ut atall persoer i hver kategori og løse oppgave derfra. 70% av respodetee som har opplevd psykologisk aggresjo fra partere, har selv også utøvd psykologisk aggresjo, de resterede 30% er kaskje mer uskyldige offer? c) Hedelse X er biomisk fordelt hvis: hvert skjema ka karakteriseres som suksess (S) eller fiasko (S ) - ige tvilstilfeller, det er et fiksert atall 418 skjema i udersøkelse, hvor suksessee telles i X, sasylighete for S, P(S K) er de samme for hvert skjema fylt ut av e kvie; vi ka altså ikke på forhåd dele buke i skjema hvor vi tror det er mage S og skjema med få S, besvarelsee er uavhegige; respodetee har ikke påvirket hveradre. Dette er rimelige atakelser, så vi bruker biomisk fordelig for X (og Y ). Hvis adele x/ fra udersøkelse gjelder hele populasjoe (av kvielige studeter i heterogee parforhold), er p X x/ 38/418. Die fem veier atas trukket tilfeldig med biomisk fordelig som over, med p P(S K) 38/418 0,0909. (Altså, ca. 1 av 10 har opplevd seksuell aggresjo fra parter.) 5 gir puktsasylighete ( ) 5 P(X 1) 1 P(X 0) 1 p 0 (1 p) 5 0 1 (1 0,0909) 5 0,3790 38%. 0 d) Vi ka tilærme biomisk til ormal hvis p X > 5 og (1 p X ) > 5 og tilsvarede mp Y > 5 og m(1 p Y ) > 5. De miste av disse ser ut til å være mp Y, me m p Y 10 er stor ok. 3
Var( p X ) Var(X/) Var(X)/ p X (1 p X )/ p X (1 p X )/. Var( p Y ) Var(Y/m) Var(Y )/m mp Y (1 p Y )/m p Y (1 p Y )/m. Evetuelt ka e legge til at vi har et gjeomsitt av idikatorvariabler, og at setralgreseteoremet gir at X p X N(0, 1) år og tilsvarede for p Y og m. bp px (1 p X )/ E rimelig estimator for adele S hvis H 0 er sa er p X+Y setter vi i p p X p Y p 0,0759 i variasuttrykkee. +m 38+10 63 0,0759. Dermed Med H 0 : p X p Y og H 1 : p X p Y har vi e tosidig hypotesetest. Testobservatore er p X p Y, som uder H 0 har forvetigsverdi p X p Y 0 og varias σ p X (1 p X )/+ p Y (1 p Y )/m p(1 p)(1/+1/m) 0,03. Vi aksepterer H 0 hvis observatore haver mellom z α/ σ og z α/ σ. Med α 0,05 blir akseptområdet p X p Y < 1,645 0,03 0,0366. Vi har p X p Y 38/418 10/14 0,044, som er utefor akseptområdet. Dermed forkastes H 0 på sigifikasivå 0.05, og vi er eige med rapporte. (Det er gru til å tro at flere kvier opplever seksuell aggresjo fra si malige parter e motsatt.) Vi har altså fått z obs bp X bp Y 1,9841. Arealet over dee verdie i stadard 0,03 ormalfordelige er halvparte av p-verdie, side vi har e tosidig test. σ 0,044 P-verdi P(Z > 1,9841) P(Z < 1,9841) 0,039+0,033 0,047 4,7%. Bruk av σ p X (1 p X )/ + p Y (1 p Y )/m gir omtret samme resultat. Merk at dette er e dårligere approksimasjo av σ uder H 0. OPPGAVE 3 a) f α x Figur : Skisse av sasylighetstetthete f(x; α, β). Sasylighetsmaksimerig for β følger ormal prosedyre, me e bør huske at x i α for 4
alle x i. { 0, hvis mist é x i < α, L(α, β; x 1,...,x ) 1 β e (xi α)/β, ellers. Λ(α, β; x 1,...,x ) l(β) Λ β β + x i α β. x i α, år alle x i α. β Λ 0 for β β og stokastiske variabler for måligee x β i gir β 1 (X i α) X α, hvor X er gjeomsittet X 1 X i. b) L x mi α Figur 3: Skisse av likelihoodfuksjoe som fuksjo av α. Vi vet at α > 0 fra oppgave, fuksjoe vokser ekspoesielt i starte, og at de blir ull hvis α er større e grese defiert av miste X-verdi. Poeget er at fuksjoe ikke er deriverbar mhp α i toppuktet, så vi ka ikke derivere og sette lik ull som før. Oppgave krever ikke at dee figure er med. Vi skal altså fie e α som maksimerer { 0, hvis mist é xi < α, L(α, β; x 1,...,x ) ( ) [ P ] exp x i α, ellers. 1 β Det er klart at vi må velge α mi(x i ), ellers er L 0 fra de første lija i de delte forskrifte. De adre lija blir størst hvis α er så stor som mulig. Derfor maksimeres L av α mi(x 1,...,X ). 5 β
Sasylighetsmaksimerigsestimatore for β har vi fra forrige oppgave. Side α er ukjet må vi prøve β X α. For å fie forvetigsverdie til α, brukes trasformasjoe Z i X i α. Dette skyver fordelige itil adreakse, slik at vi får e stadard ekspoesialfordelig med parameter β. Hitet sier at mi(z 1,...,Z ) har forvetigsverdi β/. De miste X-verdie er α større e de miste Z-verdie, side X i Z i + α også for de i-e som gir mist X i. Dermed er E( α) α + β/, og ikke forvetigsrett. Forvetigsverdie til X er α + β, det er jo bare e valig ekspoesialfordelig med forvetig β som er flyttet α til høyre på x-akse. Forvetigsverdie til X er E( X) 1 E(X i) E(X i ) α + β. Hvis vi bytter ut α med α i uttrykket for estimatore, blir forvetigsverdie E( β) E( X) E( α) α + β E( α) β(1 + 1 ) + 1 β. Dee er heller ikke forvetigsrett. Her ka vi fikse estimatore for β ved å gage med /(+1), og deretter justere estimatore for α. Vi vil demostrere e ae framgagsmåte (som gir samme resultat). Trekk fra β/ i estimatore for α. Da blir α forvetigsrett hvis β er forvetigsrett. Til samme har vi da to likiger som gjelder for forvetigsrette estimatorer: α mi(x 1,...,X ) β, β X α. Dette likigssystemet ka løses, og vi eder opp med α β 1 mi(x 1,..., X ) 1 1 X, 1 ( X mi(x 1,..., X )) 1 1 X i 1 mi(x 1,...,X ). Til slutt bør vi forsikre oss om at metode over faktisk gir forvetigsrette estimatorer: E( α) 1 E(mi(X 1,...,X )) 1 E( X) 1 1 (α + β ) 1 (α + β) α, 1 E( β) 1 1 E(X i ) 1 E(mi(X 1,...,X )) 1 (α + β) 1 1 (α + β ) β. 6