STK00 våre 07 Estmerg Svarer tl sdee 33-339 læreboka Poltsk megsmålg Sør et tlfeldg utvalg å 000 ersoer hva de vlle ha stemt hvs det hadde vært valg 305 vlle ha stemt A A's oslutg er Ørulf Borga Matematsk sttutt Uverstetet Oslo 305 000 0.305 Hvor skkert er dette aslaget? Målg av lugefuksjo The Germa tak roblem Et mål å lugefuksjo er FEV (forced exratory volume secod). I e stude Hordalad å 990-tallet ble FEV målt for 64 kke-røykede, frske me alder 30-34 år Hvorda ka v bruke formasjoe tl å fastlegge et «ormalområde» for FEV for me alder 30-34 år? (I rakss vl e så ta hesy tl høyde BMI, me det ser v bort fra her) Uder adre verdeskrg brukte de allerte (blat aet) sereumree for tyske taks tl å aslå hvor mage taks tyskeree hadde hvor stor roduksjoe var for ulke måeder. 3 Hvorda ka sereumree g dee formasjoe? 4
Statstske modeller Felles for de tre stuasjoee er at v har data x, x,..., x for eheter: For megsmålge er x hvs erso ummer vlle ha stemt A, 0 ellers For målgee av lugefuksjo er x FEV målge for erso ummer For taksee er x sereummeret for de -te takse de allerte fkk formasjo om x På grulag av utvalget, dvs. de observerte x -ee, øsker v å få kuska om de oulasjoe observasjoee kommer fra V må da ha e modell som agr hvorda de observerte -ee framkommer fra oulasjoe x V vl ata at x, x,..., x er observerte verder av stokastske varable,,..., at v kjeer fordelge tl de stokastske varablee (med utak av e eller flere arametere) 5 6 For megsmålge vl v ata at,,..., er uavhegge Beroull-fordelte, dvs P( ) P( 0) For målgee av lugefuksjo vl v ata at,,..., er uavhegge N( µσ, ) - fordelte For taksee vl v ata at,,..., er et tlfeldg utvalg (ute tlbakeleggg) blat tallee,,..., N I alle de tre tlfellee øsker v å aslå verde av e eller flere ukjete arametere, dvs, µ, σ N 7 Geerelt vl v ata at x, x,..., x er observerte verder av stokastske varable,,..., at -ee har e fordelg som avheger av e arameter θ (det ka være flere arametere, me v vl fokusere å e om gage) V vl aslå verde tl θ (eller estmere verde som det heter å «statstkersråket») å grulag av observasjoee våre Tl det bruker v e estmator θ ˆ θ ˆ(,,..., ) På grulag av de observerte x -ee, får v estmatet θ ˆ θ ˆ( x, x,..., x ) 8
Beroull varabler Bomsk fordelg Ata at,,..., er uavhegge Beroullfordelte, dvs P( ) P( 0) Da er Y bomsk(, ) E aturlg estmator for er ˆ Y For megsmålge har v 000 v observerte y 305 V får dermed estmatet y 305 ˆ 0.305 000 E ae estmator for er Y+ * + 4 For megsmålge gr dee estmatet y+ 307 * 0.306 + 4 004 Det er lte forskjell å ˆ * her. Forskjelle er større år er mdre y er ær 0 eller Hvorda ka v avgjøre hvlke estmator som er best? 9 0 Mea square error (MSE) V ser å de geerelle stuasjoe der,,..., har e fordelg som avheger av e arameter θ V øsker at estmatore θ ˆ θ ˆ(,,..., ) skal være ær θ Kokret øsker v at MSE( θˆ ) E[( θˆ θ ) ] skal være så lte som mulg Se å stuasjoe der V har estmatoree Y bomsk(, ) ˆ Y Her er (detaljer å forelesge) ( ) MSE( ˆ ) * Y+ + 4 ( ) / 4 / MSE( *) + + 8 + 6 / + 4 / Merk at (detaljer å forelesge) MSE( θˆ ) V ( θˆ ) + [ E( θˆ ) θ] varas + (skjevhet)
MSE for ˆ («usual») * («alteratve») Forvetgsrette estmatorer V ser å de geerelle stuasjoe med e estmator θ ˆ θ ˆ(,,..., ) for θ Hvs E( θˆ ) θ for alle mulge verder av θ, ser v at ˆθ er forvetgsrett (egelsk: ubased) 0 00 For e forvetgsrett estmator er skjevhete E( θˆ ) θ lk 0, det følger at MSE( θˆ ) V ( θˆ ) For de bomske stuasjoe er ˆ Y e forvetgsrett estmator for 3 4 Uavhegge detsk fordelte varabler Ata at,,..., er uavhegge detsk fordelte (u..f.) med forvetg µ varas σ Da er ˆµ Vdere er (detaljer å forelesge) ( ) S e forvetgsrett estmator for Dsse estmatoree er seselt aktuelle for ormalfordelte data (for adre fordelge ka det være at adre estmatorer er bedre) e forvetgsrett estmator for µ For FEV-målgee var x 4.48 s s 0.60 σ V ( µ ˆ) V ( ) 5 FEV-målger for 30-34 år gamle kke-røykede, frkse me er (ca.) ormalfordelt med forvetgsverd 4.48 lter stadardavvk 0.60 lter 6
Uform dskret fordelg Ata at,,..., er et tlfeldg utvalg ute tlbakeleggg blat tallee,,..., N, der N er ukjet (jf. «the Germa tak roblem») Ved å bruke dee formele (samme med dverse ae formasjo) kue de allerte aslå størrelse av de tyske roduksjoe av taks ulke måeder ( å ulke steder): V vl fe e forvetgsrett estmator for N La ( ) max være det største tallet v observerer Da er (detaljer å forelesge) ( N+ ) E ( ) + e forvetgsrett estmator for N er ˆ + N ( ) 7 Ruggles & Brode (947). A Emrcal Aroach to Ecoomc Itellgece World War II. Joural of the Amerca Statstcal Assocato, Vol. 4,.7-9 8