Forelesg 0 + Yushu.@ub.o Kofdes tervall og Bootstrap. Kofdes tervall for ) Kofdes tervall [ ˆ, ˆ ] dekker de ukjete parametere med høy grad av skkerhet (kofdesvå): P( ˆ ˆ ), er f.eks 0.0 eller 0.05, eller 0.0 a. er determstsk verd (ukjet), ˆ og ˆ er stokastske varabler som er fuksjoer av (,, 3, ) b. [ ˆ, ˆ () () ] har tervallverder [ ˆ, ˆ () () ], [ ˆ, ˆ ( ) ( ) ] ˆ m [, ˆ m ] år v har stkkprøver ( x, x,..., x ); ( x, x,..., x ),...,( x, x,..., x ). () () () () () () ( m) ( m) ( m) Kofdesvået ka tolkes som adel av dsse m tervallverdee skal dekke c. Jo skrere du treger å være på at tervallet eholder parametere, jo bredere blr tervallet! ( mdre, bredere tervallet) ) To sder tervall og e sde tervall (kofdesvået er :) a. To sder tervall : v har både edre grese ˆ og øvre grese ˆ tervallet [ ˆ, ˆ ] slk at P( ˆ ˆ ) b. E sde tervall: v har bare edre grese ˆ tervallet [ ˆ, ] slk at P( ˆ ), eller øvre grese ˆ tervallet [, ˆ ] slk at P( ˆ ). Kofdes tervall for varas ) Kofdes tervall for varas Kj-kvadratkrtsk verd (ch-squared crtcal value),v er e verd slk at P ( ) år, v () v : Fgure.,v : e sde tervall (a), to sder tervall (b)
Yushu.@ub.o Eks.,, 3, er uavhegge stokastske varabler fra N(, ),... : N(, ). V kjeer verke eller e sde (øvre grese) og to sder kofdes tervaller for. F både Ht: I ka 6, seksjo 4, har v. ( ) ( ) ( ) ( ), Eks. Fskeoppdretter A har et stort atall laks et basseg. Ha vl estmere varas A tl vekter av laks for å se om vektee varer mye. Ha tar opp 0 laks og veer dsse, verder er (00 gram): 4.46, 3.74, 4.88, 3.67, 4.75, 3.76, 3.88, 4.66, 4.56, 4.68 Vektee tl laks atas å være uavhegge og detske fordelte stokastske varabler med samme forvetg og varas. F 95% to sder kofdes tervallet for grese. A ; f 90% e sde kofdes tervallet for A med e øvre øsg: V har = 0, s =0.36. Med 0-=9 frhetsgrader, 0.05,9 = 9.0, 0.975,9 =.700, 0.9,9 = 4.68 95% to sder tervallet, 0.05 : ( ) s ( ) s [, ] [0.0, 0.77] /, /, 90% e sder kofdes tervallet, 0.: ( ) s [0, ] =[0, 0.500], V ser at legde tl 95% tervallet er 0.77-0.0=0.66, og de er legre e legde tl 90% tervallet som er 0.500
Yushu.@ub.o 3. Bootstrap og bootstrap kofdes tervall ) Itroduksjo tl bootstrap Httl er det sasylghetsregg og statstsk feres utført med gtt dstrbusjo Fx ( ) (ormal fordelg, uform fordelg, beta fordelg ). I mage stuasjoer er fordelge Fx ( ) kke spesfsert, mes stkkprøve (samples) x ( x,..., x ) er de eeste formasjo som er tlgjegelg. Bootstrap mdlertd behadler det observerte stkkprøve x ( x,..., x ) som «populasjo» og de emprske fordelgsfuksjoe (edcf) F ( x )(samplgsfordelg) fra x ( x,..., x ) er e estmator av Fx ( ) (populasjosfordelg). * Prsppet om Bootstrap: behadler de observerte stkkprøve x ( x,..., x ) som populasjo, og få bootstrap stkkprøver * * * x ( x,..., x ) ved resamplg med erstatg fra x ( x,..., x ). V gjetar resamplg B gager, da ka v få B bootstrap stkkprøver x ( x,..., x ),..., x ( x,..., x ), da ka v ()* ()* ()* ( B)* ( B)* ( B)* bruke dsse B bootstrap stkkprøvee for vdere feres. F.eks, v ka bruke bootstrap metode for å udersøke bas og stadardfel av estmatore ˆ ˆ(,..., ), selv om v har bare e stkkprøve x ( x,..., x ) Eks 3. Resamplg med erstatg hvs v får e stkkprøve fra N(0,): x ( x,..., x ) (0.09 0.3 0.08 0.60.57.63.06.3.88 0.93), da ved bruk av sample(x, replace = TRE) fuksjo fra R, ka v få mage bootstrap stkkprøver, for eksempel: x ( x,..., x ) (0.09 0.3 0.08 0.60.57.63.06.3.88 0.93) ()* ()* ()* x ( x,..., x ) ( 0.08 0.60 0.3.3.88 0.08.57 0.09.06.88) ()* ()* ()* x ( x,..., x ) ( 0.60 0.3.3.63 0.08 0.3 0.60 0.60 0.93 0.60) (3)* (3)* (3)* Eks 4. Bootstrap estmerg for bas av estmatore ˆ ( Bas( ˆ ) E( ˆ ) ), år v har e stkkprøve x ( x,..., x )
Yushu.@ub.o ) Bootstrap estmerg for stadardfel av estmatore ˆ : ˆ Var( ˆ ) I Eks på ka 8, ka v ha e matematsk form av stadardfel tl estmator ˆ : ˆ / (,..., N(, ), ˆ er e forvetgsrett estmator for ), me mage tlfeller, har v kke matematsk form av. F.eks. hvs er ˆ Eks, da e forvetgsrett estmator for er ˆ ( ), me det er kke lett å fe matematkk form av Var( ) eller stadardfel for estmatore. Eks 5. Bootstrap estmerg for stadardfel av e estmator ˆ, år v har e stkkprøve x ( x,..., x ) * B = 50 er valgvs stor ok, og sjelde er B > 00 ødvedg. (Mye større B tregs for kofdestervall estmerg.) Eks 6. V har følgede datasett AT (poegsum på jusstudet opptaksprøve) og GPA (poegsum på bachelor vås prøver) 5 jusskoler (sample), som er tlfeldg utvalg fra 80 jusskoler (populasjo). AT 576 635 558 578 666 580 555 66 65 605 653 575 545 57 594 GPA 339 330 8 303 344 307 300 343 336 33 3 74 76 88 96 a beteg AT jusskoler og Y betege GPA. V har teresse på populasjoskorrelasjo (korrelasjo mellom AT og GPA-score) Y cov( Y, ), og v ka bruke samplgskorrelasjo Y ˆ Y 5 ( )( Y Y ) ˆ ˆ Y ( ˆ og ˆY er mometestmatorer tl og Y ) som estmatore for Y.
Yushu.@ub.o a. Basert på de stkkprøve ovefor, er estmatorsverde av ˆ Y er ˆ xy = 0.776 b. Når B =50, basert på 50 bootstrap stkkprøver, ka få 50 bootstrap estmators verder ˆ ( ˆ,..., ˆ ) og hstogram tl * () (50) xy xy xy * ˆxy : c. Basert på ˆ ( ˆ,..., ˆ ) fra b., ka v få boostrap estmerg av bas for * () (50) xy xy xy : bas( ˆ Y ) 0.0006 ˆ Y d. Basert på ˆ ( ˆ,..., ˆ ) fra b., ka v få bootstrap estmerg av * () (50) xy xy xy stadardfele for ˆ Y : seˆ boot ˆ 0.53 Y 3) Bootstrap kofdestervall for parameter θ, år v har bare e stkkprøve x ( x,..., x ) 4.) The stadard ormal bootstrap kofdestervall For parameter θ, ˆ ˆ(,,..., ) er forvetgsrett estmator med stadardfele, Z statstkk: ˆ verd som: P( Z z ), da har v: ˆ E( ˆ ) ˆ Z N(0,). a z være krtsk / / / ˆ / ˆ ˆ ˆ P( z z ) P( z ˆ z ˆ ). Når v har e stkkprøve x ( x,..., x ), erstatte v ˆ med ˆ ˆ(,,..., ) x x x og v erstatter med bootstrap estmerg av stadardfel ( se ˆ ˆ ˆboot ˆ v få bootstrap kofdes tervallet [ z se ˆ ˆ ˆ ˆ, z se ˆ ˆ ] / boot / boot ˆ ) fra Eks. 5, da ka
Yushu.@ub.o Dette tervallet er lett å berege, me v har to forutsetger: a. Fordelg av ˆ er ormal b. er stor 4.) De prosetl (persetle) bootstrap kofdestervall Bootstrap prosetl tervall bruker de emprske fordelge av bootstrap resamplg som referase fordelg. De prosetlee av de emprske fordelge er estmatorer av prosetler av fordelge av ˆ. Eks 7. Her er et tlfeldg utvalg av 30 observerte tps proseter på e restaurat:.7, 6.3, 3.6, 6.8, 9.9, 5.9, 4.0, 5.0, 4., 8.,.8, 7.6, 6.4, 6., 9.0, 3.5, 8.9, 0., 9.7, 8., 5.4, 5.7, 9.0,.5, 8.4, 6.0, 6.9,.0, 40., 9. V øsker å få et kofdestervall for populasjo tps proset på dee restaurate. Dette er mdlertd kke e stor stkkprøve, og det er et problem med postv skjevhet samplgsfordelg også *Abefalt hjem lesg (homereadg): sdee 44-45 «a refed terval»