Stoastis forsø el. esperimet Iførig i medisis statisti KLH3 - Høst 9 Kapittel. Stoastis variabel og Disret sasylighetsfordelig Et ret teis begrep for e prosess der hesite er å framsaffe data om hedelser der utfallet a variere og ie forutsies med sierhet. Hvile muligheter som foreligger, er imidlertid jet. Noe esempler på stoastise forsø: a) Kast med pegestye. Registrerer resultat (utfall) som Kroeside opp eller Mytside opp. b) Kast med e treig. Registrerer resultat (utfall) som atall øye som terige viser. c) Kast med et pegestye itil resultatet Kroe opptrer første gag. Noterer atall ast (utfall) i astserie. d) Sydom. Registrerer resultat (utfall) som Fris, Krois sy eller Død. Harald Johse, aug. 9 Felles for a, b, c og d: I hvert eelt tilfelle a vi ie forutsi hva utfallet av esperimetet blir. Me det a agis e megde (utfallsrommet) av mulige eelutfall sli at hvert eelt forsø gir som resultat ett og bare ett av resultatee i megde. For esempel i ast med é terig vet vi på forhåd at utfallet må bli ett og bare ett av tallee,, 3,,6 der tallet beteger atall øye opp. I hvert tilfelle a e, i alle fall tee seg, at et esperimetet a gjetas uder samme betigelser så mage gager e øser, og det er i tillegg uderlagt statistis regelmessighet. Utfallsrom, eeltutfall og hedelse Megde av alle eeltutfall (eg.: elemetary outcomes) i et (stoastis) forsø alles utfallsrommet (eg.: sample space) og beteges valigvis med S. Eeltutfallee blir derfor elemeter utfallsrommet. I esemplee ovefor blir utfallsrommee: a) S = {Kro, Myt} b) S = {,, 3,, 5, 6} Statistis regelmessighet Ata et stoastis forsø, for esempel ast med mytstye, der A er hedelse ro opp. Mytstyet astes gager og atall gager som resulterer i ro, alles A. Det viser seg erfarigsmessig at de relative hyppighet av A, A /, har e tedes til å stabilisere seg i ærhete av et bestemt tall p år gjøres større, og i e y forsøsserie vil erfarigsmessig A / igje stabilisere seg rudt p. De relative hyppighete av A er et aslag (estimat) for sasylighete for ro i et ast, og det er opplagt at A. c) S = {,, 3,, 5, 6, 7, 8,.} d) S = {Fris, Krois sy, Død} Mer at elemeter i et utfallsrom a være e målbar størrelse uttry som tall, eller være valitative som for esempel utfallet av e sydom. 3
Utfallsrom disret eller otiuerlig I esemplee a, b og d består utfallsrommet av edelig mage elemeter. I esempel c består utfallsrommet av uedelig, me ummererbart atall elemeter. Alle situasjoee ovefor er esempler på disrete utfallsrom. Dersom utfallsrommet består av uedelige mage elemeter som ie lar seg ummerere, sies det å være otiuerlig. Dette er tilfelle år vi har å gjøre med e otiuerlig målesala som f. es. høyde, vet osv. Hedelse E hedelse (eg.:: evet) består av ett eller flere av elemetee i utfallsrommet og tilfredsstiller et eller aet riterium. F. es. a det være av iteresse å registrere hvor vidt mist øye opptrer i et terigast. Her blir hedelse megde A={, 5, 6}, m.a.o. e udermegde av utfallsrommet S. Hedelse A itrer år terige viser, 5 eller 6 øye. I tifeller der utfallsrommet er edelig, vil ehver udermegde av utfallsrommet ue utgjøre e hedelse. Stoastis variabel Forelet sagt er e stoastis variabel, (stor) X, er e fusjo av utfallet e i et esperimet. For hvert utfall har X(e) e bestemt, umeris verdi. dvs. et tall. X a godt ha samme verdi for ulie utfall, me u é verdi for hvert eelt utfall. Esempel: Kast med myt to gager. Esempelvis vil eeltutfallet KM bety Kro i. ast og Myt i adre ast osv. Utfallsrommet blir da S = {KK, KM, MK, MM} med eeltutfallee e = KK, e = KM, e 3 =MK og e = MM. Dersom atall Kro er hedelse av iteresse, får vi: X(e )=, X(e )=, X(e 3 )=, X(e )= Valigvis sløyfes argumetet e i uttryet for e stoastis variabel. I esemplet overfor a X da defieres sli:, e= MM X =, e = MK eller KM, e= KK 5 6 Disret stoastis variabel Kotiuerlig stoastis variabel (mer om dette i Kap. 5) E stoastis variabel med mulige verdier som ie a ummereres, alles e otiuerlig stoastis variabel. Syoym: Målevariabel, salavariabel Noe egesaper til otiuerlig stoastis variabel: Sasylighete for å ita e bestemt verdi er ull. E stoastis variabel som bare a ata et edelig atall verdier, eller høyst et ummerert atall verdier, alles e disret stoastis variabel. Syoym: Tellevariabel Noe egesaper: Variabele a evetuelt ha uedelig mage verdier, me de må ue ordes i e seves og telles. Sasylighete for e eelte verdier er gitt av e putsasylighet Sasyligheter uttryes over itervall av eeltverdier ved hjelp av e sasylighetstetthet. 7 8
Sasylighetsfordelig for disret stoastis variabel - putsasylighet Verdiee som e disret variabel a ata og tilhørede sasylighet a uttryes ved hjelp av e Sasylighetsfordelig esempel Es.6: Sasylighetsfordelig for atall som blir ormotesive av hypertoiere som har fått blodtrysseede mediamet Putsasylighet (probability mass fuctio) Sasylighetsfordelige utryes som P(X=x), der x beteger de mulige verdier for X. Kast med rettferdig terig, x =,, 3,, 6. Sasylighete er de samme for alle utfall (uiform fordelig) x 3 P(X=x).8.76.65.. Mer at sasylighete for e bestemt verdi alltid ligger mellom og og at summe av sasylighetee for alle mulige verdier av X alltid er li. x 3 5 6 P(X=x) /6 /6 /6 /6 /6 /6 9.5. Sasylighetsfordelig Forvetigsverdi for disret stoastis variabel Et mål for tygdeputet i sasylighetsfordelige Bereges som et veid gjeomsitt av hver eelt verdi x i av de stoastise variabele. Vetee er sasylighete for de eelte verdier de stoastise variabele a ha. Pr(X=r).3. μ= E[ X] = x P( X = x ) + x P( X = x ) +... + x P( X = x ) = x P( X = x ) i i i=.. 3 Atall ormotesive etter behadlig Spesialtilfelle: Ved uiform sasylighetsfordelig, dvs. sasylighete er de samme for alle verdier av X, er forvetige li de aritmetise middelverdi av de mulige verdier av X. NB: På egels a mea bety både middelverdi (mea value) og forvetig (expected value), alt etter meigssammehege. På ors sjeler vi mellom disse to begrepee, og de er ie idetise.
Forvetigsverdi - esempel Kast med terig, X er mulige atall øye, x er realiserige av X. x 3 5 6 P( X =x) /6 /6 /6 /6 /6 /6 6 EX [ ] = xpx ( = x) x= = P( X = ) + P( X = ) + 3 P( X = 3) + P( X = ) + 5 P( X = 5) + 6 P( X = 6) = + + 3 + + 5 + 6 = = 35. 6 6 6 6 6 6 6 Forvetige tilsvarer gjeomsittet av øye ved (uedelig) mage terigast. Mer som her at forvetigsverdie ie ødvedigvis tilhører utfallsrommet for det eelte forsø. Forvetigsverdi - esempel EKS.9; Forvetigsverdie for X= atall ormotesive etter blodtrysbehadlig av hypertoiere x 3 P(X=x).8.76.65.. μ= EX [ ] = xpx ( = x) x= = P( X = ) + P( X = ) + P( X = ) + 3 P( X = 3) + P( X = ) =. 8 +. 76 +. 65 + 3. +. =. 8 Mer at dette er populasjosforvetige. De er reget ut ute å gjøre oe forsø og observere oe tig som helst. 3 Varias for disret stoastis variabel Variase Var(X) er et mål på spredige av de uderliggede data rudt forvetigsverdie σ = Var( X) = ( x μ) P( X = x ) i= Mer av variase er forvetige til ( X μ) Var( X ) = E ( X μ ) = E( X μ X +μ ) = E( X ) μ E( X) +μ = E( X ) μ +μ i ( ) = E( X ) μ = E( X ) E( X) Fordi variase alltid er ie-egativ, følger også at EX ( ) EX ( ) ( ) i og a derfor også uttryes som Varias - esempel EKS.9: Variase til X = atall ormotesive etter blodtrysbehadlig av hypertoiere x 3 P(X=x).8.76.65.. EX ( ) =μ= 8. Var( X ) = ( x μ) P( X = x) = E( X ) μ x= = P( X = ) + P( X = ) + P( X = ) + 3 P( X = 3) + P( X = ) 8. =. 76 +. 65 + 3. +.. 8 =. 835 5 6
Stadardavvi Forvetige har samme målesala (dimesjo) som de stoastise variable har, f.es. m (meter). Variase er imidlertid et vadratis uttry og får i dette tilfellet dimesjoe m. De positive rote til variase får imidlertid samme dimesjo som forvetige og alles stadardavviet: Esempel.9 (hypertoiere): SD( X ) + Var( X) =+ σ =σ Var( X ) =. 835 SD( X ) =. 835 =. 9 Mer at i lihet med varias er også stadardavvi e ie-egativ størrelse. Det er derfor meigsløst å oppgi stadardavviet som for esempel ±. 9. Sasylighetsfordelig og frevesfordelig Esempel.8: Sammeliig av teoretis sasylighetsfordelig med frevesfordelig fra utvalgsforsø. Utfall er atall hypertoiere som blir ormotesive. Forsøet er basert på leger som hver behadler hypertoiere Her blir forvetige i utvalget (estimert forvetig) basert på observasjoer: x= Atall hypertoiere uder otroll, x Sasylighetsfordelig P(X=x) Frevesfordelig (observert).8. =/.76.9 =9/.65. =/ 3..8 =8/..9 =9/ xp( X = x) = P( X = ) + P( X = ) + P( X = ) + 3 P( X = 3) + P( X = ) = + 9. +. + 3 8. + 9. = 77. 7 8 Sammeliig av teoretis sasylighetsfordelig og observert frevesfordelig.5. Litt ombiatori Har to grupper (megder), I og II med heholdsvis og elemeter: I:{ a, a, a3,..., a } II :{ b, b, b3,..., b } Hvor mage ulie par a daes med ett elemet fra hver gruppe? Svar: Ifører er tredje gruppe III :{ c, c, c3,..., c 3} Ka da dae 3 tripler med ett elemet fra hver gruppe. Sasylighet.3.. Kombiatorisetig: Ved ombiasjo av ett elemet fra hver av r grupper a det daes 3... r r-tupler der i er atall elemeter i i -te gruppe. To esempler: ) E afeteria tilbyr e 3 rettes middag med adgag til å velge é forrett blat 3, é hovedrett blat 6, samt é dessert blat. Atall mulige middager blir da 36 = 7. ) Tippig i fotball. amper, hver med 3 mulige utfall. Atall mulige måter å fylle ut e tipperee på blir 3 3... 3 = 3 = 53. Freves-fordelig. 9 3 Sas.fordelig Atall hypertesive uder otroll
Ordet utvalg I det følgede sal vi alltid foreta utvelgig fra e edelig megde (populasjo) av elemeter som vi beteger {a, a, a 3,,a }. Defiisjo: E hvile som helst ordet seves av elemeter fra populasjoe alles et ordet utvalg av størrelse. Et utvalg av størrelse 3 a for esempel være {a, a 5, a 7 } (forutsatt 7). I prisipp a vi tee oss at ett og ett elemet velges i gage. For å ue avgjøre hvor mage ordede utvalg som er mulige av totalt elemeter må vi først presisere om utvelgelse sjer med eller ute tilbaeleggig av elemetet etter hver treig. Noe regler fra ombiatorie Vi teer oss e ure (bos) med uler ummerert fra til. Så trees s uler é og é ad gage. Ordet utvalg med tilbaeleggig Regel : Når uler trees med tilbaeleggig fra e bos med uler, vil atall ordede utvalg være. Ved første treig er det muligheter. Kule legges tilbae, og i este treig er det igje muligheter osv. Dette gjøres gager. Spesielt a samme ule trees flere gager. Det totale atall ombiasjoer av merede uler blir da... =. Esempel: I det iterasjoale alfabet (A, B, C,,Z) er det 6 bostaver. Til et bilummer med bostaver a det daes 6 = 676 bostavpar dersom e tillater samme bostav å opptre begge gagee. Ordet utvalg ute tilbaeleggig Regel : Når uler trees ute tilbaeleggig fra e bos med uler, vil atall ordede utvalg være ( )( )... ( + ). Ved første treig er det muligheter, ved este (-) muligheter og deretter (-) osv. Etter est siste treig ligger (-(-)) uler igje i bose, og atall muligheter i siste (de -te) treig blir (-(-))=(-+). Det totale atall ordede ombiasjoer av merede uler blir da P ( )... ( + ). Esempel: Fra det iterasjoale alfabet a det daes e bostavode beståede av ulie bostaver på P = 6( 6 )... ( 6 + ) = 6 5 3 = 3588 måter. 6 E oseves av Regel er at dersom alle uler, dvs. =, trees ut ute tilbaeleggig, a disse ulee ordes (permuteres) på P = ( )( )... 3 forsjellige måter. Uttryet ( )( )... 3 srives! og leses faultet. (Vi defierer!=). Dette gir: Regel 3: Atall permutasjoer av uler er! Ie-ordet utvalg Dersom uler trees fra uler ute tilbaeleggig, fis det P = ( )( )... ( + ) ordede utvalg på uler. Disse ulee a etterpå permuteres! gager, me ulee er de samme. Hvis vi ie er iteresserte i ordige av ulee, me bare hvile uler som trees ut (sli som i Lotto), blir problemstillige hvor mage ie-ordede utvalg som a foreomme. Vi aller dette atallet C. Hvert ieordet utvalg a permuteres! gager, og vi får lihete P = C! Dette gir P ( )( ) ( + ) C = =!! 3
( )( ) ( + ) ( )!! = = =! ( )!!( )! Uttryet, biomialoeffisiee, leses over og må ie forvesles med. Regel : Når uler tees ute tilbaeleggig fra e bos med uler, vil atall ie-ordede utvalg være C! = =!( )! Esempel: Lottotreig. Treer ute tilbaeleggig 7 av 3 ummererte uler. Atall muligheter 3 3! 3! 3 33... 8 C = = = = = 537966 7 7!( 3 7)! 7! 7! 7! 3 7 Biomis modell Et forsø som er araterisert ved i) Forsøet er (a tees) sammesatt av uavhegige eeltforsø ii) I hvert eeltforsø registreres hvorvidt é bestemt hedelse A opptrer eller ie iii) P(A )= p i alle eeltforsø (iebærer at P( A*) = p= q alles e biomis forsøsree. Esempler på situasjoer som a besrives ved biomis forsøsree: i) E aster gager med et pegestye og registrerer atall ast som resulterer i Kro ii) frø såes og e registrerer hvor mage som spirer etter e viss tid iii) E udersøer hvor mage eeltfødsler som resulterer i pie 5 6 Biomis fordelig Vi lar X (stoastis) være det atall av de eeltforsø som resulterer i hedelse A og ser på fordelige til X år er f. es. 3. Da vil utfallsrommet S bestå av 3 =8 eeltutfall Utfallsrom (S) Eeltutfall P(e i ) X A*A*A* e (-p) 3 A*A*A e p (-p) A*A A* e 3 p (-p) A A*A* e p (-p) A A A* e 5 p (-p) A A*A e 6 p (-p) A *A A e 7 p (-p) A A A e 8 p 3 3 Sasylighetsfordelige blir å: P(X=)= (-p) 3, P(X=)= 3(-p) p, P(X=)= 3(-p)p, P(X=3)= p 3 Dette a sammefattes som 3 P ( X = ) = p ( p) 3, =,,, 3 I det geerelle tilfelle med forsø blir sasylighete for å få eeltutfall A av mulige P ( X = ) = p ( p) Dette er de biomise fordelige, og de har e setral rolle sasylighetsregig og statisti. I prasis er det sjelde av iteresse å berege sasyligheter av type P(X=), me sarere av type P( X ) eller P( X > ). Vi får formele i i P ( X ) = p ( p) i= i i=,,,, 7 8
Esempel: Atar at sasylighete for pie i eeltfødsel er p= 5.. Hva er sasylighete for 9 pier i 8 fødsler? X=atall pier i =8 fødsler p = P( pie i eeltfødsel ) Biomis modell: =8 uavhegige forsø A = pie P(A)=p =.5 i alle forsø (fødsler) X = atall utfall A i =8 forsø 8 8 8 9 8 9 9 9 8 P( X= 9) = 5. ( 5. ) 5. 5. 5. 86. 9 = = = 9 9 Esempel, forts: E spåoe påstår hu er sys og at a forutsi jøet i e fødsel. Ser på 8 fødsler og observerer orrete forutsigelser. Gjetter hu bare? Spørsmål: Hva er sasylighete til å utsi mist orrete spådommer gitt at hu bare gjetter, dvs. p=.5? P( X ) = P( X = ) + P( X = 5) + P( X = 6) + P( X = 7) + P( X = 8) =. 7 +. 3 +. 6 +. +. =. 55 (fra tabell) Det er lite sasylighet for å forutsi orret mist av 8 gager ved re gjettig, så observasjoee a tyde på overaturlige ever. Forvetig og varias til idiatorvariabel Ser på et forsø med bare to mulige utfall ved utfall A, P( A) = p Idiatorvariabel: I = ved ufall A*, P( A*) = p = q E( I) = PI ( = ) + PI ( = ) = p E( I ) = PI ( = ) + PI ( = ) = p ( EI) Var( I) = E( I ) ( ) = p p = p( p) = pq 9 3 Forvetig og varias i biomis fordelig Atall A i forsø: X = I + I +.. + I = I i i= Forvetig: E( X) = E( I ) + E( I ) +... + E( I ) = p+ p+... + p= p Uavhegige eeltforsø (ige ovarias mellom I-ee) medfører: VarX ( ) = VarI ( ) + VarI ( ) +... + VarI ( ) = pq+ pq+... + pq= pq= p ( p) Poissofordelig estrastoff (bous, ie pesum) Noe gager har ma å gjøre med e biomis forsøsree der er stor og p er svært lite. Forvetet atall eeltutfall er som alltid μ= p. Uder betigelsee ovefor a det da vises at μ P( X = ) = e! μ Dette er poissofordelige, og det a videre vises at E( X) = Var( x) =μ Esempler på poissofordelte hedelser: i) Utsedig partiler fra e radioativ ilde over et visst tidsrom ii) Atall ollisjoer i e stert trafiert veiryss over et visst tidsrom iii) Atall sjelde celler i et sysfelt uder mirosopet iv) Atall tilfeller av e sjelde sydom i e stor populasjo over e viss tidsperiode 3 3