Kontinuerlige stokastiske variable. I forelesning har vi sett på en kontinuerlig stokastisk variabel med sannsynlighetstetthet f() =2 og sannsynlighetsfunksjon F () = 2 for. Der hadde jeg et reint regneteknisk perspektiv, for å illustrere bruken av formlene. Her kommer et eksempel, som nok er noe oppkonstruert, men forhåpentligvis ganske konkret, som har denne sannsynlighetsfordelinga. Hensikten er først og fremst å begrunne hvorfor og hvordan formelverket for kontinuerlige fordelinger naturlig stammer fra de tilsvarende formlene for diskrete fordelinger. Versjon per 28. januar 29 av Hans Petter Hornæs. Innledning. Situasjonsbeskrivelse I dette notatet skal vi se på det halvrealistiske eksemplet at en person kaster pil (eller skyter) på en sirkulær blink med radius (for eksempel desimeter). Den stokastiske variabelen X er avstanden fra treffpunktet til blinkens sentrum. I figur vises blinken med resultatet av et kast til venstre. Utfallet er da lengden på linja mellom treffpunktet og sentrum (i dette tilfellet er =.722428947...). I figuren til høyre er alle treffene ienseriepå25kastvist. Figur : Figur av blinken med henholdsvis et og en serie utfall. For å kunne si noe om sannsynligheter må vi vite noe om hvor god pilkasteren er (for en god kaster vil sannsynligheten for åfå treff i midtfeltet være stor, men det gjelder åpenbart ikke denne kasteren). Vi skal anta at han er en ganske dårlig pilkaster som treffer i hytt og pine. Mange ganger treffer han ikke blinken i det hele tatt, men da er regelen at dette ikke teller, og han kaster omigjen. Dette betyr at han helt sikkert treffer et eller annet sted innenfor blinkskiva, sannsynligheten for dette er. Derimot treffer han helt tilfeldig (uniformt) på skiva. Det vil si at to områder med samme areal har samme sannsynlighet for å bli truffet uansett hvor på blinkskiva arealene er plassert. Dette medfører at sannsynligheten for at han treffer innenfor et bestemt område er proporsjonalt med arealet av området. Skuddserien i figur er i virkeligheten simulert kunstig i Maple med disse forutsetningene.
.2 Hensikt og plan for dette notatet. Dette eksemplet vil bli presentert i kortversjon på forelesning, så kan man ta ut dette notatet om man ønsker det skriftlig og med flere detaljer. Hensikten er primært å lage et eksempel som viser overgangen fra diskret til kontinuerlig stokastisk variabel. Eksemplet er tilpasset for åfå matematikken så enkel som mulig uten at det er helt trivielt. Jeg har tidligere brukt uniform fordeling, men ulempen med dette er at det blir for enkelt til at man ser de generelle poengene. Selv om spillet (og forutsetningene) ikke er helt realistiske håper jeg det er lett åforstå slik at man kan få en praktisk forestilling om prosessen, ikke bare abstrakt matematisk manipulering. Fram til dette eksemplet har vi snakket om diskrete fordelinger der de mulige utfallene kan listes opp i en ordnet tellbar rekkefølge... < 2 < < < < 2 < 3... (eller bare en del av dette som f.eks < 2 < 3 <...< n ). I denne situasjonene kan i prinsippet hvilket som helst reelt tall (mellom og ) ende opp som utfall, og de reelle tallene kan ikke listes opp på denne måten. Når alle reelle tall i et (muligens uendelig) intervall kan oppnås sier vi at X har en kontinuerlig fordeling. I virkeligheten kan vi selvfølgelig ikke måle treffpunktet med en nøyaktighet med uendelig mange desimaler, men det viktige er at det er matematisk hensiktsmessig å tenke seg at det er dette vi skal gjøre. Kontinuerlige stokastiske variable har en rekke egenskaper felles med diskrete variable, men det er også noen viktige forskjeller. Vi skal derfor begynne med en diskret variant av eksemplet, og se på overgangen fra denne til den kontinuerlige varianten. 2 Diskrete modeller Vi skal i første omgang se på følgende den varianten av eksemplet at avstanden avrundes til det av tallene.,.3,.5,.7 eller.9 som er nærmest. Dette tilsvarer at vi har en vanlig blink men med en litt spesiell poengberegning som i figur 2. Jeg skal kalle denne stokastiske variabelen X 5, der indeksen 5 refererer til at vi har delt inn blinken i5felter: Det første skuddet (som hadde avstand =.722428947... til sentrum) gir således utfallet.7. I den simulerte skuddserien er det.9 ere, 8.7 ere, 4.5 ere, 2.3 ere og ingen. ere...5.9.3.7.5.9..3.7 Figur 2: Diskret blink med n =5felter.
2. Diskrete modell. Siden radien på hele skiva er er hele arealet π 2 = π. Sannsynligheten for at vi treffer innenfor yttergrensene av et felt er andelen dette arealet utgjør av hele. Her skal jeg kalle radius i ytterkantene r i (det vil si r =.2, r 2 =.4, r 3 =.6, r 4 =.8 og r 5 = ), mens poengene kalles i (det vil si =.q, 2 =.3, 3 =.5, 4 =.7 og 5 =.9). Sannsynligheten for åfå i eller færre poeng er dermed andelen arealet med radius r i utgjør. Jeg skal kalle sannsynlighetsfunksjonen F 5 : F 5 ( i )=P(X 5 i )= Arealet av sirkelen med radius r i Arealet av hele sirkelen For eksempel er F 5 (.7) =.8 2 tabellform: = πr2 i π = r2 i. =.64, og med tilsvarende utregninger kan F 5 settes opp på i..3.5.7.9 F 5 ( i ).4.6.36.64. () Vi kan nå finne punktsannsynlighetene f 5 ( i ) ved formelen f( i )=F ( i ) F ( i )(dervimå sette F ( )=): i..3.5.7.9 f 5 ( i ).4.2.2.28.36 (2) Merk at f 5 ( i ) passer med formelen f 5 ( i )=.4 i. Dette er igjen på formen f n ( i )= 2 n i (3) med n = 5, og dette blir den generelle formelen om vi deler inn i n felter. Du kan selv sjekke dette (med litt geometri og algebra) hvis du vil. 2.2 Sannsynlighetsmodellen Et stolpediagram for punktsannsynligheten f( i ) er vist i figur 3. Forventningsverdi og standardavvik er tegnet inn. Legg merke til at toppene på stolpene passer på en rett linje gjennom origo, noe som svarer til at den kontinuerlige modellen har sannsynlighetstetthet som er en rett linje gjennom origo (for ). 2.2. Forventningsverdi Forventningsverdien er definert som μ =E(X) = n i= i f( i ) som i dette tilfellet blir slik: μ =E(X) =..4 +.3.2 +.5.2 +.7.28 +.9.36 =.66 (4) Dette er som du ser nokså nært (men ikke eksakt lik) 2/3 som er forventningsverdien i den kontinuerlige modellen (regnet ut på forelesning). 2.2.2 Varians og standardavvik Variansen er Var (X) =σ 2 = n i= 2 i f( i) μ 2 som i dette tilfellet blir slik: σ 2 =Var(X) =. 2.4 +.3 2.2 +.5 2.2 +.7 2.28 +.9 2.36.66 2 =.544 (5) Dette er nokså nært (men ikke eksakt lik) /8 som er variansen i den kontinuerlige modellen (regnetutpå forelesning).
f( i )=P(X = i ) k =.4 f( i )=k i =.4 i..3.5.7.9 Figur 3: Stolpediagram for punktsannsynlighet med n = 5 poengfelter. Standardavviket er σ = Var (X) som i dette tilfellet er: σ =.544 =.233 (6) 2.3 Generalisering til vilkårlig antall felter Anta nå vi istedenfor 5 poengringer har n slike like brede ringer. For eksempel vil blinken og stolpediagrammet med n = 2 se ut som i figur 4: f( i )=P(X n = i ) k =. f( i )=k i =. i..3.5.7.9 Figur 4: Blink og punktsannsynlighet med n = 2 poengområder. Punktsannsynligheten er da gitt ved f( i )=P(X n = i )= 2 n i. (7) Med n = 2 som i figuren gir dette f( i )=P(X 2 = i )= 2 2 i =. i.
Med n = 2 blir (noen av) midtpunktene.25,.75,.25,...,.625,.675,.725,.775,...,.925,.975. Sammenliknet med stolpediagrammet i figur 3 er andreaksen strekt ut, toppen er bare /4 ganger så høy. Alle søylene er jo lavere, det er flere verdier å fordele den samlede sannsynligheten på. For eksempel utgjør de 4 feltene med midtpunkter.625,.675,.725,.775 tilsammen feltet som med n = 5 hadde midtpunkt.7. Disse har hver omtrent /4 av høyden til stolpen for P (X 5 =.7) =.28, og har samlet sannsynlighet..625+..675+..725+..775 =.625+.675+.725+.775 =.28 = P (X 5 =.7) 2.3. Forventningsverdi og varians Forventningsverdien μ =E(X n )ogvariansenvar(x n )er μ n =E(X n )= 2 3 6n 2 og Var (X n )= 8 n2 + 36n 4. (8) Som en liten kontroll kan vi sjekke med n =5: E(X 5 )= 2 3 6 25 =.66, som stemmer med første eksempel. Var (X 5 )= 8 26 36 5 =.544, som også stemmer med første eksempel. 4 3 Kontinuerlig modell Nå skal vi tilbake til hovedeksemplet der skåren er avstanden fra treffpunktet til sentrum av skiva. Dermed har vi (ikke tellbart) uendelig mange mulige verdier for, alle reelle tall mellom og. Alle punkter med en skår mindre eller lik er da punktene på sirkellinja med radius r =. Viskal kalle sannsynlighetsfunksjonen for dette tilfellet F,og F () =P(X ) = Arealet av sirkelen med radius Arealet av hele sirkelen altså den sannsynlighetsfunksjone vi hadde i eksemplet på forelesningen. For alle sannsynlighetsfunksjoner (kontinuerlige og diskrete) gjelder = π2 π = 2, P(a<X b) =F (b) F (a) (9) Her kommer (delvis) utledning av formel (7) og formlene i (8). Bredden på hver ring er i denne situasjonen Δ = og punktsannsynligheten er gitt ved f(i) =P(Xn = i) = n 2 i. Dermed er f(i) fremdeles en lineær funksjon på formenf(i) =ki, med konstanten k =2/n som blir mindre n jo større n er. Skårverdien er Δ =, siden den er midt i første intervall med bredde Δ. 2 2n Deretter kommer i-verdiene med mellomrom Δ slik at 2 = 2n + n = 3 2n, 3 = 2n +2 n = 5,...,i = 2n 2n +(i ) n = 2i,...,n = 2n 2n Vi kan sette opp symbolske uttrykk for forventningsverdi og varians, som lar seg forenkle. Jeg har overlatt til Maple å utføre denne forenklinga: E(X n)= n if( i)= i= n i= 2i 2n altså 2/3 minus et lite ledd som går mot når n går mot uendelig. Variansen kan regnes ut etter samme tankegang. 2 2i Maple = 2 n 2n 3 6n, 2
siden X b = X a a<x b såp(x b) =P(X a) +P(a<X b) F (b) = F (a)+p(a<x b). Sannsynligheten for at skåren ligger i et lite intevall [, +Δ] med bredde Δ er dermed (fra formel 9) P(<X +Δ) =F ( +Δ) F () Riktignok står det og ikke < i første ulikhet, men ved åsepå arealbetrakningene ser du at dette fortsatt stemmer (for kontinuerlige, men ikke diskrete fordelinger). For åfå sannsynligheten for at X er nøyaktig kan vi la Δ gåmotif ( +Δ) F (), men da blir vi stående igjen med F () F () =(sidenf er en kontinuerlig funksjon). Det vil si: P(X = ) = () Dette kan også sees ved at arealet av sirkelinja med radius er, den har jo bredde. Mange stusser på at sannsynligheten er, det er jo ikke umulig. En eller annen verdi av får vi jo som utfall, og denne hadde også sannsynlighet før pilen ble kastet. Det som er umulig har sannsynlighet, men det omvendte gjelder altså ikke. Vi er nødt til å si at det er slik, hvis ikke bryter sannsynlighetsregninga sammen (Kolmogoroffs aksiomer kan ikke oppfylles). Hvis sannsynligheten var større enn på et intervall ville den samlede sannsynligheten blit, ikkesom den skal være. Skal du bruke sannsynlighetsregning på dette må du dermed revurdere den oppfatningen av sannsynlighet du (kanskje) har. Her skal jeg forsøke å forklare hvordan dette skjer, i første omgang litt halvformelt: 3. Sannsynlighetstetthet Istedenfor å betrakte sannsynligheten for at utfallet er nøyaktig lik betrakter vi sannsynligheten per enhet på aksen i et lite intervall: P( X +Δ) Δ = F ( +Δ) F () Δ Grensen for dette når Δ (som svarer til n ) kan bettraktes som gjennomsnittssannsynligheten på et uendelig kort intervall. Dette kalles sannsynlighetstettheten. Men denne grensen er definisjonen av deriverte i matematikken: F P( X +Δ) def () = lim = f() () Δ Δ Siden F () = 2 er da f() =F () =2. Strengt tatt gjelder dette bare de mulige verdiene mellom og, f() = for de umulige verdiene utenfor dette intervallet, slik at Grafen er vist i figur 5. for < f() = 2 for < for > Legg merke til analogien mellom sannsynlighetstettheten f() =2 og punktsannsynlighetene f( i)=k i for de diskrete tilfellene. Sammenlik også stolpediagrammet til f( i)oggrafentilf(). Det er imidlertid en viktig forskjell at punktsannsynlighet gir sannsynlighet direkte, mens sannsynlighetstetthet gir (momentan) gjennomsnittssannsynlighet per enhet langs aksen. (2)
2,5,8,6,4,2,5 -,5,5,5 -,5,5,5 Figur 5: Sannsynlighetstetthet f() og sannsynlighetsfunksjon F () for eksemplet 2 P(a<X b) a b Figur 6: Sannsynlighet tolket som areal under f() 3.. Sammenhengen mellom sannsynlighetstetthet og sannsynlighetsfunksjon. Vi har følgende sammenheng mellom sannsynlighetsfunksjonen F og sannsynlighetstettheten f: F () =f() (3) Siden F () =f() er b a f() d = F (b) F (a) (fundamentalsetningen i kalkulus, den regelen du er vant til åbrukeforå regne ut bestemte integraler). Siden høyresiden er P (a <X b), fra formel 9, er b P(a<X b) = f() d En geometrisk tolkning av bestemt integral er arealet av området under grafen til integranden, mellom grensene. Dermed kan sannsynligheter illustreres som arealer som i figur 6. Mange resonnementer om sannsynlighet gjøres lettere halvformelt med henvisning til arealer i en figur som denne framfor mer formelle argumenter via integraler. Hvis vi har en formel for F () kan derivasjon brukes til å finne en formel for f(), men situasjonen er ofte at det er f() som er kjent. Da kan vi finne F () vedå integrere f. Forå unngå navnekollisjon bytter vi variabelnavn (fra til t) i integranden: F () = a f(t) dt (4)
Dette får vi ved å sette b = og la a iformel9,dalim a F (a) = (det blir sannsynlighet for et utfall som er minfre enn alle mulig reelle tall a). For generell bruk settes den nedre grensen til, men i dette tilfellet (og mange andre, men ikke i den viktige normalfordelinga) er F () =P(X ) =hvis, og da blir integralet F () = f(t) dt = dt + f(t) dt = f(t) dt hvis. Dette gir med f() =2, som i dette eksemplet: F () = 2tdt= [t 2] = 2. Egentlig er det for < siden P (X <) =, dette er umulig. F () = 2 for for > siden P (X ) =, dette er helt sikkert. Kommentar: Også i de diskrete tilfellene er F ( i)et2.gradspolynom,vimå justere litt så -verdiene blir ytre radius r i i poengsirkelen. Tabell får vi for eksempel med formelen F ( i)=( i +.) 2. 3..2 Noen egenskaper ved sannsynlighetstetthet og sannsynlighetsfunksjon De grunnleggende matematiske egenskapene for f og F er: a) f() b) f() d = c) F () = f(t) dt d) f() =F () e) F () er en ikke avtagende, kontinuerlig funksjon. f) lim F () = og lim F () = b g) P (a <X b) = f() d a (5) Kommentar: Hvis en funksjon f har egenskapene 5a og b kan sannsynlighet defineres via 5c og P (a <X b) = F (b) F (a). Det samme kan vi gjøre for en hvilken som helst funksjon F som har egenskapene 5e og f. En kontinuerlig stokastisk modell definert på en av disse måtene oppfyller Kolmogoroffs aksiomer, og er dermed matematisk gyldig som definisjon på sannsynlighet. Det viser seg også at det er svært nyttig i veldig mange anvendelser å definere kontiuerlig sannsynlighet slik. Når modellen både er matematisk gyldig, matematisk hensiktsmessig og praktisk svært anvendelig er det ingen vits i å stritte mot og hekte seg opp i innvendinger om at den kanskje ikke er % sann, for eksempel fordi vi i praksis ikke kan måle en verdi som et eksakt reelt tall. 3.2 Forventningsverdi og varians. Hvis den kontinuerlige stokastiske variabelen X har sannsynlighetstetthet f er forventningsverdien μ =E(X) def = f() d (definisjon av forventningsverdi). (6) Legg merke til at denne er nokså lik definisjonen for det diskrete tilfellet når erstattes med n i= (eller mer generelt i= ), og i erstattes med (uten indeks).
Var (X) def = ( μ) 2 f() d (Definisjon avvarians.) (7) Igjen tilsvarer dette definisjonene for det diskrete tilfellet med integrasjon istedenfor summering. σ def = Vi har følgende nyttige omskrivning av formelen for varians: Var (X) (Definisjon standardavvik.) (8) Var (X) = 2 f() d μ 2 (Alternativ definisjon varians.) (9) Dette tilsvarer tilsvarende omskrivning for det diskrete tilfelle når integrasjon erstatter summering. Integrasjonsgrensene kan erstattes med nedre grense for verdier der f() mens kan erstattes med øvre grense for verdier der f(). For viktige spesialtilfeller trenger vi imidlertid ofte uendelig i en eller begge grensene så vi får uegentlige integraler. For alle de viktigste spesialtilfellene (alle fordelinger i pensum) konvergerer disse integralene. I motsatt fall er ikke variansen og forventningsverdien definert. Forventningsverdi og varians i eksemplet. I eksemplet med f() =2 for f() = ellers, er forventningsverdien E(X) = 2d= 2 2 d = [ ] 2 3 3 = 2 3 =2 3 Merk sammenhengen med det diskrete tilfellet, der 2 3 6n der 2 6n er et lite ledd som går mot når n. 2 Nå kan vi si at n har gått mot uendelig, og vi står bare igjen med 2 3 +. Variansen er det som oftest greiest å regne ut med formel 9: Var (X) = 2 2d ( ) 2 2 = 2 3 d 4 [ ] 2 3 9 = 4 4 4 9 = 2 4 9 = 9 8 8 8 = 8. Merk sammenhengen med det diskrete tilfellet, der Var (X) = 8 v n der v n var et lite ledd som går mot når n.nå kan vi si at n har gått mot uendelig, og vi står bare igjen med Halvformell begrunnelse for definisjonen av forventningsverdi (formel 6) : Betrakt først blinken delt inn i n felter med bredde Δ, venstre endepunkt i og midtpunkt i,oglax n være poengene i dette tilfellet. Poengene i den diskrete blinken har da punktsannsynlighet (per definisjon av X n ): f n ( i )=P( i <X< i +Δ) f n ( i )=F ( i +Δ) F ( i ) Videre er (som en konsekvens av definisjonen av f, eller enda mer formelt fra sekantsetningen): F ( i +Δ) F ( i ) Δ Disse kan da kombineres til Forventningsverdi for X n : Siden også i i E(X n )= 8. f( i ) F ( i +Δ) F ( i ) f( i )Δ f n ( i ) f( i )Δ har vi n i f n ( i ) i= n i f( i )Δ i=
Det siste uttrykket er en Riemannsum som konvergerer mot det tilsvarende integralet når n : E(X) def = lim n E(X n)= f() d Ved å generalisere først med grensene a og b (istedenfor og ) i integralet, og så laa og b får vi den generelle definisjonen. Variansformelen kan begrunnes på en tilsvarende måte. At disse fomlene og alle andre formler på en liknende måte transformeres fra formler med summetegn for det diskrete tilfellet til tilsvarende formler med integrasjon for det kontinuerlige tilfellet er vel i seg selv god nok begrunnelse for at det er sannsynlighetstettheten som naturlig erstatter punktsannsynligheten for kontinuerlige variable. 4 Endring av poengskala. Til slutt tar vi med et eksempel på hva som skjer om vi endrer poengivninga til en mer vanlig poengskala for blink:.5.9..3.7 5 4 3 2 Figur 7: Blinken med gammel og ny skala. Vi kaller de gamle verdiene i,dvs. =., 2 =.3, 3 =.5, 4 =.7 og 5 =.9, og poeng med gammel blink for X. Punktsannsynlighten betegnes med f X ( i ), og er den samme som i tabell 2. De nye verdiene kaller vi y i,dvs.y =,y 2 =2,y 3 =3,y 4 =4ogy 5 =5,ogpoengmedny blink for Y. Punktsannsynligheten kaller vi f Y (y i ). Kastsituasjonen er den samme, slik at samme felt får samme sannsynlighet. Siden poengretningen er omvendt må indeksene reverseres, dvs. P (Y = y i )=P(X = i ), det vil si f Y (y i )=f X ( i )=. Dermed kan en tabell for f Y settes opp ved en liten justering av tabell 2: 6 i..3.5.7.9 y i 5 4 3 2 f Y (y i ).4.2.2.28.36 (2) Forventningsverdien er dermed μ Y =.36 + 2.28 + 3.2 + 4.2 + 5.4 = 2.2 Standardavviket er σ Y = 2.36 + 2 2.28 + 3 2.2 + 4 2.2 + 5 2.4 2.2 2 =.66.
Det er imidlertid mulig å regne ut μ Y og σ Y uten ågå om punktsannsynligheten f Y : Legg merke til at y i = 5 i +5.5 (sjekk!). Vi sier da at den stokastiske variabelen Y er en lineær funksjon av X ved Y = 5X +5.5 Det finnes en generell formel for hvordan forventningsverdi og standarddavvik transformeres gjennom lineære funksjoner: E(aX + b) =ae(x)+b og σ ax+b = a σ X (2) Vi har i dette tilfellet at μ =.66 (fra likning 4) og σ =.233(fra likning 6), så denne formelen gir μ Y = 5.66 + 5.5 =2.2 σ Y = 5.233 = 5.233 =.65 Avviket på i 3. desimal skyldes at vi har brukt avrundede verdier i mellomregningene.