Kontinuerlige stokastiske variable.



Like dokumenter
Forelening 1, kapittel 4 Stokastiske variable

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Bernoulli forsøksrekke og binomisk fordeling

Krasjkurs MAT101 og MAT111

3.1 Stokastisk variabel (repetisjon)

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Løsningsforslag AA6526 Matematikk 3MX Privatister 3. mai eksamensoppgaver.org

TMA4240 Statistikk Høst 2008

To-dimensjonale kontinuerlige fordelinger

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

Løsningsforslag Eksamen S2, våren 2014 Laget av Tommy O. Sist oppdatert: 1. september 2018 Antall sider: 11

Potensrekker. Binomialrekker

Kontinuerlige sannsynlighetsfordelinger.

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

Sannsynlighetsregning og Statistikk.

Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians.

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Rekker, Konvergenstester og Feilestimat

Lær å bruke GeoGebra 4.0

MAT 100a - LAB 3. Vi skal først illustrerere hvordan Newtons metode kan brukes til å approksimere n-te roten av et positivt tall.

Regneregler for forventning og varians

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Løsningsforslag AA6516 Matematikk 2MX desember eksamensoppgaver.org

Tallinjen FRA A TIL Å

TMA4100 Matematikk 1, 4. august 2014 Side 1 av 12. x 2 3x +2. x 2

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

TMA4100 Matematikk 1, høst 2013

Løsningsforslag. e n. n=0. 3 n 2 2n 1. n=1

Sannsynlighetsregning og kombinatorikk

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Funksjoner og andregradsuttrykk

Betinget sannsynlighet

Forelesning 3, kapittel 3. : 3.2: Sannsynlighetsregning. Kolmogoroffs aksiomer og bruk av disse.

ECON2130 Kommentarer til oblig

Oppsummering TMA4100. Kristian Seip. 26./28. november 2013

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

EKSAMEN I EMNET Mat Grunnkurs i Matematikk I - LØSNING Mandag 15. desember 2014 Tid: 09:00 14:00

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

Eneboerspillet del 2. Håvard Johnsbråten, januar 2014

MAT Grublegruppen Uke 36

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

Poissonprosesser og levetidsfordelinger

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

1 Grafisk framstilling av datamateriale

Binomisk sannsynlighetsfunksjon

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Den krever at vi henter ned Maples plottekommandoer fra arkivet. Det gjør vi ved kommandoen

Konfidensintervall for µ med ukjent σ (t intervall)

Statistikk 1 kapittel 5

Løsningsforslag Eksamen S2, våren 2016 Laget av Tommy Odland Dato: 29. januar 2017

Statistikk 1 kapittel 5

MA1102 Grunnkurs i analyse II Vår 2019

GeoGebra-opplæring i Matematikk 2P

Oppsummering TMA4100. Kristian Seip. 17./18. november 2014

Normal- og eksponentialfordeling.

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

statistikk, våren 2011

MA1102 Grunnkurs i analyse II Vår 2014

Normalfordeling. Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke 7

Løsning, Oppsummering av kapittel 10.

Enkel matematikk for økonomer 1. Innhold. Parenteser, brøk og potenser. Ekstranotat, februar 2015

Kapittel 5: Tilfeldige variable, forventning og varians.

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

Oppfriskning av blokk 1 i TMA4240

Oppsummering TMA4100. Kristian Seip. 16./17. november 2015

1 C z I G + + = + + 2) Multiplikasjon av et tall med en parentes foregår ved å multiplisere tallet med alle leddene i parentesen, slik at

Kanter, kanter, mange mangekanter

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Bokmål. Eksamensinformasjon

Beskrivende statistikk.

EKSAMEN. TILLATTE HJELPEMIDLER: John Haugan: Formler og tabeller. Rottmanns formelsamling (tillatt som overgangsordning)

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Eksamen REA3028 S2, Høsten 2012

Geometri. Mål. for opplæringen er at eleven skal kunne

Løsningsforslag til underveiseksamen i MAT 1100

Statistikk 1 kapittel 5

For en tid siden ble jeg konfrontert med følgende problemstilling:

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Eksamen. Fag: AA6524/AA6526 Matematikk 3MX. Eksamensdato: 6. desember Vidaregåande kurs II / Videregående kurs II

TMA4240 Statistikk H2015

: subs x = 2, f n x end do

Lær å bruke Microsoft Mathematics, Matematikk-tillegget i Word og WordMat. Av Sigbjørn Hals

MAT jan jan jan MAT Våren 2010

Studentene skal kunne. gjøre rede for begrepene naturlige, hele, rasjonale og irrasjonale tall. skrive mengder på listeform

Eksamen i matematikk. Hvordan har eksamen i R1 høsten 2011 endret all læreplantolkning?

Eksamen REA3028 Matematikk S2. Nynorsk/Bokmål

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

Løsningsforslag Eksamen S2, høsten 2017 Laget av Tommy O. Sist oppdatert: 26. november 2017

Go with the. Niende forelesning. Mye matematikk i boka her ikke så komplisert, men mye å holde styr på.

EKSAMEN I EMNE TMA4245 STATISTIKK

Transkript:

Kontinuerlige stokastiske variable. I forelesning har vi sett på en kontinuerlig stokastisk variabel med sannsynlighetstetthet f() =2 og sannsynlighetsfunksjon F () = 2 for. Der hadde jeg et reint regneteknisk perspektiv, for å illustrere bruken av formlene. Her kommer et eksempel, som nok er noe oppkonstruert, men forhåpentligvis ganske konkret, som har denne sannsynlighetsfordelinga. Hensikten er først og fremst å begrunne hvorfor og hvordan formelverket for kontinuerlige fordelinger naturlig stammer fra de tilsvarende formlene for diskrete fordelinger. Versjon per 28. januar 29 av Hans Petter Hornæs. Innledning. Situasjonsbeskrivelse I dette notatet skal vi se på det halvrealistiske eksemplet at en person kaster pil (eller skyter) på en sirkulær blink med radius (for eksempel desimeter). Den stokastiske variabelen X er avstanden fra treffpunktet til blinkens sentrum. I figur vises blinken med resultatet av et kast til venstre. Utfallet er da lengden på linja mellom treffpunktet og sentrum (i dette tilfellet er =.722428947...). I figuren til høyre er alle treffene ienseriepå25kastvist. Figur : Figur av blinken med henholdsvis et og en serie utfall. For å kunne si noe om sannsynligheter må vi vite noe om hvor god pilkasteren er (for en god kaster vil sannsynligheten for åfå treff i midtfeltet være stor, men det gjelder åpenbart ikke denne kasteren). Vi skal anta at han er en ganske dårlig pilkaster som treffer i hytt og pine. Mange ganger treffer han ikke blinken i det hele tatt, men da er regelen at dette ikke teller, og han kaster omigjen. Dette betyr at han helt sikkert treffer et eller annet sted innenfor blinkskiva, sannsynligheten for dette er. Derimot treffer han helt tilfeldig (uniformt) på skiva. Det vil si at to områder med samme areal har samme sannsynlighet for å bli truffet uansett hvor på blinkskiva arealene er plassert. Dette medfører at sannsynligheten for at han treffer innenfor et bestemt område er proporsjonalt med arealet av området. Skuddserien i figur er i virkeligheten simulert kunstig i Maple med disse forutsetningene.

.2 Hensikt og plan for dette notatet. Dette eksemplet vil bli presentert i kortversjon på forelesning, så kan man ta ut dette notatet om man ønsker det skriftlig og med flere detaljer. Hensikten er primært å lage et eksempel som viser overgangen fra diskret til kontinuerlig stokastisk variabel. Eksemplet er tilpasset for åfå matematikken så enkel som mulig uten at det er helt trivielt. Jeg har tidligere brukt uniform fordeling, men ulempen med dette er at det blir for enkelt til at man ser de generelle poengene. Selv om spillet (og forutsetningene) ikke er helt realistiske håper jeg det er lett åforstå slik at man kan få en praktisk forestilling om prosessen, ikke bare abstrakt matematisk manipulering. Fram til dette eksemplet har vi snakket om diskrete fordelinger der de mulige utfallene kan listes opp i en ordnet tellbar rekkefølge... < 2 < < < < 2 < 3... (eller bare en del av dette som f.eks < 2 < 3 <...< n ). I denne situasjonene kan i prinsippet hvilket som helst reelt tall (mellom og ) ende opp som utfall, og de reelle tallene kan ikke listes opp på denne måten. Når alle reelle tall i et (muligens uendelig) intervall kan oppnås sier vi at X har en kontinuerlig fordeling. I virkeligheten kan vi selvfølgelig ikke måle treffpunktet med en nøyaktighet med uendelig mange desimaler, men det viktige er at det er matematisk hensiktsmessig å tenke seg at det er dette vi skal gjøre. Kontinuerlige stokastiske variable har en rekke egenskaper felles med diskrete variable, men det er også noen viktige forskjeller. Vi skal derfor begynne med en diskret variant av eksemplet, og se på overgangen fra denne til den kontinuerlige varianten. 2 Diskrete modeller Vi skal i første omgang se på følgende den varianten av eksemplet at avstanden avrundes til det av tallene.,.3,.5,.7 eller.9 som er nærmest. Dette tilsvarer at vi har en vanlig blink men med en litt spesiell poengberegning som i figur 2. Jeg skal kalle denne stokastiske variabelen X 5, der indeksen 5 refererer til at vi har delt inn blinken i5felter: Det første skuddet (som hadde avstand =.722428947... til sentrum) gir således utfallet.7. I den simulerte skuddserien er det.9 ere, 8.7 ere, 4.5 ere, 2.3 ere og ingen. ere...5.9.3.7.5.9..3.7 Figur 2: Diskret blink med n =5felter.

2. Diskrete modell. Siden radien på hele skiva er er hele arealet π 2 = π. Sannsynligheten for at vi treffer innenfor yttergrensene av et felt er andelen dette arealet utgjør av hele. Her skal jeg kalle radius i ytterkantene r i (det vil si r =.2, r 2 =.4, r 3 =.6, r 4 =.8 og r 5 = ), mens poengene kalles i (det vil si =.q, 2 =.3, 3 =.5, 4 =.7 og 5 =.9). Sannsynligheten for åfå i eller færre poeng er dermed andelen arealet med radius r i utgjør. Jeg skal kalle sannsynlighetsfunksjonen F 5 : F 5 ( i )=P(X 5 i )= Arealet av sirkelen med radius r i Arealet av hele sirkelen For eksempel er F 5 (.7) =.8 2 tabellform: = πr2 i π = r2 i. =.64, og med tilsvarende utregninger kan F 5 settes opp på i..3.5.7.9 F 5 ( i ).4.6.36.64. () Vi kan nå finne punktsannsynlighetene f 5 ( i ) ved formelen f( i )=F ( i ) F ( i )(dervimå sette F ( )=): i..3.5.7.9 f 5 ( i ).4.2.2.28.36 (2) Merk at f 5 ( i ) passer med formelen f 5 ( i )=.4 i. Dette er igjen på formen f n ( i )= 2 n i (3) med n = 5, og dette blir den generelle formelen om vi deler inn i n felter. Du kan selv sjekke dette (med litt geometri og algebra) hvis du vil. 2.2 Sannsynlighetsmodellen Et stolpediagram for punktsannsynligheten f( i ) er vist i figur 3. Forventningsverdi og standardavvik er tegnet inn. Legg merke til at toppene på stolpene passer på en rett linje gjennom origo, noe som svarer til at den kontinuerlige modellen har sannsynlighetstetthet som er en rett linje gjennom origo (for ). 2.2. Forventningsverdi Forventningsverdien er definert som μ =E(X) = n i= i f( i ) som i dette tilfellet blir slik: μ =E(X) =..4 +.3.2 +.5.2 +.7.28 +.9.36 =.66 (4) Dette er som du ser nokså nært (men ikke eksakt lik) 2/3 som er forventningsverdien i den kontinuerlige modellen (regnet ut på forelesning). 2.2.2 Varians og standardavvik Variansen er Var (X) =σ 2 = n i= 2 i f( i) μ 2 som i dette tilfellet blir slik: σ 2 =Var(X) =. 2.4 +.3 2.2 +.5 2.2 +.7 2.28 +.9 2.36.66 2 =.544 (5) Dette er nokså nært (men ikke eksakt lik) /8 som er variansen i den kontinuerlige modellen (regnetutpå forelesning).

f( i )=P(X = i ) k =.4 f( i )=k i =.4 i..3.5.7.9 Figur 3: Stolpediagram for punktsannsynlighet med n = 5 poengfelter. Standardavviket er σ = Var (X) som i dette tilfellet er: σ =.544 =.233 (6) 2.3 Generalisering til vilkårlig antall felter Anta nå vi istedenfor 5 poengringer har n slike like brede ringer. For eksempel vil blinken og stolpediagrammet med n = 2 se ut som i figur 4: f( i )=P(X n = i ) k =. f( i )=k i =. i..3.5.7.9 Figur 4: Blink og punktsannsynlighet med n = 2 poengområder. Punktsannsynligheten er da gitt ved f( i )=P(X n = i )= 2 n i. (7) Med n = 2 som i figuren gir dette f( i )=P(X 2 = i )= 2 2 i =. i.

Med n = 2 blir (noen av) midtpunktene.25,.75,.25,...,.625,.675,.725,.775,...,.925,.975. Sammenliknet med stolpediagrammet i figur 3 er andreaksen strekt ut, toppen er bare /4 ganger så høy. Alle søylene er jo lavere, det er flere verdier å fordele den samlede sannsynligheten på. For eksempel utgjør de 4 feltene med midtpunkter.625,.675,.725,.775 tilsammen feltet som med n = 5 hadde midtpunkt.7. Disse har hver omtrent /4 av høyden til stolpen for P (X 5 =.7) =.28, og har samlet sannsynlighet..625+..675+..725+..775 =.625+.675+.725+.775 =.28 = P (X 5 =.7) 2.3. Forventningsverdi og varians Forventningsverdien μ =E(X n )ogvariansenvar(x n )er μ n =E(X n )= 2 3 6n 2 og Var (X n )= 8 n2 + 36n 4. (8) Som en liten kontroll kan vi sjekke med n =5: E(X 5 )= 2 3 6 25 =.66, som stemmer med første eksempel. Var (X 5 )= 8 26 36 5 =.544, som også stemmer med første eksempel. 4 3 Kontinuerlig modell Nå skal vi tilbake til hovedeksemplet der skåren er avstanden fra treffpunktet til sentrum av skiva. Dermed har vi (ikke tellbart) uendelig mange mulige verdier for, alle reelle tall mellom og. Alle punkter med en skår mindre eller lik er da punktene på sirkellinja med radius r =. Viskal kalle sannsynlighetsfunksjonen for dette tilfellet F,og F () =P(X ) = Arealet av sirkelen med radius Arealet av hele sirkelen altså den sannsynlighetsfunksjone vi hadde i eksemplet på forelesningen. For alle sannsynlighetsfunksjoner (kontinuerlige og diskrete) gjelder = π2 π = 2, P(a<X b) =F (b) F (a) (9) Her kommer (delvis) utledning av formel (7) og formlene i (8). Bredden på hver ring er i denne situasjonen Δ = og punktsannsynligheten er gitt ved f(i) =P(Xn = i) = n 2 i. Dermed er f(i) fremdeles en lineær funksjon på formenf(i) =ki, med konstanten k =2/n som blir mindre n jo større n er. Skårverdien er Δ =, siden den er midt i første intervall med bredde Δ. 2 2n Deretter kommer i-verdiene med mellomrom Δ slik at 2 = 2n + n = 3 2n, 3 = 2n +2 n = 5,...,i = 2n 2n +(i ) n = 2i,...,n = 2n 2n Vi kan sette opp symbolske uttrykk for forventningsverdi og varians, som lar seg forenkle. Jeg har overlatt til Maple å utføre denne forenklinga: E(X n)= n if( i)= i= n i= 2i 2n altså 2/3 minus et lite ledd som går mot når n går mot uendelig. Variansen kan regnes ut etter samme tankegang. 2 2i Maple = 2 n 2n 3 6n, 2

siden X b = X a a<x b såp(x b) =P(X a) +P(a<X b) F (b) = F (a)+p(a<x b). Sannsynligheten for at skåren ligger i et lite intevall [, +Δ] med bredde Δ er dermed (fra formel 9) P(<X +Δ) =F ( +Δ) F () Riktignok står det og ikke < i første ulikhet, men ved åsepå arealbetrakningene ser du at dette fortsatt stemmer (for kontinuerlige, men ikke diskrete fordelinger). For åfå sannsynligheten for at X er nøyaktig kan vi la Δ gåmotif ( +Δ) F (), men da blir vi stående igjen med F () F () =(sidenf er en kontinuerlig funksjon). Det vil si: P(X = ) = () Dette kan også sees ved at arealet av sirkelinja med radius er, den har jo bredde. Mange stusser på at sannsynligheten er, det er jo ikke umulig. En eller annen verdi av får vi jo som utfall, og denne hadde også sannsynlighet før pilen ble kastet. Det som er umulig har sannsynlighet, men det omvendte gjelder altså ikke. Vi er nødt til å si at det er slik, hvis ikke bryter sannsynlighetsregninga sammen (Kolmogoroffs aksiomer kan ikke oppfylles). Hvis sannsynligheten var større enn på et intervall ville den samlede sannsynligheten blit, ikkesom den skal være. Skal du bruke sannsynlighetsregning på dette må du dermed revurdere den oppfatningen av sannsynlighet du (kanskje) har. Her skal jeg forsøke å forklare hvordan dette skjer, i første omgang litt halvformelt: 3. Sannsynlighetstetthet Istedenfor å betrakte sannsynligheten for at utfallet er nøyaktig lik betrakter vi sannsynligheten per enhet på aksen i et lite intervall: P( X +Δ) Δ = F ( +Δ) F () Δ Grensen for dette når Δ (som svarer til n ) kan bettraktes som gjennomsnittssannsynligheten på et uendelig kort intervall. Dette kalles sannsynlighetstettheten. Men denne grensen er definisjonen av deriverte i matematikken: F P( X +Δ) def () = lim = f() () Δ Δ Siden F () = 2 er da f() =F () =2. Strengt tatt gjelder dette bare de mulige verdiene mellom og, f() = for de umulige verdiene utenfor dette intervallet, slik at Grafen er vist i figur 5. for < f() = 2 for < for > Legg merke til analogien mellom sannsynlighetstettheten f() =2 og punktsannsynlighetene f( i)=k i for de diskrete tilfellene. Sammenlik også stolpediagrammet til f( i)oggrafentilf(). Det er imidlertid en viktig forskjell at punktsannsynlighet gir sannsynlighet direkte, mens sannsynlighetstetthet gir (momentan) gjennomsnittssannsynlighet per enhet langs aksen. (2)

2,5,8,6,4,2,5 -,5,5,5 -,5,5,5 Figur 5: Sannsynlighetstetthet f() og sannsynlighetsfunksjon F () for eksemplet 2 P(a<X b) a b Figur 6: Sannsynlighet tolket som areal under f() 3.. Sammenhengen mellom sannsynlighetstetthet og sannsynlighetsfunksjon. Vi har følgende sammenheng mellom sannsynlighetsfunksjonen F og sannsynlighetstettheten f: F () =f() (3) Siden F () =f() er b a f() d = F (b) F (a) (fundamentalsetningen i kalkulus, den regelen du er vant til åbrukeforå regne ut bestemte integraler). Siden høyresiden er P (a <X b), fra formel 9, er b P(a<X b) = f() d En geometrisk tolkning av bestemt integral er arealet av området under grafen til integranden, mellom grensene. Dermed kan sannsynligheter illustreres som arealer som i figur 6. Mange resonnementer om sannsynlighet gjøres lettere halvformelt med henvisning til arealer i en figur som denne framfor mer formelle argumenter via integraler. Hvis vi har en formel for F () kan derivasjon brukes til å finne en formel for f(), men situasjonen er ofte at det er f() som er kjent. Da kan vi finne F () vedå integrere f. Forå unngå navnekollisjon bytter vi variabelnavn (fra til t) i integranden: F () = a f(t) dt (4)

Dette får vi ved å sette b = og la a iformel9,dalim a F (a) = (det blir sannsynlighet for et utfall som er minfre enn alle mulig reelle tall a). For generell bruk settes den nedre grensen til, men i dette tilfellet (og mange andre, men ikke i den viktige normalfordelinga) er F () =P(X ) =hvis, og da blir integralet F () = f(t) dt = dt + f(t) dt = f(t) dt hvis. Dette gir med f() =2, som i dette eksemplet: F () = 2tdt= [t 2] = 2. Egentlig er det for < siden P (X <) =, dette er umulig. F () = 2 for for > siden P (X ) =, dette er helt sikkert. Kommentar: Også i de diskrete tilfellene er F ( i)et2.gradspolynom,vimå justere litt så -verdiene blir ytre radius r i i poengsirkelen. Tabell får vi for eksempel med formelen F ( i)=( i +.) 2. 3..2 Noen egenskaper ved sannsynlighetstetthet og sannsynlighetsfunksjon De grunnleggende matematiske egenskapene for f og F er: a) f() b) f() d = c) F () = f(t) dt d) f() =F () e) F () er en ikke avtagende, kontinuerlig funksjon. f) lim F () = og lim F () = b g) P (a <X b) = f() d a (5) Kommentar: Hvis en funksjon f har egenskapene 5a og b kan sannsynlighet defineres via 5c og P (a <X b) = F (b) F (a). Det samme kan vi gjøre for en hvilken som helst funksjon F som har egenskapene 5e og f. En kontinuerlig stokastisk modell definert på en av disse måtene oppfyller Kolmogoroffs aksiomer, og er dermed matematisk gyldig som definisjon på sannsynlighet. Det viser seg også at det er svært nyttig i veldig mange anvendelser å definere kontiuerlig sannsynlighet slik. Når modellen både er matematisk gyldig, matematisk hensiktsmessig og praktisk svært anvendelig er det ingen vits i å stritte mot og hekte seg opp i innvendinger om at den kanskje ikke er % sann, for eksempel fordi vi i praksis ikke kan måle en verdi som et eksakt reelt tall. 3.2 Forventningsverdi og varians. Hvis den kontinuerlige stokastiske variabelen X har sannsynlighetstetthet f er forventningsverdien μ =E(X) def = f() d (definisjon av forventningsverdi). (6) Legg merke til at denne er nokså lik definisjonen for det diskrete tilfellet når erstattes med n i= (eller mer generelt i= ), og i erstattes med (uten indeks).

Var (X) def = ( μ) 2 f() d (Definisjon avvarians.) (7) Igjen tilsvarer dette definisjonene for det diskrete tilfellet med integrasjon istedenfor summering. σ def = Vi har følgende nyttige omskrivning av formelen for varians: Var (X) (Definisjon standardavvik.) (8) Var (X) = 2 f() d μ 2 (Alternativ definisjon varians.) (9) Dette tilsvarer tilsvarende omskrivning for det diskrete tilfelle når integrasjon erstatter summering. Integrasjonsgrensene kan erstattes med nedre grense for verdier der f() mens kan erstattes med øvre grense for verdier der f(). For viktige spesialtilfeller trenger vi imidlertid ofte uendelig i en eller begge grensene så vi får uegentlige integraler. For alle de viktigste spesialtilfellene (alle fordelinger i pensum) konvergerer disse integralene. I motsatt fall er ikke variansen og forventningsverdien definert. Forventningsverdi og varians i eksemplet. I eksemplet med f() =2 for f() = ellers, er forventningsverdien E(X) = 2d= 2 2 d = [ ] 2 3 3 = 2 3 =2 3 Merk sammenhengen med det diskrete tilfellet, der 2 3 6n der 2 6n er et lite ledd som går mot når n. 2 Nå kan vi si at n har gått mot uendelig, og vi står bare igjen med 2 3 +. Variansen er det som oftest greiest å regne ut med formel 9: Var (X) = 2 2d ( ) 2 2 = 2 3 d 4 [ ] 2 3 9 = 4 4 4 9 = 2 4 9 = 9 8 8 8 = 8. Merk sammenhengen med det diskrete tilfellet, der Var (X) = 8 v n der v n var et lite ledd som går mot når n.nå kan vi si at n har gått mot uendelig, og vi står bare igjen med Halvformell begrunnelse for definisjonen av forventningsverdi (formel 6) : Betrakt først blinken delt inn i n felter med bredde Δ, venstre endepunkt i og midtpunkt i,oglax n være poengene i dette tilfellet. Poengene i den diskrete blinken har da punktsannsynlighet (per definisjon av X n ): f n ( i )=P( i <X< i +Δ) f n ( i )=F ( i +Δ) F ( i ) Videre er (som en konsekvens av definisjonen av f, eller enda mer formelt fra sekantsetningen): F ( i +Δ) F ( i ) Δ Disse kan da kombineres til Forventningsverdi for X n : Siden også i i E(X n )= 8. f( i ) F ( i +Δ) F ( i ) f( i )Δ f n ( i ) f( i )Δ har vi n i f n ( i ) i= n i f( i )Δ i=

Det siste uttrykket er en Riemannsum som konvergerer mot det tilsvarende integralet når n : E(X) def = lim n E(X n)= f() d Ved å generalisere først med grensene a og b (istedenfor og ) i integralet, og så laa og b får vi den generelle definisjonen. Variansformelen kan begrunnes på en tilsvarende måte. At disse fomlene og alle andre formler på en liknende måte transformeres fra formler med summetegn for det diskrete tilfellet til tilsvarende formler med integrasjon for det kontinuerlige tilfellet er vel i seg selv god nok begrunnelse for at det er sannsynlighetstettheten som naturlig erstatter punktsannsynligheten for kontinuerlige variable. 4 Endring av poengskala. Til slutt tar vi med et eksempel på hva som skjer om vi endrer poengivninga til en mer vanlig poengskala for blink:.5.9..3.7 5 4 3 2 Figur 7: Blinken med gammel og ny skala. Vi kaller de gamle verdiene i,dvs. =., 2 =.3, 3 =.5, 4 =.7 og 5 =.9, og poeng med gammel blink for X. Punktsannsynlighten betegnes med f X ( i ), og er den samme som i tabell 2. De nye verdiene kaller vi y i,dvs.y =,y 2 =2,y 3 =3,y 4 =4ogy 5 =5,ogpoengmedny blink for Y. Punktsannsynligheten kaller vi f Y (y i ). Kastsituasjonen er den samme, slik at samme felt får samme sannsynlighet. Siden poengretningen er omvendt må indeksene reverseres, dvs. P (Y = y i )=P(X = i ), det vil si f Y (y i )=f X ( i )=. Dermed kan en tabell for f Y settes opp ved en liten justering av tabell 2: 6 i..3.5.7.9 y i 5 4 3 2 f Y (y i ).4.2.2.28.36 (2) Forventningsverdien er dermed μ Y =.36 + 2.28 + 3.2 + 4.2 + 5.4 = 2.2 Standardavviket er σ Y = 2.36 + 2 2.28 + 3 2.2 + 4 2.2 + 5 2.4 2.2 2 =.66.

Det er imidlertid mulig å regne ut μ Y og σ Y uten ågå om punktsannsynligheten f Y : Legg merke til at y i = 5 i +5.5 (sjekk!). Vi sier da at den stokastiske variabelen Y er en lineær funksjon av X ved Y = 5X +5.5 Det finnes en generell formel for hvordan forventningsverdi og standarddavvik transformeres gjennom lineære funksjoner: E(aX + b) =ae(x)+b og σ ax+b = a σ X (2) Vi har i dette tilfellet at μ =.66 (fra likning 4) og σ =.233(fra likning 6), så denne formelen gir μ Y = 5.66 + 5.5 =2.2 σ Y = 5.233 = 5.233 =.65 Avviket på i 3. desimal skyldes at vi har brukt avrundede verdier i mellomregningene.