Kapittel 3 TMA4245 V2007: Eirik Mo 2 Eksempel: kast med to terninger I et eksperiment kaster vi to terninger og registerer antall øyne på hver terning. Utfallsrom S={(,),(,2),(,3),...,(,), (2,),...,(2,),...,(,)} Hva hvis vi nå kun er interessert i summen av øynene på de to terningene? Første terning 2 3 4 5,,2,3,4,5, 2 2, 2,2 2,3 2,4 2,5 2, Andre 3 3, 3,2 3,3 3,4 3,5 3, terning 4 4, 4,2 4,3 4,4 4,5 4, 5 5, 5,2 5,3 5,4 5,5 5,,,2,3,4,5,
3 Sum to terninger forts. Første terning 2 3 4 5,,2,3,4,5, 2 2, 2,2 2,3 2,4 2,5 2, Andre 3 3, 3,2 3,3 3,4 3,5 3, terning 4 4, 4,2 4,3 4,4 4,5 4, 5 5, 5,2 5,3 5,4 5,5 5,,,2,3,4,5, Med utfallet (,) assosierer vi 2 Med utfallene (,2) og (2,) assosierer vi 3 Med utfallet (,) assosierer vi 2. 4 Sum to terninger forts. Situasjonen karakteriseres ved vi er ikke interessert i selve enkeltutfallet vi er kun interessert i tallverdien som assosieres til utfallet. Vi lar X være summen av to terninger, dette er et eksempel på en stokastisk variabel. Første terning 2 3 4 5 + +2 +3 +4 +5 + 2 2+ 2+2 2+3 2+4 2+5 2+ Andre 3 3+ 3+2 3+3 3+4 3+5 3+ terning 4 4+ 4+2 4+3 4+4 4+5 4+ 5 5+ 5+2 5+3 5+4 5+5 5+ + +2 +3 +4 +5 +
5 3. Stokastisk variabel DEF 3. Stokastisk variabel : En stokastisk variabel (SV) er en funksjon som assosierer et reelt tall med hvert element i utfallsrommet. Engelsk: random variable. DEF 3.2 Diskret utfallrom : Hvis utfallsrommet inneholder et endelig antall mulige utfall eller en uendelig sekvens med så mange elementer som det er hele tall, så kalles et et diskret utfallsrom. En stokastisk variabel som har et diskret utfallsrom kalles en diskret stokastisk variabel. DEF 3.3 Kontinuerlig utfallrom : Hvis utfallsrommet inneholder et uendelig antall mulige utfall (f.eks. reelle tall) så kalles det et kontinuerlig utfallsrom. En stokastisk variabel som har et kontinuerlig utfallsrom kalles en kontinuerlig stokastisk variabel. To terninger, igjen... Vi ønsker å si noe om sannsynligheten til X= summen av to terninger, men vi har til nå kun definert sannsynlighet for hendelser. A 2 ={e S X(e) = 2} A 3 ={e S X(e) = 3} A 4 ={e S X(e) = 4} A 5 ={e S X(e) = 5} A ={e S X(e) = } A 2 ={e S X(e) = 2}
7 To terninger forts. P(X = 2) = P(A 2 ) P(X = 3) = P(A 3 ) P(X = 4) = P(A 4 ) P(X = ) = P(A ) P(X = 2) = P(A 2 ) Første terning 2 3 4 5 2 3 4 5 7 2 3 4 5 7 8 Andre 3 4 5 7 8 9 terning 4 5 7 8 9 0 5 7 8 9 0 7 8 9 0 2 x 2 3 4 5 7 8 9 0 2 3 2 3 4 5 5 4 3 2 f(x) 0 0 8 3.2 Diskrete sannsynlighetsfordelinger DEF 3.4: f(x) er sannsynlighetsfordelingen til den diskrete stokastiske variabelen X, dersom for alle mulige utfall x:. f(x) 0 2. x f(x) = 3. P(X = x) = f(x) (punktsannsynlighet) DEF 3.5: Den kumulative fordelingen F(x) til en diskret stokastisk variabel X med sannsynlighetsfordeling f(x) er F(x) = P(X x) = f(t) for < x <. t x
9 f(x) grafisk Stolpediagram og sannsynlighetshistogram 0.00 0.05 0.0 0.5 0.20 0.25 Density 0.00 0.05 0.0 0.5 2 4 8 0 2 2 4 8 0 2 x 2 3 4 5 7 8 9 0 2 3 2 3 4 5 5 4 3 2 f(x) 0 0 x 0 Kumulativ fordeling: sum to terninger 0.0 0.2 0.4 0. 0.8.0 0 2 4 8 0 2 x 2 3 4 5 7 8 9 0 2 3 f(x) 0 F(x) 0 2 3 3 4 0 5 5 2 5 2 4 30 3 33 2 0 35
Høyde til mannlige studenter 2 3.3 Kontinuerlige sannsynlighetsfordelinger DEF 3.: Funksjonen f(x) er sannsynlighetstettheten til den kontinuerlige stokastiske variabelen X, dersom. f(x) 0 for alle x R (reelle tall) 2. f(x)dx = 3. P(a < X < b) = b a f(x)dx. DEF 3.7: Den kumulative fordelingen F(x) til en kontinuerlig stokastisk variabel X med sannsynlighetstetthet f(x) er x F(x) = P(X x) = f(t)dt for < x <.
3 f(x) og F(x) fx 0.0 0. 0.2 0.3 0.4 Fx 0.0 0.2 0.4 0. 0.8.0 3 2 0 2 3 x 3 2 0 2 3 x 4 P(a < X b)
5 Togforsinkelsen (Eksamen Des2003.a) I denne oppgaven kan du bruke uten å vise det at 0 x r e ax dx = r! når a > 0 og r er et heltall 0 ar+ Vi betrakter ankomst- og oppholdstider for et bestemt lokaltog på en jernbanestasjon. Toget skal etter rutetabellen ankomme hver hverdag klokka 8:00, men kommer alltid etter dette tidspunktet. La X (minutter) betegne togets forsinkelse på en tilfeldig valgt hverdag. Vi antar at X er en stokastisk variabel med sannsynlighetstetthet { kxe 2x for x > 0 g(x) = 0 for x 0 der k > 0 er en konstant. i) Vis at k = 4. ii) Vis at sannsynligheten for at toget er mer enn 2 minutter forsinket er tilnærmet lik 0.09. g(x) og P(X > 2)
7 Oppsummering Diskret stokastisk variabel Kontinuerlig stokastisk variabel X X Mulige verdier x: Mulige verdier x: Endelig eller tellbart mange Intervall eller hele R Eksempel: Eksempel: {0,,...,n} [0, ] eller [0, ) Sannsynlighetsfordeling: Sannsynlighetsfordeling: f(x) = P(X = x) for alle mulige x f(x) definert for alle reelle x ved P(a < X < b) = b a f(x)dx Kumulativ fordeling: Kumulativ fordeling: F(x) = P(X x) = t x f(t) F(x) = P(X x) = x f(t)dt definert for alle reelle x definert for alle reelle x P(a < X b) = x (a,b] f(t) P(a < X b) = b a f(x)dx = F(b) F(a) = F(b) F(a) Hvis mulige verdier er heltall: Hvis f er kontinuerlig i x: f(x) = F(x) F(x ) f(x) = F (x) 8 3.4 Flerdimensjonale sannsynlighetsfordelinger Hittil: en stokastisk variabel ad gangen. Nå: hva om vi i et eksperiment observerer to eller flere stokastiske variable. Burde vi se på dem hver for seg, eller mister vi informasjon hvis vi ikke ser på dem sammen? Situasjoner: Togforsinkelse og opphold på stasjon (eksamen desember 2003) Høyde og vekt av personer. Aktivitet av gen A og gen B ved stimulus med hormon C. Gasstrykk, gassvolum og temperatur i kjemisk forsøk. Påkjenning og gjennomslagsspenning (Isolasjonsdimensjonering i faget Overspenninger og -vern) Aksjekurs for Trønderfrukt og Agderfrukt (eksamen juni 2004)
9 Kast med to terninger X = maksimum antall øyne Y = absoluttverdi av differanse i antall øyne Utfallsrom og verdier av X og (Y) (i parentes) første terning 2 3 4 5 (0) 2 () 3 (2) 4 (3) 5 (4) (5) 2 2 () 2 (0) 3 () 4 (2) 5 (3) (4) Andre 3 3 (2) 3 () 3 (0) 4 () 5 (2) (3) terning 4 4 (3) 4 (2) 4 () 4 (0) 5 () (2) 5 5 (4) 5 (3) 5 (2) 5 () 5 (0) () (5) (4) (3) (2) () (0) 20 Kast med to terninger (forts.) f(x,y) x 2 3 4 5 0 / / / / / / 0 2/ 2/ 2/ 2/ 2/ 2 0 0 2/ 2/ 2/ 2/ y 3 0 0 0 2/ 2/ 2/ 4 0 0 0 0 2/ 2/ 5 0 0 0 0 0 2/
2 Simultanfordeling f(x, y) DEF 3.8: Funksjonen f(x, y), er simultanfordelingen til to diskrete stokastiske variable X og Y, dersom. f(x, y) 0 for alle (x, y) 2. x y f(x, y) = 3. P(X = x Y = y) = P(X = x, Y = y) = f(x, y) (punktsannsynlighet) For enhver region A is xy-rommet så er P[(X, Y) A] = A f(x, y). DEF 3.9: Funksjonen f(x, y), er simultan sannsynlighetstetthet til to kontinuerlige stokastiske variable X og Y, dersom. f(x, y) 0 for alle (x, y) 2. f(x, y)dxdy = 3. P[(X, Y) A] = A f(x, y)dxdy for enhver region A i (x, y)-planet. 22 Elektriske komponenter X =levetid elektrisk komponent nr Y =levetid elektrisk komponent nr 2 f(x, y) = e (x+y) for x > 0 og y > 0 og 0 ellers. Oppfyller f(x, y) kravene til en simultan sannsynlighetstetthet? Hva er P(0 < X <, 0 < Y < )
23 Elektriske komponenter 24 Marginalfordelinger DEF 3.0: Marginalfordelingen for X alene og for Y alene er for det diskrete tilfellet: g(x) = y f(x, y) og h(y) = x f(x, y) og for det kontinuerlige tilfellet: g(x) = f(x, y)dy og h(y) = f(x, y)dx
25 Kast med to terninger (igjen) X = maksimum antall øyne Y = absoluttverdi av differanse i antall øyne Simultan sannsynlighetsfordeling f(x, y) x 2 3 4 5 h(y) 0 / / / / / / / 0 2/ 2/ 2/ 2/ 2/ 0/ 2 0 0 2/ 2/ 2/ 2/ 8/ y 3 0 0 0 2/ 2/ 2/ / 4 0 0 0 0 2/ 2/ 4/ 5 0 0 0 0 0 2/ 2/ g(x) / 3/ 5/ 7/ 9/ / / 2 Betingede fordelinger DEF 3.: La X og Y være to stokastiske variable, diskrete eller kontinuerlige. Den betingede fordelingen for den stokastiske variablen Y gitt at X = x er f(y x) = f(x, y) g(x), g(x) > 0 Den betingede fordelingen for den stokastiske variablen X gitt at Y = y er f(x y) = f(x, y) h(y), h(y) > 0
27 Uavhengighet, intuitivt! Hva skal vi mene med at to SV er uavhengige? For hendelser: P(A B) P(A B) = P(A) = P(A) P(B) For at X og Y er uavhengige er det naturlig å kreve at f(x y) ikke avhenger av y. Hva betyr dette for f(x y) og f(x, y)? f(x y) g(x) DEF = DEF = f(x, y) f(x, y) = h(y) f(x y) h(y) f(x y) = g(x) h(y) f(x y)dy = f(x y) h(y)dy = f(x y) Dermed: f(x, y) = h(y) g(x) 28 Uavhengighet DEF 3.2: La X og Y være to stokastiske variable, diskrete eller kontinuerlige, med simultan sannsynlighetsfordeling f(x, y), og marginale fordelinger g(x) og h(y). Da er X og Y uavhengige hvis og bare hvis for alle (x, y). f(x, y) = g(x) h(y) DEF 3.3: La X, X 2,..., X n være n stokastiske variable, diskrete eller kontinuerlige, med simultan sannsynlighetsfordeling f(x, x 2,..., x n ), og marginale fordelinger f (x ), f 2 (x 2 ),..., f n (x n ). Da er X, X 2,..., X n innbyrdes uavhengige hvis og bare hvis f(x, x 2,..., x n ) = f (x ) f 2 (x 2 ) f n (x n ) for alle (x, x 2,..., x n ).
29 To terninger, antall øyne X = antall øyne på terning Y = antall øyne på terning 2 Simultan sannsynlighetsfordeling f(x, y). 2 Andre 3 terning 4 Første terning 2 3 4 5 h(y) 5 g(x) 30 Togforsinkelsen, forts. La X (minutter) betegne togets forsinkelse på en tilfeldig valgt hverdag. Vi antar at X er en stokastisk variabel med sannsynlighetstetthet { 4xe 2x for x > 0 g(x) = 0 for x 0 La Y (minutter) være den tiden toget står på stasjonen. Oppholdstiden Y vil være influert av forsinkelsen, og vi antar at den betingede sannsynlighetstetthet f(y x) for Y, gitt at forsinkelsen X er lik x (> 0), er gitt ved { (x/2) e xy/2 for y > 0 f(y x) = 0 for y 0 iii) Sett opp simultantettheten f(x, y) for X og Y. iv) Finn sannsynlighetstettheten h(y) for oppholdstiden Y.
3 Togforsinkelsen: fordelinger f(y x) g(x) f(x, y) h(y) 32 Oppsummering 3.4 Funksjonen f(x, y), er simultan sannsynlighetsfordeling for X og Y. Marginalfordelinger: g(x) = y f(x, y) og h(y) = x f(x, y) diskret g(x) = f(x, y)dy og h(y) = f(x, y)dx kontinuerlig Betingede fordelinger: f(y x) = f(x, y)/g(x), g(x) > 0 f(x y) = f(x, y)/h(y), h(y) > 0 Uavhengighet: X og Y uavhengige hvis og bare hvis f(x, y) = g(x) h(y) for alle (x, y).