Forelesning 27. mars, 2017 AVSNITT 5.5 Ordningsobservatorene AVSNITT 6.1 Observatorer og deres fordelinger
Ordningsobservatorene La X 1,..., X n være n uavhengige stokastiske variable som alle har samme marginalfordeling f (x), og kumulative fordelingsfunksjon F(x). Vi tenker oss så at vi ordner X-ene i stigende rekkefølge, og innfører: Y 1 = Den minste verdien av X 1,..., X n Y 2 = Den nest-minste verdien av X 1,..., X n Y n = Den største verdien av X 1,..., X n Vi er interessert i å finne simultanfordelingen til Y 1,..., Y n, samt marginalfordelingen til Y 1 og Y n.
Ordningsobservatorene Vi lar G i (y) = P(Y i y), i = 1,..., n, og ser først på G n (y). G n (y) = P(Y n y) = P(X 1 y,..., X n y) = P(X 1 y) P(X n y) = F (y) F(y) = [F(y)] n Herav får vi att tettheten til Y n er gitt ved: g n (y) = n[f(y)] n 1 f (y)
Ordningsobservatorene Vi ser så på G 1 (y): 1 G 1 (y) = P(Y 1 > y) = P(X 1 > y,..., X n > y) = P(X 1 > y) P(X n > y) = [1 F(y)] [1 F(y)] = [1 F(y)] n Dvs. G 1 (y) = 1 [1 F(y)] n. Herav får vi att tettheten til Y 1 er gitt ved: g 1 (y) = n[1 F(y)] n 1 ( f (y)) = n[1 F(y)] n 1 f (y)
Ordningsobservatorene Eksempel 1 EKSEMPEL: Betrakt et system av n komponenter som alle har samme levetidsfordeling: f X (x) = λe λx, x > 0. Da er den kumulative fordelingsfunksjonen gitt ved: F X (x) = 1 e λx, x > 0. Y 1 = min{x 1,..., X n } (levetid for et seriesystem) Y n = max{x 1,..., X n } (levetid for et parallellsystem). Da er tetthetene for Y 1 og Y n gitt ved: g 1 (y) = n[1 F(y)] n 1 f (y) = (nλ)e nλy g n (y) = n[f(y)] n 1 f (y) = n[1 e λy ] n 1 λe λy.
Ordningsobservatorene Eksempel 1 Tettheten for Y 1 : (λ = 0.5, n = 5) 2.50 2.00 1.50 1.00 0.50 0.00 0.00 1.00 2.00 3.00 4.00
Ordningsobservatorene Eksempel 1 Tettheten for Y 5 : (λ = 0.5, n = 5) 0.22 0.18 0.14 0.09 0.05 0.00 0.00 4.00 8.00 12.00 16.00 20.00
Ordningsobservatorene Eksempel 2 EKSEMPEL: Betrakt et system av n komponenter som alle har samme levetidsfordeling: f X (x) = λx, 0 < x < 2/λ. Da er den kumulative fordelingsfunksjonen gitt ved: F X (x) = 1 2 λx 2, 0 < x < 2/λ. Y 1 = min{x 1,..., X n } (levetid for et seriesystem) Y n = max{x 1,..., X n } (levetid for et parallellsystem). Da er tetthetene for Y 1 og Y n gitt ved: g 1 (y) = n[1 F(y)] n 1 f (y) = n[1 1 2 λy 2 ] n 1 λy g n (y) = n[f(y)] n 1 f (y) = n[ 1 2 λy 2 ] n 1 λy.
Ordningsobservatorene Eksempel 2 Tettheten for Y 1 : (λ = 0.5, n = 5) 1.25 1.00 0.75 0.50 0.25 0.00 0.00 0.40 0.80 1.20 1.60 2.00
Ordningsobservatorene Eksempel 2 Tettheten for Y 5 : (λ = 0.5, n = 5) 5.00 4.00 3.00 2.00 1.00 0.00 0.00 0.40 0.80 1.20 1.60 2.00
Simultantettheten for ordningsobservatorene Simultantettheten for Y 1,..., Y n : g(y 1,..., y n ) = { n! f (y1 ) f (y n ) y 1 < < y n 0 ellers Spesielt hvis n = 2: g(y 1, y 2 ) = { 2! f (y1 ) f (y 2 ) y 1 < y 2 0 ellers
Simultantettheten for ordningsobservatorene La > 0 være et lite tall, og la y 1 < y 2 y n. Vi skal finne: P[Y 1 (y 1, y 1 + ],..., Y n (y n, y n + ]] La så π : {1,..., n} {1,..., n} betegne en vilkårlig permutasjon av tallene 1,..., n. Vi har da: P[Y 1 (y 1, y 1 + ],..., Y n (y n, y n + ]] = Alle π P[X π(1) (y 1, y 1 + ],..., X π(n) (y n, y n + ]] = n! f (y 1 ) f (y n ). Dividerer vi med n på begge sider av ligningen og lar 0, får vi tettheten til Y 1,..., Y n.
Tettheten for den ite minste ordningsobservatoren Tettheten for Y i er gitt ved: HUSK: g(y) = g 1 (y) = g n (y) = n! (i 1)!(n i)! [F(y)]i 1 [1 F(y)] n i f (y). n! (1 1)!(n 1)! [F(y)]1 1 [1 F(y)] n 1 f (y) = n[1 F(y)] n 1 f (y) n! (n 1)!(n n)! [F(y)]n 1 [1 F(y)] n n f (y) = n[f(y)] n 1 f (y)
Tettheten for den ite minste ordningsobservatoren La > 0 være et lite tall. Vi skal finne P[Y i (y, y + ]]. Vi kan tenke på denne situasjonen som en trinomisk forsøksrekke, der ite forsøk betår i å observere X i og sjekke om en av tre muligheter har inntruffet: X i y. Dette har sannsynlighet F(y). X i (y, y + ]. Dette har sannsynlighet f (y). X i > y +. Dette har sannsynlighet 1 F(y + ). For at begivenheten {Y i (y, y + ]} skal inntreffe, må {X i y} inntreffe (i 1) ganger, {X i (y, y + ]} inntreffe nøyaktig en gang, og {X i > y + } inntreffe (n i) ganger.
Tettheten for den ite minste ordningsobservatoren Dette gir følgende trinomiske sannsynlighet: P[Y i (y, y + ]] = n! (i 1)!1!(n i)! [F(y)]i 1 [f (y) ] [1 F (y + )] n i Vi kan så dividere med på begge sider, og la 0. Dette gir formelen for tettheten til Y i.
Ordningsobservatorene Eksempel 1 EKSEMPEL: Betrakt et system av n komponenter som alle har samme levetidsfordeling: f X (x) = λe λx, x > 0. Da er den kumulative fordelingsfunksjonen gitt ved: F X (x) = 1 e λx, x > 0. Y i = den i-te minste av X j -ene (levetid for et (n i + 1)-av-n-system) Da er tetthetene for Y i gitt ved: g i (y) = = = n! (i 1)!(n i)! [F (y)]i 1 [1 F(y)] n i f (y) n! (i 1)!(n i)! [1 e λy ] i 1 e (n i)λy λe λy n! (i 1)!(n i)! [1 e λy ] i 1 λ e (n i+1)λy
Ordningsobservatorene Eksempel 1 Tetthetene for Y 1,..., Y 5 : (λ = 0.5, n = 5) 2.50 2.00 1.50 1.00 0.50 0.00 0.00 0.80 1.60 2.40 3.20 4.00
Ordningsobservatorene Eksempel 2 EKSEMPEL: Betrakt et system av n komponenter som alle har samme levetidsfordeling: f X (x) = λx, 0 < x < 2/λ. Da er den kumulative fordelingsfunksjonen gitt ved: F X (x) = 1 2 λx 2, 0 < x < 2/λ. Y i = den i-te minste av X j -ene (levetid for et (n i + 1)-av-n-system) Da er tetthetene for Y i gitt ved: g i (y) = = n! (i 1)!(n i)! [F(y)]i 1 [1 F (y)] n i f (y) n! (i 1)!(n i)! [1 2 λy 2 ] i 1 [1 1 2 λy 2 ] n i λy
Ordningsobservatorene Eksempel 2 Tetthetene for Y 1,..., Y 5 : (λ = 0.5, n = 5) 5.00 4.00 3.00 2.00 1.00 0.00 0.00 0.40 0.80 1.20 1.60 2.00
Simultantettheten for den ite og den jte ordningsobservatoren Vi antar at 1 i < j n, og skal finne simultantettheten for Y i og Y j. For y i < y j er denne gitt ved: g(y i, y j ) = n! (i 1)!(j i 1)(n j)! [F(y i )] i 1 [F(y j ) F(y i )] j i 1 [1 F (y j )] n j f (y i ) f (y j ).
Simultantettheten for den ite og den jte ordningsobservatoren La > 0 være et lite tall, og la y i < y j. Vi skal finne: P[Y i (y i, y i + ], Y j (y j, y j + ]]. Vi kan tenke på denne situasjonen som en multinomisk forsøksrekke, der ite forsøk betår i å observere X i og sjekke: X i y i. Dette har sannsynlighet F(y i ). X i (y i, y i + ]. Dette har sannsynlighet f (y i ). X i (y i +, y j ]. Dette har sannsynlighet F(y j ) F (y i + ). X i (y j, y j + ]. Dette har sannsynlighet f (y j ). X i > y j +. Dette har sannsynlighet 1 F(y j + ). For at begivenheten {Y i (y i, y i + ], Y j (y j, y j + ]} skal inntreffe, må {X i y} inntreffe (i 1) ganger, {X i (y i, y i + ]} inntreffe nøyaktig en gang, {X i (y i +, y j ]} inntreffe (j i 1) ganger, {X i (y j, y j + ]} inntreffe nøyaktig en gang, og {X i > y j + } inntreffe (n j) ganger.
Observatorer og deres fordelinger En observator [engelsk: statistic] er en størrelse som kan beregnes ut fra et sett med data. Før vi observerer datasettet er det selvsagt knyttet usikkerhet til hvilke dataverdier vi vil observere. En observator betraktes på dette stadiet som en stokastisk variabel, og betegnes da med stor bokstav. Så snart data er samlet inn, kan vi beregne verdien av observatoren. Denne verdien betegnes da med liten bokstav.
Observatorer empiriske størrelser EMPIRISK FORVENTNINGSVERDI: X = 1 n n i=1 X i EMPIRISK MEDIAN: Finn ordningsobservatoren Y 1,..., Y n. Empirisk median = Y n/2 + Y n/2+1 2 (n like) eller Y (n+1)/2 (n odde) EMPIRISK VARIANS: S 2 = 1 n 1 n (X i X) 2 i=1 EMPIRISK STANDARDAVVIK: S = S 2
Observatorer Eksempel EKSEMPEL: La X 1,..., X 10 være uavhengige og Weibull-fordelte med parametre α = 3 (formparameter) og β = 2 (skalaparameter). Tettheten til X 1,..., X 10 blir dermed: Da blir: f (x; α, β) = { α β α x α 1 e (x/β)α x 0 0 eller E[X i ] = β Γ(1 + 1 α ) = 2 Γ(1 + 1 3 ) = 1.786 MED[X i ] = β (ln(2)) 1/α = 2 (ln(2)) 1/3 = 1.770 Vi simulerer X 1,..., X 10 5000 ganger og beregner empirisk middelverdi, median, varians og standardavvik i hver simulering.
Observatorer Eksempel Histogram for X: (α = 3, β = 2, n = 10) 17.5 % 15.8 % 14.0 % 12.3 % 10.5 % 8.8 % 7.0 % 5.3 % 3.5 % 1.8 % 0.0 % 1.00 1.35 1.70 2.05 2.40 2.75 Middelverdi av middelverdiene er 1.78.
Observatorer Eksempel Histogram for empirisk MED(X): (α = 3, β = 2, n = 10) 17.5 % 15.8 % 14.0 % 12.3 % 10.5 % 8.8 % 7.0 % 5.3 % 3.5 % 1.8 % 0.0 % 0.75 1.15 1.55 1.95 2.35 2.75 Middelverdi av de empiriske medianverdiene er 1.77.
Observatorer Eksempel Histogram for empirisk V (X): (α = 3, β = 2, n = 10) 17.5 % 15.8 % 14.0 % 12.3 % 10.5 % 8.8 % 7.0 % 5.3 % 3.5 % 1.8 % 0.0 % 0.00 0.30 0.60 0.90 1.20 1.50 Middelverdi av de empiriske variansene er 0.42.
Observatorer Eksempel Histogram for empirisk SD(X): (α = 3, β = 2, n = 10) 15.0 % 13.5 % 12.0 % 10.5 % 9.0 % 7.5 % 6.0 % 4.5 % 3.0 % 1.5 % 0.0 % 0.18 0.38 0.58 0.79 1.00 1.20 Middelverdi av de empiriske standardavvikene er 0.63.