Forelesning 27. mars, 2017

Like dokumenter
TMA4240 Statistikk Høst 2009

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Midtveiseksamen i STK1100 våren 2017

TMA4240 Statistikk H2015

Gammafordelingen og χ 2 -fordelingen

FORMELSAMLING TIL STK1100 OG STK1110

Forelesning 3. april, 2017

TMA4240 Statistikk Høst 2015

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

Forelesning 13. mars, 2017

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

TMA4240 Statistikk. Øving nummer 7. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Løsning eksamen desember 2016

Oppfriskning av blokk 1 i TMA4240

FORMELSAMLING TIL STK1100 OG STK1110

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Poissonprosesser og levetidsfordelinger

To-dimensjonale kontinuerlige fordelinger

TMA4240 Statistikk Høst 2015

Forelening 1, kapittel 4 Stokastiske variable

TMA4245 Statistikk Eksamen desember 2016

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

TMA4240 Statistikk Høst 2016

Kapittel 2: Hendelser

Kap. 8: Utvalsfordelingar og databeskrivelse

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2013

Notasjon. Løsninger. Problem. Kapittel 7

TMA4240 Statistikk Høst 2009

Bernoulli forsøksrekke og binomisk fordeling

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Foreleses onsdag 8. september 2010

EKSAMEN I EMNE SIF5072 STOKASTISKE PROSESSER Lørdag 16. august 2003 Tid: 09:00 14:00

UNIVERSITETET I OSLO

TMA4240 Statistikk Høst 2008

Forslag til endringar

Bootstrapping og simulering Tilleggslitteratur for STK1100

TMA4240 Statistikk H2010

UNIVERSITETET I OSLO Matematisk Institutt

6.5 Normalapproksimasjon til. binomisk fordeling

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

TMA4240 Statistikk Eksamen desember 2015

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Løsning eksamen desember 2017

Eksempel: kast med to terninger

HØGSKOLEN I STAVANGER

Formelsamling i medisinsk statistikk

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Eksamensoppgave i TMA4240 Statistikk

TMA4245 Statistikk Høst 2016

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

La U og V være uavhengige standard normalfordelte variable og definer

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

FORMELSAMLING STATISTIKK, HiG Versjon per 10. januar 2002, ved Hornæs

6.1 Kontinuerlig uniform fordeling

TMA4240 Statistikk 2014

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Medisinsk statistikk Del I høsten 2009:

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Livsforsikring et eksempel på bruk av forventningsverdi

Statistikk 1 kapittel 5

ECON2130 Kommentarer til oblig

Bootstrapping og simulering

Dagens tekst. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Transformasjoner av stokastiske variabler

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Regneregler for forventning og varians

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Eksamensoppgåve i TMA4240 Statistikk

Kontinuerlige sannsynlighetsfordelinger.

TMA4240 Statistikk Eksamen desember 2015

STK juni 2018

Oppgave 1 a) La X være massen til et tilfeldig valgt egg, målt i gram. Sannsynligheten for at et tilfeldig valgt egg veier mer enn 60 g er

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Statistikk 1 kapittel 5

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

DEL 1 GRUNNLEGGENDE STATISTIKK

UNIVERSITETET I OSLO

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Normal- og eksponentialfordeling.

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

TMA4240 Statistikk Høst 2015

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100

Ekstraoppgaver for STK2120

TMA4245 Statistikk Vår 2007

Eksamensoppgave i TMA4295 Statistisk inferens

Løsningsforslag oblig 1 STK1110 høsten 2014

Transkript:

Forelesning 27. mars, 2017 AVSNITT 5.5 Ordningsobservatorene AVSNITT 6.1 Observatorer og deres fordelinger

Ordningsobservatorene La X 1,..., X n være n uavhengige stokastiske variable som alle har samme marginalfordeling f (x), og kumulative fordelingsfunksjon F(x). Vi tenker oss så at vi ordner X-ene i stigende rekkefølge, og innfører: Y 1 = Den minste verdien av X 1,..., X n Y 2 = Den nest-minste verdien av X 1,..., X n Y n = Den største verdien av X 1,..., X n Vi er interessert i å finne simultanfordelingen til Y 1,..., Y n, samt marginalfordelingen til Y 1 og Y n.

Ordningsobservatorene Vi lar G i (y) = P(Y i y), i = 1,..., n, og ser først på G n (y). G n (y) = P(Y n y) = P(X 1 y,..., X n y) = P(X 1 y) P(X n y) = F (y) F(y) = [F(y)] n Herav får vi att tettheten til Y n er gitt ved: g n (y) = n[f(y)] n 1 f (y)

Ordningsobservatorene Vi ser så på G 1 (y): 1 G 1 (y) = P(Y 1 > y) = P(X 1 > y,..., X n > y) = P(X 1 > y) P(X n > y) = [1 F(y)] [1 F(y)] = [1 F(y)] n Dvs. G 1 (y) = 1 [1 F(y)] n. Herav får vi att tettheten til Y 1 er gitt ved: g 1 (y) = n[1 F(y)] n 1 ( f (y)) = n[1 F(y)] n 1 f (y)

Ordningsobservatorene Eksempel 1 EKSEMPEL: Betrakt et system av n komponenter som alle har samme levetidsfordeling: f X (x) = λe λx, x > 0. Da er den kumulative fordelingsfunksjonen gitt ved: F X (x) = 1 e λx, x > 0. Y 1 = min{x 1,..., X n } (levetid for et seriesystem) Y n = max{x 1,..., X n } (levetid for et parallellsystem). Da er tetthetene for Y 1 og Y n gitt ved: g 1 (y) = n[1 F(y)] n 1 f (y) = (nλ)e nλy g n (y) = n[f(y)] n 1 f (y) = n[1 e λy ] n 1 λe λy.

Ordningsobservatorene Eksempel 1 Tettheten for Y 1 : (λ = 0.5, n = 5) 2.50 2.00 1.50 1.00 0.50 0.00 0.00 1.00 2.00 3.00 4.00

Ordningsobservatorene Eksempel 1 Tettheten for Y 5 : (λ = 0.5, n = 5) 0.22 0.18 0.14 0.09 0.05 0.00 0.00 4.00 8.00 12.00 16.00 20.00

Ordningsobservatorene Eksempel 2 EKSEMPEL: Betrakt et system av n komponenter som alle har samme levetidsfordeling: f X (x) = λx, 0 < x < 2/λ. Da er den kumulative fordelingsfunksjonen gitt ved: F X (x) = 1 2 λx 2, 0 < x < 2/λ. Y 1 = min{x 1,..., X n } (levetid for et seriesystem) Y n = max{x 1,..., X n } (levetid for et parallellsystem). Da er tetthetene for Y 1 og Y n gitt ved: g 1 (y) = n[1 F(y)] n 1 f (y) = n[1 1 2 λy 2 ] n 1 λy g n (y) = n[f(y)] n 1 f (y) = n[ 1 2 λy 2 ] n 1 λy.

Ordningsobservatorene Eksempel 2 Tettheten for Y 1 : (λ = 0.5, n = 5) 1.25 1.00 0.75 0.50 0.25 0.00 0.00 0.40 0.80 1.20 1.60 2.00

Ordningsobservatorene Eksempel 2 Tettheten for Y 5 : (λ = 0.5, n = 5) 5.00 4.00 3.00 2.00 1.00 0.00 0.00 0.40 0.80 1.20 1.60 2.00

Simultantettheten for ordningsobservatorene Simultantettheten for Y 1,..., Y n : g(y 1,..., y n ) = { n! f (y1 ) f (y n ) y 1 < < y n 0 ellers Spesielt hvis n = 2: g(y 1, y 2 ) = { 2! f (y1 ) f (y 2 ) y 1 < y 2 0 ellers

Simultantettheten for ordningsobservatorene La > 0 være et lite tall, og la y 1 < y 2 y n. Vi skal finne: P[Y 1 (y 1, y 1 + ],..., Y n (y n, y n + ]] La så π : {1,..., n} {1,..., n} betegne en vilkårlig permutasjon av tallene 1,..., n. Vi har da: P[Y 1 (y 1, y 1 + ],..., Y n (y n, y n + ]] = Alle π P[X π(1) (y 1, y 1 + ],..., X π(n) (y n, y n + ]] = n! f (y 1 ) f (y n ). Dividerer vi med n på begge sider av ligningen og lar 0, får vi tettheten til Y 1,..., Y n.

Tettheten for den ite minste ordningsobservatoren Tettheten for Y i er gitt ved: HUSK: g(y) = g 1 (y) = g n (y) = n! (i 1)!(n i)! [F(y)]i 1 [1 F(y)] n i f (y). n! (1 1)!(n 1)! [F(y)]1 1 [1 F(y)] n 1 f (y) = n[1 F(y)] n 1 f (y) n! (n 1)!(n n)! [F(y)]n 1 [1 F(y)] n n f (y) = n[f(y)] n 1 f (y)

Tettheten for den ite minste ordningsobservatoren La > 0 være et lite tall. Vi skal finne P[Y i (y, y + ]]. Vi kan tenke på denne situasjonen som en trinomisk forsøksrekke, der ite forsøk betår i å observere X i og sjekke om en av tre muligheter har inntruffet: X i y. Dette har sannsynlighet F(y). X i (y, y + ]. Dette har sannsynlighet f (y). X i > y +. Dette har sannsynlighet 1 F(y + ). For at begivenheten {Y i (y, y + ]} skal inntreffe, må {X i y} inntreffe (i 1) ganger, {X i (y, y + ]} inntreffe nøyaktig en gang, og {X i > y + } inntreffe (n i) ganger.

Tettheten for den ite minste ordningsobservatoren Dette gir følgende trinomiske sannsynlighet: P[Y i (y, y + ]] = n! (i 1)!1!(n i)! [F(y)]i 1 [f (y) ] [1 F (y + )] n i Vi kan så dividere med på begge sider, og la 0. Dette gir formelen for tettheten til Y i.

Ordningsobservatorene Eksempel 1 EKSEMPEL: Betrakt et system av n komponenter som alle har samme levetidsfordeling: f X (x) = λe λx, x > 0. Da er den kumulative fordelingsfunksjonen gitt ved: F X (x) = 1 e λx, x > 0. Y i = den i-te minste av X j -ene (levetid for et (n i + 1)-av-n-system) Da er tetthetene for Y i gitt ved: g i (y) = = = n! (i 1)!(n i)! [F (y)]i 1 [1 F(y)] n i f (y) n! (i 1)!(n i)! [1 e λy ] i 1 e (n i)λy λe λy n! (i 1)!(n i)! [1 e λy ] i 1 λ e (n i+1)λy

Ordningsobservatorene Eksempel 1 Tetthetene for Y 1,..., Y 5 : (λ = 0.5, n = 5) 2.50 2.00 1.50 1.00 0.50 0.00 0.00 0.80 1.60 2.40 3.20 4.00

Ordningsobservatorene Eksempel 2 EKSEMPEL: Betrakt et system av n komponenter som alle har samme levetidsfordeling: f X (x) = λx, 0 < x < 2/λ. Da er den kumulative fordelingsfunksjonen gitt ved: F X (x) = 1 2 λx 2, 0 < x < 2/λ. Y i = den i-te minste av X j -ene (levetid for et (n i + 1)-av-n-system) Da er tetthetene for Y i gitt ved: g i (y) = = n! (i 1)!(n i)! [F(y)]i 1 [1 F (y)] n i f (y) n! (i 1)!(n i)! [1 2 λy 2 ] i 1 [1 1 2 λy 2 ] n i λy

Ordningsobservatorene Eksempel 2 Tetthetene for Y 1,..., Y 5 : (λ = 0.5, n = 5) 5.00 4.00 3.00 2.00 1.00 0.00 0.00 0.40 0.80 1.20 1.60 2.00

Simultantettheten for den ite og den jte ordningsobservatoren Vi antar at 1 i < j n, og skal finne simultantettheten for Y i og Y j. For y i < y j er denne gitt ved: g(y i, y j ) = n! (i 1)!(j i 1)(n j)! [F(y i )] i 1 [F(y j ) F(y i )] j i 1 [1 F (y j )] n j f (y i ) f (y j ).

Simultantettheten for den ite og den jte ordningsobservatoren La > 0 være et lite tall, og la y i < y j. Vi skal finne: P[Y i (y i, y i + ], Y j (y j, y j + ]]. Vi kan tenke på denne situasjonen som en multinomisk forsøksrekke, der ite forsøk betår i å observere X i og sjekke: X i y i. Dette har sannsynlighet F(y i ). X i (y i, y i + ]. Dette har sannsynlighet f (y i ). X i (y i +, y j ]. Dette har sannsynlighet F(y j ) F (y i + ). X i (y j, y j + ]. Dette har sannsynlighet f (y j ). X i > y j +. Dette har sannsynlighet 1 F(y j + ). For at begivenheten {Y i (y i, y i + ], Y j (y j, y j + ]} skal inntreffe, må {X i y} inntreffe (i 1) ganger, {X i (y i, y i + ]} inntreffe nøyaktig en gang, {X i (y i +, y j ]} inntreffe (j i 1) ganger, {X i (y j, y j + ]} inntreffe nøyaktig en gang, og {X i > y j + } inntreffe (n j) ganger.

Observatorer og deres fordelinger En observator [engelsk: statistic] er en størrelse som kan beregnes ut fra et sett med data. Før vi observerer datasettet er det selvsagt knyttet usikkerhet til hvilke dataverdier vi vil observere. En observator betraktes på dette stadiet som en stokastisk variabel, og betegnes da med stor bokstav. Så snart data er samlet inn, kan vi beregne verdien av observatoren. Denne verdien betegnes da med liten bokstav.

Observatorer empiriske størrelser EMPIRISK FORVENTNINGSVERDI: X = 1 n n i=1 X i EMPIRISK MEDIAN: Finn ordningsobservatoren Y 1,..., Y n. Empirisk median = Y n/2 + Y n/2+1 2 (n like) eller Y (n+1)/2 (n odde) EMPIRISK VARIANS: S 2 = 1 n 1 n (X i X) 2 i=1 EMPIRISK STANDARDAVVIK: S = S 2

Observatorer Eksempel EKSEMPEL: La X 1,..., X 10 være uavhengige og Weibull-fordelte med parametre α = 3 (formparameter) og β = 2 (skalaparameter). Tettheten til X 1,..., X 10 blir dermed: Da blir: f (x; α, β) = { α β α x α 1 e (x/β)α x 0 0 eller E[X i ] = β Γ(1 + 1 α ) = 2 Γ(1 + 1 3 ) = 1.786 MED[X i ] = β (ln(2)) 1/α = 2 (ln(2)) 1/3 = 1.770 Vi simulerer X 1,..., X 10 5000 ganger og beregner empirisk middelverdi, median, varians og standardavvik i hver simulering.

Observatorer Eksempel Histogram for X: (α = 3, β = 2, n = 10) 17.5 % 15.8 % 14.0 % 12.3 % 10.5 % 8.8 % 7.0 % 5.3 % 3.5 % 1.8 % 0.0 % 1.00 1.35 1.70 2.05 2.40 2.75 Middelverdi av middelverdiene er 1.78.

Observatorer Eksempel Histogram for empirisk MED(X): (α = 3, β = 2, n = 10) 17.5 % 15.8 % 14.0 % 12.3 % 10.5 % 8.8 % 7.0 % 5.3 % 3.5 % 1.8 % 0.0 % 0.75 1.15 1.55 1.95 2.35 2.75 Middelverdi av de empiriske medianverdiene er 1.77.

Observatorer Eksempel Histogram for empirisk V (X): (α = 3, β = 2, n = 10) 17.5 % 15.8 % 14.0 % 12.3 % 10.5 % 8.8 % 7.0 % 5.3 % 3.5 % 1.8 % 0.0 % 0.00 0.30 0.60 0.90 1.20 1.50 Middelverdi av de empiriske variansene er 0.42.

Observatorer Eksempel Histogram for empirisk SD(X): (α = 3, β = 2, n = 10) 15.0 % 13.5 % 12.0 % 10.5 % 9.0 % 7.5 % 6.0 % 4.5 % 3.0 % 1.5 % 0.0 % 0.18 0.38 0.58 0.79 1.00 1.20 Middelverdi av de empiriske standardavvikene er 0.63.