Ukeoppgaver i Statistikk, uke 8 : Normal- og eksponentialfordeling. 1 Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke 8 I løpet av uken blir løsningsforslag lagt ut på emnesiden http://www.hig.no/toel/allmennfag/emnesider/smf2121 Normal- og eksponentialfordeling. Oppgave 1 5 er oppgaver om grunnleggende teknikk ved behandling av normalfordeling. Det er viktig å beherske dette stoffet. Oppgave 6 og 7 er noe vanskeligere oppgaver om eksponentialfordeling. Prøv så mye du rekker med rimelig arbeidsinnsats, men ikke fortvil om du ikke klarer alt. Oppgave 1 Anta Z N(0, 1), dvs. Z er standard normalfordelt. Regn ut sannsynlighetene: a) P(Z 1.50) b) P (Z > 1.50) c) P (Z 0.25) d) P(Z > 0.25) e) P ( 0.75 < Z 0.75) f) P (Z = 0.75). Sørg for at du behersker denne regneteknikken så fort som mulig. Flere oppgaver av samme type i oppgave 21, kap. 5.12 i Løvås. Oppgave 2 a ) Finn tallet z 0.25 som er slik at P (Z <z 0.25 )=0.75 når Z N(0, 1). b ) Finn tallet z 0.025 slik at P (Z >z 0.025 )=0.025 når Z N(0, 1). Oppgave 3 Måleverdien av spenningen på et bilbatteri er X, som er N (12.70, ). Regn ut P(12.50 <X 12.90) Sørg for at du behersker denne regneteknikken så fort som mulig. Flere oppgaver av samme type i oppgave 23, kap. 5.12 i Løvås. Oppgave 4 Anta X N(μ, ), og regn ut a) P(μ <X<μ+ ). b) P(μ 2 <X<μ+2). c) P(μ 3 <X<μ+3). Oppgave 5 La X N(12.70, ). Finn en k slik at P(12.70 k X 12.70 + k) =0.95
2 Ukeoppgaver i Statistikk, uke 8 : Normal- og eksponentialfordeling. Oppgave 6 Levetiden T til en bestemt type lyspærer antas eksponentialfordelt, med parameter λ = 0.0004 (med enhet timer 1 ). a ) Skriv opp sannsynlighetstettheten f(t) og sannsynlighetsfunksjonen F (t) i dette tilfellet. b ) Finn forventningsverdien og standardavviket til T. c ) Hvis vi har et stort antall slike lyspærer som settes i gang på likt, og får ståålyse.hvorlang tid forventer vi det tar før halvparten av disse lyspærene er røket? Dette kalles halveringstiden, eller medianen. d ) Regn ut P (2000 T 3000) ved hjelp av f(t) ogintegrasjon. e ) Regn ut P (2000 T 3000) ved hjelp av F (t). f ) Finn en formel for P (T >t)ogregnutp(t>1000), P (T >2000) og P (T >3000). g ) La hendelse A være T > 2000 og hendelse B være T > 3000. Hvordan kan du kort beskrive hendelsen A B? h ) Finn den betingede sannsynligheten P (B A) (som også kanskrivesp(t>3000 T >2000)). Oppgave 7 La den stokastiske variabelen T væreen levetid, tid framtil sammenbrudd, dødsfall, ulykke e.l. for et eller annet. Da er P (t T t +Δt T>t) sannsynligheten dødsfall i det neste tidsrommet av lengde Δt gitt overlevelse fram til tidspunktet t. Da kalles P(t T t +Δt T>t) h(t) = lim Δt 0 Δt risikoraten (eller feilraten, eng: hazard rate) til T, og uttrykker dødsrisikoen per tidsenhet ved tidspunktet t. Hvis f(t) er sannsynlighetstettheten og F (t) er sannsynlighetsfunksjonen til t kan vi finne følgende formel for h(t): h(t) = f(t) a) Anta T exp(λ). Regn ut h(t). b ) En stokastisk variabel kalles Weibullfordelt med parametre α og β om F (t) =1 e tβ /α, og dermed f(t) = βtβ 1 /α α e tβ for t 0. Finn feilraten h(t) for en slik fordeling. c) Vis at P(t T t +Δt T>t) lim = f(t) Δt 0 Δt d) La T er levetiden til en vilkårlig nyfødt person. Angi uformelt og omtrentlig hvordan grafen til h(t) blir seende ut. e ) Motsatt problemstilling av a) og b) oppgaven: Risikoraten h(t) er gitt, finn f(t) ogf (t). Forsøk å gjennomføre dette (gjerne ved hjelp av Maple) hvis vi antar h(t) =λ (for t 0) der λ>0 er en konstant. Hint: F (t) =f(t), og vi får en differensiallikning med y = F (t) som ukjent funksjon. Forslag til flere oppgaver fra læreboka, kapittel 5: Normalfordeling: 21, 23, 26. Eksponentialfordeling: 18. 18.02.10 Hans Petter Hornæs
Ukeoppgaver i Statistikk, uke 8 : Normal- og eksponentialfordeling. 3 Løsning, Normal- og eksponentialfordeling. Oppgave 1 a) P(Z 1.50) = Φ(1.50) Tabell5.1.1 = 0.9332 b) P(Z>1.50) = P ( Z 1.50 ) =1 P(Z 1.50) = 1 0.9332 = 0.0668 c) P(Z 0.25) = Φ( 0.25) = 1 Φ(0.25) Tabell5.1 = 1 0.5987 = 0.4013 d) P(Z> 0.25) = P ( Z 0.25 ) =1 P(Z 0.25) = 1 0.4013 = 0.5987 e) P( 0.75 <Z 0.75) = Φ(0.75) Φ( 0.75) = 0.7734 (1 0.7734) = 2 0.7734 1=0.5468 f) 0 (fordi enkeltverdier har sanns. 0 i kontinuerlig fordeling, eller alternativt at dette kan regnes ut som P (X =0.75) = P (0.75 X 0.75) = Φ(0.75) Φ(0.75) = 0) Oppgave 2 a) Vi må bruke tabell 5.1.1 baklengs, og finne det tallet som er nærmest 0.7500 midt inne i tabellen. Vi finnerat Φ(0.67) = 0.7486, og Φ(0.68) = 0.7517. Hvilket som helst av disse tallene, eller tall mellom disse godtas. Siden 0.75 er omtrent midt imellom foreslår jeg z = 0.675 (Nøyaktigere regning med Maple gir 0.6745). b) P(Z > z)= 0.025 P(Z z) = 1 0.025 Φ(z) = 0.975. Baklengs tabellbruk gir da at z 0.025 =1.96. Det er imidlertid greiere å bruke fraktiltabellen, tabell 5.2 i formelsamlinga. Denne gir denne verdien direkte for enkelte verdier, og vi kan lese av 1.960 under 2.5% = 0.025. Oppgave 3 ( ) ( ) 12.90 12.70 12.50 12.70 Φ Φ =Φ(0.67) Φ( 0.67) = 2 Φ(0.67) 1=0.4972 Oppgave 4 a) ( ) ( ) μ + μ μ + μ Φ Φ =Φ(1) Φ( 1) = 2Φ(1) 1=2 0.8413 1=0.6827 b) Φ(2) Φ( 2) = 0.9545 c) Φ(3) Φ( 3) = 0.9973. Oppgave 5 Uttrykker først sannsynligheten ved hjelp av Φ: ( ) ( ) 12.70 + k 12.70 12.70 k 12.70 P(12.70 k X 12.70 + k) =Φ Φ =Φ(k/) Φ( k/) = Φ(k/) (1 Φ(k/)) = 2Φ(k/) 1 Vi får dermed en likning vi først løser med hensyn på Φ(k/) 2Φ(k/) 1 = 0.95 Φ(k/) = (1 + 0.95)/2 Φ(k/) = 0.975 Siden Φ går på sannsynligheten for Z<z, mens fraktiltabellen (tab. 5.2) tar utgangspunkt i Z>z vrir vi sannsynligheten: P(Z<k/) = 0.975 P(Z>k/) = 1 0.975 = 0.025
4 Ukeoppgaver i Statistikk, uke 8 : Normal- og eksponentialfordeling. Dermed er k/ = z 0.025, dvs. 0.025 fraktilen i standard normalfordeling. z 0.025 finner vi fra tabell 5.2 som z 0.025 =1.960. Dette gir da k =1.960 = 0.588 (slik at intervallet blir 12.70 0.588 <X<12.70 + 0.588 12.11 <X<13.29). Mange vil nok synes argumentet er mer oversiktlig ved åhenvisetilenfigur: 0.950 0.025 0.025 12 µ k 12,5 µ 13 µ + k 13,5 x Siden sannsynligheten er 0.95 for at utfallet ligger mellom grensene, er sannsynligheten 1 0.95 = 0.05 for at utfallet blir utenfor. Denne sannsynligheten fordeles likt, med 0.05/2 = 0.025 på begge sider. Spesielt blir det en sannsynlighet på 0.025 for at utfallet blir større enn μ + k: ( X μ P(X μ + k) =0.025 P μ + k μ ) =0.025. De to sannsynligheten er like da det er samme hendelse, vi har trukket fra samme tall og dividert med samme positive tall på begge sider av likhetstegnet. Siden Z = X μ N(0, 1) (og μ ene nulles ut) er altså ( P Z k ) =0.025 Siden z 0.025 per definisjon er det entydige tallet som oppfyller P (Z z 0.025 )=0.025 er k = z 0.025 k = z 0.025 =1.960 = 0.588. Oppgave 6 a) f(t) =0.0004e 0.0004t F (t) =1 e 0.0004t (for t 0, 0 for t<0). (for t 0, 0 for t<0). b) E(T )=1/λ =1/0.0004 = 2500 (timer). =1/λ = 2500 (timer). c) t =ln(2)/λ = 2500 ln(2) = 1733 (timer). d) 3000 2000 0.0004e 0.0004t dt = [ e 0.0004t] 3000 2000 = e 0.0004 3000 ( e 0.0004 2000) =0.1481.
Ukeoppgaver i Statistikk, uke 8 : Normal- og eksponentialfordeling. 5 e) P (2000 T 3000) = F (3000) F (2000) = ( 1 e 0.0004 3000) ( 1 e 0.0004 2000) =0.1481. f) P(T>t)=P ( T t ) ( =1 P(T t) =1 F (t) =1 1 e λ t) = e λt = e 0.0004t. Dermed er P (T >1000) = e 0.0004 1000 = e 0.4 =0.6703, P (T >2000) = e 0.8 =0.4493. P(T>3000) = e 1.2 =12 g ) Siden B A (en lyspære som varer minst 3000 timer har allerede vart minst 2000 timer) er B A = B. P(A B) h) P(B A) = = P(B) P(A) P(A) = 0.4493 12 =0.6703. Kommentar: Merk at dette er det samme som P (T >1000), sannsynligheten for at en lyspære som har lyst i 2000 timer skal lyse 1000 timer till er det samme som sannsynlighweten for at en ny lyspære skal lyse 1000 timer til. Det kan nok diskuteres om dette stemmer helt med virkeligheten, men det skal visstnok stemme tilstrekkelig godt til at vi antar eksponentialfordelingen for levetiden til lyspærer og andre tekniske innretninger som ikke er utsatt for tydelig slitasje. Dette er ikke tilfeldig, i eksponentialfordelingen (og bare denne) gjelder P (T >a+ b T >a) = P(T>b)) generelt. Oppgave 7 a) b) c ) h(t) = λe λt 1 (1 e λt ) = λe λt e λt = λ. Eksponentialfordelingen har med andre ord konstant feilrate. Det omvendte argumentet kan også brukes, og leder via en enkel differensiallikning til at eksponentialfordelingen er den eneste fordelingen med konstant feilrate. βt β 1 α e tβ /α βt h(t) = 1 (1 e tβ /α ) = β 1 /α α e tβ e tβ /α = βtβ 1 α Denne fordelingen brukes ofte til å modellere levetid for mekaniske komponenter som er utsatt for slitasje. Svensken Weibull undersøkte denne spesielt for levetid av kulelagre. Vi har at hendelsen t T t +Δt en delmengde av T>t, slik at Dermed er den betingede sannsynligheten (t T t +Δt) (T >t)=t T t +Δt. P(t T t +Δt T>t)= P((t T t +Δt) (T >t)) P(T>t) = P(t T t +Δt) P(T>t) Siden F (t) =P(T t), er P (T >t)=1 F (t), så vifår P(t T t +Δt T>t)= F (t +Δt) F (t) Når vi dividerer med Δt kan vi sette dette opp i telleren, og ta grensen for telleren (siden nevneren ikke inneholder Δt: h(t) = lim Δt 0 F (t +Δt) F (t) / lim Δt 0 (F (t +Δt) F (t))/δt Δt = Grensen i telleren er (fra definisjonenen av den deriverte) F (t). Siden F (t) =f(t) følger formelen. d) Denervellittstoristarten(spedbarnsdødelighetenerhøyereennforeldrebarn),forsåå bli ganske liten en lang periode, langsomt voksende fra ca 30 år og raskere voksende etterhvert. Ved t = 100(år) er den blitt veldig høy, det er livsfarlig å være 100 år!.
6 Ukeoppgaver i Statistikk, uke 8 : Normal- og eksponentialfordeling. e ) Vi har sammenhengen f(t) =F (t),og ved å sette F (t) =y får vi fra definisjonen av h(t) y 1 y = λ Dette er en differensiallikning. Den er separabel, eller kan omformes til den lineære likningen y + λy = λ Vi trenger også en initialbetingelse, og hvis vi velger starttidspunktet t = 0erF (0) = P (T 0) = 0, så y(0) = 0 (og difflikningen er gyldig for t 0). Denne kan løses med standardmetoder for lineære (eller separable) difflikninger, eller ved Maple: > dsolve({diff(y(t),t)+lambda*y(t)-lambda=0, y(0)=0}, y(t)); y(t) =1 e λt Vi ser at denne alltid vil konvergere mot 1 når t som den skal (hvis ikke hadde det ikke vært mulig med en slik risikorate). Som man ser har vi fått sannsynlighetsfunksjonen for eksponentilafordeling, og ved derivering finnes sannsynlighetstettheten. Det vil si at eksponentialfordelingen er eneste fordeling med konstant risiko.