ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Like dokumenter
ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Econ 2130 Forelesning uke 11 (HG)

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

MOT310 Statistiske metoder 1, høsten 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Estimering 1 -Punktestimering

Estimering 1 -Punktestimering

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Hypotesetesting, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

Estimering 2. -Konfidensintervall

Kapittel 5: Tilfeldige variable, forventning og varians.

Forelesning Moment og Momentgenererende funksjoner

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

TMA4240 Statistikk Høst 2016

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

Kapittel 8: Estimering

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

MOT310 Statistiske metoder 1, høsten 2012

TMA4240 Statistikk Høst 2009

TMA4240/4245 Statistikk 11. august 2012

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

TMA4245 Statistikk Eksamen mai 2017

TMA4240 Statistikk Eksamen desember 2015

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

Statistikk og økonomi, våren 2017

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

TMA4240 Statistikk Høst 2015

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

LØSNING: Eksamen 28. mai 2015

Oppgaver fra boka: X 2 X n 1

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Hypotesetesting, del 5

Kap. 9: Inferens om én populasjon

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

Oversikt, del 5. Vi har sett på styrkefunksjon for ensidige tester. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

f(x)dx = F(x) = f(u)du. 1 (4u + 1) du = 3 0 for x < 0, 2 + for x [0,1], 1 for x > 1. = 1 F 4 = P ( X > 1 2 X > 1 ) 4 X > 1 ) =

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Mer om utvalgsundersøkelser

Ukeoppgaver i BtG207 Statistikk, uke 4 : Binomisk fordeling. 1

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

Kap. 9: Inferens om én populasjon

Ulike typer utvalg. MAT0100V Sannsynlighetsregning og kombinatorikk. Ordnet utvalg uten tilbakelegging. Ordnet utvalg med tilbakelegging.

Løsningsforslag Oppgave 1

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

Løsning TALM1005 (statistikkdel) juni 2017

STK1100 våren 2017 Estimering

Skrivne og trykte hjelpemiddel samt kalkulator er tillate. Ta med all mellomrekning som trengst for å grunngje svaret.

Kapittel 5: Diskrete sannsynsfordelingar TMA4245 Statistikk. 5.2 Diskret uniform fordeling NTNU NTNU NTNU

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

ECON240 Statistikk og økonometri

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

TMA4245 Statistikk Eksamen 9. desember 2013

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

UNIVERSITETET I OSLO

Sammendrag i statistikk

Transkript:

ÅMA Sasylighetsregig med statistikk, våre Kp. 4 Kotiuerlige tilfeldige variable; Normalfordelig Kotiuerlige tilfeldige variable, itro. (eller: Kotiuerlige sasylighetsfordeliger) Vi har til å sett på diskrete fordeliger - mulige verdier er atskilte pukter på tallije, feks f.eks.,,, 3,... Kotiuerlige tilfeldige variable, itro. (eller: Kotiuerlige sasylighetsfordeliger) Vi har til å sett på diskrete fordeliger - mulige verdier er atskilte pukter på tallije, feks f.eks.,,, 3,... I mage situasjoer er det aturlig at alle verdier på tallije (muliges e del av de) er mulige utfall. 3

7) 5) 3) ) 9) 7) 5) 3) ) 9) 7) 5) 3) ) 9) 7) 5) Kotiuerlige tilfeldige variable, itro. Eks.: X=høyde til tilfeldig valgt kvielig UiSstudet.,,,8 I prisippet er ehver verdi i f.eks. itervallet [.5m,.m], et mulig utfall.,6, [53, 5 [55, 5 [57, 5 [59, 6 [6, 6 [63, 6 [65, 6 [67, 6 [69, 7 [7, 7 [73, 7 [75, 7 [77, 7 [79, 8 [8, 8 [83, 8 [85, 8.5m.m Vi ka ikke liste opp alle mulige utfall i e slik situasjo og kytte sasylighet til hvert av dem! 4 Kotiuerlige tilfeldige variable, itro. Vi sier at X er e kotiuerlig tilfeldig variabel, eller at X har kotiuerlig sasylighetsfordelig., For å beskrive fordelig av sasylighet på de forskjellige utfallee, f(x),,8,6, brukes e kurve, f(x): 85 8 75 7 65 6 55 x 5 Kotiuerlige tilfeldige variable, itro. Kurve beskriver fordelige av sasylighet på de forskjellige utfallee, ved at: sasylighete er stor for verdier x der f(x) er stor. Vi ka ikke betrakte ekeltverdier, me et itervall, [a, b], av verdier.,,,8 f(x),6, 85 8 75 7 65 6 55 x 6

Kotiuerlige tilfeldige variable, itro. Kurve beskriver fordelige av sasylighet på de forskjellige utfallee, ved at: sasylighete er stor for verdier x der f(x) er stor. Vi ka ikke betrakte ekeltverdier, me et itervall, [a, b], av verdier., P(X [a,b]) = P(a X b) f(x),,8,6 b = f(x)dx a, 55 6 65 a b 7 x 75 8 85 7 Kotiuerlige tilfeldige variable, itro. Def.: Kurve f(x) kalles sasylighetstetthetsfuksjoe til X. For tetthetsfuksjoe f(x) må vi ha at : ) f(x) ) for to tall a og b der a < b, P(a X b) = f(x) dx 3) f(x) dx = - b a er 8 Kotiuerlige tilfeldige variable, itro. Def.: For e tilfeldig variabel Y sier vi at fuksjoe F defiert ved F(y) = P(Y y), er fordeligsfuksjoe til Y. Dersom Y er kotiuerlig fordelt, så F(y) = P(Y y) = f(x) dx y - 9 3

Kotiuerlige tilfeldige variable, itro. Forvetig og varias for kotiuerlige variable: Def.: Dersom X er e kotiuerlig tilfeldig variabel med tetthet f(x), så E(X) = xf(x)dx = μ - Var(X) = (x - μ) f(x)dx - ( = E{ ( X μ) }) Kotiuerlige tilfeldige variable, itro. Forvetig og varias for kotiuerlige variable: Obs.: har samme fortolkig som for diskrete variable - setrum, beliggehet - spredig Def.: Dersom X er tetthet f(x), så E(X) Var(X) = xf(x)dx = - = - e kotiuerlig tilfeldig variabel med μ (x - μ) f(x)dx ( = E{ ( X μ) }) Kotiuerlige tilfeldige variable Viktige klasser av kotiuerlige fordeliger som vi skal se på: Ekspoesialfordelige (kp. 4.) Normalfordelige (kp. 4.3) Seiere: Studet s t-fordelig (kp. 6.6) 4

Kotiuerlige tilfeldige variable Viktige klasser av kotiuerlige fordeliger som vi skal se på: Ekspoesialfordelige (kp. 4.) Normalfordelige (kp. 4.3) Seiere: Studet s t-fordelig (kp. 6.6) 3 Ekspoesialfordelige (kp. 4.) Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x λ Skrivemåte: X~eksp.( ) 4 Ekspoesialfordelige (kp. 4.) Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x, λ = : x e, f(x) =, for x > for x f(x),5, - 3 4 5 6 7 x 5 5

f(x) f(x) f(x),,5, - 3 4 5 6 7 x,,5, - 3 4 5 6 7 x,,5, - 3 4 5 6 7 x Ekspoesialfordelige E viktig type (kotiuerlig) fordelig. Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x Obs.: ) kotiuerlig vetetidsfordelig; jf. geometrisk fordelig; ) svært mye brukt til modellerig og aalyse av pålitelighet til systemer 6 Ekspoesialfordelige E viktig type (kotiuerlig) fordelig. Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x Eksempel: Modell for edbørsmegde et døg. ( Vetetid til reget er slutt.) Histogram over døgedbør i februarmåeder åree 997-6. (Døg med <.7mm er utelatt.) Rød kurve er tilpasset ekspoesialtetthet. Gjeomsitt:.87mm 7 Ekspoesialfordelige Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : λx λe, for x > f(x) =, for x Setig : Dersom X er ekspoesialfordelt med parameter λ, så E(X) = og Var(X) = λ λ 8 6

f(x),,5-3 4 5 6 7 x Ekspoesialfordelige Setig : Dersom parameter λ, så E(X) = λ og X er ekspoesialfordelt med Var(X) = λ For edbørsdataee: E(X) estimeres med gj.s. Dvs.: /λ estimeres til.87, og dermed: λ estimeres til /.87 =.777 9 Ekspoesialfordelige Eksp.-tettheter med ulike parametere: Forv. = Parameter λ = ; E(X) = = x e, f(x) =, for x > for x,,5, - 3 8 3 Forv. =.x.e, for x > Parameter λ =.; f(x) =, for x E(X) = =.,,5, - 3 8 3 Ekspoesialfordelige Setig : Dersom X er ekspoesialfordelt med Def.: Vi sier X er ekspoesialfordelt med parameter λ dersom X har tetthet f(x) gitt ved : parameter λ, så λx λe, for x >, E(X) = og Var(X) = f(x) = λ λ, for x Obs.: - λx E(X) = xf(x)dx = xλe dx = L = - λ Forvetige (og varias) fies vha. itegrasjo. (Det er ikke pesum i dette kurset.) 7

Ekspoesialfordelige Eks.: Vi atar at levetide til e tilfeldig valgt lyspære er eksposialfordelt med forvetig 5 timer. Hva er sasylighete for at de svikter før timer? Hva er sasylighete for at de virker mist 3 timer? Ekspoesialfordelige Eks.: Vi atar at levetide til e tilfeldig valgt lyspære er eksposialfordelt med forvetig 5 timer. La T = levetide til lyspære. Vi har : T er ekspoesialfordelt med parameter λ = ; 5 tetthet : f(t) = 5 e 5, x, for t > for t 3 Ekspoesialfordelige Geerelt : t λt -λt P(T t) = λe dt = e 4 8

Ekspoesialfordelige Geerelt : t λt -λt P(T t) = λe dt = e - 5 - P(T < ) = e = e 5 =.33. 5 Ekspoesialfordelige Geerelt : t λt -λt P(T t) = λe dt = e - 5 - P(T < ) = e = e 5 =.33. P(T 3 ) = P(T < 3 ) - = e 5 3 =.3 6 Kotiuerlige tilfeldige variable, geerelt Obs.: Dersom X er kotiuerlig fordelt, så a P(X = a) = f(x)dx = a Derfor : P(X a) = P(X < a) 7 9

5 5 5 5 Kotiuerlige tilfeldige variable Obs.: Dersom X er kotiuerlig fordelt, så,, P(a X b) : f(x),8,6, 55 6 a 65 b 7 x 75 8 85,,,8 P(X = a) = P(a X a) = f(x),6, 55 6 65 a 7 x 75 8 85 8 Kotiuerlige tilfeldige variable Viktige klasser av kotiuerlige fordeliger som vi skal se på: Ekspoesialfordelige (kp. 4.) Normalfordelige (kp. 4.3) Seiere: Studet s t-fordelig (kp. 6.6) 9 Normalfordelige (kp. 4.3) Dette er de viktigste fordelige i de forstad at ige adre fordeliger er mer brukt i statistiske aalyser e ormalfordelige! 3

Normalfordelige Defiisjo: Dersom X er e tilfeldig variabel med tetthet : f ( x ) = e πσ ( x μ) σ, < x <, sier vi at X er ormalfordelt med forvetig μ og varias σ. Skriver : X ~ N( μ, σ ) 3 Normalfordelige N(,),5,4,3, N(,),, -4, -,,, 4, 6, 8,, 3 Normalfordelige,5,4,3, N(,) N(5,),, -4, -,,, 4, 6, 8,, 33

Normalfordelige,5,4,3, N(,) N(5,) N(,,5),, -5,, 5,, 34 Normalfordelige Normalfordelige er spesielt viktig fordi mage datasett ser ut til å være ormalfordelte mage aalysemetoder bygger på ormalfordelige 35 Normalfordelige, Stadardormal Defiisjo: Normalfordelig med forvetig og varias kalles stadardormalfordelige. Tabeller over sasyligheter i N(,)-fordelige: 36

Normalfordelige, sasyligheter La Z~N(, ).,5 P(Z ) = f(x)dx = -,4,3,,, -4, -,,, 4, -,... tabell 37 Normalfordelige, sasyligheter La Z~N(, ).,5 P(Z ) = f(x)dx = -,4,3,,, -4, -,,, 4, -, =.843 38 Normalfordelige, sasyligheter,5 P( Z>.5 ) =,4,3, = -P( Z<.5 ),, -4, -,,, 4, -, =... -.695 =.385 Vi har tabell ku for N(,)-fordelige. 39 3

Normalfordelige Eks.: La de tilfeldige variabele X være megde melk i e tilfeldig valgt -literskartog. Vi atar at X~N(,. ) (X er ormalfordelt med forvetig og varias.. Hva er sasylighete for at det er midre e.95 liter i e tilfeldig valgt kartog? 4 Normalfordelige Eks.: La de tilfeldige variabele X være megde melk i e tilfeldig valgt -literskartog. Vi atar at X~N(,. ) (X er ormalfordelt med forvetig og varias.. Hva er sasylighete for at det er midre e.95 liter i e tilfeldig valgt kartog? Dvs.: vi vil fie P( X<.95 ).... tabeller...? 4 Normalfordelige Obs. : Y = a + bx er også ormalfordelt Obs. : X μ μ X Z = = + X = a σ X σ X σ 3 { X X + a b bx..., og derfor er Z defiert som over, også ormalfordelt 4 4

Normalfordelige Obs. : Y = a + bx er også ormalfordelt Obs. : X μ μ X Z = = + X = a σ X σ X σ 3 { X X + a b bx..., og derfor er Z defiert som over, også ormalfordelt, og... Z har forvetig og varias (SJEKK DETTE!). Dvs.: Z~N(, ). 43 Normalfordelige Eks.: X~N(,. ). Vi vil fie P( X<.95 ). X <.95 Derfor : X.95 Z = <.. X μ X Z = σ X.95 }..95 P( X <.95) = P Z < = P( Z <.5) =.6. 44 Normalfordelige, resultater Setig: Dersom X,..., X er uavhegige, ormalfordelte tilfeldige variable (og a, a,..., a er kostater), så er Y = a + a X +...+ a X e ormalfordelt tilfeldig variabel. 45 5

Normalfordelige Obs.: Resultatet i setige gjelder ikke geerelt (for adre typer fordeliger) Dersom X ~ekspo.() og X ~ekspo.(), så har vi ikke at X +X ~ekspo.() Dersom X ~B(,.5) og X ~B(,.), så har vi ikke at X +X ~B(); Heller ikke er f.eks. X biomisk fordelt! 46 Normalfordelige Setig: Dersom X,..., X er uavhegige, ormalfordelte tilfeldige variable (og a, a,..., a er kostater), så er Y = a + a X +...+ a X e ormalfordelt tilfeldig variabel. Forvetig: E(Y) = E(a +a X +...+ a X ) = a + a E(X )+...+ a E( X ) Varias: Var(Y) = Var(a +a X +...+ a X ) =a Var(X )+...+ a Var( X ) 47 Statistiske egeskaper til gjeomsittet Statistiske egeskaper til gjeomsittet Hvorfor?? Eks.: Data: 48 4.8 3.8 384.4 445. 53.6 365. 54.5 453.7 374. 44.3 43 ( måliger av e persos blodsukkerivå; tatt på samme tidspukt.) Vi vil typisk bruke gjeomsitt, som her er 4.35, i diverse videre aalyser. 48 6

,8,8 Statistiske egeskaper til gjeomsittet Eks.: Data: 4.8 3.8 4.4 5. 3.6 5. 4.5 3.7 4. 4.3 Gjeomsitt er 4.35; Prikkdiagram: 3 3, 35 3,5 4 4, 45 4,5 5 5, 55 5,5 Hva er virkelig ivå? (4.35 eller 3.6 eller 5....) Vi treger å vite oe om de statistiske usikkerhete i aslaget 4.35!! 49 Statistiske egeskaper til gjeomsittet Eks.: Data: 4.8 3.8 4.4 5. 3.6 5. 4.5 3.7 4. 4.3 Gjeomsitt er 4.35; Statistisk takegag: Vi oppfatter de måligee som utfall av e (kotiuerlig) fordelig: 3, 3,5 4, 4,5 5, 5,5 3, 3,5 4, 4,5 5, 5,5 5 Statistiske egeskaper til gjeomsittet Eks.: Data: 4.8 3.8 4.4 5. 3.6 5. 4.5 3.7 4. 4.3 Gjeomsitt er 4.35; Statistisk takegag: Vi oppfatter de måligee som utfall av e (kotiuerlig) fordelig: 3, 3,5 4, 4,5 5, 5,5 3, 3,5 4, 4,5 5, 5,5 Jf. også: resultat av terigkast, 3, 6,,...: utfall av fordelige y 3 4 5 6 P(Y=y) /6 /6 /6 /6 /6 /6 5 7

Statistiske egeskaper til gjeomsittet Dvs.: vi oppfatter måligee x, x, K, x tilfeldige variable X, X, K, X aktuelle fordelige. som utfall av som alle har de Gjeomsittet av måligee, x = ( x + x + L+ x ) oppfattes som utfall av gjemosittet X = ( X + X + L+ X ) av de tilfeldige variable: 5 Statistiske egeskaper til gjeomsittet Eks.: Data: 4.8 3.8 4.4 5. 3.6 5. 4.5 3.7 4. 4.3 Gjeomsitt er 4.35; Prikkdiagram: 3, 3,5 4, 4,5 5, 5,5 Hva er virkelig ivå? (4.35 eller 3.6 eller 5....) Vi treger å vite oe om de statistiske usikkerhete i aslaget 4.35!! De statistiske egeskapee til X = L+ vil kue fortelle oss mye om de statistiske ( X + X + X ), usikkerhete!! Dette er e typisk situasjo! 53 Statistiske egeskaper til gjeomsittet Geerelt : måliger x, x, K, x ; oppfattes som utfall av tilfeldige variable X, X, K, X. Mage gager er det rimelig å ata at X, X, K, X ) uavhegige og idetisk fordelte tilfeldige variable, og ) ormalfordelte. er Hva er da egeskapee til X = L ( X + X + + X )? 54 8

Statistiske egeskaper til gjeomsittet Setig : Dersom X,X, K,X er uavhegige tilfeldige variable som alle er ormalfordelte med forvetig μ og varias σ, så er X = L ( X + X + + X ) + ormalfordelt med forvetig μ og varias σ. 55 Statistiske egeskaper til gjeomsittet Setig : Dersom X,X, K,X tilfeldige variable som alle er ormalfordelte med forvetig μ og varias σ, er uavhegige så er X = ( X + X + L+ X ) ormalfordelt med forvetig μ og varias Bevis :... vha.: σ.. Setig: Dersom X,..., X er uavhegige, ormalfordelte tilfeldige variable (og a,..., a er kostater), så er Y = a X +...+ a X e ormalfordelt tilfeldig variabel.. Regeregler for forvetig og varias. 56 Statistiske egeskaper til gjeomsittet X = X + X + L+ X = li.komb. av uavh. orm.ford. tilf. var. E( X ) = E ( X + L+ X ) = E( X + L+ X ) = { E( X) + L + E( X )} = ( μ + + μ) = μ 4 L 43 μ Setig : Dersom tilfeldige variable X,X som forvetig μ og varias, K,X alle X = ( X + X + L+ X ) ormalfordelt med forvetig μ og varias σ er, er uavhegige ormalfordelte med så er σ. 57 9

Statistiske egeskaper til gjeomsittet X = X + X + L+ X = li.komb. av uavh. orm.ford. tilf. var. E( X ) = E ( X + L+ X ) = E( X + L+ X ) = { E( X) + L + E( X )} = ( μ + + μ) = μ 4 L 43 μ Setig : Dersom tilfeldige variable X,X som forvetig μ og varias, K,X alle X = ( X + X + L+ X ) ormalfordelt med forvetig μ og varias σ er, er uavhegige ormalfordelte med så er σ. Var(X ) = Var ( X + L+ X ) = Var( X + L+ X ) = { Var( X ) + L+ Var( X )} 64748 σ 4 σ = ( σ + L+ σ ) = 58 Statistiske egeskaper til gjeomsittet E del gager er det ikke rimelig å bruke ormalatakelse (ata at måligee er utfall fra e ormalfordelig). (F.eks. dersom dataee har e tydelig flertoppet eller usymmetrisk fordelig.) Hva ka vi da si om: Statistiske egeskaper til gjeomsittet? 59 Setralgresesetige Setralgresesetige : Dersom X,X, uavhegige og idetisk fordelte tilfeldige variable med forvetig μ og varias σ, så er X = L K ( X + X + X ) +,X er tilærmet ormalfordelt med σ forvetig μ og varias, år er stor. Bevis:...... 6

Setralgresesetige Obs : Setralgresesetige : Dersom X, X, K,X er uavhegige og idetisk fordelte tilfeldige variable med forvetig μ og varias σ, så er ( X + X + + X ) Y = L tilærmet ormalfordelt med forvetig μ og varias σ, år er stor. Videre : Y - E(Y) SD(Y) er tilærmet ormalfordelt med forvetig og varias. 6 Setralgresesetige... år er stor...?? Tommelfigerregel: mist 3 for god tilærmig. Eks.: Y = sum av 3 kast med e terig. Fordelig til Y? P(Y<) =? 6 Setralgresesetige Eks.: Y = sum av 3 kast med e terig. La X i = resultat i kast r i, i=,,..., 3. Vi ka fie at E(X i )=3.5 og Var(X i )=.9, og vi har her at Y = X +... + X 3 (Alle X i ee er uavhegige og idetisk fordelte!) Y si fordelig er tilærmet ormal med forvetig 3 3.5 = 5 og varias 3.9 = 87.6 63

Setralgresesetige Y si fordelig er tilærmet ormal med forvetig 3 3.5 = 5 og varias 3.9 = 87.6,5,3,, 75 85 95 5 5 5 35 64 Setralgresesetige Y si fordelig er tilærmet ormal med forvetig 3 3.5 = 5 og varias 3.9 = 87.6,5 Y 5 5 P(Y < ) = P < 87.6 443 87.6.53,3,, 75 85 95 5 5 5 35 P(Z < -.53) =.98, ( her er Z ~ N(,) ) fra tabell.,5,3,, 75 85 95 5 5 5 35 65 Normaltilærmig, biomisk De biomiske fordelige ka tilærmes med ormalfordelig i e del tilfeller: Dersom Y~B(, p) og p(-p) p) mist, så ka fordelige til Y tilærmes med fordelige til X, der X er ormalfordelt med forvetig p og varias p(-p); X~N( p, p(-p) ) Gir betydelig foreklig ved utregig av sasyligheter. 66

Normaltilærmig, biomisk Altså: Y ~ B(, p ). p( p), så har vi med god tilærmig : P(Y y) P(X y), der X ~ N( p, p(- p) ) 67 Normaltilærmig, biomisk Eks.: Y=at. kro i kast med et pegestykke ~ B(,.5 ) P(Y 4) P(X 4), der X ~ N( 5, 5 ) ( E(Y) = 5 og Var(Y) =.5 (-.5) = 5) P X -5 5 4-5 5 ( X 4) = P = P( Z -) =.8 68 Normaltilærmig, biomisk P(Y 4) P = P ( X 4) X -5 4-5 = P 5 5 ( Z -) =.8,,6,8,6 B(,.5) B(,.5) P(Y<= 4) N(5, 5), P(Y<= 4) N(5, 5),, 35 38 4 44 47 5 53 56 59 6 65, 35 36 37 38 39 4 4 4 43 44 45 69 3

Normaltilærmig, biomisk Det må åpebart være bedre med: ( X 4.5) P(Y 4) P +,,6,8,6 B(,.5) B(,.5) P(Y<= 4) N(5, 5), P(Y<= 4) N(5, 5),, 35 38 4 44 47 5 53 56 59 6 65, 45 44 43 4 4 4 39 38 37 36 35 7 Normaltilærmig, biomisk Da får vi: P(Y 4) X -5 4 + 5.5-5 P( X 4 +.5) = P 5 5 = P Z -.9 =.87 (eksakt : ( ).84),6,6 B(,.5) B(,.5) P(Y<= 4) P(Y<= 4), N(5, 5), N(5, 5),, 7 45 44 43 4 4 4 39 38 37 36 35 45 44 43 4 4 4 39 38 37 36 35 Normaltilærmig, heltallskorreksjo Heltallskorreksjo ved ormaltilærmig av fordeliger som tar verdier på heltallee: X: tilfeldig variabel med fordelig som ka tilærmes med ormalfordelige; Y: Normalfordelt tilf.var. med forv. E(X) og varias Var(X). Da: ( X x) P( Y x.5) P + 7 4

Normaltilærmig, heltallskorreksjo ( X x) P( Y x.5) P + Gjelder altså bl.a. ved ormaltilærmig av biomisk fordelig Hypergeometrisk fordelig Poissofordelig 73 Normaltilærmig Hypergeometrisk modell dersom <. N, så tilærmig til biomisk modell, og dersom biomisk modell ka tilærmes med ormalfordelig,... Poissomodell Dersom Y ~ Poisso ( λt) og λt, så P(Y y) P(X y), der X ~ N( { λt, { λt ) E(Y) Var(Y) 74 5