Forslag til endringar Bakgrunn: Vi har ingen forelesningar veka etter påske. Eg skal bort 18. og 19. april. Eksamen er 30.mai Forslag til endringar: Ekstra forelesningar onsdag 16.mars og onsdag 30 mars 12-14. Oppsummering og eksamensoppgåverekning: 26. og 27. mai. Vi er ferdig med forelesningar 12.april. Sei frå til referansegruppe eller meg om kva du synest.
Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling for gjennomsnitt (normalfordeling og ukjent varians) Databeskrivelse: Mest i øving (anbefalte oppgaver 8) Jf første veka normal-plott (er dataene frå ei normalfordeling?)
Observatorar Frå eit datasett finn vi (observerer vi) typisk: Empirisk gjennomsnitt: x = 1 n n i=1 x i Empirisk varians: s 2 = 1 n n 1 i=1 (x i x) 2 Empirisk median: x = x ( n+1 ) (dersom n odde) 2
Observatorar Frå eit datasett finn vi (observerer vi) typisk: Empirisk gjennomsnitt: x = 1 n n i=1 x i Empirisk varians: s 2 = 1 n n 1 i=1 (x i x) 2 Empirisk median: x = x ( n+1 ) (dersom n odde) 2 Om vi ser på desse teoretisk (desse er observatorar): Gjennomsnitt: X = 1 n n i=1 X i Utvalsvarians: S 2 = 1 n n 1 i=1 (X i X ) 2 Median: X = X ( n+1 ) (dersom n odde) 2
Observatorar Frå eit datasett finn vi (observerer vi) typisk: Empirisk gjennomsnitt: x = 1 n n i=1 x i Empirisk varians: s 2 = 1 n n 1 i=1 (x i x) 2 Empirisk median: x = x ( n+1 ) (dersom n odde) 2 Om vi ser på desse teoretisk (desse er observatorar): Gjennomsnitt: X = 1 n n i=1 X i Utvalsvarians: S 2 = 1 n n 1 i=1 (X i X ) 2 Median: X = X ( n+1 ) (dersom n odde) 2 Def. 8.4 Observator Ein funksjon av stokastiske variable som representerer eit tilfeldig utval blir kalla ein observator (engelsk: statistic) har sannsynsfordeling. Ein observator er ein stokastisk variabel, då det er ein funksjon av stokastiske variable.
Dersom X i er normalfordelt, og kjent varians X i N(µ, σ 2 ), for i = 1, 2,... n. Dvs eit utvalg på n. Då er X N(µ, σ 2 /n)
Utvalgsfordelinga til X Algoritme For m = 1 : M Trekk n=87 datapunkt frå N(179.8, 6.5 2 ) m = 1,..., M gongar x m1, x m2,..., x mn. Finn gjennomsnittet x m = 1/n n i=1 x mi Plott histogram for x 1, x 2,..., x M
Sentralgrenseteoremet. Fordelinga til gjennomsnittet, X. Sentralgrenseteoremet, teorem 8.2 La X i, i = 1, 2,..., n vere uavhengige identisk fordelte (u.i.f.) stokastiske vaiable med E(X i ) = µ og Var(X i ) = σ 2 < (endeleg varians). La X = 1 n n i=1 X i og Z = X µ. Då σ 2 /n når n. Dette tilsvarer Z N(0, 1) når n. X N(µ, σ2 n ) PS: Gjeld uansett fordeling for X i. PSS: Z = X µ er og ein observator σ 2 /n
Histogram populasjon og gj.snitt av 30 N(µ = 2, σ 2 = 2 2 ) exp(β = 2) Uniform ( 1.46,5.46) 700 700 700 600 600 600 500 500 500 400 400 400 300 300 300 200 200 200 100 100 100 0 5 0 5 10 0 5 0 5 10 0 5 0 5 10
I dag Skal sjå på: S 2 = 1 n i=1 n 1 (X i X ) 2 T = X µ S/ n Gjeld kun for X 1,... X n N(µ, σ 2 ) Korleis finn vi ut om dataene våre er normalfordelte? Kan bruke kvantil-kvantil-plott (qq-plot, i Matlab normplot) qq-plot: Dersom normalfordelt, ca på rett linje. Sjå og http://www.math.ntnu.no/emner/tma4240/2012h/ Kompendium/notater/qqplott.pdf, notat om qq-plot. Eksempla er det viktige!
qq-plot
χ 2 -fordelingar 0.25 ν = 3 χ 2 ν fordelingar 0.2 0.15 ν = 5 0.1 ν = 10 ν = 15 0.05 0 0 2 4 6 8 10 12 14 16 18 20
Student t-forelingar 0.4 N(0,1) 0.35 ν = 3 ν = 5 0.3 0.25 ν = 10 0.2 0.15 0.1 0.05 0 3 2 1 0 1 2 3
Oppsummering Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) Sentralgrenseteoremet (SGT) uansett fordeling Utvalsfordeling for varians normalfordeling, χ 2 n 1 Utvalfordeling for gjennomsnitt normalfordeling og ukjent varians, T n 1 Databeskrivelse: boksplott og qq-plot