Kap. 8: Utvalsfordelingar og databeskrivelse

Like dokumenter
Forslag til endringar

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up!

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

TMA4240 Statistikk H2017 [15]

Utvalgsfordelinger (Kapittel 5)

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Dagens tekst. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Sted Gj.snitt Median St.avvik Varians Trondheim Værnes Oppdal

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

Et lite notat om og rundt normalfordelingen.

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Kap. 6, Kontinuerlege Sannsynsfordelingar

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Denne veka. Kap 7: Funksjonar av stokastiske variable Transformasjon av variable Moment Momentgenererande funksjon

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Forelesning 3. april, 2017

Kap. 6, Kontinuerlege Sannsynsfordelingar

Et lite notat om og rundt normalfordelingen.

Kap. 6, Kontinuerlege Sannsynsfordelingar

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

TMA4240 Statistikk H2010

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

TMA4240 Statistikk Høst 2016

Medisinsk statistikk Del I høsten 2009:

ST0202 Statistikk for samfunnsvitere

Fra første forelesning:

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

ST0202 Statistikk for samfunnsvitere

TMA4245 Statistikk Eksamen desember 2016

Kapittel 2: Hendelser

UNIVERSITETET I OSLO Matematisk Institutt

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk H2010

TMA4240 Statistikk 2014

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4240 Statistikk Høst 2012

Tabell 1: Beskrivende statistikker for dataene

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

TMA4240 Statistikk Høst 2009

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

TMA4240 Statistikk H2015

TMA4245 Statistikk Eksamen desember 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Kp. 9.8 Forskjell mellom to forventninger

ÅMA110 Sannsynlighetsregning med statistikk, våren

Kapittel 4.4: Forventning og varians til stokastiske variable

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Introduksjon til statistikk og dataanalyse

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Bootstrapping og simulering Tilleggslitteratur for STK1100

TMA4240 Statistikk H2015

Løsningsforslag eksamen 27. februar 2004

Despriptiv statistikk

Oppfriskning av blokk 1 i TMA4240

Kap. 6.1: Fordelingen til en observator og stok. simulering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

Eksamensoppgave i TMA4240 Statistikk

Deskriptiv statistikk., Introduksjon til dataanalyse

Deskriptiv statistikk., Introduksjon til dataanalyse

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Øving 1 TMA Grunnleggende dataanalyse i Matlab

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Statistikk og dataanalyse

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

UNIVERSITETET I OSLO

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Oppgave 1. Kilde SS df M S F Legering Feil Total

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Øving 1 TMA Grunnleggende dataanalyse i Matlab

TMA4240 Statistikk Eksamen desember 2015

STK Oppsummering

Inferens i fordelinger

TMA4245 Statistikk Eksamen august 2014

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Løsningsforslag oblig 1 STK1110 høsten 2014

HØGSKOLEN I STAVANGER

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

TMA4240 Statistikk Høst 2016

Hypotesetest: generell fremgangsmåte

Fasit for tilleggsoppgaver

TMA4240 Statistikk Høst 2015

Transkript:

Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling for gjennomsnitt (normalfordeling og ukjent varians) Databeskrivelse: Mest i kapittel 1 (anbefalte oppgåver 1) Kapittel 8: Normal-plott (er dataene frå ei normalfordeling?)

Observatorar Frå eit datasett finn vi (observerer vi) typisk: Empirisk gjennomsnitt: x = 1 n n i=1 x i Empirisk varians: s 2 = 1 n n 1 i=1 (x i x) 2 Empirisk median: x = x ( n+1 ) (dersom n odde) 2

Observatorar Frå eit datasett finn vi (observerer vi) typisk: Empirisk gjennomsnitt: x = 1 n n i=1 x i Empirisk varians: s 2 = 1 n n 1 i=1 (x i x) 2 Empirisk median: x = x ( n+1 ) (dersom n odde) 2 Om vi ser på desse teoretisk (desse er observatorar): Gjennomsnitt: X = 1 n n i=1 X i Utvalsvarians: S 2 = 1 n n 1 i=1 (X i X ) 2 Median: X = X ( n+1 ) (dersom n odde) 2

Observatorar Frå eit datasett finn vi (observerer vi) typisk: Empirisk gjennomsnitt: x = 1 n n i=1 x i Empirisk varians: s 2 = 1 n n 1 i=1 (x i x) 2 Empirisk median: x = x ( n+1 ) (dersom n odde) 2 Om vi ser på desse teoretisk (desse er observatorar): Gjennomsnitt: X = 1 n n i=1 X i Utvalsvarians: S 2 = 1 n n 1 i=1 (X i X ) 2 Median: X = X ( n+1 ) (dersom n odde) 2 Def. 8.4 Observator Ein funksjon av stokastiske variable som representerer eit tilfeldig utval blir kalla ein observator (engelsk: statistic) har sannsynsfordeling. Ein observator er ein stokastisk variabel, då det er ein funksjon av stokastiske variable.

Dersom X i er normalfordelt, og kjent varians X i N(µ, σ 2 ), for i = 1, 2,... n. Dvs eit utvalg på n. Då er X N(µ, σ 2 /n)

Utvalgsfordelinga til X Algoritme For m = 1 : M Trekk n=216 datapunkt frå N(179.8, 6.5 2 ) m = 1,..., M gongar x m1, x m2,..., x mn. Finn gjennomsnittet x m = 1/n n i=1 x mi Plott histogram for av ( x 1, x 2,..., x M )

Sentralgrenseteoremet. Fordelinga til gjennomsnittet, X. Sentralgrenseteoremet, teorem 8.2 La X i, i = 1, 2,..., n vere uavhengige identisk fordelte (u.i.f.) stokastiske vaiable med E(X i ) = µ og Var(X i ) = σ 2 < (endeleg varians). La X = 1 n n i=1 X i og Z = X µ. Då σ 2 /n når n. Dette tilsvarer Z N(0, 1) når n. X N(µ, σ2 n ) PS: Gjeld uansett fordeling for X i. PSS: Z = X µ er og ein observator σ 2 /n

Histogram populasjon og gj.snitt av 30 N(µ = 2, σ 2 = 2 2 ) exp(β = 2) Uniform ( 1.46,5.46) 700 700 700 600 600 600 500 500 500 400 400 400 300 300 300 200 200 200 100 100 100 0 5 0 5 10 0 5 0 5 10 0 5 0 5 10

Eks: To typar ventilar Ønsker å finne ut om det er kvalitetsforskjell på ventilane A og B. Har testa n = 30 av kvar, og fått x A = 2100 og x B = 2157. Antar kjente variansar σa 2 = 1002 og σb 2 = 2002 Forskjell mellom dei, eller tilfeldig variasjon? PS: Seier ingenting om fordelinga til kvaliteten!

I dag Skal sjå på: S 2 = 1 n i=1 n 1 (X i X ) 2 T = X µ S/ n Gjeld kun for X 1,... X n N(µ, σ 2 ) Korleis finn vi ut om dataene våre er normalfordelte? Kan bruke normal-plott (i Matlab normplot) Normal-plot: Dersom normalfordelt, ca på rett linje.

Normal-plott

χ 2 -fordelingar

Student t-forelingar

Oppsummering Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) Sentralgrenseteoremet (SGT) uansett fordeling Utvalsfordeling for varians normalfordeling, χ 2 n 1 Utvalfordeling for gjennomsnitt normalfordeling og ukjent varians, T n 1 Databeskrivelse: boksplott og qq-plot