Utvalgsfordelinger (Kapittel 5)

Like dokumenter
Utvalgsfordelinger (Kapittel 5)

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Kapittel 4.4: Forventning og varians til stokastiske variable

Kap. 8: Utvalsfordelingar og databeskrivelse

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

STK Oppsummering

Statistikk og dataanalyse

Forslag til endringar

ST0202 Statistikk for samfunnsvitere

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Kapittel 3: Studieopplegg

Introduksjon til inferens

TMA4240 Statistikk H2017 [15]

ST0202 Statistikk for samfunnsvitere

Kort overblikk over kurset sålangt

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Fra første forelesning:

Seksjon 1.3 Tetthetskurver og normalfordelingen

Kapittel 9 og 10: Hypotesetesting

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

TMA4240 Statistikk H2015

Seksjon 1.3 Tetthetskurver og normalfordelingen

TMA4240 Statistikk Høst 2018

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Kapittel 7: Inferens for forventningerukjent standardavvik

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4245 Statistikk Eksamen desember 2016

Inferens i fordelinger

Kapittel 4.3: Tilfeldige/stokastiske variable

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up!

ST0202 Statistikk for samfunnsvitere

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

10.1 Enkel lineær regresjon Multippel regresjon

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO

La U og V være uavhengige standard normalfordelte variable og definer

Frivillig respons utvalg

ST0202 Statistikk for samfunnsvitere

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Kapittel 2: Hendelser

UNIVERSITETET I OSLO

TMA4240 Statistikk H2010 (20)

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ST0202 Statistikk for samfunnsvitere

Kapittel 7: Inferens for forventningerukjent standardavvik

Binomisk sannsynlighetsfunksjon

DEL 1 GRUNNLEGGENDE STATISTIKK

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

TMA4245 Statistikk Eksamen august 2014

Fasit for tilleggsoppgaver

Et lite notat om og rundt normalfordelingen.

TMA4240 Statistikk 2014

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

TMA4240 Statistikk H2010

Inferens i regresjon

Oppfriskning av blokk 1 i TMA4240

Funksjoner av stokastiske variable.

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere

Hypotesetesting. mot. mot. mot. ˆ x

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Funksjoner av stokastiske variable.

Denne uken: Kapittel 4.3 og 4.4

6.1 Kontinuerlig uniform fordeling

OPPGAVEHEFTE I STK1000 TIL KAPITTEL 5 OG 6. a b

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

Gammafordelingen og χ 2 -fordelingen

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Et lite notat om og rundt normalfordelingen.

Transkript:

Utvalgsfordelinger (Kapittel 5)

Oversikt pensum, fortid og fremtid Eksplorativ data-analyse (Kap 1, 2) Hvordan produsere data (Kap 3) Sannsynlighetsteori (Kap 4) Utvalgsfordelinger til observatorer (Kap 5): I DAG Introduksjon til inferens om ukjente parametre (Kap 6) Konfidensintervaller Hypotesetesting Inferens på Forventning (Kap 7) Regresjonsmodeller (Kap 10,11)

Observator En observator er en funksjon av data for mange individer, for eksempel Gjennomsnitt Andel Stigningstall i regresjonslinje En observator er en tilfeldig variabel Har en sannsynlighetsfordeling som kalles observatorfordeling Beskriver hvordan observatoren varierer når utvalget/eksperimentet repeteres mange ganger Individuelle data: Populasjonsfordeling

Eksempel: Populasjonsfordelinger og utvalgsfordelinger Høyde kvinne N(64.5,2.5)-fordelt N(64.5,2.5): Populasjonsfordeling Gjennomsnitt av 100 kvinner N(64.5,0.25)-fordelt x observator N(64.5,0.25): Observatorfordeling til x 64.5 er forventningen (μ), en parameter som er et fast tall, har ingen fordeling

Observatorer Vi skal i dag se på observatorene: Gjennomsnitt Antall/andeler Er ute etter egenskaper til observatorer Forventning Spredning Sannsynlighetsfordeling

Utvalgsfordeling: Gir svaret på hva som ville skje dersom vi så på mange utvalg med størrelse n fra den samme populasjonen

Kap. 5.1: Utvalgsfordelingen for gjennomsnitt x : kontinuerlig tilfeldig variabel Gjenomsnitt er mindre variable enn individuelle observasjoner Gjennomsnitt mer normalfordelte enn individuelle observasjoner

Histogram over lengden av ca 3000 oppringninger (ekstreme uteliggere er fjernet) Histogram over gjennomsnittlig lengde på oppringninger

Kvantilplott for gjennomsnittlig lengde på oppringninger (500 utvalg av størrelse 80 fra populasjonen på 3000)

Forventning til gjennomsnitt Har et SRS av størrelse n fra en populasjon Observerer variabelen X for hvert individ i utvalget, som har forventning μ og standardavik σ (populasjonsparametre) De n observasjonene er verdier av n stokastiske variable X 1,X 2,...,X n x =(x 1 +x 2 +...+x n )/n=s/n (S er summen av alle x i -ene) Forventning til x i er μ μ S = μ x =

Varians og standardavvik til gjennomsnitt x =(x 1 +x 2 +...+x n )/n=s/n Varians til x i er σ 2 σ S2 = σ 2 x = σ x =

Fordeling til gjennomsnitt Vi har beskrevet senter (forventningen) og spredning (standardavviket) til fordelingen til gjennomsnittet for et utvalg på størrelse n, men ikke formen Normalfordelte variable Anta X i er uavhengige og N(μ,σ)-fordelte Da er x N(μ,σ/ n)-fordelt Sentralgrenseteoremet for SRS av størrelse n Forventning til X i er μ Standardavvik til X i er σ Anta n stor Da er x tilnærmet N(μ,σ/ n)-fordelt

Telefonoppringninger 31492 oppringninger til en banks kundesenter Fordelingen til de individuelle observasjonene er langt fra normal Repeter 10000 ganger: Trekk enkelt tilfeldig utvalg av størrelse n=80 Beregn x Lag histogram av de 10000 x 'er

Histogram over gjennomsnittet av de 10000 utvalgene av størrelse 80

Eksponensiell fordeling Mye brukt for levetider Lyspærer Elektroniske komponenter Individer Langt fra normal

a) Fordelingen til gj.sn av 1 observasjon fra en eksponensialfordelt populasjon b) Fordelingen til gj.sn av 2 observasjoner fra en eksponensialfordelt populasjon c) Fordelingen til gj.sn av 10 observasjon fra en eksponensialfordelt populasjon d) Fordelingen til gj.sn av 25 observasjoner fra en eksponensialfordelt populasjon

Eksponensiell - eksempel X: tid tekniker bruker for vedlikehold av system Eksponensiell, μ=1 time,σ=1 time 70 enheter, P(x >50 min)=p(x >0.83 timer)=? Sentralgrenseteoremet: x tilnærmet N(1,1/ 70)=N(1,0.12) P(x >0.83)= Eksakt: 0.9294

Fordeling til en lineærkombinasjon av normalfordelte variabler At gjennomsnittet x av observerte verdier av n uavhengige normalfordelte variabler X 1,X 2,...,X n også er normalfordelt er et spesialtilfelle av en generell regel: X er N(μ X,σ X )-fordelt og Y er N(μ Y,σ Y )-fordelt X og Y er uavhengige (dvs korrelasjon=0) Da er Z = ax+by (der a og b er faste konstanter) også normalfordelt med forventning μ Z = aμ X +bμ Y standardavvik σ Z = (a 2 σ X2 +b 2 σ Y 2 )