Konfidensintervall for µ med ukjent σ (t intervall)



Like dokumenter
EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai SENSURFRIST: 16. juni KLASSE: HIS TID: kl

EKSAMEN. EMNEANSVARLIG: Terje Bokalrud og Hans Petter Hornæs. TILLATTE HJELPEMIDLER: Kalkulator og alle trykte og skrevne hjelpemidler.

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Forelening 1, kapittel 4 Stokastiske variable

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 11. juni HiS Jørstadmoen. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Fasit for tilleggsoppgaver

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

TMA4245 Statistikk Eksamen desember 2016

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ST0202 Statistikk for samfunnsvitere

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4245 Statistikk

Øving 7: Statistikk for trafikkingeniører

Eksamensoppgave i TMA4240 Statistikk

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

ST0202 Statistikk for samfunnsvitere

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk H2010

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl.

UNIVERSITETET I OSLO

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Foreleses onsdag 13.oktober, 2010

KATEGORISKE DATA- TABELLANALYSE ANALYSE AV. Tron Anders Moger. 3. Mai 2005

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg.

TMA4240 Statistikk H2015

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk H2010 (20)

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Et lite notat om og rundt normalfordelingen.

ECON2130 Kommentarer til oblig

Et lite notat om og rundt normalfordelingen.

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

ST0202 Statistikk for samfunnsvitere

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

STK1100 våren 2019 Mere om konfidensintevaller

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Binomisk sannsynlighetsfunksjon

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

QED Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

ST0202 Statistikk for samfunnsvitere

Hypotesetesting av λ og p. p verdi.

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

ST0202 Statistikk for samfunnsvitere

LØSNINGSFORSLAG ) = Dvs

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

6.2 Signifikanstester

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Eksamensoppgave i SØK Statistikk for økonomer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Løsningsforslag Til Statlab 5

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

EKSAMENSOPPGAVE. Eksamen i: STA Brukerkurs i statistikk 1 Mandag 03. juni 2013 Kl 09:00 13:00 Åsgårdvegen 9

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2016

HØGSKOLEN I STAVANGER

Normal- og eksponentialfordeling.

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Kapittel 3: Studieopplegg

TMA4240 Statistikk H2010 (22)

Fra første forelesning:

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

TMA4240 Statistikk Høst 2015

Eksamen i. MAT110 Statistikk 1

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Medisinsk statistikk Del I høsten 2009:

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Transkript:

Forelesning 3, kapittel 6 Konfidensintervall for µ med ukjent σ (t intervall) Konfidensintervall for µ basert på n observasjoner fra uavhengige N( µ, σ) fordelinger når σ er kjent : Hvis σ er ukjent har vi ikke dette tallet å sette inn i formelen. Vi kan imidlertid regne ut det empiriske standardavviket s som punktestimat for σ. Det er likevel ikke nok å erstatte σ med s i formelen over. Dette skyldes at s ofte vil vli mindre enn σ, og da blir intervallet for smalt, og sannsynligheten for "bom" blir større. Riktignok kan s like gjerne bli større enn σ, men dette er ikke nok til å kompensere. Fraktilen z α/2 må erstattes med et større tall som vi betegner t α/2 : Konfidensintervall for µ basert på n observasjoner fra uavhengige N( µ, σ) fordelinger når σ er ukjent ( t intervall): (Formel (50) i avsnitt 3.2.2 i formelsamlinga) Tallet t α/2 kalles α/2 fraktilen i Students t fordeling med n 1 frihetsgrader. Dette tallet ka (for eksempel) finnes i tabell 5.3 i formelsamlinga. Dette blir snart forklart nærmere, men først et regneeksempel : 1

Eksempel: Vi skal se på 95% konfidensintervall for µ i det samme eksemplet som i forrige forelesning med kjent standardavvik. Det vil si at vi har målt motoreffekt på en bil 3 ganger og fått resultatene 106.9, 109.8 og 111.5 (hestekrefter). Vi skal anta at dette er uavhengige 3 observasjoner fra N( µ, σ) fordelinger, med samme µ (virkelig motoreffekt) og samme σ (måleunøyaktighet) for hver måling, men skal nå i motsetning til i forrige eksempel tenke oss at vi ikke kjenner standardavviket σ. Vi skal derfor bruke t intervall, altså formelen nå. Gjennomsnittet er fortsatt 109.4. Det empiriske standardavviket er Vi må også finne fraktilen t α/2, fra tabell 5.3. Vi har n 1 = 3 1 = 2 frihetgrader, og dette betyr at vi går inn på raden for 2 frihetsgrader. Siden vi skal ha 95% konfidenintervall, er 1 α =0.95, så α = 0.05 og dermed α/2=0.025, så vi går inn i kolonna for α = 0.025: Der finner vi t α/2 = 4.303, og vi har nå alle tallene vi trenger for å sette inn i formelen: Kommentar: Med kjent σ = 3 fikk vi et smalere intervall, <106.0, 112.8>, selv om vi fikk s=2.33 litt mindre enn "sann verdi" σ=3. Dette skyldes at t α/2 =4.303 er mye større enn z α/2 = 1.960. Det reflekterer det som generelt gjelder i Statistikk (og andre fagområder): Vi får mindre presise resultater (her: bredere konfidensintervall) når vi har mindre informasjon (vi kjenner ikke σ). 2

Litt om utledningen av formel for t intervall. Sentralt i utledningen av formelen for z intervall var fordelingsresultatet Noen viktige aspekter som fikk dette til å virke var at parameteren µ som vi skal ha konfidensintervall for er eneste ukjente parameter i Z, og Z har en kjent fordeling uten ukjente parametre. Når σ er ukjent bytter vi ut σ med det empiriske standardavviket s, og kaller brøken vi da får for T : T har heller ingen andre ukjente parametre enn µ. Vi. Vi trenger derfor fordelingen (sannsynlighetstettheten) til T, og dette lar seg gjøre. Den har fått navnet "Students t fordeling" 1. Den har en parameter som er et naturlig tall ({1,2,3,4...}), og i denne situasjonen er det n 1 som skal settes inn for dette. Det kalles da "Students t fordeling med n 1 frihetsgrader", og en skrivemåte for dette er Fotnote 1: Den første som regnet ut denne fordelingen og lagde fraktiltabell for den var engelskmannen William Gossett (1876 1937) omkring 1908. Han var en beskjeden mann som publiserte under pseudonymet "Student", og fordelingen fikk navn etter dette. 3

Grafen til sannsynlighetstettheten til students t fordeling med 1 frihetsgrad ( grønn kurve), 3 frihetsgrader ( gul kurve) og 8 frihetsgrader ( blå kurve), samt til standard normalfordeling ( rød kurve). Fordelingene er symmetrisk om y aksen (like funksjoner), og nærmer seg raskt standard normalfordeling når det blir mange frihetsgrader. For mer enn 30 frihetsgrader er det ingen praktisk forskjell på Students t fordeling og standard normalfordeling (som av og til kalles Students t fordeling med uendelig mange frihetsgrader). For å konstruere konfidensintervall med signifikansnivå 1 α, betrakter vi som er illustret i figuren til høyre (med α=0.05 og 2 frihetsgrader): Siden det er sannsynlighet (areal) 1 α for at utfallet av T blir mellom k og k, er sannsynligheten α for at utfallet blir utenfor (arealet av de fyllte, røde områdene). Da blir det α/2 på hver side (på grunn av symmetrien om y aksen), og dermed er k α/2 fraktilen, som vi betegner t α/2 Det vil si at α/2 1 α α/2 k k 4

Teknikken er nå å omforme dobbeltulikheten slik at µ blir stående aleine i midten, akkurat som for z intervaller: 1 2 3 4 5 Når vi så har gjort observasjonene kan vi regne ut utfallet av de stokastiske variablene og kaller utfallene og. og Da vil de stokastiske variablene og med sannsynlighet 1 α havne slik at µ ligger mellom dem. Vi kan nå regne ut hva utfallene ble, men siden det fremdeles er ukjent om utfallene ble slik at dem kan vi fortsatt bare vite at µ ligger mellom disse verdiene med sannsynlighet 1 α. Ved å sette disse utfallene som grenser for et intervall får vi da konfidensintervallet µ ligger mellom 5

Videre arbeid. Du kan godt begynne på oppgavene med t intervaller nå. Neste forelesning blir mer teknisk, der skal vi se litt mer på bakgrunnen for Students t fordeling. Dette innebærer også at vi skal se litt på kjikvadratfordeling, som blant annet brukes til konfidensintervall (og hypotesetesting) for standardavviket σ. 6