Kapittel 9: Estimering

Like dokumenter
TMA4240 Statistikk H2010

Norske hoppdommere og Janne Ahonen

TMA4240 Statistikk H2010

Formelsamling i medisinsk statistikk

Kp. 9.8 Forskjell mellom to forventninger

Kapittel 10: Hypotesetesting

TMA4240 Statistikk H2010

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Oppgave 1. Kilde SS df M S F Legering Feil Total

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Formelsamling i medisinsk statistikk

TMA4240 Statistikk Høst 2009

Løsningsforslag eksamen 25. november 2003

Hypotesetest: generell fremgangsmåte

(utarbeidet av Mette Langaas), TMA4245 V2007

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

Kap. 8: Utvalsfordelingar og databeskrivelse

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2007

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016

Estimering og hypotesetesting

Tilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9

Oppgave 14.1 (14.4:1)

STK Oppsummering

Estimering og hypotesetesting

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Om eksamen. Never, never, never give up!

ST0202 Statistikk for samfunnsvitere

Eksamensoppgåve i TMA4240 Statistikk

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Om eksamen. Never, never, never give up!

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2016

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Forslag til endringar

Eksamensoppgave i TMA4240 Statistikk

LØSNINGSFORSLAG ) = Dvs

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

i x i

UNIVERSITETET I OSLO

TMA4240 Statistikk 2014

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

STK Oppsummering

HØGSKOLEN I STAVANGER

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

TMA4240 Statistikk H2010

Kapittel 9 og 10: Hypotesetesting

Eksamensoppgåve i TMA4255 Anvendt statistikk

ST0202 Statistikk for samfunnsvitere

STK1100 våren 2019 Mere om konfidensintevaller

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

TMA4240 Statistikk H2015

TMA4240 Statistikk Høst 2015

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

TMA4240 Statistikk Høst 2009

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Kapittel 2: Hendelser

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

TMA4240 Statistikk Høst 2018

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

TMA4240 Statistikk Høst 2015

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Econ 2130 uke 16 (HG)

Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!

Eksamensoppgave i TMA4255 Anvendt statistikk

6.1 Kontinuerlig uniform fordeling

Løsningsforslag, eksamen statistikk, juni 2015

Fasit for tilleggsoppgaver

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Oppgave N(0, 1) under H 0. S t n 3

Oppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

6.1 Kontinuerlig uniform fordeling

TMA4240 Statistikk Høst 2015

Transkript:

Kapittel 9: Estimeing TMA445 Statistikk 9.8,9.9: Estimeing, to utvalg. 9.6: Pediksjonsintevall Tuid.Follestad@math.ntnu.no p.1/13 Repetisjon: Punkt-og intevall-estimeing, eitt utvalg La X 1, X,..., X n vee eit tilfeldig utvalg få ein n(x; µ, σ)-populasjon. Geneelt: Kan finne punktestimato ved intuisjon/tolking av paameteen elle ved matematisk metode, fo eksempel SME. Estimato fo µ: ˆµ = X = 1 n n i=1 X i, med E( X) = µ, Va( X) = σ n. Desom σ e ukjent e S = 1 n 1 n i=1 (X i X) ein estimato fo σ. (1 α)100% konfidensintevall fo µ: [ x z α σ, x + z α σ (σ kjent) [ x t α,(n 1) s n, x + t α,(n 1) s (σ ukjent) Mek: Konfidensintevalla kan skivast (Kap. 9.5) punktestimat ± z α std.avvik til punktestimat og punktestimat ± t α,(n 1) std.avvik til punktestimat TMA445: Kapittel 9-del4 p./13

To utvalg Eksempel: Medisin: Test av ny blodtykksmedisin. Ko mykje bete e han enn noveande maknadsleiande blodtykksmedisin? Epidemiologi: E andelen kefttilfelle blant tidlegae kjemi-studenta ved Rosenbog støe enn i befolkninga elles? Mateialslitasje: Kva gi støst slitasje - italiensk mamo elle nosk ganitt? Bensinfobuk: Kva fo ein av to biltype buke minst bensin? Kva fo ein av to bensintype e dygast? Statistisk situasjon: Ønskje å samanlikne to populasjona baset på eit tilfeldig utvalg få kva populasjon. Ønskje å anslå diffeansen mellom foventningsvedi (elle andel) i dei to populasjonene, og eit intevall de vi ha sto tillit til at den sanne diffeansen i foventningsvedi (elle andel) ligg. Samanlikningane kan vee pavise elle ikkje pavise. TMA445: Kapittel 9-del4 p.3/13 To utvalg: Estimatoa (nomalfodeling) X (1) 1, X(1) X () 1, X(),..., X(1) : tilfeldig utvalg få ein n(x; µ 1, σ 1 )-populasjon,..., X() n : tilfeldig utvalg få ein n(x; µ, σ )-populasjon. Estimato fo µ 1 µ : ˆµ 1 ˆµ = X 1 X = 1 n1 i=1 X(1) i 1 n n j=1 X() j (intuitiv og SME). X 1 X e nomalfodelt med Desom σ 1 og σ e kjente så e E( X 1 X ) = µ 1 µ Va( X 1 X ) = σ 1 + σ n Z = ( X 1 X ) (µ 1 µ ) σ 1 + σ n n(z; 0, 1). TMA445: Kapittel 9-del4 p.4/13

To utvalg: konfidensintevall fo µ 1 µ nå σ 1 og σ e kjente Desom X 1 og X e gjennomsnitta til to tilfeldige utvalg av stoleik og n få populasjona med kjent vaians σ 1 og σ, så e eit (tilnæma) (1-α)100% konfidensintevall fo µ 1 µ ( x 1 x ) z α σ 1 + σ n (µ 1 µ ) ( x 1 x ) + z α σ 1 + σ n de z α e vedien i standad nomalfodelinga som ha aeal α til høge, dvs. P(Z > z α ) = α. TMA445: Kapittel 9-del4 p.5/13 Eksempel: Bensinfobuk Poblemstilling: Vil samanlikne to biltype A og B med tanke på skilnade i divstoffobuk. La Xi A vee #km/lite fo bil numme i, type A. La Xj B vee #km/lite fo bil numme j, type B. Anta at Xi A N(µ A, σa ), med kjent σ A =. Anta at Xj B N(µ B, σb ), med kjent σ B = 3. Obsevasjona: Gje n A = 1 målinga på bil A, med gjennomsnitt x A = 10 km/lite. Gje n B = 10 målinga på bil B, med gjennomsnitt x B = 8 km/lite. Vil finne 95% konfidensintevall fo µ A µ B. Estimato: ˆµ A ˆµ B = X A X B. Punktestimat: x A x B = km/lite. 95% konfidensintevall: α = 0.05, zα = z 0.05 = 1.96, [ 1.96 1 + 3, + 1.96 10 1 + 3 10 = [0.66,3.34 TMA445: Kapittel 9-del4 p.6/13

To utvalg: σ 1 = σ, men ukjente Desom σ 1 σ laga vi S 1 = 1 1 i=1 i X 1 ) og S = 1 n n 1 (X (1) j=1 (X () j X ) Desom vi veit at σ 1 = σ = σ så kan vi lage ein estimato S p (pooled) fo σ som ein lineækombinasjon av S 1 og S : S p = 1 1 + n 1 S 1 + n 1 1 + n 1 S = ( 1)S 1 + (n 1)S + n de X 1 = 1 n1 i=1 X(1) i og X = 1 n n j=1 X() j. TMA445: Kapittel 9-del4 p.7/13 To utvalg: konfidensintevall (1 α)100% konfidensintevall fo µ 1 µ : nå σ1 og σ e kjente: [( x 1 x ) ± z α s σ 1 + σ n nå σ 1 = σ = σ, men ukjente: s 1 [( x 1 x ) ± t α,( +n )s p + 1 n nå σ1 og σ e ukjente og ulike (tilnæma (1 α)100% konfidensintevall): s s 1 [( x 1 x ) ± t α,ν + s n de ν = (s 1 / + s /n ) [(s 1 /) /( 1) + [(s /n ) /(n 1) TMA445: Kapittel 9-del4 p.8/13

Eksempel: Bensintype Poblemstilling: (Henta få "The Catoon Guide to Statistics".) Vil samanlikne to type bensin, med tanke på fobuk pe km. To fosøksstategia: 1. Utsty n A tilfeldig valgte dosje med bensin av type A, og n B tilfeldig valgte dosje med bensin av type B. La X A i, i = 1,..., n A vee bensinfobuk (i km/l) til bilane med type A-bensin. La X B j, j = 1,..., n B vee bensinfobuk (i km/l) til bilane med type B-bensin. X A 1, XA,..., XA n A, X B 1, XB,..., XB n B alle uavhengige.. Utsty n tilfeldig valgte dosje med type A-bensin ein dag, og type B-bensin ein annan dag. La Xi A, i = 1,..., n vee bensinfobuk av type A-bensin på dei n bilane. La Xi B, i = 1,..., n vee tilsvaande bensinfobuk av type B-bensin på dei n bilane. X A i og X B i e ikkje uavhengige, typisk e Cov(X A i, XB i ) > 0. Paa (X1 A, XB 1 ),(XA, XB ),...,(XA n, XB n ) e uavhengige. Kva fo ein stategi e best? TMA445: Kapittel 9-del4 p.9/13 Konfidensintevall fo µ 1 µ fo pavise obsevasjona Desom d og s d e gjennomsnittet og standadavviket til nomalfodelte diffeansa av n pa av tilfeldige obsevasjona, så e eit (1-α)100% konfidensintevall fo µ D = µ 1 µ d t α,(n 1) s d µ D d + t α,(n 1) s d de t α,(n 1) e vedien i t-fodelinga med n 1 fidomsgade som ha aeal α til høge, dvs. P(T > t α,(n 1) ) = α. Se at dette e i tåd med konfidensintevall fo µ fo eitt utvalg: x t α,(n 1) s µ x + t α,(n 1) s TMA445: Kapittel 9-del4 p.10/13

Eksempel: Bensintype (fots.) Velge stategi. Obsevasjona (få "The Catoon Guide to Statistics"): n = 10 fosøk med obsevete vedia fo D i = Xi A Xi B (miles/gallon): i 1 3 4 5 6 7 8 9 10 d i 0.06-0.44-1.64-1.10 0.55-1.05-0.70-0.45-0.50-0.79 Anta D 1, D,..., D n u.i.f, D i N(µ D, σd ), de både µ D og σd e ukjente. Estimato fo µ D : ˆµ D = D, estimat d = 0.60. Estimato fo σ D : ˆσ D = S D = 1 n 1 P n i=1 (D i D), estimat s d = 0.38. 95% konfidensintevall fo µ D = E(D i ): α = 0.05, t α,n 1 = t 0.05,9 =.6, s d s d [ d t α,(n 1), d + t α n,(n 1) n = [ 0.60.6 0.38 0.38, 0.60 +.6 = [ 1.04, 0.16 10 10 Mek: Konfidensintevallet inneheld ikkje 0, og begge gensene e negative. Det e defo imelig å konkludee med at det e skilnad på bensintypene, dvs. µ D < 0. TMA445: Kapittel 9-del4 p.11/13 9.6 Pediksjonsintevall fo famtidig obsevasjon, nomalfodeling Fo ei nomalfodeling med ukjent foventningsvedi µ, men kjent vaians σ, e eit (1-α)100% pediksjonsintevall fo ein famtidig obsevasjon x 0 gitt som x z α σ 1 + 1 n < x 0 < x + z α σ 1 + 1 n de z α e vedien i standad nomalfodelinga som ha aeal α P(Z > z α ) = α. til høge, dvs. Fo ei nomalfodeling med ukjent foventningsvedi µ, og ukjent vaians σ, e eit (1-α)100% pediksjonsintevall fo ein famtidig obsevasjon x 0 gitt som x t α,(n 1)s 1 + 1 n < x 0 < x + t α,(n 1)s 1 + 1 n de t α,(n 1) e vedien i t-fodelinga med n 1 fidomsgade som ha aeal α til høge, dvs. P(T > t α,(n 1)) = α, og s = P n i=1 (x i x) TMA445: Kapittel 9-del4 p.1/13

Eksempel: Høgde studenta Menn Kvinne tettleik 0.00 0.01 0.0 0.03 0.04 0.05 0.06 tettleik 0.00 0.01 0.0 0.03 0.04 0.05 0.06 160 170 180 190 00 hogde, menn 155 160 165 170 175 180 185 hogde, kvinne Raudt: ˆµ og 95% konfidensintevall fo µ. Blått: 95% pediksjonsintevall fo famtidig obsevasjon av høgda til ein student. TMA445: Kapittel 9-del4 p.13/13