Kap. 9: Inferens om én populasjon

Like dokumenter
Kap. 9: Inferens om én populasjon

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

TMA4240 Statistikk Høst 2015

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Kapittel 8: Estimering

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

TMA4240 Statistikk Høst 2016

Statistikk og økonomi, våren 2017

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

Løsningsforslag Oppgave 1

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

MOT310 Statistiske metoder 1, høsten 2011

TMA4245 Statistikk Eksamen mai 2017

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

TMA4240/4245 Statistikk 11. august 2012

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

TMA4240 Statistikk Høst 2009

Oversikt over konfidensintervall i Econ 2130

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

Lineær regresjonsanalyse (13.4)

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Oversikt over konfidensintervall i Econ 2130

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

TMA4240 Statistikk Høst 2016

ECON240 Statistikk og økonometri

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Hypotesetesting, del 4

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Econ 2130 Forelesning uke 11 (HG)

Estimering 2. -Konfidensintervall

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

TMA4245 Statistikk Eksamen august 2015

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

TMA4240 Statistikk H2010

TMA4240 Statistikk Eksamen desember 2015

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

MOT310 Statistiske metoder 1, høsten 2012

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

Oversikt over konfidensintervall i Econ 2130

Løsning TALM1005 (statistikkdel) juni 2017

TMA4245 Statistikk Eksamen 9. desember 2013

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

Løsningsforslag ST2301 øving 3

Mer om utvalgsundersøkelser

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Oppgaver fra boka: X 2 X n 1

Løsningsforslag til eksamen i STK desember 2010

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

STK1100 våren 2017 Estimering

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Eksamen REA3028 S2, Våren 2011

Eksamen REA3028 S2, Våren 2012

Oversikt, del 5. Vi har sett på styrkefunksjon for ensidige tester. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

Estimering 1 -Punktestimering

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

AVDELING FOR INGENIØRUTDANNING EKSAMENSOPPGAVE

Estimering 1 -Punktestimering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Transkript:

2 ST0202 Statistikk for samfusvitere Bo Lidqvist Istitutt for matematiske fag Ka. 9: Iferes om é oulasjo Hvis σ er ukjet bytter vi ut σ med s i Ny observator blir t = x μ s/ z = x μ σ/ der s = Σx 2 (Σx) 2 / 1 t kalles for Studets t-observator Fordelige til t kalles t-fordelige og er avhegig av utvalgsstørrelse via atall frihetsgrader som er df = 1 (df = degrees of freedom ). 1. t-fordelige er symmetrisk rudt 0. 2. t-fordelige har e form som avheger av atall df (som er 1). 3. t-fordelige ærmer seg stadard ormalfordelige år df øker 4. t-fordelige har lavere to og tykkere haler e stadard ormalfordelig 4 Tabell 6: Kritiske verdier for t-fordelige t(df,α) er t-verdie slik at areal α ligger til høyre, dvs. P(t > t(df,α)) = α der t er t-fordelt med df frihetsgrader.

5 6 Tabell 7: -verdier for t-fordelige Tabelle ieholder arealer av tye edefor for ulike df Iferes om μ år σ er ukjet (9.2) Atagelse: x er tilærmet ormalfordelt, dvs. oulasjoe er ormalfordelt eller er stor. Vi bruker at t = x μ s/ er t-fordelt med df = 1 frihetsgrader. 7 Kofidesitervall for μ år σ er ukjet Et 1 α kofidesitervall for μ år σ er ukjet er gitt ved x ± t( 1,α/2) s Til sammeligig har vi følgede itervall år σ er kjet: x ± z(α/2) σ For å gå fra kjet til ukjet σ bytter vi altså ut σ med s z(α/2) med (det alltid oe større) t( 1,α/2) Ogave: Jeg har trukket 10 tall fra e oulasjo som er ormalfordelt med gjeomsitt μ og stadardavvik σ. Tallee ble 105.74 116.95 137.09 98.98 115.83 98.74 106.18 110.35 133.29 104.11 med utvalgsgjeomsitt x = 112.73 og utvalgsstadardavvik s = 13.33 Fi et uktestimat for oulasjosarametere μ Fi et itervallestimat for oulasjosarametere μ. Bruk 90% kofidesivå.

9 Hyotesetestig om μ (σ ukjet) (9.2) Eksemel: Sråktest for ugdomsskoleelever. Vil teste H 0 : μ = 125 mot H a : μ>125, der utvalget å består av = 22 elever og σ atas ukjet. Har observert x = 128.5. Vi skal gjeomføre e hyotesetest der sigifikasivået settes til 5%, me å altså med ukjet σ. Vi må da rege ut utvalgsstadardavviket s som viser seg å bli s = 15.2. Vi bruker testobservatore t = x 125 s/ Store verdier av t tyder å at H a gjelder. Poeget med å bruke t er at år H 0 er riktig, er t t-fordelt med atall frihetsgrader df = 22 1 = 21. Vi ka derfor forkaste H 0 hvis de beregede verdi for t er så stor at de er urimelig for e t-fordelig med df = 21. Her blir t = 128.5 125 15.2/ 22 = 1.08 så sørsmålet er om dette er for høyt til rimeligvis å kue komme fra e t-fordelig med df = 21. 11 Metode med -verdi med ukjet σ Vi fier fra Tabell 7 i koloe med df = 21 P(t > 1.08) er mellom 0.142 og 0.164 og ka bereges til 0.15. Da dette er større e sigifikasivået α = 0.05, forkaster vi ikke H 0. De beregede sasylighet P(t > 1.08) ka geerelt skrives P(t > t ) og er å -verdie for teste. 12 Klassisk metode med ukjet σ Situasjoe er som før og vi bruker samme testobservator, emlig t = x 125 s/ Å velge sigifikasivå α betyr at vi krever P(forkaste H 0 )=α hvis H 0 er sa Dette får vi til ved å forkaste H 0 hvis t > t( 1,α), der t(df,α) er de kritiske verdi) og fies i Tabell 6.

Vi forkaster da H 0 dersom t = x 125 s/ > t( 1,α) Med α = 0.05 og = 22 får vi fra Tabell 6: t(21, 0.05) =1.72 mes vi bereger t 128.5 125 = 15.2/ = 1.08 < 1.72 22 så vi forkaster ikke H 0 med sigifikasivå α = 0.05. Ogave (forts.): Se igje å de 10 tallee som er trukket fra e oulasjo som er ormalfordelt med gjeomsitt μ og stadardavvik σ. Tallee var 105.74 116.95 137.09 98.98 115.83 98.74 106.18 110.35 133.29 104.11 med utvalgsgjeomsitt x = 112.73 og utvalgsstadardavvik s = 13.33 Jeg åstår at μ = 100 for oulasjoe. Ta stillig til dette utsaget med e hyotesetest. Bruk sigifikasivå α = 0.1. Hva blir de kritiske verdier? Fi også -verdie. Løsig med klassisk metode: H 0 : μ = 100 mot H a : μ 100, σ ukjet. Har å: = 10, x = 112.73, s = 13.33, α = 0.10 Vi forkaster å H 0 dersom t < t( 1,α/2) eller t > t( 1,α/2). Da er fra Tabell 6: t( 1, α/2) =t(9, 0.05) =1.83. Vi får t 112.73 100 = 13.33/ = 3.02 > 1.83 10 så vi forkaster H 0 med sigifikasivå 0.10. NB. Hvis α = 0.01 ville vi brukt t(9, 0.005) =3.25 og ikke forkastet. Løsig med -verdi: -verdie er sasylighete for at vår testobservator t får e verdi som er lik de vi har fått eller e som er mer ekstrem (i retig av de alterative hyotese) år ullhyotese gjelder. Vi bruker da Tabell 7 til å fie (tilærmet, med iterolasjo å øyemål) -verdi = P(t < 3.02 eller t > 3.02) = 2 P(t > 3.02) = 2 0.008 = 0.016 som er midre e α = 0.10, så vi forkaster H 0 med sigifikasivå α = 0.10 (me for eksemel ikke med sigifikasivå 0.01.

17 Biomisk sasylighetsfordelig E tilfeldig variabel x er biomisk fordelt (ka. 5.5) hvis: det er uavhegige forsøk sasylighet for suksess og sasylighet q for fiasko i hvert forsøk x er atall suksess i de forsøk. Da er forvetig for x lik μ x = og stadardavvik for x er σ x = q. 18 Iferes om de biomiske sasylighet for suksess (9.3) fortolkes som adele med egeskae suksess i oulasjoe, slik at er sasylighete for å trekke e ehet med suksess. Utvalget består i å gjøre forsøk, dvs. tilfeldige trekiger fra oulasjoe, og registrere atallet x med suksess. Adel med suksess i utvalget er da = x som ka kalles utvalgs-suksess-sasylighete ( samle biomial robability ). er uktestimatet for basert å vårt utvalg. 19 Forvetig μ og stadardfeil σ for : 20 Utvalgsfordelig for Hvis et utvalg av størrelse trekkes fra e oulasjo med = P( suksess ), så vil utvalgsfordelige for ha: 1. forvetig μ = (dvs. uktestimatet er forvetigsrett) 2. stadardfeil (dvs. stadardavvik for uktestimatet) q σ = 3. tilærmet ormalfordelig (hvis både og q er større e 5)

Statistisk iferes om ka derfor bygges å de (tilærmet) stadard ormalfordelte z = q Merk aalogie med z = x μ σ slik at i trasformasjoe for er σ blitt til q Et kofidesitervall for med kofidesivå 1 α ville da kue se ut som ( ) q q z(α/2), + z(α/2) som er aalogt med ( x z(α/2) σ, x + z(α/2) σ ) MEN side kofidesitervallet for ovefor ieholder de ukjete (og q), vil vi bruke kofidesitervallet: ( ) z(α/2), + z(α/2) der q = 1 er utvalgs-fiasko-sasylighete. Ogave: Jeg har utført et biomisk forsøk med = 1000. Det ble x = 871 suksesser. Fi et uktestimat for Fi et kofidesitervall for med kofidesivå 0.90. 24 Utvalgsstørrelse 1 α-kofidesitervallet for suksess-sasylighete i oulasjoe er altså defiert ved ( ) z(α/2), + z(α/2) der maksimal feil for estimatet er E = z(α/2) Hvor stor må vi velge for å få e bestemt maksimal feil E? = [z(α/2)]2 q E 2 der og q er foreløige verdier for og q som brukes uder laleggige.

25 Utvalgsstørrelse (forts.) Formel: = [z(α/2)]2 q E 2 Det viser seg at i formele blir størst hvis og q begge er 0.5. Så hvis vi ikke har forhådskjeska til, og øsker å være å de sikre side, reger vi ut med = q = 0.5. Eksemel: Hva må være for at feile E skal være midre e eller lik 0.01 med kofidesivå 0.95? Hvis vi ikke har forhådsvite om : = [z(α/2)]2 q E 2 = [z(0.025)]2 0.5 0.5 0.01 2 = 1.962 0.25 = 9604 0.0001 Hvis vi har forhådsvite om at er i størrelesorde 0.15, setter vi = 0.15 og q = 0.85 og får = 1.962 0.15 0.85 0.0001 = 4898 28 Hyotesetestig med (bok s. 502) Eksemel: Det har vært atatt at 60% av studetee å et uiversitet har deltidsjobb uteom studiee. Etter at Kvalitetsreforme har virket e stud, tror studieledelse at tallet er lavere og øsker å udersøke dette ved å sørre et utvalg å = 500 studeter. Det viser seg at x = 260avdissehar deltidsjobb. Et uktestimat for er da = 260/500 = 0.52. Et kofidesitervall for med kofidesivå 0.90 er ( ) 0.52 0.48 0.52 0.48 0.52 1.65, 0.52 + 1.65 500 500 dvs. (0.483,0.557) Me ma øsker først og fremst å teste hyotese H 0 : = 0.60 mot H a : < 0.60

29 Testobservator for å teste e adel Vi vil teste H 0 : = 0 for et sesifisert tall 0.Brukda z = 0 med = x 0 q 0 For å teste H 0 : = 0.60 mot H a : < 0.60 bruker vi dermed z = 0.60 0.60 0.40 500 som hvis H 0 gjelder er stadard ormalfordelt, og som i vårt eksemel blir lik z = 0.52 0.60 0.60 0.40 500 = 3.65 -verdi blir dermed (som for testee om μ) verdi = P(z < 3.65) =P(z > 3.65) =0.0001 fra Tabell 5 (som vi ikke har brukt til å). Dette er svært lavt, og fører til forkastig av H 0 for f.eks. α =0.01 eller 0.05. Klassisk metode er også som for testee om μ: H 0 skal forkastes med sigifikasivå α hvis z < z(α). Med α = 0.01 blir det å forkaste om z < z(0.01) = 2.33 dvs. vi forkaster H 0. 31 Merkad om kofidesitervall og testig av hyoteser om Ata vi skal teste ullhyotese H 0 : = 0 der 0 er et gitt tall, f.eks. 0.60 i vårt eksemel. I testobservatore brukes da 0 og q 0 = 1 0 i uttrykket for stadardfeile til i evere z = 0 med = x 0 q 0 Til sammeligig, i et (1 α) kofidesitervall for basert å, dvs. ( ) z(α/2), + z(α/2) brukes uttrykket for å reresetere stadardfeile for

www.tu.o ST0202, Uke 38