Mer om utvalgsundersøkelser



Like dokumenter
Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

Kapittel 8: Estimering

Oppgaver fra boka: X 2 X n 1

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

STK1100 våren 2017 Estimering

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

Metoder for politiske meningsmålinger

Statistikk og økonomi, våren 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Estimering 2. -Konfidensintervall

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 4. Hypotesetesting, del 4

Hypotesetesting, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

Oversikt over konfidensintervall i Econ 2130

n 2 +1) hvis n er et partall.

Estimering 1 -Punktestimering

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Estimering 1 -Punktestimering

Ukeoppgaver i BtG207 Statistikk, uke 4 : Binomisk fordeling. 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ECON240 Statistikk og økonometri

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

Oversikt over konfidensintervall i Econ 2130

3MX 2007/8 - Kapittel 5: 8. januar 5. februar 2008

Påliteligheten til en stikkprøve

TMA4240 Statistikk Høst 2016

Kommentarer til oppgaver;

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Løsningsforslag Oppgave 1

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

MOT310 Statistiske metoder 1, høsten 2011

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

Oversikt over konfidensintervall i Econ 2130

TMA4240 Statistikk Høst 2009

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

Kap. 9: Inferens om én populasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

Kap. 9: Inferens om én populasjon

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Kapittel 7: Noen viktige sannsynlighetsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

TMA4240 Statistikk H2010

MOT310 Statistiske metoder 1, høsten 2012

ARBEIDSHEFTE I MATEMATIKK

EKSAMEN Løsningsforslag

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

Eksamen REA3028 S2, Våren 2012

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

Løsningsforslag ST2301 øving 3

TMA4240 Statistikk Høst 2016

TMA4245 Statistikk Eksamen mai 2017

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

TMA4245 Statistikk Eksamen 9. desember 2013

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 20. mai 2008

Eksamen REA3028 S2, Våren 2011

Econ 2130 Forelesning uke 11 (HG)

Hypotesetesting, del 4

Kapittel 7: Noen viktige sannsynlighetsfordelinger

2T kapittel 3 Modellering og bevis Utvalgte løsninger oppgavesamlingen

Eksempler fra slutten av forrige uke. Eksempler (styrke, dimensjonering,...) Eksempler fra slutten av forrige uke

STK1100: Kombinatorikk

TMA4245 Statistikk Eksamen august 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

Forelesning Moment og Momentgenererende funksjoner

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

Løsningsforslag til eksamen i STK desember 2010

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Løsning eksamen R1 våren 2010

Differensligninger Forelesningsnotat i Diskret matematikk Differensligninger

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

Avsnitt 8.1 i læreboka Differensligninger

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Transkript:

Mer om utvalgsudersøkelser I uderkapittel 3.6 i læreboka gir vi e kort iførig i takegage ved utvalgsudersøkelser. Vi gir her e grudigere framstillig av temaet. Populasjo og utvalg Ved e utvalgsudersøkelse vil vi ut fra et utvalg fra e populasjo aslå hvor stor adel p av populasjoe som har e bestemt egeskap, eller e bestemt meig om et aktuelt samfusspørsmål. Et eksempel på e utvalgsudersøkelse er e politisk meigsmålig. Eksempel Meigsmålig I februar 008 spurte meigsmåligsistituttet yovate et tilfeldig utvalg på 97 stemmeberettigede persoer hvilket parti de ville ha stemt på hvis det hadde vært stortigsvalg este dag. Av de spurte ville 9 ha stemt på Arbeiderpartiet. Arbeiderpartiets oppslutig på meigsmålige er 9 0,34 3,4 % 97. Estimator for populasjosadel I e stor populasjo er det et ukjet atall idivider som har et bestemt "kjeeteg". I eksempel er populasjoe alle stemmeberettigede som ville ha stemt hvis det hadde vært stortigsvalgvalg este dag, og kjeeteget er at e perso ville ha stemt på Arbeiderpartiet. Vi lar N være atall idivider i populasjoe og a det ukjete atallet som har kjeeteget. Vi øsker å fie ut hvor stor adel av populasjoe som har dette kjeeteget. Vi er altså iteressert i populasjoadele a p N For å aslå p trekker vi et tilfeldig utvalg på idivider fra populasjoe. I eksempel er de 97 et tilfeldig utvalg av de stemmeberettigede som ville ha stemt hvis det hadde vært valg. Aschehoug Udervisig www.lokus.o ide av 8

Vi forutsetter at størrelse av utvalget er lite i forhold til størrelse av hele populasjoe, og lar X være atall idivider i utvalget som har kjeeteget. Til å aslå p bruker vi adele i utvalget som har dette kjeeteget, det vil si X Vi sier at (som vi leser "p hatt") er e estimator for p. Det aslaget vi kommer fram til år vi bruker estimatore, kaller vi et estimat. I eksempel er estimatet 3,4 %. tadardfeil ide X er e stokastisk variabel, vil også være det. Verdie til vil variere fra e utvalgsudersøkelse til e ae, selv om de virkelige populasjosadele p er de samme. Det er hovedgrue til at politiske meigsmåliger ka sprike e del, selv år de er gjeomført til samme tid. Hva er fordelige til de stokastiske variabele X? ide vi trekker ute tilbakeleggig, er hedelsee "første idivid vi trekker, har kjeeteget ", "adre idivid vi trekker, har kjeeteget ", osv. egetlig avhegige. Me side utvalget er lite i forhold til hele populasjoe, ka vi se på hedelsee som uavhegige og rege som om hver av dem har sasylighet p. Da er X biomisk fordelt, og EX ( ) pog Var( X) p( p). X Vi vil fie forvetig, varias og stadardavvik til X. Da bruker vi regereglee () og () i otatet "Regeregler for forvetig og varias" som du fier på Lokus.o. Vi får at E( ) E X E( X) p p p( p) Var( ) Var X Var( X) p( p) σ Var( ) p( p) Aschehoug Udervisig www.lokus.o ide av 8

At E( ) p, betyr at hvis vi gjør mage utvalgsudersøkelser, så vil gjeomsittet av dem være ær populasjosadele p (forutsatt at p er de samme for alle udersøkelsee). tadardavviket til gir oss iformasjo om hvor mye resultatet vil variere fra e utvalgsudersøkelse til e ae på gru av tilfeldigheter ved trekkige av utvalget. Du ser at stadardavviket σ avheger av de ukjete populasjosadele p. Vi ka derfor ikke rege ut σ øyaktig. Me vi får e brukbar tilærmigsverdi hvis vi erstatter p med. Vi får da ( ) kaller vi stadardfeile til. (tadardfeile er altså et estimat for σ.) Eksempel tadardfeil ved meigsmålig Vi ser på meigsmålige i eksempel. Av de 97 persoee som ville ha brukt stemmerette hvis det hadde vært valg este dag, er det X 9 som ville ha stemt 9 Arbeiderpartiet. Det gir p 0,34 3, 4 %. 97 3,4 % er et estimat for Arbeiderpartiets oppslutig på det aktuelle tidspuktet. 0,34 ( 0,34) tadardfeile til estimatet er p 0,05 0,05. 97 Vi oppsummerer: Fra e stor populasjo trekker vi et tilfeldig utvalg på idivider. tørrelse av utvalget er lite i forhold til hele populasjoe. La X være atall idivider i utvalget som har et bestemt kjeeteg, og la p være adele i hele populasjoe som har dette kjeeteget. om estimator for populasjosadele p bruker vi X tadardfeile til estimatore er ( ) I forbidelse med politiske meigsmåliger som de i eksempel står det ekelte gager at "resultatee må tolkes iefor feilmargier på 3 prosetpoeg". Hva betyr egetlig dette, og hvorda heger det samme med stadardfeile vi fat i eksempel? For å forstå det må vi se på hva vi meer med et kofidesitervall. Aschehoug Udervisig www.lokus.o ide 3 av 8

Kofidesitervall Et kofidesitervall er grovt sagt et itervall som vi "reger med" at de ukjete populasjosadele p ligger i. For å bestemme et kofidesitervall for p tar vi utgagspukt i at X er tilærmet ormalfordelt X år er tilstrekkelig stor (se side 67 i læreboka). Da er også tilærmet ormalfordelt. Ovefor fat vi at E( p ) p, og at stadardavviket til er tilærmet lik stadardfeile. p Derfor er tilærmet stadardormalfordelt (se side 57 i læreboka). I oppgave 3.6 i læreboka fat vi at det er 95 % sasylig at e stadardormalfordelt stokastisk variabel vil få e verdi i itervallet,96,,96. Det gir at p P,96 < <,96 0,95 (I) Vi ser ærmere på ulikhetee i paretese: p,96 < <,96 (II) Vi vil omforme vestre og høyre ulikhet i (II) hver for seg. Vi multipliserer først med på begge sider i de vestre ulikhete. Da får vi, 96 p < p p p< p+, 96 På samme måte ka vi omforme de høyre ulikhete i (II). Det gir, 96 p < p Vi har dermed at (II) ka omformes til ulikhetee,96 p < p< p+,96 (III) Da viser (I) at det er tilærmet 95 % sasylig at ulikhetee i (III) vil bli oppfylt år vi utfører e utvalgsudersøkelse. asylighete er altså tilærmet 95 % for at vi vil få e verdi av som er slik at de virkelige populasjosadele p ligger i itervallet, 96, +, 96 (IV) Vi sier at itervallet er et tilærmet 95 % kofidesitervall for p. Et tilærmet 95 % kofidesitervall for populasjosadele p er, 96, +, 96 Her er estimatore for populasjosadele, og er stadardfeile til. Det er valig å lage kofidesitervaller på 90 %, 95 % eller 99 %. Vi får kofidesitervaller på 90 % og 99 % ved å bytte ut,96 med heholdsvis,64 og,58 i itervallet ovefor. Aschehoug Udervisig www.lokus.o ide 4 av 8

Eksempel 3 Kofidesitervall ved meigsmålig Vi ser igje på meigsmålige i eksemplee og. Vi fat at p 0,34 og 0,05 0,05. Et tilærmet 95 % kofidesitervall for p Arbeiderpartiets oppslutig hvis det hadde vært stortigsvalg este dag, er 0,34,96 0, 05, 0,34 +,96 0, 05 0,84, 0,344 Ut fra kofidesitervallet vil vi "rege med" at Arbeiderpartiets oppslutig i februar 008 lå mellom 8,4 % og 34,4 %. Det gir e "feilmargi" for Arbeiderpartiets oppslutig på meigsmålige. p Vi fat kofidesitervallet (IV) ved å ta utgagspukt i at er tilærmet stadardormalfordelt. Dee tilærmige er brukbar år både p og ( p) er mist lik 0 (se sidee 69 70 i læreboka). ide vi ikke kjeer p, får vi å "tommelfigerregele" at X og ( ) X begge må være mist lik 0 for at vi skal kue bruke kofidesitervallet. Hva betyr det egetlig at (IV) er et 95 % kofidesitervall? For å forstå det er det viktig å legge merke til at (IV) er et itervall der øvre og edre grese er stokastiske variabler. om alle adre sasyligheter ka 95 % her tolkes som e relativ frekves i det lage løp. For å forklare dette tar vi for oss meigsmåligseksemplet igje. Vi teker oss at det på et tidspukt blir utført veldig mage meigsmåliger, og at vi for hver målig reger ut et 95 % kofidesitervall for Arbeiderpartiets oppslutig. Da vil omtret 95 % av disse itervallee ieholde de virkelige oppslutige om Arbeiderpartiet. Etter at vi har reget ut itervallgresee på grulag av é bestemt målig, har det ige meig å sakke om sasylighete for at itervallet skal ieholde de virkelige oppslutige om Arbeiderpartiet. For ete er de med i itervallet eller så er de det ikke. ammelikig av to meigsmåliger Ata at et politisk parti på et tidspukt har oppslutig fra e adel p av velgere, og at oppslutige på et seiere tidspukt er p. På det første tidspuktet blir det gjort e meigsmålig der persoer blir spurt om hvilket parti de ville ha stemt på hvis det hadde vært stortigsvalg este dag. Av dem ville X ha stemt på det aktuelle partiet. På det adre tidspuktet er de tilsvarede tallee og X. Edrige i partiets oppslutig er altså δ p p. Dee edrige ka vi estimere med X δ p p X, der og. Aschehoug Udervisig www.lokus.o ide 5 av 8

Eksempel 4 Edrig ved meigsmåliger I februar 008 spurte meigsmåligsistituttet yovate et tilfeldig utvalg på 97 stemmeberettigede persoer hvilket parti de ville ha stemt på hvis det hadde vært stortigsvalg este dag. Av de spurte ville X 9 ha stemt på Arbeiderpartiet. e eksempel. 9 Arbeiderpartiets oppslutig på meigsmålige for februar 008 er p 0,34. 97 To måeder seiere svarte X 64 av de 90 som ble spurt, at de ville stemme Arbeiderpartiet. Arbeiderpartiets oppslutig på meigsmålige for april 008 er 64 p 0, 90. 90 Et estimat for edrige i Arbeiderpartiets oppslutig fra februar til april 008 er δ p 0, 90 0,34 0, 04 p Det svarer til e tilbakegag på,4 prosetpoeg. Hvor sikkert er estimatet i eksempel 4 på edrige i Arbeiderpartiets oppslutig? For å avgjøre det vil vi lage et kofidesitervall for edrige i partiets oppslutig. Vi ser på de geerelle situasjoe slik de ble beskrevet rett før eksempel 4. Da er X og X uavhegige stokastiske variabler som begge er biomisk fordelt, og E( X) p Var( X) p ( p) E( X) p Var( X ) p ( p) E estimator for edrige i partiets oppslutig er X X δ p Vi bruker regereglee () (6) i otatet "Regeregler for forvetig og varias" og får at Aschehoug Udervisig www.lokus.o ide 6 av 8

E( ) E( ) E( ) E( X ) E( X ) δ p p p p δ Var( δ ) Var( ) + ( ) Var( ) Var( X ) + Var( X ) p ( p ) + p ( p ) p ( p) p ( p) + tadardavviket til δ p p er altså σ Var( δ) p ( p ) p ( p ) + δ ide vi ikke kjeer og p, ka vi ikke bruke dette resultatet til å rege ut p Me e brukbar tilærmigsverdi (et estimat) ved δ ( ) p( p) + σ øyaktig. δ kaller vi stadardfeile til δ. δ δ δ E ka vise at er tilærmet stadardormalfordelt. Ved tilsvarede framgagsmåte som δ ovefor (se (I) (IV)) fier vi at et tilærmet 95 % kofidesitervall for δ er δ, 96, δ +, 96 δ δ Aschehoug Udervisig www.lokus.o ide 7 av 8

Eksempel 5 Kofidesitervall for edrig ved meigsmåliger I eksempel 4 så vi på Arbeiderpartiets oppslutig ved meigsmåligee til meigsmåligsistituttet yovate for februar og april 008. I februar 008 ville X 9 av de 97 som ble spurt ha stemt Arbeiderpartiet. 9 Oppslutig på meigsmålige var da p 0,34. 97 De tilsvarede tallee for april 008 var X 64 og 90. 64 Oppslutige på meigsmålige var da p 0, 90. 90 Et estimat for edrige i Arbeiderpartiets oppslutig fra februar til april 008 er δ p p 0, 90 0,34 0, 04 tadardfeile for dette estimatet er 0, 90( 0, 90) 0,34( 0,34) + 0, 04 0, 0 δ 90 97 Et tilærmet 95 % kofidesitervall for edrige i Arbeiderpartiets oppslutig blir derfor 0, 04,96 0, 04, 0,04 +,96 0, 04 0,066, 0,08 Ut fra kofidesitervallet ka vi "rege med" at edrige i Arbeiderpartiets oppslutig fra februar til april 008 er et sted mellom 6,6 prosetpoegs tilbakegag og,8 prosetpoegs framgag. ide uedret oppslutig om partiet er iefor kofidesitervallet, har vi ikke oe sikkert holdepukt for at de virkelige oppslutige om Arbeiderpartiet har edret seg fra februar til april 008. Aschehoug Udervisig www.lokus.o ide 8 av 8