Mer om utvalgsundersøkelser

Mer om utvalgsudersøkelser I uderkapittel 3.6 i læreboka gir vi e kort iførig i takegage ved utvalgsudersøkelser. Vi gir her e grudigere framstillig av temaet. Populasjo og utvalg Ved e utvalgsudersøkelse vil vi ut fra et utvalg fra e populasjo aslå hvor stor adel p av populasjoe som har e bestemt egeskap, eller e bestemt meig om et aktuelt samfusspørsmål. Et eksempel på e utvalgsudersøkelse er e politisk meigsmålig. Eksempel Meigsmålig I februar 008 spurte meigsmåligsistituttet yovate et tilfeldig utvalg på 97 stemmeberettigede persoer hvilket parti de ville ha stemt på hvis det hadde vært stortigsvalg este dag. Av de spurte ville 9 ha stemt på Arbeiderpartiet. Arbeiderpartiets oppslutig på meigsmålige er 9 0,34 3,4 % 97. Estimator for populasjosadel I e stor populasjo er det et ukjet atall idivider som har et bestemt "kjeeteg". I eksempel er populasjoe alle stemmeberettigede som ville ha stemt hvis det hadde vært stortigsvalgvalg este dag, og kjeeteget er at e perso ville ha stemt på Arbeiderpartiet. Vi lar N være atall idivider i populasjoe og a det ukjete atallet som har kjeeteget. Vi øsker å fie ut hvor stor adel av populasjoe som har dette kjeeteget. Vi er altså iteressert i populasjoadele a p N For å aslå p trekker vi et tilfeldig utvalg på idivider fra populasjoe. I eksempel er de 97 et tilfeldig utvalg av de stemmeberettigede som ville ha stemt hvis det hadde vært valg. Aschehoug Udervisig www.lokus.o ide av 8

Vi forutsetter at størrelse av utvalget er lite i forhold til størrelse av hele populasjoe, og lar X være atall idivider i utvalget som har kjeeteget. Til å aslå p bruker vi adele i utvalget som har dette kjeeteget, det vil si X Vi sier at (som vi leser "p hatt") er e estimator for p. Det aslaget vi kommer fram til år vi bruker estimatore, kaller vi et estimat. I eksempel er estimatet 3,4 %. tadardfeil ide X er e stokastisk variabel, vil også være det. Verdie til vil variere fra e utvalgsudersøkelse til e ae, selv om de virkelige populasjosadele p er de samme. Det er hovedgrue til at politiske meigsmåliger ka sprike e del, selv år de er gjeomført til samme tid. Hva er fordelige til de stokastiske variabele X? ide vi trekker ute tilbakeleggig, er hedelsee "første idivid vi trekker, har kjeeteget ", "adre idivid vi trekker, har kjeeteget ", osv. egetlig avhegige. Me side utvalget er lite i forhold til hele populasjoe, ka vi se på hedelsee som uavhegige og rege som om hver av dem har sasylighet p. Da er X biomisk fordelt, og EX ( ) pog Var( X) p( p). X Vi vil fie forvetig, varias og stadardavvik til X. Da bruker vi regereglee () og () i otatet "Regeregler for forvetig og varias" som du fier på Lokus.o. Vi får at E( ) E X E( X) p p p( p) Var( ) Var X Var( X) p( p) σ Var( ) p( p) Aschehoug Udervisig www.lokus.o ide av 8

At E( ) p, betyr at hvis vi gjør mage utvalgsudersøkelser, så vil gjeomsittet av dem være ær populasjosadele p (forutsatt at p er de samme for alle udersøkelsee). tadardavviket til gir oss iformasjo om hvor mye resultatet vil variere fra e utvalgsudersøkelse til e ae på gru av tilfeldigheter ved trekkige av utvalget. Du ser at stadardavviket σ avheger av de ukjete populasjosadele p. Vi ka derfor ikke rege ut σ øyaktig. Me vi får e brukbar tilærmigsverdi hvis vi erstatter p med. Vi får da ( ) kaller vi stadardfeile til. (tadardfeile er altså et estimat for σ.) Eksempel tadardfeil ved meigsmålig Vi ser på meigsmålige i eksempel. Av de 97 persoee som ville ha brukt stemmerette hvis det hadde vært valg este dag, er det X 9 som ville ha stemt 9 Arbeiderpartiet. Det gir p 0,34 3, 4 %. 97 3,4 % er et estimat for Arbeiderpartiets oppslutig på det aktuelle tidspuktet. 0,34 ( 0,34) tadardfeile til estimatet er p 0,05 0,05. 97 Vi oppsummerer: Fra e stor populasjo trekker vi et tilfeldig utvalg på idivider. tørrelse av utvalget er lite i forhold til hele populasjoe. La X være atall idivider i utvalget som har et bestemt kjeeteg, og la p være adele i hele populasjoe som har dette kjeeteget. om estimator for populasjosadele p bruker vi X tadardfeile til estimatore er ( ) I forbidelse med politiske meigsmåliger som de i eksempel står det ekelte gager at "resultatee må tolkes iefor feilmargier på 3 prosetpoeg". Hva betyr egetlig dette, og hvorda heger det samme med stadardfeile vi fat i eksempel? For å forstå det må vi se på hva vi meer med et kofidesitervall. Aschehoug Udervisig www.lokus.o ide 3 av 8

Kofidesitervall Et kofidesitervall er grovt sagt et itervall som vi "reger med" at de ukjete populasjosadele p ligger i. For å bestemme et kofidesitervall for p tar vi utgagspukt i at X er tilærmet ormalfordelt X år er tilstrekkelig stor (se side 67 i læreboka). Da er også tilærmet ormalfordelt. Ovefor fat vi at E( p ) p, og at stadardavviket til er tilærmet lik stadardfeile. p Derfor er tilærmet stadardormalfordelt (se side 57 i læreboka). I oppgave 3.6 i læreboka fat vi at det er 95 % sasylig at e stadardormalfordelt stokastisk variabel vil få e verdi i itervallet,96,,96. Det gir at p P,96 < <,96 0,95 (I) Vi ser ærmere på ulikhetee i paretese: p,96 < <,96 (II) Vi vil omforme vestre og høyre ulikhet i (II) hver for seg. Vi multipliserer først med på begge sider i de vestre ulikhete. Da får vi, 96 p < p p p< p+, 96 På samme måte ka vi omforme de høyre ulikhete i (II). Det gir, 96 p < p Vi har dermed at (II) ka omformes til ulikhetee,96 p < p< p+,96 (III) Da viser (I) at det er tilærmet 95 % sasylig at ulikhetee i (III) vil bli oppfylt år vi utfører e utvalgsudersøkelse. asylighete er altså tilærmet 95 % for at vi vil få e verdi av som er slik at de virkelige populasjosadele p ligger i itervallet, 96, +, 96 (IV) Vi sier at itervallet er et tilærmet 95 % kofidesitervall for p. Et tilærmet 95 % kofidesitervall for populasjosadele p er, 96, +, 96 Her er estimatore for populasjosadele, og er stadardfeile til. Det er valig å lage kofidesitervaller på 90 %, 95 % eller 99 %. Vi får kofidesitervaller på 90 % og 99 % ved å bytte ut,96 med heholdsvis,64 og,58 i itervallet ovefor. Aschehoug Udervisig www.lokus.o ide 4 av 8

Eksempel 3 Kofidesitervall ved meigsmålig Vi ser igje på meigsmålige i eksemplee og. Vi fat at p 0,34 og 0,05 0,05. Et tilærmet 95 % kofidesitervall for p Arbeiderpartiets oppslutig hvis det hadde vært stortigsvalg este dag, er 0,34,96 0, 05, 0,34 +,96 0, 05 0,84, 0,344 Ut fra kofidesitervallet vil vi "rege med" at Arbeiderpartiets oppslutig i februar 008 lå mellom 8,4 % og 34,4 %. Det gir e "feilmargi" for Arbeiderpartiets oppslutig på meigsmålige. p Vi fat kofidesitervallet (IV) ved å ta utgagspukt i at er tilærmet stadardormalfordelt. Dee tilærmige er brukbar år både p og ( p) er mist lik 0 (se sidee 69 70 i læreboka). ide vi ikke kjeer p, får vi å "tommelfigerregele" at X og ( ) X begge må være mist lik 0 for at vi skal kue bruke kofidesitervallet. Hva betyr det egetlig at (IV) er et 95 % kofidesitervall? For å forstå det er det viktig å legge merke til at (IV) er et itervall der øvre og edre grese er stokastiske variabler. om alle adre sasyligheter ka 95 % her tolkes som e relativ frekves i det lage løp. For å forklare dette tar vi for oss meigsmåligseksemplet igje. Vi teker oss at det på et tidspukt blir utført veldig mage meigsmåliger, og at vi for hver målig reger ut et 95 % kofidesitervall for Arbeiderpartiets oppslutig. Da vil omtret 95 % av disse itervallee ieholde de virkelige oppslutige om Arbeiderpartiet. Etter at vi har reget ut itervallgresee på grulag av é bestemt målig, har det ige meig å sakke om sasylighete for at itervallet skal ieholde de virkelige oppslutige om Arbeiderpartiet. For ete er de med i itervallet eller så er de det ikke. ammelikig av to meigsmåliger Ata at et politisk parti på et tidspukt har oppslutig fra e adel p av velgere, og at oppslutige på et seiere tidspukt er p. På det første tidspuktet blir det gjort e meigsmålig der persoer blir spurt om hvilket parti de ville ha stemt på hvis det hadde vært stortigsvalg este dag. Av dem ville X ha stemt på det aktuelle partiet. På det adre tidspuktet er de tilsvarede tallee og X. Edrige i partiets oppslutig er altså δ p p. Dee edrige ka vi estimere med X δ p p X, der og. Aschehoug Udervisig www.lokus.o ide 5 av 8

Eksempel 4 Edrig ved meigsmåliger I februar 008 spurte meigsmåligsistituttet yovate et tilfeldig utvalg på 97 stemmeberettigede persoer hvilket parti de ville ha stemt på hvis det hadde vært stortigsvalg este dag. Av de spurte ville X 9 ha stemt på Arbeiderpartiet. e eksempel. 9 Arbeiderpartiets oppslutig på meigsmålige for februar 008 er p 0,34. 97 To måeder seiere svarte X 64 av de 90 som ble spurt, at de ville stemme Arbeiderpartiet. Arbeiderpartiets oppslutig på meigsmålige for april 008 er 64 p 0, 90. 90 Et estimat for edrige i Arbeiderpartiets oppslutig fra februar til april 008 er δ p 0, 90 0,34 0, 04 p Det svarer til e tilbakegag på,4 prosetpoeg. Hvor sikkert er estimatet i eksempel 4 på edrige i Arbeiderpartiets oppslutig? For å avgjøre det vil vi lage et kofidesitervall for edrige i partiets oppslutig. Vi ser på de geerelle situasjoe slik de ble beskrevet rett før eksempel 4. Da er X og X uavhegige stokastiske variabler som begge er biomisk fordelt, og E( X) p Var( X) p ( p) E( X) p Var( X ) p ( p) E estimator for edrige i partiets oppslutig er X X δ p Vi bruker regereglee () (6) i otatet "Regeregler for forvetig og varias" og får at Aschehoug Udervisig www.lokus.o ide 6 av 8

E( ) E( ) E( ) E( X ) E( X ) δ p p p p δ Var( δ ) Var( ) + ( ) Var( ) Var( X ) + Var( X ) p ( p ) + p ( p ) p ( p) p ( p) + tadardavviket til δ p p er altså σ Var( δ) p ( p ) p ( p ) + δ ide vi ikke kjeer og p, ka vi ikke bruke dette resultatet til å rege ut p Me e brukbar tilærmigsverdi (et estimat) ved δ ( ) p( p) + σ øyaktig. δ kaller vi stadardfeile til δ. δ δ δ E ka vise at er tilærmet stadardormalfordelt. Ved tilsvarede framgagsmåte som δ ovefor (se (I) (IV)) fier vi at et tilærmet 95 % kofidesitervall for δ er δ, 96, δ +, 96 δ δ Aschehoug Udervisig www.lokus.o ide 7 av 8

Eksempel 5 Kofidesitervall for edrig ved meigsmåliger I eksempel 4 så vi på Arbeiderpartiets oppslutig ved meigsmåligee til meigsmåligsistituttet yovate for februar og april 008. I februar 008 ville X 9 av de 97 som ble spurt ha stemt Arbeiderpartiet. 9 Oppslutig på meigsmålige var da p 0,34. 97 De tilsvarede tallee for april 008 var X 64 og 90. 64 Oppslutige på meigsmålige var da p 0, 90. 90 Et estimat for edrige i Arbeiderpartiets oppslutig fra februar til april 008 er δ p p 0, 90 0,34 0, 04 tadardfeile for dette estimatet er 0, 90( 0, 90) 0,34( 0,34) + 0, 04 0, 0 δ 90 97 Et tilærmet 95 % kofidesitervall for edrige i Arbeiderpartiets oppslutig blir derfor 0, 04,96 0, 04, 0,04 +,96 0, 04 0,066, 0,08 Ut fra kofidesitervallet ka vi "rege med" at edrige i Arbeiderpartiets oppslutig fra februar til april 008 er et sted mellom 6,6 prosetpoegs tilbakegag og,8 prosetpoegs framgag. ide uedret oppslutig om partiet er iefor kofidesitervallet, har vi ikke oe sikkert holdepukt for at de virkelige oppslutige om Arbeiderpartiet har edret seg fra februar til april 008. Aschehoug Udervisig www.lokus.o ide 8 av 8