ETFAGBLADFOE SOSIAL0KONOMEK,



Like dokumenter
K4GBLAPFQE A A. En komites endeligt? Eskild Jensen: Enkelte hovedtrekk ved det norske kredittsystem. Kritisk KringsjS, Enquete om prisntviklingen ihfe

Monthly Bulletin of the Central Bureau of Statistics of Norway Bulletin Mensuel du Bureau Central de Statistique Norvegien

GEOGRAFISK KLASSIFISERING VED HJELP AV ADRESSEREGISTER I ET SYSTEM MED RUTER AV VARIERENDE ST0RRELSE

OM MASKINELL GRANSKNING AV STATISTISKE PRIM^ROPPGAVER 1

Forelesning 4 Populasjon og utvalg. Hvorfor er utvalgsteori viktig? Kjent tabbe før det amerikanske presidentvalget i 1936

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

INTEGRERT DATABEARBEIDING I STATISTIKKPRODUKSJONEN 1

THE EFFECT ON CONSUMPTION OF HOUSEHOLD SIZE AND COMPOSITION

DE NORDISKA STATISTIKERMOTENA I HELSINGFORS 1960

Konfidensiell behandling av data, informasjoiisnytte og klassifisering av data *

Hva kreves? 1 semester = 5 måneders full tids arbeid

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

DUS MED DEUCE Hullkortmaskinen ble oppfunnet av den amerikanske statistiker Herman Hollerith og det var problemer i forbindelse med de amerikanske

BRUK AV EN EDB-MASKIN I STATISTIKK- PRODUKSJONEN 1

FAUSKE KOMMUNE. Mappe nr.: Saksbehandler: JAN ERIK JOHANSEN

PERSONDATAREGISTRERING, -ARKIVERING OG -MODELLUTVIKLING I STATISTISK SENTRALBYRA I. Av Svein Nordbotten I N N H 0 L D

DIFI Direktoratet for forvaltning og IKT

Segregasjon, mangfold og boligpriser.

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS

IMPLICIT SOCIAL PREFERENCES IN THE NORVEGIAN SYSTEM OF INDIRECT TAXATION

THE CONSUMPTION FUNCTION AND THE LIFE CYCLE HYPOTHESIS

Andelen kvinner i norsk IT-bransje for Oda nettverk mars/april 2018

Meningsmåling Nordmøre og Romsdal

Å se det unike i små barns uttrykk, en etisk praksis? Tromsø, 1. februar 2013 Nina Johannesen

Konfidensintervall for µ med ukjent σ (t intervall)

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Frivillig respons utvalg

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

~ hsgskolen i oslo. Demissie Aleda I Marl Mehlcn

Lsningsforslag ved Klara Hveberg Lsningsforslag til utvalgte oppgaver i kapittel 6 I kapittel 6 minner oppgavene mer om de du er vant til fra skolemat

KAPITTEL I. Innledning

SOME EMPIRICAL EVIDENCE ON THE DECREASING SCALE ELASTICITY

Desisjonstabeller og generering av maskinprogrammer for granskning av statistisk primser mater iale'

By Petter Jakob Bjerve. Contents

Vurdering av kvaliteten på undersøkelser om virkninger av trafikksikkerhetstiltak

Befolkningsundersøkelse. gjennomført for Forbrukerrådet av Norstat juni 2015

DISCRETE DYNAMIC CHOICE: AN EXTENSION OF THE CHOICE MODELS OF THURSTONE AND LUCE

Vassdragskonsesjon. 0kt vannuttak til settefisk. gis tillatelse til. Kommune: Namdalseid kommune. Fylke: Nord-Tr0ndela g

Bruken av nasjonale prøver en evaluering

Komparative design. Forelesning 12 Mer om kvantitative forskningsdesign. Sammenligninger av to eller flere case i rom og tid

USIS ET SYSTEM FOR FORMIDLING AV KONTAKT MELLOM VITENS0KER OG VITENKILDE

TIDE DISTRIBUTIVE EFFECTS OF INDIRECT TAXATION:

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Brukerundersøkelser når innvandrere er brukere (forts.) Elisabeth Gulløy Statistisk sentralbyrå 15. september 2010

PROTOKOLL FRA ARSM0TET 11. FEBRUAR 2012 I ELVERUM FLYKLUBB/SEILFLYGRUPPA.

EKSAMENSOPPGAVE I SØK2002 SYSSELSETTING OG KONJUNKTURANALYSE EMPLOYMENT AND BUSINESS CYCLE ANALYSIS

Først skal vi se på deltakelsen i frivilligheten: hvor mange deltar og hvor ofte.

Maskinell lusetelling. Espen Børrud Software Manager Stingray Marine Solutions AS Tekmar

UNIVERSITETET I OSLO

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Vedtatt pa styrem0te 5. februar 2003, og besluttet satt i kraft fra 21. februar 2003 etter kunngj0ring overfor medlemmene og fullmakt fra a>sm0tet.

Miljø og kjemi i et IT-perspektiv

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Bedre valg av leverandør gjennom trialsourcing & Fastpris eller per time?! Oslo, 1. desember, 2014 Magne Jørgensen

Veiledning for utarbeidelsen av økonomiske analyser som fremlegges for Konkurransetilsynet

2.3 Delelighetsregler

Hvem er mest kreativ? Hva er egentlig diskriminering. Potensielle feilkilder i rekrutteringsprosessen

Språkrådet. Befolkningsundersøkelse om bruk av engelsk språk i reklame og markedsføring i Norge en oppfølging av en større undersøkelse i 2008

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

3.A IKKE-STASJONARITET

SENSORVEILEDNING FOR EKSAMENSOPPGAVEN I SVSOS107 VÅREN 2002

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Context Questionnaire Sykepleie

Informasjonsgjenfinning

Forskningsprosjektet: Nettbasert Vareprat: Effekter på bedrifters image og (potensielle) kunders kjøps-sannsynlighet

Algoritmer - definisjon

Accuracy of Alternative Baseline Methods

Oppgaver og løsningsforslag i undervisning. av matematikk for ingeniører

Skoleeksamen i SOS Kvantitativ metode

HbA1c. Resultater fra ekstern kvalitetskontroll/noklus. Diabetesforum Oslo,

Hva påvirker helsepersonells arbeidsdeltakelse? Steinar Strøm Universitetet i Torino, Italia 7.April 2014

TMA4240 Statistikk H2010

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Påvirker regionale forhold bedrifters verdiskapning og innovasjonsevne? Jarle Aarstad Senter for nyskaping Høgskolen i Bergen

UNIVERSITETET I OSLO

Improving Customer Relationships

Satellite Stereo Imagery. Synthetic Aperture Radar. Johnson et al., Geosphere (2014)

Last ned Statistikk - Tor Martin Kvikstad. Last ned. Last ned e-bok ny norsk Statistikk Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi

PRICE SENSITIVITY OF ENERGY DEMAND IN NORWEGIAN INDUSTRIES

KAPITTEL IV. Antallet og fordelingen av ugifte mødre

Veiledning Tittel: Veiledning for utarbeiding av økonomiske analyser Dok.nr: RL065

ESTIMATING ECONOMIC RELATIONS FROM INCOMPLETE. CROSS-SECTION/TIME-SERIES DATA

Endring over tid. Endringsskårer eller Ancova? Data brukt i eksemplene finner dere som anova-4-1.sav, anova-4-2.sav og likelonn.sav.

EMNERAPPORT INSTITUTT FOR BIOMEDISIN

Utarbeidet av Kontrollert av (en av disse): Swdieledersl (fagl~rer): Annen I~rer Sensor Studielederl Fagkoordinators Fagkoordinator underskrift:

Ekstraordinær generalforsamling HAVFISK ASA

Brukerundersøkelser når innvandrere er brukere. Anne Britt Djuve, Fafo Elisabeth Gulløy, SSB

Studiestedenes tematisering av overgrepsproblematikk.

EKSAMEN I TMA4240 Statistikk

INTERNASJONAL REVISJONSSTANDARD 710 SAMMENLIGNBAR INFORMASJON TILSVARENDE TALL OG SAMMENLIGNBARE REGNSKAPER INNHOLD

Utilsiktet flytting fra fosterhjem. Øivin Christiansen, BUS- Vestlandet Elisabeth Backe-Hansen, NOVA

ET FORSØK PA EN ENKEL, TEORETISK VURDERING AV DE ESTIMERINGSMETODER SOM BRUKES I FORBINDELSE MED DE POLITISKE MENINGSMÅLINGER. lb Thomsen INNHOLD

Programmering i R. 6. mars 2004

Sammenligning av sykefraværsstatistikker i KS, SSB og enkeltkommuner

Samlet rapport fra tilsynssensorer i statistikk og forsikringsmatematikk for 2011 (levert juni 2012)

Kirkpatrick lanserte for nesten 50 år siden hovedlinjene til 4 ulike nivåer på evalueringer.

UNIVERSITETET I OSLO

Samfunnsøkonomiske vurderinger av godsbilstørrelser i bysentrum

Transkript:

ETFGBLDFOE SOSIL0KONOMEK, I DETTE N U M M E R : r,~ ktivisering 3 M0te i Sos.ok, Samfunn /2 54. 6 Svein Nordbotten: Vurdering av statistikkens noyaktighet 8 Student-enquete 2 Tor Sekse: Gi en fremstilling av de faktorer som er bestemmende for tallrelasjonene mellom de to kj0nn i en befolkning 8 Litteratur 8 RGNG I 26 NR. MRS 954 l [ P^

Svein Nordbotten: Vurdering av statistikkens noyaktighet. Statistiske data vil i stor utstrekning vsere estimator pa kjennemerkeverdier ved de masser som er unders0kt fordi en fullstendig unders0kelse eller en omhyggelig bearbeiding vil medf0re uforholdsmessig store kostnader. Verdien av statistikken vil selvsagt 0kes betraktelig om det var mulig a gi mal for estimatenes n0yaktighet ). Problemet a finne fram til metoder for a vurdere statistikkens n0yaktighet bar i de senere ar opptatt en rekke framtredende statistikere. Et naturlig sentrum for denne forskervirksomhet pa statistikkens omrade bar vaert det store Bureau of the Cencus i US som i f0ge sitt arbeidsprogram forplikter seg til a gi sa objektive mal som mulig for n0yaktigheten av den statistikk det utarbeider. For statistikerne er det ikke bare statistikkens n0yaktighet som er av interesse, men ogsa de enkelte feilkomponenter og deres relative st0rrelse. Utvidet kjennskap til disse vil ved seiiere unders0kelser vsere til hjelp for en optimal allokering av de tilgjengelige resurser. Feilen, den inverse verdi av et estimats n0yaktighet, defineres som differansen mellom estimatet og «sann» kjennemerkeverdi 2 ). Den praktiske nytte av denne definisjon vil selvsagt belt og holdent vsere avhengig av definisjonen av «sann» kjennemerkeverdi. Census Bureau foreslar at sann verdi ma tilfredsstille f0gende tre krav 3 ): a. Sann verdi ma vsere entydig definert. b. Sann verdi ma vsere definert slik at den er i samsvar med unders0kelsens malsetting. c. Sann verdi ma vsere definert ved operasjoner som faktisk kan la seg gjennomf0re selv om de skulle medf0re store kostnader. Feilen ved en statistisk oppgave kan skyldes en rekke forskjellige faktorer som for eksempel upresise definisjoner, uheldig distribusjon av skjemaer, darlig instruksjon av intervjuerne, revisjon, kode eller darlig korrekturlesning. Ved en vel planlagt unders0kelse regner en likevel med at det er relativt fa faktorer som kan pavirke unders0kelsens resultater vesentlig. Dr. W. E. Deming nevner i sin bok ialt 9 typer av feilkilder som kan komme pa tale 4 ). 8

De viktigste feilkildene kan grupperes i noen fa hovedgrupper. En gruppering soni ikke avviker meget fra den amerikanske er: I. Tilfeldige fell (random errors). Disse fell opptrer i utvalgsunders0kelser hvor et tilfeldig element er innf0rt ved tilfeldige trekninger. Den tilfeldige feilkomponent ved et estimat er definert som differansen mellom estimatet og estimatets forventr.ing. Den inverse st0rrelse av estimatets tilfeldige feilkomponent blir ofte betegnet som estimatets presisjon. Dette mal har f0gelig bare mening ved unders0kelser som pavirkes av et tilfeldig element. Vurdering av den tilfeldige feilkomponent er vel kjent fra samplingteorien og en skal ikke ga naermere inn pa dette her. II. Ikke-tilfeldige fell (non-random errors). Mens den tilfeldige feilkomponent bare forekommer i unders0kelser hvor det er foretatt tilfeldige trekninger, er de ikke-tilfeldige feilkomponenter langt mer generelle. De opptrer savel i utvalgsunders0kelser som i fullstendige tellinger. En alminnelig innvending mot bruken av tilfeldige utvalgsunders0kelser er at resultatene pavirkes av en tilfeldig feilkomponent. Ved 0ket kjennskap til de ikke-tilfeldige feilkomponenter og deres st0rrelsesorden, kan det tenkes en finner at den tilfeldige feilkomponent likevel er relativt liten i forhold til den ikke-tilfeldige feilkomponent. Er da malsettingen a maksimalisere n0yaktigheten av en unders0kelses resultater under hensyn til en gitt bevilgning, vil kanskje den beste 0sning vsere et lite tilfeldig utvalg hvor en tar sikte pa a redusere eller unnga de ikke-tilfeldige fell. Den ikke-tilfeldige feilkomponent kan videre tenkes a besta av tre typer fell:. Dekningsfeil (coverage errors). Disse fell skyldes at statistikkerne ikke bar klart a identifisere alle elementer i den masse soni skulle unders0kes, eller at de feilaktig bar inkludert elementer i unders0kelsen som ikke h0rer hjemnie i massen. Ved en rekke unders0kelser i US bar en konstatert et betydelig underskudd pa elementer. 2. Svarfeil (response errors). Dette er fell som er oppstatt under innsamlingen av det statistiske materiale. rsakene kan vaere skjemaets utforming, intervjuenes oppf0rsel, oppgavegiverens innstilling etc. Det er vanlig ogsa a gruppere feil som skyldes «non-response» i denne gruppen 5 ). 3. Bearbeidingsfeil ^processing errors). Disse feil oppstar under bearbeidingen av det statistiske materialet og omfatter kode-, revisjons-, punche-, trykkfeil etc. De som har fors0kt a vurdere eller male st0rrelsen pa ikketilfeldige feil har of test nyttet en av de to f0gende metoder: 9

I. Den f0rste og eldste av de to metoder bestar i a sammenligne resultatene fra den unders0kelse som skal vurderes med resultater som en har funnet ved andre unders0kelser av de samme kjennemerker. vvikenes st0rrelse nyttes sa soin inverse mal pa n0yaktigheten av unders0kelsene. Som typisk eksempel pa bruken av denne metode kan nevnes sammenligninger melloni folketellinger og de resultater den 0pende befolkningsstatistikk gir. Det er apenbart alvorlige svakheter ved denne metode. En forutsetning for at den overhodet kan nyttes er at det foruten resultatene fra den unders0kelse som skal vurderes ogsa foreligger resultater fra en sammenlignbar unders0kelse. Det kan vsere vanskelig a avgj0re om begge unders0kelser tok sikte pa a male de samme kjennemerker. Begge unders0kelser kan ogsa ha store underskudd pa elementer uten at det n0dvendigvis beh0ver komme fram ved en sammenligning av resultatene. Om en paviser store avvik mellom resultatene av to unders0kelser, vil en heller aldri med sikkerhet kunne si noe om hvilken av dem er n0yaktigst. Den st0rste bakdel ved metoden er imidlertid at den ikke gir noe grunnlag til a si noe om arsakene til eventuelle feil som en senere kan dra nytte av. II. Den andre metode som har vsert nyttet til a vurdere statistiske resultaters n0yaktighet, bygger pa den moderne samplingteori. Prinsippet er at en fra den masse som unders0kelsen skulle omfatte, trekker et tilfeldig kontrollutvalg av elementer, Kontroll av hvert trinn i tellingsplanen gjennomf0res omhyggelig slik at kontrollresultatet tilfredsstiller definisjonen for sann kjennemerkeverdi. vviket mellom et elements kjennemerkeverdi registrert ved den opprinnelige unders0kelse og ved kontrollen pa et bestemt trinn i tellingsplanen, kalles elementets individuelle feil pa vedkommende trinn. Pa grunnlag av de individuelle feil hos utvalgselementene pa de forskjellige trinn, estiineres sa de enkelte totale eller relative feilkomponenter. De st0rrelser en kommer fram til ved denne type maling av feilkomponentene vil saledes selv vsere pavirket av tilfeldige feilkomponenter. Istedet for tilfeldige kunne en ogsa nytte kontrollerte kontrollutvalg. Fordelen ved a nytte tilfeldige utvalg er at de gir grunnlag for utledning av objektive mal pa estimatenes presisjon, mens lilsvarende estimater fra et kontrollert utvalg selv kan pavirkes av ikke-tilfeldige feilkomponenter av ukjent st0rrelsesorden 6 ). Denne fordelen ved de tilfeldige utvalg ma i denne forbindelse ansees a vsere sa betydelig at vi her kan se bort fra bruken av kontrollerte utvalg. 0

For at estimatene pa feilkomponentene skal ha en tilfredsstillende presisjon og kontrollen samtidig b0r bli billigst mulig, kreves det en grundig planlegging av utvalget. Her kommer hele den moderne samplingteori for endelige masser til anvendelse med kompliserte samplingsplaner og fine estimeringsprinsipper 7 ). v sserlig betydning for vurdering av dekningsfeilen er den sakalte «area sampling*. En masse som unders0kes vil ofte defineres som elementer av et bestemt slag innen et avgrenset geografisk omrade. Deter en dette omrade opp i et st0rre antall arealer og trekker et tilfeldig utvalg av disse hvor det foretas n0yaktig opptellinger, kan avvikene for de enkelte arealer inellom tallet pa elementer registrert ved den oppriniielige unders0kelsen og ved kontrollopptellingen nyttes for estimering av dekningsfeilen. Hvert element i kontrollutvalget av arealer kunne videre kontrolleres med henbtikk pa estimering av diverse svar- og bearbeidingsfeil. Dette vil ofte vise seg a va^re un0dvendig da en kan oppna tilstrekkelig presise estimator pa disse feilkomponentene ved et langt mindre utvalg. Det planlegges derfor gjterne en sakalt flerstegs samplingsplan hvor det fra hvert enkelt utrukket areal trekkes et tilfeldig utvalg av elementer. For at utvalget skal bli mest mulig effektivt blir ogsa i tillegg en eller flere stratifikasjoner av bade arealer og elementer nyttet. I Census Bureau er det allerede foretatt en rekke malinger av forskjellige tellingers n0yaktighet etter de prinsipper som er beskrevet under metode II. ovenfor. Unders0kelsene startet i 945 med maling av n0yaktigheteii ved resultatene fra 945 Census of griculture. Resultatet av malingen viser at omkring 0 % av farmerne er ikke kommet med i tellingen. Likeens viser malingen av dekningsfeilen ved 947 Census of Manufactures et underskudd pa industribedrifter som i present er det samme som for jordbrukstellingen. Lignende unders0kelser er foretatt i forbindelse med 948 Census of Business og de store tellingene som ble holdt i 950. Disse unders0kelser tok ogsa sikte pa maling av andre feilkomponenter. Resultatene av disse malinger er enna ikke offentliggjort i detalj, men det er meget som tyder pa at de vil fa stor betydning for den videre utyikling av denne metode for maling av feilkomponenter ved statistiske oppgaver. Berettigelsen av det arbeid som Census Bureau har nedlagt pa dette omrade uttrykker dets Deputy Director,. Ross Eckler, pa t'0gende mate i en oversikt for International Statistical Institut 8 : «Satisfactory measures of the accuracy of the different statistics will make them more convenient for making decisions, will educate the consumers of statistics to be more discriminating in selection and use of statistical information and will in-

crease public confidence in large scale programs based on statistics when the precision of the statistics is presented.» Henvisninger: ') O. Morgenstern, «On the ccuracy of Economic Observations! Princeton 950. 2 ) M. H. Hansen, W. N. Hurwitz og W. G. Madow, «Sample Survey Methods and Theory*, N. Y. 953, Vol. I, s. 0 og Vol. II, s. 8. 3 ) Morris H. Hansen o. a., «Response Errors in Surveyes», Journal of the merican Statistical ssociation, Juni 95, Vol. 46, s. 47 90. 4 ) W.E. Deming,.Some Theory of Sampling., N.Y. 950, Ch. 2, s. 24 52. 5 ) M. H. Hansen og W. N. Hurwitz, «The Problem of Non-response in Sample Surveyes», Journal of the merican Statistical ssociation, Des. 945, Vol. 4, s. 57 529. ) William G. Cohran, «Sampling Techniques», N. Y. 953, s. 05, og ^Sample Survey Methods and Theory», Vol. I, s. 7 72. ",) M. H. Hansen og W. N. Hurwitz, «0n the Theory of Sampling from Finite Populations*, Des. 943, The nnals of Mathematical Statistics, Vol. XIV, No. 4. ^). Ross Eckler og Leon Pritzker, «Measuring the ccuracy of Enumerative Surveyes», Des. 95, Bureau of the Census. Hvor star Norge? «There is no other alternative to totalitarian slavery than liberty.» (Ludwig von Mises i «Planning for Freedom*.) Student-enquete. I den arelange diskusjon om studieplan etc. har en savnet en opinionsunders0kelse blant studenter. Resultatet er at de forskjellige deltakere i diskusjonen har operert med uttrykk som «de fleste studenter mener» osv., uten a ha noe saerlig grunnlag for det. Det kunne derfor ha interesse a fa en virkelig storstilet Gallup blant studenter. Som en slags Gallup i miniatyr har na «Stimulator» stilt noen sp0rsmal til 3 l.avdelingsstudenter. Selv om tre er et altfor lite antall til a kunne foreta noen fordeling av studentmassen med hensyn pa de enkelte meningsnyanser, sa kan en i allfall ved en slik unders0kelse fa et inntrykk av hvor forskjellig meningene kan vaere, og hvor misvisende det derfor ofte er a snakke om en slags kollektiv mening blant studentene. Det er mulig vi senere vil pr0ve en liknende enquete blant ^- 2.avdelingsstudenter og blant yngre kandidater. 2