IO 77/45 29. november 1977 ESTIMERING AV ENGELDERIVERTE PA DATA MED MALEFEIL. Odd Skarstad 1) INNHOLD



Like dokumenter
Mer om utvalgsundersøkelser

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Kapittel 8: Estimering

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Metoder for politiske meningsmålinger

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Påliteligheten til en stikkprøve

H T. Amundsen INNHOLD

Ukeoppgaver i BtG207 Statistikk, uke 4 : Binomisk fordeling. 1

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

ECON240 Statistikk og økonometri

Signifikante sifre = alle sikre pluss ett siffer til

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Oppgaver fra boka: X 2 X n 1

Oversikt over konfidensintervall i Econ 2130

TMA4245 Statistikk Vår 2015

Oversikt over konfidensintervall i Econ 2130

n 2 +1) hvis n er et partall.

Statistikk og økonomi, våren 2017

Estimering 1 -Punktestimering

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Estimering 1 -Punktestimering

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Forkunnskaper i matematikk for fysikkstudenter. Derivasjon.

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

TMA4245 Statistikk Eksamen mai 2017

Fagdag 2-3mx

Detaljert løsningsveiledning til ECON1310 seminaroppgave 9, høsten der 0 < t < 1

UNIVERSITETET I OSLO

Avsnitt 8.1 i læreboka Differensligninger

TMA4240 Statistikk Høst 2015

STK1100 våren 2017 Estimering

EKSAMEN Løsningsforslag

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

Oversikt over konfidensintervall i Econ 2130

Kommentarer til oppgaver;

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

UNIVERSITETET I OSLO

Kapittel 7: Noen viktige sannsynlighetsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

TMA4240 Statistikk Høst 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

OM TAYLOR POLYNOMER. f x K f a x K a. f ' a = lim x/ a. f ' a z

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

SAMMENLIGNING AV MINSTE KVADRATERS METODE OG SANNSYNLIGHETSMAKSIMERINGSMETODEN I BINÆR REGRESJON. Henrik Dahl *)

Eksamen REA3028 S2, Våren 2011

Kap. 9: Inferens om én populasjon

Differensligninger Forelesningsnotat i Diskret matematikk Differensligninger

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

LØSNING: Eksamen 28. mai 2015

Løsningsforslag Oppgave 1

TMA4240 Statistikk Høst 2016

MOT310 Statistiske metoder 1, høsten 2011

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Kapittel 10 fra læreboka Grafer

Estimering 2. -Konfidensintervall

Kap. 9: Inferens om én populasjon

Matematikk for IT. Oblig 7 løsningsforslag. 16. oktober

3MX 2007/8 - Kapittel 5: 8. januar 5. februar 2008

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

LØSNING: Eksamen 17. des. 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

Rente og pengepolitikk 1. Innhold. Forelesningsnotat 9, februar 2015

Eksempeloppgave REA3028 Matematikk S2 Eksempel på eksamen våren 2015 etter ny ordning. Ny eksamensordning. Del 1: 3 timer (uten hjelpemidler)

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

FØLGER, REKKER OG GJENNOMSNITT

«Uncertainty of the Uncertainty» Del 4 av 6

FORFATTER(E) Jan-W. Lippestad og Trond Harsvik OPPDRAGSGIVER(E) Rikstrygdeverket. Nanna Stender, Mari K. Rollag og Kristian Munthe

Vi skal hovedsakelig ikke bestemme summen men om rekken konvergerer. det vil si om summen til rekken er et bestemt tall

Econ 2130 Forelesning uke 11 (HG)

betegne begivenheten at det trekkes et billedkort i trekning j (for j=1,2,3), og komplementet til

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

Løsningsforslag ST2301 øving 3

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

S2 kapittel 1 Rekker Løsninger til innlæringsoppgavene

2.1 Polynomdivisjon. Oppgave 2.10

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Numeriske metoder: Euler og Runge-Kutta Matematikk 3 H 2016

Løsningsforslag til eksamen i STK desember 2010

Løsningsforslag til prøveeksamen i MAT1110, våren 2012

Eksamen REA3028 S2, Våren 2010

Rente og pengepolitikk. 8. forelesning ECON september 2015

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

Transkript:

IO 77/45 29. ovember 977 ESTIMERING V ENGELDERIVERTE P DT MED MLEFEIL av Odd Skarstad ) INNHOLD I. Data fra forbruksudersøkelse II. Estimerig ved målefeil. Iledig 2. Systematiske målefeil 2 3. Tilfeldige målefeil 4 4. Variaser på estimatoree 6 5. Målefeil i forbruksdata 973 9 6. Modell med tilfeldige målefeil i forbruksdata og med tilfeldige og systematiske ålefeil i itektsoppgavee 7. Systematiske og tilfeldige målefeil i forbruks- og itektsoppgaver. Modifisert modell 2 8. Noe empiriske resultater 5 III. Estimerig ved maglede itektsdata 6. Iledig 6 2. Estimerig ved geererte itektsoppgaver 6 3. Noe empiriske resultater 8 Side Vedlegg. Estimerig av variaser 2 2. slag på, restleddsvariaser m.v 25 3. Metoder ved målefeil 29 ) Jeg vil takke doset re mudse, forsker Erik Biør, kosuletee Grete Dahl, Helge Herigstad og Petter Laake for yttige kommetarer uder arbeidet. Ikke for offetliggjørig. Dette otat er et arbeidsdokumet og ka siteres eller refereres bare etter spesiell tillatelse i hvert ekelt tilfelle. Syspukter og koklusjoer kaw ikke ute videre tas som uttrykk for Statistisk Setralbyrds oppfatig.

I. DT FR FORBRUKSUNDERSØKELSER Datamaterialer i frobruksudersøkelser.blir valigvis ihetet ved at husholdigee fewer regskap over forbruksutgiftee i e kortere periode (6 eller oe få uker). Dessute blir de gjere itervjuet om askaffelser over e legre periode av varer som kjøpes sjelde (f.eks. privat bil). v praktiske gruer er det eppe mulig å foreta oe særlig mer fullstedig kartleggig av forbruket i de ekelte husholdig som deltar, f.eks. ved avede e meget legre regskapsperiode. Erfarig viser at frafallet blat husholdigee i forbruksudersøkelser ofte er ubehagelig stort selv ved e kort regskapsperiode, og det er eppe gru til å tvile på at det som regel ville øke ved overgag til legre periode. Forbruksudersøkelser gir altså et okså kort "glimt" av forbruket hos de deltakede husholdigee. Det ka ikke overraske at slike korte glimt er e ulempe ved aalyse av data, sammeliket med fullstedige opplysiger om forbruket. Det er vesetlig å være klar over dette ved bruk av et materiale. (Forute svakheter som skyldes e kort regskapsperiode, må e selvsagt også rege med adre feilkilder, f.eks. at e del utgifter ka være uteglemt uder bokforige.) Som følge av at observasjosperiode er kort vil det være store tilfeldige variasjoer mellom husholdigee i forbruksutgifter, variasjoer som ka tekes utelukkede å ha sammeheg med tilfeldige variasjoer fra periode til periode for de ekelte husholdig. v dee gru er det store problemer med å ytte total forbruksutgift i bokførigsperiode som idikator på årlig faktisk forbruk ved aalyse av forbruksdataee (ved tabeller eller ved regresjosaalyse). Dette er ærmere behadlet i rbeidsotat 0 77/44: Estimerig av egelderiverte ved maglede itektsdata. I Statistisk Setralbyrå's forbruksudersøkelser er det ofte et problem at ma har itektsoppgaver med målefeil. Dette vil i høy grad vaskeliggjøre estimerig av egelderiverte. I dette otatet har vi sett ærmere på estimerigsmulighetee ved forskjellige typer målefeil. Framstillige er kyttet til datamateriale fra orske forbruksudersøkelser. Me dét betyr eppe at syspukter og resultater behøver å være ute iteresse uder arbeid med adre udersøkelser. Dette gjelder vel selv om disse måtte ha et oe aerledes opplegg. Problemer med utytte et datamateriale og tolke resultater ka være prisipielt okså like selv om f.eks. legde på bokforigsperiode er oe forskjellig. II. ESTIMERING VED MLEFEIL. Iledig Det er et meget stort behov for arbeide iefor modeller som tar hesy til mulige målefeil i variablee. Vår erfarig med data fra forbruksudersøkelser er at ma "alltid" må rege med målefeil i itekts- og forbruksoppgavee. Og ofte er atakelig målefeilee temmelig store. Det viser seg i praksis meget vaskelig å få pålitelige opplysiger om de forbruksdispoible itekte for private husholdiger. Det er mage årsaker til dette. Nettoitekte ved skattelikige er f.eks. av flere gruer et dårlig mål for forbruksdispoibel itekt, bl.a. fordi e del forbruksutgifter er trukket fra (reiser til og fra arbeidssted, reter på boliglå, visse spareformer m.v.). Dessute er selvsagt ikke skattefrie itekter med (mage former for sosiale støader). I tillegg kommer mulige itektsudragelser i forbidelse med beskatige. Det ka tekes mage typer målefeil, og mage forskjellige måter karakterisere målefeil på. Vi vil forutsette e todelig av feilee, heholdsvis systematiske og tilfeldige målefeil. ) Dee todelige er yttet av bl.a. E. Malivaud i Statistical Methods of Ecoometrics, Ch. 0 (968).

2 For forklare begrepee iføres folgede symboler: z beteger observert variabelverdi z' sa z" - stokastisk feilledd Vi forutsetter at de observerte verdie ka uttrykkes som e eller ae eksakt fuksjo (her symbolisert ved g (-)) av de sae verdie og evt. adre variable, og av det stokastiske leddet, altså: z = g(z', evt. adre variable) + z" Her represeterer g ( )-fuksjoe de systematiske målefeile, mes tilfeldige feil er represetert ved z" Vi meer at dee modelle ka være hesiktsmessig. De gir e viss presiserig av begrepet målefeil, samtidig som kaskje de fleste typer av målefeil i praksis ka omfattes av modelle. I avsitt 2 vil vi se på det spesielle tilfellet at z" = 0 for alle obsérvasjoer, altså at vi bare har systematiske målefeil. I avsitt 3 behadles tilfeldige målefeil. E atar da at g (-) = z', altså at z = z' + z". Fra avsitt 4 og utover er forutsetige at systematiske og tilfeldige malefeil ka opptre samtidig i materialet. Vi må vete at dette sistevte er det mest valige i forbruksudersøkelsee. 2. _.Y.qffILij.J5.2t2 -ktt:til Byråets forbruksudersøkelser gjeomføres blat aet ved at husholdigee som deltar, fewer alle sie forbruksutgifter i regskapshefter i løpet av to uker. Hver husholdig får tildelt et såkalt hovedhefte. Dette føres valigvis av det husholdigsmedlemmet som foretar størstedele av de daglige ikjøpee. Dessute får hver av de øvrige persoee (som er 5 år eller eldre) tildelt hvert sitt héfte, hvor særlig deres persolige utgifter føres. Det kreves stor påpasselighet fra husholdigees side om alle utgifter skal bli registrert. Vi reger med at det oppgitte forbruket stort sett er oe for lavt i forbruksudersøkelsee, og at dette særlig skyldes at e del utgifter blir glemt Det fies også adre gruer til at forbruket ka være feil registrert (husholdigee øsker f.eks. å vise at de har god råd, eller at de "ikke sløser", at de gjor "foruftige" ikjøp m.v.). Målefeilee i forbruket gir erfarigsvis ulikt utslag for de forskjellige vare- og tjeestegruppee. Feilee er større for f.eks. varegruppe drikkevarer og tobakk e for matvarer. Visse større varige forbruksvarer, som f.eks. privat bil, kjøpes sjelde, og vi får derfor få observasjoer i regskapsheftee. Slike utgifter blir registrert ved itervju, hvor vi spor etter askaffelser i løpet av 2 måeder bakover i tide. Også her ka det forekomme målefeil. Folk husker ikke alt de har kjøpt, eller de husker kaskje ikke år et kjøp ble foretatt (om det er mer eller midre e ett år side). Som evt i avsitt er det mage muligheter for målefeil i itektsoppgavee. Det gjøres av og til forsøk - ved å ytte likigsdata og adre itektsdata - på fie e slags forbruksdispoibel itekt. Det må imidlertid atas at oppgavee ofte ieholder vesetlige målefeil. Systematiske målefeil på tilgjegelige itektsdata vil vel ofte variere med hesy på visse bakgruskjeeteg for husholdiger. Målefeilee ka f.eks. være aerledes for husholdiger hvor hoveditektstakere er selvstedig ærigsdrivede e hvor ha er løstaker, og kaskje atter aerledes igje fra pesjoister. Det ka derfor tekes at yrkesstatus bor være med som fordeligsvariabel til målefeile, z = g (z', yrkesstatus til hoveditektstaker m.v.). Som et alterativ til dette ka det imidlertid hede e bor ha é fuksjo for hver yrkesstatusgruppe. Det sier seg selv at det ikke er mulig å si oe geerelt om hva som er e sasylig form på g (-)-fuksjoe. i Det er i praksis ødvedig ha faktiske kuskaper om svakheter ved det statistiske materialet. Som et eksempel betrakter vi her et tilfelle med lieær utformig av g ( )-fuksjoe. ) Se f.eks. E. Malivaud, Statistical Methods of Ecoometrics, Ch. 0 (968).

Vi Rytter følgede symboler: X beteger observert forbruk (av e vare-/tjeestegruppe) X' '" -faktisk R ie observert itekt R' sa (forbruksdispoibel) Vi atar at X og R ka uttrykkes som lieære fuksjoer av heholdsvis X' og R': X = c + d X' R = e + k R' hvor c, d, e og k beteger (ukjete) kostater. Det forutsettes at R' (og dermed R) er ikke stokastisk. Videre atas følgede ekle kosumfuksjo: X' = a + b R' + E (II. 2..) hvor a og b beteger kostater og E et restledd med forvetig ull og kostat varias. Vi vil seere iføre visse modifikasjoer ar det gjelder fordelige av restleddet (avsitt 3 i dette kapitlet). Estimerig av parametere b ved å ytte observerte i stedet for sae verdier gir mistekvadratersestimatore _.E (X. - x) (R. - = i i b - E. i ( R. - R) = _ - hvor X og R beteger gjeomsitt for X og R og hvor atall husholdiger er 0. Ved å sette i for X og R gir dette " d. b.e - - _ (X'. - X') (R. - R ) E (R' - R'). = i b vil her ikke være idetifiserbar medmidre d og k er kjet. Forvetige til b blir: Et; = b Vi ser at b er forvetigsrett bare hvis d = k. Derimot spiller ikke kostatleddee oe rolle for forvetigsretthete. På tilsvarede måte fier vi forvetige på estimatore til (de gjeomsittlige) elastisitete (symbolisert ved E R ): E'E R d e + k R' IZ c+dr I Estimatore til elastisitete er geerelt påvirket bade av kostatleddee og vikelkoeffisietee. Dersom kostatleddee er lik ull, vil imidlertid estimatore til elastisitete være forvetigsrett. Og likeledes, hvis e er. "lite" i forhold til k R' og samtidig c er "lite" i forhold til d R', er ER tilærmet forvetigsrett som estimator på elastisitete av X' m.h.p. R'. Ma må i praksis vurdere estimatoree ut fra kjeskape til data. Det ka f.eks. tekes at et datamateriale ka gi grulag for å estimere elastisiteter, me ikke deriverte, eller evetuelt omvedt.

4 Det ka ofte være rimelig ytte e kosumfuksjo med flere variabler, f.eks. X' = a + b R' + cl yl + c 2 y 2 + + Cr yr + E hvor c-ee beteger kostater og y-ee variabelverdier. Y-ee atas observerbare ute målefeil. Ved studere mometmatrisee ) er det lett å se at også e modell med flere variable gir e d estimator for b med tilsvarede forvetigsverdi som fora (E b = b Td. E fier videre at estimatoree til c, er c2' "" c,r kosistete bare hvis d = (E c. = d c., j =, 2,..., r). J J E ae utvidelse av modelle er å ytte et polyom av høyere grad e é, f.eks. X' = a + b R + b 2 R' 2 + E I dette tilfelle vil også kostatleddee påvirke resultatee og bidra til at e ikke får idetifikasjo (I de tilfelle kostatleddee ka settes lik ull, fier vi ved rette i de observerbare størrelsee X og R i relasjoe estimatoree b l og b 2 med forvetig E ; = b og E ; 2 = 47 b 2 ) Det virker her som at det ikke er mulig å si særlig mye geerelt om hvorda systematiske målefeil bor behadles. Vi vil imidlertid komme tilbake til dette emet i avsitt 6 i dette kapitlet og behadle e metode som ser ut til were yttig. 3. Tilfeldige målefeil I kapittel I er det påpekt at e må rege med betydelige tilfeldige målefeil i forbruksoppgavee som følge av at registrerigsperiode er kort. Også i de tilgjegelige itektsoppgavee er det rimelig d ata store variasjoer i målefeile (mellom husholdiger med f.eks. samme forbruksdispoible itekt). De observerte forbruks- og itektsoppgavee beteges heholdsvis X og R og tilsvarede feilledd X" og R" X = X' + X" R = R + R" hvor X" og R" atas å ha forvetig lik ull for alle verdier av X' og R'. R' forutsettes å være ikke-stokastisk. Dee modelle er okså valig forekommede i litterature om feil i variablee. Vi vil her også gjøre e valig forutsetig om at X" og R" er ukorrelerte med hveradre, og at de har kostat varias. (Dee siste forutsetige vil bli modifisert i este avsitt.) Ved sette i de observerte i stedet for de sae verdiee får vi relasjoe: X =a+br+u(ii. 3..) hvor U = E + X" - b R" (II. 3.2.) Estimerig ved miste kvadraters metode gir.e (X. - R) (R i - = -I. E (R. - ) 2 = i ) Se f.eks. H. T. mudse: Iførig i teoretisk statistikk, kap. 9.3. (962).

Side det ikke er så ekelt fie oe eksakt uttrykk for forvetige til b, vil vi se på de asymtoti ke egeskapee. Vi forutsetter at setralmometet for itekte (MR 2 ) kovergerer mot e kostatm 2 ved økede atall observasjoer. b vil da gå mot greseverdie ). R 2 R" P lim b = b ( - 22 ) m R R" 2 hvor a beteger de teoretiske ttiski e var ase til det stokastiske leddet R" R". b er ikke idetifiserbar og b vil kovergere mot e størrelse som (i tallverdi) er midre e b (dersom det er målefeil i itekte (a 2 R. > 0)). Vi ser også at jo storre variase på målefeile (a 2 Ru))er i forhold til spredige på itekte (m20, jo større fare er det for at b blir uderestimert år b yttes. Vi ser videre at dersom m2r /a2 R" er kjet (eller ka aslås) vil uttrykket 5 b b m 2 R' 2 m 2 R, + a R u kue yttes som (kosistet) estimator for b. Det ka imidlertid i praksis være vaskelig å fie et godt aslag på m 2 iv /a 2 R. Vi vil her se ærmere på b. For ekelhets skyld iføres symbolet 2 a R" K = m2. 2 - R' I a R" for de asymtotiske ("teoretiske")broke, mes vi symboliserer tilsvarede størrelse ved et edelig atall observasjoer med R. Side R" er stokastisk, vil også k være det. K (og K) vil selvsagt være de samme for alle vare- og tjeestegrupper (avheger bare av målefeile til itekte), altså b = Kb i(j =, 2,..., m) Størrelse 2 b. b. = -7 (j =, 2, m) (II. 3.3.) K er et asymtotisk forvetigsrett og kosistet uttrykk for b og vil kue yttes som estimator dersom K er kjet. Når ma setter i estimatee (b-ee), blir det et system med m ligiger mellom m + ukjete (b-ee og K). Systemet er altså determiert på e kostat ær. Hvis vi imidlertid lar e av "varegruppee" represetere sparige (f.eks. r. m), vil summe av utgiftee være lik itekte, og dermed J. E =J b. = Ved å pålegge restriksjoe m jl b i = blir systemet determiert og asymtotisk forvetigsrette og kosistete estimatorer for b-ee og K fies. ) Restriksjoe iebærer at ma setter m K = E b. J= J ) Metode er idetisk med e spesiell form for bruk av istrumetvariable. Se vedlegg 3.

6 I stedet for forbruksdispoibel itekt ka selvsagt faktisk total forbruksutgift (X'i) tekes brukt som forklarigsvariabel. Vi holder altså sparige utefor og estimerer utgiftsderiverte. Det vil ofte være rimelig avede modeller med flere eksogee variable, f.eks. folgede kosumfuksjo X' = a + b R' + c + c-v + c ry r (.3.4.) y r 2 + hvor c-ee beteger kostater. y-ee ka f.eks. betege atall persoer, biære variable for husholdigstype, geografisk område e.l. Vi atar her at y-ee ikke er beheftet med målefeil, og at' EU = 0 for alle verdier på alle de eksogee variablee. Uder disse forutsetiger viser det seg at estimatore til b får tilsvarede (asymtotiske) egeskaper som ovefor ägitt år vi ytter observerte variable (X og R) uder estimeriger. Dette går fram av mometmatrisee år ma setter i setralmometee for de observerte verdiee og lar atall observasjoer gå mot uedelig ). v mometmatrisee går det ellers fram at heller ikke estimatoree for c-ee vil være kosistete véd målefeil i itekte. m Ved å legge på restriksjoe J. L b = ka det på samme måte som fora fies kosistete estimatorer - j for b-ee. Videre ka (om ma øsker det) a og c-ee etterpå estimeres direkte via ligige 2 X-bR=a+c l y i +c 2y 2 + cryr4 4- U. 4. Varias på estimatore Vi tar utgagspukt i formel II. 3.3.) og sammehege K =.E b. J= J i avsittet fora. Dette gir b 4 b=j (j =,,. m) bj Isettig av b-ee gir. - R.) (R. - R) b. il E (X. i _ = J J J E (X. - R) ) (R. - i= (j =, 2,..., m), Metode iebærer altså at ma ytter broke kovar X. R kovar X R som estimator for b 2). ) Se f.eks. H. T. mudse: Iførig i teoretisk statistikk, kap. 9.3. (962). 2) Estimatore er idetisk med e spesiell form for bruk av istrumetvariabel. Se vedlegg 3.

7 Det er e selvfølge at metode ka brukes også ved e modell ute målefeil i itekte. Det er e ærliggede oppgave å udersøke variasegeskapee ved estimatore. Vi vil å først ata at det ikke er målefeil i itekte og vil sammelike 6 med de valige miste kvadratersestimatore (i det følgede symbolisert ved b). Fuksjosforme er som fora hvor X. J = a. + b. R' + Uj ( =, 2,..., m) J J U. J = E. + X". J J side R" = Vi skal altså sammelike estimatoree: E (X.. - R.) (R. - R = Ji J ) b. - i J. E (R'. - R') = 2 og E (X. - g.) (R'. -. ) = ji J b. J (< g) (R' i= ) II. 4.2.) hvor X = J. E X X-ee er stokastiske, mes R' atas ikke stokastisk. Ved å sette i for X-ee ka = j* estimatoree skrives R'. b..e - R)2 + P. (R'. - R ) (U.. - O.) = b - J = J J z ( i... )2 i= % og b..2 (R'. - - ) 2 +. 2 (R' - R ) ( U.. - 0.) J = - i Ji b j - - il (R' i RI) 2 4. ill (R' i RI) (U i O) hvor U =. E U. j= j Uder forutsetigee i avsitt 2 i dette kapitlet om restleddsegeskapee er som kjet b forvetigsrett E b. = b. J J med varias a 2 U. J var b. =.E ( R'. - R ) 2 J =

8 Når det gjelder estimatore b er det mer komplisert å fie eksakte uttrykk for forvetig og varia'hs, fordi det er stokastikk både i tellere og evere. Det er imidlertid vist i avsittet fora at estimatore er asymtotisk forvetigsrett og kosistet, i det greseverdiee i P lim- T (R'i - R') (U i - 0) og ' P lim --- 4 (R, - R') (Uji - Oj ) begge går mot ull ved økede atall observasjoer, altså er P lim b. = b. (j =, 2,..., m) J J For beregig av variase skal vi ytte e tilærmelsesformel ). Dersom vi lar T betege tellere og N betege evere, ka formele skrives: T var bi = ( IT) 2 [var T + b 2N - 2 bj kovar (T, N): - Tilsammelikigvilvariasetilb.bestå av det første leddet i uttrykket: J var b j = (rff) var T (evere til b er ikke-stokastisk). Det vil således avhege av forteget på b 2. var N - 2 b. kovar (T, N) J J om var b skal være større eller midre e var b. For gjøre de folgede beregiger eklest mulig, lar vi forbruket være delt i to vare- og tjeestegrupper (gruppe er de som aalyseres, mes gruppe 2 er reste). Leddet ovefor blir l) b2 var N - 2 b kovar (T, N) = b 2 m R 2 a 2 _ 2 b. 2 (a 2 MR ul + a ) = ' ulu2 bl m 2 [b 2 _ 2 (a 2 a.., R' u ul ulu2)j hvor a 2 u = 2 u +2 CY + a 2 ulu2 u 2 Uttrykket består av et positivt og et egativt ledd. Det er altså ikke mulig trekke geerelle slutiger om forteget, og dermed heller ikke om hvilke av estimatoree E4 og g l som gir mist varias. For d kue sammelike variasee på b l og b må e ha aslag på variaser/kovariaser og b l i et materiale. Dette gjør det selvsagt vaskelig i praksis sammelike variasee på b l og g l. I vedlegg 2 er det gjort et forsøk på aslå disse størrelsee i forbruksmaterialet fra 973, for å kue foreta e sammelikig. Dette yttes i det følgede. Vi lar varegruppe være heholdsvis - matvarer (gruppe 2 er "reste") - drikkevarer og tobakk (gruppe 2 er "reste") osv. ) Se vedlegg.

9 satt lik- 60,0). I tabell er det bereget stadardavvik på b forhold til på b l ( stadardavvik på b i er Tabell. Stadardavvik på b i i proset av stadardavvik på b.. Forbruksudersøkelse 973. Hele befolkige Vare- og tjeestegruppe var 00 (, )i var b Matvarer 0,7 Drikkevarer og tobakk 95,2 Klær og skotøy 90,7 Bolig, lys og bresel 92,6 Møbler og husholdigsartikler 90,4 Helsepleie 97,4 Reiser og trasport 93, Fritidssysler og utdaig 90,7 dre varer og tjeester 90,9 Tabelle viser at estimatore b., har et midre stadardavvik e estimatore b l utatt for matvarer. (E ka som sagt ikke si oe geerelt om hvorda forholdet mellom variasee er.) Det fies mage forskjellige måter dele i det private frobruket i udergrupper av varer og tjeester på. v dette følger det også at det vil kue avhege av hvorda dee idelige gjøres, hvilke av de to estimatoree som er de beste. Det ka eves at prøveregiger som vi har k foretatt viser at b syes å være særlig gustig ved e idelig av forbruket i grove vare- og tjeestegrupper. (E ekstrem grovdelig er selvsagt at ma har bare é vare- og tjeestegruppe, emlig total forbruksutgift. I dette spesialtilfellet blir selvsagt b alltid lik, med varias lik ull.) Grue til at ma i mage tilfelle reduserer variase ved ytte estimatore b framfor b er selvsagt at b impliserer at det er lagt e tilleggsrestriksjo (iebygget e betigelse) ved m estimerige, emlig j bj =. Ellers må ma rege med at opplegg og gjeomforig av e forbruksudersøkelse geerelt vil kue ifluere på forholdet var b/var b. I dette regeeksemplet har det vært forutsatt at det ikke er målefeil pa itekte. Dersom det derimot er målefeil i itekte (R" 0), vil ikke b-estimatore være kosistet (b blir ikke idetifiserbar). I vedlegg er et tilærmet uttrykk for variase på b-estimatore bereget for tilfellet ved bl.a. målefeil i itekte. Variase avheger bl.a. av b og mometee for de stokastiske leddee. Vi har ikke arbeidet oe med fie fram til e estimator for variase på b. 5. Målefeil i forbruksdata 973 Ved aalyser av forbruksudersøkelse yttes ofte itektsdata (forute forbruksdata). I tillegg er det gjere rimelig å trekke i i modelle variable som husholdigstype (evt. persotall i husholdige), alder på hoveditektstakere, geografisk område m.v. Mes forbruks- og itektsoppgavee atakelig som regel er beheftet med vesetlige målefeil, vil det være mer rimelig å tro at "eklere" variable, som f.eks. husholdigstype e.l. er registrert ute at det i større omfag forekommer målefeil. Det ka derfor være tillatelig arbeide iefor modelle med målefeil i forbruksog itektsoppgavee, me ute feil i de adre variablee. I det følgede vil dette bli gjort. Vi skal først vurdere feil i forbruksdata. Vi reger med at det gjeomsittlig vil være e viss uderregistrerig i forbruket, dvs. at ikke alle husholdiges utgifter kommer med uder regskapsførige og itervjuige. Det er ikke lett si oe sikkert om hvilke karakter uderestimerige har. Det er vel imidlertid ærliggede å tro at uderestimerige vil være avhegig av selve ivået på forbruket. Hvis f.eks. e familie har relativt høye utgifter og mage utgiftsposter,

0 vil e vel også tro at det er lett å glemme e del av postee uder regskapsførige. Vi vil her forutsette at de systematiske talefeile er proporsjoal med utgiftsbeløpet. Vi får altså sammehege X = d X' + X" hvor d beteger e kostat. Størrelse på kostate vil kue variere fra varegruppe til varegruppe. Sammelikiger med ae statistikk (f.eks. varehadelsstatistikk) tyder f.eks. på at uderregistrerige er større for varegruppe drikkevarer e for matvarer. Ved forbruksudersøkelse 973 har vi ihetet likigsdata fra Skattedirektøres magetbåd. På dette bådet fies det bl.a. opplysiger om ettoitekter - ved kommue- og statsskattelikige og direkte skatter og avgifter. Ut fra opplysiger på bådet ka følgede itektsbegrep daes: ettoitekt ved statsskattelikige + ettoitekt ved sjomasskatteordige + særfradrag - direkte skatter 0 avgifter = itekt Det viser seg at dette itektsbegrepet ikke gir oe godt uttrykk for de forbruksdispoible itekte For alle husholdiger uder ett utgjør itekte ca. 3/4 av forbruksutgiftee. Skattefrie itekter er ikke med i dette itektsbegrepet. Videre er ikke fradragsberettigede utgifter ved skattelikige med (e del av disse utgiftee er med i forbruksutgiftsbegrepet). Videre er på skattebådet itekte satt lik ull dersom vedkommede perso ikke har så høy itekt at ha/hu betaler itektsskatt. E god del persoer står av dee gru oppført med ull itekt på skattebådet. (Husholdigsitekte bereges ved å summere husholdigsmedlemmees itektsbeløp.) I tillegg vil selvsagt skatteudragelser kue ifluere på målefeilee. Det syes rimelig å ata at målefeile på itekte delvis vil variere på e mer eller midre systematisk måte med e persos yrkesstatus. E ka f.eks. lage følgede idelig av persoer etter yrkesstatus:. Løstakere 2. Selvstedig ærigsdrivede i jordbruk, skogbruk og fiske 3. Selvstedig ærigsdrivede ellers 4. Ikke yrkesaktive Det er ærliggede å tro at målefeile gjeomsittlig er aerledes for f.eks. løstakere e for selvstedig ærigsdrivede. Sammehege mellom sa og observert itekt ka således være oe forskjellig for forskjellige sosialgrupper. I avsitt i dette kapitlet ble det skilt mellom tilfeldige og systematiske målefeil, for itektes vedkommede symbolisert ved R = g (R', evt. adre variable) + R" hvor g (.) atas å være e eksakt fuksjo av R'. I este avsitt studeres tilfellet med både systematiske og tilfeldige målefeil i itekte og tilfeldige målefeil i forbruket.

Tilfeldige målefeil i forbruksutgiftsdata, tilfeldige og systematiske målefeil i itektsoppgavee Vi betrakter tilfellet Xi = x'xi " ( j. =, 2,..., m) R = g (R') + " (II. 6..) Isettig av observerte verdier i kosumfuksjoe X' = a + b R' +E gir X.= j +.-FIJ K, J J J hvor Ux. = X". + E. + b. (R' - R) = U. + b. (R' - R) JJJJ J J I estimatore il = b j E E (X. (R. - R) i = (X. - R) (R. - R) setter vi i R = g (R') + R" og får E (X.. - X.) (g (R' i ) - - 77)) + ii 4 (XRj ) (R"i - R" ) --. I,. _ = JiJ J i j: Ved dessute å sette i bl.a. (X i - R) ( g (R' i ) - -4 (T )) 4.il (Xi - ) (R" i - R " ) Xi = X' j + X",j, X = X' + X" og X' = R' får vi (uttrykt ved setralmometee M): bj MR g (RI) Mxj. + Muj g (R7Mu j R II, J MR' g(r) t MR' R" t MX" g (R') 4* 4X" R" Uder forutsetig av at ER" 0 for alle verdier på Xj, og R' og E Ex. 0 for alle verdier på R' og U. og R" og X" og R" er ukorrelerte, vil Š. være asymtotisk forvetigsrett og kosistet, i J J det b MR Lim g i - g (R') = b R g j (R') ved økede atall observasjoer. Dette gjelder uasett forme på de systematiske målefeile på itekte, dvs. uasett forme på g (.)-fuksjoe - bare g (R') er korrelert med R'. Dette må (isolert sett) sies were e okså lempelig forutsetig. Det er et viktig poeg at ma ikke behøver kjee forme på g (.)-fuksjoe for å få e kosistet estimator for bi.

2 7. Systematiske 29 tilfeldige målefeil i forbruks- og itektsoppgaver. Modifisert modell Sammehege mellom faktiske og observerte forbruks- og itektstall atas være Xidj = X' jx + j" (j =. m) R = g (R') + R" Isettig av observerte i stedet for faktiske verdier i kosumfuksjoe gir X j = a j + b j R + U j x (j =, 2, m) hvor U. J N = d. E. + X". + b. (d. R' - R) + d j (a j - ) JJ JJJ I dette avsittet Rytter vi for ekelhets skyld symbolet U. J = d. E. + X" (j =, 2,.. J Det er hittil forutsatt at variasee på de stokastiske leddee er kostate (homoscedastisitet) og at leddee er stokastisk uavhegig av hveradre. Det er i forskjellige sammeheger okså valig å ata at restleddsvariasjoe ofte vil variere med ivåee på de absolutte tallstørrelsee, f.eks. med ivået på de avhegige variable. Vi skal her forutsette at variase på de stokastiske leddee er proporsjoale med de faktiske itekte, var U. = R' 2 T 2 ( =, 2,.. ).3 U.) var R" = R' 22 R" hvor T 2 og T 2 R " beteger kostater. Videre forutsettes det at kovariase mellom U-ee ka skrives: u. kovar U U = R' 2 T j k U.0 j k hvor T 2 beteger e kostat. u.0 j k For e gruppe husholdiger blir de gjeomsittlige variase: 2-7- var U. = E R'2 2 2 T = (M, + R' ) 2 T (j =, 2,..., m) u R (og tilsvarede for R" ) år M 2 R, og R' beteger heholdsvis setralmomet og gjeomsitt for R. U og R" atas å være ukorrelert (j =, 2,..., m). Vi tar (de uveide) miste kvadratersestimatore av de observerte størrelsee b. - J,E, (X jir i ) (. E (R. - R. ) = i 2 Isettig for X. og R gir J R i - R) J.E = (R' i - ) + U.. - 0 j ): [(g (R' i - 79--.)) R"i - R"):I.E [(g (R') = - TT.)) (R"i -

3. Uttrykt ved setralmometee vil bi asymptotisk gå mot d. b. M, (R) Lim b. = + I I Vi ifører symbolet K = M R' g (R') M ' g (R ) (MER,r ) T R" Isettig av dette gir: lim b = j K (j =, 2,..., m) J I tilfelletmedsystemtiskemålefeiliforbrukre idetifiserbar. J J heller ikke fie forholdet mellom f.eks. b og b 2 i det ka b l d l b I b2 d 2 b 2 med midre d /d er kjet eller ka aslås 2 (Ma "vet" f.eks. at de systematiske målefeile er lik for to varegrupper). Vi vil i stedet betrakte (de gjeomsittlige) itektselastisitete. Estimatore forvaregruppe j blir, ved ytte observerte størrelser = b = d. b. K = d. b. K J J J J J J RJ g _ (.) -I- R" d.tc. J J J Ved økede atall observasjoer vil R" og g" gå mot ull, altså R i lim E. = b. JR J R j hvor KK = K ( ) Vi symboliserer de sae gjeomsittlige elastisitete med og får R ' = b. -.J J lim E. = E. (j = m). JR JR Itektselastisitetee er altså idetifiserbare på e kostat er. Dersom de ee av utgiftsgruppee (f.eks. m. m) represeterer sparige, ka også de absolutte størrelsee på elastisitetee fies. Ma tar regresjoe av total (observert) avedelse (forbruk + sparig) med hesy på (observert) dispoibel itekt, og får

4 Her er "pr. defiisjo" de sae elastisitete (EI)lik,0, slik at K vil være lik de observerte elastisitete (E R ): K' = E R Kosistete estimatorer fies altså ved 2 E = E. /E () =, 2,..., m) JR' J R R Dersom vi ikke kjeer sparige, ka ikke det absolutte ivå på itektselastisitetee fies. Ma ka imidlertid fie utgiftselastisitetee på aalog mate (jfr. avsitt 3i dette kapitlet). Det vil ofte være øskelig ytte e kosumfuksjo hvor det igår flere forklarigsvariable e itekt. Vi betrakter her fuksjoe (II. 3.3.): = a. + b.r' + C J.Y + C2J.Y 2 + C rj Y r + E. j J Vi setter i observerte tall for itekt og forbruksutgifter og estimerer ved miste kvadraters metode. Setralmometee påvirkes av målefeilee. Vi fier følgede (asymptotiske) sammeheger mellom setralmometee for observerte variable (Mx ) og sae variable (M): 2x 2 2-2 2 Lim M R = m R, + (m R, + r ) T RI Lim M 2x - d. m (j =, 2,..., m) xjr J x Lim M x =dm xilik j yk x' j (j =, 2,..., m) (k =, 2, 4) Ved betrakte setralmometmatrise i) er det lett å se at estimatoree til b-ee blir aaloge med tilfellet med bare itekte som forklarigsvariabel. Det ka tekes at det vil være iteresse for også å estimere kostatee c l, c 2, Cr i ligige. Det viser seg at c-ee ikke blir idetifiserbare ved de spesifiserte typer målefeil i forbruk og itekt. Dette er ikke overraskede. Vi fat i avsitt 2 at e modell med bare systematiske målefeil i forbruket heller ikke gir idetifikasjo. Dersom det imidlertid bare er tilfeldige målefeil, ka ma fie kosistete estimatorer til c-ee (se avsitt 3). Bare dersom det på e eller ae måte er gjørlig korrigere for de systematiske målefeilee i forbruket, er det mulig idetifisere c-ee. Vi har i dette avsittet betraktet e modell med tilfeldige og systematiske målefeil i itekt og forbruksutgifter. Det er vistat de tilfeldige feilee på sett og vis lar seg mestre, forutsatt visse krav om fordeligsegeskapee. Det samme gjelder okså geerelt for systematiske målefeil i itekte. Det kreves f.eks. ikke at de systematiske feile skal ha oe bestemt form. De må imidlertid ikke were korrelert med de tilfeldige målefeile i forbruksutgiftee eller restleddet i kosumfuksjoe. Største problemet syes å være evt. systematiske målefeil i forbruksutgiftee. Bare dersom målefeile har e meget ekel (og kjet) form, ka ma evetuelt gardere seg mot de. I dette avsittet er det forutsatt et spesialtilfelle hvor de systematiske målefeile i forbruket er proporsjoal med utgiftsivået. Dette gir åpebart ikke mulighet for idetifisere b-ee, me derimot (de gjeomsittlige) elastisitetee. Det ka imidlertid tekes at ma fra adre statistiske kilder kjeer de totale omsetig ielads til privat forbruk av de forskjellige vareog tjeestegrupper (f.eks. via varehadelsstatistikke). Budsjettadele ka derved bereges, og estimater for b-ee fies ved b i = E j, a j (j. =, 2, ) Se f.eks. H. T. mudse: Iførig i teoretisk statistikk, kap. 9.3. (962).

5 hvor Ci-ee beteger beregede budsjettadeler. (Dersom vi utfører aalyse på deler av befolkige - f.eks. løstakere - er det trolig vaskelig aslå budsjettadeler alee ut fra totaltall for hele ladet. Dersom imidlertid de systematiske målefeile i forbruket ved forbruksudérsøkelse med rimelighet ka atas være de samme for alle befolkigsgrupper, vil budsjettadeler kue aslås ved at forbruksudersøkelsesdati og totaltall for ladet "kombieres", hvoretter b-ee bereges). 8. Noe empiriske resultater q dette kapitlet er det gitt et eksempel på umeriske beregiger på datamaterialet fra forbruksudersøkelse 973. Samme modell som i avsittet fora er yttet. Kosumfuksjoe er x. = a+br' +cy +cy +cy + E. 2 2 3 3 j for vare- og tjeestegruppe r. j (j =, 2,..., m), hvor y-ee er symboler for husholdigsstørrelse og -sammesetig: Y - atall persoer uder 6 år i husholdige ("bar") - Y 2 6-66 år - Y = 3 67 år og over ("pesjoister") Ved å ytte asjoalregskapets tall for privat forbruk og dividere med atall ibyggere har vi gjort aslag på de systematiske målefeile på forbruket i forbruksudersøkelse (represetert ved d-ee). Når de systematiske dele av målefeile i forbruket er elimiert, ka kosistete estimater for b-ee fies. Tabell 2 viser estimatee bi =, 2,..., m). Som evt i avsitt 4 har vi ikke fuet oe god estimator for variase til b-ee. I tabelle er størrelsesordee på variasee idikert 2 m ved var bj = ( - ) var bj (hvor b = j E l bi ). Itektsbegrepet som er yttet er defiert i avsitt 5 i dette kapitlet og bygger på data fra Skattedirektøre. Tabell 2. Utgiftsderiverte og gjeomsittlige elastisiteter for forskjellige vare- og tjeestegrupper. Stadardavvik i paretes i) Vare- og tjeestegruppe Deriverte Elastisiteter bjex X ir Matvarer 0,093 (0,0) 0,38 Drikkevarer og tobakk 0,099 (0,009),23 Klær og skotøy 0,078 (0,00) 0,78 Bolig, lys og bresel 0,62 (0,06),22 Møbler og husholdigsartikler 0,09 (0,00),7 Helsepleie 0,035 (0,00),06 Reiser og trasport 0,94 (0,07),48 Fritidssysler og utdaig 0,067 (0,009) 0,79 dre varer og tjeester 0,62 (0,06),6 Total forbruksutgift,000 (0,000),00 ) Variasee er bereget ved var b. = () 2 var b. b J.

6 Det er også utført beregiger hvor det i tillegg til de spesifiserte variablee er iført biære variable for sosial statu (selvstedig ærigsdrivede, løstaker m.v.) for hoveditektstakere. Dette førte imidlertid ikke til vesetlig aerledes resultater..gruppe matvarer har lavest elastisitet.(0,38). Dette stemmer bra overes med de fleste aalyser som er utført på forbruksdata. Videre ser e it gruppe reiser og trasport har høy elastisitet. Dette er heller ikke overraskede; gruppe-ieholder bl.a. utgifter til askaffelse, drift og vedlikehold av privat bil. Imidlertid er det e ae gruppe, kalt "adre varer og tjeester" som har høyest elastisitet. Dee omfatter bl.a. hotellopphold, restauratbesøk og visse feriereiser (såkalte "pakketurer"). I forbidelse med framstillige i Kap. III er det gitt oe flere resultater fra 973-udersøkelse. III. ESTIMERING VED MNGLENDE INNTEKTSDT. Iledig Vi har hittil betraktet tilfellet med målefeil i itektsdata, og estimerigsmuligheter som da foreligger. E litt ae situasjo er at itektsopplysiger fullstedig magler. Dette har imidlertid ikke vært uvalig ved våre forbruksudersøkelser og vil være e realistisk situasjo også i de ærmeste framtid. Emet for dette kapitlet er e måte til estimerig av deriverte/elastisiteter også i dette tilfelle. I våre forbruksudersøkelser blir e rekke opplysiger ihetet (uteom forbruksoppgaver), bl.a. yrkesdeltakig for husholdigsmedlemmee (f.eks. total uketlig arbeidstid) og yrkesstatus (selvstedig ærigsdrivede, asatt m.v.). Vi vil her drøfte mulighetee for å estimere egel-/ utgiftsderiverte på "idirekte" måte ved å ytte evte (eller ligede) opplysiger. 2. Estimerig ved geererte itektsopp9aver Vi øsker å estimere parametre i e sammeheg mellom itekt og forbruksutgifter, me magler itektsoppgaver. Det er e ærliggede løsig å prøve å fie fram til de "mekaismer" som ligger bak husholdigees itekter, for så å ytte dette uder estimerige. I vår udersøkelse har vi oppgaver over husholdiges arbeidstid. E må rege med at ervervsitekter for husholdigee har sammeheg med hvor mage av husholdigsmedlemmee som er i itektsgivede arbeid og med hvor lag arbeidstid de har. De samlede arbeidstide for medlemmee ka derför være e viss idikator på ervervsitekte. Det er imidlertid eppe oe "streg" sammeheg mellom arbeidstid og yrkesitekt. Det vil dessute avhege av bl.a. yrke og ærig hvor høy itekte vil være. Vi vil her ytte følgede grovidelig av yrkesstatus for hoveditektstakere som idikator: - asatte - selvstedig ærigsdrivede i jordbruk, skogbruk og fiske - selvstedig ærigsdrivede ellers - ikke yrkesaktive For ikke yrkesaktive vil selvsagt ikke arbeidstide idikere oe om itekte, i dét det er helt adre forhold som bestemmer itekte for disse gruppee (ivå på pesjoer og.trygder m.v.). Vi atar her at itekte ka skrives som e fuksjo av bl.a. arbeidstid og yrkesstatus for hoveditektstakere.

Itekt = f (arbeidstid for husholdige, yrkesstatus for hoveditektstakere, adre variable) Vi ytter - følgede symboler R' = dispoibel itekt -T = samlet arbeidstid for husholdiger Z = hvis hoveditektstaker er selvstedig ærigsdrivede i jordbruk, skogbruk, fiske, 0 ellers Z hvis hoveditektstaker er ae selvstedig ærigsdrivede, 0 ellers 2 = Z 3 = hvis hoveditektstaker er ikke yrkesaktiv (asatte er ref.-gruppe) V = et restledd Vi forutsetter e lieær relasjo mellom dispoibel itekt og de adre variablee: R' = a + T + y i Z l +y2 Z2 + y 3 Z3 + V Restleddet V ieholder altså alle adre variable e de spesifiserte og som "forklarer" itekte. Vi forutsetter samme kosumfuksjo som i kap. III. avs. 8: X' =a+br' +c y +c 2y2 +c3y3 + E. (j =, 2,..., m) j med tilfeldige målefeil i forbruksoppgavee X. J = X'. + X". J J (Det er korrigert for systematiske feil slik som i kap. III. avs. 8) Symbolet U. beteger Uj = Ej + X" j (j =, 2,..., m) Vi får altså følgede relasjoer:. R' = a + at + y Z + y 2 Z2 + y 3 Z3 + V 2. X. = a. + b.r' + c.y + c J2. Y + c J J J j 2 J3 J. Y 3 + U. (j =, 2,..., m) Relasjo "forklarer" hvorda itekte "blir til", relasjo 2 hvorda de avedes. I dette systemet er (forute parameter- og restleddsverdiee) selve "mellomleddet" - itekte (R') - ikke observerbar, mes altså bl.a. arbeidstides legde og forbruksutgifter er observerbare (de sistevte riktigok med målefeil). Ved estimerig av parametree i relasjo 2 er det ærliggede å ytte relasjo til "geerere" itektsdata til isettig uder estimerige. Vi vil ytte (observert) total forbruksutgift uder geererige (etter korreksjo for systematiske feil). Vi setter i observert total forbruksutgift (X = je X.) i relasjo i stedet for itekt: =j X = a + g + y i l i + y 2 Z 2 + y 3Z 3 + V og estimerer parametree ved miste kvadraters metode. Deretter geereres "itektstall" (R') for de ekelte husholdigee ved estimatee (merket -): Í'i = a + g i + y l Z li + y 2 Z 2i + y 3 Z 3i + V i (i =, 2,.,

8 Uder estimerige av parametree i relasjo 2 erstattes altså Ril med R', og estimerige foretas som i kap. III, avs. 8. Slik som itekte her er geerert, vil gjeomsittsitekte for husholdigee alltid (defiisjosmessig) være lik total forbruksutgift: *E R.'.E = i = Dette iebærer at sparige holdes utefor itektsbegrepet. R' ma tolkes som faktisk total forbruksutgift (målefeilee er "geerert vekk"). Dee måte å geerere itektstall på medfører selvsagt at sparetilbøyelighete ikke ka estimeres, og dermed heller ikke egelderiverte/-elastisiteter (bare utgiftsderiverte/-elastisiteter). 3. Noe empiriske resultater I forbidelse med forbruksudersøkelse 973 ble det gjeomført e itekts- og formuesudersøkelse for de samme husholdigee. Materialet fra dee udersøkelse viser et mer fullstedig bilde av husholdigees dispoible itekt til privat forbruk e hva materialet fra Skattedirektøre ka gjøre. De fleste ikke skattepliktige itektstypee er f.eks. tatt med i begrepet. Vi har yttet samme kosumrelasjo som i forrige avsitt. De utgiftsderiverte er estimert ved estimatore b fra kapittel Jul) Følgede alterative idikatorer på itekt er yttet: - itektsbegrepet bygd på Skattedirektores materiale - itekt bereget ut fra itekts- og formuesudersokelses itektsoppgaver - geerert itekt (R') fra avsittet fora Tabell 3 viser estimater på utgiftsderiverte (b) for o skjellige vare- og tjeestegrupper Tabell 3. Estimerte utgiftsder verte for forskjellige var g tjeestegrupper ved forskjellige itektsidikatorer. Stadardavvik i paretes' Vare- og tjeestegruppe Skattedirektøres materiale tektsidikatorer Itektsudersokelses itektsbegrep ta timer itektsgivede arbeid og yrkesstatus/æri Matvarer 0,093 (0,0) 0,09 (0,0) 0,092 (0,020) Drikkevarer og tobakk 0,098 (0,009) 0,096 (0,009) 0,22 (0,06) Klær og skotøy 0,078 (0,00) 0,087 (0,00) 0,02 (0,08) III/ Bolig, lys og bresel 0,62 (0,06) 0,62 (0,07) 0,6 (0,030) Møbler og husholdigsartikler 0,08 (0,00) 0,24 (0,00) 0,092 (0,08) Helsepleie 0,035 (0,00) 0,027 (0,00) 0,022 (0,08) Reiser og trasport 0,95 (0,07) 0,86 (0,07) 0,93 (0,030) Fritidssysler og utdaig.... 0,067 (0,009) 0,072 (0,00) 0,075 (0,07) dre varer og tjeester 0,62 _ (0,06) 0,56 (0,07) 0,87 Q0 2 2 Total forbruksutgift,000,0,00,000 VariaseeerberegetvedvarL.Ivar.Ofr. bj tabell 4). J I, Tabelle viser at det er tildels vesetlige forskjeller mellom estimatee ved forskjellige itektsidikatorer. Videre ser vi at de estimerte stadardavvikee overalt er klart høyere ved bruk av atall timer itektsgivede arbeid og yrkesstatus/ærig som itektsidikator e ved itektsbegrepee. ) Utgiftsdataee er korrigert for systematiske målefeil.

9 Det syes ikke på oe måteå være problemfritt å fie estimater på utgitsderiverte ved magledé itektsdata. Det ka tekes at det fies adre og bedre itektsidikatorer e dem som er forsøkt her. Det er imidlertid selvsagt vaskelig i praksis å avgjøre om e idikator er god eller dårlig.. E må atakelig i hvert ekelt tilfelle prøve å vurdere idikatores egeskaper og om kravee til kosistes ka vetes å være oppfylt med rimelig tilærmelse. Det faktum at det ka være problemer forbudet ved å utføre visse statistiske beregiger bør imidlertid ikke i seg selv avskrekke oe fra å prøve. Spørsmålet ka heller være om de beregiger som ka gjeomføres ved hjelp av ett eller aet tilgjegelig materiale gir iformasjo som ka atas å være av iteresse eller av verdi i e gitt situasjo i praksis.